Konfigurowanie eksperymentów

Konfiguracja eksperymentów polega na wybraniu celu i cech, których model użyje do jego przewidywania. Można także skonfigurować szereg opcjonalnych ustawień.

Aby Ci pomóc w wyborze celu, analizowany jest zestaw historycznych danych i wyświetlane są podsumowujące statystyki dotyczące każdej jego kolumny. Do zestawu danych stosuje się kilka kroków automatycznego wstępnego przetwarzania, aby uwzględnione zostały tylko odpowiednie dane. Więcej informacji na temat wstępnego przetwarzania danych zawiera temat Automatyczne przygotowanie i przekształcanie danych.

Po uruchomieniu wersji 1 można w razie potrzeby utworzyć nowe wersje eksperymentu w celu dalszego doskonalenia uczenia modelu. Więcej informacji zawiera temat Ulepszanie modeli.

Wymagania i uprawnienia

Więcej informacji na temat wymagań dotyczących użytkowników w kontekście pracy z eksperymentami uczenia maszynowego zawiera temat Praca z eksperymentami.

Interfejs

W poniższych sekcjach opisano sposób poruszania się po interfejsie eksperymentu w celu skonfigurowania eksperymentu. Więcej informacji na temat interfejsu zawiera temat Nawigacja w interfejsie eksperymentu.

Nawigacja przy użyciu kart

Podczas tworzenia eksperymentu otwiera się karta Dane. Tutaj możesz skonfigurować cel i cechy eksperymentu.

Po uruchomieniu przynajmniej jednej wersji eksperymentu stają się dostępne kolejne karty. Karty te umożliwiają analizę modeli, które właśnie zostały nauczone w danej wersji. Jeśli trzeba będzie skonfigurować kolejne wersje z innym wyborem cech, możesz wrócić do karty Dane.

Widok schematu i Widok danych

Na karcie Dane możesz przełączać następujące widoki:

Widok schematu: widok domyślny. W tym widoku każda kolumna w zestawie danych jest reprezentowana przez wiersz w schemacie z informacjami i statystykami.
Widok danych: alternatywny widok dający dostęp do większej ilości informacji i przykładowych danych dla każdej kolumny.

Widok schematu w eksperymencie uczenia maszynowego

Widok danych w eksperymencie uczenia maszynowego

Panel Konfiguracja eksperymentu

Kliknij Elementy sterujące Wyświetl konfigurację, aby otworzyć panel, w którym można dodatkowo dostosować uczenie w ramach eksperymentu. Panel można otworzyć niezależnie od tego, która karta jest przeglądana. Panel ten udostępnia szereg dodatkowych opcji konfiguracyjnych.

Za pomocą panelu konfiguracji eksperymentu można wykonywać następujące czynności

Wybierz cel przed uczeniem pierwszej wersji
Dodaj lub usuń cechy
Skonfiguruj nową wersję eksperymentu
Wybierz, aby zmienić lub odświeżyć zestaw danych do uczenia
Dodaj lub usuń algorytmy
Zmień ustawienia optymalizacji modelu

Rozbudowany panel dostosowywania w eksperymencie uczenia maszynowego — Panel Konfiguracja eksperymentu

Wybieranie celu

Kolumna celu zawiera wartości, które mają być przewidywane przez model uczenia maszynowego. Kolumnę celu można zmienić do momentu rozpoczęcia pierwszego uczenia. Następnie zostaje zablokowana do edycji.

Wykonaj następujące czynności:

W Widoku schematu lub Widoku danych wskaż kursorem kolumnę.
Kliknij wyświetloną ikonę .

Kolumna celu jest teraz wskazywana przez , a pozostałe dostępne kolumny są automatycznie wybierane jako cechy.

Kolumna zestawu danych z symbolem celu. — Wybieranie celu w Widoku schematu

Cel można zamiast tego wybrać w panelu konfiguracji treningu.

Po wybraniu celu możesz rozpocząć pierwszą wersję eksperymentu. Więcej informacji: Uczenie eksperymentów. W tym momencie możesz przeprowadzić dodatkową konfigurację — opisaną poniżej — lub dostosować konfigurację po przejrzeniu wyników uczenia.

Wyjaśnienia dotyczące interpretacji i przetwarzania danych są wyświetlane podczas uczenia w ramach eksperymentu. Więcej informacji zawiera temat Interpretowanie wniosków z zestawu danych.

Określanie typu tworzonego modelu

Kolumna wybrana jako cel określa typ modelu tworzonego w ramach eksperymentu. To z kolei odgrywa rolę w określaniu, które algorytmy zostaną użyte do uczenia modelu. Niektóre kolumny w zestawie danych mogą być niedostępne jako cel na potrzeby eksperymentu lub mogą być do nich zastosowane określone procesy przetwarzania.

Typy modeli to:

Model klasyfikacji binarnej
Model klasyfikacji wieloklasowej
Model regresji

W poniższej tabeli podsumowano czynniki celu, które determinują rodzaj używanego modelu.

Charakterystyka kolumny celu określająca typ modelu
Typ modelu	Liczba odrębnych wartości w kolumnie	Wymagany typ cechy	Dodatkowe informacje
Klasyfikacja binarna	2	Dowolny	-
Klasyfikacja wieloklasowa	3-10	Dowolny	Kolumny zawierającej więcej niż 10 odrębnych, nienumerycznych klas nie można wybrać jako celu.
Regresja	Więcej niż 10	Liczbowe	-

Aby się dowiedzieć, jakie modele uczy Twój eksperyment, kliknij Schemat Wyświetl konfigurację i rozwiń Algorytmy. Typ modelu jest widoczny w tytule sekcji.

Wybieranie kolumn cech

Kiedy cel został ustawiony, możesz wybrać, które z pozostałych dostępnych kolumn mają zostać uwzględnione w uczeniu modelu. Wyklucz wszystkie cechy, które nie powinny być uwzględniane w modelu. Zauważ, że kolumna pozostanie w zestawie danych, ale nie będzie używana przez algorytm uczenia.

U góry panelu konfiguracji eksperymentu widać liczbę komórek w zestawie danych. Jeśli liczba przekracza limit zestawu danych, możesz wykluczyć cechy, aby zejść poniżej limitu.

Kolumny cech można wybrać na różne sposoby:

W Widoku schematu i Widoku danych

W głównych widokach można wykonywać następujące czynności:

Usuń zaznaczenie pozycji Uwzględnij wszystkie dostępne cechy, a następnie wybierz tylko te, które chcesz uwzględnić.
Wyczyść ręcznie pola wyboru cech, których nie chcesz uwzględniać.
Wyszukaj i wyklucz lub uwzględnij wszystkie cechy w przefiltrowanym wyniku wyszukiwania.

W panelu Konfiguracja eksperymentu

Jeśli rozwiniesz panel konfiguracji eksperymentu, możesz wykonać następujące czynności:

Wyczyść ręcznie pola wyboru cech, których nie chcesz uwzględniać.
Po uruchomieniu pierwszej wersji eksperymentu możesz zdefiniować Liczbę najważniejszych cech do uwzględnienia.

Sekcja cech w panelu konfiguracji uczenia Qlik Predict — Sekcja Cechy na panelu konfiguracji eksperymentu

Podczas wybierania cech zostaje im automatycznie przypisany typ. Możliwe typy cech to:

Kategorialne
Liczbowe
Data
Dowolny tekst

Typ cechy jest przypisywany na podstawie danych zawartych w kolumnie cechy. Jeśli cecha spełnia określone kryteria, może zostać przygotowana jako podstawa dla cech poddanych automatycznej inżynierii. W razie potrzeby możesz zmienić ustawienie używania danej cechy do automatycznej inżynierii. Szczegółowe informacje na temat automatycznej inżynierii cech zawiera temat Automatyczna inżynieria cech.

Niektóre kolumny w zestawie danych mogą być niedostępne jako cechy na potrzeby eksperymentu lub mogą być do nich zastosowane określone procesy przetwarzania. Wyjaśnienia dotyczące interpretacji i przetwarzania danych są wyświetlane podczas poruszania się po uczeniu w ramach eksperymentu. Więcej informacji zawiera temat Interpretowanie wniosków z zestawu danych.

Wybór algorytmów

Wszystkie dostępne algorytmy są uwzględniane domyślnie, a algorytmy, których nie chcesz używać, możesz wykluczyć. Normalnie robi się to w ramach udoskonalania modelu, po zapoznaniu się z pierwszymi wynikami uczenia. Więcej informacji: Ulepszanie modeli.

Sekcja algorytmów w panelu konfiguracji uczenia Qlik Predict — Sekcja Algorytmy na panelu konfiguracji eksperymentu

Zmiana typów danych cech

Po załadowaniu zestawu danych kolumny są traktowane jako kategorialne, liczbowe, data lub dowolny tekst na podstawie typu danych. W niektórych przypadkach trzeba zmienić to ustawienie.

Jeżeli na przykład dni tygodnia są reprezentowane przez cyfry 1–7, każda cyfra reprezentuje wartość kategorialną. Domyślnie jest traktowana jako ciągła wartość liczbowa klasyfikacji, dlatego trzeba ręcznie zmienić konfigurację, aby była traktowana jako kategorialna.

Kiedy kolumna zostanie zidentyfikowana jako zawierająca informacje o dacie i godzinie, zostanie wykorzystana jako podstawa dla nowych cech poddanych inżynierii automatycznej. Kiedy tak się stanie, oryginalna kolumna (cecha nadrzędna) jest traktowana jako mająca cechę typu data.

Typ cechy nadrzędnej można zmienić z daty na cechę kategorialną lub liczbową. Jest to na przykład przydatne, gdy cecha jest identyfikowana jako data, ale ma być traktowana jako ciąg znaków lub liczba. W takim przypadku nie będzie już można używać cech poddanych inżynierii automatycznej do uczenia w ramach eksperymentu.

Wykonaj następujące czynności:

W widoku schematu znajdź cechę.
W kolumnie Typ cechy tej cechy kliknij .
Wybierz wartość z listy.

Zamiast tego możesz zmienić typy cech w Tabela Widoku danych. Znajdź cechę, a następnie kliknij Strzałka w dół obok bieżącego typu cechy. Wybierz wartość z listy.

Wszystkie kolumny ze zmienionym typem cechy można zobaczyć na panelu konfiguracji eksperymentu w obszarze Obróbka danych.

Wpływ na predykcje

Po ręcznej zmianie typu cechy, a następnie wdrożeniu modelu wynikowego nadpisanie typu cechy zostanie zastosowane do cechy w zestawie danych do zastosowania, który jest używany do predykcji wykonywanych przy użyciu tego modelu.

Zmiana zestawu danych

Zestaw danych do uczenia możesz zmienić przed uruchomieniem pierwszej wersji eksperymentu, a także po uruchomieniu dowolnej wersji.

Jeśli zmienisz zestaw danych przed uruchomieniem pierwszej wersji, utracisz całą konfigurację wykonaną przed zmianą zestawu danych.

Wykonaj następujące czynności:

Na panelu konfiguracji eksperymentu w obszarze Dane do uczenia kliknij Zmień zestaw danych.
Wybierz nowy zestaw danych.

Więcej informacji na temat zmiany i odświeżania zestawu danych podczas doskonalenia modelu (po uruchomieniu wersji eksperymentu) zawiera temat Zmiana i odświeżenie zestawu danych.

Konfiguracja optymalizacji modeli

W celu optymalizacji modeli można dostosować następujące ustawienia:

Włączanie i wyłączanie inteligentnej optymalizacji modeli
Włączanie lub wyłączanie optymalizacji hiperparametrów
Włączanie i wyłączanie uczenia z uwzględnieniem czasu

Opcje te można włączać i wyłączać dla każdej uruchamianej wersji eksperymentu.

Konfiguracja inteligentnej optymalizacji

W eksperymencie stosuje się domyślnie inteligentną optymalizację modelu. Dzięki inteligentnej optymalizacji modeli Qlik Predict udoskonala model za użytkownika, iterując wybór cech i stosując zaawansowane transformacje danych.

Więcej informacji o inteligentnej optymalizacji zawiera temat Inteligentna optymalizacja modeli.

Możesz wyłączyć to ustawienie, aby ręcznie doskonalić uczone modele. Na przykład możesz rozpocząć uczenie modelu od inteligentnej optymalizacji modelu, a następnie przejść do ręcznego ulepszania wersji 2, aby dokładniej dostosować konfigurację.

Wykonaj następujące czynności:

Kliknij Wyświetl konfigurację.
Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.
W panelu rozwiń pozycję Optymalizacja modelu.
Przełącz z inteligentna na Ręczna.
Ustaw suwakiem maksimum czasu trwania uczenia.

Aktywacja opcji Inteligentna optymalizacja modelu w sekcji Optymalizacja modelu w panelu konfiguracji uczenia Qlik Predict — Konfiguracja optymalizacji modeli

Konfigurowanie optymalizacji hiperparametrów

Modele można zoptymalizować przy użyciu optymalizacji hiperparametrów. Pamiętaj, że jest to opcja zaawansowana, która może znacznie wydłużyć czas uczenia. Optymalizacja hiperparametrów jest dostępna po wyłączeniu inteligentnej optymalizacji.

Więcej informacji zawiera temat Optymalizacja hiperparametrów.

Wykonaj następujące czynności:

Kliknij Wyświetl konfigurację.
Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.
W panelu rozwiń pozycję Optymalizacja modelu.
Przełącz z inteligentna na Ręczna.
Zaznacz pole wyboru Optymalizacja hiperparametrów.
Opcjonalnie ustaw limit czasowy optymalizacji. Domyślny limit czasu to jedna godzina.

Panel konfiguracji uczenia Qlik Predict z aktywną optymalizacją hiperparametrów — Konfigurowanie optymalizacji hiperparametrów

Konfiguracja uczenia z uwzględnieniem czasu

Jeśli chcesz, aby modele były uczone z uwzględnieniem wymiaru szeregu czasowego, aktywuj uczenie z uwzględnieniem czasu dla wersji eksperymentu. Aby móc użyć tej opcji, musisz mieć kolumnę w zestawie danych, która zawiera odpowiednie informacje o szeregach czasowych.

Po włączeniu uczenia z uwzględnieniem czasu Qlik Predict wykorzystuje do uczenia modeli specjalistyczne procesy walidacji krzyżowej oraz imputacji wartości null.

Więcej informacji zawierają tematy Tworzenie modeli uwzględniających czas oraz Walidacja krzyżowa oparta na czasie.

Wykonaj następujące czynności:

Kliknij Wyświetl konfigurację.
Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.
W panelu rozwiń pozycję Optymalizacja modelu.
W sekcji Czasowy podział test/uczenie wybierz Indeks daty, który ma zostać użyty do sortowania danych.

Panel konfiguracji uczenia Qlik Predict z wybraną kolumną daty w celu aktywowania uczenia z uwzględnieniem czasu. — Konfiguracja uczenia z uwzględnieniem czasu przez wybranie kolumny w danych do uczenia, które mają być używane jako indeks.

Wyświetlanie wniosków na temat danych do uczenia

Na karcie Dane eksperymentu możesz wyświetlić wnioski na temat postępowania z danymi do uczenia. Informacje te są dostępne w kolumnie Wnioski Wiersze tabeli w Widoku schematu. Wyświetlane informacje zależą od tego, czy uruchomiono wersję z bieżącymi danymi do uczenia. Zmiany w kolumnie Wnioski mogą pomóc w ustaleniu, dlaczego cechy mogą być niedostępne lub dlaczego zostały automatycznie usunięte.

Więcej informacji na temat znaczenia poszczególnych wniosków zawiera temat Interpretowanie wniosków z zestawu danych.

POWIĄZANE MATERIAŁY EDUKACYJNE:

Wprowadzenie do Qlik Predict

Dowiedz się więcej

Wprowadzenie do Qlik Predict

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!

Przekaż tu opinię