Konfigurowanie eksperymentów
Konfiguracja eksperymentów polega na wyborze celu oraz cech, których model użyje do przewidywania celu. Można również skonfigurować szereg ustawień opcjonalnych.
Aby pomóc w wyborze celu, analizowany jest historyczny zestaw danych i wyświetlane są statystyki podsumowujące dla każdej kolumny w zestawie danych. Do zestawu danych stosowanych jest kilka automatycznych kroków wstępnego przetwarzania, aby upewnić się, że uwzględnione zostaną tylko odpowiednie dane. Więcej szczegółów na temat wstępnego przetwarzania danych można znaleźć w sekcji Automatyczne przygotowanie i przekształcanie danych.
Po uruchomieniu wersji v1 można w razie potrzeby utworzyć nowe wersje eksperymentu, aby dokładniej dostroić trenowanie modelu. Więcej informacji można znaleźć w sekcji Dopracowywanie modeli.
Wymagania i uprawnienia
Aby dowiedzieć się więcej o wymaganiach użytkownika dotyczących pracy z eksperymentami ML, patrz Praca z eksperymentami.
Interfejs
Poniższe sekcje opisują, jak poruszać się po interfejsie eksperymentu w celu jego skonfigurowania. Więcej informacji na temat interfejsu można znaleźć w sekcji Nawigacja po interfejsie eksperymentu.
Nawigacja na kartach
Po utworzeniu eksperymentu otwiera się karta Konfiguracja. W tym miejscu można skonfigurować cel i cechy eksperymentu.
Po uruchomieniu co najmniej jednej wersji eksperymentu karta Konfiguracja zmienia się w kartę Dane treningowe. Dostępne stają się również inne karty. Te inne karty umożliwiają analizę modeli, które właśnie zostały wytrenowane w danej wersji. Jeśli konieczne jest skonfigurowanie kolejnych wersji z innymi wyborami cech, można powrócić do karty Dane treningowe.
Widok schematu i Widok danych
Na karcie Konfiguracja/Dane treningowe można przełączać się między następującymi widokami:
-
Widok schematu: widok domyślny. W tym widoku każda kolumna w zestawie danych jest reprezentowana przez wiersz w schemacie zawierający informacje i statystyki.
-
Widok danych: alternatywny widok, którego można użyć, aby uzyskać dostęp do większej ilości informacji i danych przykładowych dla każdej kolumny.
Widok schematu w eksperymencie ML

Widok danych w eksperymencie ML

Panel konfiguracji eksperymentu
W panelu konfiguracji eksperymentu można dodatkowo dostosować trenowanie eksperymentu. Ten panel jest domyślnie otwarty w nowych eksperymentach.
Po uruchomieniu wersji kliknij ikonę Wyświetl konfigurację, aby otworzyć panel w celu skonfigurowania kolejnej wersji.
Za pomocą panelu konfiguracji eksperymentu można:
-
Wybierz cel i typ eksperymentu
-
Ustaw nazwę wersji
-
Dodaj lub usuń cechy
-
Skonfiguruj nową wersję eksperymentu
-
Wyświetl typ trenowanego modelu
-
Wybierz, aby zmienić lub odświeżyć treningowy zestaw danych
-
Dodaj lub usuń algorytmy
-
Zmień ustawienia optymalizacji modelu
-
W przypadku modeli szeregów czasowych ustaw ustawienia prognozy
-
Skonfiguruj wykrywanie stronniczości
Panel konfiguracji eksperymentu

Wybór celu i typu eksperymentu
Kolumnę docelową i typ eksperymentu można zmieniać do momentu rozpoczęcia pierwszego trenowania. Po tym czasie są one zablokowane do edycji.
Kolumna docelowa zawiera wartości, które model uczenia maszynowego ma przewidywać.
Typ eksperymentu jest określany na podstawie celu i typu danych, które zawiera. Typ eksperymentu definiuje, jaki typ modelu ma być trenowany. Dostępne mogą być następujące opcje:
-
Klasyfikacja binarna: trenuje modele do przewidywania celu, który ma dwie możliwe wartości (na przykład tak lub nie). Dane mogą być dowolnego typu cech.
-
Klasyfikacja wieloklasowa: trenuje modele do przewidywania celu o 3–10 możliwych wartościach (na przykład listy kategorii). Dane mogą być dowolnego typu cech, ale kolumna zawierająca więcej niż 10 unikalnych, nienumerycznych klas (wartości) nie może zostać wybrana jako cel.
-
Regresja: trenuje modele do przewidywania celu o więcej niż 10 możliwych wartościach — w szczególności celu o numerycznym typie cechy.
-
Szeregi czasowe: trenuje modele do prognozowania wartości docelowych dla określonych przyszłych okresów, wykorzystując dane historyczne. Cel musi mieć więcej niż 10 unikalnych wartości i zawierać dane numeryczne. Więcej informacji można znaleźć w sekcji Praca z eksperymentami szeregów czasowych.
Wykonaj następujące czynności:
-
W
Widok schematu lub
Widok danych najedź kursorem na kolumnę.
-
Kliknij ikonę
, która się pojawi.
Kolumna docelowa jest teraz oznaczona ikoną
, a pozostałe dostępne kolumny są automatycznie wybierane jako cechy.
Wybór celu w Widok schematu

-
W panelu konfiguracji eksperymentu, w sekcji Ustawienia eksperymentu, można w razie potrzeby zmienić cel przed trenowaniem.
Po wybraniu celu i typu eksperymentu można rozpocząć uruchamianie pierwszej wersji eksperymentu. Więcej informacji można znaleźć w sekcji Trenowanie eksperymentów. W tym momencie można przeprowadzić dodatkową konfigurację — opisaną poniżej — lub dostosować konfigurację po przejrzeniu wyników trenowania.
Wyjaśnienia dotyczące sposobu interpretacji i przetwarzania danych są wyświetlane w miarę postępu trenowania eksperymentu. Więcej informacji można znaleźć w sekcji Interpretowanie wglądów w zestaw danych.
Wybór kolumn cech
Po ustawieniu celu można wybrać, które z pozostałych dostępnych kolumn mają zostać uwzględnione w trenowaniu modelu. Wyklucz wszelkie cechy, które nie powinny być częścią modelu. Pamiętaj, że kolumna pozostanie w zestawie danych, ale nie będzie używana przez algorytm trenowania.
U góry panelu konfiguracji eksperymentu widoczna jest liczba komórek w zestawie danych. Jeśli liczba ta przekracza limit zestawu danych, można wykluczyć cechy, aby zmieścić się w limicie.
Kolumny cech można wybierać na różne sposoby:
W Widok schematu i Widok danych
W widokach głównych można:
-
Odznaczyć opcję Uwzględnij wszystkie dostępne cechy, a następnie wybrać tylko te, które mają zostać uwzględnione.
-
Ręcznie odznaczyć pola wyboru dla cech, które nie mają być uwzględniane.
-
Wyszukać i wykluczyć lub uwzględnić wszystkie cechy w przefiltrowanym wyniku wyszukiwania.
W panelu konfiguracji eksperymentu
W panelu konfiguracji eksperymentu można:
-
Ręcznie odznaczyć pola wyboru dla cech, które nie mają być uwzględniane.
-
Po uruchomieniu pierwszej wersji eksperymentu można zdefiniować opcję Liczba najważniejszych cech do uwzględnienia.
Sekcja Cechy w panelu konfiguracji eksperymentu

Po wybraniu cech jest im automatycznie przypisywany typ cechy. Możliwe typy cech to:
-
Kategorialny
-
Numeryczny
-
Data
-
Dowolny tekst
Typ cechy jest przypisywany na podstawie danych zawartych w kolumnie cechy. Jeśli cecha spełnia określone kryteria, może zostać wybrana jako podstawa do automatycznie generowanych cech. W razie potrzeby można zmienić to, czy cecha jest używana do automatycznego generowania cech. Pełne szczegóły na temat automatycznego generowania cech można znaleźć w sekcji Automatyczna inżynieria cech.
Niektóre kolumny w zestawie danych mogą nie być dostępne do wyboru jako cechy eksperymentu lub może być do nich stosowane określone przetwarzanie. Wyjaśnienia dotyczące sposobu interpretacji i przetwarzania danych są wyświetlane podczas nawigacji po trenowaniu eksperymentu. Więcej informacji można znaleźć w sekcji Interpretowanie wglądów w zestaw danych.
Konfigurowanie wykrywania uprzedzeń
Można aktywować wykrywanie uprzedzeń dla cech zawierających dane wrażliwe. Wykrywanie uprzedzeń jest wykonywane podczas uruchamiania eksperymentu. Można również kliknąć przycisk Pobierz rekomendacje, aby użyć generatywnej sztucznej inteligencji do przeskanowania danych treningowych pod kątem potencjalnie wrażliwych cech przed uruchomieniem wykrywania uprzedzeń.
Wykrywanie uprzedzeń określa, czy cecha zwiększa prawdopodobieństwo promowania przez model niesprawiedliwych wyników w jego prognozach, czy też dane źródłowe są ze swej natury uprzedzone.
Wykonaj następujące czynności:
-
W eksperymencie ML rozwiń Uprzedzenie w panelu konfiguracji trenowania.
-
Przed wybraniem cech do wykrywania stronniczości, opcjonalnie kliknij Pobierz rekomendacje, aby użyć generatywnej sztucznej inteligencji do sugerowania cech, które mogą zawierać stronnicze dane. Zob. Wykorzystywanie generatywnej sztucznej inteligencji do rekomendowania cech do wykrywania stronniczości.
-
Wybierz lub odznacz dowolne cechy, dla których chcesz uruchomić wykrywanie stronniczości.
Alternatywnie, włącz wykrywanie uprzedzeń dla żądanych cech w widoku schematu.
Więcej informacji na temat wykrywania uprzedzeń można znaleźć w sekcji Wykrywanie stronniczości w modelach uczenia maszynowego.
Wybór algorytmów
Wszystkie dostępne algorytmy są domyślnie uwzględniane i można wykluczyć te, których nie chce się używać. Zazwyczaj robi się to w ramach dostrajania modelu po zapoznaniu się z pierwszymi wynikami trenowania. Więcej informacji można znaleźć w sekcji Dopracowywanie modeli.
Sekcja Algorytmy w panelu konfiguracji eksperymentu
Zmiana typów cech
Po załadowaniu zestawu danych kolumny są traktowane jako kategorialne, numeryczne, daty lub dowolny tekst na podstawie typu danych i innych cech charakterystycznych. W niektórych przypadkach może być konieczna zmiana tego ustawienia.
Na przykład, jeśli dni tygodnia są reprezentowane przez liczby 1–7, każda liczba reprezentuje wartość kategorialną. Domyślnie jest ona traktowana jako ciągła, uporządkowana wartość numeryczna, więc trzeba ręcznie zmienić konfigurację, aby traktować ją jako kategorialną.
Gdy kolumna zostanie zidentyfikowana jako zawierająca informacje o dacie i godzinie, jest używana jako podstawa do generowania nowych, automatycznie tworzonych cech. W takim przypadku oryginalna kolumna (cecha nadrzędna) jest traktowana jako mająca typ cechy daty.
Można zmienić cechę nadrzędną z cechy daty na cechę kategorialną lub numeryczną. Jest to przydatne na przykład wtedy, gdy cecha zostanie zidentyfikowana jako data, ale musi być traktowana jako ciąg znaków lub liczba. W takim przypadku nie można już używać jej automatycznie generowanych cech w trenowaniu eksperymentu.
Wykonaj następujące czynności:
-
W
Widok schematu zlokalizuj cechę.
-
W kolumnie Typ cechy dla tej cechy kliknij ikonę
.
-
Wybierz wartość z listy.
Można również zmienić typy cech w Widok danych. Zlokalizuj cechę, a następnie kliknij ikonę
obok bieżącego typu cechy. Wybierz wartość z listy.
Prognozowanie szeregów czasowych
W przypadku trenowania eksperymentu szeregów czasowych niektóre przekształcenia typów cech są stosowane automatycznie w zależności od konfiguracji. Na przykład w przypadku wybrania grup do prognozowania wielowymiarowego typy cech tych grup są automatycznie przełączane na kategorialne.
Wpływ na prognozy
Po ręcznej zmianie typu cechy, a następnie wdrożeniu modelu wynikowego nadpisanie typu cechy zostanie zastosowane do cechy w zestawie danych do zastosowania, który jest używany do predykcji wykonywanych przy użyciu tego modelu.
Zmiana zestawu danych
Treningowy zestaw danych można zmienić przed uruchomieniem pierwszej wersji eksperymentu, a także po uruchomieniu dowolnej wersji.
W przypadku zmiany zestawu danych przed uruchomieniem pierwszej wersji utracona zostanie konfiguracja wykonana przed zmianą zestawu danych.
Wykonaj następujące czynności:
-
W panelu konfiguracji eksperymentu w sekcji Dane treningowe > Przejrzyj zestaw danych kliknij przycisk Zmień zestaw danych.
-
Wybierz nowy zestaw danych.
Więcej informacji na temat zmiany i odświeżania zestawu danych podczas dostrajania modelu (po uruchomieniu wersji eksperymentu) można znaleźć w sekcji Zmiana i odświeżanie zestawu danych.
Konfigurowanie optymalizacji modelu
Jeśli typ eksperymentu to klasyfikacja binarna, klasyfikacja wieloklasowa lub regresja, można dostosować następujące ustawienia w celu optymalizacji modeli:
-
Włączanie lub wyłączanie inteligentnej optymalizacji modelu
-
Włączanie lub wyłączanie optymalizacji hiperparametrów
-
Włączanie lub wyłączanie trenowania uwzględniającego czas
Opcje te można włączać lub wyłączać dla każdej uruchamianej wersji eksperymentu.
Sekcja Optymalizacja modelu w panelu konfiguracji eksperymentu
Konfigurowanie inteligentnej optymalizacji
Domyślnie eksperyment korzysta z inteligentnej optymalizacji modelu. Dzięki inteligentnej optymalizacji modelu rozwiązanie Qlik Predict obsługuje proces dostrajania modelu za użytkownika, iterując wybór cech i stosując zaawansowane przekształcenia danych.
Więcej informacji na temat inteligentnej optymalizacji można znaleźć w sekcji Inteligentna optymalizacja modelu.
Można wyłączyć to ustawienie, aby ręcznie dostrajać trenowane modele. Na przykład można rozpocząć trenowanie modelu z inteligentną optymalizacją modelu, a następnie przełączyć się na ręczne dostrajanie dla wersji v2, aby dokładniej dostosować konfigurację.
Wykonaj następujące czynności:
-
Kliknij ikonę
Wyświetl konfigurację.
-
Jeśli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij przycisk Nowa wersja.
-
W panelu rozwiń sekcję Optymalizacja modelu.
-
Przełącz opcję z Inteligentna na Ręczna.
-
Za pomocą suwaka ustaw maksymalny czas trwania trenowania.
Konfigurowanie optymalizacji hiperparametrów
Modele można optymalizować za pomocą optymalizacji hiperparametrów. Pamiętaj, że jest to opcja zaawansowana, która może znacznie wydłużyć czas trenowania. Optymalizacja hiperparametrów jest dostępna po wyłączeniu inteligentnej optymalizacji.
Więcej informacji można znaleźć w sekcji Optymalizacja hiperparametrów.
Wykonaj następujące czynności:
-
Kliknij ikonę
Wyświetl konfigurację.
-
Jeśli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij przycisk Nowa wersja.
-
W panelu rozwiń sekcję Optymalizacja modelu.
-
Przełącz opcję z Inteligentna na Ręczna.
-
Zaznacz pole wyboru Optymalizacja hiperparametrów.
-
Opcjonalnie ustaw limit czasu dla optymalizacji. Domyślny limit czasu to jedna godzina.
Konfigurowanie trenowania uwzględniającego czas
Jeśli chcesz, aby modele były trenowane z uwzględnieniem wymiaru szeregów czasowych, aktywuj trenowanie uwzględniające czas dla danej wersji eksperymentu. Aby skorzystać z tej opcji, w zestawie danych musi znajdować się kolumna zawierająca odpowiednie informacje o szeregach czasowych.
Gdy trenowanie uwzględniające czas jest włączone, rozwiązanie Qlik Predict używa specjalistycznych procesów walidacji krzyżowej i imputacji wartości pustych do trenowania modeli.
Więcej informacji można znaleźć w sekcjach Tworzenie modeli uwzględniających czas oraz Walidacja krzyżowa oparta na czasie.
Wykonaj następujące czynności:
-
Kliknij ikonę
Wyświetl konfigurację.
-
Jeśli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij przycisk Nowa wersja.
-
W panelu rozwiń sekcję Optymalizacja modelu.
-
W sekcji Podział na dane testowe i treningowe na podstawie czasu wybierz Indeks daty, który ma być używany do sortowania danych.
Wyświetlanie wglądów w dane treningowe
Na karcie Konfiguracja/Dane treningowe eksperymentu można wyświetlić wglądy w sposób obsługi danych treningowych. Informacje te są dostępne w kolumnie Wglądy w Widok schematu. Wyświetlane informacje zależą od tego, czy uruchomiono wersję z bieżącymi danymi treningowymi. Zmiany w kolumnie Wglądy mogą pomóc zidentyfikować, dlaczego cechy mogą być niedostępne do użycia lub dlaczego zostały automatycznie odrzucone.
Więcej informacji o znaczeniu poszczególnych wglądów można znaleźć w sekcji Interpretowanie wglądów w zestaw danych.