Konfigurowanie eksperymentów | Qlik Cloud Pomoc
Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Konfigurowanie eksperymentów

Konfiguracja eksperymentów polega na wyborze celu oraz cech, których model użyje do przewidywania celu. Można również skonfigurować szereg ustawień opcjonalnych.

Aby pomóc w wyborze celu, analizowany jest historyczny zestaw danych i wyświetlane są statystyki podsumowujące dla każdej kolumny w zestawie danych. Do zestawu danych stosowanych jest kilka automatycznych kroków wstępnego przetwarzania, aby upewnić się, że uwzględnione zostaną tylko odpowiednie dane. Więcej szczegółów na temat wstępnego przetwarzania danych można znaleźć w sekcji Automatyczne przygotowanie i przekształcanie danych.

Po uruchomieniu wersji v1 można w razie potrzeby utworzyć nowe wersje eksperymentu, aby dokładniej dostroić trenowanie modelu. Więcej informacji można znaleźć w sekcji Dopracowywanie modeli.

Wymagania i uprawnienia

Aby dowiedzieć się więcej o wymaganiach użytkownika dotyczących pracy z eksperymentami ML, patrz Praca z eksperymentami.

Interfejs

Poniższe sekcje opisują, jak poruszać się po interfejsie eksperymentu w celu jego skonfigurowania. Więcej informacji na temat interfejsu można znaleźć w sekcji Nawigacja po interfejsie eksperymentu.

Nawigacja na kartach

Po utworzeniu eksperymentu otwiera się karta Konfiguracja. W tym miejscu można skonfigurować cel i cechy eksperymentu.

Po uruchomieniu co najmniej jednej wersji eksperymentu karta Konfiguracja zmienia się w kartę Dane treningowe. Dostępne stają się również inne karty. Te inne karty umożliwiają analizę modeli, które właśnie zostały wytrenowane w danej wersji. Jeśli konieczne jest skonfigurowanie kolejnych wersji z innymi wyborami cech, można powrócić do karty Dane treningowe.

Widok schematu i Widok danych

Na karcie Konfiguracja/Dane treningowe można przełączać się między następującymi widokami:

  • Wiersze Widok schematu: widok domyślny. W tym widoku każda kolumna w zestawie danych jest reprezentowana przez wiersz w schemacie zawierający informacje i statystyki.

  • Tabela Widok danych: alternatywny widok, którego można użyć, aby uzyskać dostęp do większej ilości informacji i danych przykładowych dla każdej kolumny.

Widok schematu w eksperymencie ML

Widok schematu w eksperymencie ML

Widok danych w eksperymencie ML

Widok danych w eksperymencie ML

Panel konfiguracji eksperymentu

W panelu konfiguracji eksperymentu można dodatkowo dostosować trenowanie eksperymentu. Ten panel jest domyślnie otwarty w nowych eksperymentach.

Po uruchomieniu wersji kliknij ikonę Elementy sterujące Wyświetl konfigurację, aby otworzyć panel w celu skonfigurowania kolejnej wersji.

Za pomocą panelu konfiguracji eksperymentu można:

  • Wybierz cel i typ eksperymentu

  • Ustaw nazwę wersji

  • Dodaj lub usuń cechy

  • Skonfiguruj nową wersję eksperymentu

  • Wyświetl typ trenowanego modelu

  • Wybierz, aby zmienić lub odświeżyć treningowy zestaw danych

  • Dodaj lub usuń algorytmy

  • Zmień ustawienia optymalizacji modelu

  • W przypadku modeli szeregów czasowych ustaw ustawienia prognozy

  • Skonfiguruj wykrywanie stronniczości

Panel konfiguracji eksperymentu

Panel konfiguracji eksperymentu z wybranym celem, typem eksperymentu i domyślnym wyborem cech

Wybór celu i typu eksperymentu

Kolumnę docelową i typ eksperymentu można zmieniać do momentu rozpoczęcia pierwszego trenowania. Po tym czasie są one zablokowane do edycji.

Kolumna docelowa zawiera wartości, które model uczenia maszynowego ma przewidywać.

Typ eksperymentu jest określany na podstawie celu i typu danych, które zawiera. Typ eksperymentu definiuje, jaki typ modelu ma być trenowany. Dostępne mogą być następujące opcje:

  • Klasyfikacja binarna: trenuje modele do przewidywania celu, który ma dwie możliwe wartości (na przykład tak lub nie). Dane mogą być dowolnego typu cech.

  • Klasyfikacja wieloklasowa: trenuje modele do przewidywania celu o 3–10 możliwych wartościach (na przykład listy kategorii). Dane mogą być dowolnego typu cech, ale kolumna zawierająca więcej niż 10 unikalnych, nienumerycznych klas (wartości) nie może zostać wybrana jako cel.

  • Regresja: trenuje modele do przewidywania celu o więcej niż 10 możliwych wartościach — w szczególności celu o numerycznym typie cechy.

  • Szeregi czasowe: trenuje modele do prognozowania wartości docelowych dla określonych przyszłych okresów, wykorzystując dane historyczne. Cel musi mieć więcej niż 10 unikalnych wartości i zawierać dane numeryczne. Więcej informacji można znaleźć w sekcji Praca z eksperymentami szeregów czasowych.

  1. W Wiersze Widok schematu lub Tabela Widok danych najedź kursorem na kolumnę.

  2. Kliknij ikonę Cel, która się pojawi.

    Kolumna docelowa jest teraz oznaczona ikoną Cel, a pozostałe dostępne kolumny są automatycznie wybierane jako cechy.

    Wybór celu w Widok schematu

    Kolumna zestawu danych z symbolem celu.
  3. W panelu konfiguracji eksperymentu, w sekcji Ustawienia eksperymentu, można w razie potrzeby zmienić cel przed trenowaniem.

  4. InformacjaUstawienia eksperymentu mogą zawierać selektor Typ eksperymentu. Na przykład, jeśli dla danego zestawu danych i celu możliwe jest prognozowanie szeregów czasowych, dostępna jest opcja zmiany typu eksperymentu z Regresja na Szeregi czasowe.

Po wybraniu celu i typu eksperymentu można rozpocząć uruchamianie pierwszej wersji eksperymentu. Więcej informacji można znaleźć w sekcji Trenowanie eksperymentów. W tym momencie można przeprowadzić dodatkową konfigurację — opisaną poniżej — lub dostosować konfigurację po przejrzeniu wyników trenowania.

Wyjaśnienia dotyczące sposobu interpretacji i przetwarzania danych są wyświetlane w miarę postępu trenowania eksperymentu. Więcej informacji można znaleźć w sekcji Interpretowanie wglądów w zestaw danych.

Wybór kolumn cech

Po ustawieniu celu można wybrać, które z pozostałych dostępnych kolumn mają zostać uwzględnione w trenowaniu modelu. Wyklucz wszelkie cechy, które nie powinny być częścią modelu. Pamiętaj, że kolumna pozostanie w zestawie danych, ale nie będzie używana przez algorytm trenowania.

U góry panelu konfiguracji eksperymentu widoczna jest liczba komórek w zestawie danych. Jeśli liczba ta przekracza limit zestawu danych, można wykluczyć cechy, aby zmieścić się w limicie.

Kolumny cech można wybierać na różne sposoby:

W Widok schematu i Widok danych

W widokach głównych można:

  • Odznaczyć opcję Uwzględnij wszystkie dostępne cechy, a następnie wybrać tylko te, które mają zostać uwzględnione.

  • Ręcznie odznaczyć pola wyboru dla cech, które nie mają być uwzględniane.

  • Wyszukać i wykluczyć lub uwzględnić wszystkie cechy w przefiltrowanym wyniku wyszukiwania.

W panelu konfiguracji eksperymentu

W panelu konfiguracji eksperymentu można:

  • Ręcznie odznaczyć pola wyboru dla cech, które nie mają być uwzględniane.

  • Po uruchomieniu pierwszej wersji eksperymentu można zdefiniować opcję Liczba najważniejszych cech do uwzględnienia.

Sekcja Cechy w panelu konfiguracji eksperymentu

Sekcja Cechy w panelu konfiguracji eksperymentu Qlik Predict

Po wybraniu cech jest im automatycznie przypisywany typ cechy. Możliwe typy cech to:

  • Kategorialny

  • Numeryczny

  • Data

  • Dowolny tekst

Typ cechy jest przypisywany na podstawie danych zawartych w kolumnie cechy. Jeśli cecha spełnia określone kryteria, może zostać wybrana jako podstawa do automatycznie generowanych cech. W razie potrzeby można zmienić to, czy cecha jest używana do automatycznego generowania cech. Pełne szczegóły na temat automatycznego generowania cech można znaleźć w sekcji Automatyczna inżynieria cech.

Niektóre kolumny w zestawie danych mogą nie być dostępne do wyboru jako cechy eksperymentu lub może być do nich stosowane określone przetwarzanie. Wyjaśnienia dotyczące sposobu interpretacji i przetwarzania danych są wyświetlane podczas nawigacji po trenowaniu eksperymentu. Więcej informacji można znaleźć w sekcji Interpretowanie wglądów w zestaw danych.

Konfigurowanie wykrywania uprzedzeń

Można aktywować wykrywanie uprzedzeń dla cech zawierających dane wrażliwe. Wykrywanie uprzedzeń jest wykonywane podczas uruchamiania eksperymentu. Można również kliknąć przycisk Pobierz rekomendacje, aby użyć generatywnej sztucznej inteligencji do przeskanowania danych treningowych pod kątem potencjalnie wrażliwych cech przed uruchomieniem wykrywania uprzedzeń.

Wykrywanie uprzedzeń określa, czy cecha zwiększa prawdopodobieństwo promowania przez model niesprawiedliwych wyników w jego prognozach, czy też dane źródłowe są ze swej natury uprzedzone.

  1. W eksperymencie ML rozwiń Uprzedzenie w panelu konfiguracji trenowania.

  2. Przed wybraniem cech do wykrywania stronniczości, opcjonalnie kliknij Pobierz rekomendacje, aby użyć generatywnej sztucznej inteligencji do sugerowania cech, które mogą zawierać stronnicze dane. Zob. Wykorzystywanie generatywnej sztucznej inteligencji do rekomendowania cech do wykrywania stronniczości.

  3. Wybierz lub odznacz dowolne cechy, dla których chcesz uruchomić wykrywanie stronniczości.

Alternatywnie, włącz wykrywanie uprzedzeń dla żądanych cech w Wiersze widoku schematu.

Więcej informacji na temat wykrywania uprzedzeń można znaleźć w sekcji Wykrywanie stronniczości w modelach uczenia maszynowego.

Wybór algorytmów

Wszystkie dostępne algorytmy są domyślnie uwzględniane i można wykluczyć te, których nie chce się używać. Zazwyczaj robi się to w ramach dostrajania modelu po zapoznaniu się z pierwszymi wynikami trenowania. Więcej informacji można znaleźć w sekcji Dopracowywanie modeli.

Sekcja Algorytmy w panelu konfiguracji eksperymentu

Sekcja Algorytmy w panelu konfiguracji eksperymentu Qlik Predict.

Zmiana typów cech

Po załadowaniu zestawu danych kolumny są traktowane jako kategorialne, numeryczne, daty lub dowolny tekst na podstawie typu danych i innych cech charakterystycznych. W niektórych przypadkach może być konieczna zmiana tego ustawienia.

Na przykład, jeśli dni tygodnia są reprezentowane przez liczby 1–7, każda liczba reprezentuje wartość kategorialną. Domyślnie jest ona traktowana jako ciągła, uporządkowana wartość numeryczna, więc trzeba ręcznie zmienić konfigurację, aby traktować ją jako kategorialną.

Gdy kolumna zostanie zidentyfikowana jako zawierająca informacje o dacie i godzinie, jest używana jako podstawa do generowania nowych, automatycznie tworzonych cech. W takim przypadku oryginalna kolumna (cecha nadrzędna) jest traktowana jako mająca typ cechy daty.

Można zmienić cechę nadrzędną z cechy daty na cechę kategorialną lub numeryczną. Jest to przydatne na przykład wtedy, gdy cecha zostanie zidentyfikowana jako data, ale musi być traktowana jako ciąg znaków lub liczba. W takim przypadku nie można już używać jej automatycznie generowanych cech w trenowaniu eksperymentu.

  1. W Wiersze Widok schematu zlokalizuj cechę.

  2. W kolumnie Typ cechy dla tej cechy kliknij ikonę Strzałka w dół.

  3. Wybierz wartość z listy.

Można również zmienić typy cech w Tabela Widok danych. Zlokalizuj cechę, a następnie kliknij ikonę Strzałka w dół obok bieżącego typu cechy. Wybierz wartość z listy.

Prognozowanie szeregów czasowych

W przypadku trenowania eksperymentu szeregów czasowych niektóre przekształcenia typów cech są stosowane automatycznie w zależności od konfiguracji. Na przykład w przypadku wybrania grup do prognozowania wielowymiarowego typy cech tych grup są automatycznie przełączane na kategorialne.

Wpływ na prognozy

Po ręcznej zmianie typu cechy, a następnie wdrożeniu modelu wynikowego nadpisanie typu cechy zostanie zastosowane do cechy w zestawie danych do zastosowania, który jest używany do predykcji wykonywanych przy użyciu tego modelu.

Zmiana zestawu danych

Treningowy zestaw danych można zmienić przed uruchomieniem pierwszej wersji eksperymentu, a także po uruchomieniu dowolnej wersji.

W przypadku zmiany zestawu danych przed uruchomieniem pierwszej wersji utracona zostanie konfiguracja wykonana przed zmianą zestawu danych.

  1. W panelu konfiguracji eksperymentu w sekcji Dane treningowePrzejrzyj zestaw danych kliknij przycisk Zmień zestaw danych.

  2. Wybierz nowy zestaw danych.

Więcej informacji na temat zmiany i odświeżania zestawu danych podczas dostrajania modelu (po uruchomieniu wersji eksperymentu) można znaleźć w sekcji Zmiana i odświeżanie zestawu danych.

Konfigurowanie optymalizacji modelu

Jeśli typ eksperymentu to klasyfikacja binarna, klasyfikacja wieloklasowa lub regresja, można dostosować następujące ustawienia w celu optymalizacji modeli:

  • Włączanie lub wyłączanie inteligentnej optymalizacji modelu

  • Włączanie lub wyłączanie optymalizacji hiperparametrów

  • Włączanie lub wyłączanie trenowania uwzględniającego czas

Opcje te można włączać lub wyłączać dla każdej uruchamianej wersji eksperymentu.

Sekcja Optymalizacja modelu w panelu konfiguracji eksperymentu

Sekcja Optymalizacja modelu w panelu konfiguracji trenowania Qlik Predict

Konfigurowanie inteligentnej optymalizacji

Domyślnie eksperyment korzysta z inteligentnej optymalizacji modelu. Dzięki inteligentnej optymalizacji modelu rozwiązanie Qlik Predict obsługuje proces dostrajania modelu za użytkownika, iterując wybór cech i stosując zaawansowane przekształcenia danych.

Więcej informacji na temat inteligentnej optymalizacji można znaleźć w sekcji Inteligentna optymalizacja modelu.

Można wyłączyć to ustawienie, aby ręcznie dostrajać trenowane modele. Na przykład można rozpocząć trenowanie modelu z inteligentną optymalizacją modelu, a następnie przełączyć się na ręczne dostrajanie dla wersji v2, aby dokładniej dostosować konfigurację.

  1. Kliknij ikonę Elementy sterujące Wyświetl konfigurację.

  2. Jeśli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij przycisk Nowa wersja.

  3. W panelu rozwiń sekcję Optymalizacja modelu.

  4. Przełącz opcję z Inteligentna na Ręczna.

  5. Za pomocą suwaka ustaw maksymalny czas trwania trenowania.

Konfigurowanie optymalizacji hiperparametrów

Modele można optymalizować za pomocą optymalizacji hiperparametrów. Pamiętaj, że jest to opcja zaawansowana, która może znacznie wydłużyć czas trenowania. Optymalizacja hiperparametrów jest dostępna po wyłączeniu inteligentnej optymalizacji.

Więcej informacji można znaleźć w sekcji Optymalizacja hiperparametrów.

  1. Kliknij ikonę Elementy sterujące Wyświetl konfigurację.

  2. Jeśli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij przycisk Nowa wersja.

  3. W panelu rozwiń sekcję Optymalizacja modelu.

  4. Przełącz opcję z Inteligentna na Ręczna.

  5. Zaznacz pole wyboru Optymalizacja hiperparametrów.

  6. Opcjonalnie ustaw limit czasu dla optymalizacji. Domyślny limit czasu to jedna godzina.

Konfigurowanie trenowania uwzględniającego czas

Jeśli chcesz, aby modele były trenowane z uwzględnieniem wymiaru szeregów czasowych, aktywuj trenowanie uwzględniające czas dla danej wersji eksperymentu. Aby skorzystać z tej opcji, w zestawie danych musi znajdować się kolumna zawierająca odpowiednie informacje o szeregach czasowych.

Gdy trenowanie uwzględniające czas jest włączone, rozwiązanie Qlik Predict używa specjalistycznych procesów walidacji krzyżowej i imputacji wartości pustych do trenowania modeli.

Więcej informacji można znaleźć w sekcjach Tworzenie modeli uwzględniających czas oraz Walidacja krzyżowa oparta na czasie.

  1. Kliknij ikonę Elementy sterujące Wyświetl konfigurację.

  2. Jeśli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij przycisk Nowa wersja.

  3. W panelu rozwiń sekcję Optymalizacja modelu.

  4. W sekcji Podział na dane testowe i treningowe na podstawie czasu wybierz Indeks daty, który ma być używany do sortowania danych.

Wyświetlanie wglądów w dane treningowe

Na karcie Konfiguracja/Dane treningowe eksperymentu można wyświetlić wglądy w sposób obsługi danych treningowych. Informacje te są dostępne w kolumnie Wglądy w Wiersze tabeli Widok schematu. Wyświetlane informacje zależą od tego, czy uruchomiono wersję z bieżącymi danymi treningowymi. Zmiany w kolumnie Wglądy mogą pomóc zidentyfikować, dlaczego cechy mogą być niedostępne do użycia lub dlaczego zostały automatycznie odrzucone.

Więcej informacji o znaczeniu poszczególnych wglądów można znaleźć w sekcji Interpretowanie wglądów w zestaw danych.

POWIĄZANE MATERIAŁY EDUKACYJNE:

Dowiedz się więcej

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać!