Konfigurowanie eksperymentów
Konfiguracja eksperymentów polega na wybraniu celu i cech, których model użyje do jego przewidywania. Można także skonfigurować szereg opcjonalnych ustawień.
Aby Ci pomóc w wyborze celu, analizowany jest zestaw historycznych danych i wyświetlane są podsumowujące statystyki dotyczące każdej jego kolumny. Do zestawu danych stosuje się kilka kroków automatycznego wstępnego przetwarzania, aby uwzględnione zostały tylko odpowiednie dane. Więcej informacji na temat wstępnego przetwarzania danych zawiera temat Automatyczne przygotowanie i przekształcanie danych.
Po uruchomieniu wersji 1 można w razie potrzeby utworzyć nowe wersje eksperymentu w celu dalszego doskonalenia uczenia modelu. Więcej informacji zawiera temat Ulepszanie modeli.
Wymagania i uprawnienia
Więcej informacji na temat wymagań dotyczących użytkowników w kontekście pracy z eksperymentami uczenia maszynowego zawiera temat Praca z eksperymentami.
Interfejs
W poniższych sekcjach opisano sposób poruszania się po interfejsie eksperymentu w celu skonfigurowania eksperymentu. Więcej informacji na temat interfejsu zawiera temat Nawigacja w interfejsie eksperymentu.
Nawigacja przy użyciu kart
Podczas tworzenia eksperymentu otwiera się karta Dane. Tutaj możesz skonfigurować cel i cechy eksperymentu.
Po uruchomieniu przynajmniej jednej wersji eksperymentu stają się dostępne kolejne karty. Karty te umożliwiają analizę modeli, które właśnie zostały nauczone w danej wersji. Jeśli trzeba będzie skonfigurować kolejne wersje z innym wyborem cech, możesz wrócić do karty Dane.
Widok schematu i Widok danych
Na karcie Dane możesz przełączać następujące widoki:
-
Widok schematu: widok domyślny. W tym widoku każda kolumna w zestawie danych jest reprezentowana przez wiersz w schemacie z informacjami i statystykami.
-
Widok danych: alternatywny widok dający dostęp do większej ilości informacji i przykładowych danych dla każdej kolumny.
Panel Konfiguracja eksperymentu
Kliknij Wyświetl konfigurację, aby otworzyć panel, w którym można dodatkowo dostosować uczenie w ramach eksperymentu. Panel można otworzyć niezależnie od tego, która karta jest przeglądana. Panel ten udostępnia szereg dodatkowych opcji konfiguracyjnych.
Za pomocą panelu konfiguracji eksperymentu można wykonywać następujące czynności
-
Wybierz cel przed uczeniem pierwszej wersji
-
Dodaj lub usuń cechy
-
Skonfiguruj nową wersję eksperymentu
-
Wybierz, aby zmienić lub odświeżyć zestaw danych do uczenia
-
Dodaj lub usuń algorytmy
-
Zmień ustawienia optymalizacji modelu
Wybieranie celu
Kolumna celu zawiera wartości, które mają być przewidywane przez model uczenia maszynowego. Kolumnę celu można zmienić do momentu rozpoczęcia pierwszego uczenia. Następnie zostaje zablokowana do edycji.
Wykonaj następujące czynności:
W Widoku schematu lub Widoku danych wskaż kursorem kolumnę.
Kliknij wyświetloną ikonę .
Kolumna celu jest teraz wskazywana przez , a pozostałe dostępne kolumny są automatycznie wybierane jako cechy.
Cel można zamiast tego wybrać w panelu konfiguracji treningu.
Po wybraniu celu możesz rozpocząć pierwszą wersję eksperymentu. Więcej informacji: Uczenie eksperymentów. W tym momencie możesz przeprowadzić dodatkową konfigurację — opisaną poniżej — lub dostosować konfigurację po przejrzeniu wyników uczenia.
Wyjaśnienia dotyczące interpretacji i przetwarzania danych są wyświetlane podczas uczenia w ramach eksperymentu. Więcej informacji zawiera temat Interpretowanie wniosków z zestawu danych.
Określanie typu tworzonego modelu
Kolumna wybrana jako cel określa typ modelu tworzonego w ramach eksperymentu. To z kolei odgrywa rolę w określaniu, które algorytmy zostaną użyte do uczenia modelu. Niektóre kolumny w zestawie danych mogą być niedostępne jako cel na potrzeby eksperymentu lub mogą być do nich zastosowane określone procesy przetwarzania.
Typy modeli to:
Model klasyfikacji binarnej
Model klasyfikacji wieloklasowej
Model regresji
W poniższej tabeli podsumowano czynniki celu, które determinują rodzaj używanego modelu.
Typ modelu | Liczba odrębnych wartości w kolumnie | Wymagany typ cechy | Dodatkowe informacje |
---|---|---|---|
Klasyfikacja binarna | 2 | Dowolny | – |
Klasyfikacja wieloklasowa | 3-10 | Dowolny | Kolumny zawierającej więcej niż 10 odrębnych, nienumerycznych klas nie można wybrać jako celu. |
Regresja | Więcej niż 10 | Liczbowe | – |
Aby się dowiedzieć, jakie modele uczy Twój eksperyment, kliknij Wyświetl konfigurację i rozwiń Algorytmy. Typ modelu jest widoczny w tytule sekcji.
Wybieranie kolumn cech
Kiedy cel został ustawiony, możesz wybrać, które z pozostałych dostępnych kolumn mają zostać uwzględnione w uczeniu modelu. Wyklucz wszystkie cechy, które nie powinny być uwzględniane w modelu. Zauważ, że kolumna pozostanie w zestawie danych, ale nie będzie używana przez algorytm uczenia.
U góry panelu konfiguracji eksperymentu widać liczbę komórek w zestawie danych. Jeśli liczba przekracza limit zestawu danych, możesz wykluczyć cechy, aby zejść poniżej limitu.
Kolumny cech można wybrać na różne sposoby:
W Widoku schematu i Widoku danych
W głównych widokach można wykonywać następujące czynności:
Usuń zaznaczenie pozycji Uwzględnij wszystkie dostępne cechy, a następnie wybierz tylko te, które chcesz uwzględnić.
Wyczyść ręcznie pola wyboru cech, których nie chcesz uwzględniać.
Wyszukaj i wyklucz lub uwzględnij wszystkie cechy w przefiltrowanym wyniku wyszukiwania.
Na panelu dostosowywania uczenia
Jeśli rozwiniesz panel konfiguracji eksperymentu, możesz wykonać następujące czynności:
Wyczyść ręcznie pola wyboru cech, których nie chcesz uwzględniać.
Po uruchomieniu pierwszej wersji eksperymentu możesz zdefiniować Liczbę najważniejszych cech do uwzględnienia.
Podczas wybierania cech zostaje im automatycznie przypisany typ. Możliwe typy cech to:
Kategorialne
Liczbowe
Data
Dowolny tekst
Typ cechy jest przypisywany na podstawie danych zawartych w kolumnie cechy. Jeśli cecha spełnia określone kryteria, może zostać przygotowana jako podstawa dla cech poddanych automatycznej inżynierii. W razie potrzeby możesz zmienić ustawienie używania danej cechy do automatycznej inżynierii. Szczegółowe informacje na temat automatycznej inżynierii cech zawiera temat Automatyczna inżynieria cech.
Niektóre kolumny w zestawie danych mogą być niedostępne jako cechy na potrzeby eksperymentu lub mogą być do nich zastosowane określone procesy przetwarzania. Wyjaśnienia dotyczące interpretacji i przetwarzania danych są wyświetlane podczas poruszania się po uczeniu w ramach eksperymentu. Więcej informacji zawiera temat Interpretowanie wniosków z zestawu danych.
Wybór algorytmów
Wszystkie dostępne algorytmy są uwzględniane domyślnie, a algorytmy, których nie chcesz używać, możesz wykluczyć. Normalnie robi się to w ramach udoskonalania modelu, po zapoznaniu się z pierwszymi wynikami uczenia. Więcej informacji: Ulepszanie modeli.
Zmiana typów danych cech
Po załadowaniu zestawu danych kolumny są traktowane jako kategorialne, liczbowe, data lub dowolny tekst na podstawie typu danych. W niektórych przypadkach trzeba zmienić to ustawienie.
Jeżeli na przykład dni tygodnia są reprezentowane przez cyfry 1–7, każda cyfra reprezentuje wartość kategorialną. Domyślnie jest traktowana jako ciągła wartość liczbowa klasyfikacji, dlatego trzeba ręcznie zmienić konfigurację, aby była traktowana jako kategorialna.
Kiedy kolumna zostanie zidentyfikowana jako zawierająca informacje o dacie i godzinie, zostanie wykorzystana jako podstawa dla nowych cech poddanych inżynierii automatycznej. Kiedy tak się stanie, oryginalna kolumna (cecha nadrzędna) jest traktowana jako mająca cechę typu data.
Typ cechy nadrzędnej można zmienić z daty na cechę kategorialną lub liczbową. Jest to na przykład przydatne, gdy cecha jest identyfikowana jako data, ale ma być traktowana jako ciąg znaków lub liczba. W takim przypadku nie będzie już można używać cech poddanych inżynierii automatycznej do uczenia w ramach eksperymentu.
Wykonaj następujące czynności:
W widoku schematu znajdź cechę.
W kolumnie Typ cechy tej cechy kliknij .
Wybierz wartość z listy.
Zamiast tego możesz zmienić typy cech w Widoku danych. Znajdź cechę, a następnie kliknij obok bieżącego typu cechy. Wybierz wartość z listy.
Wszystkie kolumny ze zmienionym typem cechy można zobaczyć na panelu konfiguracji eksperymentu w obszarze Obróbka danych.
Wpływ na predykcje
Po ręcznej zmianie typu cechy, a następnie wdrożeniu modelu wynikowego nadpisanie typu cechy zostanie zastosowane do cechy w zestawie danych do zastosowania, który jest używany do predykcji wykonywanych przy użyciu tego modelu.
Zmiana zestawu danych
Zestaw danych do uczenia możesz zmienić przed uruchomieniem pierwszej wersji eksperymentu, a także po uruchomieniu dowolnej wersji.
Jeśli zmienisz zestaw danych przed uruchomieniem pierwszej wersji, utracisz całą konfigurację wykonaną przed zmianą zestawu danych.
Wykonaj następujące czynności:
Na panelu konfiguracji eksperymentu w obszarze Dane do uczenia kliknij Zmień zestaw danych.
Wybierz nowy zestaw danych.
Więcej informacji na temat zmiany i odświeżania zestawu danych podczas doskonalenia modelu (po uruchomieniu wersji eksperymentu) zawiera temat Zmiana i odświeżenie zestawu danych.
Konfiguracja optymalizacji modeli
W celu optymalizacji modeli można dostosować następujące ustawienia:
Włączanie i wyłączanie inteligentnej optymalizacji modeli
Włączanie lub wyłączanie optymalizacji hiperparametrów
Włączanie i wyłączanie uczenia z uwzględnieniem czasu
Opcje te można włączać i wyłączać dla każdej uruchamianej wersji eksperymentu.
Konfiguracja inteligentnej optymalizacji
W eksperymencie stosuje się domyślnie inteligentną optymalizację modelu. Dzięki inteligentnej optymalizacji modeli AutoML udoskonala model za użytkownika, iterując wybór cech i stosując zaawansowane transformacje danych.
Więcej informacji o inteligentnej optymalizacji zawiera temat Inteligentna optymalizacja modeli.
Możesz wyłączyć to ustawienie, aby ręcznie doskonalić uczone modele. Na przykład możesz rozpocząć uczenie modelu od inteligentnej optymalizacji modelu, a następnie przejść do ręcznego ulepszania wersji 2, aby dokładniej dostosować konfigurację.
Wykonaj następujące czynności:
Kliknij Wyświetl konfigurację.
Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.
W panelu rozwiń pozycję Optymalizacja modelu.
Przełącz z inteligentna na Ręczna.
Ustaw suwakiem maksimum czasu trwania uczenia.
Konfigurowanie optymalizacji hiperparametrów
Modele można zoptymalizować przy użyciu optymalizacji hiperparametrów. Pamiętaj, że jest to opcja zaawansowana, która może znacznie wydłużyć czas uczenia. Optymalizacja hiperparametrów jest dostępna po wyłączeniu inteligentnej optymalizacji.
Więcej informacji zawiera temat Optymalizacja hiperparametrów.
Wykonaj następujące czynności:
Kliknij Wyświetl konfigurację.
Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.
W panelu rozwiń pozycję Optymalizacja modelu.
Przełącz z inteligentna na Ręczna.
Zaznacz pole wyboru Optymalizacja hiperparametrów.
Opcjonalnie ustaw limit czasowy optymalizacji. Domyślny limit czasu to jedna godzina.
Konfiguracja uczenia z uwzględnieniem czasu
Jeśli chcesz, aby modele były uczone z uwzględnieniem wymiaru szeregu czasowego, aktywuj uczenie z uwzględnieniem czasu dla wersji eksperymentu. Aby móc użyć tej opcji, musisz mieć kolumnę w zestawie danych, która zawiera odpowiednie informacje o szeregach czasowych.
Po włączeniu uczenia z uwzględnieniem czasu AutoML wykorzystuje do uczenia modeli specjalistyczne procesy walidacji krzyżowej oraz imputacji wartości null.
Więcej informacji zawierają tematy Tworzenie modeli uwzględniających czas oraz Walidacja krzyżowa oparta na czasie.
Wykonaj następujące czynności:
Kliknij Wyświetl konfigurację.
Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.
W panelu rozwiń pozycję Optymalizacja modelu.
W sekcji Czasowy podział test/uczenie wybierz Indeks daty, który ma zostać użyty do sortowania danych.
Wyświetlanie wniosków na temat danych do uczenia
Na karcie Dane eksperymentu możesz wyświetlić wnioski na temat postępowania z danymi do uczenia. Informacje te są dostępne w kolumnie Wnioski w Widoku schematu. Wyświetlane informacje zależą od tego, czy uruchomiono wersję z bieżącymi danymi do uczenia. Zmiany w kolumnie Wnioski mogą pomóc w ustaleniu, dlaczego cechy mogą być niedostępne lub dlaczego zostały automatycznie usunięte.
Więcej informacji na temat znaczenia poszczególnych wniosków zawiera temat Interpretowanie wniosków z zestawu danych.