Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Konfigurowanie eksperymentów

Konfiguracja eksperymentów polega na wybraniu celu i cech, których model użyje do jego przewidywania. Można także skonfigurować szereg opcjonalnych ustawień.

Aby Ci pomóc w wyborze celu, analizowany jest zestaw historycznych danych i wyświetlane są podsumowujące statystyki dotyczące każdej jego kolumny. Do zestawu danych stosuje się kilka kroków automatycznego wstępnego przetwarzania, aby uwzględnione zostały tylko odpowiednie dane. Więcej informacji na temat wstępnego przetwarzania danych zawiera temat Automatyczne przygotowanie i przekształcanie danych.

Po uruchomieniu wersji 1 można w razie potrzeby utworzyć nowe wersje eksperymentu w celu dalszego doskonalenia uczenia modelu. Więcej informacji zawiera temat Ulepszanie modeli.

Wymagania i uprawnienia

Więcej informacji na temat wymagań dotyczących użytkowników w kontekście pracy z eksperymentami uczenia maszynowego zawiera temat Praca z eksperymentami.

Interfejs

W poniższych sekcjach opisano sposób poruszania się po interfejsie eksperymentu w celu skonfigurowania eksperymentu. Więcej informacji na temat interfejsu zawiera temat Nawigacja w interfejsie eksperymentu.

Nawigacja przy użyciu kart

Podczas tworzenia eksperymentu otwiera się karta Dane. Tutaj możesz skonfigurować cel i cechy eksperymentu.

Po uruchomieniu przynajmniej jednej wersji eksperymentu stają się dostępne kolejne karty. Karty te umożliwiają analizę modeli, które właśnie zostały nauczone w danej wersji. Jeśli trzeba będzie skonfigurować kolejne wersje z innym wyborem cech, możesz wrócić do karty Dane.

Widok schematu i Widok danych

Na karcie Dane możesz przełączać następujące widoki:

  • Schemat Widok schematu: widok domyślny. W tym widoku każda kolumna w zestawie danych jest reprezentowana przez wiersz w schemacie z informacjami i statystykami.

  • Tabela Widok danych: alternatywny widok dający dostęp do większej ilości informacji i przykładowych danych dla każdej kolumny.

Widok schematu w eksperymencie uczenia maszynowego

Widok schematu w eksperymencie uczenia maszynowego

Widok danych w eksperymencie uczenia maszynowego

Widok danych w eksperymencie uczenia maszynowego

Panel Konfiguracja eksperymentu

Kliknij Schemat Wyświetl konfigurację, aby otworzyć panel, w którym można dodatkowo dostosować uczenie w ramach eksperymentu. Panel można otworzyć niezależnie od tego, która karta jest przeglądana. Panel ten udostępnia szereg dodatkowych opcji konfiguracyjnych.

Za pomocą panelu konfiguracji eksperymentu można wykonywać następujące czynności

  • Wybierz cel przed uczeniem pierwszej wersji

  • Dodaj lub usuń cechy

  • Skonfiguruj nową wersję eksperymentu

  • Wybierz, aby zmienić lub odświeżyć zestaw danych do uczenia

  • Dodaj lub usuń algorytmy

  • Zmień ustawienia optymalizacji modelu

Panel Konfiguracja eksperymentu

Rozbudowany panel dostosowywania w eksperymencie uczenia maszynowego

Wybieranie celu

Kolumna celu zawiera wartości, które mają być przewidywane przez model uczenia maszynowego. Kolumnę celu można zmienić do momentu rozpoczęcia pierwszego uczenia. Następnie zostaje zablokowana do edycji.

  1. W Schemat Widoku schematu lub Tabela Widoku danych wskaż kursorem kolumnę.

  2. Kliknij wyświetloną ikonę Cel.

    Kolumna celu jest teraz wskazywana przez Cel, a pozostałe dostępne kolumny są automatycznie wybierane jako cechy.

Wybieranie celu w Widoku schematu

Kolumna zestawu danych z symbolem celu.

Cel można zamiast tego wybrać w panelu konfiguracji treningu.

Po wybraniu celu możesz rozpocząć pierwszą wersję eksperymentu. Więcej informacji: Uczenie eksperymentów. W tym momencie możesz przeprowadzić dodatkową konfigurację — opisaną poniżej — lub dostosować konfigurację po przejrzeniu wyników uczenia.

Wyjaśnienia dotyczące interpretacji i przetwarzania danych są wyświetlane podczas uczenia w ramach eksperymentu. Więcej informacji zawiera temat Interpretowanie wniosków z zestawu danych.

Określanie typu tworzonego modelu

Kolumna wybrana jako cel określa typ modelu tworzonego w ramach eksperymentu. To z kolei odgrywa rolę w określaniu, które algorytmy zostaną użyte do uczenia modelu. Niektóre kolumny w zestawie danych mogą być niedostępne jako cel na potrzeby eksperymentu lub mogą być do nich zastosowane określone procesy przetwarzania.

Typy modeli to:

  • Model klasyfikacji binarnej

  • Model klasyfikacji wieloklasowej

  • Model regresji

W poniższej tabeli podsumowano czynniki celu, które determinują rodzaj używanego modelu.

Charakterystyka kolumny celu określająca typ modelu
Typ modeluLiczba odrębnych wartości w kolumnieWymagany typ cechyDodatkowe informacje
Klasyfikacja binarna2Dowolny
Klasyfikacja wieloklasowa3-10DowolnyKolumny zawierającej więcej niż 10 odrębnych, nienumerycznych klas nie można wybrać jako celu.
RegresjaWięcej niż 10Liczbowe

Aby się dowiedzieć, jakie modele uczy Twój eksperyment, kliknij Schemat Wyświetl konfigurację i rozwiń Algorytmy. Typ modelu jest widoczny w tytule sekcji.

Wybieranie kolumn cech

Kiedy cel został ustawiony, możesz wybrać, które z pozostałych dostępnych kolumn mają zostać uwzględnione w uczeniu modelu. Wyklucz wszystkie cechy, które nie powinny być uwzględniane w modelu. Zauważ, że kolumna pozostanie w zestawie danych, ale nie będzie używana przez algorytm uczenia.

U góry panelu konfiguracji eksperymentu widać liczbę komórek w zestawie danych. Jeśli liczba przekracza limit zestawu danych, możesz wykluczyć cechy, aby zejść poniżej limitu.

Kolumny cech można wybrać na różne sposoby:

W Widoku schematu i Widoku danych

W głównych widokach można wykonywać następujące czynności:

  • Usuń zaznaczenie pozycji Uwzględnij wszystkie dostępne cechy, a następnie wybierz tylko te, które chcesz uwzględnić.

  • Wyczyść ręcznie pola wyboru cech, których nie chcesz uwzględniać.

  • Wyszukaj i wyklucz lub uwzględnij wszystkie cechy w przefiltrowanym wyniku wyszukiwania.

Na panelu dostosowywania uczenia

Jeśli rozwiniesz panel konfiguracji eksperymentu, możesz wykonać następujące czynności:

  • Wyczyść ręcznie pola wyboru cech, których nie chcesz uwzględniać.

  • Po uruchomieniu pierwszej wersji eksperymentu możesz zdefiniować Liczbę najważniejszych cech do uwzględnienia.

Sekcja Cechy na panelu konfiguracji eksperymentu

Sekcja Cechy w panelu dostosowywania uczenia AutoML

Podczas wybierania cech zostaje im automatycznie przypisany typ. Możliwe typy cech to:

  • Kategorialne

  • Liczbowe

  • Data

  • Dowolny tekst

Typ cechy jest przypisywany na podstawie danych zawartych w kolumnie cechy. Jeśli cecha spełnia określone kryteria, może zostać przygotowana jako podstawa dla cech poddanych automatycznej inżynierii. W razie potrzeby możesz zmienić ustawienie używania danej cechy do automatycznej inżynierii. Szczegółowe informacje na temat automatycznej inżynierii cech zawiera temat Automatyczna inżynieria cech.

Niektóre kolumny w zestawie danych mogą być niedostępne jako cechy na potrzeby eksperymentu lub mogą być do nich zastosowane określone procesy przetwarzania. Wyjaśnienia dotyczące interpretacji i przetwarzania danych są wyświetlane podczas poruszania się po uczeniu w ramach eksperymentu. Więcej informacji zawiera temat Interpretowanie wniosków z zestawu danych.

Wybór algorytmów

Wszystkie dostępne algorytmy są uwzględniane domyślnie, a algorytmy, których nie chcesz używać, możesz wykluczyć. Normalnie robi się to w ramach udoskonalania modelu, po zapoznaniu się z pierwszymi wynikami uczenia. Więcej informacji: Ulepszanie modeli.

Sekcja Algorytmy na panelu konfiguracji eksperymentu

Sekcja Algorytmy w panelu dostosowywania uczenia AutoML.

Zmiana typów danych cech

Po załadowaniu zestawu danych kolumny są traktowane jako kategorialne, liczbowe, data lub dowolny tekst na podstawie typu danych. W niektórych przypadkach trzeba zmienić to ustawienie.

Jeżeli na przykład dni tygodnia są reprezentowane przez cyfry 1–7, każda cyfra reprezentuje wartość kategorialną. Domyślnie jest traktowana jako ciągła wartość liczbowa klasyfikacji, dlatego trzeba ręcznie zmienić konfigurację, aby była traktowana jako kategorialna.

Kiedy kolumna zostanie zidentyfikowana jako zawierająca informacje o dacie i godzinie, zostanie wykorzystana jako podstawa dla nowych cech poddanych inżynierii automatycznej. Kiedy tak się stanie, oryginalna kolumna (cecha nadrzędna) jest traktowana jako mająca cechę typu data. Typ cechy nadrzędnej można zmienić z daty na cechę kategorialną.W takim przypadku nie będzie już można używać cech poddanych inżynierii automatycznej do uczenia w ramach eksperymentu.

  1. W Schemat widoku schematu znajdź cechę.

  2. W kolumnie Typ cechy tej cechy kliknij .

  3. Wybierz wartość z listy.

Zamiast tego możesz zmienić typy cech w Tabela Widoku danych. Znajdź cechę, a następnie kliknij obok bieżącego typu cechy. Wybierz wartość z listy.

Wszystkie kolumny ze zmienionym typem cechy można zobaczyć na panelu konfiguracji eksperymentu w obszarze Obróbka danych.

Zmiana zestawu danych

Zestaw danych do uczenia możesz zmienić przed uruchomieniem pierwszej wersji eksperymentu, a także po uruchomieniu dowolnej wersji.

Jeśli zmienisz zestaw danych przed uruchomieniem pierwszej wersji, utracisz całą konfigurację wykonaną przed zmianą zestawu danych.

  1. Na panelu konfiguracji eksperymentu w obszarze Dane do uczenia kliknij Zmień zestaw danych.

  2. Wybierz nowy zestaw danych.

Więcej informacji na temat zmiany i odświeżania zestawu danych podczas doskonalenia modelu (po uruchomieniu wersji eksperymentu) zawiera temat Zmiana i odświeżenie zestawu danych.

Konfiguracja optymalizacji modeli

W celu optymalizacji modeli można dostosować następujące ustawienia:

  • Włączanie i wyłączanie inteligentnej optymalizacji modeli

  • Włączanie lub wyłączanie optymalizacji hiperparametrów

  • Włączanie i wyłączanie uczenia z uwzględnieniem czasu

Opcje te można włączać i wyłączać dla każdej uruchamianej wersji eksperymentu.

Konfiguracja inteligentnej optymalizacji

W eksperymencie stosuje się domyślnie inteligentną optymalizację modelu. Dzięki inteligentnej optymalizacji modeli AutoML udoskonala model za użytkownika, iterując wybór cech i stosując zaawansowane transformacje danych.

Więcej informacji o inteligentnej optymalizacji zawiera temat Inteligentna optymalizacja modeli.

Możesz wyłączyć to ustawienie, aby ręcznie doskonalić uczone modele. Na przykład możesz rozpocząć uczenie modelu od inteligentnej optymalizacji modelu, a następnie przejść do ręcznego ulepszania wersji 2, aby dokładniej dostosować konfigurację.

  1. Kliknij Schemat Wyświetl konfigurację.

  2. Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.

  3. W panelu rozwiń pozycję Optymalizacja modelu.

  4. Przełącz z inteligentna na Ręczna.

  5. Ustaw suwakiem maksimum czasu trwania uczenia.

Konfiguracja optymalizacji modeli

Aktywacja opcji Inteligentna optymalizacja modelu w sekcji Optymalizacja modelu w panelu dostosowywania uczenia AutoML

Konfigurowanie optymalizacji hiperparametrów

Modele można zoptymalizować przy użyciu optymalizacji hiperparametrów. Pamiętaj, że jest to opcja zaawansowana, która może znacznie wydłużyć czas uczenia. Optymalizacja hiperparametrów jest dostępna po wyłączeniu inteligentnej optymalizacji.

Więcej informacji zawiera temat Optymalizacja hiperparametrów.

  1. Kliknij Schemat Wyświetl konfigurację.

  2. Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.

  3. W panelu rozwiń pozycję Optymalizacja modelu.

  4. Przełącz z inteligentna na Ręczna.

  5. Zaznacz pole wyboru Optymalizacja hiperparametrów.

  6. Opcjonalnie ustaw limit czasowy optymalizacji. Domyślny limit czasu to jedna godzina.

Konfigurowanie optymalizacji hiperparametrów

Panel dostosowywania uczenia AutoML z włączoną optymalizacją hiperparametrów

Konfiguracja uczenia z uwzględnieniem czasu

Jeśli chcesz, aby modele były uczone z uwzględnieniem wymiaru szeregu czasowego, aktywuj uczenie z uwzględnieniem czasu dla wersji eksperymentu. Aby móc użyć tej opcji, musisz mieć kolumnę w zestawie danych, która zawiera odpowiednie informacje o szeregach czasowych.

Po włączeniu uczenia z uwzględnieniem czasu AutoML wykorzystuje do uczenia modeli specjalistyczne procesy walidacji krzyżowej oraz imputacji wartości null.

Więcej informacji zawierają tematy Tworzenie modeli uwzględniających czas oraz Walidacja krzyżowa oparta na czasie.

  1. Kliknij Schemat Wyświetl konfigurację.

  2. Jeżeli uruchomiono już co najmniej jedną wersję eksperymentu, kliknij Nowa wersja.

  3. W panelu rozwiń pozycję Optymalizacja modelu.

  4. W sekcji Czasowy podział test/uczenie wybierz Indeks daty, który ma zostać użyty do sortowania danych.

Konfiguracja uczenia z uwzględnieniem czasu przez wybranie kolumny w danych do uczenia, które mają być używane jako indeks.

Panel dostosowywania uczenia AutoML z wybraną kolumną daty w celu aktywowania uczenia z uwzględnieniem czasu.

Wyświetlanie wniosków na temat danych do uczenia

Na karcie Dane eksperymentu możesz wyświetlić wnioski na temat postępowania z danymi do uczenia. Informacje te są dostępne w kolumnie Wnioski Wiersze tabeli w Widoku schematu. Wyświetlane informacje zależą od tego, czy uruchomiono wersję z bieżącymi danymi do uczenia. Zmiany w kolumnie Wnioski mogą pomóc w ustaleniu, dlaczego cechy mogą być niedostępne lub dlaczego zostały automatycznie usunięte.

Więcej informacji na temat znaczenia poszczególnych wniosków zawiera temat Interpretowanie wniosków z zestawu danych.

Dowiedz się więcej

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!