Tworzenie i konfigurowanie eksperymentu
Pierwszy krok polega na utworzeniu i skonfigurowaniu eksperymentu. Przesłany wcześniej zestaw danych do uczenia będzie używany do uczenia modelu, aż model będzie gotowy do wdrożenia w celu tworzenia predykcji.
Tworzenie nowego eksperymentu
Wykonaj następujące czynności:
-
Przejdź do strony Utwórz w centrum aktywności Analytics i wybierz Eksperyment uczenia maszynowego.
-
Wpisz nazwę eksperymentu, na przykład Samouczek — Odpływ klientów.
-
Opcjonalnie dodaj opis i znaczniki.
-
Wybierz przestrzeń na eksperyment. Może to być Twoja przestrzeń prywatna lub przestrzeń udostępniona.
-
Kliknij polecenie Utwórz.
-
Wybierz plik zestawu danych szkoleniowych. Będzie to jedna z poniższych sytuacji, w zależności od tego, czy pracujesz z plikiem CSV, czy QVD:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
Sprawdzanie danych
Możesz już rozpocząć konfigurację eksperymentu, ale najpierw przyjrzyjmy się zestawowi danych.
Zaczynamy od karty Dane. Widokiem domyślnym jest Widok schematu. Tutaj widzimy tabelę, w której każdy wiersz reprezentuje kolumnę z zestawu danych. Statystyki i wnioski zostały wygenerowane podczas automatycznego przygotowywania danych. Aby zobaczyć Wnioski, być może trzeba będzie przewinąć do prawej strony schematu.
Widzimy, że wykluczono AccountID ze względu na dużą kardynalność. Oznacza to, że kolumna ta zawiera zbyt wiele unikatowych wartości. Cecha Country została wykluczona z przeciwnego powodu: wartość jest taka sama dla wszystkich wierszy. Te dwie cechy nie wniosłyby żadnej wartości do modeli uczenia maszynowego.
Widzimy również, że cecha kategorialna Territory została zakodowana metodą impact encoding. Wskaż kursorem ikony ostrzeżeń i informacji , aby uzyskać więcej informacji.
Kliknij Widok danych. W tym widoku widać więcej informacji o każdej kolumnie, w tym przykładowe dane.
Wybieranie celu
Chcemy, aby nasz model uczenia maszynowego przewidywał odpływ klientów, dlatego jako cel wybieramy Churned — ostatnią kolumnę w zestawie danych.
Wykonaj następujące czynności:
-
Przełącz z powrotem na Widok schematu.
-
Wskaż kursorem wiersz Churned i kliknij wyświetloną ikonę .
W panelu konfiguracji eksperymentu możemy teraz zobaczyć, że wybrana została pozycja Churned. Możemy także zobaczyć, które cechy są automatycznie wybierane i wykluczane. Ponieważ Churned jest celem, nie będzie używana jako cecha. Widzimy również, że eksperyment ten będzie traktowany jako problem klasyfikacji binarnej.
Wybieranie cech
Podczas pierwszego uruchomienia eksperymentu uwzględnimy wszystkie cechy i algorytmy, które zostały zaznaczone domyślnie. Jeśli jednak wiesz już na podstawie swojego doświadczenia biznesowego, że pewne cechy nie mają wpływu na cel, możesz je w tym momencie odznaczyć, aby wykluczyć je z uczenia.
Zmiana ustawień optymalizacji
Inteligentna optymalizacja modeli jest domyślnie włączona. Inteligentna optymalizacja modeli w AutoML umożliwia automatyczne ulepszanie uczenia modeli. Celem tego samouczka jest jednak pokazanie, jak ręcznie identyfikować pewne problemy z danymi cech i wynikami uczenia.
Przykład uczenia modeli za pomocą inteligentnej optymalizacji modeli można znaleźć w temacie Przykład — uczenie modeli z automatycznym uczeniem maszynowym.
Wyłączmy inteligentną optymalizację modeli, aby zademonstrować udoskonalanie ręczne.
Wykonaj następujące czynności:
-
W panelu konfiguracji eksperymentu rozwiń sekcję Optymalizacja modelu.
-
Przełącz z inteligentna na Ręczna.
Uczenie eksperymentu
Konfiguracja jest zakończona i możemy rozpocząć uczenie.
Wykonaj następujące czynności:
-
W prawym dolnym rogu okna eksperymentu kliknij Uruchom eksperyment.
Po zakończeniu eksperymentu możemy przejść do następnego kroku, jakim jest przejrzenie wynikowych wskaźników modelu.