Optymalizacja hiperparametrów
Modele uczenia maszynowego wymagają różnych ograniczeń, wag lub współczynników uczenia, aby uogólniać różne wzorce danych. Te miary nazywane są hiperparametrami i służą do kontrolowania procesu uczenia. Hiperparametry muszą zostać dostrojone, aby model mógł optymalnie rozwiązać problem uczenia maszynowego.
Domyślnie Qlik Predict używa wstępnie zdefiniowanego zestawu wartości hiperparametrów dla każdego algorytmu używanego w trenowaniu modelu. Są to standardowe, zoptymalizowane wartości, które są ogólnie akceptowane przez społeczność zajmującą się analizą danych (data science). Najlepiej działająca kombinacja wartości hiperparametrów jest wybierana automatycznie.
Jednak w niektórych przypadkach może być konieczne dostrojenie modelu w celu uzyskania optymalnych wyników predykcyjnych. Można to zrobić za pomocą optymalizacji hiperparametrów (HPO).
Qlik Predict uruchamia optymalizację hiperparametrów tylko dla najlepszego algorytmu z zestawu wybranego w konfiguracji eksperymentu. Najpierw uruchamiane jest wyszukiwanie losowe, a następnie przeszukiwanie siatki, aby znaleźć najlepsze hiperparametry dla algorytmu.
Przed użyciem optymalizacji hiperparametrów należy wziąć pod uwagę kilka ważnych kwestii:
-
Nie używaj optymalizacji hiperparametrów podczas pierwszego trenowania modelu. Jest ona przeznaczona do użycia po wytrenowaniu modelu i uzyskaniu zadowalających wyników. Proces ten często wymaga wielokrotnego udoskonalania i ponownego trenowania.
-
Optymalizacja hiperparametrów znacznie wydłuża czas. Jeśli proces trenowania modelu trwa pięć minut przy użyciu standardowych, wstępnie zdefiniowanych wartości hiperparametrów, trenowanie tego samego modelu z włączoną optymalizacją hiperparametrów może zająć wiele godzin.
Algorytmy używane w optymalizacji hiperparametrów
Optymalizacja hiperparametrów jest ograniczona do określonych algorytmów i typów modeli. Została ona specjalnie zaprojektowana do współpracy z następującymi typami modeli i algorytmami:
-
Modele klasyfikacji binarnej
-
Klasyfikacja CatBoost
-
Regresja Elastic Net
-
Regresja Lasso
-
Klasyfikacja LightGBM
-
Regresja logistyczna
-
Klasyfikacja Random Forest
-
Klasyfikacja XGBoost
-
-
Modele regresji
-
Regresja CatBoost
-
Regresja LightGBM
-
Regresja Random Forest
-
Regresja XGBoost
-
Włączanie optymalizacji hiperparametrów
Wykonaj następujące czynności:
-
W eksperymencie kliknij Wyświetl konfigurację.
Otworzy się panel konfiguracji eksperymentu.
-
W razie potrzeby kliknij Utwórz nową wersję, aby skonfigurować następną wersję.
-
W panelu rozwiń Optymalizacja modelu.
-
Przełącz z Inteligentna na Ręczna.
Optymalizacja hiperparametrów nie jest dostępna w przypadku inteligentnej optymalizacji modelu.
-
Zaznacz pole wyboru Optymalizacja hiperparametrów.
Wyświetlanie wartości hiperparametrów
Wyświetl wartości hiperparametrów na karcie Porównaj podczas szczegółowej analizy modelu. Więcej informacji zawiera temat Szczegółowa analiza modelu.