Ottimizzazione degli iperparametri
I modelli di machine learning richiedono vincoli, pesi o tassi di apprendimento diversi per generalizzare i diversi pattern di dati. Queste misure sono chiamate iperparametri e vengono utilizzate per controllare il processo di apprendimento. Gli iperparametri devono essere sintonizzati in modo che il modello possa risolvere in modo ottimale il problema di machine learning.
Per impostazione predefinita, Qlik Predict utilizza un set predefinito di valori di iperparametri per ciascun algoritmo utilizzato nell'addestramento del modello. Si tratta dei valori standard e ottimizzati generalmente accettati dalla community di data science. La combinazione di valori di iperparametri con le prestazioni migliori viene selezionata automaticamente.
Tuttavia, in alcuni casi, potrebbe essere necessario perfezionare il modello per ottenere risultati predittivi ottimali. Ciò può essere fatto utilizzando l'ottimizzazione degli iperparametri (HPO).
Qlik Predict esegue l'ottimizzazione degli iperparametri solo per il miglior algoritmo del set selezionato nella configurazione dell'esperimento. Innanzitutto viene eseguita una ricerca casuale, quindi una ricerca a griglia per trovare i migliori iperparametri per l'algoritmo.
Ci sono alcune cose importanti da considerare prima di utilizzare l'ottimizzazione degli iperparametri:
-
Non utilizzare l'ottimizzazione degli iperparametri la prima volta che si addestra un modello. È progettata per essere utilizzata dopo aver addestrato il modello e quando si è soddisfatti dei risultati. Tale processo richiede spesso perfezionamenti e riaddestramenti ripetuti.
-
L'ottimizzazione degli iperparametri richiede molto tempo aggiuntivo. Se il processo di addestramento del modello richiede cinque minuti utilizzando i valori di iperparametri predefiniti standard, l'addestramento dello stesso modello con l'ottimizzazione degli iperparametri abilitata potrebbe richiedere ore.
Algoritmi utilizzati nell'ottimizzazione degli iperparametri
L'ottimizzazione degli iperparametri è limitata ad algoritmi e tipi di modello specifici. È progettata specificamente per funzionare con i seguenti tipi di modello e algoritmi:
-
Modelli di classificazione binaria
-
CatBoost Classification
-
Elastic Net Regression
-
Lasso Regression
-
LightGBM Classification
-
Logistic Regression
-
Random Forest Classification
-
XGBoost Classification
-
-
Modelli di regressione
-
CatBoost Regression
-
LightGBM Regression
-
Random Forest Regression
-
XGBoost Regression
-
Abilitazione dell'ottimizzazione degli iperparametri
Procedere come indicato di seguito:
-
In un esperimento, fare clic su Visualizza configurazione.
Si apre il pannello di configurazione dell'esperimento.
-
Se necessario, fare clic su Crea nuova versione per configurare la versione successiva.
-
Nel pannello, espandere Ottimizzazione modello.
-
Passare da Intelligente a Manuale.
L'ottimizzazione degli iperparametri non è disponibile con l'ottimizzazione intelligente del modello.
-
Selezionare la casella di controllo per Ottimizzazione degli iperparametri.
Visualizzazione dei valori degli iperparametri
Visualizzare i valori degli iperparametri nella scheda Confronta durante l'analisi dettagliata del modello. Per ulteriori informazioni, vedere Esecuzione di analisi dettagliate dei modelli.