Esempio: addestramento di modelli con machine learning automatizzato
Nell'esempio riportato di seguito, si descrive come addestrare modelli di machine learning utilizzando l'ottimizzazione intelligente del modello. Con la funzione di ottimizzazione intelligente del modello, AutoML gestisce il processo di ripetizione e miglioramento dei modelli.
Per ulteriori informazioni sull'ottimizzazione intelligente dei modelli, vedere Ottimizzazione intelligente del modello .
Cosa si apprenderà
In questo esempio, si descrive quanto segue:
-
Come creare e configurare un esperimento di ML
-
Come l'ottimizzazione intelligente può fornire funzioni di miglioramento automatico del modello
-
Come visualizzare e analizzare i risultati dell'addestramento
Altre considerazioni
Le funzioni di ottimizzazione intelligente del modello consentono di migliorare notevolmente i modelli se si fornisce un set di dati ben preparato. Per assicurare la qualità elevata dei modelli in casi di utilizzo reali, è essenziale iniziare seguendo il framework strutturato e preparare un training set con funzioni e dati rilevanti. Per ulteriori informazioni, vedere:
Facoltativamente, l'ottimizzazione intelligente del modello può essere disattivata per ogni versione dell'esperimento. Quando si disattiva questa opzione, i modelli vengono migliorati manualmente. L'ottimizzazione manuale può essere utile se si desidera apportare regolazioni specifiche alla configurazione dell'esperimento. È possibile eseguire una versione con l'ottimizzazione intelligente del modello, quindi disattivarla per apportare piccole regolazioni manuali, continuando a trarre vantaggio dei miglioramenti automatici forniti dalla funzione.
Questo esempio spiega l'addestramento dell'esperimento con l'ottimizzazione intelligente. Per un tutorial completo su come utilizzare l'ottimizzazione manuale, vedere Tutorial – Generazione e visualizzazione dei dati di previsione. Il tutorial fornisce anche una guida end-to-end su come distribuire i modelli, creare previsioni e visualizzare i dati di previsione con le app Qlik Sense interattive.
Chi dovrebbe completare questo esempio
Si consiglia di completare il seguente esempio agli utenti che desiderano apprendere come utilizzare l'ottimizzazione intelligente del modello per migliorare i modelli di machine learning.
Per completare l'esempio, è necessario disporre del seguente ruolo:
-
Diritto Full User o Professional
-
Ruolo di sicurezza Automl Experiment Contributor nel tenant
-
Se si lavora in uno spazio collaborativo, i ruoli richiesti per gli spazi utilizzati. Vedere: Gestione delle autorizzazioni negli spazi condivisi
Se non è possibile visualizzare o creare risorse di ML, probabilmente non si dispone dei ruoli, diritti o autorizzazioni richiesti. Per ulteriori informazioni, contattare l'amministratore del tenant.
Per ulteriori informazioni, vedere Utenti che possono utilizzare Qlik AutoML.
Cosa bisogna fare prima di iniziare
Scaricare questo pacchetto e decomprimerlo sul desktop:
Esempio di AutoML - Ottimizzazione intelligente del modello
Il pacchetto contiene il training set che si utilizza per addestrare i modelli. Il set di dati contiene informazioni sui clienti la cui scadenza per il rinnovo è trascorsa e che hanno deciso di annullare o di mantenere la sottoscrizione al servizio.
Procedere come indicato di seguito:
-
Apertura del centro attività Analisi
-
Andare alla pagina Crea, selezionare Set di dati, quindi selezionare Carica file di dati.
-
Trascinare il file AutoML Example - Churn data - training.csv nella finestra di dialogo di upload.
-
Selezionare uno spazio. Può essere uno spazio personale o uno spazio condiviso se si desidera che altri utenti possano accedere a questi dati.
-
Fare clic su Carica.
Una volta caricato il set di dati, è possibile continuare con la creazione dell'esperimento.
Parte 1: creazione di un esperimento
Procedere come indicato di seguito:
-
Andare alla pagina Crea nel centro attività Analisi e selezionare Esperimento ML.
-
Inserire un nome per l'esperimento, per esempio, Esempio di ottimizzazione intelligente.
-
Aggiungere facoltativamente una descrizione e dei tag.
-
Scegliere uno spazio per il proprio esperimento. Può essere uno spazio personale o uno spazio condiviso.
-
Fare clic su Crea.
-
Selezionare il file AutoML Example - Churn data - training.csv.
Parte 2: configurazione dell'esperimento
Quindi, è possibile configurare l'esperimento.
L'ottimizzazione intelligente del modello richiede meno configurazione iniziale dell'ottimizzazione manuale. In questo caso, si selezionerà una destinazione e si utilizzeranno tutte le funzioni incluse per impostazione predefinita.
Selezione della destinazione
Vogliamo che il nostro modello di machine learning preveda l'abbandono dei clienti, quindi selezioniamo Churned, l'ultima colonna nel set di dati, come destinazione.
Nell'esperimento, Dati dovrebbe essere l'unica scheda visualizzata. È possibile selezionare una destinazioni in una serie di modi, ma qui useremo la Vista schema, che si apre per impostazione predefinita.
Procedere come indicato di seguito:
-
Nello schema, posizionare il puntatore del mouse su Churned e fare clic sull'icona della destinazione che viene visualizzata.
Conferma della selezione di funzioni
Una volta selezionata la destinazione, tutte le funzioni disponibili e consigliate sono incluse per impostazione predefinita. In Vista schema, confermare l'inclusione di tutte le funzioni tranne due. È necessario selezionare le caselle accanto a ogni funzione inclusa. Il valore Country non è disponibile per l'utilizzo. Non si consiglia l'utilizzo di AccountID a causa della cardinalità elevata, quindi non lasciare la casella deselezionata.
Conferma dell'ottimizzazione intelligente
Dovrebbe aprirsi un pannello nella parte destra della pagina che consente di configurare impostazioni aggiuntive. Assicurarsi di aver attivato l'ottimizzazione intelligente del modello.
Procedere come indicato di seguito:
-
Se il pannello di configurazione dell'esperimento non si apre, fare clic su Visualizza configurazione per aprirlo.
-
Nel pannello, espandere Ottimizzazione modello.
-
Selezionare l'opzione di ottimizzazione Intelligente.
Esecuzione dell'esperimento
Fare clic su Esegui esperimento nell'angolo in basso a destra della pagina per iniziare l'addestramento del modello.
Parte 3: visualizzazione dei risultati
Una volta completato l'addestramento, viene visualizzata e si apre la scheda Modelli. Qui è possibile visualizzare le ottimizzazioni eseguite durante l'addestramento. Il modello con le prestazioni migliori, contrassegnato con l'icona , viene selezionato automaticamente. Analizziamo il modello.
Esaminare il Riepilogo addestramento modello. L'opzione mostra i risultati dell'ottimizzazione intelligente per quel modello. In questo caso, è possibile verificare che le seguenti funzioni sono state eliminate, accompagnate dal motivo per la loro rimozione:
-
La funzione DaysSinceLastService è stata eliminata a causa di una perdita sospetta nella destinazione. In questo caso, la colonna contiene dati con una logica incorretta. I giorni dall'ultimo ticket di assistenza sono stati ancora conteggiati attivamente per clienti che hanno annullato il servizio (in alcuni casi, addirittura anni prima). Questa funzione ha dovuto essere rimossa, perché, in caso contrario, avrebbe fornito al modello punteggi di prestazioni falsi determinando, se distribuito, delle prestazioni scadenti. Vedere Perdita di dati
-
Le funzioni PriorPeriodUsage e PriorPeriodUsage-Rounded sono state eliminate a causa della correlazione elevata con un'altra funzione. La funzione con cui erano correlate era ancora inclusa nell'addestramento. Vedere Correlazione.
-
Le funzioni CurrentPeriodUsage, CustomerTenure, StartMonth, Territory, DeviceType e StartWeek sono state tutte eliminate a causa della bassa importanza di permutazione. Le funzioni che hanno un basso impatto sul modello sono considerate come rumore statistico, e quindi possono essere rimosse per migliorare le prestazioni. Vedere Nozioni sull'importanza della permutazione.
Una volta rimosse le funzioni, è possibile esaminare le visualizzazioni che mostrano le funzioni con un'influenza maggiore, oltre ad alcuni indicatori delle prestazioni predittive del modello. I dati visualizzati in questi grafici possono aiutare a valutare se mancano delle opzioni nel set delle funzioni, oppure se i risultati sono alterati.
Per maggiori informazioni sull'analisi dei modelli con queste visualizzazioni, vedere Esecuzione di analisi rapide dei modelli.
Approfondimento delle analisi
Se si desidera approfondire le metriche del modello, passare alle schede Confronta e Analizza nell'esperimento. Queste schede forniscono una vista interattiva più granulare delle metriche.
Per ulteriori informazioni, vedere Confronto dei modelli e Esecuzione di analisi dettagliate dei modelli.
Prossimi passaggi
Con set di dati di qualità elevata, l'ottimizzazione intelligente crea modelli pronti per la distribuzione con poche o nessuna ulteriore iterazione richiesta. A partire da questo punto, si consiglia di distribuire il modello più performante. In caso contrario, è possibile continuare a migliorare i modelli manualmente o aggiornare i dati di addestramento ed eseguire nuovamente l'ottimizzazione intelligente del modello.
Per maggiori informazioni sui passi successivi, vedere:
Grazie!
Hai completato questo esempio. Speriamo che tu abbia appreso come utilizzare l'ottimizzazione intelligente del modello per addestrare facilmente modelli di machine learning pronti per la distribuzione.
Ulteriori letture e risorse
- Per chi desidera approfondire le proprie conoscenze, Qlik offre una vasta gamma di risorse.
- È disponibile la guida di Qlik online.
- Il materiale formativo, compresi corsi online gratuiti, è disponibile in Qlik Continuous Classroom.
- In Qlik Community è possibile trovare forum di discussione, blog e altro ancora.
La vostra opinione è importante
Apprezziamo il feedback dei nostri clienti. Utilizzate la sezione sottostante per inviarci le vostre impressioni.