Creazione e configurazione dell'esperimento
Il primo passo è creare e configurare l'esperimento. Si utilizzerà il set di dati di training caricato in precedenza per addestrare il modello fino a quando non sarà pronto per essere distribuito per fare previsioni.
Creazione di un nuovo esperimento
Procedere come indicato di seguito:
-
Andare alla pagina Crea nel centro attività Analisi e selezionare Esperimento ML.
-
Inserire un nome per l'esperimento, ad esempio: Tutorial sull'abbandono dei clienti.
-
Aggiungere facoltativamente una descrizione e dei tag.
-
Scegliere uno spazio per il proprio esperimento. Può essere uno spazio personale o uno spazio condiviso.
-
Fare clic su Crea.
-
Selezionare il file del training set, che sarà uno dei seguenti, a seconda se si utilizza il formato CSV o QVD:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
Verifica dei dati
Ora è possibile iniziare a configurare l'esperimento ma, prima di farlo, diamo un'occhiata al set di dati.
Per iniziare, si parte dalla scheda Dati. La visualizzazione predefinita è la Vista schema. Qui possiamo vedere una tabella in cui ogni riga rappresenta una colonna del set di dati. Nella preparazione automatica dei dati sono state generate statistiche e informazioni strategiche. Potrebbe essere necessario scorrere il lato destro dello schema per vedere le Informazioni strategiche.
Si può notare che AccountID è stato escluso a causa dell'elevata cardinalità. Ciò significa che la colonna contiene troppi valori unici. La funzionalità Country è stata esclusa per il motivo opposto: il valore è lo stesso per tutte le righe. Queste due funzionalità non fornirebbero alcun valore ai modelli di machine learning.
Si può anche notare che la funzione categoriale Territory è di tipo impact encoded. Per ulteriori informazioni, posizionare il mouse sulle icone di avviso e informazione .
Fare clic su Vista dati. In questa vista, è possibile trovare maggiori informazioni su ogni colonna, compresi i dati campione.
Selezionare una destinazione
Vogliamo che il nostro modello di machine learning preveda l'abbandono dei clienti, quindi selezioniamo Churned, l'ultima colonna nel set di dati, come destinazione.
Procedere come indicato di seguito:
-
Tornare alla Vista schema.
-
Posizionare il puntatore del mouse su Churned e fare clic sull'icona di destinazione che viene visualizzata.
Nel pannello di configurazione dell'esperimento, ora è possibile vedere che è stato selezionato il valore Churned. È possibile inoltre visualizzare quali funzioni vengono selezionate automaticamente ed escluse. Poiché Churned è la destinazione, non verrà utilizzata come funzione. È inoltre possibile vedere che l'esperimento verrà trattato come un problema di classificazione binaria.
Selezione delle funzioni
Per questa prima fase del nostro esperimento, includeremo tutte le funzioni e gli algoritmi selezionati per impostazione predefinita. Tuttavia, se è già noto che alcune caratteristiche non hanno alcuna influenza sul target, in base alle proprie conoscenze aziendali, è possibile deselezionarle a questo punto per escluderle dal training.
Modifica delle impostazioni di ottimizzazione
L'ottimizzazione intelligente del modello è attiva per impostazione predefinita. Con l'ottimizzazione intelligente del modello, AutoML fornisce l'affinamento automatico dell'addestramento del modello. Tuttavia, l'obiettivo di questo tutorial è mostrare come identificare manualmente determinati problemi con i dati della funzione e i risultati dell'addestramento.
Per un esempio su come addestrare i modelli con l'ottimizzazione intelligente del modello, vedere Esempio: addestramento di modelli con machine learning automatizzato.
Disattivare l'ottimizzazione intelligente del modello per dimostrare un affinamento manuale.
Procedere come indicato di seguito:
-
Nel pannello di configurazione dell'esperimento, espandere la sezione Ottimizzazione modello.
-
Passare da Intelligente a Manuale.
Addestramento dell'esperimento
La configurazione è terminata e siamo pronti per iniziare il training.
Procedere come indicato di seguito:
-
Nell'angolo in basso a destra, fare clic su Esegui esperimento.
Una volta terminata l'esecuzione dell'esperimento, possiamo passare alla fase successiva, che consiste nell'esaminare le metriche dei modelli risultanti.