Configurazione di esperimenti
La configurazione degli esperimenti consiste nel selezionare il target e le funzioni che il modello utilizzerà per prevedere la destinazione. È inoltre possibile configurare una serie di impostazioni opzionali.
Per aiutare l'utente nella selezione di una destinazione, il set di dati cronologici viene analizzato e vengono visualizzate le statistiche di riepilogo relative a ciascuna colonna del set di dati. Al set di dati vengono applicate diverse fasi di pre-elaborazione automatica per assicurarsi che vengano inclusi solo i dati adatti. Per maggiori dettagli sulla pre-elaborazione dei dati, vedere Preparazione e trasformazione automatica dei dati.
Dopo aver eseguito la versione v1, è possibile creare nuove versioni dell'esperimento se è necessario affinare ulteriormente l'addestramento del modello. Per ulteriori informazioni, vedere Affinamento dei modelli.
Requisiti e autorizzazioni
Per maggiori informazioni sui requisiti utente per l'utilizzo degli esperimenti di ML, vedere Utilizzo degli esperimenti.
Interfaccia
Le seguenti sezioni descrivono come navigare l'interfaccia per configurare l'esperimento. Per maggiori informazioni sull'interfaccia, vedere Navigazione dell'interfaccia di un esperimento.
Navigazione a schede
Quando si crea un esperimento, si apre la scheda Dati. Qui è possibile configurare la destinazione e le funzioni dell'esperimento.
Una volta eseguito almeno una versione dell'esperimento, diventano disponibili altre schede. Queste schede consentono di analizzare i modelli addestrati nella versione. Se è necessario configurare versioni successive con una selezione differente di funzioni, è possibile tornare alla scheda Dati.
Vista schema e Vista dati
Nella scheda Dati, è possibile alternare le seguenti viste:
-
Vista schema: la vista predefinita. In questa vista, ogni colonna nel set di dati è rappresentata da una riga dello schema con informazioni e statistiche.
-
Vista dati: una vista alternativa che è possibile utilizzare per accedere a maggiori informazioni e dati campione per ogni colonna.
Pannello Configurazione esperimento
Fare clic su Visualizza configurazione per aprire un pannello in cui è possibile personalizzare ulteriormente l'addestramento dell'esperimento. È possibile aprire il pannello indipendentemente dalla scheda visualizzata. Questo pannello fornisce una serie di opzioni di configurazione aggiuntive.
Tramite il pannello di configurazione dell'esperimento, è possibile eseguire le seguenti operazioni:
-
Selezionare una destinazione prima di iniziare l'addestramento della prima versione
-
Aggiunta o rimozione di funzioni
-
Configurazione di una nuova versione dell'esperimento
-
Selezionare per modificare o aggiornare il training set
-
Aggiunta o rimozione di algoritmi
-
Modifica delle impostazioni di ottimizzazione del modello
Selezionare una destinazione
La colonna di destinazione contiene i valori che si desidera far predire al modello di machine learning. È possibile modificare la colonna di destinazione fino all'avvio del primo addestramento. Dopodiché è bloccata per la modifica.
Procedere come indicato di seguito:
In Vista schema o Vista dati, posizionare il mouse sopra la colonna.
Fare clic sull'icona che viene visualizzata successivamente.
La colonna di destinazione è ora indicata da e le altre colonne disponibili sono selezionate automaticamente come funzioni.
In alternativa, è possibile selezionare la destinazione nel pannello di configurazione dell'esperimento.
Una volta selezionata la destinazione, è possibile avviare l'esecuzione della prima versione dell'esperimento. Ulteriori informazioni in Addestramento degli esperimenti. A questo punto è possibile eseguire una configurazione aggiuntiva, descritta di seguito, oppure regolare la configurazione dopo aver esaminato i risultati dell'addestramento.
Le spiegazioni sul modo in cui i dati vengono interpretati ed elaborati vengono visualizzate durante l'avanzamento dell'addestramento dell'esperimento. Per ulteriori informazioni, vedere Interpretazione delle informazioni strategiche di un set di dati.
Determinazione del tipo di modello creato
La colonna selezionata come destinazione dall'utente determina il tipo di modello creato dall'esperimento. Questo, a sua volta, svolge un ruolo nella determinazione degli algoritmi da utilizzare per l'addestramento del modello. Alcune colonne del set di dati potrebbero non essere selezionabili come destinazione per l'esperimento o potrebbero essere sottoposte a un'elaborazione specifica.
I tipi di modello sono i seguenti:
Modello di classificazione binaria
Modello di classificazione multiclasse
Modello di regressione
La tabella sottostante riepiloga i fattori nella destinazione che determinano il tipo di modello utilizzato.
Tipo di modello | Numero di valori distinti nella colonna | Tipo di funzione richiesto | Ulteriori informazioni |
---|---|---|---|
Classificazione binaria | 2 | Qualsiasi | - |
Classificazione Multiclasse | 3-10 | Qualsiasi | Una colonna con più di 10 classi non numeriche distinte non è selezionabile come destinazione. |
Regressione | Più di 10 | Numerico | - |
Per maggiori informazioni sul tipo di modelli addestrato nell'esperimento, fare clic su Visualizza configurazione ed espandere Algoritmi. Il tipo di modello è visibile nel titolo della sezione.
Selezione delle colonne di funzioni
Con il set di destinazione, è possibile scegliere quali delle altre colonne disponibili includere per l'addestramento del modello. Escludere tutte le funzioni che non si vogliono includere nel modello. Si noti che la colonna rimarrà nel set di dati, ma non sarà utilizzata dall'algoritmo dell'addestramento.
Nella parte superiore del pannello di configurazione dell'esperimento, è possibile vedere il numero di celle del set di dati. Se il numero supera il limite del set di dati, è possibile escludere le funzioni per scendere sotto il limite.
È possibile selezionare le colonne delle funzioni in vari modi:
In Vista schema e in Vista dati
Nelle viste principali, è possibile fare quanto segue:
Deselezionare Escludi tutte le funzioni disponibili e selezionare solo quelle che si desidera includere.
Deselezionare manualmente le caselle di controllo per le funzioni che non si desidera includere.
Effettuare una ricerca ed escludere o includere tutte le funzioni nei risultati filtrati.
Pannello di personalizzazione dell'addestramento
Se si espande il pannello di configurazione dell'esperimento, è possibile fare quanto segue:
Deselezionare manualmente le caselle di controllo per le funzioni che non si desidera includere.
Dopo aver eseguito la prima versione dell'esperimento, è possibile definire il Numero di funzioni principali da includere.
Quando si selezionano le funzioni, a queste viene assegnato automaticamente un tipo di funzione. I tipi possibili di funzione sono i seguenti:
Categorico
Numerico
Data
Testo libero
Il tipo di funzione viene assegnato in base ai dati contenuti nella colonna delle funzioni. Se una funzione soddisfa determinati criteri, può essere eseguita in modalità staged per diventare la base delle funzioni con ingegneria automatica. Se si desidera, è possibile modificare se utilizzare la funzione per l'ingegneria automatica delle funzioni. Per i dettagli completi sull'ingegneria automatica delle funzioni, vedere Ingegneria automatica delle funzioni.
Alcune colonne del set di dati potrebbero non essere selezionabili come funzioni per l'esperimento o potrebbero essere sottoposte a un'elaborazione specifica. Le spiegazioni sul modo in cui i dati vengono interpretati ed elaborati vengono visualizzate durante l'esecuzione dell'addestramento dell'esperimento. Per ulteriori informazioni, vedere Interpretazione delle informazioni strategiche di un set di dati.
Selezione degli algoritmi
Tutti gli algoritmi disponibili sono inclusi per impostazione predefinita ed è possibile escludere quelli che non si desidera utilizzare. Normalmente, questa operazione viene eseguita nell'ambito del perfezionamento del modello dopo aver visto i primi risultati dell'addestramento. Ulteriori informazioni in Affinamento dei modelli.
Modifica dei tipi di funzione
Quando si carica un set di dati, le colonne vengono trattate come categoriche, numeriche, data o testo libero in base al tipo di dati e altre funzioni. In alcuni casi, è possibile modificare questa impostazione.
Ad esempio, se i giorni della settimana sono rappresentati dai numeri 1-7, ogni numero rappresenta un valore categoriale. Per impostazione predefinita, viene trattato come un valore numerico continuo e classificato, quindi è necessario modificare manualmente la configurazione per trattarla come categorica.
Quando si identifica una colonna come contenente informazioni su data e ora, questa viene utilizzata per le nuove funzioni progettate automaticamente. Quando ciò si verifica, la colonna originale (la funzione padre) viene considerata come avente il tipo di funzione data.
È possibile modificare il tipo per la funzione padre da data a categorico o numerico. Ad esempio, questa opzione può essere utile quando una funzione è identificata come una data, ma è necessario trattarla come una stringa o un numero. Quando si esegue questa operazione, non è più possibile utilizzare le relative funzioni progettate automaticamente per l'addestramento dell'esperimento.
Procedere come indicato di seguito:
In Visualizzazione schema, individuare la funzione.
Nella colonna Tipo funzione per la funzione, fare clic su .
Selezionare un valore nell'elenco.
In alternativa, è possibile cambiare i tipi di funzione da Vista dati. Individuare la funzione, quindi fare clic su accanto al tipo di funzione corrente. Selezionare un valore nell'elenco.
È possibile vedere tutte le colonne con un tipo di funzione modificato nel pannello di configurazione dell'esperimento, alla voce Trattamento dati.
Impatto sulle previsioni
Quando si modifica manualmente il tipo di funzione e quindi si distribuisce il modello risultante, le sostituzioni del tipo di funzione verranno applicate alla funzione nel set di dati di applicazione utilizzato nelle previsioni fatte con quel modello.
Modifica del set di dati
È possibile modificate il training set prima di eseguire la prima versione dell'esperimento o qualsiasi altra versione.
Se si modifica il set di dati prima di eseguire la prima versione, si perderà qualsiasi configurazione completata prima di modificare il set di dati.
Procedere come indicato di seguito:
Nel pannello di configurazione dell'esperimento, alla voce Dati di addestramento, fare clic su Modifica set di dati.
Selezionare un nuovo set di dati.
Per maggiori informazioni sulla modifica e sull'aggiornamento del set di dati durante il perfezionamento del modello (dopo aver eseguito una versione dell'esperimento), vedere Modificare e aggiornare il set di dati.
Configurazione dell'ottimizzazione del modello
È possibile utilizzare le seguenti impostazioni per ottimizzare i modelli:
Attivazione e disattivazione della funzione di ottimizzazione intelligente del modello
Attivazione e disattivazione della funzione di ottimizzazione dell'iperparametro
Attivare o disattivare l'addestramento sensibile ai valori temporali
È possibile attivare e disattivare queste opzioni per ogni versione eseguita dell'esperimento.
Configurazione della funzione di ottimizzazione intelligente
Per impostazione predefinita, l'esperimento utilizza la funzione di ottimizzazione intelligente del modello. Con l'ottimizzazione intelligente del modello, AutoML gestisce il processo di perfezionamento del modello per l'utente, iterando la selezione delle funzioni e applicando trasformazioni avanzate ai dati.
Per maggiori informazioni sull'ottimizzazione intelligente, vedere Ottimizzazione intelligente del modello .
È possibile disattivare questa impostazione manualmente per migliorare i modelli addestrati. Per esempio, potrebbe essere necessario iniziare l'addestramento del modello con l'ottimizzazione intelligente del modello, per passare quindi al miglioramento manuale per la versione 2 per regolare ulteriormente la configurazione.
Procedere come indicato di seguito:
Fare clic su Visualizza configurazione.
Se si è già eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
Nel pannello, espandere Ottimizzazione modello.
Passare da Intelligente a Manuale.
Con il cursore, impostare la durata massima dell'addestramento.
Configurazione dell'ottimizzazione degli iperparametri
È possibile ottimizzare i modelli utilizzando l'ottimizzazione degli iperparametri. Si noti che si tratta di un'opzione avanzata che potrebbe aumentare notevolmente il tempo richiesto per l'addestramento. L'ottimizzazione degli iperparametri è disponibile se si disattiva l'ottimizzazione intelligente.
Per ulteriori informazioni, vedere Ottimizzazione degli iperparametri.
Procedere come indicato di seguito:
Fare clic su Visualizza configurazione.
Se si è già eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
Nel pannello, espandere Ottimizzazione modello.
Passare da Intelligente a Manuale.
Selezionare la casella di controllo Ottimizzazione iperparametro.
È possibile impostare un limite di tempo per l'ottimizzazione. Il limite di tempo predefinito è di un'ora.
Configurazione dell'addestramento sensibile ai valori temporali
Se si desidera che i modelli vengano addestrati tenendo conto della dimensione delle serie temporali, attivare l'addestramento sensibile ai valori temporali per la versione dell'esperimento. Per utilizzare questa opzione, è necessario che nel set di dati sia presente una colonna che contenga le informazioni pertinenti della serie temporale.
Quando l'addestramento sensibile ai valori temporali è attivato, AutoML utilizza processi specializzati di convalida incrociata e imputazione nulla per addestrare i modelli.
Per ulteriori informazioni, vedere Creazione di modelli sensibili ai valori temporali e Convalida incrociata basata sul tempo.
Procedere come indicato di seguito:
Fare clic su Visualizza configurazione.
Se si è già eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.
Nel pannello, espandere Ottimizzazione modello.
Nella sezione Suddivisione training-test in base al tempo, selezionare l'Indicizzazione data da utilizzare per l'ordinamento dei dati.
Visualizzazione delle informazioni strategiche sui dati dell'addestramento
Nella scheda Dati dell'esperimento, è possibile visualizzare le informazioni strategiche per la gestione dei dati dell'addestramento. Queste informazioni sono disponibili nella colonna Informazioni strategiche nella Vista schema. Le informazioni mostrate variano dipendendo se per eseguire la versione si sono utilizzati o meno i dati di addestramento. Le modifiche nella colonna Informazioni strategiche può aiutare a identificare la ragione per cui le funzioni possono essere inutilizzabili o perché sono state eliminate automaticamente.
Per maggiori informazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.