Vai al contenuto principale Passa a contenuto complementare

Configurazione di esperimenti

La configurazione degli esperimenti consiste nel selezionare il target e le funzioni che il modello utilizzerà per prevedere la destinazione. È inoltre possibile configurare una serie di impostazioni opzionali.

Per aiutare l'utente nella selezione di una destinazione, il set di dati cronologici viene analizzato e vengono visualizzate le statistiche di riepilogo relative a ciascuna colonna del set di dati. Al set di dati vengono applicate diverse fasi di pre-elaborazione automatica per assicurarsi che vengano inclusi solo i dati adatti. Per maggiori dettagli sulla pre-elaborazione dei dati, vedere Preparazione e trasformazione automatica dei dati.

Dopo aver eseguito la versione v1, è possibile creare nuove versioni dell'esperimento se è necessario affinare ulteriormente l'addestramento del modello. Per ulteriori informazioni, vedere Affinamento dei modelli.

Requisiti e autorizzazioni

Per maggiori informazioni sui requisiti utente per l'utilizzo degli esperimenti di ML, vedere Utilizzo degli esperimenti.

Interfaccia

Le seguenti sezioni descrivono come navigare l'interfaccia per configurare l'esperimento. Per maggiori informazioni sull'interfaccia, vedere Navigazione dell'interfaccia di un esperimento.

Navigazione a schede

Quando si crea un esperimento, si apre la scheda Dati. Qui è possibile configurare la destinazione e le funzioni dell'esperimento.

Una volta eseguito almeno una versione dell'esperimento, diventano disponibili altre schede. Queste schede consentono di analizzare i modelli addestrati nella versione. Se è necessario configurare versioni successive con una selezione differente di funzioni, è possibile tornare alla scheda Dati.

Vista schema e Vista dati

Nella scheda Dati, è possibile alternare le seguenti viste:

  • Schema Vista schema: la vista predefinita. In questa vista, ogni colonna nel set di dati è rappresentata da una riga dello schema con informazioni e statistiche.

  • Tabella Vista dati: una vista alternativa che è possibile utilizzare per accedere a maggiori informazioni e dati campione per ogni colonna.

Vista schema in un esperimento di ML

Vista schema in un esperimento di ML

Vista dati in un esperimento di ML

Vista dati in un esperimento di ML

Pannello Configurazione esperimento

Fare clic su Schema Visualizza configurazione per aprire un pannello in cui è possibile personalizzare ulteriormente l'addestramento dell'esperimento. È possibile aprire il pannello indipendentemente dalla scheda visualizzata. Questo pannello fornisce una serie di opzioni di configurazione aggiuntive.

Tramite il pannello di configurazione dell'esperimento, è possibile eseguire le seguenti operazioni:

  • Selezionare una destinazione prima di iniziare l'addestramento della prima versione

  • Aggiunta o rimozione di funzioni

  • Configurazione di una nuova versione dell'esperimento

  • Selezionare per modificare o aggiornare il training set

  • Aggiunta o rimozione di algoritmi

  • Modifica delle impostazioni di ottimizzazione del modello

Pannello Configurazione esperimento

Pannello di personalizzazione espanso in un esperimento di ML

Selezionare una destinazione

La colonna di destinazione contiene i valori che si desidera far predire al modello di machine learning. È possibile modificare la colonna di destinazione fino all'avvio del primo addestramento. Dopodiché è bloccata per la modifica.

  1. In Schema Vista schema o Tabella Vista dati, posizionare il mouse sopra la colonna.

  2. Fare clic sull'icona Destinazione che viene visualizzata successivamente.

    La colonna di destinazione è ora indicata da Destinazione e le altre colonne disponibili sono selezionate automaticamente come funzioni.

Selezione della destinazione in Vista schema

Colonna set di dati con simbolo  di destinazione.

In alternativa, è possibile selezionare la destinazione nel pannello di configurazione dell'esperimento.

Una volta selezionata la destinazione, è possibile avviare l'esecuzione della prima versione dell'esperimento. Ulteriori informazioni in Addestramento degli esperimenti. A questo punto è possibile eseguire una configurazione aggiuntiva, descritta di seguito, oppure regolare la configurazione dopo aver esaminato i risultati dell'addestramento.

Le spiegazioni sul modo in cui i dati vengono interpretati ed elaborati vengono visualizzate durante l'avanzamento dell'addestramento dell'esperimento. Per ulteriori informazioni, vedere Interpretazione delle informazioni strategiche di un set di dati.

Determinazione del tipo di modello creato

La colonna selezionata come destinazione dall'utente determina il tipo di modello creato dall'esperimento. Questo, a sua volta, svolge un ruolo nella determinazione degli algoritmi da utilizzare per l'addestramento del modello. Alcune colonne del set di dati potrebbero non essere selezionabili come destinazione per l'esperimento o potrebbero essere sottoposte a un'elaborazione specifica.

I tipi di modello sono i seguenti:

  • Modello di classificazione binaria

  • Modello di classificazione multiclasse

  • Modello di regressione

La tabella sottostante riepiloga i fattori nella destinazione che determinano il tipo di modello utilizzato.

Funzioni della colonna di destinazione che determinano il tipo di modello
Tipo di modelloNumero di valori distinti nella colonnaTipo di funzione richiestoUlteriori informazioni
Classificazione binaria2Qualsiasi-
Classificazione Multiclasse3-10QualsiasiUna colonna con più di 10 classi non numeriche distinte non è selezionabile come destinazione.
RegressionePiù di 10Numerico-

Per maggiori informazioni sul tipo di modelli addestrato nell'esperimento, fare clic su Schema Visualizza configurazione ed espandere Algoritmi. Il tipo di modello è visibile nel titolo della sezione.

Selezione delle colonne di funzioni

Con il set di destinazione, è possibile scegliere quali delle altre colonne disponibili includere per l'addestramento del modello. Escludere tutte le funzioni che non si vogliono includere nel modello. Si noti che la colonna rimarrà nel set di dati, ma non sarà utilizzata dall'algoritmo dell'addestramento.

Nella parte superiore del pannello di configurazione dell'esperimento, è possibile vedere il numero di celle del set di dati. Se il numero supera il limite del set di dati, è possibile escludere le funzioni per scendere sotto il limite.

È possibile selezionare le colonne delle funzioni in vari modi:

In Vista schema e in Vista dati

Nelle viste principali, è possibile fare quanto segue:

  • Deselezionare Escludi tutte le funzioni disponibili e selezionare solo quelle che si desidera includere.

  • Deselezionare manualmente le caselle di controllo per le funzioni che non si desidera includere.

  • Effettuare una ricerca ed escludere o includere tutte le funzioni nei risultati filtrati.

Pannello di personalizzazione dell'addestramento

Se si espande il pannello di configurazione dell'esperimento, è possibile fare quanto segue:

  • Deselezionare manualmente le caselle di controllo per le funzioni che non si desidera includere.

  • Dopo aver eseguito la prima versione dell'esperimento, è possibile definire il Numero di funzioni principali da includere.

La sezione Funzioni nel pannello di configurazione dell'esperimento

La sezione Funzioni nel pannello di personalizzazione dell'addestramento AutoML

Quando si selezionano le funzioni, a queste viene assegnato automaticamente un tipo di funzione. I tipi possibili di funzione sono i seguenti:

  • Categorico

  • Numerico

  • Data

  • Testo libero

Il tipo di funzione viene assegnato in base ai dati contenuti nella colonna delle funzioni. Se una funzione soddisfa determinati criteri, può essere eseguita in modalità staged per diventare la base delle funzioni con ingegneria automatica. Se si desidera, è possibile modificare se utilizzare la funzione per l'ingegneria automatica delle funzioni. Per i dettagli completi sull'ingegneria automatica delle funzioni, vedere Ingegneria automatica delle funzioni.

Alcune colonne del set di dati potrebbero non essere selezionabili come funzioni per l'esperimento o potrebbero essere sottoposte a un'elaborazione specifica. Le spiegazioni sul modo in cui i dati vengono interpretati ed elaborati vengono visualizzate durante l'esecuzione dell'addestramento dell'esperimento. Per ulteriori informazioni, vedere Interpretazione delle informazioni strategiche di un set di dati.

Selezione degli algoritmi

Tutti gli algoritmi disponibili sono inclusi per impostazione predefinita ed è possibile escludere quelli che non si desidera utilizzare. Normalmente, questa operazione viene eseguita nell'ambito del perfezionamento del modello dopo aver visto i primi risultati dell'addestramento. Ulteriori informazioni in Affinamento dei modelli.

La sezione Algoritmi nel pannello di configurazione dell'esperimento

La sezione Algoritmi nel pannello di personalizzazione dell'addestramento AutoML

Modifica dei tipi di funzione

Quando si carica un set di dati, le colonne vengono trattate come categoriche, numeriche, data o testo libero in base al tipo di dati e altre funzioni. In alcuni casi, è possibile modificare questa impostazione.

Ad esempio, se i giorni della settimana sono rappresentati dai numeri 1-7, ogni numero rappresenta un valore categoriale. Per impostazione predefinita, viene trattato come un valore numerico continuo e classificato, quindi è necessario modificare manualmente la configurazione per trattarla come categorica.

Quando si identifica una colonna come contenente informazioni su data e ora, questa viene utilizzata per le nuove funzioni progettate automaticamente. Quando ciò si verifica, la colonna originale (la funzione padre) viene considerata come avente il tipo di funzione data.

È possibile modificare il tipo per la funzione padre da data a categorico o numerico. Ad esempio, questa opzione può essere utile quando una funzione è identificata come una data, ma è necessario trattarla come una stringa o un numero. Quando si esegue questa operazione, non è più possibile utilizzare le relative funzioni progettate automaticamente per l'addestramento dell'esperimento.

  1. In Schema Visualizzazione schema, individuare la funzione.

  2. Nella colonna Tipo funzione per la funzione, fare clic su .

  3. Selezionare un valore nell'elenco.

In alternativa, è possibile cambiare i tipi di funzione da Tabella Vista dati. Individuare la funzione, quindi fare clic su accanto al tipo di funzione corrente. Selezionare un valore nell'elenco.

È possibile vedere tutte le colonne con un tipo di funzione modificato nel pannello di configurazione dell'esperimento, alla voce Trattamento dati.

Impatto sulle previsioni

Quando si modifica manualmente il tipo di funzione e quindi si distribuisce il modello risultante, le sostituzioni del tipo di funzione verranno applicate alla funzione nel set di dati di applicazione utilizzato nelle previsioni fatte con quel modello.

Modifica del set di dati

È possibile modificate il training set prima di eseguire la prima versione dell'esperimento o qualsiasi altra versione.

Se si modifica il set di dati prima di eseguire la prima versione, si perderà qualsiasi configurazione completata prima di modificare il set di dati.

  1. Nel pannello di configurazione dell'esperimento, alla voce Dati di addestramento, fare clic su Modifica set di dati.

  2. Selezionare un nuovo set di dati.

Per maggiori informazioni sulla modifica e sull'aggiornamento del set di dati durante il perfezionamento del modello (dopo aver eseguito una versione dell'esperimento), vedere Modificare e aggiornare il set di dati.

Configurazione dell'ottimizzazione del modello

È possibile utilizzare le seguenti impostazioni per ottimizzare i modelli:

  • Attivazione e disattivazione della funzione di ottimizzazione intelligente del modello

  • Attivazione e disattivazione della funzione di ottimizzazione dell'iperparametro

  • Attivare o disattivare l'addestramento sensibile ai valori temporali

È possibile attivare e disattivare queste opzioni per ogni versione eseguita dell'esperimento.

Configurazione della funzione di ottimizzazione intelligente

Per impostazione predefinita, l'esperimento utilizza la funzione di ottimizzazione intelligente del modello. Con l'ottimizzazione intelligente del modello, AutoML gestisce il processo di perfezionamento del modello per l'utente, iterando la selezione delle funzioni e applicando trasformazioni avanzate ai dati.

Per maggiori informazioni sull'ottimizzazione intelligente, vedere Ottimizzazione intelligente del modello .

È possibile disattivare questa impostazione manualmente per migliorare i modelli addestrati. Per esempio, potrebbe essere necessario iniziare l'addestramento del modello con l'ottimizzazione intelligente del modello, per passare quindi al miglioramento manuale per la versione 2 per regolare ulteriormente la configurazione.

  1. Fare clic su Schema Visualizza configurazione.

  2. Se si è già eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.

  3. Nel pannello, espandere Ottimizzazione modello.

  4. Passare da Intelligente a Manuale.

  5. Con il cursore, impostare la durata massima dell'addestramento.

Configurazione dell'ottimizzazione del modello

Attivazione della funzione Ottimizzazione intelligente del modello in Ottimizzazione modello nel pannello di personalizzazione dell'addestramento AutoML

Configurazione dell'ottimizzazione degli iperparametri

È possibile ottimizzare i modelli utilizzando l'ottimizzazione degli iperparametri. Si noti che si tratta di un'opzione avanzata che potrebbe aumentare notevolmente il tempo richiesto per l'addestramento. L'ottimizzazione degli iperparametri è disponibile se si disattiva l'ottimizzazione intelligente.

Per ulteriori informazioni, vedere Ottimizzazione degli iperparametri.

  1. Fare clic su Schema Visualizza configurazione.

  2. Se si è già eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.

  3. Nel pannello, espandere Ottimizzazione modello.

  4. Passare da Intelligente a Manuale.

  5. Selezionare la casella di controllo Ottimizzazione iperparametro.

  6. È possibile impostare un limite di tempo per l'ottimizzazione. Il limite di tempo predefinito è di un'ora.

Configurazione dell'ottimizzazione degli iperparametri

Il pannello di personalizzazione dell'addestramento AutoML con l'ottimizzazione degli iperparametri attivata

Configurazione dell'addestramento sensibile ai valori temporali

Se si desidera che i modelli vengano addestrati tenendo conto della dimensione delle serie temporali, attivare l'addestramento sensibile ai valori temporali per la versione dell'esperimento. Per utilizzare questa opzione, è necessario che nel set di dati sia presente una colonna che contenga le informazioni pertinenti della serie temporale.

Quando l'addestramento sensibile ai valori temporali è attivato, AutoML utilizza processi specializzati di convalida incrociata e imputazione nulla per addestrare i modelli.

Per ulteriori informazioni, vedere Creazione di modelli sensibili ai valori temporali e Convalida incrociata basata sul tempo.

  1. Fare clic su Schema Visualizza configurazione.

  2. Se si è già eseguita almeno una versione dell'esperimento, fare clic su Nuova versione.

  3. Nel pannello, espandere Ottimizzazione modello.

  4. Nella sezione Suddivisione training-test in base al tempo, selezionare l'Indicizzazione data da utilizzare per l'ordinamento dei dati.

Configurare l'addestramento sensibile ai valori temporali selezionando una colonna nei dati di addestramento da utilizzare come indice

Pannello di personalizzazione dell'addestramento di AutoML con una colonna della data selezionata per attivare l'addestramento sensibile ai valori temporali

Visualizzazione delle informazioni strategiche sui dati dell'addestramento

Nella scheda Dati dell'esperimento, è possibile visualizzare le informazioni strategiche per la gestione dei dati dell'addestramento. Queste informazioni sono disponibili nella colonna Informazioni strategiche nella Righe della tabella Vista schema. Le informazioni mostrate variano dipendendo se per eseguire la versione si sono utilizzati o meno i dati di addestramento. Le modifiche nella colonna Informazioni strategiche può aiutare a identificare la ragione per cui le funzioni possono essere inutilizzabili o perché sono state eliminate automaticamente.

Per maggiori informazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!