Vai al contenuto principale Passa a contenuto complementare

Configurazione di esperimenti

La configurazione degli esperimenti consiste nel selezionare il target e le funzioni che il modello utilizzerà per prevedere la destinazione. È inoltre possibile configurare una serie di impostazioni opzionali.

Per aiutare l'utente nella selezione di una destinazione, il set di dati cronologici viene analizzato e vengono visualizzate le statistiche di riepilogo relative a ciascuna colonna del set di dati. Al set di dati vengono applicate diverse fasi di pre-elaborazione automatica per assicurarsi che vengano inclusi solo i dati adatti. Per maggiori dettagli sulla pre-elaborazione dei dati, vedere Preparazione e trasformazione automatica dei dati.

Dopo aver eseguito la versione v1, è possibile creare nuove versioni dell'esperimento se è necessario affinare ulteriormente l'addestramento del modello. Per ulteriori informazioni, vedere Affinamento dei modelli.

Requisiti e autorizzazioni

Per maggiori informazioni sui requisiti utente per l'utilizzo degli esperimenti di ML, vedere Utilizzo degli esperimenti.

Visualizzazioni

La visualizzazione predefinita è quella dello schema, dove ogni colonna nel set di dati è rappresentata da una riga dello schema con informazioni e statistiche. Per ottenere maggiori informazioni e dati campione per ogni colonna, è disponibile anche la visualizzazione dati. Fare clic su Colonne e Visualizzazione dati per scorrere tra le visualizzazioni.

Un'anteprima del set di dati mostrato nella visualizzazione schema

La visualizzazione schema AutoML.

Un'anteprima del set di dati mostrato nella visualizzazione dati

La visualizzazione dati AutoML.

Fare clic su Pannello di configurazione per aprire o chiudere il pannello laterale Configurazione esperimento. Qui si trovano informazioni sull'esperimento e sulla configurazione attuale.

Il pannello laterale mostra la configurazione dell'esperimento per la versione corrente

Il pannello laterale di configurazione dell'esperimento AutoML.

Selezione di una destinazione

La colonna di destinazione contiene i valori che si desidera far predire al modello di machine learning. È possibile modificare la colonna di destinazione fino all'avvio del primo training. Dopodiché è bloccata per la modifica.

  • Passare il mouse sulla colonna e fare clic sull'icona Destinazione che apparirà.

    La colonna di destinazione è ora indicata da Destinazione e le altre colonne disponibili sono selezionate automaticamente come funzioni.

Selezione della destinazione

Colonna set di dati con simbolo  di destinazione.

Una volta selezionata la destinazione, è possibile avviare l'esecuzione della prima versione dell'esperimento. Ulteriori informazioni in Training degli esperimenti. A questo punto è possibile eseguire una configurazione aggiuntiva, descritta di seguito, oppure regolare la configurazione dopo aver esaminato i risultati del training.

Le spiegazioni sul modo in cui i dati vengono interpretati ed elaborati vengono visualizzate durante l'esecuzione del training dell'esperimento. Per ulteriori informazioni, vedere Informazioni strategiche comuni rilevate nei dati di training.

Determinazione del tipo di modello creato

La colonna selezionata come destinazione dall'utente determina il tipo di modello creato dall'esperimento. Questo, a sua volta, svolge un ruolo nella determinazione degli algoritmi da utilizzare per il training del modello. Alcune colonne del set di dati potrebbero non essere selezionabili come destinazione per l'esperimento o potrebbero essere sottoposte a un'elaborazione specifica.

I tipi di modello sono i seguenti:

  • Modello di classificazione binaria

  • Modello di classificazione multiclasse

  • Modello di regressione

La tabella sottostante riepiloga i fattori nella destinazione che determinano il tipo di modello utilizzato.

Funzioni della colonna di destinazione che determinano il tipo di modello
Tipo di modello Numero di valori distinti nella colonna Tipo di funzione richiesto Ulteriori informazioni
Classificazione binaria 2 Qualsiasi -
Classificazione Multiclasse 3-10 Qualsiasi Una colonna con più di 10 classi non numeriche distinte non è selezionabile come destinazione.
Regressione Più di 10 Numerico -

Selezione delle colonne di funzioni

Con il set di destinazione, è possibile scegliere quali delle altre colonne disponibili includere nel training del modello. Escludere tutte le funzioni che non si vogliono includere nel modello. Si noti che la colonna rimarrà nel set di dati, ma non sarà utilizzata dall'algoritmo di training.

Nella parte superiore del pannello Configurazione esperimento, è possibile vedere il numero di celle del set di dati. Se il numero supera il limite del set di dati, è possibile escludere le funzioni per scendere sotto il limite.

È possibile selezionare le colonne delle funzioni in vari modi:

  • Deselezionare manualmente le caselle di controllo per le funzioni che non si desidera includere.

  • Fare clic su Escludi tutte le funzioni e selezionare solo quelle che si desidera includere.

  • Effettuare una ricerca ed escludere o includere tutte le funzioni nei risultati filtrati.

  • Dopo aver eseguito la prima versione dell'esperimento, è possibile definire il Numero di funzioni principali da includere.

Sezione Funzioni nella configurazione dell'esperimento

Sezione Funzioni nel pannello laterale di configurazione dell'esperimento AutoML.

Quando si selezionano le funzioni, a queste viene assegnato automaticamente un tipo di funzione. I tipi possibili di funzione sono i seguenti:

  • Categorico

  • Numerico

  • Data

  • Testo libero

Il tipo di funzione viene assegnato in base ai dati contenuti nella colonna delle funzioni. Se una funzione soddisfa determinati criteri, può essere eseguita in modalità staged per diventare la base delle funzioni con ingegneria automatica. Se si desidera, è possibile modificare se utilizzare la funzione per l'ingegneria automatica delle funzioni. Per i dettagli completi sull'ingegneria automatica delle funzioni, vedere Ingegneria automatica delle funzioni.

Alcune colonne del set di dati potrebbero non essere selezionabili come funzioni per l'esperimento o potrebbero essere sottoposte a un'elaborazione specifica. Le spiegazioni sul modo in cui i dati vengono interpretati ed elaborati vengono visualizzate durante l'esecuzione del training dell'esperimento. Per ulteriori informazioni, vedere Informazioni strategiche comuni rilevate nei dati di training.

Selezione degli algoritmi

Tutti gli algoritmi disponibili sono inclusi per impostazione predefinita ed è possibile escludere quelli che non si desidera utilizzare. Normalmente, questa operazione viene eseguita nell'ambito del perfezionamento del modello dopo aver visto i primi risultati del training. Ulteriori informazioni in Affinamento dei modelli.

Sezione Algoritmi nella configurazione dell'esperimento

Sezione Algoritmi nel pannello laterale di configurazione dell'esperimento AutoML.

Modifica dei tipi di funzionalità

Quando si carica un set di dati, le colonne vengono trattate come categoriche, numeriche, data o testo libero in base al tipo di dati e altre funzioni. In alcuni casi, è consigliabile modificare questa impostazione.

Ad esempio, se i giorni della settimana sono rappresentati dai numeri 1-7, ogni numero rappresenta un valore categoriale. Per impostazione predefinita, viene trattato come un valore numerico continuo e classificato, quindi è necessario modificare manualmente la configurazione per trattarlo come categoriale. È inoltre possibile convertire una funzione di tipo categoriale in una funzione di tipo numerico.

Quando si identifica una colonna come contenente informazioni su data e ora, questa viene utilizzata per le nuove funzionalità progettate automaticamente. Quando ciò accade, la colonna originale (la funzionalità padre) viene considerata come avente il tipo di funzionalità data. È possibile modificare il tipo per la funzionalità padre da data a categorico. In tal caso, tuttavia, non è più possibile utilizzare le relative funzionalità progettate automaticamente per il training dell'esperimento.

  1. Nella colonna Tipo funzione, fare clic su .

  2. Selezionare un valore nell'elenco.

È possibile vedere tutte le colonne con un tipo di funzione modificato nel pannello Configurazione esperimento, alla voce Trattamento dati.

Modifica del set di dati

È possibile modificate il training set prima di eseguire la prima versione dell'esperimento o qualsiasi altra versione.

Se si modifica il set di dati prima di eseguire la prima versione, si perderà qualsiasi configurazione completata prima di modificare il set di dati.

  1. Nel pannello Configurazione esperimento, alla voce Dati di training, fare clic su Cambia set di dati.

  2. Selezionare un nuovo set di dati.

Per maggiori informazioni sulla modifica e sull'aggiornamento del set di dati durante il perfezionamento del modello (dopo aver eseguito una versione dell'esperimento), vedere Modificare e aggiornare il set di dati.

Configurazione dell'ottimizzazione degli iperparametri

È possibile ottimizzare il modello utilizzando l'ottimizzazione degli iperparametri. Si noti che si tratta di un'opzione avanzata che potrebbe aumentare notevolmente il tempo di training. Per ulteriori informazioni, vedere Ottimizzazione degli iperparametri.

Sezione di ottimizzazione del modello nella configurazione dell'esperimento

Sezione di ottimizzazione del modello nel pannello laterale di configurazione dell'esperimento AutoML.
  1. Nel pannello Configurazione esperimento, espandere la sezione Ottimizzazione modello.

  2. Selezionare la casella di controllo Ottimizzazione iperparametro.

  3. È possibile impostare un limite di tempo per l'ottimizzazione. Il limite di tempo predefinito è di un'ora.

Informazioni strategiche comuni rilevate nei dati di training

A seconda della qualità del set di dati, potrebbero esserci limitazioni sull'utilizzo di parti specifiche dei dati nella configurazione dell'esperimento. La colonna Informazioni strategiche nella visualizzazione schema è utile per identificare particolari funzioni dei campi di dati e il modo in cui verranno elaborati dagli algoritmi di machine learning.

La tabella seguente mostra le possibili informazioni strategiche visualizzabili nello schema:

Informazioni strategiche sul set di dati nella visualizzazione schema
Informazione strategicaSignificatoImpatto sulla configurazione
CostanteLa colonna presenta lo stesso valore per tutte le righe.La colonna non può essere utilizzata come funzione di destinazione o inclusa.
One-hot encodedIl tipo di funzione è categorico e la colonna ha meno di 14 valori univoci.Nessun effetto sulla configurazione.
Impatto codificatoIl tipo di funzione è categorico e la colonna ha 14 o più valori univoci.Nessun effetto sulla configurazione.
Cardinalità elevataLa colonna ha troppi valori unici e può influire negativamente sulle prestazioni del modello se utilizzata come funzione.La colonna non può essere utilizzata come target. Verrà esclusa automaticamente come funzione, ma potrà essere inclusa, se richiesto.
Dati di tipo sparseLa colonna ha troppi valori nulli.La colonna non può essere utilizzata come funzione di destinazione o inclusa.
Classe sottorappresentataLa colonna ha una classe con meno di 10 righe.La colonna non può essere utilizzata come destinazione, ma può essere inclusa come funzione.
<numero di> funzionalità progettate automaticamenteLa colonna è la funzionalità padre che è possibile utilizzare per generare funzionalità progettate automaticamente.Se la funzionalità padre è interpretata come funzionalità data, viene rimossa automaticamente dalla configurazione. Si consiglia di utilizzare invece le funzionalità data progettate automaticamente che è possibile generare da quest'ultima. È possibile sovrascrivere questa impostazione e includere questa funzionalità anziché le funzionalità progettate automaticamente.
Funzionalità progettata automaticamenteLa colonna è una funzionalità progettata automaticamente che può essere o è stata generata da una funzionalità data padre. Questa non era visualizzata nel set di dati originale.Durante il training dell'esperimento, è possibile rimuovere una o più funzionalità progettate automaticamente. Se si modifica il tipo della funzionalità padre a categorico, tutte le funzionalità progettate automaticamente vengono rimosse.
Impossibile elaborare come una dataLa colonna può includere informazioni relative a data e ora, ma non può essere utilizzata per creare funzionalità data progettate automaticamente.La funzionae viene rimossa dalla configurazione. Se le funzioni progettate con ingengeria automatica sono state generate anteriormente dalla funzionalità padre, vengono rimosse dalle versioni future dell'esperimento. È ancora possibile utilizzare la funzione nell'esperimento, ma è necessario modificarne il tipo a categorico.
Testo libero possibileLa colonna può essere disponibile per l'utilizzo come una funzione testo libero.Il tipo di funzione testo libero viene assegnato alla colonna. È necessario eseguire una versione dell'esperimento per confermare se è possibile eseguire ulteriormente la funzione come testo libero.
Testo liberoLa colonna è stata confermata come contenente testo libero. Non è possibile elaborarla come testo libero.Non è richiesta alcuna configurazione aggiuntiva per la funzione.
Impossibile elaborare come testo liberoDopo un ulteriore analisi, la colonna non può essere elaborata come testo libero.Per la versione successiva dell'esperimento, è necessario deselezionare la funzione dalla configurazione. Se la funzione non ha una cardinalità elevata, in alternativa è possibile cambiare il tipo di funzione a categorico.

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!