Vai al contenuto principale Passa a contenuto complementare

Visualizzazione delle informazioni strategiche sui dati dell'addestramento

Man mano che si aggiungono e addestrano i dati e si eseguono le versioni dell'addestramento, è possibile accedere alle informazioni strategiche su come vengono gestiti i dati. Le Informazioni strategiche forniscono informazioni sulla destinazione e sulle funzioni nell'esperimento, ad esempio le funzioni che sono state eliminate, non sono disponibili o che verranno codificate con un'elaborazione speciale.

La colonna Informazioni strategiche è disponibile nella scheda Dati quando si utilizza la SchemaVista schema. Le informazioni strategiche abbreviate sono disponibili anche in Tabella Vista dati. Le informazioni strategiche vengono create individualmente per ogni modello addestrato nell'esperimento.

Colonna Informazioni strategiche nella Vista schema

Informazioni strategiche visualizzate sulle colonne di ogni funzione nel training set

Le informazioni strategiche vengono generate nei seguenti casi:

  • Dopo aver aggiunto o modificato i dati di addestramento, ma prima che sia stata eseguita una versione dell'esperimento.

  • Dopo l'esecuzione di ogni versione dell'esperimento. Un set di informazioni strategiche separato viene creato per ogni modello addestrato.

Le informazioni strategiche possono essere differenti prima e dopo l'esecuzione di una versione. Ciò è dovuto al fatto che, quando l'addestramento inizia, AutoML è in grado di pre-elaborare i dati e diagnosticare ulteriormente i problemi con i dati. Per ulteriori informazioni, vedere Preparazione e trasformazione automatica dei dati.

Visualizzazione delle informazioni strategiche prima dell'addestramento

Prima di eseguire una versione dell'esperimento, è possibile analizzare le Informazioni strategiche per visualizzare il modo in cui vengono interpretati i dati di addestramento correnti. Queste informazioni strategiche possono cambiare dopo l'esecuzione della versione.

  1. In un esperimento, assicurarsi di aver aggiunto i dati di addestramento che si desidera utilizzare per la versione dell'esperimento.

  2. Aprire la scheda Dati.

  3. Assicurarsi di utilizzare la Righe della tabella Vista schema.

  4. Analizzare la colonna Informazioni strategiche. I suggerimenti a comparsa forniscono ulteriore contesto alla base delle informazioni strategiche. Per ulteriori spiegazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.

Visualizzazione delle informazioni strategiche per un modello

Una volta che i modelli hanno completato l'addestramento di una versione dell'esperimento, selezionare un modello e analizzare i modi in cui i dati sono stati gestiti.

  1. Eseguire una versione dell'esperimento e aprire la scheda Dati.

  2. Selezionare un modello dall'elenco a comparsa nella barra degli strumenti.

  3. Assicurarsi di utilizzare la Righe della tabella Vista schema.

  4. Analizzare la colonna Informazioni strategiche. I suggerimenti a comparsa forniscono ulteriore contesto alla base delle informazioni strategiche. Per ulteriori spiegazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.

Interpretazione delle informazioni strategiche di un set di dati

La seguente tabella fornisce maggiori dettagli sulle informazioni strategiche che possono essere visualizzate nello schema.

Informazioni strategiche sul set di dati nella visualizzazione schema
Informazione strategica Significato Impatto sulla configurazione Quando l'informazione strategica viene determinata Riferimenti aggiuntivi
Costante La colonna presenta lo stesso valore per tutte le righe. La colonna non può essere utilizzata come funzione di destinazione o inclusa. Prima e dopo l'esecuzione della versione Cardinalità
One-hot encoded Il tipo di funzione è categorico e la colonna ha meno di 14 valori univoci. Nessun effetto sulla configurazione. Prima e dopo l'esecuzione della versione Codifica categoriale
Impatto codificato Il tipo di funzione è categorico e la colonna ha 14 o più valori univoci. Nessun effetto sulla configurazione. Prima e dopo l'esecuzione della versione Codifica categoriale
Cardinalità elevata La colonna ha troppi valori unici e può influire negativamente sulle prestazioni del modello se utilizzata come funzione. La colonna non può essere utilizzata come target. Verrà esclusa automaticamente come funzione, ma potrà essere inclusa, se richiesto. Prima e dopo l'esecuzione della versione Cardinalità
Dati di tipo sparse La colonna ha troppi valori nulli. La colonna non può essere utilizzata come funzione di destinazione o inclusa. Prima e dopo l'esecuzione della versione Imputazione di valori nulli
Classe sottorappresentata La colonna ha una classe con meno di 10 righe. La colonna non può essere utilizzata come destinazione, ma può essere inclusa come funzione. Prima e dopo l'esecuzione della versione -
<numero di> funzionalità progettate automaticamente La colonna è la funzionalità padre che è possibile utilizzare per generare funzionalità progettate automaticamente. Se la funzionalità padre è interpretata come funzionalità data, viene rimossa automaticamente dalla configurazione. Si consiglia di utilizzare invece le funzionalità data progettate automaticamente che è possibile generare da quest'ultima. È possibile sovrascrivere questa impostazione e includere questa funzionalità anziché le funzionalità progettate automaticamente. Prima e dopo l'esecuzione della versione Ingegneria automatica delle funzioni
Funzionalità progettata automaticamente La colonna è una funzionalità progettata automaticamente che può essere o è stata generata da una funzionalità data padre. Questa non era visualizzata nel set di dati originale. Durante l'addestramento dell'esperimento, è possibile rimuovere una o più funzionalità progettate automaticamente. Se si modifica il tipo della funzionalità padre a categorico, tutte le funzionalità progettate automaticamente vengono rimosse. Prima e dopo l'esecuzione della versione Ingegneria automatica delle funzioni
Impossibile elaborare come una data La colonna può includere informazioni relative a data e ora, ma non può essere utilizzata per creare funzionalità data progettate automaticamente. La funzione viene eliminata dalla configurazione. Se le funzioni progettate con ingengeria automatica sono state generate anteriormente dalla funzionalità padre, vengono rimosse dalle versioni future dell'esperimento. È ancora possibile utilizzare la funzione nell'esperimento, ma è necessario modificarne il tipo a categorico. Dopo l'esecuzione della versione Progettazione delle funzioni data
Testo libero possibile La colonna può essere disponibile per l'utilizzo come una funzione testo libero. Il tipo di funzione testo libero viene assegnato alla colonna. È necessario eseguire una versione dell'esperimento per confermare se è possibile eseguire ulteriormente la funzione come testo libero. Prima dell'esecuzione della versione Gestione dei dati di testo libero
Testo libero La colonna è stata confermata come contenente testo libero. Non è possibile elaborarla come testo libero. Non è richiesta alcuna configurazione aggiuntiva per la funzione. Dopo l'esecuzione della versione Gestione dei dati di testo libero
Impossibile elaborare come testo libero Dopo un ulteriore analisi, la colonna non può essere elaborata come testo libero. Per la versione successiva dell'esperimento, è necessario deselezionare la funzione dalla configurazione. Se la funzione non ha una cardinalità elevata, in alternativa è possibile cambiare il tipo di funzione a categorico. Dopo l'esecuzione della versione Gestione dei dati di testo libero
Perdita nella destinazione Si sospetta che la funzione sia interessata da una perdita nella destinazione. In tal caso, questa include le informazioni sulla colonna della destinazione che si tenta di prevedere. Le funzioni con una perdita nella destinazione possono fornire un falso senso di sicurezza sulle prestazioni del modello. Nelle previsioni reali, possono determinare prestazioni molto negative da parte del modello. La funzione non è stata utilizzata per addestrare il modello. Dopo l'esecuzione della versione Perdita di dati
Importanza della permutazione bassa La funzione non ha molta o nessuna influenza sulle previsioni del modello. La rimozione di queste funzioni migliora le prestazioni del modello riducendo il rumore statistico. La funzione non è stata utilizzata per addestrare il modello. Dopo l'esecuzione della versione Nozioni sull'importanza della permutazione
Correlazione elevata La funzione ha una correlazione elevata con una o molte altre funzioni nell'esperimento. L'inclusione di funzioni altamente correlate le une con le altre diminuiscono le prestazioni del modello. La funzione non è stata utilizzata per addestrare il modello. La funzione alla quale è altamente correlata non è stata eliminata a causa dell'elevata correlazione, ma potrebbe essere stata eliminata per un'altra ragione, come la bassa importanza della permutazione. Dopo l'esecuzione della versione Correlazione

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!