Vai al contenuto principale Passa a contenuto complementare

Visualizzazione delle informazioni strategiche sui dati dell'addestramento

Man mano che si aggiungono e addestrano i dati e si eseguono le versioni dell'addestramento, è possibile accedere alle informazioni strategiche su come vengono gestiti i dati. Le Informazioni strategiche forniscono informazioni sulla destinazione e sulle funzioni nell'esperimento, ad esempio le funzioni che sono state eliminate, non sono disponibili o che verranno codificate con un'elaborazione speciale.

La colonna Informazioni strategiche è disponibile nella scheda Dati quando si utilizza la SchemaVista schema. Le informazioni strategiche abbreviate sono disponibili anche in Tabella Vista dati. Le informazioni strategiche vengono create individualmente per ogni modello addestrato nell'esperimento.

Colonna Informazioni strategiche nella Vista schema

Informazioni strategiche visualizzate sulle colonne di ogni funzione nel training set

Le informazioni strategiche vengono generate nei seguenti casi:

  • Dopo aver aggiunto o modificato i dati di addestramento, ma prima che sia stata eseguita una versione dell'esperimento.

  • Dopo l'esecuzione di ogni versione dell'esperimento. Un set di informazioni strategiche separato viene creato per ogni modello addestrato.

Le informazioni strategiche possono essere differenti prima e dopo l'esecuzione di una versione. Ciò è dovuto al fatto che, quando l'addestramento inizia, AutoML è in grado di pre-elaborare i dati e diagnosticare ulteriormente i problemi con i dati. Per ulteriori informazioni, vedere Preparazione e trasformazione automatica dei dati.

Visualizzazione delle informazioni strategiche prima dell'addestramento

Prima di eseguire una versione dell'esperimento, è possibile analizzare le Informazioni strategiche per visualizzare il modo in cui vengono interpretati i dati di addestramento correnti. Queste informazioni strategiche possono cambiare dopo l'esecuzione della versione.

  1. In un esperimento, assicurarsi di aver aggiunto i dati di addestramento che si desidera utilizzare per la versione dell'esperimento.

  2. Aprire la scheda Dati.

  3. Assicurarsi di utilizzare la Righe della tabella Vista schema.

  4. Analizzare la colonna Informazioni strategiche. I suggerimenti a comparsa forniscono ulteriore contesto alla base delle informazioni strategiche. Per ulteriori spiegazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.

Visualizzazione delle informazioni strategiche per un modello

Una volta che i modelli hanno completato l'addestramento di una versione dell'esperimento, selezionare un modello e analizzare i modi in cui i dati sono stati gestiti.

  1. Eseguire una versione dell'esperimento e aprire la scheda Dati.

  2. Selezionare un modello dall'elenco a comparsa nella barra degli strumenti.

  3. Assicurarsi di utilizzare la Righe della tabella Vista schema.

  4. Analizzare la colonna Informazioni strategiche. I suggerimenti a comparsa forniscono ulteriore contesto alla base delle informazioni strategiche. Per ulteriori spiegazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.

Interpretazione delle informazioni strategiche di un set di dati

La seguente tabella fornisce maggiori dettagli sulle informazioni strategiche che possono essere visualizzate nello schema.

Informazioni strategiche sul set di dati nella visualizzazione schema
Informazione strategicaSignificatoImpatto sulla configurazioneQuando l'informazione strategica viene determinataRiferimenti aggiuntivi
CostanteLa colonna presenta lo stesso valore per tutte le righe.La colonna non può essere utilizzata come funzione di destinazione o inclusa.Prima e dopo l'esecuzione della versioneCardinalità
One-hot encodedIl tipo di funzione è categorico e la colonna ha meno di 14 valori univoci.Nessun effetto sulla configurazione.Prima e dopo l'esecuzione della versioneCodifica categoriale
Impatto codificatoIl tipo di funzione è categorico e la colonna ha 14 o più valori univoci.Nessun effetto sulla configurazione.Prima e dopo l'esecuzione della versioneCodifica categoriale
Cardinalità elevataLa colonna ha troppi valori unici e può influire negativamente sulle prestazioni del modello se utilizzata come funzione.La colonna non può essere utilizzata come target. Verrà esclusa automaticamente come funzione, ma potrà essere inclusa, se richiesto.Prima e dopo l'esecuzione della versioneCardinalità
Dati di tipo sparseLa colonna ha troppi valori nulli.La colonna non può essere utilizzata come funzione di destinazione o inclusa.Prima e dopo l'esecuzione della versioneImputazione di valori nulli
Classe sottorappresentataLa colonna ha una classe con meno di 10 righe.La colonna non può essere utilizzata come destinazione, ma può essere inclusa come funzione.Prima e dopo l'esecuzione della versione-
<numero di> funzionalità progettate automaticamenteLa colonna è la funzionalità padre che è possibile utilizzare per generare funzionalità progettate automaticamente.Se la funzionalità padre è interpretata come funzionalità data, viene rimossa automaticamente dalla configurazione. Si consiglia di utilizzare invece le funzionalità data progettate automaticamente che è possibile generare da quest'ultima. È possibile sovrascrivere questa impostazione e includere questa funzionalità anziché le funzionalità progettate automaticamente.Prima e dopo l'esecuzione della versioneIngegneria automatica delle funzioni
Funzionalità progettata automaticamenteLa colonna è una funzionalità progettata automaticamente che può essere o è stata generata da una funzionalità data padre. Questa non era visualizzata nel set di dati originale.Durante l'addestramento dell'esperimento, è possibile rimuovere una o più funzionalità progettate automaticamente. Se si modifica il tipo della funzionalità padre a categorico, tutte le funzionalità progettate automaticamente vengono rimosse.Prima e dopo l'esecuzione della versioneIngegneria automatica delle funzioni
Impossibile elaborare come una dataLa colonna può includere informazioni relative a data e ora, ma non può essere utilizzata per creare funzionalità data progettate automaticamente.La funzione viene eliminata dalla configurazione. Se le funzioni progettate con ingengeria automatica sono state generate anteriormente dalla funzionalità padre, vengono rimosse dalle versioni future dell'esperimento. È ancora possibile utilizzare la funzione nell'esperimento, ma è necessario modificarne il tipo a categorico.Dopo l'esecuzione della versioneIngegneria delle funzionalità data
Testo libero possibileLa colonna può essere disponibile per l'utilizzo come una funzione testo libero.Il tipo di funzione testo libero viene assegnato alla colonna. È necessario eseguire una versione dell'esperimento per confermare se è possibile eseguire ulteriormente la funzione come testo libero.Prima dell'esecuzione della versioneGestione dei dati di testo libero
Testo liberoLa colonna è stata confermata come contenente testo libero. Non è possibile elaborarla come testo libero.Non è richiesta alcuna configurazione aggiuntiva per la funzione.Dopo l'esecuzione della versioneGestione dei dati di testo libero
Impossibile elaborare come testo liberoDopo un ulteriore analisi, la colonna non può essere elaborata come testo libero.Per la versione successiva dell'esperimento, è necessario deselezionare la funzione dalla configurazione. Se la funzione non ha una cardinalità elevata, in alternativa è possibile cambiare il tipo di funzione a categorico.Dopo l'esecuzione della versioneGestione dei dati di testo libero
Perdita nella destinazioneSi sospetta che la funzione sia interessata da una perdita nella destinazione. In tal caso, questa include le informazioni sulla colonna della destinazione che si tenta di prevedere. Le funzioni con una perdita nella destinazione possono fornire un falso senso di sicurezza sulle prestazioni del modello. Nelle previsioni reali, possono determinare prestazioni molto negative da parte del modello.La funzione non è stata utilizzata per addestrare il modello.Dopo l'esecuzione della versionePerdita di dati
Importanza della permutazione bassaLa funzione non ha molta o nessuna influenza sulle previsioni del modello. La rimozione di queste funzioni migliora le prestazioni del modello riducendo il rumore statistico.La funzione non è stata utilizzata per addestrare il modello.Dopo l'esecuzione della versioneNozioni sull'importanza della permutazione
Correlazione elevataLa funzione ha una correlazione elevata con una o molte altre funzioni nell'esperimento. L'inclusione di funzioni altamente correlate le une con le altre diminuiscono le prestazioni del modello.La funzione non è stata utilizzata per addestrare il modello. La funzione alla quale è altamente correlata non è stata eliminata a causa dell'elevata correlazione, ma potrebbe essere stata eliminata per un'altra ragione, come la bassa importanza della permutazione.Dopo l'esecuzione della versioneCorrelazione

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!