Visualizzazione delle informazioni strategiche sui dati dell'addestramento
Man mano che si aggiungono e addestrano i dati e si eseguono le versioni dell'addestramento, è possibile accedere alle informazioni strategiche su come vengono gestiti i dati. Le Informazioni strategiche forniscono informazioni sulla destinazione e sulle funzioni nell'esperimento, ad esempio le funzioni che sono state eliminate, non sono disponibili o che verranno codificate con un'elaborazione speciale.
La colonna Informazioni strategiche è disponibile nella scheda Dati quando si utilizza la Vista schema. Le informazioni strategiche abbreviate sono disponibili anche in Vista dati. Le informazioni strategiche vengono create individualmente per ogni modello addestrato nell'esperimento.
Le informazioni strategiche vengono generate nei seguenti casi:
-
Dopo aver aggiunto o modificato i dati di addestramento, ma prima che sia stata eseguita una versione dell'esperimento.
-
Dopo l'esecuzione di ogni versione dell'esperimento. Un set di informazioni strategiche separato viene creato per ogni modello addestrato.
Le informazioni strategiche possono essere differenti prima e dopo l'esecuzione di una versione. Ciò è dovuto al fatto che, quando l'addestramento inizia, AutoML è in grado di pre-elaborare i dati e diagnosticare ulteriormente i problemi con i dati. Per ulteriori informazioni, vedere Preparazione e trasformazione automatica dei dati.
Visualizzazione delle informazioni strategiche prima dell'addestramento
Prima di eseguire una versione dell'esperimento, è possibile analizzare le Informazioni strategiche per visualizzare il modo in cui vengono interpretati i dati di addestramento correnti. Queste informazioni strategiche possono cambiare dopo l'esecuzione della versione.
Procedere come indicato di seguito:
In un esperimento, assicurarsi di aver aggiunto i dati di addestramento che si desidera utilizzare per la versione dell'esperimento.
Aprire la scheda Dati.
Assicurarsi di utilizzare la Vista schema.
Analizzare la colonna Informazioni strategiche. I suggerimenti a comparsa forniscono ulteriore contesto alla base delle informazioni strategiche. Per ulteriori spiegazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.
Visualizzazione delle informazioni strategiche per un modello
Una volta che i modelli hanno completato l'addestramento di una versione dell'esperimento, selezionare un modello e analizzare i modi in cui i dati sono stati gestiti.
Procedere come indicato di seguito:
Eseguire una versione dell'esperimento e aprire la scheda Dati.
Selezionare un modello dall'elenco a comparsa nella barra degli strumenti.
Assicurarsi di utilizzare la Vista schema.
Analizzare la colonna Informazioni strategiche. I suggerimenti a comparsa forniscono ulteriore contesto alla base delle informazioni strategiche. Per ulteriori spiegazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.
Interpretazione delle informazioni strategiche di un set di dati
La seguente tabella fornisce maggiori dettagli sulle informazioni strategiche che possono essere visualizzate nello schema.
Informazione strategica | Significato | Impatto sulla configurazione | Quando l'informazione strategica viene determinata | Riferimenti aggiuntivi |
---|---|---|---|---|
Costante | La colonna presenta lo stesso valore per tutte le righe. | La colonna non può essere utilizzata come funzione di destinazione o inclusa. | Prima e dopo l'esecuzione della versione | Cardinalità |
One-hot encoded | Il tipo di funzione è categorico e la colonna ha meno di 14 valori univoci. | Nessun effetto sulla configurazione. | Prima e dopo l'esecuzione della versione | Codifica categoriale |
Impatto codificato | Il tipo di funzione è categorico e la colonna ha 14 o più valori univoci. | Nessun effetto sulla configurazione. | Prima e dopo l'esecuzione della versione | Codifica categoriale |
Cardinalità elevata | La colonna ha troppi valori unici e può influire negativamente sulle prestazioni del modello se utilizzata come funzione. | La colonna non può essere utilizzata come target. Verrà esclusa automaticamente come funzione, ma potrà essere inclusa, se richiesto. | Prima e dopo l'esecuzione della versione | Cardinalità |
Dati di tipo sparse | La colonna ha troppi valori nulli. | La colonna non può essere utilizzata come funzione di destinazione o inclusa. | Prima e dopo l'esecuzione della versione | Imputazione di valori nulli |
Classe sottorappresentata | La colonna ha una classe con meno di 10 righe. | La colonna non può essere utilizzata come destinazione, ma può essere inclusa come funzione. | Prima e dopo l'esecuzione della versione | - |
<numero di> funzionalità progettate automaticamente | La colonna è la funzionalità padre che è possibile utilizzare per generare funzionalità progettate automaticamente. | Se la funzionalità padre è interpretata come funzionalità data, viene rimossa automaticamente dalla configurazione. Si consiglia di utilizzare invece le funzionalità data progettate automaticamente che è possibile generare da quest'ultima. È possibile sovrascrivere questa impostazione e includere questa funzionalità anziché le funzionalità progettate automaticamente. | Prima e dopo l'esecuzione della versione | Ingegneria automatica delle funzioni |
Funzionalità progettata automaticamente | La colonna è una funzionalità progettata automaticamente che può essere o è stata generata da una funzionalità data padre. Questa non era visualizzata nel set di dati originale. | Durante l'addestramento dell'esperimento, è possibile rimuovere una o più funzionalità progettate automaticamente. Se si modifica il tipo della funzionalità padre a categorico, tutte le funzionalità progettate automaticamente vengono rimosse. | Prima e dopo l'esecuzione della versione | Ingegneria automatica delle funzioni |
Impossibile elaborare come una data | La colonna può includere informazioni relative a data e ora, ma non può essere utilizzata per creare funzionalità data progettate automaticamente. | La funzione viene eliminata dalla configurazione. Se le funzioni progettate con ingengeria automatica sono state generate anteriormente dalla funzionalità padre, vengono rimosse dalle versioni future dell'esperimento. È ancora possibile utilizzare la funzione nell'esperimento, ma è necessario modificarne il tipo a categorico. | Dopo l'esecuzione della versione | Ingegneria delle funzionalità data |
Testo libero possibile | La colonna può essere disponibile per l'utilizzo come una funzione testo libero. | Il tipo di funzione testo libero viene assegnato alla colonna. È necessario eseguire una versione dell'esperimento per confermare se è possibile eseguire ulteriormente la funzione come testo libero. | Prima dell'esecuzione della versione | Gestione dei dati di testo libero |
Testo libero | La colonna è stata confermata come contenente testo libero. Non è possibile elaborarla come testo libero. | Non è richiesta alcuna configurazione aggiuntiva per la funzione. | Dopo l'esecuzione della versione | Gestione dei dati di testo libero |
Impossibile elaborare come testo libero | Dopo un ulteriore analisi, la colonna non può essere elaborata come testo libero. | Per la versione successiva dell'esperimento, è necessario deselezionare la funzione dalla configurazione. Se la funzione non ha una cardinalità elevata, in alternativa è possibile cambiare il tipo di funzione a categorico. | Dopo l'esecuzione della versione | Gestione dei dati di testo libero |
Perdita nella destinazione | Si sospetta che la funzione sia interessata da una perdita nella destinazione. In tal caso, questa include le informazioni sulla colonna della destinazione che si tenta di prevedere. Le funzioni con una perdita nella destinazione possono fornire un falso senso di sicurezza sulle prestazioni del modello. Nelle previsioni reali, possono determinare prestazioni molto negative da parte del modello. | La funzione non è stata utilizzata per addestrare il modello. | Dopo l'esecuzione della versione | Perdita di dati |
Importanza della permutazione bassa | La funzione non ha molta o nessuna influenza sulle previsioni del modello. La rimozione di queste funzioni migliora le prestazioni del modello riducendo il rumore statistico. | La funzione non è stata utilizzata per addestrare il modello. | Dopo l'esecuzione della versione | Nozioni sull'importanza della permutazione |
Correlazione elevata | La funzione ha una correlazione elevata con una o molte altre funzioni nell'esperimento. L'inclusione di funzioni altamente correlate le une con le altre diminuiscono le prestazioni del modello. | La funzione non è stata utilizzata per addestrare il modello. La funzione alla quale è altamente correlata non è stata eliminata a causa dell'elevata correlazione, ma potrebbe essere stata eliminata per un'altra ragione, come la bassa importanza della permutazione. | Dopo l'esecuzione della versione | Correlazione |