Visualizzazione degli insight sui dati di addestramento | Guida di Qlik Cloud
Vai al contenuto principale Passa a contenuto complementare

Visualizzazione degli insight sui dati di addestramento

Man mano che si aggiungono i dati di addestramento e si eseguono le versioni dell'addestramento, è possibile accedere agli insight su come vengono gestiti i dati. Gli Insight forniscono informazioni sul target e sulle funzionalità nell'esperimento, come le funzionalità che sono state scartate, non sono disponibili o verranno codificate con un'elaborazione speciale.

La colonna Insight si trova nella Vista schema Schema quando si è nella scheda Configurazione/Dati di addestramento. Gli insight abbreviati sono disponibili anche nella Vista dati Tabella. Gli insight vengono creati singolarmente per ciascun modello addestrato all'interno dell'esperimento.

Colonna Insight nella Vista schema

Insight mostrati per ciascuna colonna di funzionalità nel dataset di addestramento

Gli insight vengono generati:

  • Dopo aver aggiunto o modificato i dati di addestramento, ma prima di aver eseguito qualsiasi versione dell'esperimento.

  • Dopo l'esecuzione di ciascuna versione dell'esperimento. Viene creato un set separato di insight per ciascun modello addestrato.

Gli insight potrebbero essere diversi prima e dopo l'esecuzione di una versione. Questo avviene perché all'inizio dell'addestramento, Qlik Predict è in grado di pre-elaborare i dati e diagnosticare ulteriormente eventuali problemi con i dati. Per ulteriori informazioni, vedere Preparazione e trasformazione automatica dei dati.

Visualizzazione degli insight prima dell'addestramento

Prima di eseguire una versione dell'esperimento, è possibile analizzare gli Insight per vedere come vengono interpretati i dati di addestramento correnti. Questi insight potrebbero cambiare dopo l'esecuzione della versione.

  1. In un esperimento, assicurarsi di aver aggiunto i dati di addestramento che si desidera utilizzare per la versione dell'esperimento.

  2. Aprire la scheda Configurazione/Dati di addestramento.

  3. Assicurarsi di essere in Righe della tabella Vista schema.

  4. Analizzare la colonna Insight. Le descrizioni comandi forniscono un contesto aggiuntivo alla base degli insight. Per ulteriori spiegazioni sul significato di ciascun insight, vedere Interpretazione degli insight del dataset.

Visualizzazione degli insight per un modello

Al termine dell'addestramento dei modelli per una versione dell'esperimento, selezionare un modello ed esaminare come sono stati gestiti i dati.

  1. Eseguire una versione dell'esperimento, quindi aprire la scheda Configurazione/Dati di addestramento.

  2. Selezionare un modello dall'elenco a discesa nella barra degli strumenti.

  3. Assicurarsi di essere in Righe della tabella Vista schema.

  4. Analizzare la colonna Insight. Le descrizioni comandi forniscono un contesto aggiuntivo alla base degli insight. Per ulteriori spiegazioni sul significato di ciascun insight, vedere Interpretazione degli insight del dataset.

Interpretazione degli insight del dataset

Le tabelle seguenti forniscono maggiori dettagli sui possibili insight che potrebbero essere visualizzati nello schema.

Insight generali

Insight del dataset — Generali
Insight Significato Impatto sulla configurazione Quando viene determinato l'insight Riferimenti aggiuntivi
Costante La colonna ha lo stesso valore per tutte le righe. La colonna non può essere utilizzata come target o funzionalità inclusa. Prima e dopo l'esecuzione della versione Cardinalità
Codificato One-hot Il tipo di funzionalità è categorico e la colonna ha meno di 14 valori univoci. Nessun effetto sulla configurazione. Prima e dopo l'esecuzione della versione Codifica di categoria
Codificato Impact Il tipo di funzionalità è categorico e la colonna ha 14 o più valori univoci. Nessun effetto sulla configurazione. Prima e dopo l'esecuzione della versione Codifica di categoria
Cardinalità elevata La colonna ha troppi valori univoci e può influire negativamente sulle prestazioni del modello se utilizzata come funzionalità. La colonna non può essere utilizzata come target. Verrà esclusa automaticamente come funzionalità, ma può comunque essere inclusa se necessario. Prima e dopo l'esecuzione della versione Cardinalità
Dati sparsi La colonna ha troppi valori nulli. La colonna non può essere utilizzata come target o funzionalità inclusa. Prima e dopo l'esecuzione della versione Imputazione di null
Classe sottorappresentata La colonna ha una classe con meno di 10 righe. La colonna non può essere utilizzata como target, ma può essere inclusa come funzionalità. Prima e dopo l'esecuzione della versione -
Trasformazione funzionalità non riuscita Il tipo di funzionalità di una funzionalità è stato modificato manualmente rispetto al tipo predefinito. Con questa configurazione si è verificato un errore. La versione dell'esperimento non può essere eseguita correttamente con questa trasformazione della funzionalità. Ripristinare il tipo di funzionalità della funzionalità al valore precedente o escludere la funzionalità dall'addestramento. Dopo l'esecuzione della versione Modifica dei tipi di funzionalità

Insight sull'ingegneria delle funzionalità automatica

Insight del dataset — Ingegneria delle funzionalità automatica
Insight Significato Impatto sulla configurazione Quando viene determinato l'insight Riferimenti aggiuntivi
<numero di> funzionalità generate automaticamente La colonna è la funzionalità principale che può essere utilizzata per generare funzionalità generate automaticamente. Se questa funzionalità principale viene interpretata come una funzionalità di data, viene rimossa automaticamente dalla configurazione. Si consiglia invece di utilizzare le funzionalità di data generate automaticamente che possono essere generate da essa. È possibile ignorare questa impostazione e includere la funzionalità anziché le funzionalità generate automaticamente. Prima e dopo l'esecuzione della versione Ingegneria automatica delle funzionalità
Funzionalità generata automaticamente La colonna è una funzionalità generata automaticamente che può essere, o è stata, generata da una funzionalità di data principale. Non era presente nel dataset originale. È possibile rimuovere una o più di queste funzionalità generate automaticamente durante l'addestramento dell'esperimento. Se si passa il tipo di funzionalità della funzionalità principale a categorico, tutte le funzionalità generate automaticamente verranno rimosse. Prima e dopo l'esecuzione della versione Ingegneria automatica delle funzionalità
Impossibile elaborare come data La colonna potrebbe includere informazioni su data e ora, ma non è stato possibile utilizzarla per creare funzionalità di data generate automaticamente. La funzionalità viene scartata dalla configurazione. Se in precedenza erano state generate funzionalità generate automaticamente da questa funzionalità principale, verranno rimosse dalle versioni future dell'esperimento. È comunque possibile utilizzare la funzionalità nell'esperimento, ma è necessario impostare il relativo tipo di funzionalità su categorico. Dopo l'esecuzione della versione Ingegneria automatica delle funzionalità
Possibile testo libero La colonna potrebbe essere disponibile per l'uso come funzionalità di testo libero. Il tipo di funzionalità di testo libero viene assegnato alla colonna. È necessario eseguire una versione dell'esperimento per confermare se la funzionalità può essere elaborata come testo libero. Prima dell'esecuzione della versione Ingegneria automatica delle funzionalità
Testo libero È stato confermato che la colonna contiene testo libero. Può essere elaborata come testo libero. Non sono richieste configurazioni aggiuntive per la funzionalità. Dopo l'esecuzione della versione Ingegneria automatica delle funzionalità
Impossibile elaborare come testo libero A seguito di un'ulteriore analisi, la colonna non può essere elaborata come testo libero. È necessario deselezionare la funzionalità dalla configurazione per la versione successiva dell'esperimento. Se la funzionalità non ha una cardinalità elevata, in alternativa è possibile modificare il tipo di funzionalità in categorico. Dopo l'esecuzione della versione Ingegneria automatica delle funzionalità

Insight sull'ottimizzazione intelligente del modello

Insight del dataset — Ottimizzazione intelligente del modello
Insight Significato Impatto sulla configurazione Quando viene determinato l'insight Riferimenti aggiuntivi
Target leakage Si sospetta che la funzionalità sia interessata da target leakage. In tal caso, include informazioni sulla colonna target che si sta tentando di prevedere. Le funzionalità con target leakage possono dare un falso senso di sicurezza sulle prestazioni del modello. Nelle previsioni reali, causano prestazioni molto scarse del modello. La funzionalità non è stata utilizzata per addestrare il modello. Dopo l'esecuzione della versione Perdita di dati
Bassa importanza della permutazione La funzionalità ha un'influenza minima, se non nulla, sulle previsioni del modello. La rimozione di queste funzionalità migliora le prestazioni del modello riducendo il rumore statistico. La funzionalità non è stata utilizzata per addestrare il modello. Dopo l'esecuzione della versione Nozioni sull'importanza della permutazione
Altamente correlata La funzionalità è altamente correlata con una o più altre funzionalità nell'esperimento. La presenza di funzionalità altamente correlate tra loro riduce le prestazioni del modello. La funzionalità non è stata utilizzata per addestrare il modello. La funzionalità con cui è altamente correlata non è stata scartata a causa dell'elevata correlazione, ma potrebbe essere stata scartata per un altro motivo, come una bassa importanza della permutazione. Dopo l'esecuzione della versione Correlazione

Insight sulle previsioni delle serie temporali

Insight del dataset — Previsioni delle serie temporali
Insight Significato Impatto sulla configurazione Quando viene determinato l'insight Riferimenti aggiuntivi
Possibile indice data La funzionalità può eventualmente essere utilizzata come indice data per l'esperimento sulle serie temporali.

Se utilizzati come indice data delle serie temporali, i dati nella colonna possono influire su aspetti della configurazione delle serie temporali, ad esempio l'orizzonte temporale futuro per la previsione.

I valori nell'indice data devono aumentare con ogni riga o valore di gruppo univoco a un intervallo di tempo fisso.

Prima dell'esecuzione della versione

Utilizzo degli esperimenti sulle serie temporali

Indice data

Insight sul rilevamento dei bias

Insight del dataset — Rilevamento dei bias
Insight Significato Impatto sulla configurazione Quando viene determinato l'insight Riferimenti aggiuntivi
Rilevato bias dei dati Rispetto ai valori nella colonna target, alcuni gruppi (valori) sono sottorappresentati rispetto ad altri. Analizzare i risultati del rilevamento dei bias per determinare i passaggi successivi, che possono includere l'esclusione della funzionalità, la modifica del dataset o la creazione di un nuovo esperimento con un framework rivisto. Dopo l'esecuzione della versione Rilevamento dei bias nei modelli di machine learning
Rilevato bias di rappresentazione È stato rilevato un bias nel modo in cui il modello addestrato utilizza i dati della funzionalità per creare previsioni. Analizzare i risultati del rilevamento dei bias per determinare i passaggi successivi, che possono includere l'esclusione della funzionalità, la modifica del dataset o la creazione di un nuovo esperimento con un framework rivisto. Dopo l'esecuzione della versione Rilevamento dei bias nei modelli di machine learning

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!