Vai al contenuto principale Passa a contenuto complementare

Esecuzione di analisi rapide dei modelli

Una volta completato l'addestramento dei modelli per una versione dell'esperimento, eseguire l'analisi delle metriche più importanti del modello e accedere a un riepilogo della modalità in cui i dati di addestramento sono stati elaborati. L'analisi rapida viene eseguita nelle schede Dati e Modelli.

Utilizzare la scheda Modelli per una panoramica dei risultati dell'addestramento. Quando si esegue una versione dell'esperimento, si passa automaticamente alla scheda Modelli. Si consiglia anche di andare nuovamente la scheda Dati per esaminare il modo in cui i dati vengono pre-elaborati e gestiti.

La scheda Modelli per l'esperimento di una classificazione binaria

La scheda 'Modelli' in un esperimento di ML

Sono disponibili opzioni aggiuntive per l'ulteriore valutazione dei modelli. È possibile confrontare ulteriori metriche e iperparametri tra i modelli o concentrarsi su un modello specifico per l'analisi granulare. Queste opzioni sono disponibili nelle schede Confronta e Analizza. Per ulteriori informazioni, vedere:

Nozioni sui concetti

Può essere utile avere una comprensione basilare dei concetti alla base dell'analisi dei modelli prima di iniziare a valutarli. Per ulteriori informazioni, vedere Nozioni sui concetti per la verifica dei modelli.

Impatto delle impostazioni dell'ottimizzazione sulle analisi

Per gli esperimenti di classificazione e regressione, l'esperienza dell'analisi può essere leggermente differente, dipendendo se si utilizza l'ottimizzazione intelligente dei modelli o meno. L'ottimizzazione Intelligente dei modelli è attiva per impostazione predefinita per i nuovi esperimenti di classificazione e regressione.

Analisi di modelli addestrati con l'ottimizzazione intelligente

Per impostazione predefinita, i nuovi esperimenti di classificazione e regressione vengono eseguiti con l'ottimizzazione intelligente dei modelli.

Nota informaticaL'ottimizzazione intelligente del modello non è applicabile a esperimenti di serie temporali.

L'ottimizzazione intelligente dei modelli fornisce un processo di addestramento più affidabile che, idealmente, crea un modello pronto per la distribuzione con poche o nessuna modifica. La qualità delle prestazioni di questi modelli, quando sono distribuiti per i casi di utilizzo legati alla produzione, dipende in ogni caso dall'addestramento con set di dati di qualità elevata che includono funzioni e dati rilevanti.

Se la versione viene addestrata con l'ottimizzazione intelligente dei modelli, considerare quanto segue:

  • Ogni modello nella versione può avere una selezione di funzioni differente, a seconda della modalità in cui l'algoritmo analizza i dati.

  • Dalla scheda Modelli, leggere il Riepilogo addestramento modello per il modello prima di passare alle analisi specifiche. Il Riepilogo addestramento modello mostra una sintesi di come Qlik Predict ha ottimizzato automaticamente il modello ripetendo la selezione delle funzioni e applicando trasformazioni avanzate.

Per ulteriori informazioni sull'ottimizzazione intelligente dei modelli, vedere Ottimizzazione intelligente del modello .

Analisi di modelli addestrati senza l'ottimizzazione intelligente

In alternativa, è possibile disattivare l'ottimizzazione intelligente dei modelli per la versione dell'addestramento. L'ottimizzazione manuale dei modelli può essere utile se è necessario esercitare un maggiore controllo sul processo di addestramento.

Se si utilizza l'ottimizzazione manuale, tutti i modelli nella versione avranno la stessa selezione di funzioni, quindi l'opzione Riepilogo addestramento modello non è necessaria.

Controllo della configurazione

Durante il processo di pre-elaborazione, alcune funzioni potrebbero essere escluse dall'addestramento. Questo in genere accade perché, con la progressione dell'addestramento, si dispone di un maggior numero di informazioni rispetto a prima dell'esecuzione della versione.

Dopo aver controllato il Riepilogo addestramento modello (opzione che viene mostrata con l'ottimizzazione intelligente), è possibile esaminare più approfonditamente la configurazione dell'esperimento in caso fosse necessario verificare queste ultime modifiche.

  1. Nell'esperimento, andare alla scheda Dati.

  2. Assicurarsi di utilizzare la Righe della tabella vista Schema.

  3. Utilizzare il menu a discesa nella barra degli strumenti per selezionare un modello dalla versione.

  4. Analizzare lo schema del modello. Potrebbe essere consigliabile concentrarsi sulle colonne Informazioni strategiche e Tipo di funzione per verificare se determinate funzioni sono state rimosse o se sono state trasformate in un tipo di funzione differente.

    Per esempio, è possibile che la funzione inizialmente contrassegnata come Testo libero possibile sia stata esclusa dopo l'esecuzione della versione.

    Per maggiori informazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.

Notare che, se si esegue la versione con l'opzione di ottimizzazione intelligente predefinita, ogni modello nella versione potrebbe avere una diversa selezione di funzioni, a seguito dell'ottimizzazione automatica. Se la versione viene eseguita senza l'ottimizzazione intelligente, la selezione di funzioni rimarrà la stessa per tutti i modelli nella versione. Per ulteriori informazioni sull'ottimizzazione intelligente dei modelli, vedere Ottimizzazione intelligente del modello .

In base ai risultati riscontrati in questa configurazione, potrebbe essere necessario tornare alla fase di preparazione del set di dati per migliorare i dati delle funzioni.

Se si disattiva l'ottimizzazione intelligente del modello, l'opzione Riepilogo addestramento modello non verrà visualizzata per l'analisi rapida. Inoltre, tutti i modelli da una versione dell'esperimento utilizzeranno le stesse combinazioni di funzioni, mentre i modelli addestrati con l'ottimizzazione intelligente possono avere combinazioni di funzioni differenti.

Selezione di un modello

Una volta completato l'addestramento, il modello più consigliato viene selezionato automaticamente per l'analisi e vengono visualizzate le metriche per quel modello.

Visualizzare i diversi modelli per confrontare le differenze relative a metriche e configurazione. Se si utilizza la scheda Dati, utilizzare il menu a comparsa nella barra degli strumenti per selezionare un modello. Se si utilizza la scheda Modelli, fare clic su un modello nella tabella Metriche modello per selezionarlo.

Analisi del riepilogo dell'addestramento

Ottimizzazione intelligente del modello

Per i modelli addestrati con l'ottimizzazione intelligente del modello, l'opzione Riepilogo addestramento modello delinea le informazioni chiave sulle fasi dell'addestramento. Il riepilogo include i seguenti dati:

  • Il rapporto di campionamento per quel modello.

  • Un elenco delle funzioni eliminate automaticamente come risultato dell'ottimizzazione intelligente. L'elenco varia a seconda del modello selezionato.

  • Un riepilogo di tutte le trasformazioni avanzate applicate durante l'addestramento del modello.

  • Un collegamento al training set.

L'opzione Riepilogo addestramento modello non viene visualizzata si sceglie di ottimizzare i modelli manualmente.

Per ulteriori informazioni sull'ottimizzazione intelligente dei modelli, vedere Ottimizzazione intelligente del modello .

Il grafico Riepilogo addestramento modello per un modello, mostrato nella scheda Modelli

Grafico di riepilogo dell'addestramento per un modello addestrato con l'ottimizzazione intelligente.

Il riepilogo dell'addestramento del modello non elenca le funzioni che sono state eliminate durante la fase di pre-elaborazione. Per verificare queste informazioni, tornare alla scheda Dati dell'esperimento. Vedere: Controllo della configurazione

  1. Nell'esperimento, andare alla scheda Modelli.

  2. Confermare di aver selezionato il modello che si desidera analizzare.

  3. Nella sezione Informazioni strategiche modello nella parte destra del modello, esaminare Riepilogo addestramento modello.

Esperimenti di serie temporali

Negli esperimenti di serie temporali, il Riepilogo dell'addestramento del modello mostra le impostazioni di configurazione per il problema di previsione delle serie temporali, come definite dal set di dati e dalle impostazioni di addestramento. Alcuni di questi dettagli sono stati stimati prima dell'inizio dell'addestramento, ma ora sono confermati con certezza dopo che l'intero set di dati è stato analizzato. È possibile visualizzare i seguenti elementi:

Riepilogo addestramento modello grafico per un modello in un esperimento di serie temporali

Grafico di riepilogo dell'addestramento per un modello di serie temporali, che mostra il riepilogo delle serie temporali

Analisi della tabella Metriche modello

La tabella Metriche modello fornisce informazioni di alto livello sulle prestazioni di ogni modello nell'esperimento. I modelli consigliati da questo elenco sono presentati sopra la tabella.

Tabella Metriche modello con i modelli e i filtri consigliati

La tabella "Metriche modello" in un esperimento di ML, con i modelli migliori presentati come raccomandazioni

La tabella mostra i seguenti elementi:

  • Se il modello è un migliore rispetto ai tipi di modello migliori. Vedere: Individuazione dei modelli migliori

  • Il nome di ogni modello (è possibile modificare questa voce per comodità. Vedere: Modifica dei dettagli del modello)

  • L'algoritmo utilizzato per addestrare il modello

  • Metriche chiave relative alle prestazioni del modello. È possibile passare tra i seguenti elementi:

    • Metriche comuni per valutare il potenziale predittivo, in base al tipo di modello. Per i modelli di classificazione binaria è F1. Per i modelli di classificazione multiclasse è F1 Macro. Per i modelli di regressione, è R2.

    • Velocità di previsione.

    • Accuratezza. Per i modelli di classificazione, questa è la metrica denominata accuratezza. Per i modelli di regressione, questo è il MAE (errore assoluto medio).

Individuazione dei modelli migliori

I modelli migliori e più performanti vengono determinati in base ai filtri applicati. Sono presentati come raccomandazioni sopra la tabella delle metriche del modello e sono anche evidenziati all'interno della tabella.

Il Modello migliore è selezionato per impostazione predefinita. Questo modello è contrassegnato dall'icona Trofeo. Il modello migliore viene determinato in base a un calcolo equilibrato che tiene conto sia dell'accuratezza che della velocità di previsione.

A seconda del caso d'uso, potrebbe anche essere utile analizzare individualmente specifici marcatori di prestazioni. Altri modelli con le migliori prestazioni sono evidenziati con i seguenti indicatori:

  • Destinazione Più preciso: il modello mostra la massima accuratezza in base alle metriche di punteggio applicabili per il tipo di problema.

  • Fulmine Modello più veloce: il modello fornisce la velocità di previsione più elevata. Si tiene conto anche dell'accuratezza.

È possibile anche selezionare i modelli più performanti direttamente dalle raccomandazioni sopra la tabella Metriche modello.

Per una panoramica completa su come viene determinato ogni tipo di modello consigliato, consultare Selezione del modello migliore per i propri casi d'uso.

Filtraggio dei modelli nella tabella

È possibile filtrare la tabella Metriche in modo da visualizzare solamente i modelli che si desidera confrontare.

Sono disponibili i seguenti filtri che è possibile combinare in base alle necessità:

  • Versione: selezionare una o più versioni dell'esperimento.

  • Algoritmo: selezionare uno o più algoritmi.

  • Campionamento del 100%: questo filtro viene applicato per impostazione predefinita. Se si desidera, è possibile rimuoverlo. Questo filtro mostra i modelli che hanno utilizzato l'intero training set per completare l'addestramento e il processo di convalida incrociata. Filtro disponibile in Più filtri modello.

  • Distribuito: mostra i modelli distribuiti nelle distribuzioni di ML. Filtro disponibile in Più filtri modello.

Dopo aver applicato i filtri desiderati, i modelli più performanti vengono automaticamente ricalcolati in base alle voci filtrate. I modelli consigliati vengono quindi aggiornati.

Come interpretare le visualizzazioni sull'importanza delle funzioni

Nella scheda Modelli, scorrere verso il basso per vedere le visualizzazioni sull'importanza delle funzioni. Queste sono Importanza della permutazione e Importanza SHAP.

Nota informaticaLe visualizzazioni dell'importanza delle feature non vengono mostrate per i modelli di serie temporali.

Visualizzazione sull'importanza delle funzioni nella scheda Modelli

Grafici Importanza della permutazione e Importanza SHAP per l'analisi rapida del modello

Grafico Importanza della permutazione

Il grafico Importanza della permutazione mostra l'importanza di ogni funzione per le prestazioni di previsione generali del modello. I valori visualizzati nel grafico Importanza della permutazione possono aiutare a comprendere come affinare i modelli.

Le informazioni strategiche generali che è possibile ricavare analizzando questo grafico includono:

  • Se una funzione consuma quasi tutta l'importanza, può indicare una perdita nella destinazione ed è necessario rimuoverla. Se la causa è dovuta a problemi legati alla qualità dei dati, sarà anche necessario correggerli.

    Perdita di dati

  • Alcune funzioni potrebbero avere un impatto minimo o inesistente sulle previsioni del modello. Le funzioni con importanza della permutazione estremamente bassa possono essere considerate come rumore statistico e dovrebbero essere rimosse.

 Se si utilizza l'ottimizzazione intelligente del modello per addestrare la versione, alcuni dei problemi comuni descritti sopra potrebbero essere risolti automaticamente eliminando le funzioni.

Per maggiori informazioni sull'importanza della permutazione, vedere Nozioni sull'importanza della permutazione.

Grafico Importanza SHAP

Il grafico Importanza SHAP fornisce un altro modo per analizzare l'influenza di ogni funzione nell'esperimento ha sulle previsioni di ogni modello. Il grafico può fornire informazioni tempestive su quali funzioni sono importanti o se è necessario riconfigurare l'addestramento. Per ulteriori informazioni, vedere Nozioni sull'importanza SHAP nell'addestramento dell'esperimento.

Interpretazione delle visualizzazioni sul punteggio dei modelli

Per alcuni tipi di modello, sono disponibili visualizzazioni aggiuntive per mostrare una panoramica di quanto bene il modello si comporta.

Classificazione binaria

Se l'esperimento è un problema di classificazione binaria, viene generata automaticamente una serie di visualizzazioni per l'utilizzo rapido. Queste visualizzazioni offrono maggiori informazioni dettagliate sulla qualità delle previsioni generate dal modello per le classi positive e negative.

Per ulteriori informazioni sull'analisi dei modelli con queste visualizzazioni, vedere Valutazione dei modelli di classificazione binaria.

Matrice di confusione

Il grafico Matrice di confusione mostra l'accuratezza delle previsioni create dal modello. Le previsioni vengono eseguite sui dati di controllo automatico.

Matrice di confusione

Curva ROC

Il grafico Curva ROC descrive la qualità delle previsioni generate dal modello per le classi positive quando il risultato effettivo è positivo.

Per un'indicazione sull'aspetto ideale di una curva ROC, vedere AUC e curva ROC.

Serie temporale

Per i modelli di serie temporali, il grafico Errore di previsione nella finestra di previsione viene generato automaticamente per fornire informazioni sull'accuratezza della previsione. È possibile visualizzare il tasso di errore di previsione per ogni passo temporale nella finestra di previsione. I tassi di errore sono suddivisi in cinquantesimo, decimo e novantesimo percentile.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!