Vai al contenuto principale Passa a contenuto complementare

Esecuzione di analisi dettagliate dei modelli

Nella scheda Analizza di un esperimento, è possibile concentrarsi su un unico modello per un'analisi approfondita delle prestazioni predittive. Le analisi dettagliate vengono eseguite utilizzando le analisi integrate.

Al termine dell'addestramento, selezionare un modello. Quindi, aprire la scheda Analizza per visualizzare maggiori informazioni sull'accuratezza delle previsioni del modello, sugli elementi che influenzano le tendenze nei dati e altre informazioni. I dati mostrati nella scheda Analizza si basano sulle previsioni generate dal modello rispetto ai dati di controllo automatico.

Scheda Analizza in un esperimento di ML

Grafico di riepilogo dell'addestramento per il modello più performante, che mostra le funzioni scartate a causa di una perdita di dati, una correlazione elevata o una bassa importanza di permutazione

Alcuni dei vantaggi principali dell'analisi dettagliata dei modelli includono i seguenti elementi:

  • Interfaccia interattiva dove è possibile affinare e personalizzare i dati della visualizzazione in base alle esigenze.

  • Un esame più vicino delle previsioni realizzate in base ai dati di controllo automatico, oltre alle statistiche dell'importanza delle funzioni.

Flusso di lavoro di analisi

Per una comprensione completa dei risultati dell'addestramento del modello, si consiglia di completare un'analisi rapida, quindi di procedere con le opzioni aggiuntive nelle schede Confronta e Analizza. L'analisi rapida fornisce un Riepilogo addestramento modello che mostra le funzioni che sono state eliminate durante il processo di ottimizzazione intelligente, e fornisce inoltre un numero di visualizzazioni generate automaticamente per un consumo rapido. Le schede Confronta e Analizza non mostrano il Riepilogo addestramento modello, ma consentono di eseguire il drill-down nelle metriche del modello per una migliore comprensione della qualità dei modelli.

Per ulteriori informazioni sulle altre opzioni di analisi vedere:

Nozioni sui concetti

Può essere utile avere una comprensione basilare dei concetti alla base dell'analisi dei modelli prima di iniziare a valutarli. Per ulteriori informazioni, vedere Nozioni sui concetti per la verifica dei modelli.

Impatto delle impostazioni dell'ottimizzazione sull'analisi

L'esperienza dell'analisi può essere leggermente differente, dipendendo se si utilizza l'ottimizzazione intelligente dei modelli o meno. L'ottimizzazione Intelligente dei modelli è attiva per impostazione predefinita per i nuovi esperimenti.

Analisi di modelli addestrati con l'ottimizzazione intelligente

Per impostazione predefinita, i nuovi esperimenti vengono eseguiti con l'ottimizzazione intelligente dei modelli.

L'ottimizzazione intelligente dei modelli fornisce un processo di addestramento più affidabile che, idealmente, crea un modello pronto per la distribuzione con poche o nessuna modifica. La qualità delle prestazioni di questi modelli, quando sono distribuiti per i casi di utilizzo legati alla produzione, dipende in ogni caso dall'addestramento con set di dati di qualità elevata che includono funzioni e dati rilevanti.

Se la versione viene addestrata con l'ottimizzazione intelligente dei modelli, considerare quanto segue:

  • Ogni modello nella versione può avere una selezione di funzioni differente, a seconda della modalità in cui l'algoritmo analizza i dati.

  • Dalla scheda Modelli, leggere il Riepilogo addestramento modello per il modello prima di passare alle analisi specifiche. Il Riepilogo addestramento modello mostra una sintesi di come AutoML ha ottimizzato automaticamente il modello ripetendo la selezione delle funzioni e applicando trasformazioni avanzate.

Per ulteriori informazioni sull'ottimizzazione intelligente dei modelli, vedere Ottimizzazione intelligente del modello .

Analisi di modelli addestrati senza l'ottimizzazione intelligente

In alternativa, è possibile disattivare l'ottimizzazione intelligente dei modelli per la versione dell'addestramento. L'ottimizzazione manuale dei modelli può essere utile se è necessario esercitare un maggiore controllo sul processo di addestramento.

Se si utilizza l'ottimizzazione manuale, tutti i modelli nella versione avranno la stessa selezione di funzioni, quindi l'opzione Riepilogo addestramento modello non è necessaria.

Controllo della configurazione

Durante il processo di pre-elaborazione, alcune funzioni potrebbero essere escluse dall'addestramento. Questo in genere accade perché, con la progressione dell'addestramento, si dispone di un maggior numero di informazioni rispetto a prima dell'esecuzione della versione.

Dopo aver controllato il Riepilogo addestramento modello (opzione che viene mostrata con l'ottimizzazione intelligente), è possibile esaminare più approfonditamente la configurazione dell'esperimento in caso fosse necessario verificare queste ultime modifiche.

  1. Nell'esperimento, andare alla scheda Dati.

  2. Assicurarsi di utilizzare la Righe della tabella vista Schema.

  3. Utilizzare il menu a discesa nella barra degli strumenti per selezionare un modello dalla versione.

  4. Analizzare lo schema del modello. Potrebbe essere consigliabile concentrarsi sulle colonne Informazioni strategiche e Tipo di funzione per verificare se determinate funzioni sono state rimosse o se sono state trasformate in un tipo di funzione differente.

    Per esempio, è possibile che la funzione inizialmente contrassegnata come Testo libero possibile sia stata esclusa dopo l'esecuzione della versione.

    Per maggiori informazioni sul significato di ogni informazione strategica, vedere Interpretazione delle informazioni strategiche di un set di dati.

Notare che, se si esegue la versione con l'opzione di ottimizzazione intelligente predefinita, ogni modello nella versione potrebbe avere una diversa selezione di funzioni, a seguito dell'ottimizzazione automatica. Se la versione viene eseguita senza l'ottimizzazione intelligente, la selezione di funzioni rimarrà la stessa per tutti i modelli nella versione. Per ulteriori informazioni sull'ottimizzazione intelligente dei modelli, vedere Ottimizzazione intelligente del modello .

In base ai risultati riscontrati in questa configurazione, potrebbe essere necessario tornare alla fase di preparazione del set di dati per migliorare i dati delle funzioni.

Avvio di un'analisi dettagliata

È possibile avviare un'analisi dettagliata di un modello specifico in diversi modi:

  • Selezionare un modello nella scheda Dati o Modelli, fare clic su Menu a tre punti accanto al modello, quindi fare clic su Analizza Analizza.

  • Dopo aver selezionato un modello, fare clic sulla scheda Analizza.

  • Se si sta visualizzando un'analisi dettagliata per un modello, utilizzare il menu a discesa nella barra degli strumenti per selezionare un altro modello.

Il contenuto dell'analisi dipende dal tipo di modello, definito nella destinazione dell'esperimento. Metriche differenti sono disponibili per tipi di modelli diversi.

Nota informaticaI modelli addestrati con un rapporto di campionamento inferiore al 100% non possono essere aperti nella scheda Analizza.

Utilizzo delle analisi integrate

Utilizzare l'interfaccia interattiva per analizzare il modello utilizzando le analisi integrate.

Passaggio da un foglio all'altro

Il pannello Fogli consente di passare tra i fogli nell'analisi. Ogni foglio ha un obiettivo specifico. È possibile espandere o comprimere il pannello in base alle esigenze.

Esecuzione di selezioni

Utilizzare le selezioni per affinare i dati. È possibile selezionare funzioni ed eseguire il drill-down di valori e intervalli specifici. Ciò consente di completare un esame più approfondito se necessario. In alcuni casi, può essere necessario effettuare una o più selezioni per le visualizzazioni che si desidera mostrare. Fare clic sui valori dei dati nelle visualizzazioni e sulle caselle di filtro per effettuare le selezioni.

È possibile lavorare con le selezioni nei seguenti modi:

  • Selezionare i valori facendo clic sul contenuto, definendo gli intervalli e tramite tracciamento.

  • Cercare nei grafici per selezionare i valori.

  • Fare clic su un campo selezionato nella barra degli strumenti nella parte superiore dell'analisi incorporata. Ciò consente di cercare nelle selezioni esistenti, di bloccarle o sbloccarle e di modificarle ulteriormente.

  • Nella barra degli strumenti nella parte superiore dell'analisi incorporata, fare clic su Rimuovi per rimuovere una selezione. Cancellare tutte le selezioni facendo clic sull'icona Cancella selezioni.

  • Spostarsi avanti e indietro nelle selezioni facendo clic su Vai indietro nelle selezioni e Vai avanti nelle selezioni.

L'analisi contiene caselle di filtro per consentire di affinare più facilmente i dati. In una casella di filtro, fare clic sulla casella di selezione di un valore per effettuare una selezione. Se la casella di filtro contiene più caselle di riepilogo, fare clic su una di queste per espanderla ed effettuare le selezioni desiderate.

Esportazione dei dati nel catalogo

È possibile esportare nel catalogo i dati utilizzati nell'analisi dettagliata. I dati vengono esportati in uno spazio in Qlik Cloud Analytics. È possibile utilizzare i dati esportati per creare le proprie app Qlik Sense per analisi personalizzate.

Per ulteriori informazioni, vedere Esportazione dei dati di addestramento del modello.

Analisi dell'accuratezza della previsione

Come si interpreta l'accuratezza delle previsioni dipende dalla struttura del training set e dal caso di utilizzo di machine learning. Inoltre, l'interpretazione di queste visualizzazioni dipende dal tipo di modello. Ulteriori informazioni vengono fornite per ogni tipo di modello nelle sezioni qui sotto.

La sezione Previsioni del foglio Panoramica modello fornisce una panoramica aggregata del numero di previsioni che il modello realizza in modo corretto e incorretto.

Utilizzando il foglio Previsioni e distribuzione funzionalità, concentrarsi su una funzione specifica per analizzare la natura delle inesattezze della previsione. Selezionare una sola funzione nella casella di filtro nella parte sinistra del foglio. Per tutti i tipi di modello, questo foglio mostra le inesattezze della previsione e la distribuzione dei valori reali una accanto all'altra, per consentire di analizzare i dati in prospettiva.

Modelli di classificazione binaria

Analisi dell'intero modello

Nella sezione Previsioni del foglio Panoramica modello, sono visualizzati i dati non elaborati nella matrice di confusione. Questa include i valori veri e falsi positivi e quelli veri e falsi negativi. Questi valori sono presentati come totali statici, quindi non rispondono alle selezioni. Per maggiori informazioni sul significato di questi valori, vedere Matrice di confusione.

Visualizzazione della panoramica aggregata delle prestazioni di previsione nella scheda Analizza per un modello di classificazione binaria

La sezione della panoramica della previsione, che mostra i dettagli della matrice di confusione e le previsioni corrette a confronto con quelle incorrette

Analisi di sottogruppi di dati

Nel foglio Previsioni e distribuzione funzionalità, il grafico Previsione incorretta mostra una barra per ogni valore o intervallo possibile nella funzione, con l'altezza della barra che corrisponde al numero di previsioni incorrette create dal modello. Ogni colore nella barra corrisponde a ciascuno dei valori di destinazione effettivi. Selezionare un'unica funzione, oltre ai valori da qualsiasi altro campo desiderato, per visualizzare il modo in cui l'accuratezza della previsione cambia per differenti sottogruppi di dati.

Analisi delle inesattezze della previsione accanto alla distribuzione dei valori per una funzione selezionata. Questa immagine mostra la vista dell'analisi per un modello di classificazione binaria.

Foglio con un'unica funzione selezionata e due grafici: uno per le inesattezze della previsione per tutti i valori della funzione, e l'altro per la distribuzione dei valori reali della funzione

Modello di classificazione multiclasse

Analisi dell'intero modello

Nella sezione Previsioni del foglio Panoramica modello, viene visualizzato un grafico a barre per ogni valore di destinazione effettivo. L'altezza del colore di ogni colore di una barra corrisponde al numero di volte che una classe specifica viene inclusa nella previsione del modello. Oltre a questo grafico, la sezione Previsioni mostra anche una scomposizione delle previsioni corrette rispetto a quelle incorrette.

Visualizzazione della panoramica aggregata delle prestazioni di previsione nella scheda Analizza per un modello di classificazione multiclasse

La sezione della panoramica della previsione, che mostra i valori previsti rispetto a quelli effettivi, oltre alle previsioni corrette a confronto con quelle incorrette

Analisi di sottogruppi di dati

Nel foglio Previsioni e distribuzione funzionalità, il grafico Previsione incorretta mostra una barra per ogni valore o intervallo possibile nella funzione, con l'altezza della barra che corrisponde al numero di previsioni incorrette create dal modello. Ogni colore nella barra corrisponde a ciascuno dei valori di destinazione effettivi.

Analisi delle inesattezze della previsione accanto alla distribuzione dei valori per una funzione selezionata. Questa immagine mostra la vista dell'analisi per un modello di classificazione multiclasse.

Foglio con un'unica funzione selezionata e due grafici: uno per le inesattezze della previsione per tutti i valori della funzione, e l'altro per la distribuzione dei valori reali della funzione

Modelli di regressione

Per i modelli di regressione, è possibile visualizzare le seguenti informazioni sia a livello di modello che a livello di funzione:

  • Valore medio previsto per la destinazione

  • Valore di destinazione effettivo

  • Intervalli decimo e novantesimo percentile della previsione. Queste righe mostrano gli intervalli nei quali è possibile presumere che il modello preveda un modello. La riga del novantesimo percentile includerà sempre i valori più grandi.

  • Media assoluta di errore (MAE)

Per le visualizzazioni sia a livello di modello che specifiche per la funzione, analizzare le metriche insieme alla distribuzione del valore effettiva per la funzione.

Analisi delle inesattezze della previsione accanto alla distribuzione dei valori per una funzione selezionata. Questa immagine mostra la vista dell'analisi per un modello di regressione.

Foglio con un'unica funzione selezionata e due grafici: uno per le inesattezze della previsione per tutti i valori della funzione, e l'altro per la distribuzione dei valori reali della funzione

Analisi dell'importanza delle funzioni

Accesso a una panoramica

L'analisi dell'importanza della funzione fornisce un'indicazione di come ogni funzione influenza le previsioni rispetto alle altre funzioni.

La sezione Impatto funzionalità del foglio Panoramica modello fornisce una panoramica aggregata dei valori SHAP medi assoluti. Questo grafico sembra lo stesso del grafico dell'Importanza SHAP nella scheda Modelli. Il grafico si aggiorna in base alle selezioni effettuate. Quando si seleziona una sola funzione, è possibile eseguire il drill-down di valori e intervalli specifici per ulteriori dettagli.

Il confronto aggregato dei valori SHAP con una singola funzione selezionata

Grafico dell'analisi dell'importanza della funzione, in cui vengono confrontati i valori SHAP aggregati per intervalli di valore specifici

Analisi della distribuzione SHAP

È possibile anche aprire il foglio Impatto per funzionalità per ottenere una vista più completa dei valori per ogni valore o intervallo della funzione. I valori SHAP vengono presentati con la direzione, anziché i valori assoluti.

Questa analisi può aiutare a identificare modelli per coorti specifiche, oltre a individuare gli outlier nei dati. Effettuare selezioni di valori o intervalli nel grafico per filtrare i dati per un'analisi più granulare.

L'aspetto e il tipo di grafico dipende dal tipo di funzione selezionato.

Funzioni categoriali

Le funzioni categoriali sono visualizzate come un box plot. Il box plot consente di visualizzare la distribuzione di valori SHAP per ogni valore categoriale. Il box plot ha la seguente configurazione:

  • mostra la media dei valori SHAP.

  • Viene utilizzata la configurazione Standard (Tukey):

    • la casella per un valore viene definita dal primo quartile (limite inferiore) e dal terzo quartile (limite superiore).

    • La mediana è la riga orizzontale all'interno della casella.

  • I baffi superiori e inferiori corrispondo ai imiti superiore e inferiore per 1,5 scarti interquartile.

  • I valori outlier non sono visualizzati.

Box plot per l'analisi della distribuzione di un valore SHAP per una funzione categoriale

Grafico box plot per una funzione categoriale selezionata, che consente l'analisi della distribuzione di un valore SHAP

Funzioni numeriche

Per le funzioni numeriche, i valori SHAP sono visualizzati come un grafico a dispersione. Il grafico a dispersione ha la seguente configurazione:

  • Vengono visualizzati i valori SHAP per il campione selezionato.

  • L'aspetto e il funzionamento del grafico a dispersione dipendono dal numero di punti dati da visualizzare. Per i grafici con un numero basso di punti dati, sono visualizzate le bolle individuali. Per i grafici con un gran numero di punti dati, le bolle sono raccolte in blocchi, con i colori che indicano il numero di punti dati contenuti in ogni blocco.

Nel grafico a dispersione, effettuare selezioni di valori e intervalli specifici per un esame più preciso.

Grafico a dispersione per l'analisi della distribuzione di un valore SHAP per una funzione numerica

Grafico a dispersione per una funzione numerica selezionata, che consente l'analisi della distribuzione di un valore SHAP

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!