Nozioni sull'importanza SHAP nell'addestramento dell'esperimento

L'importanza SHAP offre informazioni strategiche sulle previsioni create dagli esperimenti. Può aiutare a capire quali sono le funzioni più importanti per la previsione.

I valori SHAP rappresentano il contributo di ciascuna funzione al valore previsto della destinazione, date tutte le altre funzioni di quella riga.

Dopo aver addestrato una versione dell'esperimento, selezionare un modello. Il grafico importanza SHAP nella scheda Modelli sotto la tabella visualizza i dati SHAP dalle previsioni del modello create utilizzando i dati di controllo (test).

Questo argomento della guida illustra l'importanza SHAP nell'addestramento dell'esperimento Per informazioni sui set di dati sull'importanza SHAP generati durante una previsione, vedere Generazione di set di dati SHAP durante le previsioni.

Panoramica

L'importanza SHAP è misurata a livello di riga. Rappresenta il modo in cui una funzione influenza la previsione di una singola riga rispetto alle altre funzioni di quella riga e al risultato medio del set di dati. Il valore ha sia una direzione che una magnitudine, ma per l'addestramento del modello, l'importanza SHAP è rappresentata in forma di valore assoluto.

Nel grafico dell'importanza SHAP, i valori a livello di riga sono aggregati. Ciò consente di comprendere l'influenza delle funzioni all'interno di sottoinsiemi di dati.

Esperimenti di classificazione binaria e regressione

In un esperimento di classificazione binaria o regressione, il grafico di importanza SHAP per ogni versione del modello è un grafico a barre che visualizza il valore SHAP assoluto medio per ogni funzione nell'esperimento. Il grafico importanza SHAP è ordinato dal valore più alto a quello più basso. Il grafico indica quali funzioni esercitano la maggiore e minore influenza sull'esito previsto della destinazione, indipendentemente dall'esito determinato.

Fare clic per visualizzare a dimensioni complete — Grafico di importanza SHAP mostrato durante il training di un modello di classificazione binario

Esperimenti di classificazione multiclasse

In un esperimento di classificazione multiclasse, sono disponibili più opzioni per la presentazione del grafico di importanza SHAP. Sono disponibili le opzioni seguenti:

Funzione SHAP presentata come un totale
Valori funzione SHAP separati per classe
Grafici di importanza SHAP con un'unica classe

Funzione SHAP presentata come un totale

Per impostazione predefinita, il grafico di importanza SHAP sarà configurato con l'impostazione Tutte le classi: funzione SHAP media.

Questa configurazione mostra l'importanza SHAP di ogni funzione, indipendentemente dall'esito previsto della destinazione. Le funzioni nel grafico sono ordinate per il valore SHAP assoluto medio totale e non sono separate per classe.

Valori funzione SHAP separati per classe

Per visualizzare quanta influenza ogni funzione ha sull'esito della destinazione come un valore di ogni classe nell'esperimento, selezionare l'impostazione Funzione SHAP per classe. È possibile impostare la configurazione con il valore Raggruppato o )In pila. I valori SHAP assoluti medi per ogni classe nell'esperimento sono presentati con colori per consentire il confronto per classe.

Ad esempio, supponiamo che un campo di destinazione nell'esperimento abbia quattro classi possibili o esiti (Piano viola, Piano verde, Piano blu o Piano rosso). La barra multi-colore per ogni funzione scompone la l'entità dell'influenza che la funzione ha esercitato su ciascuno dei quattro esiti possibili dell'esperimento. Se si prende in esame la lunghezza totale della barra, si visualizza l'influenza totale che la funzione ha esercitato sulla previsione della destinazione, indipendentemente dell'esito previsto.

Grafici di importanza SHAP con un'unica classe

Si dispone anche di un'opzione per visualizzare un grafico di importanza SHAP per ciascuno degli esiti possibili della previsione di destinazione. Vengono visualizzati i valori SHAP assoluti medi per gli esiti previsti di una singola classe.

Ad esempio, se la destinazione del proprio esperimento ha quattro esiti possibili, è possibile visualizzare quattro grafici separati che analizzano nel dettaglio le funzioni con maggiore impatto per le previsioni per ognuno dei quattro esiti possibili.

Calcolo di valori SHAP

I valori SHAP vengono calcolati per una vasta serie di algoritmi. L'importanza SHAP è calcolata con due metodi distinti:

Tree SHAP: un metodo veloce e preciso per stimare i valori SHAP per i modelli ad albero.
Linear SHAP: un metodo per calcolare i valori SHAP per i modelli lineari.

Algoritmi disponibili per tipi di modello e metodo di calcolo SHAP
Algoritmo	Tipi di modelli supportati	Metodo di calcolo SHAP
Classificazione Random Forest	Classificazione binaria, classificazione multiclasse	Tree SHAP
Classificazione XGBoost	Classificazione binaria, classificazione multiclasse	Tree SHAP
Classificazione LightGBM	Classificazione binaria, classificazione multiclasse	Tree SHAP
Classificazione CatBoost	Classificazione binaria, classificazione multiclasse	Tree SHAP
Regressione logistica	Classificazione binaria, classificazione multiclasse	Linear SHAP
Regressione LASSO	Classificazione binaria, classificazione multiclasse	Linear SHAP
Regressione Elastic Net	Classificazione binaria, classificazione multiclasse	Linear SHAP
Bayesiano ingenuo gaussiano	Classificazione binaria, classificazione multiclasse	SHAP non calcolato
Regressione CatBoost	Regressione	Tree SHAP
Regressione LightGBM	Regressione	Tree SHAP
Regressione lineare	Regressione	Linear SHAP
Regressione Random Forest	Regressione	Tree SHAP
Regressione SGD	Regressione	Linear SHAP
Regressione XGBoost	Regressione	Tree SHAP

Analisi dei fattori chiave

È possibile creare analisi dei fattori chiave direttamente in un'app Qlik Sense per confrontare l'importanza di fattori particolari per determinare i dati osservati per un'azienda particolare o per le metriche delle prestazioni. L'analisi dei fattori chiave viene effettuata calcolando i valori SHAP a livello di riga per ogni fattore preso in considerazione e visualizzandoli in forma aggregata. Questa fornisce una visualizzazione di alto livello delle tendenze e dei comportamenti alla base dei dati nelle app. È possibile utilizzare i risultati delle analisi dei fattori chiave per ottimizzare l'alfabetizzazione dati e prendere decisioni più informate ed efficienti.

Per ulteriori informazioni, vedere Identificazione degli influenzatori chiave alla base dei dati che utilizzano l'analisi dei fattori chiave.

APPRENDIMENTO CORRELATO:

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!

Lascia qui il tuo feedback