Nozioni sull'importanza SHAP nell'addestramento dell'esperimento
L'importanza SHAP offre informazioni strategiche sulle previsioni create dagli esperimenti. Può aiutare a capire quali sono le funzioni più importanti per la previsione.
I valori SHAP rappresentano il contributo di ciascuna funzione al valore previsto della destinazione, date tutte le altre funzioni di quella riga.
Dopo aver addestrato una versione dell'esperimento, selezionare un modello. Il grafico importanza SHAP nella scheda Modelli sotto la tabella visualizza i dati SHAP dalle previsioni del modello create utilizzando i dati di controllo (test).
Questo argomento della guida illustra l'importanza SHAP nell'addestramento dell'esperimento Per informazioni sui set di dati sull'importanza SHAP generati durante una previsione, vedere Generazione di set di dati SHAP durante le previsioni.
Panoramica
L'importanza SHAP è misurata a livello di riga. Rappresenta il modo in cui una funzione influenza la previsione di una singola riga rispetto alle altre funzioni di quella riga e al risultato medio del set di dati. Il valore ha sia una direzione che una magnitudine, ma per l'addestramento del modello, l'importanza SHAP è rappresentata in forma di valore assoluto.
Nel grafico dell'importanza SHAP, i valori a livello di riga sono aggregati. Ciò consente di comprendere l'influenza delle funzioni all'interno di sottoinsiemi di dati.
Esperimenti di classificazione binaria e regressione
In un esperimento di classificazione binaria o regressione, il grafico di importanza SHAP per ogni versione del modello è un grafico a barre che visualizza il valore SHAP assoluto medio per ogni funzione nell'esperimento. Il grafico importanza SHAP è ordinato dal valore più alto a quello più basso. Il grafico indica quali funzioni esercitano la maggiore e minore influenza sull'esito previsto della destinazione, indipendentemente dall'esito determinato.
Esperimenti di classificazione multiclasse
In un esperimento di classificazione multiclasse, sono disponibili più opzioni per la presentazione del grafico di importanza SHAP. Sono disponibili le opzioni seguenti:
Funzione SHAP presentata come un totale
Valori funzione SHAP separati per classe
Grafici di importanza SHAP con un'unica classe
Funzione SHAP presentata come un totale
Per impostazione predefinita, il grafico di importanza SHAP sarà configurato con l'impostazione Tutte le classi: funzione SHAP media.
Questa configurazione mostra l'importanza SHAP di ogni funzione, indipendentemente dall'esito previsto della destinazione. Le funzioni nel grafico sono ordinate per il valore SHAP assoluto medio totale e non sono separate per classe.
Valori funzione SHAP separati per classe
Per visualizzare quanta influenza ogni funzione ha sull'esito della destinazione come un valore di ogni classe nell'esperimento, selezionare l'impostazione Funzione SHAP per classe. È possibile impostare la configurazione con il valore Raggruppato o )In pila. I valori SHAP assoluti medi per ogni classe nell'esperimento sono presentati con colori per consentire il confronto per classe.
Ad esempio, supponiamo che un campo di destinazione nell'esperimento abbia quattro classi possibili o esiti (Piano viola, Piano verde, Piano blu o Piano rosso). La barra multi-colore per ogni funzione scompone la l'entità dell'influenza che la funzione ha esercitato su ciascuno dei quattro esiti possibili dell'esperimento. Se si prende in esame la lunghezza totale della barra, si visualizza l'influenza totale che la funzione ha esercitato sulla previsione della destinazione, indipendentemente dell'esito previsto.
Grafici di importanza SHAP con un'unica classe
Si dispone anche di un'opzione per visualizzare un grafico di importanza SHAP per ciascuno degli esiti possibili della previsione di destinazione. Vengono visualizzati i valori SHAP assoluti medi per gli esiti previsti di una singola classe.
Ad esempio, se la destinazione del proprio esperimento ha quattro esiti possibili, è possibile visualizzare quattro grafici separati che analizzano nel dettaglio le funzioni con maggiore impatto per le previsioni per ognuno dei quattro esiti possibili.
Calcolo di valori SHAP
I valori SHAP vengono calcolati per una vasta serie di algoritmi. L'importanza SHAP è calcolata con due metodi distinti:
Tree SHAP: un metodo veloce e preciso per stimare i valori SHAP per i modelli ad albero.
Linear SHAP: un metodo per calcolare i valori SHAP per i modelli lineari.
Algoritmo | Tipi di modelli supportati | Metodo di calcolo SHAP |
---|---|---|
Classificazione Random Forest | Classificazione binaria, classificazione multiclasse | Tree SHAP |
Classificazione XGBoost | Classificazione binaria, classificazione multiclasse | Tree SHAP |
Classificazione LightGBM | Classificazione binaria, classificazione multiclasse | Tree SHAP |
Classificazione CatBoost | Classificazione binaria, classificazione multiclasse | Tree SHAP |
Regressione logistica | Classificazione binaria, classificazione multiclasse | Linear SHAP |
Regressione LASSO | Classificazione binaria, classificazione multiclasse | Linear SHAP |
Regressione Elastic Net | Classificazione binaria, classificazione multiclasse | Linear SHAP |
Bayesiano ingenuo gaussiano | Classificazione binaria, classificazione multiclasse | SHAP non calcolato |
Regressione CatBoost | Regressione | Tree SHAP |
Regressione LightGBM | Regressione | Tree SHAP |
Regressione lineare | Regressione | Linear SHAP |
Regressione Random Forest | Regressione | Tree SHAP |
Regressione SGD | Regressione | Linear SHAP |
Regressione XGBoost | Regressione | Tree SHAP |
Analisi dei fattori chiave
È possibile creare analisi dei fattori chiave direttamente in un'app Qlik Sense per confrontare l'importanza di fattori particolari per determinare i dati osservati per un'azienda particolare o per le metriche delle prestazioni. L'analisi dei fattori chiave viene effettuata calcolando i valori SHAP a livello di riga per ogni fattore preso in considerazione e visualizzandoli in forma aggregata. Questa fornisce una visualizzazione di alto livello delle tendenze e dei comportamenti alla base dei dati nelle app. È possibile utilizzare i risultati delle analisi dei fattori chiave per ottimizzare l'alfabetizzazione dati e prendere decisioni più informate ed efficienti.
Per ulteriori informazioni, vedere Identificazione degli influenzatori chiave alla base dei dati che utilizzano l'analisi dei fattori chiave.