Vai al contenuto principale Passa a contenuto complementare

Nozioni sull'importanza SHAP nell'addestramento dell'esperimento

L'importanza SHAP offre informazioni strategiche sulle previsioni create dagli esperimenti. Può aiutare a capire quali sono le funzioni più importanti per la previsione.

I valori SHAP rappresentano il contributo di ciascuna funzione al valore previsto della destinazione, date tutte le altre funzioni di quella riga.

Dopo aver addestrato una versione dell'esperimento, selezionare un modello. Il grafico importanza SHAP nella scheda Modelli sotto la tabella visualizza i dati SHAP dalle previsioni del modello create utilizzando i dati di controllo (test).

Questo argomento della guida illustra l'importanza SHAP nell'addestramento dell'esperimento Per informazioni sui set di dati sull'importanza SHAP generati durante una previsione, vedere Generazione di set di dati SHAP durante le previsioni.

Panoramica

L'importanza SHAP è misurata a livello di riga. Rappresenta il modo in cui una funzione influenza la previsione di una singola riga rispetto alle altre funzioni di quella riga e al risultato medio del set di dati. Il valore ha sia una direzione che una magnitudine, ma per l'addestramento del modello, l'importanza SHAP è rappresentata in forma di valore assoluto.

Nel grafico dell'importanza SHAP, i valori a livello di riga sono aggregati. Ciò consente di comprendere l'influenza delle funzioni all'interno di sottoinsiemi di dati.

Esperimenti di classificazione binaria e regressione

In un esperimento di classificazione binaria o regressione, il grafico di importanza SHAP per ogni versione del modello è un grafico a barre che visualizza il valore SHAP assoluto medio per ogni funzione nell'esperimento. Il grafico importanza SHAP è ordinato dal valore più alto a quello più basso. Il grafico indica quali funzioni esercitano la maggiore e minore influenza sull'esito previsto della destinazione, indipendentemente dall'esito determinato.

Grafico di importanza SHAP mostrato durante il training di un modello di classificazione binario

Esperimenti di classificazione multiclasse

In un esperimento di classificazione multiclasse, sono disponibili più opzioni per la presentazione del grafico di importanza SHAP. Sono disponibili le opzioni seguenti:

  • Funzione SHAP presentata come un totale

  • Valori funzione SHAP separati per classe

  • Grafici di importanza SHAP con un'unica classe

Funzione SHAP presentata come un totale

Per impostazione predefinita, il grafico di importanza SHAP sarà configurato con l'impostazione Tutte le classi: funzione SHAP media.

Questa configurazione mostra l'importanza SHAP di ogni funzione, indipendentemente dall'esito previsto della destinazione. Le funzioni nel grafico sono ordinate per il valore SHAP assoluto medio totale e non sono separate per classe.

Valori funzione SHAP separati per classe

Per visualizzare quanta influenza ogni funzione ha sull'esito della destinazione come un valore di ogni classe nell'esperimento, selezionare l'impostazione Funzione SHAP per classe. È possibile impostare la configurazione con il valore Raggruppato o )In pila. I valori SHAP assoluti medi per ogni classe nell'esperimento sono presentati con colori per consentire il confronto per classe.

Ad esempio, supponiamo che un campo di destinazione nell'esperimento abbia quattro classi possibili o esiti (Piano viola, Piano verde, Piano blu o Piano rosso). La barra multi-colore per ogni funzione scompone la l'entità dell'influenza che la funzione ha esercitato su ciascuno dei quattro esiti possibili dell'esperimento. Se si prende in esame la lunghezza totale della barra, si visualizza l'influenza totale che la funzione ha esercitato sulla previsione della destinazione, indipendentemente dell'esito previsto.

Il grafico dell'importanza SHAP per un modello di classificazione multiclasse (opzione Funzione SHAP per classe)

Grafici di importanza SHAP con un'unica classe

Si dispone anche di un'opzione per visualizzare un grafico di importanza SHAP per ciascuno degli esiti possibili della previsione di destinazione. Vengono visualizzati i valori SHAP assoluti medi per gli esiti previsti di una singola classe.

Ad esempio, se la destinazione del proprio esperimento ha quattro esiti possibili, è possibile visualizzare quattro grafici separati che analizzano nel dettaglio le funzioni con maggiore impatto per le previsioni per ognuno dei quattro esiti possibili.

Calcolo di valori SHAP

I valori SHAP vengono calcolati per una vasta serie di algoritmi. L'importanza SHAP è calcolata con due metodi distinti:

  • Tree SHAP: un metodo veloce e preciso per stimare i valori SHAP per i modelli ad albero.

  • Linear SHAP: un metodo per calcolare i valori SHAP per i modelli lineari.

Algoritmi disponibili per tipi di modello e metodo di calcolo SHAP
AlgoritmoTipi di modelli supportatiMetodo di calcolo SHAP
Classificazione Random Forest Classificazione binaria, classificazione multiclasseTree SHAP
Classificazione XGBoostClassificazione binaria, classificazione multiclasseTree SHAP
Classificazione LightGBMClassificazione binaria, classificazione multiclasseTree SHAP
Classificazione CatBoostClassificazione binaria, classificazione multiclasseTree SHAP
Regressione logisticaClassificazione binaria, classificazione multiclasseLinear SHAP
Regressione LASSOClassificazione binaria, classificazione multiclasseLinear SHAP
Regressione Elastic NetClassificazione binaria, classificazione multiclasseLinear SHAP
Bayesiano ingenuo gaussianoClassificazione binaria, classificazione multiclasseSHAP non calcolato
Regressione CatBoostRegressioneTree SHAP
Regressione LightGBMRegressioneTree SHAP
Regressione lineareRegressioneLinear SHAP
Regressione Random ForestRegressioneTree SHAP
Regressione SGDRegressioneLinear SHAP
Regressione XGBoostRegressioneTree SHAP

Analisi dei fattori chiave

È possibile creare analisi dei fattori chiave direttamente in un'app Qlik Sense per confrontare l'importanza di fattori particolari per determinare i dati osservati per un'azienda particolare o per le metriche delle prestazioni. L'analisi dei fattori chiave viene effettuata calcolando i valori SHAP a livello di riga per ogni fattore preso in considerazione e visualizzandoli in forma aggregata. Questa fornisce una visualizzazione di alto livello delle tendenze e dei comportamenti alla base dei dati nelle app. È possibile utilizzare i risultati delle analisi dei fattori chiave per ottimizzare l'alfabetizzazione dati e prendere decisioni più informate ed efficienti.

Per ulteriori informazioni, vedere Identificazione degli influenzatori chiave alla base dei dati che utilizzano l'analisi dei fattori chiave.

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!