Visualisation de valeurs de Shapley dans des applications Qlik Sense
Les valeurs de Shapley nous aident à comprendre ce qui dirige un modèle ainsi que ce qui dirige les résultats individuels. Créez des visualisations de valeurs de Shapley dans des applications Qlik Sense pour explorer davantage vos données. Les exemples suivants vous donneront une idée des informations que vous pouvez obtenir.
Préparations
Avant de commencer, procédez aux préparations suivantes :
-
Générez un ensemble de données Coordonnées de Shapley. Cet ensemble de données comporte des colonnes de valeurs de Shapley pivotées sous forme de « caractéristique » et de « valeur », ce qui vous permet d'utiliser plusieurs caractéristiques dans un seul graphique.
-
Pour les prédictions de classification binaire, tracez la probabilité prédite par rapport à la somme des valeurs de Shapley par ligne et observez la direction des valeurs de Shapley. Si la pente est négative, inversez la direction des valeurs de Shapley pour faciliter l'interprétation des visualisations.
Classement de l'importance des caractéristiques (ou variables)
Vous pouvez créer un classement de l'importance des caractéristiques via les valeurs absolues moyennes des valeurs de Shapley de chaque caractéristique. La figure montre l'importance de différentes caractéristiques sur la probabilité de perte d'un client.
Direction et distribution
Il est également possible d'utiliser les valeurs de Shapley pour comprendre la direction et la distribution de l'influence de chaque caractéristique. Sur la figure, vous pouvez voir si les différentes caractéristiques rendent la perte des clients plus ou moins probable.
Importance des caractéristiques pour les groupes
Il est possible d'obtenir l'importance des caractéristiques pour différents groupes. Par exemple, vous pouvez comparer les caractéristiques les plus importantes pour des clients avec des types de programme différents. La figure montre les facteurs d'influence des caractéristiques par type de programme.
Ce graphique utilise un conteneur de schéma croisé pour représenter les données pour des valeurs de champ spécifiques des données. Vous pouvez également créer des graphiques similaires individuellement via des expressions d'ensemble.
Importance des caractéristiques au niveau de la ligne
SHAP importance peut être utilisé pour comprendre l'importance des caractéristiques au niveau de la ligne. Vous pouvez rechercher et comparer les caractéristiques qui influencent la probabilité de perte de différents clients, comme illustré sur la figure.
Variation des caractéristiques
Vous pouvez tracer l'influence de chaque variation d'une caractéristique. Par exemple, vous pouvez créer des visualisations pour montrer l'influence moyenne du type de programme client pour chaque type de programme proposé.
Variables continues
Il est possible d'utiliser les valeurs de Shapley dans des nuages de points pour analyser les tendances à mesure de la fluctuation des valeurs des variables continues. Sur ce tracé de valeurs de Shapley, nous voyons que la probabilité de perdre un client augmente généralement avec l'augmentation de son tarif de base.
Nous pouvons également éventuellement utiliser des lignes de régression et d'autres outils pour découvrir de nouvelles informations dans les données.