Accéder au contenu principal Passer au contenu complémentaire

Visualisation de valeurs de Shapley dans des applications Qlik Sense

Les valeurs de Shapley nous aident à comprendre ce qui dirige un modèle ainsi que ce qui dirige les résultats individuels. Créez des visualisations de valeurs de Shapley dans des applications Qlik Sense pour explorer davantage vos données. Les exemples suivants vous donneront une idée des informations que vous pouvez obtenir.

Préparations

Avant de commencer, procédez aux préparations suivantes :

  • Générez un ensemble de données Coordonnées de Shapley. Cet ensemble de données comporte des colonnes de valeurs de Shapley pivotées sous forme de « caractéristique » et de « valeur », ce qui vous permet d'utiliser plusieurs caractéristiques dans un seul graphique.

  • Pour les prédictions de classification binaire, tracez la probabilité prédite par rapport à la somme des valeurs de Shapley par ligne et observez la direction des valeurs de Shapley. Si la pente est négative, inversez la direction des valeurs de Shapley pour faciliter l'interprétation des visualisations.

Vérification de la direction des valeurs de Shapley indiquant une pente positive

Graphique des valeurs de Shapley pour indiquer une pente positive.

Classement de l'importance des caractéristiques (ou variables)

Vous pouvez créer un classement de l'importance des caractéristiques via les valeurs absolues moyennes des valeurs de Shapley de chaque caractéristique. La figure montre l'importance de différentes caractéristiques sur la probabilité de perte d'un client.

Classement SHAP importance dans Qlik Sense

Classement de l'importance des caractéristiques (ou variables) avec un graphique à barres.

Direction et distribution

Il est également possible d'utiliser les valeurs de Shapley pour comprendre la direction et la distribution de l'influence de chaque caractéristique. Sur la figure, vous pouvez voir si les différentes caractéristiques rendent la perte des clients plus ou moins probable.

Tracé de distribution SHAP dans Qlik Sense

Graphique de distribution de l'importance des caractéristiques.

Importance des caractéristiques pour les groupes

Il est possible d'obtenir l'importance des caractéristiques pour différents groupes. Par exemple, vous pouvez comparer les caractéristiques les plus importantes pour des clients avec des types de programme différents. La figure montre les facteurs d'influence des caractéristiques par type de programme.

Ce graphique utilise un conteneur de schéma croisé pour représenter les données pour des valeurs de champ spécifiques des données. Vous pouvez également créer des graphiques similaires individuellement via des expressions d'ensemble.

Graphique dans Qlik Sense montrant les facteurs d'influence sur la perte de clientèle les plus importants par type de programme

Objet Schéma croisé dans Qlik Sense montrant des valeurs d'analyse définies pour quatre valeurs de champ de caractéristique différentes (types de programme).

Importance des caractéristiques au niveau de la ligne

SHAP importance peut être utilisé pour comprendre l'importance des caractéristiques au niveau de la ligne. Vous pouvez rechercher et comparer les caractéristiques qui influencent la probabilité de perte de différents clients, comme illustré sur la figure.

Graphiques SHAP importance pour des ID de client spécifiques

Graphiques à barres montrant les classements SHAP importance de deux clients différents.

Variation des caractéristiques

Vous pouvez tracer l'influence de chaque variation d'une caractéristique. Par exemple, vous pouvez créer des visualisations pour montrer l'influence moyenne du type de programme client pour chaque type de programme proposé.

Graphique à barres dans Qlik Sense montrant SHAP importance de valeurs de champ spécifiques pour une seule caractéristique

Graphique à barres SHAP importance pour chaque type de programme.

Tracé de distribution dans Qlik Sense montrant SHAP importance de valeurs de champ spécifiques pour une seule caractéristique

Graphiques à barres montrant les classements SHAP importance de deux clients différents.

Variables continues

Il est possible d'utiliser les valeurs de Shapley dans des nuages de points pour analyser les tendances à mesure de la fluctuation des valeurs des variables continues. Sur ce tracé de valeurs de Shapley, nous voyons que la probabilité de perdre un client augmente généralement avec l'augmentation de son tarif de base.

Nous pouvons également éventuellement utiliser des lignes de régression et d'autres outils pour découvrir de nouvelles informations dans les données.

Nuage de points SHAP montrant les tendances de résultat de perte de clientèle à mesure que le tarif de base augmente

Exemple de visualisation des données de prédiction.

En savoir plus

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !