Visualisation des données de prédiction dans une application Qlik Sense
La dernière étape du processus consiste à créer une application analytique Qlik Sense pour visualiser les données de prédiction générées.
Flux de travail alternatif : Chargement d'une application préconfigurée
Au lieu de suivre les étapes restantes de cette rubrique, vous pouvez charger dans le centre d'activités Analyses l'application Customer churn predictions.qvf que vous avez téléchargée au début de ce didacticiel.
Les sections restantes de cette page vous guident tout au long de la création d'une application similaire. Il existera des différences entre les données de prédiction de l'application et vos propres données de prédiction.
L'application téléchargeable contient une feuille supplémentaire intitulée Individual Customer Analysis, qui utilise des expressions conditionnelles pour encourager l'analyse granulaire d'un seul compte client à la fois.
Prise en main
Depuis le centre d'activités Analyses, accédez à la page Créer et cliquez sur Application analytique. Sélectionnez un espace pour l'application et nommez-le Customer churn predictions (Prédictions de perte de clientèle).
Cliquez sur Créer.
Création du modèle de données
Sélection de vos données
Vous devez ajouter les données nécessaires à votre application. Il s'agit du jeu de données à appliquer (chargé au début du didacticiel) et des deux jeux de données générés à partir de la prédiction.
Procédez comme suit :
-
Dans la nouvelle application, cliquez pour ajouter des données depuis Catalogue de données.
-
Dans Catalogue de données, cochez les cases à côté des trois jeux de données suivants :
-
Jeu de données d'application : AutoML Tutorial - Churn data - apply.csv ou AutoML Tutorial - Churn data - apply.qvd
-
Jeu de données de prédiction : AutoML Tutorial - Churn data - apply_Prediction.csv
-
Jeu de données Coordonnée SHAP : AutoML Tutorial - Churn data - apply_Prediction_Coordinate_SHAP.csv
-
-
Cliquez sur Suivant.
-
Un panneau récapitulatif apparaît. Cliquez sur le jeu de données AutoML Tutorial - Churn data - apply.csv pour développer les champs disponibles à charger.
-
Cliquez sur l'icône à côté de n'importe quelle caractéristique désélectionnée lors de l'apprentissage du modèle. Il doit s'agir de DaysSinceLastService, ainsi que toutes les caractéristiques que vous avez désélectionnées en raison de leur faible influence sur le modèle.
-
Cliquez sur Charger dans l'application.
Association des données
À ce stade, vous avez ajouté les données à l'application ; mais aucun modèle de données connecté n'est créé tant que vous n'associez pas les jeux de données les uns aux autres. Dans le cas présent, le champ AccountID sera l'index qui associe les jeux de données.
Dans votre application, Gestionnaire de données est maintenant ouvert. Vous verrez les trois jeux de données, mais sous forme d'entités distinctes, non connectées.
Procédez comme suit :
-
Dans votre application, Gestionnaire de données est maintenant ouvert. Vous verrez les trois jeux de données, mais sous forme d'entités distinctes, non connectées.
-
Dans le volet droit de Gestionnaire de données, recherchez la suggestion d'association AccountID.
-
Cliquez sur Appliquer. Les tables doivent maintenant être connectées.
-
Cliquez sur Charger les données.
Vérification de vos associations dans Visionneur de modèle de données
Avant de créer des visualisations dans l'application, vous devez vérifier que les données ont été correctement associées.
Procédez comme suit :
-
Dans la barre de navigation en haut de l'interface, ouvrez le menu de navigation de l'application et sélectionnez Visionneur de modèle de données.
-
Vérifiez que les trois jeux de données ont été correctement connectés. Le champ AccountID doit jouer le rôle de clé pour les trois jeux de données. Le modèle de données de l'application doit ressembler à celui de l'image suivante.
Vous pouvez à présent commencer à créer le contenu analytique. Cliquez sur Feuille dans l'onglet Analyser de la barre de navigation.
Première feuille : Tableau de bord Prédictions agrégées
La première feuille se concentre sur l'analyse des prédictions sous forme agrégée.
Procédez comme suit :
-
Vous devez maintenant être en mode d'édition de feuille. Cliquez sur Options avancées.
-
À l'aide du bouton droit de la souris, cliquez sur une visualisation existante sur la feuille et supprimez-la. Pour les besoins de ce didacticiel, nous n'utiliserons pas cette caractéristique de suggestion de graphique.
-
Donnez un titre à la feuille, par exemple, Prédictions agrégées. Pour ce faire, cliquez n'importe où sur la feuille vide pour ouvrir Propriétés de la feuille à droite de l'interface. Sous Titre, saisissez un nom pour la feuille.
Graphique en secteurs
Un graphique en secteurs vous permet de visualiser facilement la répartition proportionnelle de vos données. Dans le cas présent, il est intéressant de répartir les données en fonction des résultats prédits (yes ou no).
Procédez comme suit :
-
Faites glisser un graphique en secteurs sur la feuille.
-
Ajoutez Churned_predicted comme dimension.
-
Ajoutez Count(AccountID) comme mesure.
-
Si vous le souhaitez, désactivez Étiquette de dimension sous Aspect > Présentation dans le panneau des propriétés.
-
Développez la dimension sous Données dans le panneau des propriétés et remplacez l'Étiquette de la dimension par Perte prédite.
L'étiquette se met à jour dans la légende.
Volet de filtre
Ce tableau de bord servira d'analyse générale du modèle de données complet. Cependant, il sera certainement presque aussi important de pouvoir facilement filtrer les données en fonction des différentes dimensions pour analyser des cohortes spécifiques.
Créez un volet de filtre contenant plusieurs zones de liste. Chaque zone de liste permet de sélectionner des valeurs au sein d'une seule dimension.
Procédez comme suit :
-
Faites glisser un volet de filtre sur la feuille.
-
Ajoutez des champs au volet de filtre. Il peut s'agir de dimensions qui, selon vous, devraient être significatives dans les résultats prédits.
-
Modifiez chaque zone de liste selon les besoins en cliquant dans le champ sous Données dans le panneau des propriétés. Cette opération permet d'ouvrir les Propriétés de la zone de liste.
Vous souhaitez peut-être, par exemple, modifier l'étiquette de champ et définir Réduire la zone de liste sur Toujours pour gagner de l'espace sur la feuille.
Redimensionnez le volet de filtre de sorte qu'il apparaisse sous forme de panneau sur un côté de la feuille.
Objets ICP
Les indicateurs ICP constituent un excellent moyen d'afficher une seule valeur pour une analyse particulièrement importante de vos données. Ici, nous allons créer trois graphiques ICP.
Procédez comme suit :
-
Créez un graphique ICP vide. Ajoutez la mesure suivante :
=Count(Churned_predicted)
Cela calculera le nombre total de clients pour lesquels nous avons généré des prédictions de perte.
-
Libellez la mesure Nombre total de clients.
-
Définissez Formatage des nombres sur Nombre et présentez les valeurs au format 1 000 (sans valeurs décimales ni de pourcentage).
-
Créez un autre graphique ICP vide. Ajoutez la mesure suivante :
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Il s'agit d'une expression d'ensemble qui calcule le nombre de fois où la valeur yes est apparue dans le champ Churned_predicted.
-
Libellez la mesure Perte prédite.
-
Configurez le formatage des nombres du graphique selon les mêmes paramètres que ceux du premier ICP.
-
Créez un troisième graphique ICP vide. Ajoutez la mesure suivante :
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Cela calcule le nombre de fois où la valeur no est apparue dans le champ Churned_predicted.
-
Intitulez la mesure Rétention prédite.
Histogramme
Vous pouvez visualiser la distribution des valeurs de probabilité de prédiction à l'aide d'un histogramme.
Faites glisser un histogramme sur la feuille et donnez-lui un titre. Ajoutez Churned_yes en tant que dimension.
Graphiques à barres empilées
Pour analyser les prédictions par champ catégorique, comme le type de plan, vous pouvez créer un graphique à barres avec des analyses d'ensembles individuelles empilées les unes sur les autres.
Procédez comme suit :
-
Faites glisser un graphique à barres sur la feuille et intitulez-le Prédictions de perte par type de plan.
-
Ajoutez PlanType comme dimension. Libellez-la Type de plan.
-
Ajoutez la mesure suivante :
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Intitulez la mesure Rétention prédite.
-
Ajoutez la mesure suivante :
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Libellez la mesure Perte prédite.
-
Sous Aspect > Présentation, remplacez la présentation Groupée par Empilée.
-
Supprimez la barre de défilement et définissez Étiquettes de valeur sur Activé.
-
Configurez Étiquettes des segments et Étiquettes des totaux sur Auto.
Une fois terminé, vous pouvez créer un graphique à barres similaire avec les deux mêmes mesures, mais avec une dimension catégorique différente telle que NumberOfPenalties.
Diagramme de distribution pour analyser des valeurs de champ numériques individuelles
Il est possible d'utiliser un diagramme de distribution pour présenter les données des prédictions en fonction d'une mesure prenant différentes valeurs numériques. Dans cette section, vous allez créer un graphique pour afficher les prédictions de perte de clientèle en fonction du tarif de base, avec des groupements distincts pour l'évaluation du service par le client.
Procédez comme suit :
-
Faites glisser un diagramme de distribution sur la feuille et intitulez-le Prédictions de perte de clientèle en fonction du tarif de base et de l'évaluation du service.
-
Ajoutez AccountID comme dimension pour les points.
-
Ajoutez la mesure suivante sur l'axe des abscisses :
=Avg(BaseFee)
-
Ajoutez la dimension calculée suivante sur l'axe des ordonnées :
=Round(ServiceRating,2)
Cela crée des groupements le long de l'axe des ordonnées pour des valeurs ServiceRating approximatives. Plus la valeur est élevée, plus l'évaluation par le client de la qualité du service reçu est élevée.
-
Sous Aspect > Présentation, réduisez la Taille de bulle à 20 et activez Ajouter du bruit aux points.
-
Dans Couleurs et légende, définissez Couleurs sur Personnalisées.
-
Sélectionnez l'option permettant de colorer les données en fonction de la dimension suivante :
=Churned_predicted
Cela attribue une couleur à chacune des valeurs du champ Churned_predicted. Dans le cas présent, deux couleurs seront affichées.
-
Ajoutez des étiquettes à la dimension et à la mesure et ajoutez l'étiquette suivante au paramètre de couleur personnalisé :Predicted to Churn (Perte prédite).
Il est possible de créer des graphiques similaires pour les analyses de différents champs numériques en substituant d'autres agrégations de champs à la mesure BaseFee.
Configurez les visualisations de la feuille de sorte qu'elles ressemblent à l'image ci-dessous.
Deuxième feuille : Tableau de bord SHAP agrégé
Ensuite, créez une feuille dédiée à l'analyse des valeurs de Shapley (SHAP) agrégées.
Procédez comme suit :
-
Créez une nouvelle feuille et passez en mode d'édition avancé.
-
Donnez un titre à la feuille (par exemple, SHAP agrégé).
Classement SHAP importance
Ce type de graphique est similaire à celui automatiquement généré que vous avez peut-être vu lors de la configuration de vos versions d'expérimentation. Ici, nous allons en générer un pour le jeu de données prédit.
L'objectif de ce type de graphique est d'afficher les caractéristiques qui contribuent le plus au résultat apparaissant dans la colonne Churned (Perte de clientèle). Nous devons être conscients du fait que, comme nous allons utiliser des valeurs absolues, les résultats SHAP peuvent être positifs (valeur yes (Oui)) ou négatifs (valeur no (Non)). Si vous préférez, vous pouvez également utiliser une expression qui ne calcule pas la valeur absolue.
Procédez comme suit :
-
Faites glisser un graphique à barres sur la feuille vide.
-
Intitulez le graphique SHAP Importance par caractéristique.
-
Ajoutez automl_feature comme dimension et libellez-la Caractéristique.
Cela vous permet de présenter les données agrégées sur l'ensemble des caractéristiques incluses.
-
Ajoutez la mesure calculée suivante :
=fabs(Avg(SHAP_value))
-
Sous Étiquette, saisissez Valeur de Shapley moyenne absolue.
-
Dans le panneau des propriétés, sous Aspect > Présentation, supprimez la barre de défilement, si elle est présente, et remplacez l'orientation Verticale du graphique par Horizontale.
-
Sous Tri, faites glisser la mesure sur la dimension, si ce n'est pas déjà fait. Laissez le tri de chaque champ sur Auto.
Cela permet de trier le graphique en fonction des valeurs de mesure dans l'ordre décroissant.
Conteneur de schéma croisé
Vous pouvez créer un conteneur de schéma croisé (trellis container) pour filtrer les données afin d'afficher des valeurs de champ spécifique au sein d'une dimension. Dans le cas présent, nous pouvons répartir les valeurs de Shapley de chacun des quatre types de plan proposés aux clients.
Pour créer un objet Treillis, vous devez spécifier une dimension et une visualisation principale. Nous allons convertir le Classement SHAP importance que nous venons de créer en visualisation principale.
Procédez comme suit :
- Cliquez avec le bouton droit de la souris sur le graphique Valeur de Shapley moyenne absolue de la feuille, puis sélectionnez Ajouter aux éléments princip..
- Conservez le nom par défaut et cliquez sur Ajouter.
-
Sous Objets personnalisés > Qlik Visualization Bundle du panneau des ressources, faites glisser un conteneur de schéma croisé (trellis container) sur la feuille.
-
Ajoutez PlanType comme dimension.
-
Cliquez sur Ajouter une visualisation principale à l'intérieur du graphique, puis ajoutez le graphique Valeur de Shapley moyenne absolue.
-
Sous Aspect > Général dans le panneau des propriétés, activez Afficher les titres et intitulez le graphique SHAP Importance par type de plan.
-
Redimensionnez le conteneur de schéma croisé (trellis container) de sorte qu'il soit suffisamment large pour pouvoir afficher les noms des caractéristiques dans les graphiques. Si toutes les étiquettes ne s'affichent pas, ajustez le zoom dans la fenêtre du navigateur.
Sinon, vous pouvez afficher ces données en créant des graphiques individuels avec des expressions d'ensemble pour chaque valeur de dimension que vous cherchez à analyser. Dans le cas présent, vous pouvez créer un graphique distinct pour chacun des quatre types de plan.
Réutilisation du volet de filtre
Il est possible de réutiliser sur cette feuille le volet de filtre créé sur la première feuille. En mode d'édition avancé, cliquez avec le bouton droit de la souris sur le volet de filtre et copiez-le. Collez-le sur la feuille SHAP agrégé.
Treemap
Vous pouvez également visualiser la répartition des valeurs de Shapley à l'aide d'un treemap. Glissez un treemap sur la feuille et ajoutez la même dimension et la même mesure que celles utilisées dans le classement SHAP importance.
Configurez les visualisations de la feuille de sorte qu'elles ressemblent à l'image ci-dessous.
Utilisation de l'application
Une fois l'application créée, vous pouvez l'utiliser pour analyser les données.
Cliquez sur Modifier la feuille pour passer en mode d'analyse. Dans cette vue, vous pouvez effectuer des sélections (dans les volets de filtre ou ailleurs sur la feuille) pour filtrer les données à des fins d'analyse spécifique de sous-ensembles des données. Par exemple, vous pouvez souhaiter analyser une région ou un type de plan client spécifique et comparer les résultats à d'autres sous-jeux de données.
Merci !
Ce didacticiel est à présent terminé. Nous espérons que vous avez appris des choses et que vous avez compris que l'apprentissage automatique est une manière facile et rapide de générer des modèles prédictifs. Qlik Sense est un outil performant qui facilite la visualisation des données de prédictions et fournit des informations analytiques significatives sur vos données.