Accéder au contenu principal Passer au contenu complémentaire

Configuration d'une application de prédiction Qlik Sense

La dernière étape du processus consiste à créer une application analytique Qlik Sense pour visualiser les données de prédiction générées.

Dans le hub Analyses Qlik Cloud, cliquez sur Ajouter nouveau > Application analytique. Sélectionnez un espace pour l'application et nommez-le Prédictions de perte de clientèle.

Cliquez sur Créer.

Note InformationsLe mode d'interaction avec l'application varie selon que vous utilisez un appareil à écran tactile ou que vous activez l'assistance tactile. Pour plus d'informations, voir Menu à pression longue sur les appareils tactiles.

Importation des données

Dans la nouvelle application, cliquez pour ajouter des données depuis Catalogue de données.

Importez les ensembles de données suivants dans votre application :

  • Ensemble de données d'application : Customer churn data - apply.csv

  • Ensemble de données de prédiction : Customer churn data - apply_Prediction.csv

  • Ensemble de données Coordonnée SHAP : Customer churn data - apply_Prediction_Coordinate_SHAP.csv

L'ensemble de données d'application a été chargé au début du didacticiel. Les deux autres ensembles de données ont été créés lors de l'exécution de la prédiction.

À l'invite, associez les données de l'application via les associations recommandées. Dans le cas présent, le champ AccountID sera l'index qui associe les ensembles de données.

Une fois ces opérations terminées, les données sont prêtes à être ajoutées à l'application.

Cliquez sur Charger les données.

Examen du modèle de données

Avant de créer des visualisations dans l'application, ouvrez le visionneur de modèle de données et vérifiez que les trois ensembles de données ont été correctement associés. Le champ AccountID doit jouer le rôle de clé pour les trois ensembles de données. Le modèle de données de l'application doit ressembler à celui de l'image ci-dessous.

Visionneur de modèle de données affichant le modèle de données de l'application de prédictions

Vérification que le modèle de données de votre nouvelle application de prédictions a été correctement configuré.

Visualisation des données

Il existe plusieurs méthodes pour structurer une application de prédictions. Ici, nous allons créer une feuille pour afficher les valeurs de Shapley (facteurs d'influence des prédictions) et une autre feuille pour afficher les prédictions.

Première feuille :Graphiques de l'importance des valeurs de Shapley en fonction de leurs caractéristiques

Commencez par créer une feuille dédiée à l'analyse des valeurs de Shapley dans différentes configurations.

  1. Créez une nouvelle feuille, puis cliquez sur Éditer la feuille.

  2. Donnez un titre à la feuille, par exemple, Analyse SHAP.
  3. Activez les options avancées et supprimez l'objet de graphique suggéré vide du canevas de la feuille.

Vous pouvez maintenant commencer à créer vos visualisations.

Classement SHAP importance

Ce type de graphique est similaire à celui automatiquement généré que vous avez peut-être vu lors de la configuration de vos versions d'expérimentation. Ici, nous allons en générer un pour l'ensemble de données prédit.

L'objectif de ce type de graphique est d'afficher les caractéristiques qui contribuent le plus au résultat apparaissant dans la colonne Churned (Perte de clientèle). Nous devons savoir que, comme nous allons utiliser des valeurs absolues, les résultats SHAP peuvent être positifs (valeur Yes (Oui)) ou négatifs (valeur No (Non)).

  1. Depuis le panneau des ressources de la feuille, faites glisser un graphique à barres sur la feuille vide.

  2. Intitulez le graphique Classement SHAP importance.

  3. Ajoutez automl_feature comme dimension et libellez-la Caractéristique.

    Cela vous permet de présenter les données agrégées sur l'ensemble des caractéristiques incluses.

  4. Ajoutez la mesure calculée suivante :

    =fabs(Avg(SHAP_value))

  5. Sous Étiquette, saisissez Valeur de Shapley moyenne.

  6. Dans le panneau des propriétés, sous Aspect > Présentation, supprimez la barre de défilement, si elle est présente, et remplacez l'orientation Verticale du graphique par Horizontale.

  7. Sous Tri, faites glisser la mesure sur la dimension, si ce n'est pas déjà fait. Laissez le tri de chaque champ sur Auto.

    Cela permet de trier le graphique en fonction des valeurs de mesure dans l'ordre décroissant.

Graphique affichant les contributeurs les plus importants au résultat de perte de clientèle

Valeurs de Shapley classées dans un graphique à barres.

Conteneur de schéma croisé (trellis container)

Vous pouvez créer un conteneur de schéma croisé (trellis container) pour filtrer les données afin d'afficher des valeurs de champ spécifique au sein d'une dimension. Dans le cas présent, nous pouvons répartir les valeurs de Shapley de chacun des quatre types de plan proposés aux clients.

Pour créer un objet Treillis, vous devez spécifier une dimension et une visualisation principale. Nous allons convertir le Classement SHAP importance que nous venons de créer en visualisation principale.

  1. Cliquez avec le bouton droit de la souris sur le graphique Classement SHAP importance de la feuille, puis sélectionnez Objet lié Ajouter aux éléments princ..
  2. Conservez le nom par défaut et cliquez sur Ajouter.
  3. Sous Objets personnalisés > Qlik Visualization Bundle du panneau des ressources, faites glisser un conteneur de schéma croisé (trellis container) sur la feuille.

  4. Ajoutez PlanType comme dimension.

  5. Cliquez sur Ajouter une visualisation principale à l'intérieur du graphique, puis ajoutez le graphique Classement SHAP importance.

  6. Sous Aspect > Général du panneau des propriétés, activez Afficher les titres et intitulez le graphique SHAP importance par type de plan.

  7. Redimensionnez le conteneur de schéma croisé (trellis container) de sorte qu'il soit suffisamment large pour pouvoir afficher les noms des caractéristiques dans les graphiques. Si toutes les étiquettes ne s'affichent pas, ajustez le zoom dans la fenêtre du navigateur.

Graphique affichant les contributeurs les plus importants au résultat de perte de clientèle, par type de plan

Conteneur de schéma croisé (trellis container) affichant les valeurs de Shapley classées pour chaque type de plan client.

Sinon, vous pouvez afficher ces données en créant des graphiques individuels avec des expressions d'ensemble pour chaque valeur de dimension que vous cherchez à analyser. Dans le cas présent, vous pouvez créer un graphique distinct pour chacun des quatre types de plan.

Analyses des valeurs de Shapley de chaque client

Vous pouvez créer des classements des caractéristiques en fonction de leur importance pour des ID de compte spécifiques via l'analyse d'ensembles. Dans cet exemple, nous allons créer un graphique pour un client que nous nous attendons à perdre, et un graphique pour un client que nous nous attendons à conserver.

Pour cet exercice, vous avez besoin d'exemples d'ID de compte d'un client dont la perte est prédite et d'un client dont la rétention est prédite.

  1. Sous Préparer dans la barre de navigation, accédez au Gestionnaire de données.

  2. Dans le tableau Aperçu des données au bas de la page, recherchez une valeur dans le champ Customer churn data - apply_Prediction.AccountID correspondant à une valeur 'yes' (oui) dans le champ Churned_predicted. Notez la valeur dans un éditeur de texte distinct.

  3. Recherchez une valeur dans le champ Customer churn data - apply_Prediction.AccountID correspondant à une valeur 'no' (non) dans le champ Churned_predicted. Notez la valeur dans un éditeur de texte distinct.

Commencez par créer un graphique pour un client auquel une valeur Yes a été attribuée dans le champ Churned de l'ensemble de données de prédiction.

  1. Depuis le panneau des ressources, faites glisser un graphique à barres sur la feuille.

  2. Intitulez le graphique SHAP importance pour un client dont la perte est prédite.

  3. Ajoutez automl_feature comme dimension et libellez-la Caractéristique.

  4. Ajoutez la mesure calculée suivante :

    =Sum({<AccountID={""}>}(SHAP_value))

    Entre parenthèses, collez la valeur de l'ID de compte d'un client dont la perte est prédite (de la procédure précédente).

    Cette expression d'ensemble filtrera l'analyse pour afficher uniquement les facteurs d'influence de prédiction d'un client portant l'ID de compte spécifié.

  5. Nommez la mesure Valeur de Shapley moyenne.

  6. Dans le panneau des propriétés, sous Aspect > Présentation, supprimez la barre de défilement, si elle est présente, et remplacez l'orientation Verticale du graphique par Horizontale.

  7. Sous Aspect > Couleurs et légende, remplacez le réglage du curseur de couleurs Auto par Personnalisées. Définissez les couleurs du graphique sur Par mesure.

    Sélectionnez un jeu de couleurs de sorte à afficher clairement la différence entre les caractéristiques ayant des impacts positifs et celles ayant des impacts négatifs sur le résultat prédit.

  8. Définissez Afficher la légende sur Désactivé.

  9. Sous Tri, faites glisser la mesure sur la dimension, si ce n'est pas déjà fait. Laissez le tri de chaque champ sur Auto.

    Cela permet de trier le graphique en fonction des valeurs de mesure dans l'ordre décroissant.

Graphique affichant les contributeurs les plus importants au résultat de perte de clientèle pour un client dont la perte est prédite

Valeurs de Shapley classées dans un graphique à barres pour un client individuel dont on s'attend à ce qu'il annule son abonnement.

Ensuite, créez un graphique pour un client auquel une valeur No a été attribuée dans le champ Churned de l'ensemble de données de prédiction.

  1. Depuis le panneau des ressources, faites glisser un graphique à barres sur la feuille.

  2. Intitulez le graphique SHAP importance pour un client prédit pour être conservé.

  3. Ajoutez automl_feature comme dimension et libellez-la Caractéristique.

  4. Ajoutez la mesure calculée suivante :

    =Sum({<AccountID={""}>}(SHAP_value))

    Entre parenthèses, collez la valeur de l'ID de compte d'un client dont la rétention est prédite (de la procédure précédente).

    Cette expression d'ensemble filtrera l'analyse pour afficher uniquement les facteurs d'influence de prédiction d'un client portant l'ID de compte spécifié.

  5. Nommez la mesure Valeur de Shapley moyenne.

  6. Dans le panneau des propriétés, sous Aspect, supprimez la barre de défilement et remplacez l'orientation Verticale du graphique par Horizontale.

  7. Sous Aspect > Couleurs et légende, définissez Couleurs sur Personnalisées et Par mesure.

    Sélectionnez un jeu de couleurs de sorte à afficher clairement la différence entre les caractéristiques ayant des impacts positifs et celles ayant des impacts négatifs sur le résultat prédit.

  8. Définissez Afficher la légende sur Désactivé.

  9. Sous Tri, faites glisser la mesure sur la dimension, si ce n'est pas déjà fait. Laissez le tri de chaque champ sur Auto.

    Cela permet de trier le graphique en fonction des valeurs de mesure dans l'ordre décroissant.

Le graphique doit ressembler à celui ci-dessous.

Graphique affichant les contributeurs les plus importants au résultat de perte de clientèle pour un client dont la rétention est prédite

Valeurs de Shapley classées dans un graphique à barres pour un client individuel dont on s'attend à ce qu'il poursuive son abonnement.

Votre feuille renseignée doit ressembler à celle ci-dessous.

Feuille d'analyse SHAP en mode d'analyse

Feuille complète en mode de consommation affichant différentes visualisations basées sur les valeurs de Shapley.

Une autre application utile d'analyse d'ensembles pour des clients individuels consiste à utiliser des variables dans l'expression, avec un contrôle d'entrée de variable pour permettre le filtrage rapide des prédictions des clients individuels.

Deuxième feuille : Tableau de bord Prédictions

La deuxième feuille sera davantage consacrée aux valeurs de prédiction réelles de chaque client.

  1. Créez une nouvelle feuille, puis cliquez sur Éditer la feuille.

  2. Donnez un titre à la feuille, par exemple, Prédictions.

Table

Créez un tableau intitulé Prédictions par compte avec les deux dimensions suivantes :

  • AccountID

  • Churned_predicted

Remplacez les titres des colonnes par ID de compte et Perte prévue en cliquant sur chaque en-tête de colonne. Redimensionnez le tableau afin qu'il corresponde à l'image ci-dessous.

Tableau de prédictions pour les recherches d'ID de compte

Tableau affichant la prédiction par ID de compte.

Ce tableau vous permet d'effectuer des recherches rapides d'ID de compte individuels et de voir instantanément si oui ou non on s'attend à perdre le client sélectionné. Il est également possible de créer cette fonctionnalité via des volets de filtre.

Objets KPI

Les indicateurs KPI constituent un excellent moyen d'afficher une seule valeur pour une analyse particulièrement importante de vos données. Ici, nous allons créer trois graphiques KPI.

  1. Créez un graphique KPI vide. Ajoutez la mesure suivante :

    =Count(Churned_predicted)

    Cela calculera le nombre total de clients pour lesquels nous avons généré des prédictions de perte.

  2. Libellez la mesure Nombre total de clients.

  3. Définissez Formatage des nombres sur Nombre et présentez les valeurs au format 1 000 (sans valeurs décimales ni de pourcentage).

  4. Créez un autre graphique KPI vide. Ajoutez la mesure suivante :

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    Il s'agit d'une expression d'ensemble qui calcule le nombre de fois où la valeur yes est apparue dans le champ Churned_predicted.

  5. Nommez la mesure Perte prédite.

  6. Configurez le formatage des nombres du graphique selon les mêmes paramètres que ceux du premier KPI.

  7. Créez un troisième graphique KPI vide. Ajoutez la mesure suivante :

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    Cela calcule le nombre de fois où la valeur no est apparue dans le champ Churned_predicted.

  8. Intitulez la mesure Rétention prédite.

Redimensionnez et organisez les indicateurs KPI de sorte qu'ils se présentent comme sur l'image ci-dessous.

Objets KPI affichant des métriques de prédictions

Objets KPI affichant des données de prédictions.

Graphique à barres empilées de prédictions par type de plan

Pour analyser les prédictions par champ catégorique, comme le type de plan, vous pouvez créer un graphique à barres avec des analyses d'ensembles individuelles empilées les unes sur les autres.

  1. Faites glisser un graphique à barres sur la feuille et intitulez-le Prédictions par type de plan.

  2. Ajoutez PlanType comme dimension. Libellez-la Type de plan.

  3. Ajoutez la mesure suivante :

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    Nommez la mesure Rétention prédite.

  4. Ajoutez la mesure suivante :

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    Libellez la mesure Perte prédite.

  5. Sous Aspect > Présentation, remplacez la présentation Groupée par Empilée.

  6. Supprimez la barre de défilement et définissez Étiquettes de valeur sur Activé.

  7. Configurez Étiquettes des segments et Étiquettes des totaux sur Auto.

Votre graphique à barres doit ressembler à l'image suivante.

Graphique à barres empilées de prédictions par type de plan

Graphique à barres empilées de prédictions par type de plan.

Diagramme de distribution pour analyser des valeurs de champ numériques individuelles

Il est possible d'utiliser un diagramme de distribution pour présenter les données des prédictions en fonction d'une mesure prenant différentes valeurs numériques. Dans cette section, vous allez créer un graphique pour afficher les prédictions de perte de clientèle en fonction du tarif de base, avec des groupements distincts pour la durée du client.

Notez que même si nous avons supprimé le champ CustomerTenure (Durée du client) de notre expérimentation (et que nous ne l'incluons par conséquent pas dans les données de prédiction), le champ est encore présent dans le modèle de données afin que nous puissions l'utiliser pour trier les données du graphique.

  1. Faites glisser un diagramme de distribution sur la feuille et intitulez-le Prédictions de perte de clientèle en fonction du tarif de base et de la durée.

  2. Ajoutez AccountID comme dimension pour les points.

  3. Ajoutez la mesure suivante sur l'axe des abscisses :

    =Avg(BaseFee)

  4. Ajoutez la dimension calculée suivante sur l'axe des ordonnées :

    =Round(CustomerTenure,10)

    Cela crée des groupements le long de l'axe des ordonnées pour chaque niveau de durée de client approximative. Plus la valeur est élevée, plus la durée est importante depuis que le client a commencé son service.

  5. Sous Aspect > Présentation, réduisez la Taille de bulle à 20 et activez Ajouter du bruit aux points.

  6. Dans Couleurs et légende, définissez Couleurs sur Personnalisées.

  7. Sélectionnez l'option permettant de colorer les données en fonction de la dimension suivante :

    =Churned_predicted

    Cela attribue une couleur à chacune des valeurs du champ Churned_predicted. Dans le cas présent, deux couleurs seront affichées.

  8. Ajoutez l'étiquette suivante au paramètre de couleurs personnalisées : Perte prédite.

Votre diagramme de distribution doit ressembler à celui de l'image ci-dessous.

Diagramme de distribution des prédictions de perte de clientèle en fonction de BaseFee et de CustomerTenure

Diagramme de distribution des prédictions de perte de clientèle en fonction de BaseFee et de CustomerTenure.

Il est possible de créer des graphiques similaires pour les analyses de différents champs numériques en substituant d'autres agrégations de champs à la mesure BaseFee.

Configurez les visualisations de la feuille de sorte qu'elles ressemblent à l'image ci-dessous.

Feuille d'analyse des prédictions

Tableau de bord Prédictions avec six objets de graphique pour l'analyse des données de prédictions.

Merci !

Ce didacticiel est à présent terminé. Nous espérons que vous avez appris des choses et que vous avez compris que l'apprentissage machine automatisé est une manière facile et rapide de générer des modèles prédictifs. Qlik Sense est un outil performant qui facilite la visualisation des données de prédictions et fournit des informations analytiques significatives sur vos données.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !