Découverte des facteurs d'influence clés sous-jacents à vos données via l'analyse des facteurs clés
Grâce à Analyse des facteurs clés, vous pouvez identifier et comparer les sources de tendances spécifiques dans vos données. Une analyse des facteurs clés vous permet de visualiser et de classer l'influence d'un ensemble défini de facteurs sur les données actuelles d'un champ cible spécifique. Utilisez les informations analytiques découvertes pour améliorer et renforcer les processus analytiques et de prise de décision de votre entreprise.
L'analyse des facteurs clés est disponible dans une application Qlik Sense. Effectuez une analyse des facteurs clés en mode feuille lorsque vous êtes en mode d'analyse.
L'analyse des facteurs clés n'est pas disponible dans Qlik Sense Business, dans Qlik Cloud Analytics - Standard ni dans Qlik Anonymous Access.
En quoi consiste l'analyse des facteurs clés ?
Analyse des facteurs clés est une forme de découverte de données statistiques qui vous permet d'identifier le niveau d'impact de divers facteurs sur le résultat d'une seule métrique cible. L'analyse est réalisée pour les données tant quantitatives que qualitatives. L'intention, derrière une analyse des facteurs clés, est de découvrir la cause exacte d'une tendance spécifique des données et d'utiliser ces informations analytiques pour agir directement ou améliorer la sensibilisation organisationnelle.
En BI (Business Intelligence), les cibles courantes pour lesquelles vous souhaitez évaluer les facteurs d'influence sont les champs tels que Ventes, Satisfaction des clients, Marge, Perte de clientèle et Coût de vente. Parmi les exemples de facteurs (facteurs clés) figurent Produit, Emplacement, Numéro de magasin et Responsable.
Les métriques évaluées dans une analyse des facteurs clés varient suivant l'entreprise et le cas d'utilisation. La métrique cible et les différents facteurs influençant ses résultats dépendent du problème que vous cherchez à résoudre, des données disponibles et d'autres facteurs.
Pourquoi avoir recours à une analyse des facteurs clés ?
L'analyse des facteurs clés s'avère utile en BI (Business Intelligence), car elle peut s'appliquer de nombreuses façons différentes pour améliorer les indicateurs clés de performance. Vous pouvez utiliser une analyse des facteurs clés pour résoudre des problèmes et obtenir des informations analytiques en rapport avec les investissements de produits, l'expansion des revenus, la réduction des coûts, la satisfaction des clients, etc.
Dans Qlik Sense, l'analyse des facteurs clés est intégrée à l'expérience des consommateurs d'applications. Grâce à l'utilisation des fonctionnalités d'analyse des données en temps réel natives dans Qlik Sense, vous pouvez exécuter une nouvelle analyse des facteurs clés chaque fois que les données de l'application changent. Cela vous permet de surveiller en permanence les changements dans vos données et de découvrir rapidement les nouvelles tendances afin de pouvoir agir rapidement et efficacement, si besoin.
Principe de fonctionnement
L'analyse des facteurs clés est axée sur l'idée d'influence. Dans Qlik Sense, l'analyse des facteurs clés évalue l'influence de champs spécifiques (caractéristiques ou facteurs clés) sur un champ d'intérêt donné (la cible).
Les données utilisées dans l'analyse
Une analyse des facteurs clés consiste en un examen spécifique d'un sous-ensemble de vos données. Lorsque vous créez l'analyse, vous sélectionnez certains champs comme composants de l'analyse.
Pour chaque analyse, vous devez sélectionner les blocs de construction suivants :
-
Cible
-
Nombreuses caractéristiques différentes
Une fois que vous avez sélectionné ces composants, un jeu de données spécifique est créé à partir de votre modèle de données via la cible et les caractéristiques. L'analyse des facteurs clés utilise ce jeu de données et non le modèle de données tout entier pour déterminer l'influence des caractéristiques sur la cible. Les champs non inclus dans la configuration ne sont pas analysés.
Vous trouverez ci-dessous plus d'informations sur chaque composant.
Calcul de l'influence
Dans Qlik Sense, l'analyse des facteurs clés est réalisée via le calcul des valeurs SHAP pour chaque valeur de données de caractéristique du sous-jeu de données que vous analysez. Ces valeurs de Shapley sont générées à partir d'un modèle formé par Qlik AutoML. Les modèles utilisent l'algorithme de forêt d'arbres décisionnels pour générer les valeurs de Shapley.
La valeur SHAP est un calcul du niveau d'impact d'une valeur de données sur une valeur cible correspondante, par rapport aux autres caractéristiques du jeu de données spécifiquement créé à partir de la configuration de l'analyse des facteurs clés. Lorsque vous affichez les résultats d'une analyse des facteurs clés, vous voyez des agrégations de valeurs de Shapley sur tout ou partie d'un ensemble d'enregistrements du jeu de données.
Pour plus d'informations sur SHAP importance dans Qlik AutoML, voir Familiarisation avec SHAP importance dans l'apprentissage d'une expérimentation.
La cible
La cible est le champ pour lequel vous souhaitez analyser des facteurs clés. Par exemple, vous pouvez souhaiter comparer la manière dont certains facteurs influencent vos ventes. Dans ce cas, vous sélectionnez une mesure de vente comme cible.
Lors de la sélection de la cible, le temps de disponibilité des données est important, en particulier en ce qui concerne les caractéristiques que vous décidez d'inclure dans votre analyse. Pour plus d'informations sur les cadres temporels de collecte de données appropriés pour votre cible et vos caractéristiques, voir Fonctions.
Le nombre de valeurs uniques et le type de données de la cible déterminent le type de problème que l'analyse va résoudre. Cela a, à son tour, un impact sur les conditions que vos données doivent remplir. Pour plus d'informations, consultez Conditions requises des données.
L'analyse des facteurs clés supporte les types de problème suivants :
-
Régression
-
Classification binaire
Analyses de régression
Les analyses de régression sont utilisées lorsque la cible contient un grand nombre de valeurs numériques uniques. Si vous utilisez un calcul numérique (une mesure) comme cible, l'analyse des facteurs clés interprétera probablement la configuration comme un problème de régression.
Lors du choix d'une mesure comme cible, vous pouvez appliquer une agrégation de base directement au champ au sein de la configuration, ou vous pouvez sélectionner un élément principal existant, si vous souhaitez utiliser une expression plus complexe.
Analyses de classification binaire
Si votre cible inclut uniquement deux valeurs uniques (par exemple, oui ou non), l'analyse des facteurs clés interprète la configuration comme un problème de classification binaire. Les analyses de classification binaire sont créées via la sélection d'une dimension binaire comme cible.
Exemple courant : si vous avez un champ Perte de clientèle dans votre application pour savoir quels clients ont annulé un service spécifique, vous pouvez sélectionner le champ Perte de clientèle comme cible pour découvrir les facteurs qui influencent les décisions de ces clients.
Fonctions
Les caractéristiques sont vos facteurs clés. Il s'agit de champs qui contiennent des informations extractibles sur ce qui influence les tendances des données. Par exemple, lorsque vous créez une analyse des facteurs clés pour identifier les facteurs d'influence sous-jacents aux ventes, vous pouvez sélectionner des dimensions telles que Emplacement, Type de produit, Numéro de magasin, et Représentant commercial comme caractéristiques. Les mesures calculées peuvent également servir de caractéristiques.
Vous devez uniquement inclure des caractéristiques contenant des données enregistrables et collectées avant le point dans le temps auquel vous collectez vos données cibles. Si vous incluez des caractéristiques contenant des données que vous ne connaîtriez qu'au moment de la collecte de données pour la cible, l'analyse sera faussée et n'aura pas de valeur analytique.
Par exemple, si votre cible est Ventes, vous ne devez pas inclure de caractéristiques contenant des données directement dérivées de cette valeur. De même, si votre cible est un champ Perte de clientèle avec un résultat binaire (Oui ou Non), vous ne devez pas inclure de caractéristique contenant la date à laquelle a eu lieu la perte de client.
Pour plus d'informations sur l'identification des résultats d'analyse non valides, voir Identification des résultats non valides.
Les deux types de caractéristiques sont les suivants :
-
Caractéristique catégorique : contient des valeurs de données basées sur des catégories distinctes récurrentes. Il peut s'agir par exemple d'un champ Continent, dans lequel il ne peut y avoir qu'un petit nombre de valeurs possibles, qui ne sont pas interprétées comme des données numériques brutes, mais comme du texte. Les nombres peuvent être utilisés comme catégories.
-
Catégorie numérique : contient des valeurs de données purement numériques et n'appartenant pas à des catégories.
Toutes les caractéristiques incluses sont spécifiquement analysées pour déterminer dans quelle mesure chacune influence les données actuelles dans la cible.
Pour plus d'informations sur les conditions requises pour la cible et les caractéristiques incluses, voir Conditions requises des données.
Sélections dans l'application
Les sélections que vous effectuez dans l'application sont utilisées dans l'analyse des facteurs clés. Par exemple, vous pouvez souhaiter connaître les facteurs clés des ventes, mais, si vous incluez une dimension Numéro de magasin comme caractéristique, il se peut que vous souhaitiez uniquement analyser l'influence de cinq magasins spécifiques dans votre entreprise. Pour ce faire, vous pouvez sélectionner les valeurs dans l'application, puis configurer l'analyse des facteurs clés.
Étant donné que les sélections sont en fait des filtres appliqués au modèle de données, n'oubliez pas que les sélections effectuées dans un champ peuvent affecter les données disponibles pouvant être utilisées dans l'analyse.
Considérations relatives à l'abonnement au client
L'analyse des facteurs clés s'appuie sur Qlik AutoML pour calculer l'influence des caractéristiques sur la cible. Elle y parvient en créant des modèles d'apprentissage automatique qui sont utilisés pour calculer les valeurs de Shapley des points de données correspondant aux caractéristiques incluses dans le sous-jeu de données sélectionné.
La création d'une analyse des facteurs clés consomme des services mesurés par Qlik AutoML. La plupart des abonnements Qlik Cloud incluent une certaine quantité d'utilisation d'AutoML. Si vous avez besoin de davantage de capacité, vous devez souscrire un niveau payant d'AutoML.
Contactez votre propriétaire de compte de service et consultez les conditions de l'abonnement que vous utilisez pour connaître votre capacité d'utilisation de l'analyse des facteurs clés.
Les ressources suivantes peuvent fournir des détails supplémentaires :
-
Limitations et fonctionnalités gouvernées par les licences AutoML
-
Description de produit Abonnements Qlik Cloud®
Conditions requises des données
Configuration minimale requise du volume de données
Le jeu de données créé à partir de la cible et des caractéristiques doit comporter au moins 400 cellules. Sinon, vous ne pouvez pas exécuter l'analyse.
Autres conditions requises
Les conditions suivantes s'appliquent au jeu de données créé à partir de la configuration de votre analyse :
-
La cible doit contenir au moins deux valeurs uniques.
-
Si la cible contient entre deux et dix valeurs uniques, chaque valeur unique doit apparaître dans au moins dix enregistrements du jeu de données.
Si vous rencontrez des erreurs lors de l'exécution de l'analyse des facteurs clés, cela peut s'expliquer par le fait que les données que vous avez sélectionnées pour l'analyse ne remplissent pas ces conditions. Pour d'autres problèmes que vous pourriez rencontrer et une liste des solutions possibles, voir Dépannage .
Utilisation de l'analyse des facteurs clés dans Qlik Sense
Les rubriques d'aide suivantes peuvent vous aider à bien démarrer lors de la création et de l'interprétation des analyses des facteurs clés dans Qlik Sense :
Limitations
Voici ci-dessous une liste des limitations relatives à l'analyse des facteurs clés :
-
Les champs contenant les types de données Date, Heure et Horodatage ne peuvent pas être utilisés comme cible ni comme caractéristiques.