Accéder au contenu principal Passer au contenu complémentaire

Affichage d'informations analytiques sur les données d'apprentissage

À mesure que vous ajoutez des données d'apprentissage et que vous exécutez des versions de l'apprentissage, vous pouvez accéder à des informations analytiques sur la manière dont les données sont traitées. Les Informations fournissent des renseignements sur la cible et les caractéristiques de l'expérimentation tels que les caractéristiques exclues, indisponibles ou chiffrées à l'aide d'un traitement spécial.

La colonne Informations figure dans l'onglet Données lorsque vous vous trouvez dans Schéma Vue Schéma. Des informations analytiques abrégées sont également disponibles dans la Table Vue Données. Les informations analytiques sont créées individuellement pour chaque modèle dont l'apprentissage est effectué au sein de l'expérimentation.

Colonne Informations de la Vue Schéma

Informations analytiques affichées concernant chaque colonne Caractéristique du jeu de données d'apprentissage

Des informations analytiques sont générées :

  • après que vous avez ajouté ou modifié des données d'apprentissage, mais que vous n'avez pas encore exécuté de versions d'expérimentation ;

  • après l'exécution de chaque version d'expérimentation. Un ensemble distinct d'informations analytiques est créé pour chaque modèle dont vous effectuez l'apprentissage.

Les informations analytiques peuvent être différentes avant et après l'exécution d'une version. Cela est dû au fait que lorsque l'apprentissage démarre, Qlik Predict est en mesure de prétraiter vos données et de diagnostiquer davantage les problèmes de vos données. Pour plus d'informations, consultez Préparation et transformation automatiques des données.

Affichage des informations analytiques avant l'apprentissage

Avant d'exécuter une version de l'expérimentation, vous pouvez analyser les Informations pour voir comment les données d'apprentissage actuelles sont interprétées. Ces informations analytiques peuvent changer après l'exécution de la version.

  1. Dans une expérimentation, assurez-vous d'avoir ajouté les données d'apprentissage à utiliser pour la version d'expérimentation.

  2. Ouvrez l'onglet Données.

  3. Assurez-vous de vous trouver dans la Lignes de tableau Vue Schéma.

  4. Analysez la colonne Informations. Des infos-bulles fournissent un contexte supplémentaire sous-jacent aux informations analytiques. Pour plus d'explications sur la signification de chaque information analytique, consultez Interprétation des informations analytiques d'un jeu de données.

Affichage des informations analytiques d'un modèle

Une fois que les modèles ont terminé l'apprentissage d'une version d'expérimentation, sélectionnez un modèle et inspectez la manière dont les données ont été traitées.

  1. Exécutez une version d'expérimentation, puis ouvrez l'onglet Données.

  2. Sélectionnez un modèle dans la liste déroulante de la barre d'outils.

  3. Assurez-vous de vous trouver dans la Lignes de tableau Vue Schéma.

  4. Analysez la colonne Informations. Des infos-bulles fournissent un contexte supplémentaire sous-jacent aux informations analytiques. Pour plus d'explications sur la signification de chaque information analytique, consultez Interprétation des informations analytiques d'un jeu de données.

Interprétation des informations analytiques d'un jeu de données

Les tableaux suivants fournissent des renseignements plus détaillés sur les informations analytiques possibles susceptibles d'apparaître dans le schéma.

Informations générales

Informations sur le jeu de données — Général
InformationsSignificationImpact sur la configurationMoment où l'information est déterminéeRéférences supplémentaires
ConstanteLa colonne contient la même valeur pour toutes les lignes.La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse.Avant et après l'exécution de la versionCardinalité
Encodage one-hotLe type de caractéristique est catégorique et la colonne comporte moins de 14 valeurs uniques.Aucun effet sur la configuration.Avant et après l'exécution de la versionEncodage catégorique
Traité(e) avec impact encodingLe type de caractéristique est catégorique et la colonne comporte au moins 14 valeurs uniques.Aucun effet sur la configuration.Avant et après l'exécution de la versionEncodage catégorique
Cardinalité élevéeLa colonne comporte un trop grand nombre de valeurs uniques et peut affecter négativement les performances du modèle si elle est utilisée comme caractéristique.La colonne ne peut pas être utilisée comme cible. Elle sera automatiquement exclue en tant que caractéristique, mais elle peut tout de même être incluse, si nécessaire.Avant et après l'exécution de la versionCardinalité
Données clairseméesLa colonne comporte un trop grand nombre de valeurs nulles.La colonne ne peut pas être utilisée comme cible ni comme caractéristique incluse.Avant et après l'exécution de la versionImputation des valeurs nulles
Classe sous-représentéeLa colonne a une classe de moins de 10 lignes.La colonne ne peut pas être utilisée comme cible, mais elle peut être incluse comme caractéristique.Avant et après l'exécution de la version-
Échec de la transformation de la caractéristiqueLe type de caractéristique d'une caractéristique a été modifié manuellement par rapport à son type par défaut. Avec cette configuration, il s'est produit une erreur.La version de l'expérimentation ne peut pas s'exécuter correctement avec cette transformation de caractéristique. Rétablissez le type de caractéristique de la caractéristique à sa valeur précédente ou excluez la caractéristique de l'apprentissage.Après l'exécution de la versionModification des types de caractéristiques

Informations d'ingénierie automatique des caractéristiques

Informations sur le jeu de données — Ingénierie automatique des caractéristiques
InformationsSignificationImpact sur la configurationMoment où l'information est déterminéeRéférences supplémentaires
<nombre de> caractéristiques auto-conçuesLa colonne est la caractéristique parente qui peut être utilisée pour générer des caractéristiques auto-conçues.Si cette caractéristique parente est interprétée comme une caractéristique de date, elle est automatiquement supprimée de la configuration. Il est recommandé d'utiliser plutôt les caractéristiques de date auto-conçues qui peuvent être générées à partir de celle-ci. Il est possible d'outrepasser ce paramètre et d'inclure la caractéristique au lieu des caractéristiques auto-conçues.Avant et après l'exécution de la versionIngénierie automatique des caractéristiques
Caractéristique auto-conçueLa colonne est une caractéristique auto-conçue qui peut être générée à partir d'une caractéristique de date parente, ou qui l'a été. Elle n'apparaissait pas dans le jeu de données d'origine.Vous pouvez supprimer une ou plusieurs de ces caractéristiques auto-conçues pendant l'apprentissage de votre expérimentation. Si vous modifiez le type de caractéristique de la caractéristique parente en catégorique, toutes les caractéristiques auto-conçues sont supprimées.Avant et après l'exécution de la versionIngénierie automatique des caractéristiques
Impossible de traiter comme dateLa colonne inclut éventuellement des informations de date et d'heure, mais n'a pas pu être utilisée pour créer des caractéristiques de date auto-conçues.La caractéristique est retirée de la configuration. Si des caractéristiques auto-conçues ont été précédemment générées à partir de cette caractéristique parente, elles sont supprimées des futures versions de l'expérimentation. Vous pouvez toujours utiliser la caractéristique dans l'expérimentation, mais vous devez changer son type de caractéristique en catégorique.Après l'exécution de la versionIngénierie des caractéristiques de date
Texte libre possibleIl se peut que la colonne puisse être utilisée comme une caractéristique de type texte libre.Le type de caractéristique Texte libre est attribué à la colonne. Vous devez exécuter une version d'expérimentation pour vérifier si la caractéristique peut être traitée sous forme de texte libre.Avant l'exécution de la versionTraitement des données de type texte libre
Texte libreLa colonne a été confirmée comme contenant un texte libre. Elle peut être traitée sous forme de texte libre.Aucune configuration supplémentaire de la caractéristique n'est nécessaire.Après l'exécution de la versionTraitement des données de type texte libre
Impossible de traiter comme texte libreUne analyse plus poussée confirme que la colonne ne peut pas être traitée sous forme de texte libre.Vous devez désélectionner la caractéristique de la configuration pour la version d'expérimentation suivante. Sinon, si la caractéristique ne présente pas de forte cardinalité, vous pouvez remplacer le type de caractéristique par Catégorique.Après l'exécution de la versionTraitement des données de type texte libre

Informations sur l'optimisation de modèle intelligente

Informations sur le jeu de données — Optimisation de modèle intelligente
InformationsSignificationImpact sur la configurationMoment où l'information est déterminéeRéférences supplémentaires
Fuite de la cibleLa caractéristique est soupçonnée d'être affectée par une fuite de la cible. Si c'est le cas, cela inclut des informations sur la colonne cible que vous tentez de prédire. Les caractéristiques avec une fuite de la cible peuvent vous donner une mauvaise impression d'assurance quant aux performances du modèle. Dans les prédictions dans le monde réel, elles sont la cause des très mauvaises performances du modèle.La caractéristique n'a pas été utilisée pour effectuer l'apprentissage du modèle.Après l'exécution de la versionFuite de données
Importance basse de permutationLa fonction n'a pas beaucoup d'influence, voire aucune influence, sur les prédictions du modèle. L'exclusion de ces caractéristiques améliore les performances du modèle en réduisant les parasites statistiques.La caractéristique n'a pas été utilisée pour effectuer l'apprentissage du modèle.Après l'exécution de la versionFamiliarisation avec le concept de permutation importance
Fortement corréléeLa caractéristique est fortement corrélée avec une ou plusieurs autres caractéristiques de l'expérimentation. Le fait d'avoir des caractéristiques très corrélées les unes avec les autres réduit les performances du modèle.La caractéristique n'a pas été utilisée pour effectuer l'apprentissage du modèle. La caractéristique avec laquelle elle est fortement corrélée n'a pas été exclue en raison d'une forte corrélation, mais peut l'avoir été pour une autre raison telle qu'une faible permutation importance.Après l'exécution de la versionCorrélation

Informations sur la projection de série temporelle

Informations sur le jeu de données — Projection de série temporelle
InformationsSignificationImpact sur la configurationMoment où l'information est déterminéeRéférences supplémentaires
Indexation possible de datesLa caractéristique peut éventuellement être utilisée comme index de date pour l'expérimentation de série temporelle.

Si elle est utilisée comme index de date de série temporelle, les données de la colonne peuvent affecter certains aspects de la configuration de la série temporelle tels que la durée de la projection dans le futur.

Les valeurs de l'index de date doivent augmenter à chaque ligne ou valeur de groupe unique à un intervalle de temps fixe.

Avant l'exécution de la version

Utilisation d’expérimentations de série temporelle

Index de date

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.