Accéder au contenu principal Passer au contenu complémentaire

Évaluation de la qualité des données

Après avoir ouvert un jeu de données, vous pouvez consulter plusieurs sections de la vue d'ensemble pour en savoir plus sur sa qualité générale, son schéma, les statistiques de qualité et les types sémantiques de chaque colonne.

Note InformationsVous avez besoin d'un abonnement Qlik Talend Cloud Enterprise.

Indicateurs de qualité du jeu de données

Note InformationsUne connexion Qlik Cloud Analytics est nécessaire pour calculer la qualité et le profilage de vos jeux de données. Pour plus d'informations, consultez Qualité des données des jeux de données basés sur des connexions

Lorsque vous ouvrez la vue d'ensemble d'un jeu de données qui vient d'être enregistré, la plupart des informations sont grisées. Pour calculer la qualité des données pour la première fois, cliquez sur le bouton Calculer. Si la qualité des données a déjà été calculée une fois auparavant, mais que vous souhaitez vous assurer que les données sont à jour, cliquez sur Actualiser.

Chaque calcul ou actualisation en mode pushdown entraînera des coûts dans votre entrepôt de données cloud (Snowflake ou Databricks). Pour plus d'informations, consultez Qualité des données des jeux de données basés sur des connexions.

Il existe deux principales sections dans lesquelles la qualité est affichée.

  • La section Qualité des données, qui inclut :

    • La répartition des valeurs valides, non valides et vides dans le jeu de données tout entier sous la forme d'une barre de qualité avec trois couleurs et leurs pourcentages respectifs.

    • Un score de Validité exprimant le pourcentage de valeurs valides sans tenir compte des valeurs vides.

    • Un score de Complétude exprimant le pourcentage de valeurs qui ne sont pas vides.

  • La section Schéma, qui indique les différents champs du jeu de données, le type de données ou le type sémantique appliqué et une barre de qualité pour chaque champ du jeu de données.

Note ConseilPour les jeux de données basés sur les connexions, si la récupération du schéma et de la qualité du jeu de données échoue, vérifiez que la connexion que vous avez configurée dans le hub Services d'analyse Qlik comporte le champ Rôle correctement renseigné ou que le rôle lui-même accorde les autorisations nécessaires sur la table de base de données.

Découverte des types sémantiques

À chaque colonne d'un jeu de données est automatiquement affecté un type sémantique pour mieux décrire son contenu. En arrière-plan, une opération de découverte des données est effectuée pour déterminer le type à attribuer.

Vous pouvez également créer des types sémantiques et gérer les valeurs de chaque type sémantique.

Pour plus d'informations, consultez Gérer les types sémantiques.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.