Évaluation de la qualité des données

Après avoir ouvert un jeu de données, vous pouvez consulter plusieurs sections de la vue d'ensemble pour en savoir plus sur sa qualité générale, son schéma, les statistiques de qualité et les types sémantiques de chaque colonne.

Vous avez besoin d'un abonnement Qlik Talend Cloud Enterprise.

Indicateurs de qualité du jeu de données

Une connexion Qlik Cloud Analytics est nécessaire pour calculer la qualité et le profilage de vos jeux de données. Pour plus d'informations, consultez Qualité des données des jeux de données basés sur des connexions

Lorsque vous ouvrez la vue d'ensemble d'un jeu de données qui vient d'être enregistré, la plupart des informations sont grisées. Pour calculer la qualité des données pour la première fois, cliquez sur le bouton Calculer. Si la qualité des données a déjà été calculée une fois auparavant, mais que vous souhaitez vous assurer que les données sont à jour, cliquez sur Actualiser.

Chaque calcul ou actualisation en mode pushdown entraînera des coûts dans votre entrepôt de données cloud (Snowflake ou Databricks). Pour plus d'informations, consultez Qualité des données des jeux de données basés sur des connexions.

Il existe deux principales sections dans lesquelles la qualité est affichée.

La zone Qualité des données, qui comprend une barre de qualité avec trois couleurs et leurs pourcentages respectifs :
- Non valide (rouge) : affiche le pourcentage de valeurs du jeu de données qui sont considérées comme non valides.
- Vide (noir) : indique le pourcentage de valeurs qui sont vides.
- Valide (vert) : affiche le pourcentage de valeurs valides du jeu de données. Le pourcentage ne prend pas en compte les valeurs vides.
La section Schéma, qui indique les différents champs du jeu de données, le type de données ou le type sémantique appliqué et une barre de qualité pour chaque champ du jeu de données.

Pour les jeux de données basés sur les connexions, si la récupération du schéma et de la qualité du jeu de données échoue, vérifiez que la connexion que vous avez configurée dans le hub Services d'analyse Qlik comporte le champ Rôle correctement renseigné ou que le rôle lui-même accorde les autorisations nécessaires sur la table de base de données.

Découverte des types sémantiques

À chaque colonne d'un jeu de données est automatiquement affecté un type sémantique pour mieux décrire son contenu. En arrière-plan, une opération de découverte des données est effectuée pour déterminer le type à attribuer.

Vous pouvez également créer des types sémantiques et gérer les valeurs de chaque type sémantique.

Pour plus d'informations, consultez Gérer les types sémantiques.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Laissez vos commentaires ici