Accéder au contenu principal Passer au contenu complémentaire

Configuration du calcul de la qualité des données

Une fois que vous avez calculé pour la première fois la qualité des données de votre jeu de données, vous avez la possibilité d'actualiser ce calcul et de le personnaliser en fonction de vos besoins.

Note InformationsVous avez besoin d'un abonnement Qlik Talend Cloud Enterprise.

Sélection de la taille d'échantillon et du mode de traitement

Afin de pouvoir personnaliser la taille d'échantillon pour le calcul de la qualité, vous devez avoir cliqué une fois sur Calculer sur votre jeu de données.

  1. Depuis Qlik Talend Data Integration > Catalogue, ouvrez votre jeu de données.

  2. Selon la manière dont vous souhaitez calculer la qualité des données :

    • Cliquez sur Actualiser pour recalculer la qualité des données en utilisant les paramètres précédemment appliqués.

    • Cliquez sur la flèche vers le bas à côté du bouton Actualiser pour développer le panneau Qualité et profilage et personnaliser le nouveau calcul.

  3. Dans Taille d'échantillon, saisissez la taille de l'échantillon sur lequel vous souhaitez calculer la qualité des données :

    • Nombre de lignes : saisissez le nombre de lignes sur lesquelles vous souhaitez calculer la qualité des données. La valeur maximale est de 100 000 lignes en mode pullup ; il n'existe pas de valeur maximale en mode pushdown.

    • Pourcentage du jeu de données : sinon, saisissez le pourcentage du jeu de données sur lequel vous souhaitez calculer la qualité des données. Les valeurs décimales ne sont pas autorisées. Pour les jeux de données volumineux, si 1 % du jeu de données représente plus que le nombre maximal de lignes autorisé (100 000 lignes), cette option n'est pas affichée.

  4. Dans Mode de traitement, sélectionnez le mode de traitement à utiliser lors du calcul de la qualité des données :

    • Pushdown : actuellement disponible uniquement pour les jeux de données Snowflake et Databricks. Cela déclenche le calcul de la qualité côté base de données, ce qui consomme des crédits Snowflake ou des unités Databricks (DBU).

    • Pullup : disponible pour tous les jeux de données. Cela déclenche le calcul de la qualité dans Qlik Cloud.

  5. Cliquez sur Actualiser pour recalculer la qualité des données en fonction de vos paramètres.

Les indicateurs de qualité des données ainsi que la taille d'échantillon sont affichés dans la Vue d'ensemble. Le temps de traitement dépend de la taille d'échantillon. Notez que l'aperçu des données affiche toujours uniquement 100 enregistrements.

Note InformationsImpossible de calculer la qualité de données des jeux de données ayant plus de 500 colonnes.

Le calcul de la qualité des données peut également être déclenché et personnalisé par l'intermédiaire de l'API publique Qlik correspondante.

Pour la planification de la qualité des données, le modèle Qlik Automate Planifier des calculs de qualité des données peut être utilisé. Consultez All templates pour plus d'informations.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.