Accéder au contenu principal Passer au contenu complémentaire

Configurer des indicateurs système

Cette analyse de colonnes utilise des indicateurs prêts à l'emploi pour fournir des statistiques simples comme le nombre de lignes, de valeurs vides et de valeurs en doublon dans les colonnes Email et Phone.

Avant de commencer

  • Vous avez ouvert la perspective Profiling dans le Studio Talend.

  • Vous avez créé une analyse de colonnes et défini la connexion à la base de données.

Procédure

  1. Dans la zone Data Preview dans l'éditeur d'analyse, cliquez sur Select indicators pour ouvrir la boîte de dialogue [Indicator Selection].
  2. Développez Simple Statistics et sélectionnez les indicateurs Row Count, Blank Count et Duplicate Count. Cliquez sur OK pour fermer l'assistant.

    Vous voulez consulter le nombre de lignes, de valeurs blanches et de valeurs en doublon dans les colonnes Email et Phone pour contrôler la cohérence des données.

    Des indicateurs sont ainsi ajoutés dans les colonnes qui se trouvent dans la zone Analyzed Columns.

  3. Cliquez sur l'icône Options près des indicateurs Duplicate Count (Nombre de doublons) et Blank Count (Nombre de blancs) et configurez une valeur de 0 dans le champ Upper threshold (Seuil supérieur).

    Définir des limites dans les colonnes Email and Phone est très utile car le nombre des valeurs blanches et des valeurs en doublon est indiqué en rouge dans les résultats d'analyse.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.