Accéder au contenu principal Passer au contenu complémentaire

Définition des indicateurs sur les colonnes

Après avoir défini les colonnes à analyser, configurez des indicateurs système ou personnalisés pour chacune des colonnes définies.

Définir des indicateurs système ou personnalisés

Before you begin

Une analyse de colonne(s) doit être ouverte dans l'éditeur de la perspective Profiling du Studio Talend.

Procedure

  1. Dans la section Data Preview (Apreçu des données) dans l'éditeur d'analyse, cliquez sur Select indicators (Sélectionner les indicateurs) pour ouvrir la boîte de dialogue Indicator Selection (Sélection d'indicateurs).
  2. Dans la boîte de dialogue Indicator Selection :
    Note InformationsNote:

    Il n'est pas très utile d'utiliser les statistiques de fréquence des modèles sur une colonne de type Date dans des bases de données, lors de l'exécution de l'analyse avec le moteur SQL. Aucune erreur de qualité de données n'est retournée par l'indicateur, car toutes les dates sont affichées selon un format.

    Si vous attachez Date Pattern Frequency à une colonne de date dans votre analyse, vous pouvez générer une expression régulière de date à partir des résultats de l'analyse.

  3. Cliquez sur OK.
    Les indicateurs sélectionnés sont attachés aux colonnes analysées dans la vue Analyzed Columns (Colonnes analysées).
    L'analyse de cet exemple fournit/calcule :
    • les statistiques simples de toutes les colonnes,
    • les caractéristiques des champs textuels, à l'aide d'indicateurs de statistiques textuelles et le nombre de valeurs les plus fréquentes pour chaque enregistrement distinct dans les indicateurs,
    • les modèles dans la colonne email pour afficher les modèles fréquents et rares, afin que vous puissiez identifier plus facilement les problèmes de qualité de données, à l'aide d'indicateurs de statistiques de fréquence de modèle,
    • l'écart, l'écart interquartile, ainsi que les valeurs moyenne et médiane des données numériques dans la colonne total_sales, à l'aide d'indicateurs de statistiques de résumé,
    • la fréquence des chiffres 1 à 9 dans les chiffres de ventes, afin de détecter la fraude, à l'aide des indicateurs de détection de fraude.

Définir les options pour les indicateurs système ou personnalisés

Before you begin

Une analyse de colonne(s) doit être ouverte dans l'éditeur. Pour plus d'informations, consultez Définir les colonnes à analyser.

About this task

Vous pouvez définir des seuils attendus sur la valeur de l'indicateur. Le seuil que vous définissez est utilisé pour mesurer la qualité des données. Si la valeur de l'indicateur est en dehors du seuil défini, les données sont de mauvaise qualité. Vous pouvez définir un seuil ou aucun seuil. Vous pouvez configurer ces seuils en valeur ou en pourcentage, en respectant le nombre de lignes.

Pour plus d'informations concernant la définition des indicateurs, consultez Définir des indicateurs système ou personnalisés.

Procedure

  1. Dans la vue Analyzed Columns (Colonnes analysées) de l'éditeur d'analyse, cliquez sur l'icône Options à côté de l'indicateur.
  2. Dans la boîte de dialogue ouverte, configurez les paramètres pour l'indicateur donné.
    Par exemple, si vous souhaitez préciser qu'il y a des valeurs nulles dans la colonne que vous souhaitez analyser, vous pouvez saisir la valeur 0 dans le champ Upper threshold pour l'indicateur Null Count.
    Vue d'ensemble de la boîte de dialogue Indicator Settings (Paramètres de l'indicateur).

    Les boîtes de dialogue des paramètres des différents indicateurs diffèrent selon les paramètres spécifiques à chaque indicateur. Pour plus d'informations concernant les paramètres des différents indicateurs, consultez Paramètres des indicateurs.

  3. Cliquez sur Finish pour fermer la boîte de dialogue.
  4. Sauvegardez l'analyse.

Définir les indicateurs personnalisés dans l'éditeur d'analyses

Before you begin

Pour définir des indicateurs personnalisés dans l'éditeur d'analyses pour les colonnes à analyser, procédez comme suit :

Procedure

  1. Vous pouvez :
    1. Dans l'éditeur d'analyses et dans la vue Analyzed Columns (Colonnes analysées), cliquez sur Add UDI (Ajouter un indicateur personnalisé) à côté du nom de la colonne que vous souhaitez définir comme indicateur.
      La boîte de dialogue [UDI Selector] s'ouvre.
      Emplacement de l'icône Add UDI (Ajouter un indicateur personnalisé) et boîte de dialogue Overview of the UDI Selector (Vue d'ensemble du sélecteur d'indicateur personnalisé).
    2. Sélectionnez les indicateurs personnalisés puis cliquez sur OK.
  2. Soit :
    1. Dans la vue DQ Repository, développez successivement les nœuds Libraries > Indicators.
    2. Dans le dossier User Defined Indicator, glissez les indicateurs personnalisés par rapport auxquels vous souhaitez analyser le contenu de la colonne sur le nom de la colonne dans la vue Analyzed Columns.
      L'indicateur personnalisé s'affiche sous le nom de la colonne.
    3. Optional: Configurez un seuil pour l'indicateur personnalisé.
    4. Sauvegardez l'analyse.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.