Accéder au contenu principal Passer au contenu complémentaire

Créer une analyse de colonnes

Cette procédure décrit les premières étape de la création d'une analyse de colonnes.

Vous trouverez davantage des détails dans les prochaines étapes de :

Procédure

  1. Dans la vue DQ repository (Référentiel DQ), développez le nœud Data Profiling (Profiling de données) et cliquez-droit sur Analyses > New analysis (Nouvelle analyse).
  2. Sélectionnez l'onglet Column (Colonne) et sélectionnez una analyse :
    • Basic Column Analysis (Analyse de colonne simple) : génère une analyse de colonnes vide dans laquelle vous pouvez sélectionner les colonnes à analyser et attribuer manuellement les indicateurs sur chaque colonne.

      Pour plus d'informations, consultez Créer une analyse simple sur une colonne d'une base de données.

    • Discrete data analysis (Analyse de données discrètes) : crée une analyse de colonnes sur des données numériques préconfigurées avec les indicateurs Bin Frequency (Fréquence des intervalles) et Simple Statistics (Statistiques simples). Vous pouvez configurer plus l'analyse ou la modifier afin de convertir des données continues en données discrètes (écarts) selon vos besoins.

      Pour plus d'informations, consultez Analyse de données discrètes.

    • Nominal values analysis (Analyse des valeurs nominales) : crée une analyse de colonnes sur les données nominales préconfigurées avec les indicateurs correspondant aux données nominales, à savoir les indicateurs Value Frequency (Fréquence des valeurs), Simple Statistics (Statistiques simples) et Text Statistics (Statistiques de texte).

      Pour des exemples de résultats sur ces statistiques, consultez Finaliser et exécuter l'analyse de colonnes.

    • Pattern Frequency Analysis (Analyse de fréquence des modèles): crée une analyse de colonnes préconfigurée avec les indicateurs Pattern Frequency (Fréquence des modèles), Pattern Low Frequency (Basse fréquence des modèles), Row count (Nombre de lignes) et Null count (Nombre de nulls).

      Cette analyse peut acquérir des connaissances au sujet des modèles dans vos données. Elle montre les modèles fréquents et les modèles rares, afin que vous puissiez identifier les problèmes de qualité de données plus facilement.

      Pour des exemples de résultats sur ces statistiques, consultez Finaliser et exécuter l'analyse de colonnes.

    • Summary Statistics Analysis (Analyse de résumé statistique) : crée une analyse de colonnes sur des données numériques préconfigurées avec les indicateurs Summary Statistics (Résumé statistique), Row count (Nombre de lignes) et Null count (Nombre de nulls).

      Cela vous permet d'avoir une bonne idée de la forme de vos données numériques en calculant l'écart, l'écart interquartile et les valeurs médiane et moyenne.

      Pour un exemple d'utilisation de Summary Statistics, consultez Définir des indicateurs système ou personnalisés et Finaliser et exécuter l'analyse de colonnes.

    • Availability-noteDeprecated
      Semantic Discovery Analysis (Analyse d'exploration sémantique) : crée une analyse de colonnes préconfigurée avec des indicateurs et modèles convenant aux données après exploration des catégories sémantiques des colonnes de données et utilisation de concepts associés du référentiel sémantique.

      Pour plus d'informations, consultez Analyse d'exploration sémantique.

  3. Les étapes du profiling de données d'une ou plusieurs colonnes sont les suivantes :
    1. Connexion à la source de données. Pour plus d'informations, consultez Créer des connexions aux différentes sources de données.
    2. Définition d'une ou plusieurs colonnes sur lesquelles effectuer des processus de profiling de données.
      Cela permet de définir le contenu, la structure et la qualité des données des colonnes analysées.
    3. Configuration des paramètres des indicateurs système prédéfinis ou personnalisés sur les colonnes à analyser ou à monitorer.
      Ces indicateurs représenteront les résultats atteints grâce à l'implémentation de différents modèles.
    4. Ajout aux colonnes des modèles par rapport auxquels vous souhaitez définir le contenu, la structure et la qualité des données.
    5. Génération de rapports à partir de ces analyses et partage des résultats avec les membres d'une même équipe.
      Ces rapports vous permettent de comparer les statistiques actuelles et historiques afin de déterminer s'il y a eu amélioration ou détérioration des données. Pour plus d'informations concernant les rapports, consultez Reports (Rapports).

Que faire ensuite

La section Créer une analyse simple sur une colonne d'une base de données explique les procédures d'analyse de contenu d'une ou de plusieurs colonnes dans une base de données.

La section Création d'une analyse de colonnes simple dans un fichier explique les procédures d'analyse de colonnes dans des fichiers délimités.

Studio Talend Le Studio vous propose des modes de verrouillage vous permettant, si vous êtes le·a premier·ère utilisateur·trice à ouvrir un élément et de le verrouiller. les autres utilisateurs et utilisatrices·rices qui ouvrent simultanément le même élément n'ont qu'un accès en lecture seule. Pour plus d'informations, consultez Principe de verrouillage.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.