Accéder au contenu principal Passer au contenu complémentaire

Définir les colonnes à analyser

La première étape lors de l'analyse du contenu d'une ou plusieurs colonne·s est de définir la·es colonne·s à analyser. Les résultats d'analyse fournissent des statistiques concernant les valeurs dans chaque colonne.

Avant de commencer

Au moins une connexion à une base de données doit avoir été définie dans la perspective Profiling du Studio Talend.

Pourquoi et quand exécuter cette tâche

Lorsque vous choisissez d'analyser des colonnes de type Date et que vous exécutez l'analyse avec un moteur Java, les informations de date sont stockées dans le Studio Talend et dans le datamart au format de date YYYY-MM-DD HH:mm:ss et d'heure HH:mm:ss.SSS. Les formats de date et heure sont légèrement différents lorsque vous exécutez l'analyse avec un moteur SQL.

Définir l'analyse de colonnes simple

Procédure

  1. Dans la vue DQ repository (Référentiel DQ), développez le nœud Data Profiling (Profiling de données) et cliquez-droit sur Analyses > New analysis (Nouvelle analyse).
    Menu contextuel du nœud Analyses.
    L'assistant Create new analysis (Créer une analyse) s'ouvre.
  2. Sélectionnez Column (Colonne) > Basic column analysis (Analyes de colonne simple) et cliquez sur Create (Créer).
  3. Dans le champ Name, saisissez un nom pour l'analyse de colonne.
    Note InformationsImportant :

    N'utilisez pas les caractères spéciaux suivants dans le nom des éléments : ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " « » < >

    Ces caractères seront remplacés par un "_" dans le système de fichiers et vous risquez de créer des doublons.

  4. Facultatif : Configurez les métadonnées de l'analyse de colonnes (Purpose (Objectif), Description et Author (Auteur)) dans les champs correspondants, puis cliquez sur Next.

Sélectionner les colonnes de base de données et configurer les données d'exemple

Procédure

  1. Dans le menu Connection (Connexion), sélectionnez la connexion et cliquez sur Next (Suivant).
    Note InformationsRemarque : Pour la base de données DB2, si des guillemets doubles existent dans le nom des colonnes d'une table, les guillemets doubles ne peuvent être récupérés avec les colonnes. Il est donc recommandé de ne pas utiliser de guillemet double dans le nom des colonnes dans les tables de la base de données DB2.
  2. Cochez la case Run with sample data (Exécuter avec les données d'exemple) pour exécuter l'analyse uniquement sur le jeu de données d'exemple, dans le champ Limit (Limite).
  3. Dans le menu Columns (Colonnes), cliquez sur Select columns (Sélectionner des colonnes. Un aperçu des données s'affiche.
    Vous pouvez effectuer différentes actions depuis ce menu :
    • Select Columns : ouvrir la boîte de dialogue Column Selection dans laquelle vous pouvez sélectionner les colonnes à analyser ou modifier la sélection des colonnes listées dans la table. Dans la boîte de dialogue ouverte, vous pouvez filtrer la liste des tables ou des colonnes à l'aide des champs Table filter et Column filter, respectivement.
    • Refresh Data : afficher les données dans les colonnes sélectionnées selon les critères définis.
    • New Connection : ouvrir un assistant et créer une connexion à la source de données depuis l'éditeur.

      Le champ Connection en haut de cette section liste toutes les connexions créées dans le Studio Talend.

    • n first rows ou n random rows : lister dans la table les N premiers enregistrements de données des colonnes sélectionnées ou lister N enregistrements aléatoires des colonnes sélectionnées.
  4. Cliquez sur Next (Suivant) pour configurer les indicateurs sur les colonnes.
  5. Dans le menu Indicators (Indicateurs), cliquez sur Select Indicators (Sélectionner des indicateurs) et sélectionnez les indicateurs à utiliser pour profiler les colonnes.
    Si l'une des colonnes que vous souhaitez analyser est une clé primaire ou étrangère, son type de data mining devient automatiquement Nominal lorsque vous la listez dans la vue Analyzed Columns.
    Pour plus d'informations, consultez Types de data mining.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.