- Guide d'utilisation du Studio Talend
- Profiling de données et qualité de données
- Analyses de tables
- Analyser des tables dans des bases de données
- Créer une analyse de table simple (Analyse d'un ensemble de colonnes)
- Créer une analyse d'un ensemble de colonnes en utilisant des modèles
- Définir l'ensemble de colonnes à analyser
Sélectionner l'ensemble de colonnes à analyser
- Big Data Platform
- Cloud API Services Platform
- Cloud Big Data Platform
- Cloud Data Fabric
- Cloud Data Management Platform
- Data Fabric
- Data Management Platform
- Data Services Platform
- MDM Platform
- Real-Time Big Data Platform
Procédure
- Développez DB connections.
-
Dans la base de données de votre choix, parcourez l'arborescence jusqu'aux colonnes à analyser, sélectionnez-les et cliquez sur Finish pour fermer l'assistant.
Dans cet exemple, vous souhaitez analyser un ensemble de six colonnes dans la table customer : numéro de compte (account_num), scolarité (education), e-mail (email), prénom (fname), nom de famille (Iname) et sexe (gender). Les statistiques présentées dans les résultats d'analyse sont le nombre de lignes, de valeurs distinctes, de valeurs uniques et de valeurs en doublon s'appliquant sur tous les enregistrements (valeurs d'un ensemble de colonnes).Un dossier pour l'analyse nouvellement créée s'affiche sous le nœud Analyses dans la vue DQ Repository et l'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse. Des données d'exemple sont affichées dans la zone Data Preview et les colonnes sélectionnées sont affichées dans la zone Analyzed Column de l'éditeur de l'analyse.
Dans cet exemple, vous souhaitez analyser un ensemble de six colonnes dans la table customer : numéro de compte (account_num), études (education), e-mail (email), prénom (fname), nom de famille (Iname) et genre (gender). Les statistiques présentées dans les résultats d'analyse sont le nombre de lignes, de valeurs distinctes, de valeurs uniques et de valeurs en doublon s'appliquant sur tous les enregistrements (valeurs d'un ensemble de colonnes).
-
Dans la zone Data preview, sélectionnez :
Option Pour... New Connection (Nouvelle connexion) ouvrir un assistant et créer ou modifier la connexion à la source de données depuis l'éditeur. Le champ Connection en haut de cette zone liste toutes les connexions créées dans le Studio.
Select Columns ouvrir la boîte de dialogue Column Selection dans laquelle vous pouvez sélectionner les colonnes à analyser ou modifier la sélection des colonnes listées dans la table. Dans la boîte de dialogue ouverte, vous pouvez filtrer la liste des tables ou des colonnes à l'aide des champs Table filter et Column filter, respectivement.
n first rows ou n random rows lister dans la table les N premiers enregistrements de données des colonnes sélectionnées ou lister N enregistrements aléatoires des colonnes sélectionnées. Refresh Data (Actualiser les données) afficher les données dans les colonnes sélectionnées selon les critères définis. Run with sample data exécuter l'analyse uniquement sur le jeu de données d'exemple, dans le champ Limit. - Dans le champ Limit (Limite), configurez le nombre d'enregistrements de données que vous souhaitez afficher dans la table et utiliser comme données d'exemple.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.