Accéder au contenu principal Passer au contenu complémentaire

Créer une analyse

Créer une analyse de contenu d'une base de données

Dans la perspective Profiling du Studio Talend, vous pouvez créer une analyse pour examiner le contenu d'une base de données spécifiée.

About this task

Avant de commencer, vous devez avoir défini au moins une connexion de base de données dans la perspective Profiling du Studio Talend.

Pour créer une analyse de contenu d'une base de données, vous devez d'abord définir l'analyse correspondante puis sélectionner la connexion à la base de données que vous souhaitez analyser.

Dans la vue Statistical information, vous pouvez :
  • Cliquer sur un catalogue ou un schéma pour lister toutes les tables ainsi qu'un résumé de leur contenu : nombre de lignes, clés et index personnalisés.

    Le catalogue ou schéma sélectionné est surligné en bleu. Les catalogues ou schémas surlignés en rouge indiquent des problèmes potentiels dans les données.

  • Cliquez-droit sur un catalogue ou schéma et sélectionnez Overview analysis pour analyser le contenu de l'élément sélectionné.
  • Cliquez-droit sur une table ou une vue et sélectionner Table analysis pour créer une analyse de table sur l'élément sélectionné.
  • Cliquer sur un en-tête dans la table analytique pour trier les données listées dans les catalogues ou schémas par ordre alphabétique.

Définir l'analyse de vue d'ensemble de connexion

Procedure

  1. Dans la vue DQ Repository, développez le nœud Data Profiling.
  2. Cliquez-droit sur le dossier Analyses et sélectionnez New Analysis.
    L'assistant Create New Analysis s'ouvre.
    Vue d'ensemble de l'assistant Create New Analysis (Créer une analyse).
  3. Dans le champ de filtre, commencez à saisir connection overview analysis, sélectionnez Connection Overview Analysis dans la liste qui s'affiche et cliquez sur Next.
    Exemple de nom, d'objectif et de description d'une analyse.
    Vous pouvez créer une analyse de contenu de base de données via une procédure utilisant des raccourcis, si vous cliquez-droit sur la base de données sous Metadata > DB connections et sélectionnez Overview analysis dans le menu contextuel.
  4. Dans le champ Name, saisissez un nom pour l'analyse.
    Note InformationsImportant:

    N'utilisez pas les caractères spéciaux suivants dans le nom des éléments : ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " « » < >

    Ces caractères seront remplacés par un "_" dans le système de fichiers et vous risquez de créer des doublons.

  5. Définissez les métadonnées de l'analyse : Purpose, Description et Author (objectif, description et nom de l'auteur) dans les champs correspondants puis cliquez sur Next.

Sélectionner la connexion à la base de données que vous souhaitez analyser

Procedure

  1. Développez le nœud DB Connections et sélectionnez une connexion à analyser, s'il y en a plus d'une.
  2. Cliquez sur Next.
  3. Configurez les filtres sur les tables et les vues à analyser dans les champs correspondants, à l'aide du langage SQL.
    Exemple de valeurs dans les champs Table name filter (Filtre sur le nom des tables) et View name filter (Filtre sur le nom de vue).
    Par défaut, l'analyse examine toutes les tables et les vues de la base de données.
  4. Cliquez sur Finish pour fermer l'assistant Create New Analysis.
    Un dossier pour l'analyse nouvellement créée s'affiche sous le dossier Analyses dans la vue DQ Repository, et l'éditeur de connexion s'ouvre avec les métadonnées définies.
    Vue d'ensemble de la section Analysis Metadata (Métadonnées d'analyse) contenant les métadonnées définies.
    Note InformationsNote: L'affichage de l'éditeur de connexion dépend des paramètres que vous avez configurés dans la boîte de dialogue Preferences. Pour plus d'informations, consultez Configurer les préférences des éditeurs et des résultats d'analyse.
  5. Dans la vue Analysis Parameters, procédez comme suit :
    1. Dans le champ Number of connections per analysis, configurez le nombre de connexions concourantes autorisées par analyse pour la base de données sélectionnée.
      Vous pouvez configurer ce nombre selon les ressources disponibles de la base de données, c'est-à-dire le nombre de connexions concourantes que chaque base de données peut supporter.
    2. Vérifiez et modifiez les filtres sur les tables et les vues, s'il y en a.
      Vous pouvez utiliser des valeurs de contexte.
    3. Si vous souhaitez recharger toutes les bases de données de votre connexion sur le serveur lors de l'exécution des analyses de vue d'ensemble, cochez la case Reload databases.
      Lorsque vous tentez de recharger une base de données, un message vous demande confirmation, car toute modification de la structure de la base de données peut affecter les analyses existantes.
  6. Dans la vue Context Settings (Paramètres de contexte), sélectionnez dans la liste l'environnement de contexte à utiliser pour exécuter l'analyse.
    La table dans cette vue liste tous les environnements de contexte et la valeur que vous leur avez définie dans la vue Context (Contexte), dans l'éditeur d'analyse. Pour plus d'informations, consultez Utilisation des variables de contexte dans les analyses.
  7. Appuyez sur F6 pour exécuter l'analyse.
    Un message s'ouvre au bas de l'éditeur pour confirmer que l'opération est en cours et que les résultats d'analyse sont ouverts dans la vue Analysis Results.

Créer une analyse de catalogue ou de schéma

Vous pouvez utiliser la perspective Profiling du Studio Talend pour analyser un schéma ou catalogue spécifique dans une base de données, si cette entité est utilisée dans la structure physique de la base de données.

Le résultat de l'analyse fournit des informations analytiques concernant le contenu du schéma, par exemple son nombre de lignes, son nombre de tables, le nombre de lignes par table, etc.

Before you begin

Au moins une connexion à une base de données doit avoir été créée pour vous connecter à une base de données utilisant l'entité "catalogue" ou "schéma". Pour plus d'informations, consultez Se connecter à une base de données.

Procedure

  1. Sous DB connections, dans la vue DQ Repository, cliquez-droit sur le catalogue ou schéma pour lequel vous souhaitez créer l'analyse de contenu, puis sélectionnez Overview analysis dans le menu contextuel.
    Cet exemple vous montre comment créer une analyse de schéma.
  2. Dans l'assistant qui s'ouvre, saisissez un nom pour l'analyse.
    Note InformationsImportant:

    N'utilisez pas les caractères spéciaux suivants dans le nom des éléments : ~ ! ` # ^ * & \\ / ? : ; \ , . ( ) ¥ ' " « » < >

    Ces caractères seront remplacés par un "_" dans le système de fichiers et vous risquez de créer des doublons.

  3. Si nécessaire, configurez les métadonnées de l'analyse (objectif, description et auteur) dans les champs correspondants, puis cliquez sur Next.
  4. Configurez les filtres sur les tables et les vues à analyser dans les champs correspondants, à l'aide du langage SQL.
    Par défaut, l'analyse examine toutes les tables et vues dans le catalogue.
    Exemple de valeurs dans les champs Table name filter (Filtre sur le nom des tables) et View name filter (Filtre sur le nom de vue).
  5. Cliquez sur Finish.
    Un dossier pour l'analyse nouvellement créée s'affiche sous le nœud Analysis dans la vue DQ Repository, et l'éditeur d'analyse s'ouvre avec les métadonnées définies de l'analyse.
  6. Appuyez sur F6 pour exécuter l'analyse.
    Un message s'ouvre au bas de l'éditeur pour confirmer que l'opération est en cours et que les résultats d'analyse sont ouverts dans la vue Analysis Results.

    Dans la vue Statistical information, vous pouvez :

    • Cliquer sur le schéma pour lister toutes les tables ainsi qu'un résumé de leur contenu : nombre de lignes, clés et index personnalisés.

      Le schéma sélectionné est surligné en bleu. Les schémas surlignés en rouge indiquent des problèmes potentiels dans les données.

    • Cliquer-droit sur un schéma et sélectionner Overview analysis pour analyser le contenu de l'élément sélectionné.

    • Cliquez-droit sur une table ou une vue et sélectionner Table analysis pour créer une analyse de table sur l'élément sélectionné. Vous pouvez également voir les clés et index d'une table sélectionnée. Pour plus d'informations, consultez Affichage des clés et des index des tables de base de données.

    • Cliquer sur un en-tête dans la table analytique pour trier les données listées par ordre alphabétique.

    Actions possibles depuis la section Statistical information (Informations statistiques).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.