Accéder au contenu principal Passer au contenu complémentaire

Finaliser et exécuter l'analyse d'un ensemble de colonnes

Avant de commencer

Une analyse d'un ensemble de colonnes doit déjà avoir été configurée dans la perspective du .

Procédure



  1. Si vous sélectionnez le moteur Java, la case Store data (Stocker les données) est cochée par défaut et ne peut être décochée. Une fois l'analyse exécutée, les résultats du profiling sont disponibles localement. Vous pouvez les explorer depuis la vue des résultats d'analyse > Data (Données).

    Exécuter l'analyse avec le moteur Java utilise de l'espace disque car toutes les données sont récupérées et stockées localement. Si vous souhaitez libérer de l'espace, vous pouvez supprimer les données stockées dans le répertoire suivant du Studio : Talend-Studio>workspace>project_name>Work_MapDB.

    Si vous sélectionnez le moteur SQL, vous pouvez utiliser la case Store data (Stocker les données) pour décider de stocker localement les données analysées et d'y accéder via les résultats d'analyse.
    Note InformationsRemarque : Si les données en cours d'analyse sont très volumineuses, il est recommandé de ne pas cocher la case Store data pour ne pas stocker les résultats à la fin des calculs de l'analyse.


  2. Cliquez sur Save and run.
    Vue d'ensemble de la section Simple Statistics (Statistiques simples) dans les résultats d'analyse.

    L'éditeur d'analyse passe à la vue des résultats d'analyse dans laquelle vous pouvez lire les résultats d'analyse dans des tables et des diagrammes. Les résultats graphiques fournissent les statistiques simples sur les enregistrements complets de l'ensemble de colonnes analysées et non sur les valeurs au sein de chaque colonne séparément.

  3. Dans la table Simple Statistics, cliquez-droit sur un résultat d'indicateur et sélectionnez View Rows ou View Values.
    • Lorsque vous exécutez l'analyse avec le moteur Java, une liste des données analysées est ouverte dans la perspective .
    • Lorsque vous exécutez l'analyse avec le moteur SQL, une liste des données analysées est ouverte dans la perspective .
  4. Dans la vue Data (Données), cliquez sur Filter data (Filtrer les données) pour filtrer les données valides/invalides selon les modèles utilisés.
    Vous pouvez filtrer les données uniquement lorsque vous exécutez l'analyse avec le moteur Java.
    Pour plus d'informations, consultez Filtrer des données par rapport à des modèles.

Que faire ensuite

Vous pouvez générer un Job prêt à l'emploi pour regrouper les lignes valides/invalides et les écrire dans deux fichiers séparés. Dans la table All Match, cliquez-droit sur la ligne de résultat et sélectionnez Generate an ETL job to handle rows. Le Job sera créé dans la perspective .
Note InformationsRestriction : La table All Match est disponible uniquement lorsque vous exécutez l'analyse avec le moteur Java.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.