Accéder au contenu principal Passer au contenu complémentaire

Créer une analyse de profiling sur un fichier ADLS Databricks via Hive

Après avoir créé une connexion à un cluster ADLS Databricks via Hive, vous pouvez créer une analyse de profiling sur un fichier spécifique.

Avant de commencer

Procédure

  1. Dans la vue DQ Repository, développez Metadata > DB Connections > la connexion JDBC > Tables.
  2. Dans le dossier Columns, sélectionnez les colonnes à analyser et cliquez-droit sur celles-ci.
    Note InformationsConseil : Pour créer une analyse sur toutes les colonnes, cliquez-droit sur le nom de la table.
  3. Passez votre curseur sur Column Analysis et sélectionnez le type d'analyse.
    L'assistant Create New Analysis s'ouvre.
  4. Saisissez un nom et cliquez sur Finish. Les autres champs sont facultatifs.
    Une nouvelle analyse sur le fichier ADLS sélectionné est automatiquement créée et s'ouvre dans l'éditeur d'analyse. Selon le type d'analyse sélectionné, les indicateurs sont automatiquement attribués aux colonnes.

    L'analyse s'applique à la table Hive, mais calcule les statistiques des données depuis ADLS en utilisant le mécanisme External tables. External tables conserve les données du fichier original en dehors de Hive. Si le fichier ADLS que vous avez choisi d'analyser est supprimé, l'analyse ne peut plus s'exécuter.

  5. Si nécessaire :
    • Modifiez les colonnes à analyser : Dans l'onglet Data Preview, cliquez sur Select Columns.
    • Ajoutez plus d'indicateurs ou de nouveaux modèles aux colonnes : Dans l'onglet Analyzed Columns, cliquez sur Select Indicators.
  6. Exécutez l'analyse pour afficher les résultats dans la vue Analysis Results de l'éditeur.

Que faire ensuite

Vous pouvez créer un rapport sur cette analyse. Consultez Créer un rapport sur des analyses spécifiques.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.