Accéder au contenu principal Passer au contenu complémentaire

Vue détaillée du jeu de données

Lorsque vous cliquez sur un jeu de données depuis la liste des jeux de données, vous accédez à sa vue détaillée.

Note InformationsRemarque : Cette fonctionnalité est disponible pour les utilisateurs et utilisatrices de Talend Cloud Pipeline Designer et Talend Cloud Data Preparation lorsque Talend Cloud Data Inventory est activé pour le compte.
La vue détaillée vous permet d'avoir une vision claire de votre jeu de données, de son contenu, de ses métadonnées, de sa qualité et autres propriétés, en plus des fonctionnalités sociales et collaboratives. Pour tout jeu de données, la vue détaillée vous donne accès aux panneaux suivants :
  • Vue d'ensemble du jeu de données
    Vue d'ensemble du jeu de données

    C'est le premier panneau qui s'ouvre lorsque vous cliquez sur un jeu de données dans la liste. Vous pouvez obtenir plusieurs informations d'un coup d'œil, notamment les métadonnées du jeu de données et un indicateur simple de qualité.

  • Échantillon du jeu de données
    Échantillon du jeu de données

    Ici, vous pouvez visualiser directement des données dans différents formulaires, vérifier leur qualité, même modifier la catégorie sémantique des colonnes.

  • Gérer des API de données
    API

    Ce menu vous permet d'activer une API pour partager facilement le contenu d'un jeu de données aux consommateur·trices de votre choix.

  • Propriétés du jeu de données
    Propriétés du jeu de données

    Dans cette page, vous pouvez voir et modifier les propriétés de votre jeu de données et générer un nouvel échantillon basé sur la nouvelle configuration.

Vue d'ensemble du jeu de données

Lorsque vous sélectionnez un jeu de données dans la liste, le panneau de vue d'ensemble du jeu de données s'ouvre, affichant les différentes informations et métadonnées.

Note InformationsNote: Cette fonctionnalité est disponible pour les utilisateurs et utilisatrices de Talend Cloud Pipeline Designer et Talend Cloud Data Preparation lorsque Talend Cloud Data Inventory est activé pour le compte.
Les informations que vous pouvez voir d'un coup d'œil sont structurées sous forme de tuiles :
  • Talend Trust Score™ : visualisez le Talend Trust Score™ de votre jeu de données via cinq axes de métriques et apprenez comment améliorer sa fiabilité globale.
  • Data quality (Qualité de données) : cette tuile vous permet de constater rapidement la qualité de vos données via des diagrammes en barres dédiés affichant la répartition des valeurs vides, valides et invalides dans le jeu de données.
  • Data quality rules (Règles de qualité de données) : liste de règles appliquées à ce jeu de données. Chaque barre de conformité vous permet de voir la répartition des valeurs invalides, non applicables et valides.
  • Schema (Schéma) : consultez la liste des colonnes composant la structure de votre jeu de données, ainsi que le type sémantique et la qualité de chaque colonne.
  • Preparations : liste des préparations utilisant ce jeu de données comme source et liste des préparations compatibles avec ce jeu de données pouvant être appliquées directement.
  • Pipelines : liste des pipelines utilisant ce jeu de données comme source ou destination.
  • Rating : cette tuile vous permet d'appliquer ou de modifier votre note individuelle, ainsi que d'accéder à la note globale du jeu de données.
  • Description : description facultative saisie lors de la création du jeu de données. Elle peut être modifiée pour ajouter toute autre information de contexte à partager sur ce jeu de données.
  • Custom attributes : toutes les définitions d'attributs personnalisés ayant été créées pour le tenant sont regroupées dans cette tuile. D'ici, vous pouvez appliquer une valeur à n'importe quelle catégorie ou en modifier une existante, afin de compléter les métadonnées du jeu de données.
  • Tags : permet d'appliquer facilement les mots-clés afin de mieux documenter votre jeu de données et d'améliorer ses possibilités de recherche.
  • API : cette tuile est visible pour les jeux de données compatibles. Cela vous permet d'activer une API, afin que les consommateur·trices obtiennent les informations du jeu de données et monitorent l'activité.
  • Details : cette tuile regroupe toutes les informations de base concernant le créateur du jeu de données, ses dates de création et de dernière modification, ainsi que le nom de la personne ayant effectué cette dernière modification.
Panneau de vue d'ensemble du jeu de données
Panneau de vue d'ensemble de l'échantillon affichant les informations, la qualité de données, les règles de qualité de données du Talend Trust Score™, ainsi que le schéma d'un jeu de données.

Échantillon du jeu de données

Après avoir créé un jeu de données, vous pouvez visualiser et comprendre son contenu via la vue de l'échantillon.

Note InformationsNote: Cette fonctionnalité est disponible pour les utilisateurs et utilisatrices de Talend Cloud Pipeline Designer et Talend Cloud Data Preparation lorsque Talend Cloud Data Inventory est activé pour le compte.

Talend Cloud Data Inventory peut afficher un échantillon de 10 000 enregistrements de vos jeux de données. Cela comprend la Qualité des jeux de données au niveau des colonnes et des jeux de données. Vous pourrez également Changer le type sémantique d'une colonne afin que les données soient bien définies.

L'échantillon de début (Head sample) est sélectionné par défaut. Il affiche les 10 000 premiers enregistrements de votre jeu de données. Si vous devez travailler sur un échantillon plus représentatif de votre jeu de données, cliquez sur la flèche près de Head sample (Échantillon de début) et sélectionnez Random sample (Échantillon aléatoire) pour afficher 10 000 enregistrements aléatoirement sélectionnés.
Échantillon d'un jeu de données concernant des compagnies aériennes
Échantillon du jeu de données Aircrafts. Le curseur de la souris passe sur une liste déroulante dans laquelle vous pouvez choisir entre 'Head sample (Début du jeu de données)' et 'Random sample (Échantillon aléatoire)'.

Propriétés du jeu de données

La définition et les propriétés du jeu de données peuvent être consultées à tout moment dans le panneau des propriétés du jeu de données.

Note InformationsNote: Cette fonctionnalité est disponible pour les utilisateurs et utilisatrices de Talend Cloud Pipeline Designer et Talend Cloud Data Preparation lorsque Talend Cloud Data Inventory est activé pour le compte.

Les propriétés du jeu de données sont accessibles depuis les emplacements suivants :

  • Dans la liste des jeux de données :
    Liste des jeux de données affichant un jeu de données sélectionné, avec l'option 'Edit this dataset (Modifier ce jeu de données)' sélectionnée.
  • dans la vue détaillée du jeu de données.
    Propriétés du jeu de données 'Aircrafts'.

Cette page permet de vérifier ou modifier directement des champs renseignés lors de la création du jeu de données et devant être mis à jour.

Les propriétés disponibles dans le formulaire dépendent du type de jeu de données et peuvent notamment inclure :

  • le nom de votre jeu de données
  • l'entrée de vos jeux de données de test
  • le séparateur de champs et d'enregistrements, les caractères d'entourage et d'échappement ou l'encodage d'un fichier CSV
  • la table et la requête pour les jeux de données de bases de données
  • les modules, colonnes et conditions Salesforce
  • l'URL HDFS

Vous pouvez cliquer sur le bouton View sample pour prévisualiser quelques enregistrements du nouvel échantillon, avant de le valider et de le générer.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.