Accéder au contenu principal Passer au contenu complémentaire

Ajout d'un nouveau type sémantique composé

Vous pouvez créer un type sémantique composé référençant d'autres types sémantiques publiés sur le serveur de Talend Dictionary Service et l'ajouter à la liste des types reconnus dans les modèles de données, dans Talend Data Stewardship.

Vous pouvez mélanger tous les types sémantiques lors de la création d'un type composé. Un type composé peut référencer d'autres types composés si les types enfants sont déjà publiés.

Imaginez que vous avez un fichier contenant des informations relatives à des clients des États-Unis, du Royaume-Uni, d'Allemagne et de France. Vous devez intervenir et valider les différents codes postaux par rapport à un type sémantique composé, que vous créez. Lorsque les données correspondent à l'un des types enfants, elles sont considérées comme valides et ne sont pas évaluées par rapport aux autres types référencés.

Lors de la définition d'un modèle de données dans Talend Data Stewardship, vous pouvez configurer le type sémantique pour la colonne contenant les codes postaux comme étant ce nouveau type composé, Zip_codes dans cet exemple.

Avant de commencer

Tous les types sémantiques enfants à utiliser dans le type composé sont créés et publiés.

Procédure

  1. Sélectionnez Semantic types (Types sémantiques) > Add semantic type (Ajouter un type sémantique).
  2. Saisissez un nom et une description pour le nouveau type sémantique.
  3. Sélectionnez le type sémantique dans la liste Type.
  4. Laissez l'option Use for validation (Utiliser pour la validation) activée.

    Ce type composé sera utilisé pour définir les valeurs considérées comme bonnes ou mauvaises lors de l'application sur une colonne donnée. Le résultat de ce processus de validation peut être vu dans la barre de statistiques de chaque colonne de vos jeux de données.

    Dans cet exemple, si vous choisissez de désactiver l'option Use for validation, le type composé ne sera utilisé que pour l'exploration de données, et aucune valeur ne sera considérée comme invalide.

  5. Dans la liste Children types, sélectionnez les types sémantiques que vous souhaitez regrouper dans ce type composé.
  6. Cliquez sur Save and publish (Sauvegarder et publier) pour envoyer le type sémantique au serveur de Talend Dictionary Service et le rendre disponible à l'utilisation par Talend Data Stewardship.
    Cliquer sur Save as draft (Sauvegarder comme brouillon) stocke le nouveau type sur le serveur sans le propager au système. Le nouveau type n'est pas utilisable, sauf s'il est publié. Pour un exemple d'utilisation de cette option, imaginez que vous avez de nouveaux types sémantiques à déployer en tant que partie d'un nouveau projet. Vous pouvez préparer le travail en créant les types sémantiques et en les sauvegardant en tant que brouillon avant la mise en production du projet, puis vous pouvez déployer les types sémantiques le jour de la mise en production.
  7. Dans la page Data models (Modèles de données), créez le modèle de données pour les données client·es.
    La nouvelle catégorie sémantique Phone_numbers est disponible dans la liste des types sémantiques et vous pouvez la choisir pour la colonne contenant les numéros de téléphone.

Résultats

Lorsque vous chargez les données client·es dans Talend Data Stewardship, les données sont rapprochées et validées par rapport au type composé Phone_numbers que vous avez créé. Les données sont évaluées par rapport au premier type enfant et si elles correspondent, elles ne sont pas évaluées par rapport à d'autres types référencés.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.