Ajout d'un type sémantique basé sur un dictionnaire
Vous pouvez créer un type sémantique basé sur un dictionnaire Talend Dictionary Service et l'ajouter à la liste des types de données reconnus dans Talend Cloud Data Stewardship. Cependant, les valeurs en doublon ne sont pas autorisées dans un type sémantique basé sur un dictionnaire, car elles sont inutiles et peuvent ralentir le processus.
Dans Talend Cloud Data Stewardship, tous les types de données sont actuellement mis en correspondance avec l'un des types sémantiques prédéfinis. Les comtés du Royaume-Uni, par exemple, ne sont pas reconnus comme tels.
Pourquoi et quand exécuter cette tâche
Imaginez que vous travaillez pour une entreprise britannique, avec des clients vivant uniquement au Royaume-Uni. Dans cet exemple, vous devez gérer des données clients, comme les noms, adresses e-mail, ou le pays de résidence. Vous pouvez vous demander quel type sémantique utiliser pour la colonne contenant les comtés, lorsque vous définissez le modèle de données dans Talend Data Stewardship. Vous souhaitez ajouter un type sémantique spécifique à vos données : le type sémantique UK_counties, dans cet exemple.
Vous allez créer ce nouveau type sémantique dans Talend Dictionary Service, il sera automatiquement disponible dans Talend Data Stewardship, pour que vos données puissent être rapprochées par rapport à un type correct de données.
Procédure
Résultats
Lorsque vous chargez dans Talend Cloud Data Stewardship des données contenant les comtés du Royaume-Uni, elles sont automatiquement rapprochées et validées par rapport au type sémantique UK_counties manuellement créé dans Talend Dictionary Service.