Enrichir des types sémantiques dans Data Stewardship (interface)
Lorsque des gestionnaires de campagnes définissent la structure des données à gérer dans une campagne, ils peuvent sélectionner parmi une liste prédéfinie le type sémantique de chaque attribut. Lorsqu'ils chargent des données dans Talend Data Stewardship, une validation interne du type de schéma est effectuée et les données sont affichées comme valides ou invalides.
Par exemple, la liste des entrées comprises par défaut dans l'application pour les pays ne contient pas Republic of Angola, United States of America ou UK. Par conséquent, ces entrées sont considérées comme des noms de pays invalides lors du chargement dans Talend Data Stewardship.
Vous pouvez toutefois créer vos propres types sémantiques, ainsi que mettre à jour ou supprimer les types existants, afin que votre expérience avec Talend Data Stewardship soit adaptée à votre entreprise. Vous pouvez effectuer toutes ces options de gestion via une interface intégrée.
- la validation de données rapproche les données par rapport à des types sémantiques et marque les données comme valides ou invalides ;
- la découverte de données permet d'explorer les catégories sémantiques et d'interroger les relations sémantiques complexes dans les données analysées et d'écrire en sortie les résultats du rapprochement pour afficher les concepts les plus pertinents.
Talend Cloud Data Stewardship utilise les types sémantiques uniquement pour la validation, comme aucune découverte de données n'est effectuée de son côté.
- Le type Dictionary qui est basé sur une liste de valeurs fermée.
- le type Regular expression, qui compare vos données à une expression régulière présélectionnée,
- le type Compound type, qui compare vos données à différents types sémantiques référencés dans le type composé.
- Talend Dictionary Service doit être installé et en cours d'exécution.
- Talend Administration Center doit être installé et en cours d'exécution.
- Votre licence dans doit inclure la qualité de données (Data Quality), c'est-à-dire à partir de Data Management.
- Le rôle qui vous est assigné dans Talend Administration Center est Designer ou Operation manager.
- Les cases Dictionary Service User et Data Stewardship User sont cochées pour votre compte utilisateur·rice dans Talend Administration Center et vous devez avoir un des deux rôles possibles configurés dans le champ Data Stewardship Role.
- Dans le fichier <install_folder>\tds\apache-tomcat\conf\data-stewardship.properties, la propriété dataquality.dictionaryservice.enable est configurée à true.