Écrire des tâches dans une campagne Merging
Ce Job charge des tâches dans une campagne Merging définie dans Talend Data Stewardship selon les critères que vous avez définis dans les paramètres simples (Basic settings) du composant tDataStewardshipTaskOutput.
Les enregistrements de données dans ces tâches contiennent des doublons. Talend Data Stewardship vous permet de fusionner les données redondantes et créer des enregistrements maître basés sur des scores de confiance que vous pouvez définir lors de la création de la campagne.
Une fois les données chargées dans la campagne, les participants autorisés peuvent intervenir et configurer manuellement des règles de consolidation par attribut dans les enregistrements de données ou saisir des valeurs entièrement nouvelles lors de la résolution des tâches.
Il est également possible d'effectuer un calcul dynamique du score de confiance d'un enregistrements donné en se basant sur des règles métier embarquées dans le Job. Dans une telle situation, vous devez fournir le score de confiance pour un ou plusieurs enregistrement(s) et le(s) mapper vers la colonne de sortie TDS_RATING dans le tDataStewardshipTaskOutput. Ces scores de confiance écrasent les éventuels scores définis lors de la création de la campagne.
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Ce scénario s'applique à tous les produits Talend.
Dans ce Job :
-
Le composant tFileInputDelimited lit les données clients.
-
Le composant tMatchGroup compare les données en utilisant des méthodes de rapprochement et de bloc. Il crée également des groupes de doublons rencontrés.
-
Le composant tMap mappe l'identifiant du groupe, GID, généré par le tMatchGroup à TDS_GID.
Lorsque les données d'entrée ont une colonne contenant le nom des sources de données, le tMap peut également mapper la colonne d'entrée vers TDS_SOURCE.
-
Le composant tDataStewardshipTaskOutput écrit les données dans la campagne CRM Data Deduplication dans Talend Data Stewardship.