Créer des enregistrements consolidés
Fusionner les enregistrements à l'aide du tRuleSurvivorship
Après avoir estimé les doublons et regroupé les paires suspectes, vous pouvez utiliser le tRuleSurvivorship créer un représentant unique de chaque groupe de doublons en choisissant les données les plus adaptées. Cette représentation est appelée "enregistrement consolidé".
Pour un exemple de création d'un jeu de données nettoyées à partir des paires suspectes libellées par le tMatchPredict et les enregistrements uniques calculés par le tMatchPairing, consultez tMatchModel.
nettoyage et de dédoublonnage d'un jeu de données à partir des paires suspectes libellées par le tMatchPredict sur Talend Help Center (https://help.talend.com (uniquement en anglais)).
Utiliser Talend Data Stewardship pour examiner manuellement et fusionner les enregistrements
Vous pouvez ajouter des campagnes de fusion dans Talend Data Stewardship pour examiner et modifier les règles, créer des représentants uniques et fusionner les données.
Pour plus d'informations concernant la fusion de campagnes dans Talend Data Stewardship, consultez Exemples d'utilisation de Talend Data Stewardship.
Dans Talend Data Stewardship, les data stewards sont des utilisateur·trice·s métier chargé·e·s de résoudre les tâches de fusion :- Classification des données en assignant des libellés choisis parmi une liste prédéfinie de choix d'arbitrage.
- Fusion d'enregistrements suspects en un seul enregistrement.
Tâches de fusion permettant aux data stewards de fusionner plusieurs suspects parmi les enregistrements source en un seul enregistrement (enregistrement consolidé). Le résultat d'une tâche de fusion est l'enregistrement maître produit par les data stewards.
Pour plus d'informations concernant la fusion de tâches dans Talend Data Stewardship, consultez Exemples d'utilisation de Talend Data Stewardship.
Pour plus d'informations concernant les tâches de fusion dans Talend Data Stewardship, consultez la documentation en ligne sur la gestion des tâches de fusion pour dédoublonner les enregistrements sur Talend Help Center (https://help.talend.com (uniquement en anglais)).
Les enregistrements source peuvent provenir d'une même source (dédoublonnage de base de données) ou de sources différentes (réconciliation de bases de données).