Exécuter le Job pour libeller des paires suspectes avec des libellés assignés
Procédure
Résultats
tMatchPredict libelle les paires suspectes, groupe les enregistrements suspects correspondant au libellé YES et écrit toutes les paires suspectes dans le fichier de sortie.
Les enregistrements suspects correspondant au libellé YES appartiennent aux groupes car le tMatchPredict a été configuré pour regrouper les enregistrements correspondant à cette classe de clustering.
Les enregistrements correspondant au libellé NO n'appartiennent à aucun groupe.
Que faire ensuite
Vous pouvez maintenant créer une représentation unique de chaque groupe de doublons et les fusionner avec les enregistrements uniques calculés par le tMatchPairing.
Pour un exemple de création d'un jeu de données propre et dédoublonné, consultez Créer un jeu de données nettoyées à partir des paires suspectes libellées par le tMatchPredict et les enregistrements uniques calculés par le tMatchPairing.
Vous trouverez un exemple de création d'un jeu de données propres et dédoublonnées sur Talend Help Center (https://help.talend.com (uniquement en anglais)).