Marquage de paires suspectes avec des libellés assignés
Ce scénario s'applique uniquement aux produits Talend Platform avec Big Data nécessitant souscription et à Talend Data Fabric.
Pour plus d'informations concernant les deux workflows utilisés lors d'un rapprochement avec Spark, consultez Rapprochement sur Spark.
Le cas d'utilisation décrit ici utilise :
-
un composant tFileInputDelimited pour lire les paires d'entrée suspectes générées par le tMatchPairing,
-
un composant tMatchPredict pour libeller automatiquement les enregistrements suspects et regrouper les enregistrements suspects correspondant au(x) libellé(s) configurés dans les propriétés du composant,
-
un composant tFileOutputDelimited pour écrire en sortie les enregistrements en doublon libellés et les groupes créés sur les enregistrements suspects correspondant au libellé configuré dans les propriétés du tMatchPredict.