Comparer les colonnes et regrouper dans le flux de sortie les enregistrements en doublon ayant la même clé fonctionnelle
Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend MDM Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.
Ce second scénario décrit un Job dont le but est de :
-
générer une clé fonctionnelle utilisant un algorithme sur l'une des colonnes d'entrée, DoB tel que décrit dans le scénario 1 ;
-
mettre en correspondance les deux colonnes d'entrée à l'aide de l'algorithme Jaro-Winkler ;
-
regrouper les colonnes de sortie via la clé fonctionnelle générée afin d'optimiser l'opération de rapprochement et comparer uniquement les enregistrements ayant la même valeur de bloc, la clé fonctionnelle dans ce scénario. Pour plus d'informations concernant le regroupement des colonnes de sortie et l'utilisation des valeurs de bloc, consultez tMatchGroup.