Comparaison de colonnes et regroupement dans le flux de sortie d'enregistrements en doublon ayant la même clé fonctionnelle
Ce composant est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Ce second scénario décrit un Job dont le but est de :
-
générer une clé fonctionnelle utilisant un algorithme sur l'une des colonnes d'entrée, DoB tel que décrit dans le scénario 1 ;
-
mettre en correspondance les deux colonnes d'entrée à l'aide de l'algorithme Jaro-Winkler ;
-
regrouper les colonnes de sortie via la clé fonctionnelle générée afin d'optimiser l'opération de rapprochement et comparer uniquement les enregistrements ayant la même valeur de bloc, la clé fonctionnelle dans ce scénario. Pour plus d'informations concernant le regroupement des colonnes de sortie et l'utilisation des valeurs de bloc, consultez tMatchGroup.