Accéder au contenu principal

Correspondance floue entre deux colonnes et écriture en sortie des données principales et rejetées

Availability-noteDéprécié·e
Note InformationsImportant : Le composant tFuzzyJoin est déprécié depuis la version 6.0 généralement disponible et est supprimé à partir de la version 8.0 R2024-05 du Studio Talend. Talend vous recommande d'utiliser le composant tRecordMatching à sa place.

Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend MDM Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Ce scénario décrit un Job comprenant cinq composants, ayant pour but : en premier lieu, de vérifier la distance d'édition entre la colonne IdClient d'un fichier d'entrée, par rapport aux données du fichier de référence d'entrée, et, ensuite, de vérifier tous les e-mails par prononciation dans la colonne Email, par rapport aux données du fichier d'entrée de référence. Les sorties de ces deux types de correspondances sont écrits dans des fichiers distincts.

Dans ce scénario, vous avez déjà stocké les schémas d'entrée et les fichiers de référence dans le Repository. Pour plus d'informations concernant le stockage des schémas de métadonnées dans la vue Repository, consultez Gestion des métadonnées dans le Studio Talend.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.