Analyser des doublons
Vous pouvez utiliser l'analyse de rapprochement dans la perspective Profiling du Studio Talend afin de comparer des colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide l'algorithme VSR ou T-Swoosh.
Cette analyse vous fournit un moyen simple de créer des règles de rapprochement, de les tester sur un ensemble de colonnes et de voir les résultats directement dans l'éditeur.Après avoir testé vos règles de rapprochement sur les données, vous pouvez les exporter à partir de l'éditeur et les sauvegarder dans le référentiel du Studio Talend, afin de les importer et les utiliser ultérieurement dans les composants de rapprochement, notamment le tMatchGroup, le tRecordMatching, le tGenKey et les composants Hadoop de rapprochement, par exemple.
Vous pouvez également utiliser la perspective Profiling afin de définir des règles de rapprochement dans l'éditeur de règles et les sauvegarder dans le référentiel du Studio Talend.