Rapprochement de deux enregistrements
La création d'un enregistrement maître est un processus itératif : chaque nouvel enregistrement maître peut être utilisé pour trouver de nouveaux doublons.
Vous pouvez choisir entre deux algorithmes différents pour créer des enregistrements maître :
- Simple VSR Matcher,
- T-Swoosh. Cet algorithme est disponible uniquement dans le composant Standard.
La principale différence entre ces deux algorithmes, c'est que T-Swoosh crée, pour chaque enregistrement maître, un enregistrement qui n'existe pas dans la liste des enregistrements en entrée.
Rapprochement de deux mesures
Vous pouvez également comparer plusieurs attributs de deux enregistrements. Pour qu'une mise en correspondance s'effectue, les deux conditions suivantes doivent être réunies :
- Lorsque vous utilisez l'algorithme T-Swoosh, le score pour chaque fonction de rapprochement dans la règle de rapprochement doit dépasser le seuil, si défini. Par défaut, le seuil est défini à 1. Ceci est l'équivalent d'une correspondance exacte pour la plupart des fonctions de rapprochement, excepté pour Exact - ignore case et, potentiellement, tout algorithme de rapprochement personnalisé.
- Le score global, qui est un score pondéré des différentes fonctions de rapprochement, doit être supérieur au seuil de correspondance. Le score est égal à Σ(wi × si(r1,r2)) / Σwi, où wi correspond au poids numérique de la fonction de rapprochement i et si(r1,r2) correspond au score de la fonction de rapprochement i sur-enregistre r1 et r2 .
Règles de rapprochement
Deux enregistrements correspondent si au moins une règle de rapprochement est satisfaite. Dès que deux enregistrements correspondent selon une règle donnée, les autres règles ne sont pas vérifiées.