Qu'est-ce que le rapprochement de données ?
Le rapprochement de données est un processus qui vous permet de trouver des enregistrements représentant la même entité dans un jeu de données.
Définition générale
Le rapprochement de données vous permet :
- de chercher des doublons, des paires suspectes et des enregistrements uniques dans une source de données,
- d'analyser des données et de retourner des probabilités pondérées de correspondance,
- de fusionner les entrées identiques ou similaires en une seule entrée et
- de réduire les disparités entres les différentes sources de données.
Rapprochement d'enregistrements
Le rapprochement consiste en une identification des enregistrements faisant référence à une même entité dans un jeu de données.
Deux types de rapprochements d'enregistrements existent :
- le rapprochement des enregistrements déterministe, basé sur des identifiants qui entrent en correspondance et
- le rapprochement des enregistrements probabiliste, basé sur la probabilité que deux identifiants correspondent.