SUR CETTE PAGE

Accéder au contenu principal

CETTE PAGE VOUS A-T-ELLE AIDÉ ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Qu'est-ce que le rapprochement de données ?

Le rapprochement de données est un processus qui vous permet de trouver des enregistrements représentant la même entité dans un jeu de données.

Définition générale

Le rapprochement de données vous permet :

de chercher des doublons, des paires suspectes et des enregistrements uniques dans une source de données,
d'analyser des données et de retourner des probabilités pondérées de correspondance,
de fusionner les entrées identiques ou similaires en une seule entrée et
de réduire les disparités entres les différentes sources de données.

Rapprochement d'enregistrements

Le rapprochement consiste en une identification des enregistrements faisant référence à une même entité dans un jeu de données.

Deux types de rapprochements d'enregistrements existent :

le rapprochement des enregistrements déterministe, basé sur des identifiants qui entrent en correspondance et
le rapprochement des enregistrements probabiliste, basé sur la probabilité que deux identifiants correspondent.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Laissez vos commentaires ici