Technique des blocs par partition

Le rapprochement d'enregistrement est une tâche exigeante car chaque enregistrement doit être comparé aux autres enregistrements du jeu de données. Pour améliorer l'efficacité de cette tâche, la technique des blocs est souvent une étape nécessaire.

Elle consiste en un tri des données en partitions de même tailles ayant le même attribut. L'objectif est de restreindre les comparaisons aux enregistrements groupés dans la même partition.

Pour créer des partitions efficaces, vous devez trouver des attributs qui ne risquent pas de changer, comme un prénom ou un nom. De ce fait, vous améliorez la fiabilité de la méthode des blocs et la vitesse d'exécution de la tâche.

Il est recommandé d'utiliser le composant tGenKey pour générer des clés de bloc et visualiser la distribution des blocs.

Pour plus d'informations sur la génération de clés de bloc, consultez Identification.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Laissez vos commentaires ici