Technique des blocs par partition
Le rapprochement d'enregistrement est une tâche exigeante car chaque enregistrement doit être comparé aux autres enregistrements du jeu de données. Pour améliorer l'efficacité de cette tâche, la technique des blocs est souvent une étape nécessaire.
Elle consiste en un tri des données en partitions de même tailles ayant le même attribut. L'objectif est de restreindre les comparaisons aux enregistrements groupés dans la même partition.
Pour créer des partitions efficaces, vous devez trouver des attributs qui ne risquent pas de changer, comme un prénom ou un nom. De ce fait, vous améliorez la fiabilité de la méthode des blocs et la vitesse d'exécution de la tâche.
Il est recommandé d'utiliser le composant tGenKey pour générer des clés de bloc et visualiser la distribution des blocs.
Pour plus d'informations sur la génération de clés de bloc, consultez Identification.