Accéder au contenu principal Passer au contenu complémentaire

Définir une clé de bloc

Pourquoi et quand exécuter cette tâche

Définir une clé de bloc n'est pas obligatoire mais fortement conseillé. Utiliser une clé de bloc pour partitionner des données en blocs réduit le nombre d'enregistrements nécessitant d'être comparés à des paires d'enregistrements dans chaque bloc. Utiliser des colonnes de bloc est très utile lors du traitement d'un jeu de données volumineux.

Procédure

  1. Dans le menu Blocking key (Clé de bloc), cliquez sur Add new item (Ajouter un élément), dans la section Blocking algorithm (Algorithme de bloc).
  2. Sélectionnez un algorithme pour la clé de bloc et configurez les autres paramètres dans la table Blocking Key selon vos besoins.
    Dans cet exemple, seule une clé de bloc est utilisée. Le premier caractère de chaque mot dans la colonne country est récupéré et listé dans la colonne BLOCK_KEY.
  3. Cliquez sur le nom des colonnes que vous souhaitez utiliser pour partitionner les données traitées en blocs.
    Exemples de clés de bloc et de leurs paramètres dans le menu Blocking Key (Clé de bloc).
    Cependant, une seule clé de bloc est générée et listée dans la colonne BLOCK_KEY de la table Data.
    Par exemple, si vous utilisez un algorithme sur les colonnes country et lname afin de traiter les enregistrements ayant le même caractère de départ, les enregistrements de données ayant la même première lettre dans le nom du pays ou dans le nom de famille sont groupés dans le même bloc. La comparaison est restreinte à chaque enregistrement dans chaque bloc.
    Pour supprimer une colonne de la table Blocking key, cliquez-droit dessus et sélectionnez Delete ou cliquez sur son nom dans la table Data.
  4. Cliquez sur Chart (Diagramme) pour calculer la clé générée et afficher les résultats dans un diagramme.
    Ce diagramme vous permet de visualiser les statistiques concernant le nombre de blocs et d'adapter les paramètres de bloc selon les résultats que vous souhaitez obtenir.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.