Exécuter le Job
Procédure
Enregistrez le Job et appuyez sur F6 pour l'exécuter.
Résultats
Le tFuzzyUniqRow utilise la méthode de Levenshtein pour comparer séparément chacune des trois colonnes définies, il utilise la méthode du Double Metaphone, afin de comparer les données de la colonne City, puis passer la ligne unique et les doublons aux fichiers de sortie définis. Dans notre exemple, les deux premières lignes correspondent, cependant, la deuxième ligne ira dans la sortie duplicates.
La colonne FID générée fournit un identifiant de référence de l'enregistrement original auquel se réfère l'enregistrement actuel.
La troisième ligne est unique et ira dans la sortie uniques.
La colonne UID générée contient les identifiants générés pour l'enregistrement principal.