Calculer les paires suspectes et les enregistrements uniques
Procédure
Résultats
Le tMatchIndexPredict regroupe les enregistrements issus des données d'entrée et les enregistrements de correspondance, issus du jeu de données de référence stocké dans Elasticsearch, puis libelle les paires suspectes. Ils apparaissent dans la même ligne.
Le tMatchIndexPredict exclut les enregistrements uniques afin de les écrire dans un fichier séparé.
Vous pouvez maintenant nettoyer et dédoublonner les enregistrements uniques, puis utiliser le tMatchIndex afin de les ajouter au jeu de données de référence stocké dans Elasticsearch.