tMatchIndexPredict
Ce composant compare un nouveau jeu de données à un jeu de données de référence stocké dans ElasticSearch à l'aide du tMatchIndex. Le tMatchIndexPredict écrit en sortie les enregistrements uniques et les doublons suspects dans des fichiers séparés.
Chaque enregistrement dans la sortie des doublons potentiels contient les champs des enregistrements source et les champs des enregistrements de référence correspondant potentiellement.
Le composant tMatchIndexPredict supporte les versions d'Elasticsearch jusqu'à 6.4.2 et les versions 2.0, 2.1, 2.2, 2.3 et 2.4 d'Apache Spark en mode local.
Comme ce composant ne supporte pas l'authentification Elasticsearch, il ne peut s'exécuter sur Databricks.