Le tMatchPredict
Ce composant libelle automatiquement des enregistrements suspects correspondant au(x) libellé(s) configurés dans les propriétés du composant.
Le tMatchPredict utilise des modèles de paires et de rapprochement généré par les composants tMatchPairing et tMatchModel pour libeller automatiquement des enregistrements suspects.
Si les données d'entrée n'ont pas été précédemment appairées, vous pouvez les définir comme étant "unpaired" (non appariées) et définir le chemin d'accès vers le modèle permettant d'apparier les données, afin de séparer les doublons exacts des enregistrements uniques.
Le tMatchPredict peut également écrire en sortie des enregistrements uniques, des doublons exacts et des doublons suspects d'un nouveau jeu de données.
En mode local, les versions 2.4.0 et supérieures d'Apache Spark sont supportées.
Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.