Accéder au contenu principal

Le tMatchPredict

Ce composant libelle automatiquement des enregistrements suspects correspondant au(x) libellé(s) configurés dans les propriétés du composant.

Le tMatchPredict utilise des modèles de paires et de rapprochement généré par les composants tMatchPairing et tMatchModel pour libeller automatiquement des enregistrements suspects.

Si les données d'entrée n'ont pas été précédemment appairées, vous pouvez les définir comme étant "unpaired" (non appariées) et définir le chemin d'accès vers le modèle permettant d'apparier les données, afin de séparer les doublons exacts des enregistrements uniques.

Le tMatchPredict peut également écrire en sortie des enregistrements uniques, des doublons exacts et des doublons suspects d'un nouveau jeu de données.

Ce composant s'exécute avec Apache Spark versions 1.6.0 et supérieures.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.