Accéder au contenu principal Passer au contenu complémentaire

Configurer le Job

Procédure

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFileInputDelimited, un tMatchPredict et un tFileOutputDelimited.
  2. Reliez le composant tMatchPredict au tFileOutputDelimited à l'aide d'un lien Main.
  3. Reliez le composant tMatchPredict au tFileOutputDelimited à l'aide d'un lien Suspect duplicates.
  4. Vérifiez que vous avez défini la connexion au cluster Spark et activé les points de validation dans la vue Run > Spark Configuration comme décrit dans Calcul de paires suspectes et d'un échantillon suspect à partir de données source.
  5. Vérifiez que vous avez défini la connexion au cluster Spark et activé le checkpoint dans la vue Run > Spark Configuration. Pour plus d'informations concernant la sélection du mode Spark, consultez la documentation sur Talend Help Center (https://help.talend.com (uniquement en anglais)).

Résultats

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.