Accéder au contenu principal Passer au contenu complémentaire

Créer un Job afin de diviser un texte en termes individuels au format CoNLL

Ce Job utilise le tNLPPreprocessing afin de diviser un échantillon de texte au format XML en termes individuels. Ensuite, ces termes individuels sont convertis au format CoNLL à l'aide du tNormalize.

Procédure

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tXMLFileInput, un tNLPPreprocessing, un tFilterColumns, un tNormalize et un tFileOutputDelimited.
  2. Reliez les composants à l'aide de liens Row > Main.

Résultats

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.