Vous avez annoté les entités nommées dans les fichiers au format CoNLL qui seront utilisés pour l'apprentissage d'un modèle.
Procédure
Double-cliquez sur le tFileInputDelimited pour afficher sa vue Basic settings et définissez ses propriétés.
Configurez le schéma en Built-In, puis cliquez sur Edit schema pour définir le schéma comme vous le souhaitez.
Dans le schéma de sortie, la première colonne doit être tokens et la dernière, labels. Entre ces deux colonnes, vous pouvez ajouter des colonnes pour les caractéristiques ajoutées manuellement.
Dans le champ Folder/file, saisissez le chemin d'accès vers les données d'apprentissage.
Laissez la case Die on error cochée.
Dans la vue Advanced settings du composant, cochez la case Custom encoding si vous rencontrez des problèmes lors du traitement des données.
Dans la liste Encoding, sélectionnez l'encodage à utiliser, UTF-8 dans cet exemple.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.