Accéder au contenu principal

Segmenter du texte en japonais

Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend Data Services Platform et à Talend Data Fabric.

Avec le composant tJapaneseTokenize, vous pouvez segmenter du texte en japonais.

Pour reproduire l'exemple décrit ci-après, téléchargez le fichier tJapaneseTokenize_standard_scenario.zip.

Le fichier tJapaneseTokenize_standard_scenario.zip comprend :
  • le fichier texte inputJapaneseText.txt contenant du texte en japonais, la transcription et la traduction en anglais ;
  • le fichier tJapaneseTokenizeJob.zip contenant le Job.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.