Segmenter du texte en japonais
Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend Data Services Platform et à Talend Data Fabric.
Avec le composant tJapaneseTokenize, vous pouvez segmenter du texte en japonais.
Pour reproduire l'exemple décrit ci-après, téléchargez le fichier tJapaneseTokenize_standard_scenario.zip.
Le fichier tJapaneseTokenize_standard_scenario.zip comprend :
- le fichier texte inputJapaneseText.txt contenant du texte en japonais, la transcription et la traduction en anglais ;
- le fichier tJapaneseTokenizeJob.zip contenant le Job.