Segmenter du texte en japonais
Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend MDM Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.
Avec le composant tJapaneseTokenize, vous pouvez segmenter du texte en japonais.
Pour reproduire l'exemple décrit ci-après, téléchargez le fichier tJapaneseTokenize_standard_scenario.zip.
Le fichier tJapaneseTokenize_standard_scenario.zip comprend :
- le fichier texte inputJapaneseText.txt contenant du texte en japonais, la transcription et la traduction en anglais ;
- le fichier tJapaneseTokenizeJob.zip contenant le Job.