Composants de standardisation de texte

tJapaneseNumberNormalize	Ce composant normalise des nombres japonais (kansūji) vers des nombres arabes.
tJapaneseTokenize	Ce composant segmente du texte japonais.
tJapaneseTransliterate	Ce composant convertit des données textuelles en japonais vers des caractères kana et caractères de l'alphabet latin.
tStem	Ce composant permet de standardiser des données dans des colonnes avant d'effectuer des correspondances.
tTransliterate	Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Laissez vos commentaires ici