Composants de standardisation de texte
tJapaneseNumberNormalize | Ce composant normalise des nombres japonais (kansūji) vers des nombres arabes. |
tJapaneseTokenize | Ce composant segmente du texte japonais. |
tJapaneseTransliterate | Ce composant convertit des données textuelles en japonais vers des caractères kana et caractères de l'alphabet latin. |
tStem | Ce composant permet de standardiser des données dans des colonnes avant d'effectuer des correspondances. |
tTransliterate | Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS). |