Composants de standardisation de texte
| tJapaneseNumberNormalize | Ce composant normalise des nombres japonais (kansūji) vers des nombres arabes. |
| tJapaneseTokenize | Ce composant segmente du texte japonais. |
| tJapaneseTransliterate | Ce composant convertit des données textuelles en japonais vers des caractères kana et caractères de l'alphabet latin. |
| tStem | Ce composant permet de standardiser des données dans des colonnes avant d'effectuer des correspondances. |
| tTransliterate | Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS). |