tTransliterate
Ce composant convertit des chaînes de caractères de différentes langues du monde en un jeu de caractères standard (Universal Coded Character Set, UCS).
Cette conversion est une opération phonétique, dans laquelle le composant tTransliterate essaye de créer en UCS un équivalent de la chaîne de caractères originale, en se basant sur le son que cette chaîne représente.
Le tTransliterate encode des textes rédigés dans différents systèmes d'écriture du monde en caractères lisibles, en se basant sur le répertoire du standard Unicode. Vous pouvez reconnaître et interpréter des mots de différentes langues plus facilement que si les caractères étaient toujours dans leur écriture originale. Pour plus d'informations concernant Unicode et le standard Unicode, consultez Unicode et Unicode Standard (en anglais).
En mode local, les versions 2.0, 2.3, 2.4 et 3.0 d'Apache Spark sont supportées.
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Selon le produit Talend que vous utilisez, ce composant peut être utilisé dans un framework de Jobs, dans plusieurs, ou dans tous les frameworks :
-
Standard : consultez Propriétés du tTransliterate Standard.
Le composant de ce framework est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real Time Big Data Platform, Talend Data Services Platform et dans Talend Data Fabric.
-
Spark Batch : consultez Propriétés du tTransliterate pour Apache Spark Batch.
Le composant de ce framework est disponible dans tous les produits Talend Platform avec Big Data et dans Talend Data Fabric.
-
Spark Streaming : consultez Propriétés du tTransliterate pour Apache Spark Streaming.
Ce composant est disponible dans Talend Real Time Big Data Platform et dans Talend Data Fabric.