Modèles basés sur les caractères

Talend Data Stewardship effectue un profiling basé sur les caractères et calcule la répartition des modèles basés sur les caractères dans les données chargées dans n'importe quelle campagne.

Les caractères latins, comme les caractères asiatiques, divisés en hiragana, katakana, kanji et hangul, sont représentés par les modèles suivants :

Caractère	Modèle
Chiffres latins	9 remplace tous les chiffres ASCII.
Lettres minuscules latines	a remplace tous les caractères latins ASCII.
Latin uppercase letters	A remplace tous les caractères latins en majuscule.
Hiragana	H remplace tous les caractères Hiragana
Katakana	K remplace tous les caractères Katakana
Kanji	C remplace les caractères chinois
Hangul	G remplace des caractères Hangeul.
Katakana	K remplace tous les caractères Katakana

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Laissez vos commentaires ici