Modèles basés sur les caractères
Talend Data Stewardship effectue un profiling basé sur les caractères et calcule la répartition des modèles basés sur les caractères dans les données chargées dans n'importe quelle campagne.
Les caractères latins, comme les caractères asiatiques, divisés en hiragana, katakana, kanji et hangul, sont représentés par les modèles suivants :
Caractère | Modèle |
---|---|
Chiffres latins | 9 remplace tous les chiffres ASCII. |
Lettres minuscules latines | a remplace tous les caractères latins ASCII. |
Latin uppercase letters | A remplace tous les caractères latins en majuscule. |
Hiragana | H remplace tous les caractères Hiragana |
Katakana | K remplace tous les caractères Katakana |
Kanji | C remplace les caractères chinois |
Hangul | G remplace des caractères Hangeul. |
Katakana | K remplace tous les caractères Katakana |