文字ベースのパターン
Talend Data Stewardshipは文字ベースのパターンプロファイリングを実行し、キャンペーンにロードするデータ内の文字パターン配分を計算します。
Latin文字、アジア文字のほかに、ひらがな、カタカナ、漢字、ハングルの間の分割は、以下のパターンで表記されます。
文字 | パターン |
---|---|
ラテン数字 | すべてのASCII数字が9に置き換わります |
Latin小文字 | すべてのASCII Latin文字がaに置き換わります |
Latin大文字 | すべての大文字のLatin文字がAに置き換わります |
ひらがな | すべてのひらがな文字がHに置き換わります |
片仮名 | すべてのカタカナ文字がKに置き換わります |
漢字 | 漢字がCに置き換わります |
ハングル | ハングル文字がGに置き換わります |
片仮名 | すべてのカタカナ文字がKに置き換わります |