新しい正規表現ベースのセマンティックタイプを追加
正規表現に基づくセマンティックタイプをTalend Dictionary Serviceで作成し、認識されたデータ型のリストに追加できます。
このアプリケーションでは現在、すべてのデータ型がいずれかの事前定義済みセマンティックタイプに一致するとは限りません。たとえば、現在のところイタリアの社会保障番号(codice fiscale)は認識されません。
ここで、あなたはイタリアの顧客のみを扱っているイタリアの会社に勤務しているとしましょう。この例では、顧客データ(名前、メールアドレス、社会保障番号など)が含まれているデータセットが既に作成されています。社会保障番号を含んでいるカラムのセマンティックタイプはtextによってデフォルト値に設定されます。これでは不十分であり、このデータのタイプが一致するよう新しいカテゴリーを作成する必要があります。この場合はcodice fiscaleセマンティックタイプです。
Talend Dictionary Serviceでこの新しいセマンティックタイプを作成すると、自分のデータセットで自動的に使用可能になり、データを適切なタイプと一致させることができます。
手順
タスクの結果
今後、イタリアの社会保障番号を含んだ新しいデータセットをインポートすると、適切なタイプと自動的に一致するようになります。