新しい正規表現ベースのセマンティックタイプを追加
正規表現に基づくセマンティックタイプをTalend Dictionary Serviceで作成し、Data Stewardshipで認識されたデータ型のリストに追加できます。
Talend Dictionary Serviceでは、現在、すべてのタイプのデータが、事前定義済みのセマンティックタイプの1つと照合され、検証されるわけではありません。たとえば、現在のところイタリアの社会保障番号(codice fiscale)は認識されません。
このタスクについて
仮に、あなたがイタリアの顧客のみを扱っているイタリアの会社に勤務しているとしましょう。この例では、顧客データ(名前、メールアドレス、社会保障番号など)を登録して管理する必要があります。Data Stewardshipでデータモデルを定義する場合、社会保障番号を含むカラムのセマンティックタイプを、イタリア社会保障番号のセマンティックタイプが事前定義されていないtextに設定することが義務付けられます。これは少し残念なことですが、このデータのタイプとの一致のために、より具体的なカテゴリーを作成することになります。この場合は、codice_fiscaleセマンティックタイプです。
この新しいセマンティックタイプをTalend Dictionary Serviceで作成すると、自動的にData Stewardshipで使用可能になり、データを適切なタイプと照合して検証できます。
手順
タスクの結果
Talend Data Stewardshipに顧客データをロードすると、データは、Talend Dictionary Serviceで作成したcodice_fiscaleセマンティックタイプと照合され、検証されます。