新しいディクショナリーベースのセマンティックタイプを追加
ディクショナリーに基づくセマンティックタイプをTalend Dictionary Serviceで作成し、Talend Data Stewardshipで認識されたデータ型のリストに追加できます。ただし、重複した値はディクショナリーベースのセマンティックタイプでは許可されません。そのような値は無用であり、プロセスを遅延させる可能性があるためです。
Talend Data Stewardshipでは現在、すべてのデータ型がいずれかの事前定義済みセマンティックタイプに一致するとは限りません。たとえば、英国の郡は現在そのような形で認識されません。
このタスクについて
仮に、あなたが英国に居住している顧客のみを扱っている英国の会社に勤務しているとしましょう。この例では、顧客データ(名前、メールアドレス、顧客が住んでいる郡など)を登録して管理する必要があります。Data Stewardshipでデータモデルを定義する際に、郡を含むカラムに使用するセマンティックタイプが必要です。ここでは、データに固有のセマンティックタイプ(この場合はUK_countiesセマンティックタイプ)を追加します。
この新しいセマンティックタイプをTalend Dictionary Serviceで作成すると、自動的にData Stewardshipで使用可能になり、データを適切なタイプと照合して検証できます。
手順
タスクの結果
Talend Data Stewardshipに英国の郡を含むデータをロードすると、データは、Talend Dictionary Serviceで手動により作成したセマンティックタイプUK_countiesと照合され、検証されます。