Data Stewardship (ユーザーインターフェイス)用のセマンティックタイプのエンリッチ
Talend Dictionary Serviceは、各種Talend製品(Talend Data Stewardshipを含む)で使用されるセマンティックカテゴリーを保存します。個人のカテゴリーでこれらのセマンティックタイプをエンリッチでき、行ったすべての変更は即座に反映されます。ただし、Talend Dictionary Serviceが利用可能かどうかは所有するライセンスによって決まります。
キャンペーン所有者がキャンペーンで管理するデータの構造を定義する場合、事前定義済みのリストから各属性のセマンティックタイプを選択できます。データをTalend Data Stewardshipにロードすると、スキーマタイプの内部検証が実行され、それに応じてデータが有効または無効として表示されます。
たとえば、デフォルトで国の下のアプリケーションに含まれているエントリーのリストには、アンゴラ共和国、アメリカ合衆国、および英国は含まれていません。結果として、そのようなエントリーはTalend Data Stewardshipにロードされると無効な国名と見なされます。
しかし、さらに踏み込んで、独自のセマンティックタイプを作成したり、既存のセマンティックタイプのアップデートや削除を行ったりすると、Talend Data Stewardshipで自社に合ったビジネス用語が使用されるようになります。これらの管理オプションはすべて統合ユーザーインターフェイスを介して実行できます。
セマンティックタイプの作成時、セマンティックタイプをデータ検証に使用するか、データ検出に使用するかを決定できます。
- データ検証では、データをセマンティックタイプと照合し、データを有効または無効としてマークします。
- データ検出では、セマンティックカテゴリーを探索し、分析されたデータ内の複雑な意味関係を照会し、照合の結果を出力して、最も関連性の高い概念を表示します。
Talend Cloud Data Stewardshipでは、データ検出が行われないため、検証用にのみセマンティックタイプを使用します。
サーバー上では、セマンティックタイプは複数のカテゴリーに分けられます。
- ディクショナリータイプ: 閉じた値のリストに基づく。
- 正規表現タイプ: 事前に選択した正規表現とデータを比較する。
- 複合型タイプ: 複合型で参照される複数のセマンティックタイプとデータを比較する。
Talend Dictionary ServiceとTalend Data Stewardshipとの間のやり取りを可能にするには、次の前提条件を満たす必要があります。
- Talend Dictionary Serviceがインストールされ、実行されている。
- Talend Administration Centerがインストールされ、実行されている。
- プラットフォームライセンスがあること。
- Talend Administration Centerであなたに割り当てられたロールは、デザイナーまたはオペレーションマネージャーである。
- 管理センターのユーザーアカウントで[Dictionary Service User] (ディクショナリーサービスユーザー)および[Data Stewardship User] (Data Stewardshipユーザー)チェックボックスがオンになっていること、また[Data Stewardship Role] (Data Stewardshipロール)フィールドで設定できる2つのロールが設定されていること。
- <install_folder>\tds\apache-tomcat\conf\data-stewardship.propertiesファイルで、dataquality.dictionaryservice.enableプロパティがtrueに設定されていること。