セマンティックタイプライブラリーをエンリッチ化
データセットを追加すると、Talend Data Preparationは各カラムに対し、データに一致する最適なデータ型またはセマンティックタイプを自動的に提案します。
Talend Data Preparationによって推奨されたあるカラムのセマンティックタイプが不要な場合は、カラムヘッダーのメニューアイコンをクリックして手動で変更できます。
この操作によって、Talend Data Preparationにデフォルトで表示されているセマンティックタイプのリストの中から必要なタイプを選択できます。詳細は、事前定義されたセマンティックタイプをご覧ください。さらに、自分のセマンティックタイプを作成したり、既存のセマンティックタイプをアップデートまたは削除したりすれば、Talend Data Preparationで自社に合ったビジネス用語が使用されるようになります。
セマンティックタイプの変更は、Talend Data Preparationインターフェイスの左側のメニューにある[Semantic types] (セマンティックタイプ)タブで直接行います。
すべての変更はTalend Dictionary Serviceを使って保存され、各種Talend製品にプロパゲートされます。
Talend Dictionary Serviceが利用可能かどうかは所有するライセンスによって決まります。
Talend Dictionary Serviceでは、セマンティックライプは3つの主要カテゴリーに分けられます。
- DICTタイプ: 値の有効なリストや終了したリストに基づきます。
- REGEXタイプ: 事前に選択した正規表現とデータを比較します。
- COMPOUNDタイプ: 複数の既存のタイプに分類できる。
Talend Dictionary ServiceとTalend Data Preparationとの間のやり取りを可能にするには、次の前提条件を満たす必要があります。
- Talend Dictionary Serviceがインストールされ、実行されている。
- Talend Administration Centerがインストールされ、実行されている。
- PlatformライセンスまたはTalend Data Fabricライセンスを所有している。
- [Dictionary Service User] (ディクショナリーサービスユーザー)チェックボックスがTalend Administration Centerのユーザーで選択されている。
- <install_folder>\dataprep\config\application.propertiesファイルで、プロパティdataquality.semantic.update.enableとdataquality.semantic.list.enableがtrueに設定されている。
- <install_folder>\dataprep\config\application.propertiesファイルで、URLをsemanticservice.urlパラメーターでTalend Dictionary Serviceインスタンスに設定している。