用語集モデルを使って作業
用語集は、柔軟なメタモデルに基づくカスタムモデルの一種です。
Talend Data Catalogでは、用語、データ定義、コードセット、ドメイン、検証ルールなどのエンタープライズ用語集を取得、定義、保持、実装するための、拡張可能なメタモデルベースの用語集が提供されています。
用語を使って、オブジェクトの分類やデータクラスとの関連付け、データの自動分類を行うこともできます。セマンティックマッピングを定義して、ソースモデル内のエレメント(ビジネス用語集のようにより概念的)がデスティネーションモデル内のエレメント(より実装的または表記的)をどのように定義しているかを説明できます。
企業は、用語集を使うことで、ビジネスアセット(用語など)、およびそのデータアセット(データベーステーブルなど)や技術アセット(ETLマッピングなど)との関連性について、全ステークホルダー間の合意を取りやすくなります。用語集を使って、IT部門全体で論理データエンティティ、物理データエンティティ、属性をドキュメント化できます。また、ビジネスアセットと技術アセット間の依存項目をトレースします。
用語集のオブジェクトタイプ
オブジェクトタイプ | 説明 | ワークフローによる影響 | 所属元 |
---|---|---|---|
[Term] (用語) | アーキテクチャー全体で一般的に使われる用語 | あり |
|
[Acronym] (頭字語) | 用語の頭字語(省略形)で主に実装で使われる | あり |
|
用語の階層
用語集は通常、用語のフラットコレクションです。作成できる用語集の数は無制限なので、複数の用語集で特定のドメイン向けの用語を追加できます。1つの用語内に複数の用語を追加し、用語の階層を作成することもできます。
用語の関連付けタイプとセマンティック来歴
関連付けタイプ | 説明 | 推測済み名前と説明の割り当てに対する影響 | 定義ルックアップに対する影響 | セマンティック用法に対する影響 |
---|---|---|---|---|
[Has Synonym] (シノニムあり) | ほぼ同じ意味を表す用語 | なし | あり | あり |
[Has Acronym] (頭字語あり) | 用語の頭字語 | なし | - | - |
[See Also] (関連項目) | その他の関連用語 | なし | なし | なし |
[More General] (より一般的) | より一般的なコンテキストを持つ用語、またはより抽象的なコンセプトの用語 | あり | あり | なし |
[More Specific] (より具体的) | より詳細なコンテキストを持つ用語、またはより具体的なコンセプトの用語 | なし | なし | あり |
[Contains] (含む) | 完全なコンセプトの生成に寄与していると見なされる用語(姓名に含まれる名など) | なし | なし | なし |
所属元 | 該当する用語が定義されている親コンテナを表す用語(通り名が含まれている住所など) | なし | なし | なし |
[References] (参照) | - | なし | なし | なし |
[Referenced by] (参照元) | - | なし | なし | なし |
[Represents] (表す) | ドメインタイプ用語とそのドメインを表す用語のリレーションシップ(利用可能残高が統一のドル金額を表現する場合など) | なし | なし | あり |
[Represented by] (表現元) | ドメインタイプ用語を表す用語とドメインタイプ用語のリレーションシップ(統一のドル金額が利用可能残高によって表現される場合など) | なし | あり | なし |
こうした用語間のリレーションシップは、同じ用語集モデル内、または複数の用語集をまたいで定義できます。2つの用語集におけるセマンティックマッピングを、[More General] (より一般的)と[More Specific] (より具体的)の用語関連付けに置換できます。この関連付けは、セマンティックマッピングにおけるセマンティックリンクと同じように動作します。
ワークフロー
- Talend Data Catalogでは、想定される状況に柔軟に対応できる一連のワークフローおよび公開プロセスが提供されています。
複数のユーザーが関与する正式な用語集開発プロセスでは、ワークフロープロセスを使用できます。
- ワークフローを使わない場合、用語集への変更は、システム全体ですぐに反映されます。
このモードは、ワークフロープロセスの複雑化を防ぐうえで有効です。また、用語集とそのセマンティックマッピングを初めてビルドして入力する場合も役立ちます。
ワークフローの下にある用語集の用語を編集するためには、ワークフローエディターとメタデータエディターの両方のオブジェクトロールが割り当てられている必要があります。
ワークフロー機能を有効にすると、Talend Data Catalogによって用語集の公開済みバージョンが作成されます。大半のユーザーに提供されるのは、この公開済みバージョンです。権限の有無に関わらず、そのコンテンツを直接編集することはできません。公開されたバージョンの現在の編集やワークフローの状態を確認することはできません。確認できるのは公開されているもののみです。その代わり、開発版を編集し、公開ワークフローのステップを使って、公開された用語集の内容を変更することは可能です。開発版では、用語集オブジェクトの現在のワークフローの状態を確認できます。実装については、用語集の公開バージョンは任意の設定バージョンに関連付けられています。
用語集のアーカイブ(履歴)バージョンを設定に関連付け、プレゼンテーションの目的で公開バージョンにすることは可能です。
ワークフロープロセスは、用語集のすべてのオブジェクトに適用されます。ワークフローを有効にすると、特定のアクションの実行に制限が適用されます。
- 公開済みの用語が含まれている用語は削除できません。
- 用語とその親を一緒に作成する場合、用語はその親が公開されるまで公開できません。
用語集モデルとその他のカスタムモデル
必要に応じて、ビジネスの属性タイプ、オブジェクトタイプ、リレーションシップタイプを拡張できます。メタモデルでその他のカスタムモデルとの関連付けを定義し、それらのカスタムモデルインスタンス(用語集など)を関連付けできます。