Talend Data Catalogの概念
- カタログ
カタログとは、データアセット(データベーステーブル、Data Integrationジョブ、BIレポートなど)のインベントリーのことです。
- メタデータ
メタデータとは、名前、タイプ、ロケーション、作成者、作成日、サイズ、他のデータオブジェクトとのリレーションシップなど、データリソースを説明する構造化情報のことです。
- メタデータリポジトリー
メタデータリポジトリーには、データソース、プロジェクト設定、レポートから作成またはインポートされたメタデータが保管されます。
- メタデータを収集
メタデータの収集とは、Talend Data Catalogのブリッジを使ってデータソースからメタデータを収集することです。メタデータはモデル内にインポートされ、メタデータリポジトリーに保管されます。
- ブリッジ
ブリッジとはプラットフォーム専用のコネクターのことです。特定のドライバーを使ってソースツールに接続し、メタデータを収集します。
メタデータは、データストア、Data Integrationツール、ビジネスインテリジェンスツール、ビジネスアプリケーションからインポートできます。
- スティッチ
モデルが作成されると、設定内で互いにリンクされ、情報システム内でデータフローが定義されます。
- 設定
設定とは、エンタープライズ情報システムのグローバルスキーマをビルドするためにモデルを相互に接続する環境またはワークスペースのことです。
- 用語集
用語集は、誰もが把握できる共通言語を構築するために、エンタープライズボキャブラリをキャプチャーして定義します。
- データプロファイリング
データプロファイリングとは、使用するカタログにインポートされたデータソースのデータを検証し、このデータに関する統計と情報を収集するプロセスのことです。
- データサンプリング
データサンプリングによって、使用するカタログにインポートされたデータベーステーブルやデータファイルのコンテンツをプレビューできるようになります。
- データクラス
データ分類は、カタログにインポート済みデータソースに含まれているエレメントの性質と目的を検出、理解、分類するのに役立ちます。
- データ検出クラス
データ検出分類は、事前定義済みの列挙、パターン、正規表現に基づいて共通データのパターンを自動的に検出します。
- メタデータ検出クラス
メタデータ検出分類は、メタデータ属性でクラスを検出します。
- 秘密度ラベル
秘密度ラベルはリポジトリーオブジェクトに適用され、それによってオブジェクトの秘密度のレベルを規定できます。
- グローバルロール
グローバルロールは、すべてのカタログアセットに対してユーザーが負う責任を規定します。
- オブジェクトロール
オブジェクトロールは、特定のカタログアセット(用語集やモデルなど)に対してユーザーが負う責任を規定します。
- ワークシート
ワークシートによって、検索を保存したり、オブジェクトページのタブをカスタマイズしたりできます。
- ダッシュボード
ダッシュボードはカタログアセットの知見を提供するだけでなく、ユーザーによる特定のニーズに合わせたカスタマイズが可能です。