複数のデータセットでクローリング
同じソースからデータセットを多数インポートする必要がある場合は、Talend Cloud Data Inventoryでそれらを手動で1つずつ作成する代わりに、クローラーを作成して、1回の操作でアセットの完全なリストを取得できます。
接続をクローリングすると、データを大規模に取得して、インベントリーをより効率的にエンリッチ化できます。接続を選択した後に、クイック検索経由でそのコンテンツをすべてまたは部分的にインポートし、フィルタリングして、どのユーザーが新しく作成されたデータセットにアクセスできるかを選択できるようになります。
クローリングモードには次の2つがあり、ユースケースに応じて使い分けられます。
- その時点でのデータソースの内容に関係なく、特定のフィルターに一致するテーブルをすべて取得する動的選択を使用したクローリングデータセット。
- 取得するテーブルを現在の状態のデータソースから手動で選択する 手動選択を使用したクローリングデータセット。
複数のデータセットに対して接続をクローリングする場合は、次の前提条件と制限が伴います。
- Talend Management Consoleで、[Dataset administrator] (データセットマネージャー)ロールか[Dataset manager] (データセットマネージャー)ロール(または少なくとも[Crawling - Add] (クローリング - 追加)権限)が自分に割り当てれていること。
- Remote Engine 2022-02以降を使用していること。
- JDBC接続からデータのみをクローリングし、接続からクローラーを1つのみ同時に作成できます。
手順
タスクの結果
実行開始後に、クローラー設定を編集できません。クローラーが停止または終了している場合は、そのクローラーのテーブル選択、名前、説明を編集できます。ただし、共有設定は編集できません。別の共有設定で接続を再びクロールするためには、クローラーを削除して、新しいクローラーを作成します。
データセット検索でクローラー名をファセットとして使って、特定のクローラーにリンクされているデータセットをすべて表示できます。