Talend Cloud Data Preparationのアーキテクチャー
このアーキテクチャー図はTalend Cloud Data Preparationのファンクションブロックを示したものです。
この図は、主要な部分である2つの環境、つまりローカルネットワークとクラウドインフラストラクチャーという2つの主要な部分に分かれています。
ローカルネットワーク
Webブラウザー、Talend Studio、Remote Engine Gen2、Runtime Serverを含むローカルネットワーク。
- Webブラウザーから、Talend Cloud Data Preparation、Talend Dictionary Service、Talend Management Consoleにアクセスできます。
- Talend Studioからは、tDatasetInput、tDatasetOutput、tDataprepRunの各コンポーネントを使うことでTalend Cloud Data Preparationのファンクションを活用できます。さまざまなデータセットからデータセットを作成してTalend Cloud Data Preparationにエクスポートしたり、データ統合ジョブまたはSparkジョブでプレパレーションを直接利用したりできます。
- Remote Engine Gen 1は、Data Preparationコンポーネントを使うジョブの実行、およびオンプレミスでのアーティファクトやタスクの実行に使用されます。
- Remote Engine Gen2は、Talend Cloudアプリケーションのオブジェクト(プレパレーションなど)を実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。
クラウドインフラストラクチャー
クラウドインフラストラクチャーには、データセットサービスに依存するTalend Cloud Data Preparationの他にCloud Engine for Designが含まれています。
- データセットサービスは、Talend Cloud Data Preparation、Talend Cloud Data Inventory、Talend Cloud Pipeline Designer用に統合されたデータセットリストを提供します。
- Talend Management Consoleでは、ロール、ユーザー、プロジェクト、ライセンスを管理します。クラウドアプリケーションの新しいユーザーを作成し、カスタムグループに割り当てます。その後、ロールを決定してユーザーに割り当てます。Talend Management Consoleは、ライセンスファイルをインポートし、Talend Studioで共同作業するプロジェクトを作成するためも使用されます。加えて、Webユーザーのデータおよびファイル転送、データ統合、および共有データソースへのアクセスを有効にできます。たとえば、アプリケーション間のデータ交換と同期を自動化する、設定済みのサンプルタスクまたはデザインタスクをインポートして使用できます。
- Talend Cloud Data Preparationでは、ローカルファイルやその他のソースからデータをインポートし、新しいプレパレーションを作成することでクレンジングしたりエンリッチ化したりできます。
- Talend Dictionary Serviceでは、Talend Cloud Data Preparationで開かれている場合に、データの各カラムに適用されるセマンティックカテゴリーを追加、削除、変更できます。
- Cloud Engine for Designは、アーティファクト、タスク、プレパレーションをクラウドで実行するほか、接続を作成したりデータサンプルをフェッチしたりするために使われます。