Talend Real-Time Big Data Platformのファンクションアーキテクチャー
Talend Real-Time Big Data Platformファンクションアーキテクチャーは、Talend Real-Time Big Data Platform機能、相互作用、および対応するITニーズを特定するアーキテクチャーモデルです。アーキテクチャー全体は、特定の機能を機能ブロックに分離することで説明されています。
下の図は、主なアーキテクチャー機能ブロックを示しています。
機能ブロックのタイプは以下のとおりです。
- Talend Studioから、Hadoopクラスターを活用するビッグデータジョブをデザインして起動し、大量のデータセットを処理します。これらのジョブは起動後にこのHadoopクラスターに送られ、そこでデプロイおよび実行されます。
Talend Studioから、定義済みのパターンとインジケーターを使用して、さまざまなデータソースに保存されているデータを分析し、分析結果を参照およびクエリーして、破損、不完全、不正確なデータを削除することもできます。
- Talendシステムから独立したHadoopクラスターでは、大量のデータセットを処理します。
- ジョブをデプロイして実行するため、Hadoopクラスターの中や外にインストールされたTalend JobServerまたは Talend Runtime。
Hortonworksクラスターの場合は、ファイアウォールやアクセスの問題を回避できるよう、Talend JobServerまたは Talend Runtimeをエッジノードのマシンにインストールすることをお勧めします。
Amazon EMRクラスターの場合も、Talend JobServerまたは Talend Runtimeをクラスターにインストールすることをお勧めします。
- データクオリティデータマートからは、分析結果に関するレポートを生成して他のビジネスユーザーと共有できます。