Talendジョブ内のtDataprepRunワークフロー
Talend Studioでは、tDataprepRunコンポーネントを使用してジョブを実行すると、Talend Data Preparationで準備されたデータを取得してジョブのフローで使用できるように、いくつかのエレメントが機能します。
次の図は、Talendデータ統合ジョブとビッグデータジョブでtDataprepRunコンポーネントを使ってプレパレーションを取得する時にランタイムに発生する一連のイベントをまとめたものです。どちらの場合も、最初のステップは、ユーザーがtDataprepRunコンポーネントを含むジョブを作成することです。
プレパレーションバージョンでtDataprepRunコンポーネントを使用することをお勧めします。これにより、ジョブが期間中にずっと有効であり、予測可能な結果が保証され、同じプレパレーションステップの適用が保証されます。これにより、プレパレーションのスキーマが進展した状況を防ぐことができますが、他のコンポーネントのスキーマは進展していないため、ジョブが中断されます。
データ統合ジョブでのtDataprepRun
データ統合ジョブのフローでプレパレーションを実行すると、プレパレーションはTalend Data Preparationサーバーで直接処理されます。
ビッグデータSpark BatchまたはSpark StreamingジョブでのtDatapreprun
ビッグデータジョブのフローでプレパレーションを実行すると、Talend Data Preparationサーバーからプレパレーション定義が取得され、実行時にBig Dataクラスターで処理されます。