Talendジョブ内のtDataprepRunワークフロー
Talend Studioでは、tDataprepRunコンポーネントを使用してジョブを実行すると、Talend Data Preparationで準備されたデータを取得してジョブのフローで使用できるように、いくつかのエレメントが機能します。
次の図は、tDataprepRunコンポーネントを使用してTalendデータ統合ジョブとビッグデータジョブでプレパレーションを取得する時にランタイムに発生する一連のイベントを示しています。どちらの場合も、最初のステップは、ユーザーがtDataprepRunコンポーネントを含むジョブを作成することです。
プレパレーションバージョンでtDataprepRunコンポーネントを使用することをお勧めします。これにより、ジョブが期間中にずっと有効であり、予測可能な結果が保証され、同じプレパレーションステップの適用が保証されます。これにより、プレパレーションのスキーマが進展した状況を防ぐことができますが、他のコンポーネントのスキーマは進展していないため、ジョブが中断されます。
データ統合ジョブでのtDataprepRun
データ統合ジョブのフローでプレパレーションを実行すると、プレパレーションはTalend Data Preparationサーバーで直接処理されます。
ビッグデータSpark BatchまたはSpark StreamingジョブでのtDatapreprun
ビッグデータジョブのフローでプレパレーションを実行すると、プレパレーション定義がTalend Data Preparationサーバーから取得され、実行時にBig Dataクラスターで処理されます。