tDataprepRun
標準データ統合ジョブでTalend Data Preparationを使って作成したプレパレーションを適用します。
tDataprepRunは、Talend Data Preparationを使って作成したプレパレーションを取得し、一連のデータに適用します。
tDataprepRunコンポーネントの[Basic settings] (基本設定)にある[Deployment] (デプロイメント)ドロップダウンリストを使えば、コンポーネントのいずれかバージョンを選択できます:
- [On-Premises deployment] (オンプレミスデプロイメント) - Talend Data Preparationサーバーでプレパレーションを実行します。
- [Cloud deployment] (クラウドデプロイメント) - ジョブと同じエンジンで実行されます。データはインフラストラクチャーを離れません。唯一行われるやり取りは、Talend Cloud Data Preparationからプレパレーション情報を取得することです。
情報メモ注: デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。Talend Studioで使用できるよう、機能マネージャーの セクションにTalend Data Preparationコンポーネントをインストールする必要があります。詳細は、機能マネージャーを使って機能をインストールをご覧ください。
情報メモ注: 参考までに、tDataprepRunは60ステップのプレパレーションで最大1,000万行と100カラム(7GB)のデータセットを約200行/秒(150kB/秒)の速度で処理できます(ただしこの数値は目安であり、実際は異なる場合があります)。パフォーマンスを改善したい場合や1,000万行を超えるデータセットの場合は、Spark Jobの利用をご検討ください。