Talend Studioでは、ビッグデータ処理のためにSparkやMapReduceでBatchジョブやStreamingジョブを作成できます。
始める前に
[Integration] (統合)パースペクティブ()を選択します。
手順
-
[Repository] (リポジトリー)で、[Job Designs] (ジョブデザイン)を右クリックします。
-
[Create Big Data Batch Job] (ビッグデータバッチジョブを作成)をクリックします。
-
[Name] (名前)フィールドに、名前を入力します。
例
ReadHDFS_Spark_or_YARN
-
フレームワークととして次のいずれかを選択します。
- オプション:
[Purpose] (目的)フィールドに目的を入力します。
例
Read and sort customer data
- オプション:
[Description] (説明)フィールドに説明を入力します。
例
Read and sort customer data stored in HDFS from a Big Data Batch Job running on Spark or YARN
情報メモヒント: [Purpose] (目的)と[Description] (説明)を入力して整理します。
-
[Finish] (終了)をクリックします。
タスクの結果
[Designer] (デザイナー)で空のジョブが開かれます。