このページ上

メインコンテンツをスキップする

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

SparkまたはYARNを使うビッグデータバッチジョブを作成

Talend Studioでは、ビッグデータ処理のためにSparkやMapReduceでBatchジョブやStreamingジョブを作成できます。

[Integration] (統合)パースペクティブ([Window] (ウィンドウ) > パースペクティブ > [Integration] (統合))を選択します。

[Repository] (リポジトリー)で、[Job Designs] (ジョブデザイン)を右クリックします。
1. [Create Big Data Batch Job] (ビッグデータバッチジョブを作成)をクリックします。
[Name] (名前)フィールドに、名前を入力します。
例
ReadHDFS_Spark_or_YARN
フレームワークととして次のいずれかを選択します。
- Spark
- MapReduce (非推奨)
オプション: [Purpose] (目的)フィールドに目的を入力します。
例
Read and sort customer data
オプション: [Description] (説明)フィールドに説明を入力します。
例
Read and sort customer data stored in HDFS from a Big Data Batch Job running on Spark or YARN

情報メモヒント: [Purpose] (目的)と[Description] (説明)を入力して整理します。
[Finish] (終了)をクリックします。

[Designer] (デザイナー)で空のジョブが開かれます。

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。