メイン コンテンツをスキップする 補完的コンテンツへスキップ

SparkまたはYARNを使うビッグデータバッチジョブを作成

Talend Studioでは、ビッグデータ処理のためにSparkやMapReduceでBatchジョブやStreamingジョブを作成できます。

始める前に

[Integration] (統合)パースペクティブ([Window] (ウィンドウ) > パースペクティブ > [Integration] (統合))を選択します。

手順

  1. [Repository] (リポジトリー)で、[Job Designs] (ジョブデザイン)を右クリックします。
    1. [Create Big Data Batch Job] (ビッグデータバッチジョブを作成)をクリックします。
  2. [Name] (名前)フィールドに、名前を入力します。

    ReadHDFS_Spark_or_YARN
  3. フレームワークととして次のいずれかを選択します。
    • Spark
    • MapReduce (非推奨)
  4. オプション: [Purpose] (目的)フィールドに目的を入力します。

    Read and sort customer data
  5. オプション: [Description] (説明)フィールドに説明を入力します。

    Read and sort customer data stored in HDFS from a Big Data Batch Job running on Spark or YARN
    情報メモヒント: [Purpose] (目的)[Description] (説明)を入力して整理します。
  6. [Finish] (終了)をクリックします。

タスクの結果

[Designer] (デザイナー)で空のジョブが開かれます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。