メイン コンテンツをスキップする 補完的コンテンツへスキップ

EMRに書き込み、暗号化するデータのフローをデザインする

コンポーネントをリンクしてデータフローを構築します。

手順

  1. Studioの Integration パースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のSpark Batchジョブを1つ作成します。
  2. ワークスペース内に使用するコンポーネントの名前を入力し、表示されるリストからこのコンポーネントを選択します。このシナリオでは、コンポーネントは、tHDFSConfiguration (ラベルemr_hdfs)、tS3ConfigurationtFixedFlowInputtAggregateRowtFileOutputParquetです。
    tFixedFlowInputコンポーネントは、サンプルデータをデータフローにロードするために使われます。現実のケースでは、tFixedFlowInputの代わりに、使われるデータ形式またはソースシステムに固有の入力コンポーネントを使います。
  3. [Row] (行) > [Main] (メイン)リンクを使って、tFixedFlowInputtAggregateRowtFileOutputParquetを接続します。
  4. tHDFSConfigurationコンポーネントとtS3Configurationコンポーネントは、接続しないでおきます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。