メイン コンテンツをスキップする 補完的コンテンツへスキップ

コンポーネントをリンク

手順

  1. Talend StudioIntegrationパースペクティブで、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードから空のSpark Batchジョブを1つ作成します。
    Spark Batchジョブの作成方法は、Spark Batchジョブを作成をご覧ください。
  2. ワークスペース内に使用するコンポーネントの名前を入力し、表示されるリストからこのコンポーネントを選択します。このシナリオでは、コンポーネントは、tHDFSConfiguration、2つのtFixedFlowInputコンポーネント(ラベル1はcustomer_baseに、もう1つはweb_dataに)、tSqlRowtCacheOuttCacheIntMaptExtractDelimitedFieldstAggregateRowtTop、およびtLogRowです。
    tFixedFlowInputコンポーネントは、サンプルデータをデータフローにロードするために使用されます。現実のケースではtFixedFlowInputの代わりにtMysqlInputtMapといった他のコンポーネントを使って処理するデータを準備する、より洗練されたプロセスを設計できます。
  3. [Row] (行) > [Main] (メイン)リンクを使って、customer_base (tFixedFlowInput)、tSqlRowtCacheOutを接続します。このサブジョブでは、シルバーレベルの顧客に関するレコードが選択され、キャッシュに保管されます。
  4. [Row] (行) > [Main] (メイン)リンクを使って、web_data (tFixedFlowInput)をtMapに接続します。これは、tMapコンポーネントへの主な入力フローです。
  5. 同じ手順で、tCacheIntMapに接続します。これはtMapへのルックアップフローです。
  6. [Row] (行) > [Main] (メイン)リンクを使ってtMaptExtractDelimitedFieldsに接続し、表示されるダイアログボックスでこの接続に名前を付けます。たとえば、outputという名前を付けます。
  7. [Row] (行) > [Main] (メイン)リンクを使って、tExtractDelimitedFieldstAggregateRowtToptLogRowを接続します。
  8. [Trigger] (トリガー) > OnSubjobOkリンクを使って、customer_baseweb_dataに接続します。
  9. tHDFSConfigurationコンポーネントは、接続しないでおきます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。