メイン コンテンツをスキップする 補完的コンテンツへスキップ

登録日と収入に基づいた顧客リストのフィルタリング

ソースデータセット、2つのFilterプロセッサー、3つのデスティネーションが含まれている複雑なパイプライン。

始める前に

  • ソースデータを保管するシステムへの接続が作成済みであること。

    ここでは、データベースへの接続を使用します。

  • ソースデータを保管するデータセットが追加済みであること。

    filter-python-customers.zipファイルをダウンロードして抽出します。このドキュメントに添付される登録日フィールドを持つ顧客リストが含まれています。

  • 接続および処理済みデータを保管する関連データセットも作成済みであること。

    ここでは、ファイルはHDFSに保管されているものとします。

手順

  1. [Pipelines] (パイプライン)ページで[Add pipeline] (パイプラインを追加)をクリックします。新しいパイプラインが開きます。
  2. パイプラインに意味のある名前を付けます。

    Filter on Registration and Revenue
  3. [ADD SOURCE] (ソースを追加)をクリックしてパネルを開きます。このパネルで、ソースデータ(この場合はデータベースに保存されている顧客のリスト)を選択できます。

    顧客に関するデータサンプルのプレビュー。
  4. データセットを選択し、[Select] (選択)をクリックしてパイプラインに追加できるようにします。
    必要であれば名前を変更します。
  5. +をクリックし、パイプラインにFilterプロセッサーを追加します。[Configuration] (設定)パネルが開きます。
  6. プロセッサーに意味のある名前を付けます。

    customers registered in 2000
  7. [Filters] (フィルター)エリアで次の操作を行います。
    1. [Input] (入力)リストで.RegistrationDateを選択し、この値に基づいて顧客をフィルタリングします。
    2. レコードのフィルタリング時にファンクションを適用したくないので、[Optionally select a function to apply] (適用するファンクションをオプションとして選択)リストで[None] (なし)を選択します。
    3. 登録日に2000年が含まれている顧客をフィルタリングする場合は、[Operator] (オペレーター)リストでContainsを選択し、[Value] (値)リストに2000と入力します。

      このエリアではavpath構文を使用できます。

  8. [Save] (保存)をクリックして設定を保存します。
  9. +を再びクリックし、パイプラインにFilterプロセッサーをもう1つ追加します。[Configuration] (設定)パネルが開きます。
  10. プロセッサーに意味のある名前を付けます。

    customers with revenue > 90000
  11. [Filters] (フィルター)エリアで次の操作を行います。
    1. [Input] (入力)リストで.Revenueを選択し、この値に基づいて顧客をフィルタリングします。
    2. レコードのフィルタリング時にファンクションを適用したくないので、[Optionally select a function to apply] (適用するファンクションをオプションとして選択)リストで[None] (なし)を選択します。
    3. 90000ドルを超える収入のある顧客をフィルタリングする場合は、[Operator] (オペレーター)リストで>を選択し、[Value] (値)リストに90000と入力します。
  12. [Save] (保存)をクリックして設定を保存します。
  13. 最初のFilterプロセッサーの横にある[Doesn't match filter] (フィルターに一致しない)ボタンをクリックし、フィルター基準に一致しないデータを保持するデータセットを追加および選択します。
  14. デスティネーションに意味のある名前を付けます。

    other registration date
  15. Filterプロセッサーの横にある[ADD DESTINATION] (デスティネーションを追加)ボタンをクリックし、フィルター基準に一致しないデータを保持するデータセットを追加および選択します。
    必要であれば名前を変更します。
  16. 2番目のFilterプロセッサーの横にある[Doesn't match filter] (フィルターに一致しない)ボタンをクリックし、リジェクトされたデータを保持するデータセットを選択します。
  17. デスティネーションに意味のある名前を付けます。

    other customers
  18. (オプション) 最後のFilterプロセッサープレビューを表示し、フィルタリング操作後のデータを確認します。
    フィルタリングを適用した後のFilterプロセッサーのプレビュー。
  19. Talend Cloud Pipeline Designerの上部ツールバーで[Run] (実行)ボタンをクリックするとパネルが開き、実行プロファイルを選択できるようになります。
  20. リストで実行プロファイルを選択し(詳細は実行プロファイルをご覧ください)、[Run] (実行)をクリックしてパイプラインを実行します。

タスクの結果

パイプラインは実行中となり、記述した条件に基づいてデータがフィルタリングされ、指定したターゲットシステムに出力が送られます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。