メイン コンテンツをスキップする 補完的コンテンツへスキップ

データをマッチングするジョブの作成

Talend Studioメタデータの特定のファイルのデータを別のデータソースのデータに対してマッチングするジョブを生成できます。

この自動生成ジョブのコンポーネントの設定を使用して、厳密一致と不一致の値を個別のファイルまたはデータベースに出力するように選択できます。ただし、一致候補をファイルまたはデータベースに出力するように選択することもできます。

このタスクについて

ルックアップファイルに対してデータをマッチングするステップは、次のとおりです。

  1. マッチングするデータを保存するファイルを選択します。
  2. 一致ジョブを実行するカラムを選択します。
  3. 必要に応じて、ブロッキングキーを定義して処理対象のデータを分割します。ブロッキングキーは、通常、ファイルに大量のデータが存在する場合に必要になります。
  4. 厳密一致、一致候補、不一致レコードを書き込む場所を選択します。
  5. 生成されたジョブを実行します。

手順

  1. メニューバーで、[Window] (ウィンドウ) > [Show View] (ビューを表示)と選択します。
    [Show View] (ビューを表示)ダイアログボックスが表示されます。
  2. [Help] (ヘルプ)フォルダーを展開して、[Cheat Sheets] (参照シート)を選択します。
  3. OKをクリックしてダイアログボックスを閉じます。
    Talend Studio[Cheat Sheet] (参照シート)パネルが表示されます。
  4. 参照シートアイコンバーでドロップダウン矢印をクリックし、メニューから[Launch Other...] (その他を起動)を選択します。
    [参照シート]パネルからの[その他を起動]オプションの場所。
    [Cheat Sheet Selection] (参照シートの選択)ダイアログボックスが表示されます。
  5. [Talend - Cheat Sheets] (参照シート) > [Job] (ジョブ)を展開して[Match Data] (データのマッチング)を選択し、OKをクリックしてダイアログボックスを閉じます。
    [参照シートの選択]ダイアログボックスからの[データをマッチング]参照シートの場所。

    対応するページが[Cheat Sheet] (参照シート)パネルに表示されます。このページでは、特定のファイルの特定のカラムに対して既製ジョブを作成する方法を段階的に説明します。

    [参照シート]パネルにある参照シートの概要。
  6. 紹介文を読んで、[Click to Begin] (クリックして開始)をクリックします。

    処理の最初のステップである[Select Input File] (入力ファイルを選択)が展開されます。

  7. 説明を読み、[Click to perform] (クリックして実行)をクリックします。

    [Input Type Select Dialog] (入力タイプ選択ダイアログ)ウィザードが開き、ジョブの作成ステップが説明されます。

  8. [Type list] (タイプリスト)フィールドから、ジョブを実行するファイルのタイプを選択します。OKをクリックして、ウィザードの最初のステップを閉じます。
    参照シートの次のステップが展開します。
    ダイアログボックスが開き、Talend Studioで定義したファイル接続とデータベースが表示されます。
  9. メタデータ接続からクレンジングを行うファイルを選択し、OKをクリックします。

    参照シートの次のステップが展開します。

  10. データをマッチングするルックアップデータソースを選択する方法の説明を読み、[Click to perform] (クリックして実行)をクリックして、ウィザードの次のビューを開きます。
  11. 指示に従い、最後のステップ[Review and Run the Generated Job] (生成されたジョブを確認して実行)までウィザードと参照シートページのステップの切り替えを続けます。

    このウィザードでは、さまざまなビューで定義された設定に応じて、リポジトリーのすべてのコンポーネントおよびメタデータを設定し、ジョブを生成します。Talend StudioIntegrationパースペクティブに切り替わります。結果のジョブは次のようになります。

    データをマッチングさせるために複数のコンポーネントを使うジョブ。
  12. ジョブを保存し、F6を押して実行します。

タスクの結果

ファイルの値の厳密一致、一致候補、不一致が特定され、指定された出力ファイルまたはデータベースに保存されます。生成されたジョブは、[Repository] (リポジトリー)ツリービューの[Job Designs] (ジョブデザイン)ノードの下に保存されます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。