メイン コンテンツをスキップする

キー生成の設定

  1. tGenKeyをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントプロパティを定義します。

    をクリックし、VSRアルゴリズムで作成されたマッチングルールからブロッキングキーをインポートし、 Talend Studio Profiling パースペクティブでテストしてジョブで使用できます。それ以外の場合は、以下の手順に従ってブロッキングキーのパラメーターを定義します。

  2. Algorithmテーブルでプラスボタンをクリックして、このテーブルに行を追加します。

  3. [column] (カラム)のカラムで、新しく追加された行をクリックし、アルゴリズムを使用して処理する列をリストから選択します。このサンプルでは、PostalCodeを選択します。

    情報メモ注: 日付カラムにアルゴリズムやマッチングアルゴリズムを適用すると、日付形式で比較する内容を決定できます。

    たとえば、日付の年のみを比較する場合は、コンポーネントスキーマで日付カラムのタイプを[Date]に設定し、[Date Pattern] (日付パターン)フィールドにyyyyと入力します。コンポーネントでは、スキーマで定義されたパターンに基づき、日付形式を文字列に変換してから文字列比較が開始されます。

  4. アルゴリズム/オプションパラメーターの設定方法の説明を表示するには、[Show help] (ヘルプを表示)チェックボックスをオンにします。

  5. [algorithm] (アルゴリズム)カラムで、新しく追加された行をクリックし、対応する列に適用するアルゴリズムをリストから選択します。このサンプルでは、文字列の最初のN文字を選択します。

  6. [Value] (値)カラムをクリックし、必要に応じて選択したアルゴリズムの値を入力します。このシナリオでは、2を入力します。

    このサンプルでは、各データ行の郵便番号の最初の2文字を保持するファンクションキーを生成し、これらのカラムに余分なオプションを定義する必要はありません。

    必要なアルゴリズムの値を設定してください。さもないと、ジョブを実行する時にコンパイルエラーが発生することがあります。

tGenKeyプロパティを定義すると、これらのパラメーターの統計ビューを表示できます。これを行うには、次の手順に従います。

  1. tGenKeyコンポーネントを右クリックし、コンテキストメニューで[View Key Profile] (キープロファイルの表示)を選択します。

    [View Key Profile] (キープロファイルの表示)エディタが表示され、ブロックごとの行数に関する統計を表示し、取得する結果に従ってそれらを適合させることができます。

    大量のデータを処理する場合、このコンポーネントを使用して一致するコンポーネント(tRecordMatchingtMatchGroupなど)でデータを使用する場合、このコンポーネントを使用して1つのブロックに行数を制限する必要があります。1ブロックあたり約50行が最適ですが、比較するフィールド数、行総数、データ処理に適正な時間に依存します。

    キー プロファイルの表示オプションの使用例については、同じ機能キーを持つ出力フロー重複レコード内でカラムを比較し、グルーピングするをご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。