マッチングルールをTalend Studioリポジトリーからインポート
tMatchGroup設定ウィザードを使って、 Profiling パースペクティブで作成およびテストされたマッチングルールからマッチングキーをインポートできます。このインポートされたマッチングキーをマッチジョブで使用できます。
tMatchGroupコンポーネントを使用すると、VSRまたはT-Swooshアルゴリズムに基づいてTalend Studioのリポジトリーマッチングルールからインポートできます。
VSRアルゴリズムはレコードのセットを入力と見なし、定義されたマッチングルールに基づいて、検出された類似の重複をグルーピングします。このアルゴリズムは、レコードのペアを比較してグループに割り当てます。各グループで最初に処理されたレコードがそのグループのマスターレコードとなります。VSRアルゴリズムは各レコードを各グループのマスターレコードと比較し、計算されたマスターレコードからの距離を使ってそのグループの割り当て先を決定します。
T-Swooshアルゴリズムを使用して重複を検出するか、2つの類似のレコードをマージし、サバイバーシップファンクションを使用してマスターレコードを作成する方法を定義できます。このような新しくマージされたレコードは、新たな重複を検出するために使用されます。VSRアルゴリズムとの相違は、通常マスターレコードが入力レコードのリストに存在しない新規レコードとなる点です。