同じ機能キーを持つ出力フロー重複レコード内でカラムを比較し、グルーピングする
このシナリオはTalend Data Management Platform、Talend Big Data PlatformTalend Real-Time Big Data Platform、Talend MDM PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。
このシナリオ2では、次を目標とするジョブについて説明します。
-
シナリオ1で説明したように、入力カラムの1つのDoB上でアルゴリズムを1つ使用して機能キーを生成します。
-
Jaro-Winklerアルゴリズムを使用して2つの入力カラムを照合します。
-
生成された機能キーによって出力カラムをグルーピングして、一致操作を最適化し、このシナリオの同じブロッキング値や機能キーを持つレコードのみを比較します。出力カラムのグルーピングとブロッキング値の使用については、tMatchGroupをご覧ください。