マスターレコードを存続
tRuleSurvivorshipコンポーネントやTalend Data Stewardshipを使えばマスターレコードを存続させることができます。
tRuleSurvivorshipを使ってレコードをマージ
重複、および重複の可能性がありグループ化されているものを推定した後は、tRuleSurvivorshipコンポーネントを使い、最善のデータによって重複する各グループに単一の表現を作成できます。これはサバイバーと呼ばれます。
tMatchPredictによってラベル付けされた疑わしいペアと、tMatchPairingによって計算された一意行からクリーンなデータセットを作成する方法の例は、https://help.talend.com/ja-JP/data-matching/8.0/tmatchmodelをご覧ください。
事務的なレビューとレコードのマージでTalend Data Stewardshipを使用
Talend Data Stewardshipでマージキャンペーンを追加すれば、サバイバーシップルールのレビューと変更、マスターレコードの作成、データのマージが可能になります。
Talend Data Stewardshipでのキャンペーンのマージングについては、Talend Data Stewardshipの例をご覧ください。
Talend Data Stewardshipでは、データスチュワードが次のようなデータスチュワードシップタスクの解決を担当するビジネスユーザーとなります。- 定義済みのアービトレーション選択リストから選択したラベルを割り当ててデータを分類する
- 重複する可能性がある複数のレコードを1つのレコードにマージする
権限を持つデータスチュワードはマージングタスクによって、重複する可能性があるソースレコードを1つのレコード(ゴールデンレコード)にマージできます。マージングタスクの結果として、データスチュワードによりゴールデンレコードが生成されます。
Talend Data Stewardshipでのタスクのマージングについては、Talend Data Stewardshipの例をご覧ください。
ソースレコードは同じソース(データベース重複除去)または異なるソース(データベース照合)から取得できます。