Talend MDMの統合マッチング
統合マッチングでは類似のレコードをまとめ、グループのすべてのレコードを連結したバージョンとなる"ゴールデン"レコードを作成します。
Talend MDMの統合マッチングでは、以下の手順を実行してデータの重複除去またはリコンサイルを行うことができます。
- 類似するレコードを識別し、残す値を選択する。これはマッチングとサバイバーシップのプロセスとして知られています。
- ゴールデンレコードをビルドする。
- マージするのに人手による介入を必要とするレコードのマージングタスクを作成し、Talend Data Stewardship内に自動的にリスト表示する。
- Talend Data Stewardship内でマージングタスクを処理する。たとえば、残った値を変更する、余分なレコードを削除するなど。
- ステージングエリアで検証プロセスを再び実行する。
統合マッチングはステージングエリア内のレコードのみを処理します。ステージングエリアは実際には、マスターデータレコードの保存に使用されるSQLストレージのミラーです。
ステージングエリアに検証を待機するデータレコードが保存されると、MDMユーザーは検証プロセスを実行して、データを"ステージングエリア"から"マスターデータベース"に転送できます。
MDM内の統合マッチングは、ネイティブ機能が完全に統合されており、すべてのロジックがさまざまなジョブに分散せず、MDMによって所有されているという点で、ジョブを使用するデータマッチングとは異なります。