サスペクトペアと一意な行の計算
手順
タスクの結果
tMatchIndexPredictは、入力データからのレコードと、Elasticsearch内でインデックスが作成された参照データセットからのマッチングレコードをグルーピングし、サスペクトペアにラベル付けします。これらは同じ行に表示されます。

tMatchIndexPredictは一意なレコードを除外して、別のファイルに書き込みます。

これで、一意な行をクリーン化し、重複除去して、tMatchIndexを使用して、Elasticsearchに保存されている参照データセットに追加できます。