サスペクトペアに割り当て済みのラベルを付ける
このシナリオは、サブスクリプションベースのビッグデータ対応のTalendプラットフォーム製品およびTalend Data Fabricにのみ適用されます。
Sparkのマッチングで使用する2つのワークフローの詳細は、Sparkのマッチングをご覧ください。
このユースケースでは以下のコンポーネントが使用されます:
-
tFileInputDelimitedコンポーネント。tMatchPairingによって生成される入力の疑わしいペアを読み取ります。
-
tMatchPredictコンポーネント。疑わしいレコードを自動的にラベル付けし、コンポーネントプロパティのラベルセットにマッチする疑わしいレコードをグルーピングします。
-
tFileOutputDelimitedコンポーネント。サスペクトレコードに作成された、ラベル付け済みの重複レコードとグループのうち、tMatchPredictプロパティ内のラベルセットとマッチングするものを出力します。