tMatchPredict
疑わしいレコードを自動的にラベル付けし、コンポーネントプロパティのラベルセットにマッチする疑わしいレコードをグルーピングします。
tMatchPredictでは、tMatchPairingおよびtMatchModelコンポーネントによって生成されたペアリングおよびマッチングモデルに基づいて、疑わしいペアのラベル付けを行います。
新しい入力データで、ペアリングされていない場合は、入力データを[unpaired] (ペアリングなし)として定義し、ペアリングモデルフォルダーのパスを設定して、厳密な重複とユニークレコードを分離できます。
tMatchPredictでは、新しいデータセットからユニークレコード、厳密な重複、および疑わしい重複を出力することもできます。
ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。