tMatchModelを使ってマッチング機能を抽出
疑わしい重複するペアのラベル付きサンプルをtMatchModelコンポーネントの入力として使えます。
モデルがビルドされるカラムのセットとラベルを指定するカラムを指定する必要があります。アルゴリズムは、特徴量というさまざまな測定を計算して、このカラムのセットで可能な限り情報を多く取得します。
tMatchModelコンポーネントは、ランダムフォレストアルゴリズムを使用して、モデルをビルドします。このアルゴリズムはデシジョンツリーの一般化です。