マッチングモデルを生成
このシナリオは、サブスクリプションベースのビッグデータ対応のTalendプラットフォーム製品およびTalend Data Fabricにのみ適用されます。
tMatchModelコンポーネントでは、tMatchPairingコンポーネントによって生成された疑わしいサンプルペアを読み取ってから、手動でラベル付けします。
tMatchModelコンポーネントでは、いくつかのマッチングモデルが生成され、学習パラメーターの最適な組み合わせが自動的に検索され、クロス検証の結果として出される最適なマッチングモデルが保持されます。
ここで説明するユースケースでは、以下のコンポーネントが使用されます:
-
tFileInputDelimitedコンポーネント。tMatchPairingによって生成された疑わしいデータペアを含むソースファイルが読み取られます。
-
tMatchModelコンポーネント。疑わしいレコードからフィーチャーを生成し、Random Forestアルゴリズムの実装により分類モデルを作成します。