ヒートマップを分析
ヒートマップは、モデルの機能およびマッチングキーの重要性をすばやく確認するのに役立ちます。
次のサンプルでは、ヒートマップを分析する方法と、取得する最小モデルのクオリティに応じて、モデルに機能が必要かどうかを判断する方法を示します。
これらのサンプルでは、次の入力データを含む保育所のデータベースを使います。
- サイト名
- 住所
- 以前のデータのソース
データベースと設定は同じままです。マッチングキーのみが変更されました。
最初のサンプル: サイト名がマッチングキー
この例では、1つの入力データがマッチングキーとして設定されています。
モデルのクオリティは0.802です。高いですが、信頼できるモデルを作るには不十分です。
次のサンプルでは、モデルのクオリティへの影響を確認するために、より多くのマッチングキーが設定されています。
2番目のサンプル: 住所とサイト名がマッチングキー
この例では、1つのマッチングキーが前のサンプルに追加されています。
3番目のサンプル: 住所、サイト名、およびソースがマッチングキー
この例では、1つのマッチングキーが前のサンプルに追加されています。
概要
次のテーブルは、前述のサンプルのマッチングキーとモデルのクオリティをまとめたものです。
サンプル | マッチングキー | モデルのクオリティ |
---|---|---|
1 | サイト名 | 0.802 |
2 | 住所とサイト名 | 0.917 |
3 | 住所、サイト名、およびソース | 0.925 |
異なるマッチングキーを設定して複数のジョブを実行すると、一部のフィーチャーがモデルにとって重要ではないことがわかります。
モデルのクオリティが満足のいくものであっても、マッチングキーを追加または削除して結果を比較できます。
データベースによっては、それほど重要でないフィーチャーがモデルのノイズになる場合があります。
取得する最低モデルクオリティに応じて、モデルにマッチングキーが必要かどうかを判断できます。