特徴量重要度を理解する
特徴量重要度は、各特徴量がターゲットにどれだけ影響を与えたかを表します。特徴量重要度によりデータセットの問題は特定され、モデルの改善に役立ちます。特徴量重要度は、Permutation Importance と SHAP Importanceという 2 つの異なるビジュアライゼーションで構成されます。
特徴量重要度を単純に解釈すると、最も特徴量重要度が高い変数を変更する場合、他の変数を変更するよりもターゲット変数が大きく変化するということになります。最も特徴量重要度が高い変数の 2 つを変更すると、1 つのみを変更するよりも影響が大きくなる可能性がありますが、原則として、特徴量重要度が非常に低いものは予測力が低いと考えられます。それを制御または変更しても、あまり違いはありません。まったく
特徴量重要度の使用
特徴量重要度は、モデルのトレーニングに使用されているデータの問題を特定するのに役立ちます。例えば、販売機会が成立するかどうかを予測しており、成立日を含む列を除外するのを忘れたとします。これは、おそらく最も予測に関連の高い列であり、したがって特徴量重要度は最も高くなります。それを含めると現実よりもモデルの業績が向上します。なぜなら、販売が成立するかどうかという二項対立の結果を予測しようとすると、成立日にアクセスすることができないからです。
特徴量重要度は、モデルを反復的に改善する方法を見つけるのにも役立ちます。最も特徴量重要度が高い値は、セグメント化に適したベースになる場合があります。例として、自動支払のフラグの特徴量重要度が非常に高い場合があります。この特徴量を使用してデータをセグメント化し、自動支払が設定されている顧客に対して 1 つのモデルをトレーニングし、自動支払を設定していない顧客で別のモデルをトレーニングできます。2 つのモデルは、最初のモデルよりもうまく機能する可能性があります。
また、冗長性を追加することなく、特徴量重要度がより高い変数が説明するものをより適切に表す特徴量を取得または設計できる場合があります。例えば、特徴量重要度が非常に高い変数は、ある企業が生産している製品群である可能性があります。製品群を、製品に関するいくつかの説明的な特徴量に分割すると、より大きな影響を与える可能性があります。
Permutation Importance と SHAP Importance の比較
Permutation Importance と SHAP Importance は、特徴量重要度を測定する別の方法です。主な違いは、Permutation Importance がモデル パフォーマンスの低下に基づくのに対し、SHAP Importance は特徴量属性の大きさに基づくことです。
値の使用方法
Permutation Importance は、次の目的に使用できます。
-
どの特徴量を残し、どの特徴量を除外するかを理解する。
-
データ漏洩をチェックする。
-
モデルの正確度を高めるために最も重要な特徴量を理解する。
-
追加の特徴量エンジニアリングをガイドする。
SHAP Importance は、次の目的に使用できます。
-
どの特徴量が予測結果に最も影響を与えるかを理解する。
-
特徴量を詳しく調べ、その特徴量のさまざまな値が予測にどのように影響するかを理解する。
-
データ内の個々の行またはサブセットに対して、最も影響を与えるものを理解する。
データ レベル
Permutation Importance は、データセット全体に対して計算されます。具体的には、特徴量を削除することによってデータセット全体の正確度がどの程度変化するかを確認します。個々の行に対する影響を理解するためには使用できません。
SHAP Importance は行レベルで計算され、特定の行にとって何が重要であるかを理解するために使用できます。値は、データセットの平均結果と比較して、特徴量が単一行の予測にどのように影響するかを表します。
特徴量の値の影響
Permutation Importance を、特徴量のどの値が最も重要であるかを理解するために使用することはできません。
SHAP Importance の値は、特定の特徴量の値が結果にどのように影響するかを理解するために使用できます。
方向
Permutation Importance には、方向は含まれません。
SHAP Importance の値には、方向があります。予測された結果に影響を与えた方向に応じて、正または負になります。
大きさ
Permutation Importance の大きさは、モデルの全体的な予測に対して特徴量がどの程度重要であるかを測定します。
SHAP Importance の大きさは、特定の特徴量がデータセットの平均的な予測とは異なる行の予測にどの程度影響を与えるかを示しています。