Qlik Sense アプリでの SHAP 値のビジュアライゼーション
SHAP 値は、個々の結果およびモデルの原動力となるものを理解するのに役立ちます。Qlik Sense アプリで SHAP 値のビジュアライゼーションを構築して、データを深く掘り下げます。次の例では、ビジュアライゼーションのイメージを紹介しています。
準備
開始する前に、次を準備します。
-
座標 SHAP データセットを生成します。このデータセットには、SHAP 値の列が「特徴量」と「値」にピボットされており、1 つのチャートで複数の特徴量を使用できます。
-
二項分類予測の場合は、行ごとの SHAP 値の合計に対する予測確率をプロットし、SHAP 値の方向を調べます。傾きが負の場合は、SHAP 値の方向を逆にすると、ビジュアライゼーションの解釈がしやすくなります。
正の傾きを示す SHAP 値の方向チェック

特徴量重要度ランキング
各特徴量の SHAP 値の平均絶対値を使用して、特徴量重要度ランクを作成できます。この図は、顧客チャーン率に対するさまざまな特徴量の重要度を示しています。
Qlik Sense での SHAP Importance ランキング

方向と分布
SHAP 値は、各特徴量の影響の方向と分布を理解するためにも使用できます。図では、さまざまな特徴量が顧客のチャーンの可能性を高くしているか低くしているかを示しています。
Qlik Sense での SHAP 分布プロット

コホートの特徴量重要度
特徴量重要度は、個別のコホートに対して作成できます。例えば、異なるプラン タイプの顧客にとって最も重要な特徴量を比較できます。図は、プラン タイプごとの特徴量インフルエンサーを示しています。
このチャートは、Trellis container / 格子コンテナを使用して、データ内の特定のフィールド値のデータを表しています。セット式を使用して、同様のチャートを個別に作成することもできます。
プラン タイプ別に最もチャーンに影響を与えるものを表示する Qlik Sense のチャート

行レベルでの特徴量重要度
SHAP Importance を使用して、行レベルでの特徴量重要度を理解できます。図に示すように、顧客ごとにチャーン率に影響を与える特徴量を調査して比較できます。
特定の顧客 ID の SHAP Importance チャート

特徴量のバリエーション
特徴量の各バリエーションの影響をプロットできます。例えば、提供するプラン タイプごとに、顧客のプラン タイプの平均的な影響力を示すビジュアライゼーションを作成できます。
1 つの特徴量に対する特定のフィールド値の SHAP Importance を示す Qlik Sense の棒グラフ

1 つの特徴量に対する特定のフィールド値の SHAP Importance を示す Qlik Sense の分布プロット

連続変数
SHAP 値を散布図で使用して、連続変数の値が変動する傾向を分析できます。この SHAP 値のプロットでは、基本料金の増加に伴い、顧客チャーン率が上昇するのが一般的であることがわかります。
必要に応じて、回帰直線やその他のツールを使用して、データの新しい情報を発見することもできます。
基本料金の増加に伴うチャーン結果の傾向を示す SHAP 散布図
