Qlik Sense アプリでの SHAP 値のビジュアライゼーション
SHAP 値は、個々の結果およびモデルの原動力となるものを理解するのに役立ちます。Qlik Sense アプリで SHAP 値のビジュアライゼーションを構築して、データを深く掘り下げます。次の例では、ビジュアライゼーションのイメージを紹介しています。
準備
開始する前に、次を準備します。
-
座標 SHAP データセットを生成します。このデータセットには、SHAP 値の列が「特徴量」と「値」にピボットされており、1 つのチャートで複数の特徴量を使用できます。
-
二項分類予測の場合は、行ごとの SHAP 値の合計に対する予測確率をプロットし、SHAP 値の方向を調べます。傾きが負の場合は、SHAP 値の方向を逆にすると、ビジュアライゼーションの解釈がしやすくなります。
特徴量重要度ランキング
各特徴量の SHAP 値の平均絶対値を使用して、特徴量重要度ランクを作成できます。この図は、顧客チャーン率に対するさまざまな特徴量の重要度を示しています。
方向と分布
SHAP 値は、各特徴量の影響の方向と分布を理解するためにも使用できます。図では、さまざまな特徴量が顧客のチャーンの可能性を高くしているか低くしているかを示しています。
コホートの特徴量重要度
特徴量重要度は、個別のコホートに対して作成できます。例えば、異なるプラン タイプの顧客にとって最も重要な特徴量を比較できます。図は、プラン タイプごとの特徴量インフルエンサーを示しています。
このチャートは、Trellis container / 格子コンテナを使用して、データ内の特定のフィールド値のデータを表しています。セット式を使用して、同様のチャートを個別に作成することもできます。
行レベルでの特徴量重要度
SHAP Importance を使用して、行レベルでの特徴量重要度を理解できます。図に示すように、顧客ごとにチャーン率に影響を与える特徴量を調査して比較できます。
特徴量のバリエーション
特徴量の各バリエーションの影響をプロットできます。例えば、提供するプラン タイプごとに、顧客のプラン タイプの平均的な影響力を示すビジュアライゼーションを作成できます。
連続変数
SHAP 値を散布図で使用して、連続変数の値が変動する傾向を分析できます。この SHAP 値のプロットでは、基本料金の増加に伴い、顧客チャーン率が上昇するのが一般的であることがわかります。
必要に応じて、回帰直線やその他のツールを使用して、データの新しい情報を発見することもできます。