在 Qlik Sense 应用程序中可视化 SHAP 值
SHAP 值有助于我们理解什么是驱动模型以及单独驱动结果。在 Qlik Sense 应用程序中构建 SHAP 值的可视化,以进一步探索数据。以下示例将让您了解您可以获得的见解。
准备工作
开始之前,请做好以下准备:
-
生成坐标 SHAP 数据集。此数据集将 SHAP 值列透视为“特征”和“值”,这允许您在单个图表中使用多个特征。
-
对于二进制分类预测,根据每行 SHAP 值之和绘制预测概率,并查看 SHAP 值的方向。如果斜率为负值,请反转 SHAP 值的方向,以便于解释可视化效果。
特征重要性排名
可以使用每个要素的 SHAP 值的平均绝对值创建特征重要性等级。该图显示了不同特征对客户流失概率的重要性。
方向和分布
SHAP 值也可用于了解每个特征影响的方向和分布。在图中,您可以看到不同的特征是否使客户更容易流失。
队列的特征重要性
可以为不同的队列创建特征重要性。例如,您可以比较不同计划类型的客户最重要的特征。该图按计划类型显示了特征影响因素。
此图表使用网格容器表示数据中特定字段值的数据。也可以使用集合表达式单独创建类似的图表。
行级别的特征重要性
SHAP importance 可用于理解行级别的特征重要性。如图所示,您可以调查并比较哪些特征会影响不同客户的流失概率。
特征变化
可以绘制特征的每个变化的影响。例如,您可以创建可视化,以显示客户计划类型对您提供的每种计划类型的平均影响。
连续变量
SHAP 值可用于散点图,以分析连续变量值波动时的趋势。在 SHAP 值的图中,我们可以看到,客户的流失概率通常会随着基本费用的增加而增加。
可选地,我们还可以使用回归线和其他工具来发现数据中的新见解。