在 Qlik Sense 应用程序中可视化预测数据
该过程的最后一步是创建一个 Qlik Sense 分析应用程序,以可视化您生成的预测数据。
替代工作流:上传预配置的应用程序
您可以将本教程开始时下载的 Customer churn predictions.qvf 应用程序上传到 分析 活动中心,而不是按照本主题中的剩余步骤操作。
本页面上的其余部分将指导您创建类似的应用程序。应用程序中的预测数据与您自己的预测数据之间会有一些差异。
可下载的应用程序包含一个标题为 Individual Customer Analysis 的附加工作表,该工作表使用条件表达式来鼓励一次对单个客户帐户进行精细分析。
入门
在 分析 活动中心,转到“创建”页面并单击 应用程序。 为应用程序选择一个空间,并将其命名为 Customer churn predictions。
单击 创建。
创建数据模型
选择您的数据
您需要将必要的数据添加到应用程序中。这包括应用数据集(在教程开始时上传)和从预测生成的两个数据集。
执行以下操作:
-
在新应用程序中,单击以从 数据目录 添加数据。
-
在 数据目录 中,单击以下三个数据集旁边的复选框:
-
应用数据集: ML - Churn data - apply.csv 或 ML - Churn data - apply.qvd
-
预测 数据集:ML - Prediction output.parquet
-
坐标 SHAP 数据集:ML - Prediction output_Coordinate_SHAP.parquet
-
-
单击 下一步。
-
将出现一个摘要面板。单击 ML - Churn data - apply 数据集以展开要加载的可用字段。
-
单击在模型训练期间取消选择的任何特性旁边的
图标。您需要将 AccountID 保留在列表中,因为它是一个关键字段。作为参考,请返回您创建的预测配置并比较模型和应用数据集模式(有关一般帮助,请参阅 编辑预测配置)。
-
单击 加载到应用程序。
关联数据
此时,您已将数据添加到应用程序中,但在将数据集关联在一起之前,不会构建连接的数据模型。在这种情况下,AccountID 字段将是链接数据集的索引。
在您的应用程序中,数据管理器 现已打开。您将看到这三个数据集,但它们显示为未连接的独立实体。
执行以下操作:
-
在您的应用程序中,数据管理器 现已打开。您将看到这三个数据集,但它们显示为未连接的独立实体。
-
在 数据管理器 的右侧窗格中,找到 AccountID 关联建议。
-
单击 应用。这些表现在应该连接在一起了。
-
单击 加载数据。
在 数据模型查看器 中检查您的关联
在应用程序中构建任何可视化之前,您应该验证数据是否已正确关联。
执行以下操作:
-
在界面顶部的导航栏中,打开应用程序导航菜单并选择 数据模型查看器。
-
检查这三个数据集是否已正确连接。AccountID 字段应作为所有三个数据集的键。应用程序的数据模型应如下图所示。
显示预测应用程序数据模型的 数据模型查看器
您现在已准备好开始构建分析内容。单击导航栏中 分析 选项卡内的 工作表。
第一个工作表:聚合预测仪表板
第一个工作表将侧重于以聚合形式分析预测。
执行以下操作:
-
您现在应该处于工作表编辑模式。
-
右键单击工作表中的任何现有可视化,然后将其删除。这是一个图表建议功能,我们在本教程中不会使用。
-
为工作表指定一个标题,例如 Aggregated Predictions。为此,请单击空白工作表中的任意位置以打开界面右侧的 工作表属性。在 标题 下,键入工作表的名称。
饼图
饼图可让您轻松可视化数据的比例细分。在这种情况下,按预测结果(yes 或 no)细分数据是有意义的。
执行以下操作:
-
将饼图拖到工作表上。
-
添加 Churned_predicted 作为维度。
-
添加以下度量:
Count(AccountID) -
如果需要,请在属性面板中的 外观 > 演示 下关闭 维度标签。
-
在属性面板中的 数据 下展开维度,并将维度的 标签 修改为 Predicted to Churn。
标签在图例中更新。
筛选器窗格
此仪表板将用于对整个数据模型进行广泛分析。然而,能够跨各个维度快速筛选数据以分析特定群组几乎肯定是重要的。
创建具有多个列表框的筛选器窗格。每个列表框允许在单个维度内选择值。
执行以下操作:
-
将筛选器窗格拖到工作表上。
-
将字段添加到筛选器窗格。这些可能是您期望对预测结果具有重要意义的维度。
-
根据需要通过单击属性面板中 数据 下的字段来修改每个列表框。这将打开 列表框属性。
例如,您可能想要更改字段标签,并将 折叠列表框 设置为 始终 以节省工作表空间。
调整筛选器窗格的大小,使其显示为工作表一侧的面板。
KPI 对象
KPI 是为数据中特别重要的分析显示单个值的绝佳方式。在这里,我们将创建三个 KPI 图表。
执行以下操作:
-
创建一个空白 KPI 图表。添加以下度量:
=Count(Churned_predicted)这将计算我们为其生成流失预测的客户总数。
-
将度量标记为 Total # of Customers。
-
将 数字格式 设置为 数字,并以 1,000 格式(不带小数或百分比值)显示值。
-
创建另一个空白 KPI 图表。添加以下度量:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))这是一个集合表达式,用于计算值 yes 在 Churned_predicted 字段中显示的次数。
-
将度量标记为 Predicted to Churn。
-
使用与第一个 KPI 相同的设置配置图表的数字格式。
-
创建第三个空白 KPI 图表。添加以下度量:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))这将计算值 no 在 Churned_predicted 字段中显示的次数。
-
将度量标记为 Predicted to Stay。
直方图
您可以使用直方图可视化预测概率值的分布。
将直方图拖到工作表上并为其指定标题。添加 Churned_yes 作为维度。
堆叠式条形图
要按分类字段(例如计划类型)分析预测,您可以创建一个条形图,将各个集合分析堆叠在一起。
执行以下操作:
-
将条形图拖到工作表上,并将其命名为 Churn Predictions by Plan Type。
-
添加 PlanType 作为维度。将其标记为 Plan Type。
-
添加以下度量:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))将度量标记为 Predicted to Stay。
-
添加以下度量:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))将度量标记为 Predicted to Churn。
-
在 外观 > 演示 下,将布局从 分组 更改为 堆叠式。
-
移除滚动条并将 值标签 设置为 开。
-
将 分段标签 和 总计标签 配置为 自动。
完成后,您可以使用相同的两个度量创建一个类似的条形图,但使用不同的分类维度,例如 NumberOfPenalties。
用于分析单个数值字段值的分布图
分布图可用于通过具有不同数值的度量来呈现预测数据。在本部分中,您将创建一个图表,以按基本费用显示流失预测,并为客户的服务评级进行不同的分组。
执行以下操作:
-
将分布图拖到工作表上,并将其命名为 Churn Predictions by Base Fee and Service Rating。
-
添加 AccountID 作为点的维度。
-
在 x 轴上添加以下度量:
=Avg(BaseFee) -
在 y 轴上添加以下计算维度:
=Round(ServiceRating,2)这会沿 y 轴为近似的 ServiceRating 值创建分组。该值越高,客户对其服务质量的评级就越高。
-
在 外观 > 演示 下,将 气泡大小 减小到 20 并打开 抖动点。
-
在 颜色和图例 中,将 颜色 设置为 自定义。
-
选择按以下维度为数据着色的选项:
=Churned_predicted这将为 Churned_predicted 字段中的每个值分配一种颜色。在这种情况下,将显示两种颜色。
-
向维度和度量添加标签,并将以下标签添加到自定义颜色设置:Predicted to Churn。
通过用其他字段聚合替换 BaseFee 度量,可以创建类似的图表来分析不同的数值字段。
配置工作表上的可视化,使其看起来与下图类似。
预测分析工作表

第二个工作表:聚合 SHAP 仪表板
接下来,创建一个专门用于分析聚合 SHAP 值的工作表。
执行以下操作:
-
创建一个新工作表。
-
为工作表指定一个标题(例如, Aggregated SHAP)。
SHAP 重要性排名
这种类型的图表类似于您在配置实验版本时可能看到的自动生成的图表。在这里,我们将为预测数据集制作一个。
这种类型图表的目的是显示对 Churned 列中看到的结果贡献最大的特性。我们需要注意的是,由于我们将使用绝对值,因此 SHAP 结果可能为正(值为 yes)或负(值为 no)。如果您愿意,也可以使用不计算绝对值的表达式。
执行以下操作:
-
将条形图拖到空工作表上。
-
将图表命名为 SHAP Importance by Feature。
-
添加 automl_feature 作为维度,并将其标记为 Feature。
这允许您跨所有包含的特性呈现聚合数据。
-
添加以下计算度量:
=fabs(Avg(SHAP_value)) -
在 标签 下,键入 Average Absolute SHAP。
-
在属性面板中,在 外观 > 演示 下,移除滚动条(如果存在),并将图表方向从 垂直 设置为 水平。
-
在 排序 下,如果尚未完成,请将度量拖到维度上方。将每个字段的排序保留为 自动。
这会按度量值以递减模式对图表进行排序。
Trellis container/格子容器
您可以制作一个 Trellis container/格子容器,以筛选维度内特定字段值的数据。在这种情况下,我们可以细分提供给客户的四种计划类型中每一种的 SHAP 值。
要创建 Trellis 对象,您需要指定一个维度和一个主可视化。我们将把刚刚创建的 SHAP 重要性排名转换为一个主可视化。
执行以下操作:
- 右键单击工作表中的 Average Absolute SHAP 图表,然后选择
添加到主条目。
- 保留默认名称并单击 添加。
-
在资产面板中的 自定义对象 > Qlik Visualization bundle 下,将 Trellis container/格子容器拖到工作表上。
-
添加 PlanType 作为维度。
-
在图表内单击 添加主可视化,然后添加 Average Absolute SHAP 图表。
-
在属性面板中的 外观 > 常规 下,打开 显示标题 并将图表命名为 SHAP Importance by Plan Type。
-
调整 Trellis container/格子容器的大小,使其足够宽以显示图表中的特性名称。如果未显示所有标签,请调整浏览器窗口中的缩放比例。
或者,您可以通过为您要分析的每个维度值创建带有集合表达式的单独图表来显示此数据。在这种情况下,您可以为四种计划类型中的每一种创建一个单独的图表。
重用筛选器窗格
您在第一个工作表上创建的筛选器窗格可以在此工作表上重用。在工作表编辑模式下,右键单击筛选器窗格并复制它。将其粘贴到 Aggregated SHAP 工作表中。
树状图
您还可以使用树状图可视化 SHAP 值的细分。将树状图拖到工作表上,并添加您在 SHAP 重要性排名中使用的相同维度和度量。
配置工作表上的可视化,使其看起来与下图类似。
分析模式下的 Aggregated SHAP 工作表

使用应用程序
完成构建应用程序后,即可将其用于数据分析。
单击 编辑工作表 以切换到分析模式。在此视图中,您可以进行选择(在筛选器窗格或工作表中的其他位置)以筛选数据,从而对数据子集进行特定分析。例如,您可能想要分析特定的客户计划类型或区域,并将结果与其他数据子集进行比较。
谢谢!
您已到达本教程的结尾。我们希望您学到了一些东西,并认识到自动化机器学习是生成预测模型的一种快速简便的方法。Qlik Sense 是一个强大的工具,可以轻松可视化您的预测数据并为您的数据提供有意义的见解。