使用关键驱动因素分析揭示数据背后的关键影响因素
借助关键驱动因素分析,您可以识别并比较数据中特定趋势的来源。关键驱动因素分析可帮助您可视化并对一组定义的因素对特定目标字段当前数据的影响进行排名。利用您发现的见解来改进和增强组织的分析和决策流程。
关键驱动因素分析在 Qlik Sense 应用程序中可用。在分析模式下,在工作表视图中执行关键驱动因素分析。
关键驱动因素分析在 Qlik Sense Business、Qlik Cloud Analytics Standard 或 Qlik Anonymous Access 中不可用。
Qlik Sense 应用程序中的关键驱动因素分析
什么是关键驱动因素分析?
关键驱动因素分析是一种统计数据发现形式,允许您识别各种因素对单一目标指标结果的影响程度。该分析针对定量和定性数据执行。关键驱动因素分析的目的是准确找出导致数据中某种趋势的原因,并利用这些见解采取直接行动或提高组织意识。
在商业智能中,您希望评估影响因素的常见目标是字段,例如 销售额、客户满意度、利润率、流失和 销售成本。因素(关键驱动因素)的示例包括 产品、位置、商店编号和 经理。
在关键驱动因素分析中评估的指标因每个组织和用例而异。目标指标以及影响其结果的各种因素取决于您要解决的问题、可用数据和其他因素。
为什么要使用关键驱动因素分析?
关键驱动因素分析在商业智能中非常有用,因为它可以以多种方式应用来改进关键绩效指标。您可以使用关键驱动因素分析来解决问题并获得与产品投资、收入扩张、成本降低、客户满意度等相关的见解。
在 Qlik Sense 中,关键驱动因素分析集成到了应用程序消费者体验中。使用 Qlik Sense 原生的实时数据分析功能,您可以在每次应用程序数据更改时运行新的关键驱动因素分析。这使您可以持续监控数据的变化并快速发现新兴趋势,以便在需要时采取迅速有效的行动。
工作原理
关键驱动因素分析以影响力的概念为中心。在 Qlik Sense 中,关键驱动因素分析评估特定字段(特性或关键驱动因素)对特定关注字段(目标)的影响。
分析中使用的数据
关键驱动因素分析是对数据子集的特定检查。创建分析时,您选择某些字段作为分析的组件。
您需要为每个分析选择以下构建块:
-
目标
-
多个特性
选择这些组件后,将使用目标和特性从您的数据模型创建一个特定的数据集。关键驱动因素分析使用此数据集(而不是整个数据模型)来确定特性对目标产生的影响。未包含在配置中的字段将不被分析。
下面提供了有关每个组件的更多信息。
计算影响力
在 Qlik Sense 中,通过计算您正在分析的数据子集中每个特性数据值的 SHAP 值来执行关键驱动因素分析。这些 SHAP 值由 Qlik Predict 训练的模型生成。模型使用随机森林算法生成 SHAP 值。
SHAP 值是计算数据值对相应目标值的影响程度,这与根据您的关键驱动因素分析配置专门创建的数据集中的其他特性相关。当您查看关键驱动因素分析的结果时,您正在查看数据集中所有或特定记录集的 SHAP 值的聚合。
有关 Qlik Predict 中 SHAP 重要性的更多信息,请参阅 了解实验训练中的 SHAP 重要性。
目标
目标是您要分析其关键驱动因素的字段。例如,您可能想要比较某些因素如何影响您的销售额。在这种情况下,您将选择销售度量作为您的目标。
选择目标时,数据可用性的时间很重要,特别是与您选择包含在分析中的特性相关时。有关目标和特性的适当数据收集时间范围的更多信息,请参阅 特性。
目标中唯一值的数量和数据类型决定了分析将解决的问题类型。这反过来又会影响您的数据必须满足的要求。有关更多信息,请参阅 数据要求。
关键驱动因素分析支持以下问题类型:
-
回归
-
二元分类
回归分析
当目标包含大量唯一的数值时,将使用回归分析。如果您使用数值计算(度量)作为目标,关键驱动因素分析可能会将配置解释为回归问题。
选择度量作为目标时,您可以直接对配置中的字段应用基本聚合,或者如果您想使用更复杂的表达式,可以选择现有的主条目。
二元分类分析
如果您的目标仅包含两个唯一值(例如,是或否),关键驱动因素分析会将配置解释为二元分类问题。通过选择二元维度作为目标来创建二元分类分析。
作为一个常见的例子,如果您的应用程序中有一个 流失 字段来跟踪哪些客户取消了特定服务,您可以选择 流失 字段作为目标,以揭示推动这些客户决策的因素。
特性
特性是您的关键驱动因素。这些字段包含有关影响数据趋势的因素的可提取信息。例如,当您创建关键驱动因素分析以识别销售额背后的影响因素时,您可能会选择 位置、产品类型、商店编号 和 销售代表 等维度作为特性。计算的度量也可以用作特性。
您应该只包含包含在收集目标数据的时间点之前可记录和收集的数据的特性。如果您包含的特性包含只有在收集目标数据时才会知道的数据,则分析将会出现偏差,并且无法提供分析价值。
例如,如果您的目标是 销售额,则不应包含包含直接从中派生的数据的特性。同样,如果您的目标是具有二元结果(是或否)的 流失 字段,则不应包含包含客户流失日期的特性。
有关如何识别无效分析结果的更多信息,请参阅 识别无效结果。
特性被分配为以下两种类型之一:
-
分类特性:包含基于不同、重复类别的数值的特性。分类特性的一个例子可能是 大洲 字段,其中只有少数可能的值,并且这些值不被解释为原始数值数据,而是解释为文本。数字可以用作类别。
-
数值特性:数据值纯粹是数值数据且不属于类别的特性。
所有包含的特性都经过专门分析,以确定每个特性对目标中当前数据的影响程度。
有关目标和包含的特性的要求的更多信息,请参阅 数据要求。
应用程序选择
您在应用程序中所做的选择将用于关键驱动因素分析。例如,您可能想要发现销售额的关键驱动因素,但在将 商店编号 维度作为特性包含在内时,您可能只想分析组织中五个特定商店的影响。为此,您可以在应用程序中选择这些值,然后配置关键驱动因素分析。
由于选择基本上是应用于数据模型的过滤器,因此必须注意,在一个字段中进行选择可能会影响可用于分析的可用数据。
租户订阅的注意事项
关键驱动因素分析依赖于 Qlik Predict 来计算特性对目标的影响。它通过创建机器学习模型来实现这一点,这些模型用于计算与所选数据子集中包含的特性相对应的数据点的 SHAP 值。
创建关键驱动因素分析会消耗由 Qlik Predict 计量的服务。大多数 Qlik Cloud 订阅都包含一定数量的 Qlik Predict 使用量。如果需要更多容量,则需要升级到 Qlik Predict 的付费层。
请咨询您的服务帐户所有者,并查阅您正在使用的订阅条款,以了解您使用关键驱动因素分析的容量。
以下资源可以提供更多详细信息:
-
Qlik Cloud® 订阅的产品描述
数据要求
最低数据量要求
从您的目标和特性创建的数据集需要至少有 400 个单元格。否则,您无法运行分析。
其他要求
以下要求适用于从您的分析配置创建的数据集:
-
目标需要包含至少两个唯一值。
-
如果目标包含两到十个唯一值,则每个唯一值需要至少出现在数据集中的十条记录中。
如果在运行关键驱动因素分析时遇到错误,可能是您为分析选择的数据不满足这些要求。有关您可能遇到的其他问题和可能的解决方案列表,请参阅 故障排除。
在 Qlik Sense 中使用关键驱动因素分析
以下帮助主题可帮助您开始在 Qlik Sense 中创建和解释关键驱动因素分析:
限制
下面提供了关键驱动因素分析的限制列表:
-
不支持将包含日期、时间或时间戳数据类型的字段用作目标或特性。