使用关键驱动因素分析揭示数据背后的关键影响因素
通过关键驱动因素分析,您可以识别和比较数据中特定趋势的来源。关键驱动因素分析可帮助您可视化一组定义的因素对特定目标领域的当前数据的影响,并对其进行排名。利用您发现的见解来改进和加强组织的分析和决策过程。
关键驱动因素分析在Qlik Sense 应用程序中可用。在分析模式下,在工作表视图中执行关键驱动因素分析。
关键驱动因素分析在 Qlik Sense Business、Qlik Cloud Analytics Standard 或 Qlik Anonymous Access 中不可用。
关键驱动因素分析是什么?
关键驱动因素分析是一种统计数据发现形式,允许您确定各种因素对单个目标指标结果的影响程度。对定量和定性数据进行分析。关键驱动因素分析背后的意图是找出数据中特定趋势的确切原因,并利用这些见解采取直接行动或提高组织意识。
在商业智能中,您想评估影响者的常见目标是 Sales、Customer Satisfaction、Margin、Churned 和 Cost of Sale 等字段。因素(关键驱动因素)示例包括 Product、Location、Store Number 和 Manager
关键驱动因素分析中评估的指标因每个组织和用例而异。目标指标以及影响其结果的各种因素取决于您想要解决的问题、可用数据和其他因素。
为什么要使用关键驱动因素分析?
关键驱动因素分析在商业智能中很有用,因为它可以用多种方式应用于改进关键绩效指标。您可以使用关键驱动因素分析来解决问题,并获得与产品投资、收入扩展、成本降低、客户满意度等相关的见解。
在 Qlik Sense 中,关键驱动因素分析被集成到应用程序消费者体验中。使用 Qlik Sense 原生的实时数据分析特性,您可以在每次应用程序数据更改时运行新的关键驱动因素分析。这使您能够持续监控数据的变化,并快速发现新出现的趋势,以便在需要时采取及时有效的行动。
工作方式
关键驱动因素分析围绕影响力的概念展开。在 Qlik Sense 中,关键驱动因素分析评估特定领域(特性或关键驱动因素)对特定感兴趣领域(目标)的影响。
分析中使用的数据
关键驱动因素分析是对数据子集的具体检查。创建分析时,可以选择某些字段作为分析的组成部分。
您需要为每个分析选择以下构建块:
-
目标
-
多个特性
选择这些组件后,将使用目标和特性从数据模型中创建特定的数据集。关键驱动因素分析使用此数据集,而不是整个数据模型,来确定特性对目标的影响。不分析配置中未包含的字段。
下面提供了有关每个组件的更多信息。
计算影响
在 Qlik Sense 中,通过计算正在分析的数据子集中每个特性数据值的 SHAP 值来执行关键驱动因素分析。这些 SHAP 值是由 Qlik AutoML 训练的模型生成的。模型使用随机森林算法来生成 SHAP 值。
SHAP 值是一种计算数据值对相应目标值的影响程度的方法,与根据关键驱动因素分析配置专门创建的数据集中的其他特性有关。当您查看关键驱动因素分析的结果时,您查看的是数据集中所有记录或特定记录集的 SHAP 值的聚合。
有关 Qlik AutoML 中 SHAP 重要性的更多信息,请参阅了解实验训练中的 SHAP 重要性。
目标
目标是要分析其关键驱动因素的字段。例如,您可能想比较某些因素如何影响您的销售额。在这种情况下,您将选择一个销售指标作为目标。
在选择目标时,数据可用性时间非常重要,尤其与您选择包含在分析中的特性有关。有关目标和特性的正确数据收集时间框架的更多信息,请参阅特性。
目标中唯一值的数量和数据类型决定了分析将解决的问题类型。这反过来又会影响您的数据必须满足的要求。有关更多信息,请参阅数据要求。
关键驱动因素分析支持以下问题类型:
-
回归
-
二元分类
回归分析
当目标包含大量唯一数值时,将使用回归分析。如果您使用数字计算(度量)作为目标,关键驱动因素分析可能会将配置解释为回归问题。
选择度量作为目标时,可以将基本聚合直接应用于配置中的字段,或者如果希望使用更复杂的表达式,则可以选择现有的主条目。
二元分类分析
如果您的目标仅包括两个唯一值(例如,yes或no),则关键驱动程序分析将配置解释为二元分类问题。二元分类分析是通过选择一个二进制维度作为目标来创建的。
作为一个常见的例子,如果您的应用程序中有一个 Churned 字段来跟踪哪些客户取消了特定的服务,您可以选择 Chuned 字段作为目标,以揭示驱动这些客户决策的因素。
特性
这些特性是您的主要驱动因素。这些字段包含有关影响数据趋势的可提取信息。例如,当您创建一个关键驱动因素分析来识别销售背后的影响者时,您可以选择 Location、Product Type、Store Number 和 Sales Representative 等维度作为特性。计算的度量也可以用作特性。
您应该只包括包含在收集目标数据的时间点之前可记录和收集的数据的特性。如果包含的要素包含仅在收集目标数据时才知道的数据,则分析将出现偏差,无法提供分析价值。
例如,如果您的目标是 Sales,则不应包含包含直接从中派生的数据的特性。同样,如果您的目标是具有二进制结果(是或否)的 Churned 字段,则包含的特性不应包含客户流失日期。
有关如何识别无效分析结果的更多信息,请参阅识别无效的结果。
特性被指定为以下两种类型之一:
-
类别特性:包含基于不同、重复类别的数据值的特性。分类特性的一个例子可以是 Continent 字段,其中只有少数可能的值,这些值不会被解释为原始数字数据,而是被解释为文本。数字可以用作类别。
-
数字特性:数据值是纯数字数据,不属于类别。
专门分析所有包含的特性,以确定每个特性对目标中的当前数据有多大影响。
有关目标和包含的特性的要求的更多信息,请参阅数据要求。
应用程序选择
您在应用程序中所做的选择将用于关键驱动因素分析。例如,您可能想发现销售的关键驱动因素,但当将门店编号维度作为一项特性时,您可能只想分析组织中五个特定门店的影响。为此,您可以在应用程序中选择值,然后配置关键驱动因素分析。
因为选择基本上是应用于数据模型的筛选器,所以重要的是要意识到在一个字段中进行选择会影响可用于分析的可用数据。
租户订阅的注意事项
关键驱动因素分析依赖于 Qlik AutoML 来计算特性对目标的影响。它通过创建机器学习模型来实现这一点,该模型用于计算与所选数据子集中包括的特性相对应的数据点的 SHAP 值。
创建关键驱动因素分析会消耗 Qlik AutoML 计量的服务。大多数 Qlik Cloud 订阅都包含一定数量的 AutoML 使用。如果需要更多容量,则需要升级到付费级别的 AutoML。
请与您的服务帐户所有者联系,并咨询您正在使用的订阅条款,以了解您使用关键驱动因素分析的能力。
以下资源可以提供其他详细信息:
数据要求
最小数据量要求
根据目标和特性创建的数据集至少需要有 400 个单元格。否则,将无法运行分析。
其他要求
以下要求适用于根据分析配置创建的数据集:
-
目标需要至少包含两个唯一值。
-
如果目标包含两到十个唯一值,则每个唯一值需要出现在数据集中的至少十条记录中。
如果在运行关键驱动因素分析时遇到错误,可能是您为分析选择的数据不符合这些要求。有关您可能遇到的其他问题以及可能的解决方案列表,请参阅 故障排除 。
在 Qlik Sense 中使用关键驱动因素分析
以下帮助主题可以帮助您开始在 Qlik Sense 中创建和解释关键驱动因素分析:
限制
关键驱动因素分析的限制列表如下:
-
不支持将包含日期、时间或时间戳数据类型的字段用作目标或特性。