为Qlik Answers准备应用程序的最佳实践
尽管任何应用程序都可以用于Qlik Answers,但花费时间准备应用程序以与Qlik Answers一起使用可以提高响应的质量。
清晰度和上下文是确保从Qlik Answers获得良好结果的最重要因素。清晰度使Qlik Answers易于理解应用程序中的数据。上下文有助于Qlik Answers解释并正确使用应用程序中的数据。准备应用程序的以下最佳实践有助于确保清晰度和上下文:
-
使用明确且描述性的字段名称
-
简化您的数据模型
-
检查字段的数据格式
-
使用主条目
-
使用业务逻辑词汇添加术语
-
从您的数据模型中删除不必要的字段
使用明确且具有描述性的字段名称
您的数据模型应使用具有描述性且明确的字段。字段名称应:
-
阐明每个字段的业务含义。
-
应用清晰的、与业务对齐的命名,以概述与其他字段的差异或相似之处。
以下最佳实践有助于阐明字段及其用途:
-
使用完整措辞,例如Customer Name而不是CUST_NM。这有助于使字段与自然语言问题对齐。
-
在字段名称中提供上下文限定符,以帮助区分字段。例如:
-
使位置清除。使用客户城市和商店城市,而不是两个都命名为城市的字段。
-
使数据/时间清除。使用订单日期和发货日期,而不是两个都命名为日期的字段。
-
尝试指明字段的角色和类型。加入“计数”、“总计”、“金额”或“百分比”等词语,以阐明其聚合性质。例如,订单计数。如果您的字段名称使用布尔值,它们应读作介词,例如使用 is_active 或 has_churned 等前缀。
-
对于关键字段,请为其添加上下文前缀。例如,customer_id 和 order_id 优于 ID 或 cust_ref 等通用字段。
避免使用具有以下特点的字段名称:
-
使用不透明代码或技术术语。
-
对布尔字段使用 Flag 或裸形容词(例如 Active),因为这会妨碍对字段的解释。
-
使用没有上下文的模糊或通用名词。例如,一个名为金额的字段,并没有说明它是什么的金额。多个通用字段会使自然语言查询难以可靠地映射到正确的字段。
-
使用隐晦的缩写,例如用cust_no表示客户编号,或用txn表示交易。这些会使理解该字段变得更加困难。
简化您的数据模型
通过移除不必要的字段来简化您的数据模型,可以产生更准确、可预测的答案。精心挑选的字段可以减少字段选择错误或混淆的可能性。简化的数据模型索引速度也更快。要简化您的数据模型:
-
隐藏技术字段。
-
将冗余或近似复制的字段整合为单一的权威版本。
隐藏技术字段
您的数据模型应向Qlik Answers呈现具有实际分析价值的字段。避免包含无助于Qlik Answers理解应用程序的技术字段。技术字段包含以下信息:
-
ID
-
键
-
加载时间戳
-
暂存列
您可以通过隐藏不必要的字段来将其移除。隐藏字段仍可用于脚本逻辑或内部计算,但会从Qlik Answers分析中排除。
-
在加载脚本或数据管理器中,在其名称中添加 % 前缀(例如,%Discount2)
-
在业务逻辑中的逻辑模型中,将其可见性设置为隐藏。
有关更多信息,请参阅可见性。
整合并重命名字段
将冗余或近似复制的字段整合为单一的权威版本。模糊字段使其难以正确解释数据。
重命名或合并字段,使数据模型尽可能清除易懂。
示例:通过修复模糊字段来简化数据模型
考虑数据模型中的以下字段名称:
-
折扣金额
-
折扣值
-
折扣1
-
折扣2
这些字段名称在 Qlik Answers 尝试解释它们时造成了一些问题:
-
多个字段争用术语 折扣,为 Qlik Answers 造成了歧义。
-
数字后缀(1、2)和模糊的字段名称没有提供清除业务含义。
-
混合命名约定降低了清晰度。
为了解决这些问题,在准备将应用程序与 Qlik Answers 配合使用时,应重命名字段。如果字段代表不同的概念,请重命名它们以清楚地表明其用途和目的。例如:
-
产品折扣
-
促销折扣
-
优惠券折扣
-
忠诚度折扣
如果它们代表相同的概念,则应合并为一个权威字段,例如折扣金额。如果这些字段中有任何技术性或遗留字段,则应将其隐藏。
将加载为纯文本的日期/时间字段格式化
某些字段包含日期/时间信息,但在数据模型中作为纯文本加载。由于它们未被归类为日期/时间字段,而是文本字段,因此在Qlik Answers分析中将无法正确使用,因为它们不会被视为真正的日期字段。
如果包含日期/时间信息的字段被标记或存储为文本,请在加载期间将其转换为正确的格式,可以使用数据管理器中的工具或加载脚本中的日期函数。这确保了:
-
该字段被识别为包含日期。
-
自动日历生成功能正常。
-
用户提出的基于时间的问题正确映射到数据/时间字段。
-
排序和筛选行为正确。
使用主条目
主条目提高了Qlik Answers解释应用程序数据的能力。在解释问题时,Qlik Answers 会将主条目看得比数据模型中的字段更重要,因为它们是用户创建的。主条目有助于 Qlik Answers 更准确地解释应用程序数据。在处理问题时,Qlik Answers 会将主条目看得比数据模型中的原始字段更重要,因为主条目代表用户定义的语义和业务意图。这使得 Qlik Answers 能够优先考虑精选定义,而不是底层的技术字段。
主条目通过在数据模型中为每个重要指标或字段创建单一、可信的版本,从而增加清晰度并减少歧义。这也有助于使不同用户之间的类似答案保持一致。当有人询问利润率并且存在相应的主度量时,无论谁提问或问题如何措辞,答案都基于相同的定义。
主条目最重要的元素之一是描述。Qlik Answers使用描述来为主条目的解释提供上下文。主条目中的强描述清楚地解释了:
-
意图
-
含义
-
业务背景
主条目描述使 Qlik Answers 更容易理解主维度或度量并选择正确的度量,即使用户以意想不到的方式提问。
有关主条目和 Qlik Answers 的其他最佳实践,请参阅 为Qlik Answers编写主条目描述。
示例: 有用的主条目描述
主度量: 客户获取成本
描述: 获取新客户的平均成本。计算方式为总营销和销售支出除以新获取客户的数量。不包括保留或续订支出。也称为CAC。
使用业务逻辑同义词来增加价值
业务逻辑同义词可帮助您优化 Qlik Answers 解释术语的方式。尽管 Qlik Answers 理解常见的业务语言,但您的数据模型可能包含 LLM 无法自然识别或正确解释的术语。同义词可帮助 Qlik Answers 理解您的组织数据特有的术语。以下术语类别可从添加同义词中受益:
-
组织特有的行话或缩写
-
内部 KPI 昵称
-
兼作业务术语的产品或流程代码
-
看起来相似但具有独特内部定义的指标
-
在您的行业之外不广泛使用的特定领域语言
尽量避免具有以下特点的同义词:
-
包含诸如top或bottom之类的术语,因为它们通常未明确指定,并且可以有多种解释。例如,top 5可能指按收入、交易数量、百分比或绝对排名计算的前5名。使用更精确的同义词有助于确保一致的解释。
添加复制字段值的同义词也可能增加歧义。
-
复制现有字段值,因为这可能会引入歧义。
-
将相同的同义词分配给多个字段,例如将销售额用于两个不同的度量。这使得不清楚应该使用哪个字段。
-
包含停用词,因为它们在问题处理期间会被忽略,并且可能会阻止问题被接受。
要了解更多信息,请参阅添加同义词。