术语表
表格:ODS、HDS 和更改
在数据项目中,有几种类型的表,这些表可能存在,也可能不存在,具体取决于项目设置:
当前表 (ODS)
此表包含数据源的副本,该副本在最近的应用间隔期间根据更改进行了更新。
先前表格 (HDS)
此表包含类型 2 历史数据。仅当在数据任务设置中启用了历史记录时,才会生成。
更新源表记录时,每次都会向上一个表中添加一条新记录。历史记录是前一个当前记录的副本,其中还包括更新的内容以及有效时间。
更改表
此表包含尚未应用于当前表的所有更改。仅当使用登陆模式满载和 CDC 时才生成。
请参阅: 云数据仓库中的数据集架构
超参数优化
微调机器学习模型的约束、权重和学习率以提高其解决问题的性能的过程。在 Qlik AutoML中,这在默认情况下不启用,但可以在实验配置期间应用,以获得可能改进的结果。
请参阅: 超参数优化
词汇
词汇表是一种业务逻辑功能,允许您向 Insight Advisor 搜索 和 Insight Advisor Chat 添加同义词和自定义分析。
大型应用程序支持
有了大型应用程序支持,您可以使用大于标准应用程序大小的应用程序。管理员可以将大型应用程序支持分配给特定空间。
对于 Qlik Sense Enterprise SaaS,标准应用程序大小最高可达 5 GB,对于Qlik Cloud 分析 高级版和企业版最高可达 10 GB。
请参阅: 大型应用程序支持
登陆
在 Qlik Cloud 数据集成 中,登陆可以指以下其中之一:
- 云数据仓库中的一个数据库(通常称为登陆区),源数据最初“登陆”,然后再通过数据管道进一步处理
- 将数据从数据源移动到登陆区的实际任务或过程
Qlik Cloud 数据集成 中的登陆任务控制数据从数据源到登陆区的连续或计划登陆。
请参阅: 云数据仓库中的数据集架构
工作表
工作表是 Qlik Sense 应用程序的组件。它们向应用程序用户展示可视化效果,以便他们能够探索、分析和发现数据。工作表可以是公共的,也可以是私人的。
相似术语:仪表板、工作表
请参阅: 工作表视图
合成钥
合成钥是数据模型中两个表之间的复合钥。在两个或更多数据表共有两个或更多字段时,会创建它们。如果在加载数据时收到有关合成钥的警告,您可能需要在数据模型查看器中查看数据结构。合成钥不一定是问题,但如果您有基于其他合成键的合成钥,则数据模型中可能存在错误。
请参阅: 合成钥
交叉验证
在 Qlik AutoML 中的实验训练过程中完成的一个过程,其中训练数据被分成五个片段(折叠),允许每个数据片段用作其他四个片段的测试。交叉验证的结果将显示一个模型对其从未见过的数据进行预测的能力。
请参阅: 保留数据和交叉验证
聚合
聚合是使用源表中的多条记录进行的计算。通常,它是一个单独的字段,使用 sum、count、min、max 或 average 等函数进行聚合。例如,销售额的值。
相似术语:计算,度量,指标
请参阅: 度量
联想见解
联想见解是一种 Insight Advisor 功能,它将您的选择与您的选择排除的值进行比较,以帮助您找到盲点和隐藏的关系。
逻辑模型
逻辑模型是底层数据模型,告诉 Insight Advisor 在生成可视化时如何使用数据。
相似术语:逻辑模型、逻辑框架
模型度量
有关算法在 Qlik AutoML 中的实验训练中执行情况的详细信息。模型度量显示每个模型学习的准确程度,以确定机器学习问题的正确结果。这有助于决定将部署哪个模型以用于创建预测。
请参阅: 查看模型分数
目标
该术语有几种定义:
前置 Load
前置 Load 是一个脚本构造,允许您从后续 LOAD 或 SELECT 语句加载,而无需指定该源。前置 Load 通常比 Resident LOAD 快。
请参阅: 从之前加载的表格中加载数据
曲线下面积 (AUC)
AUC 的 ROC曲线(曲线下面积)描述了当实际结果为正时,机器学习模型在预测正类方面的效果。真阳性率越接近曲线下最大可能面积的 1.0,模型的确定性越高。ROC 曲线有助于理解类别之间的分离是否可能,由此表明数据是否足够好,以准确区分预测结果。
请参阅: AUC 和 ROC 曲线
商业逻辑
业务逻辑是一套功能,允许您自定义 Insight Advisor 的行为。商业逻辑有两个主要功能:
-
逻辑模型:生成可视化时应用程序使用的数据模型。
-
词汇:自然语言查询的替代术语。
相似术语:逻辑模型、词汇、领域逻辑
实时视图
在 Qlik Cloud 数据集成 中,实时视图允许您访问当前数据 (ODS) 和历史数据 (HDS)。实时视图包括尚未应用于当前或以前表的更改表中的数据。这使您能够以较低的延迟查看数据,而无需频繁应用更改的数据。延迟合并的能力允许降低目标平台中的成本和处理要求。
另请参阅: 实时视图
事实
事实表与维度表一起使用。事实表保存要分析的数据,维度表存储有关事实表中数据分析方式的数据。因此,事实表由两种类型的列组成:主键列和度量列。主键列允许与维度表连接,度量列包含正在分析的数据。例如,订单事实数据集将简单地列出在某一天,某个客户购买了一定数量的某个产品,而相关维度数据集将提供有关客户、产品和交易发生地区的更多信息。
请参阅:创建和管理数据集市
视图
视图用于数据项目。视图是物理数据集的虚拟表示。由于视图是通过查询物理数据集生成的,因此它们将始终从基础数据集中选择相关数据。与物理数据集相比,视图有几个优点:它们能够从多个数据集之间的连接生成单个结果集;它们控制对底层数据的访问;并且它们不占用任何显著的磁盘空间。
数据项目中可以有几种类型的视图。创建哪些视图取决于是否启用了实时视图和历史记录,以及是否使用更改处理。
请参阅: 云数据仓库中的数据集架构
数据管道
在数据项目中,数据管道是一组用于集成数据的任务。入职将数据从内部部署或云中的数据源移动到项目中,并将数据存储在随时可用的数据集中。您还可以执行转换并创建数据集市,以利用生成和转换的数据集。数据管道可以是简单的线性管道,也可以是一个复杂的管道,它消耗多个数据源并生成多个输出。
请参阅: 创建数据管道
数据集
术语数据集有时与表同义。它可以引用原始源表、经过转换后的表或数据集市中的事实表和维度表。
它也可以指逻辑表,其中有几个实例表和视图:
-
当前数据
-
历史记录,保存表的以前版本
-
更改
请参阅:管理数据集
数据集市
数据集市是数据管道的一部分,包含存储或转换数据资产中的数据子集。您可以根据业务需要创建任意数量的数据集市。理想情况下,您的数据集市应该包含收集的汇总数据的存储库,以便对您组织内的特定部门或单位进行分析。
请参阅: 创建和管理数据集市
数据空间
数据空间是 Qlik Cloud 租户的受管理区域,用于创建和存储数据项目。在空间内,您还可以使用连接器创建新的数据连接,并管理对数据移动网关的访问。所有数据资产都将在它们所属的数据项目的空间中创建。
数据任务
数据任务是数据项目中的主要工作单元。在数据项目中。可以创建以下类型的数据任务:
- 登陆 - 将数据从数据源移动到云数据仓库或 Qlik Cloud。
- 存储 - 将登陆数据存储在读取中以使用数据集中。
- 注册的数据 - 注册数据平台上已存在的数据。
- 转换 - 根据目标需求和业务需求转换数据。
- 数据集市 - 从存储或转换的数据创建数据集市。
您还可以将登陆和存储合并为单个“入门”任务。
请参阅:数据任务
数据网关 - 数据移动
Qlik 数据网关 - 数据移动 允许您通过严格的出站、加密和相互认证的连接将防火墙数据从企业数据源移动到云目标。通过消除打开入站防火墙端口的需要,Qlik 数据网关 - 数据移动 为访问企业数据提供了一种安全可靠的方法。
请参阅:Qlik 数据网关 - 数据移动
数据网关 - 直接访问
Qlik 数据网关 - 直接访问 允许 Qlik SenseSaaS 应用程序通过严格的出站、加密和相互认证的连接安全地访问防火墙数据。
请参阅: Qlik 数据网关 - 直接访问 概述
数据项目
数据项目是使用数据资产创建数据管道的地方。数据项目与用作所有输出目标的数据平台相关联。您可以创建一个简单的线性管道,也可以创建一条消耗多个数据源并生成多个输出的复杂管道。
请参阅: Qlik Cloud 数据集成 简介
数据泄露
机器学习中的一种不希望出现的现象,在这种现象中,用数据训练算法,并将其用于生成预测。数据泄漏的一个指标是不切实际的高模型性能,其结果仅来自目标值的记忆(直接或间接地在训练数据中错误提供),而不是模式和关联的实际学习。
请参阅: 数据泄露
图表
图表是可以进行计算、聚合和分组的对象。图形可视化(如条形图和饼图)是常见的示例,但透视表等非图形对象也是图表。
图表由维度和度量组成,其中每个维度值计算一次度量。如果图表包含多个维度,则每个维度值组合计算一次度量。
相似术语:可视化、Hypercube、Cube
请参阅: 选择正确的可视化
完全用户
完全用户授权 适用于 Qlik Cloud 中的所有用例。作为完全用户,您可以执行权限允许的任何操作,例如创建共享空间、创建、编辑和发布工作表或应用程序,或使用数据集成。
请参阅: 管理用户权限
维度
在 分析服务 中:
维度是用于对图表中的数据进行分类的实体。例如,饼图中的切片或条形图的条形表示维度中的单个值。维度通常是具有离散值的单个字段,但也可以在表达式中计算。
相似术语:类别、组
请参阅: 带维度的数据分组
在 数据集成 中:
维度是数据集市中的数据集,构成星形模式的一部分。维度数据集保存事实表记录中包含的所有相关字段的描述性信息。维度数据集的几个常见示例是客户和产品。由于维度数据集中的数据通常是非规范化的,因此维度数据集具有大量列。
请参阅: 创建和管理数据集市
应用程序
该术语有几种定义:
-
Qlik Sense 或 QlikView 应用程序:应用程序是特定于任务的、专门构建的应用程序。应用程序包含从数据源加载的数据,该数据通过可视化进行解释。
相似术语:文档、工作簿
请参阅: 了解应用程序
-
Qlik Sense Mobile 应用程序:适用于 iOS 和 Android 设备的移动应用程序。在移动应用程序中,您可以连接到云数据并与之交互您可使用自己可用的应用程序。
confusion matrix
confusion matrix 总结了分类模型中预测结果的准确性。每个类别的正确预测和错误预测数量汇总。这不仅可以让您深入了解分类器所犯的错误,还可以了解所犯错误的类型。
请参阅: Confusion Matrix
Insight Advisor
Insight Advisor 是一套功能。Insight Advisor 可以帮助构建数据模型、创建可视化效果和分析数据。
Insight Advisor 分析类型
Insight Advisor 分析类型 是一种 Insight Advisor 功能,通过允许您选择要查看的分析类型和要使用的数据,为您创建可视化效果。
请参阅: Insight Advisor 分析类型
Insight Advisor 搜索
Insight Advisor 搜索 是一项 Insight Advisor 功能,允许您在应用程序中提出自然语言问题并接收相关的可视化效果。
请参阅: Insight Advisor 搜索
Insight Advisor Chat
Insight Advisor Chat 是一个基于聊天的会话分析界面。Insight Advisor Chat 允许您向您有权访问的应用程序提问。Insight Advisor Chat 然后返回相关的可视化。
请参阅: 使用会话分析探索应用程序
ML 部署
一个模型,由单个实验版本中的单个算法生成,用于在 Qlik AutoML 中生成预测。这通常是在多个版本上配置实验以产生用例所需的性能级别后获得的结果。ML 部署作为资产提供,可以从目录中访问。
请参阅: 部署模型
Permutation importance
机器学习模型的性能在多大程度上取决于特征。在迭代模型中要包含哪些特征时,可以使用 permutation importance 来确定要保留哪些列,以及可以删除哪些列。
QVD
QlikView 数据文件 (QVD) 是包含从 Qlik Sense 或 QlikView 导出的数据的文件。它是一种为快速加载数据而优化的原生 Qlik Sense 格式。您还可以使用 Qlik Cloud 数据集成 生成 QVD 文件。
请参阅: 使用 QVD 文件
SHAP importance
对实验中每个特征对目标的预测结果有多大影响的度量。Qlik AutoML 在二进制分类和回归实验的训练过程中自动创建聚合的行级 SHAP importance 排名图表。
请参阅: SHAP importance