自动化机器学习简介
使用 Qlik AutoML 将分析团队的机器学习自动化。使用简单的无代码界面,您可以轻松地创建机器学习实验,以生成模型并进行预测。
什么是机器学习
机器学习是人工智能和数据科学的一个分支,专注于识别历史数据中的模式以预测未来结果。算法在数据上进行训练,以建立预测模型,而无需明确编程。机器学习模型可以帮助您回答以下问题:
-
健身房的顾客会取消他们的会员资格吗?
-
给定客户的预期寿命值是多少?
阅读 理解机器学习 中有关基本概念的更多信息。您还将了解用于定义机器学习问题和准备数据集的结构化框架。
你能用自动机器学习做什么
在 Qlik Sense 中创建自动机器学习实验。在中心中,您可以与其他用户协作进行实验,并轻松地从目录加载数据以训练模型。
将预测分析与 Qlik Sense 应用程序集成,以共享您的发现。通过可视化和交互式假设场景进一步探索,以了解更改不同参数可能会如何影响您的预期结果。
您可以对目录中存储的数据集进行预测,也可以使用 Qlik Sense API 实时进行操作预测。
实验是如何工作的
一项实验在具有特定目标的特定数据集上训练机器学习算法。训练生成机器学习模型,您可以使用这些模型进行预测。
大多数过程在自动机器学习中是自动化的。当您创建实验并加载数据集时,数据集将被自动分析,数据将被预处理,以便为机器学习做好准备。将显示有关每列的统计信息和其他信息,以帮助您选择目标。当您开始训练时,几个算法开始搜索数据中的模式。有关创建和训练实验的详细信息,请参阅使用实验。
训练完成后,分数和排名可以让您评估生成的机器学习模型。通过更改参数和迭代训练,可以生成多个版本。为数据集选择表现最佳的模型,并将其部署以开始进行预测。有关更多信息,请参阅使用 ML 部署。
如下图所示,一个实验可以有多个版本,每个版本使用一个或多个算法。可以部署具有最佳性能算法的模型来进行预测。这意味着一个实验可以导致多个ML部署。

谁可以使用实验和 ML 部署
具有专业用户分配的用户可以在 Qlik Cloud 中的个人或共享空间中创建实验。他们可以在个人或共享空间中部署模型并生成预测。他们还可以将 ML 部署发布到托管空间。
您的实验和 ML 部署存储在目录中。按类型筛选或使用集合轻松查找它们。通过空间控制访问。有关空间的更多信息,请参阅在空间中工作。
租户管理员可以从 管理控制台 管理实验和ML部署。有关更多信息,请参阅管理实验和 ML 部署。
AutoML 限制和许可证管理能力
AutoML 是一种额外的付费功能。Qlik Sense Enterprise SaaS 订阅中包含一些有限的功能。具体的功能和容量取决于您的订阅层。
限制
-
数据集中的最大列数:500
这适用于用于训练实验和生成预测的数据集。限制是在实验版本中用作特征的列数。数据集中可以有更多列,当列包含在数据集中时,将计算限制。
许可证管理的容量
您的客户许可证决定了以下度量的容量:
-
ML 部署数
部署模型时消耗配额单位。如果删除了 ML 部署,则返回该单元。如果多次部署同一个模型版本,则将其视为一次 ML 部署。
-
数据集大小(以单元格总数计)
这适用于用于训练实验和生成预测的数据集。限制是实验版本中用作特征的列数乘以行数。数据集中可以有更多列,当列包含在数据集中时,将计算限制。
-
并发任务数
这是租户可以并行执行的实验训练作业的数量。
-
高级功能 – 仅适用于附加 AutoML 订阅的客户
高级功能是超参数优化 和预测 API。
-
API 速率限制:每秒 5 个请求(每个 ML 部署)