自动化机器学习简介
使用 Qlik AutoML 将分析团队的机器学习自动化。使用简单的无代码界面,您可以轻松地创建机器学习实验,以生成模型并进行预测。
什么是机器学习
机器学习是人工智能和数据科学的一个分支,专注于识别历史数据中的模式以预测未来结果。算法在数据上进行训练,以建立预测模型,而无需明确编程。机器学习模型可以帮助您回答以下问题:
-
健身房的顾客会取消他们的会员资格吗?
-
给定客户的预期寿命值是多少?
阅读 理解机器学习 中有关基本概念的更多信息。您还将了解用于定义机器学习问题和准备数据集的结构化框架。
你能用自动机器学习做什么
在 Qlik Sense 中创建自动计算机学习实验。在 Analytics 活动中心中,您可以与其他用户协作进行实验,并轻松地从目录加载数据以训练模型。
将预测分析与 Qlik Sense 应用程序集成,以共享您的发现。通过可视化和交互式假设场景进一步探索,以了解更改不同参数可能会如何影响您的预期结果。
您可以对目录中存储的数据集进行预测,也可以使用 Qlik Sense API 实时进行操作预测。
实验是如何工作的
一项实验在具有特定目标的特定数据集上训练机器学习算法。训练生成机器学习模型,您可以使用这些模型进行预测。
大多数过程在自动机器学习中是自动化的。当您创建实验并加载数据集时,数据集将被自动分析,数据将被预处理,以便为机器学习做好准备。将显示有关每列的统计信息和其他信息,以帮助您选择目标。当您开始训练时,几个算法开始搜索数据中的模式。有关创建和训练实验的详细信息,请参阅使用实验。
训练完成后,分数和排名可以让您评估生成的机器学习模型。通过更改参数和迭代训练,可以生成多个版本。为数据集选择表现最佳的模型,并将其部署以开始进行预测。有关更多信息,请参阅使用 ML 部署。
如下图所示,一个实验可以有多个版本,每个版本使用一个或多个算法。可以部署具有最佳性能算法的模型来进行预测。这意味着一个实验可以导致多个ML部署。
AutoML 的用户访问权限
有关用户如何访问 Qlik AutoML的完整详细信息,请参阅谁可以使用 Qlik AutoML。
AutoML 限制和许可证管理能力
AutoML 是一种额外的付费特性。一些有限的特性包含在适用的订阅中。具体的特性和容量取决于您的订阅级别。
限制
-
Qlik AutoML 的 API 速率限制为每分钟 300 个请求。
-
数据集中的最大列数:500
这适用于用于训练实验和生成预测的数据集。限制是在实验版本中用作特性的列数。数据集中可以有更多列,当列包含在数据集中时,将计算限制。
许可证管理的容量
您的客户许可证决定了管理您的 Qlik AutoML 使用方式的各种指标的能力。您的使用指标通过 AutoML 用户界面、Qlik Sense 应用程序中的关键驱动因素分析和公共 API,以您对 AutoML 服务的使用情况的组合形式来衡量。
根据您的业务需求,有多级别 AutoML 可用。有以下两种类型的级别:
-
已包括级别:这是 AutoML 的基本特性,但作用有限。它包含在 Qlik Sense Enterprise SaaS、Qlik Cloud Analytics Standard、Qlik Cloud Analytics Premium、Qlik Cloud Enterprise 或 Qlik Talend Cloud(标准版、高级版或企业版)的订阅中。所包含的级别适用于试用,并用于评估 Qlik AutoML 如何帮助满足您的业务需求。它不适用于生产用例。要获得更全面的特性,可以考虑使用付费级别的 Qlik AutoML。
-
付费级别:有许多软件包提供生产用例所需的全面 AutoML 能力。它们可以作为 Qlik Cloud 订阅的额外付费附加组件使用。
以下特性仅在 Qlik AutoML 的付费级别中可用:
-
超参数优化
-
计划预测
-
实时预测
-
Qlik AutoML 连接器
有关每种类型的 AutoML 级别中包含的内容的更多信息,请参阅下表。
公制 | 描述 | 在包含的级别中可用 | 在付费级别中可用 |
---|---|---|---|
部署的模型 | Qlik Cloud 订阅中包含的级别定义了可以在许可证内创建的所有租户中创建的最大部署模型数。这个消耗限制是按模型定义的,这意味着从单个模型创建的多个 ML 部署算作单个部署的模型。 | 支持 | 支持 |
并行培训 | 这是租户可以并行训练的模型数量。在 Qlik AutoML 的所包含级别中,每个模型都将依次运行。付费级别包括允许租户同时训练多个模型的能力。 | 不支持 | 支持 |
数据集大小增加 | 付费级别为训练模型提供了更大的数据集大小。 | 不支持 | 支持 |
手动批量预测 | 手动预测数据集中的所有行。 | 支持 | 支持 |
计划的批次预测 | 将您的预测配置为按计划运行,而不是手动启动它们。计划预测仅适用于 Qlik AutoML 的付费级别。有关更多信息,请参阅计划预测。 | 不支持 | 支持 |
实时预测 | 使用这个 API 来使用 ML 部署来实时运行预测。有关更多信息,请参阅创建实时预测。 | 不支持 | 支持 |
Qlik Cloud 分析 中的 Qlik AutoML 连接器 | 使用此分析连接器,您可以将集成的 Qlik AutoML 平台中的数据加载到 Qlik Cloud 中。有关更多信息,请参阅Qlik AutoML 分析源。 | 不支持 | 支持 |
超参数优化 | 超参数优化允许您微调 AutoML 模型,以增强对学习过程的控制。有关更多信息,请参阅超参数优化。 | 不支持 | 支持 |
部署的模型监控 | 使用内置的监控工具来评估部署到 ML 部署中的模型。您可以监视随时间变化的特性漂移,以及有关模型用于预测的详细信息。有关更多信息,请参阅监控已部署模型的性能和使用情况。 | 不支持 | 支持 |
有关您的许可指标的详细信息,请参阅 Qlik Cloud® 订阅产品描述。管理员可以在 Administration 活动中心中查看许可证信息并监视已部署模型的数量。 有关更多信息,请参阅监控资源消耗。