跳到主要内容 跳到补充内容

创建有关数据集的预测

使用您的 ML 部署来预测新数据的未来结果。 使用批量预测,您可以在 ML 部署中创建预测配置,然后使用它们将预测作为数据集生成。在生成的数据集中,每一行都包含该特定行的预测值。使用批预测,您可以为应用数据集中的每一行生成预测。

要开始创建预测配置,可打开 ML 部署并转到批量预测窗格。请参阅ML 部署界面导航

通过批量预测,您可以对目录中的数据集进行预测,例如,对新事务的每日预测。或者,还可以使用机器学习 API 中的实时预测端点实时进行预测。有关实时预测的信息,请参阅创建实时预测

信息注释

实时预测 API 被弃用,并被机器学习 API 中的实时预测端点所取代。功能本身并没有被弃用。对于未来的实时预测,请使用机器学习 API 中的实时预测端点。

批量预测是在一个包含预测的数据集中生成的,对于分类模型,还有一个包含每个类别概率的列。您还可以选择生成包含 SHAP 值或错误的数据集,以及应用数据集的副本。数据集可以是 Parquet、CSV 或 QVD 格式。

生成预测后,您可以将预测见解加载到 Qlik Sense 应用程序中。这允许您可视化数据并与数据交互,并创建假设情景。

要求和权限

要了解使用 ML 部署和预测的权限要求,请参阅使用 ML 预测

创建新的批次预测

您可以从部署概述可部署模型批处理预测窗格创建新的预测配置。

  1. 从目录中打开 ML 部署。

  2. 在右下角,单击创建预测

  3. 应用数据集模式部分,单击选择应用数据集

  4. 选择要生成预测的数据集,或单击添加应用数据集以上传新数据集。有关在 Qlik Cloud 分析 中添加数据文件的更多信息,请参阅添加数据文件

    信息注释在此阶段,如果应用数据集架构与模型架构不匹配,您将收到通知。为了使预测成功运行,模式必须具有相同的特性和数据类型。
  5. 您可以选择命名您的预测配置,并添加描述。在右侧的预测配置窗格中的预测名称下,编辑名称描述

  6. 默认情况下,您的预测配置设置为使用部署中的默认模型生成预测。您也可以选择使用别名从其他模型运行预测。在预测配置窗格中,展开选择模型别名,然后选择要使用的别名。

    有关在批处理预测中使用别名的更多信息,请参阅为批量预测配置模型别名

  7. 预测配置窗格的预测数据集(输出)下,单击名称预测数据集

  8. 输入名称(或接受默认名称)。

    Qlik AutoML 支持预测数据集的动态文件命名。有关更多信息,请参阅在预测数据集文件名中使用变量

  9. 为生成的数据集选择格式。默认设置为 Parquet。数据集也可用 CSV 或 QVD 格式生成。

  10. 选择空间

  11. 单击确认

  12. 预测选项下,选择要生成的任何其他数据集。

    • 应用数据集:生成用于预测的应用数据集的副本。

    • 错误数据集:为应用数据集中的记录生成包含错误的数据集。这可以让您知道记录是否被删除以及原因。

    • SHAP:为每个记录生成具有 SHAP 值的数据集。数据集具有列 index<feature>_SHAP,用于模型中的每个特性。

      信息注释此选项不适用于来自多类别分类模型的预测。对于这些模型,可以使用坐标 SHAP 选项。
    • 坐标 SHAP:为每个记录生成具有 SHAP 值的数据集。这将为您提供与 SHAP 数据集相同的值,但组织方式不同。数据集具有列 indexautoml_featureSHAP_value。一个额外的列,Predicted_class,包括来自多类分类模型的预测。

  13. 索引列下,选择是自动生成索引列还是使用应用数据集中的现有列。

  14. 您可能还想按计划运行预测。在预测计划下,单击创建计划并在出现的对话框中调整设置。有关更多信息,请参阅计划预测

  15. 单击保存并关闭按钮保存预测配置并返回批处理预测窗格,而不运行预测。如果您只希望预测按计划运行,则可能更喜欢此选项。

    或者,单击保存和关闭边的 向下箭头 图标。选择现在保存并预测。这将保存预测配置并手动运行预测。

    上次运行显示 复选框 时,预测成功完成。

  16. 转到目录以查看生成的数据集。

编辑预测配置

您可以从批量预测窗格中编辑现有的预测配置。

  1. 批量预测窗格中,单击您要编辑的预测配置上的 更多操作

  2. 操作菜单中选择编辑预测配置

  3. 预测配置窗格中,可以编辑以下部分:

    • 预测名称:更改预测配置的名称和描述。

    • 所有者:让自己成为预测配置的所有者。有关何时可能需要此项的信息,请参阅预测配置所有权

    • 选择模型别名:更改用于预测的模型别名。

    • 应用数据(输入):您可以更改应用数据集。

    • 预测数据集(输出):您可以更改预测数据集的名称和空间。

    • 预测选项:您可以更改对生成的其他数据集的选择。

    • 预测计划:如果您愿意,可以设置运行预测的计划。有关更多信息,请参阅计划预测

  4. 单击保存并关闭按钮保存预测配置并返回批处理预测窗格,而不运行预测。

    或者,单击保存和关闭边的 向下箭头 图标。选择现在保存并预测。这将保存预测配置并手动运行预测。

    最新状态显示“成功”时,预测完成。

运行批量预测

您可以从批量预测窗格中运行现有预测配置的预测。 或者,您可能希望根据可定制的时间表运行预测。您可以将手动和计划运行的预测结合起来,以最大程度满足您的需求。

手动运行预测

通过在批量预测窗格的上下文菜单中选择选项,可以直接开始运行预测配置。

对于要手动运行预测的用户,该用户必须满足操作的访问要求。请参阅预测配置所有权

  1. 批量预测窗格中,单击要用于预测的预测配置上的 更多操作

  2. 操作菜单中选择立即运行预测以开始生成预测。

    最新状态显示“成功”时,预测完成。

计划预测

可以将预测设置为按计划自动运行。您可以为创建的每个预测配置创建一个计划。创建或编辑预测配置时,访问预测计划菜单。

要使计划的预测成功运行,预测配置所有权的所有者必须满足几个权限要求。否则,预测将无法运行。有关更多信息,请参阅预测配置所有权

预测计划对话框允许您为计划指定以下参数:

  • 运行预测:调整预测运行的一般计划(每日、每周或每月)。根据您的选择设置间隔、星期几或月几。

  • 时间:配置预测开始运行的时间。

    如果您是按小时调度(对于每日或每周预测),您还可以指定预测运行的开始和结束时间。

  • 开始日期:设置预测计划生效的日期。

  • 结束日期:设置停止在计划中运行预测的日期。默认情况下,计划将设置为无限期继续运行,但您可以指定计划的结束日期。

  • 仅在应用数据集发生更改时运行:如果发生以下任何事件,则将运行计划的预测。否则,计划的预测将不会运行。

    • 在应用数据集中检测到更改。

    • 批量预测中使用的模型发生了变化,要么是由于分配给当前别名的模型发生变化,要么由于使用不同模型的不同别名发生变化。

删除预测配置

您可以从批量预测窗格中删除现有的预测配置。

  1. 批量预测窗格中,单击您要删除的预测配置上的 更多操作

  2. 操作菜单中选择删除预测配置

  3. 单击删除确认。

关键概念

应用数据集

在实验训练过程中,您将部署一个用于在新数据集上生成预测的模型。此数据集称为应用数据集。预测是在具有预测和用于分类模型的数据集中生成的,即每个类别的概率列。也可以选择生成包含 SHAP 值或错误的数据集。

信息注释

Qlik Cloud 中支持在 Qlik AutoML 中使用任何可以上载和分析的扁平文件。

对于多表文件(如具有多个工作表的 Microsoft Excel 文件),将只导入第一个表。如果表的数据分析失败(例如,如果表为空),则不支持该文件。

应用数据集必须具有与用于训练 ML 部署的数据集相同的特性和数据类型。ML 实验中指定的目标列不需要包含在应用数据集中。注意,不属于模型训练的其他列仍然可以出现在应用数据集中。AutoML 将在生成预测时直接忽略额外列。

预测配置

预测数据集是根据预测配置生成的。每个 ML 部署可以具有多个预测配置。预测配置可以设置为在有或没有计划的情况下运行。

预测配置所有权

当用户创建预测配置时,会自动将他们指定为所有者。

以下列表说明了要运行的预测配置的访问要求。如果手动运行预测,则运行预测的用户必须满足要求。对于计划的预测,预测配置的所有者必须满足要求。

  • 在租户中的 专业或 Full User 授权 以及 Automl Deployment Contributor 角色。请参阅: 谁可以使用 Qlik AutoML

  • 在空间中运行 ML 部署中的预测所需的权限。

  • 在保存预测数据的空间中创建数据源所需的权限。

预测配置的所有者可能会失去对租户的访问权限,或者不再满足使用 ML 部署的其他要求。在这种情况下,具有所需权限的用户可以单击使我成为所有者以获得计划预测的所有权,以便它可以运行。他的操作在预测配置窗格中完成,或者作为数据集预测窗口中的操作完成。

有关本部分中提到的任何操作的空间权限要求的信息,请参阅管理共享空间中的权限管理托管空间中的权限

模型激活

在开始使用 ML 部署生成预测之前,需要激活源模型。有关更多信息,请参阅批准已部署的模型

自动特性设计

有关使用使用自动特性工程训练的模型生成预测的信息,请参阅自动特性设计

应用数据集的注意事项

手动更改特性类型的影响

当您手动更改特性的特性类型,然后部署生成的模型时,特性类型覆盖项将应用于应用数据集中的特性,该数据集用于使用该模型进行的预测。

更改特性类型

管理预测作业

租户管理员可以从 Administration 活动中心中停止或取消预测作业。有关更多信息,请参阅管理 Qlik AutoML

配置通知

当从 ML 部署创建预测时,您可以收到通知。有关更多信息,请参阅Qlik AutoML 的配置通知

查看数据漂移和预测事件详细信息

运行预测后,切换到数据漂移监控操作监控窗格,查看以下详细信息:

  • 应用数据集中每个特性的数据漂移水平。比较在应用数据集和训练数据集之间进行。

  • 关于预测事件的详细信息,例如它是成功还是失败,以及它生成了多少预测。

有关更多信息,请参阅监控已部署模型的性能和使用情况

了解详情

 

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!