创建有关数据集的预测
使用您的 ML 部署来预测新数据的未来结果。
要开始创建预测配置,可打开 ML 部署并转到数据集预测窗格。请参阅ML 部署界面导航。
您可以对目录中的数据集进行预测,例如,对新事务的每日预测。还可以使用预测 API 实时进行预测。有关预测 API 的信息,请参阅创建实时预测。
预测是在具有预测和用于分类模型的数据集中生成的,即每个类别的概率列。 也可以选择生成包含 SHAP 值或错误的数据集,以及应用数据集的副本。数据集可以是 Parquet、CSV 或 QVD 格式。
生成预测后,您可以将预测见解加载到 Qlik Sense 应用程序中。这允许您可视化数据并与数据交互,并创建假设情景。
在您开始之前
在开始使用 ML 部署生成预测之前,需要激活源模型。有关更多信息,请参阅批准已部署的模型。
关键概念
应用数据集
在实验训练过程中,您将部署一个用于在新数据集上生成预测的模型。此数据集称为应用数据集。预测是在具有预测和用于分类模型的数据集中生成的,即每个类别的概率列。也可以选择生成包含 SHAP 值或错误的数据集。
Qlik Cloud 中支持在 Qlik AutoML 中使用任何可以上载和分析的平面文件。
对于多表文件(如具有多个工作表的 Microsoft Excel 文件),将只导入第一个表。如果表的数据分析失败(例如,如果表为空),则不支持该文件。
应用数据集必须具有与用于训练 ML 部署的数据集相同的特性和数据类型。ML 实验中指定的目标列不需要包含在应用数据集中。注意,不属于模型训练的其他列仍然可以出现在应用数据集中。AutoML 将在生成预测时直接忽略额外列。
自动特性设计
有关使用使用自动特性工程训练的模型生成预测的信息,请参阅自动特性设计。
预测配置
预测数据集是根据预测配置生成的。每个 ML 部署可以具有多个预测配置。预测配置可以设置为在有或没有计划的情况下运行。
预测配置所有权
当用户创建预测配置时,会自动将他们指定为所有者。
以下列表说明了要运行的预测配置的访问要求。如果手动运行预测,则运行预测的用户必须满足要求。对于计划的预测,预测配置的所有者必须满足要求。
-
在租户中的 专业或 Full User 授权 以及 Automl Deployment Contributor 角色。请参阅: 谁可以使用 Qlik AutoML
-
在空间中运行 ML 部署中的预测所需的权限。
-
在保存预测数据的空间中创建数据源所需的权限。
预测配置的所有者可能会失去对租户的访问权限,或者不再满足使用 ML 部署的其他要求。在这种情况下,具有所需权限的用户可以单击使我成为所有者以获得计划预测的所有权,以便它可以运行。他的操作在预测配置窗格中完成,或者作为数据集预测窗口中的操作完成。
有关本部分中提到的任何操作的空间权限要求的信息,请参阅管理共享空间中的权限和管理托管空间中的权限。
应用数据集的注意事项
手动更改特性类型的影响
当您手动更改特性的特性类型,然后部署生成的模型时,特性类型覆盖项将应用于应用数据集中的特性,该数据集用于使用该模型进行的预测。
要求和权限
要了解使用 ML 部署和预测的权限要求,请参阅使用 ML 预测。
创建新的预测
您可以从部署概览窗格和数据集预测窗格创建新预测配置。
执行以下操作:
-
从目录中打开 ML 部署。
-
在右下角,单击创建预测。
-
在预测配置窗格中,展开应用数据集应用数据并单击选择应用数据集。
-
选择要生成预测的数据集。数据集必须具有与模型架构相同的特性和数据类型。
数据集可以通过 Analytics 活动中心的“创建”页面上传。您还可以从预测的数据集选择页面将新数据集直接上传到目录中。然后,将自动选择此数据集作为应用数据集,用于您的预测。为此,请单击添加应用数据集并选择要上传的文件。
-
在预测数据集下,单击名称预测数据集。
-
输入名称(或接受默认名称)。
Qlik AutoML 支持预测数据集的动态文件命名。有关更多信息,请参阅在预测数据集文件名中使用变量。
-
为生成的数据集选择格式。默认设置为 Parquet。数据集也可用 CSV 或 QVD 格式生成。
-
选择空间
-
单击确认。
-
在预测选项下,选择要生成的任何其他数据集。
-
错误数据集:为应用数据集中的记录生成包含错误的数据集。这可以让您知道记录是否被删除以及原因。
-
SHAP:为每个记录生成具有 SHAP 值的数据集。数据集具有列 index 和 <feature>_SHAP,用于模型中的每个特性。
信息注释此选项不适用于来自多类别分类模型的预测。对于这些模型,可以使用坐标 SHAP 选项。 -
坐标 SHAP:为每个记录生成具有 SHAP 值的数据集。这将为您提供与 SHAP 数据集相同的值,但组织方式不同。数据集具有列 index、automl_feature 和 SHAP_value。一个额外的列 Predicted_class,包括来自多类分类模型的预测。
-
-
选择是自动生成索引列还是使用应用数据集中的现有列。
-
您可能还想按计划运行预测。在预测计划下,单击创建计划并在出现的对话框中调整设置。有关更多信息,请参阅计划预测。
-
单击保存并关闭按钮保存预测配置并返回数据集预测窗格,而不运行预测。如果您只希望预测按计划运行,则可能更喜欢此选项。
或者,单击保存并立即预测以保存预测配置并手动运行预测。
当最新状态显示“成功”时,预测完成。
-
转到目录以查看生成的数据集。
编辑预测配置
您可以从数据集预测窗格中编辑现有的预测配置。
执行以下操作:
-
在数据集预测窗格中,单击要编辑的预测配置上的 ...。
-
从操作菜单中选择编辑预测配置。
-
在预测配置窗格中,可以编辑以下部分:
-
应用数据:您可以更改应用数据集。
-
预测数据集:您可以更改预测数据集的名称和空间。
-
预测选项:您可以更改对生成的其他数据集的选择。
-
预测计划:如果您愿意,可以设置运行预测的计划。有关更多信息,请参阅计划预测。
-
-
单击保存并关闭按钮保存预测配置并返回数据集预测窗格,而不运行预测。
或者,单击保存并立即预测以保存预测配置并手动运行预测。
当最新状态显示“成功”时,预测完成。
运行预测
您可以从数据集预测窗格中运行现有预测配置的预测。 或者,您可能希望根据可定制的时间表运行预测。您可以将手动和计划运行的预测结合起来,以最大程度满足您的需求。
手动运行预测
通过在数据集预测窗格的上下文菜单中选择选项,可以直接开始运行预测配置。
对于要手动运行预测的用户,该用户必须满足操作的访问要求。请参阅预测配置所有权。
执行以下操作:
-
在数据集预测窗格中,单击要编辑的预测配置上的 ...。
-
从操作菜单中选择立即运行预测以开始生成预测。
当最新状态显示“成功”时,预测完成。
计划预测
可以将预测设置为按计划自动运行。您可以为创建的每个预测配置创建一个计划。创建或编辑预测配置时,访问预测计划菜单。
要使计划的预测成功运行,预测配置所有权的所有者必须满足几个权限要求。否则,预测将无法运行。有关更多信息,请参阅预测配置所有权。
预测计划对话框允许您为计划指定以下参数:
-
运行预测:调整预测运行的一般计划(每日、每周或每月)。根据您的选择设置间隔、星期几或月几。
-
时间:配置预测开始运行的时间。
如果您是按小时调度(对于每日或每周预测),您还可以指定预测运行的开始和结束时间。
-
开始日期:设置预测计划生效的日期。
-
结束日期:设置停止在计划中运行预测的日期。默认情况下,计划将设置为无限期继续运行,但您可以指定计划的结束日期。
-
仅在应用数据集已更改时运行:如果自上次运行预测以来,应用数据集没有任何更改,则不会运行计划预测。如果希望始终运行计划预测而不考虑数据的更改,则可以禁用此设置。
删除预测配置
您可以从数据集预测窗格中删除现有的预测配置。
执行以下操作:
-
在数据集预测窗格中,单击要删除的预测配置上的 ...。
-
从操作菜单中选择删除预测配置。
-
单击删除确认。
管理预测作业
租户管理员可以从 Administration 活动中心中停止或取消预测作业。有关更多信息,请参阅管理 Qlik AutoML。
配置通知
当从 ML 部署创建预测时,您可以收到通知。有关更多信息,请参阅Qlik AutoML 的配置通知。
查看数据漂移和预测事件详细信息
运行预测后,切换到数据漂移监控窗格以查看以下方面的详细信息:
-
应用数据集中每个特性的数据漂移水平。比较在应用数据集和训练数据集之间进行。
-
关于预测事件的详细信息,例如它是成功还是失败,以及它生成了多少预测。
有关更多信息,请参阅监控已部署模型的性能和使用情况。