创建预测数据
一旦部署并批准了模型,就可以对新数据创建预测。
到目前为止,我们已经使用现有客户数据创建了一个机器学习模型。该过程的目标是通过机器学习识别模式,并将其应用于新数据。
还有一个用例是只分析训练数据中的 SHAP 值。这些信息本身也很有价值。
有关在 Qlik AutoML 中使用预测的更多信息,请参见创建有关数据集的预测。
该过程的第一步是选择要应用模型生成预测的数据集。然后,为输出配置所需的资产并生成文件。
执行以下操作:
在目录中,打开新的 ML 部署。
-
在 ML 部署界面的右下角,单击创建预测。
-
单击 打开预测配置窗格(如果尚未打开)。
-
接下来,您需要选择应用数据集。在应用数据下,单击选择应用数据集。
-
选择应用数据集文件。根据您使用的是 CSV 还是 QVD,此项将是以下之一:
-
AutoML Tutorial - Churn data - apply.csv
-
AutoML Tutorial - Churn data - apply.qvd
-
-
比较训练的模式并应用数据集。由于在训练过程中取消选择了特性,因此应用数据集的字段将比训练数据集的多。不必担心这点。生成预测时,AutoML 只是忽略应用数据集中不存在于训练数据集中的字段。
-
在预测配置窗格中,单击名称预测数据集。键入数据集的名称(或将其设置为默认名称)并选择格式。默认设置为 Parquet,但在本教程中,我们使用 CSV。
-
选择一个空间,然后单击确认。
-
在预测选项下,配置要使用此预测生成的数据集。在这种情况下,确认坐标 SHAP 是唯一选择的选项。允许将 AccountID 用作索引列。
单击现在保存并预测。可以在数据集预测中监控该过程。
您可以通过单击出现的弹出窗口中的打开来查看目录中的输出。
预测运行完成后,您可以开始使用新数据集构建应用程序。转到下一个主题。