使用时间序列模型的预测
部署时间序列模型后,您可以使用它对新数据进行预测。要创建时间序列预测,请准备一个包含所需数据和结构的应用数据集。有关完整详细信息,请参阅 准备应用数据集。
预测机制
时间序列模型预测的过程与分类和回归模型有一些不同。
分类和回归模型会为应用数据集中不存在或未知的整个列预测未来值。例如,假设您有一个二元分类模型,用于预测 流失 列的未来值。应用数据集通常不会包含 流失 列,如果存在,则会被忽略——相反,该列的值由模型作为预测生成。
另一方面,对于时间序列模型,预测是作为行而不是列创建的。预测仍然是为目标列生成的,但它们是对应于特定未来时间值的记录。列的结构在训练数据集和应用数据集之间不会改变。
此外,分类或回归模型的应用数据集不应包含您要为其生成预测的任何目标值。另一方面,时间序列模型的应用数据集需要包含一些历史目标和特性值,对应于模型的应用窗口。这些要求在 准备应用数据集 中有进一步说明。
用于创建应用数据集的可用工具
Qlik Cloud 中提供了以下工具,可以帮助您构建和动态生成数据集:
-
Qlik 脚本,可在应用程序中的 数据加载编辑器 中使用,以及从 分析 活动中心访问的独立脚本编辑器。
-
表格配方,可以作为独立工具从 分析 活动中心获取。表格配方旨在创建单表数据集,例如机器学习中所使用的那些数据集。
-
数据流,可作为独立工具从 分析 活动中心获取。
-
分析应用程序中的 数据管理器。
常用操作
更改特性类型
在准备应用数据集时,您可能需要转换列以修改其特性类型。
最常见的示例是,如果您有一个在模型中配置为组的数值列。当您在实验中选择一个特性作为组时,其特性类型会自动更改为分类(如果尚未更改),以便可以将其作为组进行处理。当您添加用于预测的应用数据集时,列数据可能仍包含数值特性数据,因此您需要将该列更改为字符串数据,以便将其识别为分类特性。这种转换可以使用 Qlik 脚本(使用 text() 函数)或使用其他 Qlik 数据准备工具(例如表格配方和数据流)轻松完成。
有关使用 Qlik 脚本的示例,请参阅 准备数据集。
模型重新训练
如果您需要为新的组值(训练数据中不存在的值)创建预测,则需要使用包含这些新组值的训练数据来训练新模型。有关更多信息,请参阅 准备应用数据集。
限制
-
时间序列模型不支持数据漂移监控。
-
使用时间序列模型执行预测时,无法生成 SHAP 数据集。
-
Qlik Predict 分析连接器不支持时间序列模型。
有关与时间序列实验相关的限制,请参阅 限制和注意事项。