跳到主要内容 跳到补充内容

日期功能设计

Qlik Predict 从具有日期特性类型的合格列生成自动工程特性,这些列已被标识为包含日期和时间信息。自动设计特性及从其衍生它们的父特性都标有 自动工程 图标 。

Qlik Cloud Analytics 分析您选择用于 Qlik Predict 的训练数据集时,它会将某些数据类型链接到日期特性类型。这包括以下数据类型:

  • 日期

  • 日期时间

  • 时间

  • 时间戳

在分析期间分配给这些数据类型中任何一种的特性都被指定为日期特性类型。有关可以查看的数据字段的可用配置文件统计数据的信息,请参阅列表视图

如果可能,Qlik Predict 会显示一个自动设计的日期特性列表,这些特性可以从具有日期特性类型的合格父特性创建。默认情况下,实验中包含自动设计的日期特性。如果您选择包含它们,则新特性性将在实验的 v1 之后生成。

信息注释如果 2023 年 8 月 29 日之前训练的模型包含内有日期或时间戳的特性,建议对其进行重新训练。

自动设计日期特性具有数字特性类型。默认情况下,它们包含在实验中,但是可选的。在开始实验训练之前,或者在配置下一个实验版本时,可以删除其中的部分或全部。当包含自动设计的日期特性时,将从实验中删除原始父日期特性。

您可以将父日期特性作为分类或数字特性包含在内。当您这样做时,自动设计的日期特性将不再可用。在大多数情况下,建议在实验中使用可用的自动设计特性,因为它们可以提高机器学习模型的性能。然而,在某些情况下,列被标识为日期特性,但您需要将其视为分类或数字特性。在这些情况下,您可以手动更改特性类型。

自动设计的日期特性不计入 Qlik Cloud 订阅中指定的 Qlik Predict 数据集大小(训练数据集和应用数据集中的最大单元格数)。只计算原始日期列单元格。

显示可从父日期特性“发票日期”生成的自动设计特性的架构视图。请注意每个特性的数据类型特性类型之间的差异。

实验训练中的模式视图,显示被识别为日期特性的父特性以及可以从中创建的可能的自动设计特性。

使用日期特性作为实验目标

在极少数情况下,您希望使用具有日期和时间信息的特性作为实验目标,列的特性类型将从日期切换到分类,并且自动设计的特性将被删除。如果您选择了另一个目标,然后稍后希望将日期和时间特性添加为常规特性,则需要根据需要手动将其更改回日期特性类型。如果将特性返回到日期特性类型,则会再次生成自动设计的日期特性。

有关如何更改特性类型的详细信息,请参阅更改功能类型

可用的自动设计日期特性

当从数据集中的列生成自动设计的日期特性时,Qlik Predict 提取并计算每个日期和日期时间值的特定组件,将每个组件隔离在自己的列中。下表列出了 Qlik Predict 可以生成的自动设计特性。

可从日期和时间特性衍生的自动设计特性的列表
自动设计特性 数据类型 特性类型 描述
整数 数字 直接从源日期或时间戳解析的年份字段。
整数 数字 直接从源日期或时间戳解析的月份字段。
整数 数字 直接从源日期或时间戳解析的日字段。
小时 整数 数字 直接从源时间戳解析的小时字段。
整数 数字 直接从源时间戳解析的分钟字段。
整数 数字 直接从源时间戳解析的秒字段。
星期几 整数 数字 星期几,根据源日期、月份和年份计算。
整数 数字 年中第几周,根据源日期、月份和年份计算。

对于创建的每个新特性,原始列名的后缀都是适用的自动设计特性。

实验配置窗格中的自动设计日期功能

实验配置窗格中的特性部分,显示自动设计的特性。

自动生成的日期特性和时间序列模型

当您为时间序列实验选择日期索引列时,日期特性类型将用于此列。但是,时间序列模型不支持日期特性工程。自动工程化的日期特性无法从该列派生。

有关时间序列模型的详细信息,请参阅 使用时间序列实验使用多元时间序列预测

预测中的自动设计日期功能

有关在运行预测时如何使用日期特性,请参阅 在预测中使用日期功能

了解详情

 

预测中的自动设计日期功能

当使用训练数据集创建模型时,会生成自动设计的日期特性,该模型被部署并用作 ML 部署,以对新数据(应用数据集)进行预测。

当使用自动设计日期特性训练的模型被部署用于进行预测时,用于生成预测的应用数据集不需要包括自动设计日期特性。Qlik Predict 在预测之前为应用数据集生成自动设计特性。但是,应用数据集必须包括父日期特性,并且列必须已被配置为具有日期、日期时间、时间戳或时间数据类型。

ML 部署创建的预测数据集,包括 SHAP 和应用数据集,将包括自动设计的日期特性。

实时预测中的自动设计日期特性

为了使机器学习 API 中的实时预测端点能够处理您的日期和时间戳字段,您发送到端点的 JSON 有效负载必须符合以下要求:

  • 日期和日期时间值必须是根据 ISO 8601 标准格式化的字符串示例:

    • 2020-01-14

    • 2020-01-14T00:00:00.000Z

  • 父日期(从中派生出日期部分的功能)必须完整包含。例如,您的模型可能只使用 年份 特性,但您仍然需要以符合 ISO 8601 标准的格式提供日期。

  • 每列中的数据需要属于同一时区

信息注释用于训练模型的数据不必遵循这些要求。
信息注释

实时预测 API 被弃用,并被机器学习 API中的实时预测端点所取代。功能本身并没有被弃用。对于未来的实时预测,请使用机器学习 API中的实时预测端点。如需从实时预测 API 迁移到机器学习 API的帮助,请参阅Qlik Cloud开发者门户上的迁移指南

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们!