日期特性工程
Qlik Predict 从具有日期特性类型的合格列中生成自动工程化的特性,这些列已被识别为包含日期和时间信息。自动工程化的日期特性以及派生它们的父特性均标有 图标。
当 Qlik Cloud Analytics 对您选择在 Qlik Predict 中使用的训练数据集进行概要分析时,它会将某些数据类型链接到日期特性类型。这包括以下数据类型:
-
日期
-
日期时间
-
时间
-
时间戳
在概要分析期间分配了这些数据类型中任何一种的特性都将被赋予日期特性类型。有关可为数据字段查看的可用概要分析统计信息,请参阅 列表视图。
在可能的情况下,Qlik Predict 会显示可以从具有日期特性类型的合格父特性中创建的自动工程化日期特性列表。默认情况下,实验中包含自动工程化的日期特性。如果您选择包含它们,则会在实验的 v1 之后生成新特性。
自动工程化的日期特性具有数值特性类型。默认情况下,它们包含在实验中,但也是可选的。您可以在开始实验训练之前或在配置下一个实验版本时删除其中部分或全部特性。当包含自动工程化的日期特性时,原始父日期特性将从实验中删除。
相反,您可以将父日期特性作为分类或数值特性包含在内。当您这样做时,自动工程化的日期特性将不再可用。在大多数情况下,建议在实验中使用可用的自动工程化特性,因为它们可以提高机器学习模型的性能。但是,在某些情况下,某列可能被识别为日期特性,但您需要将其视为分类或数值特性。在这些情况下,您可以手动更改特性类型。
自动工程化的日期特性不计入您的 Qlik Cloud 订阅中指定的 Qlik Predict 数据集大小(训练数据集和应用数据集中的最大单元格数)。仅计算原始日期列单元格。
架构视图显示可以从父日期特性“Invoice Date”生成的自动工程化特性。请注意每个特性的 数据类型 和 特性类型 之间的区别。

使用日期特性作为实验目标
在极少数情况下,如果您想使用包含日期和时间信息的特性作为实验的目标,该列的特性类型将从日期切换为分类,并且自动工程化的特性将被删除。如果您选择另一个目标,稍后又想将日期和时间特性添加为常规特性,则需要根据需要手动将其改回日期特性类型。如果您将特性恢复为日期特性类型,则会再次生成自动工程化的日期特性。
有关如何更改特性类型的更多信息,请参阅 更改特性类型。
可用的自动工程化日期特性
从数据集中的列生成自动工程化日期特性时,Qlik Predict 提取并计算每个日期和日期时间值的特定组件,并将每个组件隔离在自己的列中。下表列出了可由 Qlik Predict 生成的自动工程化特性。
| 自动工程化特性 | 数据类型 | 特性类型 | 描述 |
|---|---|---|---|
| YEAR | Integer | Numeric | 直接从源日期或时间戳解析的年份字段。 |
| MONTH | Integer | Numeric | 直接从源日期或时间戳解析的月份字段。 |
| DAY | Integer | Numeric | 直接从源日期或时间戳解析的天字段。 |
| HOUR | Integer | Numeric | 直接从源时间戳解析的小时字段。 |
| MINUTE | Integer | Numeric | 直接从源时间戳解析的分钟字段。 |
| SECOND | Integer | Numeric | 直接从源时间戳解析的秒字段。 |
| DAYOFWEEK | Integer | Numeric | 星期几,根据源天、月和年计算。 |
| WEEK | Integer | Numeric | 一年中的第几周,根据源天、月和年计算。 |
对于创建的每个新特性,原始列名都会加上适用的自动工程化特性作为后缀。
实验配置面板中的自动工程化日期特性

自动工程化日期特性和时间序列模型
当您为时间序列实验选择日期索引列时,日期特性类型将用于此列。但是,时间序列模型不支持日期特性工程。自动工程化的日期特性无法从该列派生。
有关时间序列模型的更多信息,请参阅 使用时间序列实验 和 使用多元时间序列预测。
预测中的自动工程化日期特性
有关运行预测时如何处理日期特性的信息,请参阅 在预测中使用日期功能。