自动特性工程
通过自动特性工程,Qlik Predict 可以使用训练数据中的现有特性来创建新特性。这些新的自动设计的特性允许您发现数据中的新模式,并可以极大地提高机器学习模型的性能。Qlik Predict 支持日期特征工程和自由文本特征工程。
背景
特征设计是从当前特征列创建新特征列的过程。Qlik Predict 可以自动执行特性设计,以改进对某些类型数据的处理。有关功能设计的一般信息,请参见创建新要素列。
识别何时可以进行自动特征工程
选择一个数据集用于实验后,将对该数据集进行分析,并将其中的列标识为包含某些数据类型。这些数据类型允许 Qlik Predict 为数据集中的每一列分配一个特性类型。每列都有以下特性类型之一:
-
无条件型
-
数字
-
日期
-
自由文本
如果可能,Qlik Predict 会显示一个可以从符合条件的父特性创建的自动设计特性列表。随着预处理的开始,这个自动设计特性列表将进一步细化和减少。建议在实验中包含自动设计特性,但这是可选的。您可以在开始训练之前以及在配置每个新的实验版本时删除单独的自动设计特性。
有关实验训练开始前完成的过程的更多信息,请参阅自动数据准备和转换。