超参数优化
机器学习模型需要不同的约束、权重或学习率来泛化不同的数据模式。这些度量被称为超参数,用于控制学习过程。需要对超参数进行微调,以便模型能够以最佳方式解决机器学习问题。
默认情况下,Qlik Predict 为模型训练中使用的每个算法使用一组预定义的超参数值。这些是数据科学界普遍接受的标准优化值。系统会自动选择表现最佳的超参数值组合。
然而,在某些情况下,您可能希望对模型进行微调以获得最佳预测结果。这可以使用超参数优化 (HPO) 来完成。
Qlik Predict 仅针对您在实验配置中选择的算法集中最好的算法运行超参数优化。首先运行随机搜索,然后运行网格搜索,以找到该算法的最佳超参数。
在使用超参数优化之前,有几个重要事项需要考虑:
-
不要在首次训练模型时使用超参数优化。它旨在您训练完模型并对结果满意后使用。该过程通常需要反复改进和重新训练。
-
超参数优化会增加大量时间。如果使用标准预定义超参数值训练模型需要 5 分钟,那么在启用超参数优化的情况下训练同一模型可能会花费数小时。
超参数优化中使用的算法
超参数优化仅限于特定的算法和模型类型。它专门设计用于以下模型类型和算法:
-
二分类模型
-
CatBoost 分类
-
Elastic Net 回归
-
Lasso 回归
-
LightGBM 分类
-
逻辑回归
-
随机森林分类
-
XGBoost 分类
-
-
回归模型
-
CatBoost 回归
-
LightGBM 回归
-
随机森林回归
-
XGBoost 回归
-
启用超参数优化
执行以下操作:
-
在实验中,单击 查看配置。
实验配置面板将打开。
-
如果需要,单击 创建新版本 以配置下一个版本。
-
在面板中,展开 模型优化。
-
从 智能 切换到 手动。
智能模型优化不提供超参数优化。
-
勾选 超参数优化 复选框。
查看超参数值
在详细模型分析期间,在 比较 选项卡中查看超参数值。有关更多信息,请参阅 执行 详细的模型分析。