优化模型
使用自动机器学习的一个重要部分是改进模型以提高分数。通过排除或包含特征并更改其他配置参数,您可以比较不同的模型版本,以了解更改的效果。
通过解释分数,您将学习如何改进模型。不同度量的值可以让您深入了解要采取哪些行动来改善结果。
改进数据集
如果您的模型得分不好,您可能需要检查数据集以解决任何问题。阅读有关如何改进 准备好数据集进行训练 中数据集的详细信息。
排除特征
更多的特征不一定会产生更好的模型。要优化模型,需要排除不可靠和不相关的特征,例如:
-
相关性过高的特征。从两个相关特征中,排除特征重要性较小的特征。
-
特征重要性太低的特征。这些特征不会对您试图了解的内容产生任何影响。
-
特征重要性过高的特征。这可能是由于数据泄漏。
测试以从训练数据中删除该特征,然后再次运行训练并检查这是否改进了模型。它对模型得分有很大影响吗?
执行以下操作:
-
从目录中打开一个实验。
-
选择要优化的模型。
-
在右下角,单击 Configure v2 以打开实验配置窗格。
(按钮上的文本取决于运行的版本数。)
-
在特征下,清除不想在训练中使用的任何特征的复选框。
添加特征
如果您的模型仍然得分不好,可能是因为与目标相关的特征尚未在数据集中捕获。阅读有关如何在 创建新要素列 中捕获或设计新特征的更多信息。
选择算法
根据目标列的数据类型,将自动选择合适的算法进行训练。您可能希望排除性能不佳或较慢的算法。这样你就不必在他们身上浪费时间训练了。
有关如何选择算法的更多信息,请参阅算法。
执行以下操作:
-
从目录中打开一个实验。
-
选择要优化的模型。
-
在右下角,单击 Configure v2 以打开实验配置窗格。
(按钮上的文本取决于运行的版本数。)
-
在算法下,清除不想在训练中使用的任何算法的复选框。
比较实验版本
完成更改后,再次运行训练,并将新版本与旧版本进行比较,以查看更改的效果。
执行以下操作:
-
单击屏幕右下角的 Run v2 以训练另一个实验版本。
(按钮上的文本取决于运行的版本数。)
-
在度量表中,您可以对模型进行排序,或者使用算法筛选器查找要比较的模型。
比较模型版本

删除实验版本
您可以删除不想保留的实验版本。请注意,实验版本中的所有模型也将被删除,无法恢复。
执行以下操作:
-
在模型度量表中,从要删除的实验版本中选择一个模型。
-
在右下角,单击删除 1 版本。
-
在确认对话框中,单击删除。