跳到主要内容 跳到补充内容

智能模型优化

智能模型优化可以自动优化您在实验中训练的模型。通过智能模型优化,可能对模型性能产生负面影响的特性会自动从模型训练中排除。有了一个准备充分的训练数据集,其中包括所有相关功能,您可以实现智能模型优化,从而在单个版本中训练可部署的模型。

智能模型优化是什么?

智能模型优化自动化了模型优化过程的许多方面。智能模型优化识别并删除降低模型预测潜力的特性。

使用智能模型优化

默认情况下,新 ML 实验中的智能模型优化处于打开状态。您可以为运行的每个版本的实验打开或关闭它。

在打开智能优化的情况下运行实验版本后,可以在模型训练摘要中查看优化结果。此摘要显示在模型见解下的模型选项卡中。将光标悬停在带下划线的术语上,可以查看带有详细描述的工具提示。

在实验版本中训练的每个模型的模型训练摘要均不同。

模型的模型训练摘要图表,显示在模型选项卡中

用智能优化训练的模型的训练摘要图表。

在智能模型优化过程中,由于以下任何原因,一个特性可能会被删除:

  • 目标泄露:该特性可能受到目标泄露的影响。受目标泄露影响的特性包括您试图预测的目标列的信息。例如,该特性直接衍生自目标,或包含在预测时未知的信息。导致目标泄露的特性可能会让您错误地认为模型性能可靠。在现实世界的预测中,它们会导致模型表现非常糟糕。

  • 低排列重要性:该特性对模型预测没有太大影响。删除这些特性可以通过减少统计噪声来提高模型性能。

  • 高度相关:该特性与实验中的一个或多个其他特性高度相关。相关性太高的特性不适合在训练模型中使用。

在实验中的数据选项卡中,您可以查看每个模型的已删除特性的见解。见解还涉及智能模型优化过程之外的特性。有关每种见解的更多信息,请参阅解释数据集见解

智能模型优化的工作原理

使用智能模型优化:

  • 与手动优化相比,训练的模型更多。特性选择在模型级别处理。这意味着,与手动优化不同,一个版本中的每个模型都可以有不同的特性选择。
  • 为了保证质量,仍会训练基线模型(在您为版本配置的整个特性集上训练的模型)。这有助于检查智能优化是否确实能提高模型分数。
  • 对于较大的训练数据集,模型以各种采样率进行训练。这有助于加快训练过程。有关更多信息,请参阅训练数据采样

训练数据采样

当您使用大量数据训练模型时,AutoML 使用采样以原始数据集的各种子集(采样率)训练模型。采样用于加快训练过程。在训练开始时,模型以较小的采样率进行训练。随着训练的继续,模型逐渐用更大的数据部分进行训练。最终,模型用整个数据集进行训练(采样率为 100%)。

在分析模型训练数据的过程中,用不到 100% 的训练数据集训练的模型在某些视图中是隐藏的。

关闭智能优化

关闭智能优化后,您将手动优化训练。如果您需要对训练过程进行更多控制,手动优化可能会有所帮助。特别是您可能希望运行一个具有智能模型优化的版本,然后如果需要进行一小部分手动调整,则将该设置关闭。

  1. 在实验中,单击 模式 视图配置

    实验配置面板打开。

  2. 如果您已经运行了至少一个版本的实验,请单击新建版本

  3. 在面板中,展开模型优化

  4. 智能切换到手动

注意事项

使用智能模型优化时,请考虑以下方面:

  • 使用智能模型优化并不能保证您的训练会产生高质量的模型。数据集准备和实验配置阶段对于生成可靠的模型也至关重要。如果您没有一个准备充分的数据集,或者您的配置缺少关键特性,那么您的模型就不能保证在生产用例中表现良好。有关这些阶段的更多信息,请参阅:

  • 当为某个版本启用智能模型优化时,此版本中的每个模型都将具有一组单独的包含的特性。另一方面,经过手动优化训练的版本的所有模型都将具有相同的包含的特性集。

  • 智能模型优化仅使用您在版本配置中包含的特性和算法。

超参数优化

启用智能模型优化时,超参数优化不可用。要激活超参数优化,您需要将模型优化设置为手动

有关更多信息,请参阅超参数优化

示例

有关演示智能模型优化好处的示例,请参阅示例 - 使用自动机器学习训练模型

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!