跳到主要内容 跳到补充内容

评分回归模型

回归模型以数字形式预测结果,表明模型对目标变量的最佳估计。为评估回归模型,生成了几个度量。

在回归实验的训练过程中,自动生成以下图表,以提供对生成的模型的快速分析:

  • Permutation importance:一种图表,在其中特征按照从最高影响(对模型性能的最大影响)到最低影响(对性能的最小影响)的顺序显示。有关详细信息,请参阅permutation importance

  • SHAP importance:表示每个特征对预测结果的影响程度的图表。有关详细信息,请参阅实验训练中的 SHAP 重要性

R2

R 平方 (R2) 是特征与目标的相关性的无单位度量。它可以表示为:与使用目标的平均值相比,模型的预测接近完美的百分比是多少?

R2 的范围从负无穷大到 1。越接近 1,目标值中的方差越能被特征变量解释。换言之,你越有可能拥有能够导致准确预测的重要变量。

图表显示了身高与年龄的关系。在第一张图表中,R2 为 0.97,而在第二张图表中 R2 为 0.56,身高与年龄的相关性更密切。

用不同的 R2 值绘制身高与年龄的两个图表

两个 R2 值不同的图。

注意,R2 值较低并不一定意味着它是一个坏模型。如何解释 R2 取决于用例和数据。在考虑回归模型评分时,重要的是要记住线性关系并不总是关键的。如果线性回归产生的结果很差,而其他算法的性能更好,这可能仅仅意味着你的数据不能用线性关系来建模。

RMSE

均方根误差 (RMSE) 可以解释为预测值和实际值之间的平均 +/- 差值。它是残差的标准偏差(特征的观测值和预测值之间的差值)。RMSE 以与目标值相同的单位测量。

例如,假设我们的目标是预测合同价值,我们得到 RMSE=1250。这意味着,平均而言,预测值与实际值相差 +/- $1,250。

MSE

均方误差 (MSE) 可以解释为预测值和实际值之间的平方 +/- 差,我们预计平均会看到该均方误差。其测量单位与目标值的平方相同。

在合同价值预测的示例中,MSE 值 1562500 意味着模型偏离 +/- 1,562,500 $2。注意,单位是平方美元。

MAE

平均绝对误差 (MAE) 是所有绝对预测误差的平均值,其中预测误差是实际值和预测值之间的差。使用预测误差的绝对值可以防止 +/- 误差相互抵消。MAE 以与目标值相同的单位测量。

了解详情

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们如何改进!