회귀 모델 채점
회귀 모델은 대상 변수에 대한 모델의 최상의 추정치를 나타내는 숫자로 결과를 예측합니다. 회귀 모델을 평가하기 위해 여러 메트릭이 생성됩니다.
R2
R 제곱(R2)은 대상에 대한 기능의 상관 관계를 단위 없이 측정한 값입니다. 다음과 같이 표현할 수 있습니다. 대상의 평균값을 사용하는 것과 비교하여 모델의 예측이 완벽에 몇 퍼센트 더 가깝습니까?
R2 범위는 음의 무한대에서 1까지입니다. 1에 가까울수록 대상 값의 변동이 많은 기능 변수로 설명될 수 있습니다. 즉, 정확한 예측으로 이어지는 중요한 기능 변수가 있을 가능성이 더 큽니다.
이 차트는 나이에 대한 키의 예를 보여 줍니다. R2가 0.56인 두 번째 차트보다 R2가 0.97인 첫 번째 차트에서 나이와 키가 더 밀접하게 상관되어 있습니다.
R2 값이 낮다고 해서 반드시 불량 모델이라는 의미는 아닙니다. R2를 해석하는 방법은 사용 사례와 데이터에 따라 다릅니다. 회귀 모델 채점을 고려할 때 선형 관계가 항상 중요한 것은 아니라는 점을 기억해야 합니다. 다른 알고리즘이 우수한 성능을 보이는데 선형 회귀가 좋지 않은 결과를 생성한다면 선형 관계로 데이터를 충분히 모델링할 수 없다는 의미일 수 있습니다.
RMSE
RMSE(루트 평균 제곱 오차)는 예측 값과 실제 값 사이에 예측되는 평균 +/- 차이로 해석될 수 있습니다. 잔차의 표준 편차(기능에 대한 관측값과 예측값의 차이)입니다. RMSE는 대상 값과 동일한 단위로 측정됩니다.
예를 들어, 대상이 계약 가치를 예측하는 것이고 RMSE = 1250을 얻는다고 가정해 보겠습니다. 이는 평균적으로 예측 값이 실제 값과 +/- $1,250 다르다는 것을 의미합니다.
MSE
평균 제곱 오차(MSE)는 예측 값과 평균적으로 예측되는 실제 값 사이의 제곱 +/- 차이로 해석할 수 있습니다. 대상 값의 제곱과 동일한 단위로 측정됩니다.
계약 가치 예측의 예에서 MSE 값 1562500은 모델이 +/- 1,562,500 $2 차이가 난다는 것을 의미합니다. 단위는 달러 제곱입니다.
MAE
평균 절대 오차(MAE)는 모든 절대 예측 오차의 평균이며, 여기서 예측 오차는 실제 값과 예측 값의 차이입니다. 예측 오차의 절대값을 사용하면 +/- 오차가 서로 상쇄되는 것을 방지할 수 있습니다. MAE는 대상 값과 동일한 단위로 측정됩니다.