Modelos de regressão de pontuação
Os modelos de regressão preveem os resultados como um número, indicando a melhor estimativa do modelo da variável de destino. Diversas métricas são geradas para você avaliar os modelos de regressão.
R2
R ao quadrado (R2) é uma medida sem unidade de correlação dos recursos com o alvo. Pode ser expresso como: que porcentagem mais próxima do perfeito são as previsões do modelo em comparação com o uso do valor médio do alvo?
R2 varia de infinito negativo a 1. Quanto mais próximo de 1, mais a variação no valor de destino pode ser explicada pelas variáveis de recurso. Em outras palavras, o mais provável é que você tenha variáveis importantes do recurso que levariam a previsões precisas.
Os gráficos mostram um exemplo de altura plotada em relação à idade. A altura está mais correlacionada com a idade no primeiro gráfico, onde R2 é 0,97, do que no segundo gráfico, onde R2 é 0,56.
Observe que um valor R2 mais baixo não significa necessariamente que seja um modelo ruim. Como você interpreta o R2 depende do caso de uso e dos dados. Ao considerar a pontuação do modelo de regressão, é importante lembrar que uma relação linear nem sempre é crítica. Se a regressão linear estiver produzindo resultados insatisfatórios enquanto outros algoritmos tiverem melhor desempenho, isso pode significar simplesmente que seus dados não podem ser modelados bem o suficiente por uma relação linear.
RMSE
Raiz do erro quadrático médio (RMSE) pode ser interpretada como a diferença média +/- esperada entre um valor previsto e o valor real. É o desvio padrão dos resíduos (a diferença entre o valor observado e o valor previsto para um recurso). A RMSE é medida na mesma unidade que o valor alvo.
Como exemplo, digamos que nosso alvo seja prever o valor do contrato e obtemos RMSE = 1250. Isso significa que, em média, o valor previsto difere +/- US$ 1.250 do valor real.
MSE
Erro quadrático médio (MSE) pode ser interpretado como a diferença quadrada +/- entre o valor previsto e o valor real que esperaríamos ver em média. É medida na mesma unidade que o valor alvo ao quadrado.
No exemplo com previsão de valor de contrato, um valor MSE de 1562500 significaria que o modelo está errado em +/- 1.562.500 US$ 2. Observe que a unidade é dólares ao quadrado.
MAE
O erro absoluto médio (MAE) é a média de todos os erros absolutos de previsão, onde o erro de previsão é a diferença entre o valor real e o valor previsto. Usar o valor absoluto dos erros de previsão evita que os erros +/- se anulem. O MAE é medido na mesma unidade que o valor alvo.