Ir para conteúdo principal Pular para conteúdo complementar

Modelos de regressão de pontuação

Os modelos de regressão preveem os resultados como um número, indicando a melhor estimativa do modelo da variável de destino. Diversas métricas são geradas para você avaliar os modelos de regressão.

Durante o treinamento de um experimento de regressão, os gráficos a seguir são gerados automaticamente para fornecer uma análise rápida dos modelos gerados:

  • Importância da permutação Um gráfico no qual os recursos são exibidos em ordem da maior influência (maior impacto no desempenho do modelo) à menor influência (menor impacto no desempenho do modelo). Para obter mais informações, consulte Importância da permutação.

  • SHAP importance Um gráfico representando o quanto cada recurso influencia o resultado previsto. Para obter mais informações, consulte Importância de SHAP no treinamento experimental.

R2

R ao quadrado (R2) é uma medida sem unidade de correlação dos recursos com o alvo. Pode ser expresso como: que porcentagem mais próxima do perfeito são as previsões do modelo em comparação com o uso do valor médio do alvo?

R2 varia de infinito negativo a 1. Quanto mais próximo de 1, mais a variação no valor de destino pode ser explicada pelas variáveis de recurso. Em outras palavras, o mais provável é que você tenha variáveis importantes do recurso que levariam a previsões precisas.

Os gráficos mostram um exemplo de altura plotada em relação à idade. A altura está mais correlacionada com a idade no primeiro gráfico, onde R2 é 0,97, do que no segundo gráfico, onde R2 é 0,56.

Dois gráficos traçando altura versus idade com diferentes valores de R2

Dois gráficos com diferentes valores de R2.

Observe que um valor R2 mais baixo não significa necessariamente que seja um modelo ruim. Como você interpreta o R2 depende do caso de uso e dos dados. Ao considerar a pontuação do modelo de regressão, é importante lembrar que uma relação linear nem sempre é crítica. Se a regressão linear estiver produzindo resultados insatisfatórios enquanto outros algoritmos tiverem melhor desempenho, isso pode significar simplesmente que seus dados não podem ser modelados bem o suficiente por uma relação linear.

RMSE

Raiz do erro quadrático médio (RMSE) pode ser interpretada como a diferença média +/- esperada entre um valor previsto e o valor real. É o desvio padrão dos resíduos (a diferença entre o valor observado e o valor previsto para um recurso). A RMSE é medida na mesma unidade que o valor alvo.

Como exemplo, digamos que nosso alvo seja prever o valor do contrato e obtemos RMSE = 1250. Isso significa que, em média, o valor previsto difere +/- US$ 1.250 do valor real.

MSE

Erro quadrático médio (MSE) pode ser interpretado como a diferença quadrada +/- entre o valor previsto e o valor real que esperaríamos ver em média. É medida na mesma unidade que o valor alvo ao quadrado.

No exemplo com previsão de valor de contrato, um valor MSE de 1562500 significaria que o modelo está errado em +/- 1.562.500 US$ 2. Observe que a unidade é dólares ao quadrado.

MAE

O erro absoluto médio (MAE) é a média de todos os erros absolutos de previsão, onde o erro de previsão é a diferença entre o valor real e o valor previsto. Usar o valor absoluto dos erros de previsão evita que os erros +/- se anulem. O MAE é medido na mesma unidade que o valor alvo.

Saiba mais

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!