Modelos de regressão de pontuação
Os modelos de regressão preveem os resultados como um número, indicando a melhor estimativa do modelo da variável de destino. Diversas métricas são geradas para você avaliar os modelos de regressão.
R2
R ao quadrado (R2) é uma medida sem unidade de correlação dos recursos com o alvo. Pode ser expresso como: que porcentagem mais próxima do perfeito são as previsões do modelo em comparação com o uso do valor médio do alvo?
R2 varia de infinito negativo a 1. Quanto mais próximo de 1, mais a variação no valor de destino pode ser explicada pelas variáveis de recurso. Em outras palavras, o mais provável é que você tenha variáveis importantes do recurso que levariam a previsões precisas.
Os gráficos mostram um exemplo de altura plotada em relação à idade. A altura está mais correlacionada com a idade no primeiro gráfico, onde R2 é 0,97, do que no segundo gráfico, onde R2 é 0,56.
Dois gráficos traçando altura versus idade com diferentes valores de R2

Observe que um valor R2 mais baixo não significa necessariamente que seja um modelo ruim. Como você interpreta o R2 depende do caso de uso e dos dados. Ao considerar a pontuação do modelo de regressão, é importante lembrar que uma relação linear nem sempre é crítica. Se a regressão linear estiver produzindo resultados insatisfatórios enquanto outros algoritmos tiverem melhor desempenho, isso pode significar simplesmente que seus dados não podem ser modelados bem o suficiente por uma relação linear.
RMSE
Raiz do erro quadrático médio (RMSE) pode ser interpretada como a diferença média +/- esperada entre um valor previsto e o valor real. É o desvio padrão dos resíduos (a diferença entre o valor observado e o valor previsto para um recurso). A RMSE é medida na mesma unidade que o valor alvo.
Como exemplo, digamos que nosso alvo seja prever o valor do contrato e obtemos RMSE = 1250. Isso significa que, em média, o valor previsto difere +/- US$ 1.250 do valor real.
MSE
Erro quadrático médio (MSE) pode ser interpretado como a diferença quadrada +/- entre o valor previsto e o valor real que esperaríamos ver em média. É medida na mesma unidade que o valor alvo ao quadrado.
No exemplo com previsão de valor de contrato, um valor MSE de 1562500 significaria que o modelo está errado em +/- 1.562.500 US$ 2. Observe que a unidade é dólares ao quadrado.
MAE
O erro absoluto médio (MAE) é a média de todos os erros absolutos de previsão, onde o erro de previsão é a diferença entre o valor real e o valor previsto. Usar o valor absoluto dos erros de previsão evita que os erros +/- se anulem. O MAE é medido na mesma unidade que o valor alvo.
Velocidade de previsão
Velocidade de previsão é uma métrica de modelo que se aplica a todos os tipos de modelo: classificação binária, classificação multiclasse, regressão e série temporal. A velocidade de previsão mede a rapidez com que um modelo de aprendizado de máquina pode gerar previsões.
No Qlik Predict, a velocidade de previsão é calculada usando o tempo combinado de computação do recurso e o tempo de previsão do conjunto de dados de teste. Ela é exibida em linhas por segundo.
A velocidade de previsão pode ser analisada na tabela Métricas do modelo após a execução da versão do experimento. Você também pode visualizar os dados de velocidade de previsão ao analisar modelos com análise incorporada. Para obter mais informações, consulte:
Considerações
A velocidade de previsão medida baseia-se no tamanho do conjunto de dados de treinamento, e não nos dados nos quais as previsões são feitas. Após implementar um modelo, você poderá notar diferenças entre a rapidez com que as previsões são criadas se o tamanho dos dados de treinamento e de previsão for muito diferente, ou ao criar previsões em tempo real em uma ou poucas linhas de dados.