Puntuación de modelos de regresión
Los modelos de regresión predicen los resultados como un número, lo que indica la mejor estimación del modelo de la variable objetivo. Se generan varias métricas para evaluar los modelos de regresión.
R2
R al cuadrado (R2) es una medida sin unidades de correlación de las características con el objetivo. Se puede expresar como: ¿a qué porcentaje más cercano a la perfección están las predicciones del modelo en comparación con el uso del valor promedio del objetivo?
R2 oscila entre infinito negativo y 1. Cuanto más se acerque a 1, más varianza del valor objetivo pueden explicar las variables de las características. En otras palabras, cuanto más probable sea que haya variables importantes que conduzcan a predicciones precisas.
Los gráficos muestran un ejemplo de estatura en función de la edad. La altura está más estrechamente correlacionada con la edad en el primer gráfico, donde R2 es 0,97, que en el segundo, donde R2 es 0,56.
Dos gráficos que representan la altura en función de la edad con diferentes valores R2

Tenga en cuenta que un valor R2 más bajo no significa necesariamente que sea un mal modelo. Cómo interpreta R2 depende del caso de uso concreto y los datos. Al considerar la puntuación del modelo de regresión, es importante recordar que una relación lineal no siempre es crítica. Si la regresión lineal produce resultados deficientes mientras que otros algoritmos tienen un mejor rendimiento, simplemente podría significar que sus datos no se pueden modelar lo suficientemente bien mediante una relación lineal.
RMSE
El error cuadrático medio (RMSE) se puede interpretar como la diferencia promedio +/- esperada entre un valor predicho y el valor real. Es la desviación estándar de los residuos (la diferencia entre el valor observado y el valor predicho para una característica). RMSE se mide en la misma unidad que el valor objetivo.
Como ejemplo, supongamos que nuestro objetivo es predecir el valor del contrato y obtenemos RMSE = 1250. Esto significa que, en promedio, el valor predicho difiere +/- 1,250 $ del valor real.
MSE
El error cuadrático medio (MSE) se puede interpretar como la diferencia cuadrática +/- entre el valor predicho y el valor real que esperaríamos ver en promedio. Se mide en la misma unidad que el valor objetivo al cuadrado.
En el ejemplo con la predicción del valor de contrato, un valor de MSE de 1562500 significaría que el modelo tiene una desviación de +/- 1.562.500 $2. Tenga en cuenta que la unidad es dólares al cuadrado.
MAE
El error medio absoluto (MAE) es la media de todos los errores absolutos de predicción, donde el error de predicción es la diferencia entre el valor real y el valor predicho. Utilizar el valor absoluto de errores de predicción evita que los errores +/- se anulen entre sí. MAE se mide en la misma unidad que el valor objetivo.
Velocidad de predicción
La velocidad de predicción es una métrica de modelos que se aplica a todos los tipos de modelos: clasificación binaria, clasificación multiclase y regresión. La velocidad de predicción mide la rapidez con la que un modelo de aprendizaje automático es capaz de generar predicciones.
En Qlik Predict, la velocidad de predicción se calcula utilizando el tiempo combinado de cálculo de las características y el tiempo de predicción del conjunto de datos de prueba. Se muestra en filas por segundo.
La velocidad de predicción puede analizarse en la tabla Métricas del modelo tras ejecutar su versión del experimento. También puede ver los datos de velocidad de predicción cuando analice modelos con análisis integrados. Para más información, vea:
Consideraciones
La velocidad de predicción medida se basa en el tamaño del conjunto de datos de entrenamiento y no en los datos sobre los que se realizan las predicciones. Después de implementar un modelo, es posible que note diferencias entre la rapidez con la que se crean las predicciones si los datos de entrenamiento y de predicción difieren mucho en tamaño, o cuando se crean predicciones en tiempo real sobre una o varias filas de datos.