Perfeccionamiento de los modelos
Una vez que haya creado algunos modelos iniciales, es importante perfeccionarlos para aumentar su eficacia y el grado de exactitud. Las puntuaciones del modelo indican diferentes medidas de rendimiento. Si bien el objetivo de perfeccionar los modelos es aumentar estas puntuaciones, una puntuación más alta no siempre indica un mejor modelo.
Puede perfeccionar sus modelos excluyendo o incluyendo características, cambiando los datos de entrenamiento y modificando otros parámetros de configuración. De este modo, podrá comparar diferentes versiones para ver qué efecto tienen sus cambios.
Al interpretar las puntuaciones, aprenderá a refinar el modelo. Los valores de las diferentes métricas pueden brindarle información sobre qué acciones realizar para mejorar el resultado.
Requisitos y permisos
Si desea más información sobre los requisitos del usuario para trabajar con experimentos de ML, consulte Trabajar con experimentos.
Configurar una nueva versión
Después de ejecutar una versión experimental, puede perfeccionar sus modelos si es necesario creando una nueva versión.
Haga lo siguiente:
-
En la pestaña Datos, Modelos o Analizar, seleccione el modelo que se utilizará como base para la siguiente versión.
-
Haga clic en Ver configuración.
Se abre el panel de configuración del experimento.
-
Haga clic en Nueva versión.
Después de crear una nueva versión, puede hacer cambios en su configuración, como:
-
Excluir características previas
-
Incluir elementos anteriormente excluidos
-
Cambiar o actualizar el conjunto de datos
-
Seleccionar o anular la selección de algoritmos
En las secciones siguientes encontrará más información sobre estas opciones.
Cuando redacte una nueva versión, haga clic en el icono de filtro, debajo de Características en el panel de configuración del experimento. Al filtrar, puede visualizar más fácilmente qué características se han introducido desde que cambió el conjunto de datos de entrenamiento. También puede ver qué características se han diseñado mediante ingeniería automática y cuáles no.
Mejorar el conjunto de datos
Si su modelo no obtiene una buena puntuación, es posible que desee revisar el conjunto de datos para solucionar cualquier problema. Obtenga más información sobre cómo mejorar el conjunto de datos en Cómo preparar su conjunto de datos para el entrenamiento.
Excluir características
Más características no necesariamente hacen un mejor modelo. Para refinar el modelo, deseamos excluir características que sean poco fiables e irrelevantes como:
-
Características con una correlación demasiado alta. De dos características correlacionadas, excluya la que tiene menos importancia como característica.
-
Características con una importancia demasiado baja. Esas características no proporcionan ninguna influencia sobre lo que está tratando de aprender.
-
Características con una importancia demasiado alta. Puede ser debido a la fuga de datos.
Pruebe a eliminar la característica de los datos de entrenamiento, luego ejecute el entrenamiento nuevamente y verifique si esto mejora el modelo. ¿Supone una gran diferencia o ninguna en la puntuación del modelo?
Haga lo siguiente:
-
Abra un experimento desde el Catálogo.
-
En la pestaña Datos, Modelos o Analizar, seleccione el modelo que se utilizará como base para la siguiente versión.
-
Haga clic en Ver configuración.
Se abre el panel de configuración del experimento.
-
Haga clic en Nueva versión para configurar una nueva versión del experimento.
-
En Características, desmarque las casillas de cualquier característica que no desee utilizar en el entrenamiento.
Agregar características
Si su modelo todavía no obtiene una buena puntuación, podría deberse a que las características que tienen una relación con el objetivo aún no están capturadas en el conjunto de datos. Puede volver a procesar y reutilizar su conjunto de datos para optimizar la calidad y añadir nuevas características e información. Cuando esté listo, el nuevo conjunto de datos podrá añadirse a futuras versiones del experimento. Vea Cambiar o actualizar el conjunto de datos.
Vea más información sobre cómo capturar o diseñar nuevas características en Crear nuevas columnas de características.
Seleccionar algoritmos
Según el tipo de datos de su columna objetivo, los algoritmos adecuados se seleccionan automáticamente para el entrenamiento. Es posible que desee excluir los algoritmos que no funcionan tan bien o que son más lentos. De esta manera, no tendrá que perder tiempo en ellos para el entrenamiento.
Para obtener más información sobre cómo se eligen los algoritmos, consulte Entendimiento de los algoritmos del modelo.
Haga lo siguiente:
-
Abra un experimento desde el Catálogo.
-
En la pestaña Datos, Modelos o Analizar, seleccione el modelo que se utilizará como base para la siguiente versión.
-
Haga clic en Ver configuración.
Se abre el panel de configuración del experimento.
-
Haga clic en Nueva versión para configurar una nueva versión del experimento.
-
En Algoritmos, desmarque las casillas de cualquier algoritmo que no desee utilizar en el entrenamiento.
Cambiar o actualizar el conjunto de datos
Si sus datos de entrenamiento han cambiado desde la última versión del experimento, puede cambiar o actualizar el conjunto de datos para futuras versiones del experimento.
Esto puede ser útil si desea comparar las métricas y el rendimiento del modelo para diferentes conjuntos de datos dentro del mismo experimento. Por ejemplo, esto es útil si:
-
Se dispone de un nuevo conjunto de registros de datos o se han realizado actualizaciones del conjunto original de registros de datos. Por ejemplo, las transacciones del último mes podrían estar disponibles y ser adecuadas para su uso en el entrenamiento, o se podría haber identificado y resuelto un problema de recopilación de datos.
-
El conjunto de datos de entrenamiento original se ha reprocesado o reutilizado, quizá con la intención de mejorar el entrenamiento del modelo. Por ejemplo, se puede haber mejorado la lógica para definir los valores de las columnas de características, o incluso haber añadido nuevas columnas de características.
Cambiar o actualizar el conjunto de datos no altera los modelos existentes que ya han sido entrenados a partir de versiones anteriores del experimento. Dentro de una versión del experimento, los modelos se entrenan solo con los datos de entrenamiento definidos dentro de esa versión específica.
Requisitos
Cuando cambie o actualice el conjunto de datos para una nueva versión del experimento, el nuevo conjunto de datos debe cumplir los siguientes requisitos:
-
El nombre y el tipo de característica de la columna objetivo deben ser los mismos que los del conjunto de datos de entrenamiento original.
- El número de valores distintos en la columna objetivo debe estar dentro del mismo rango que el requerido para el tipo de experimento determinado. Por ejemplo, para un experimento de clasificación multiclase, la columna objetivo del nuevo conjunto de datos debe tener entre tres y diez valores únicos. Para conocer los rangos específicos, consulte Determinar el tipo de modelo creado.
Las otras columnas de características pueden ser completamente nuevas, tener nombres diferentes y contener datos distintos.
Cambiar el conjunto de datos
Haga lo siguiente:
-
En la pestaña Datos, Modelos o Analizar, seleccione el modelo que se utilizará como base para la siguiente versión.
-
Haga clic en Ver configuración.
Se abre el panel de configuración del experimento.
-
Haga clic en Nueva versión para configurar una nueva versión del experimento.
-
En Datos de entrenamiento, haga clic en Cambiar conjunto de datos.
-
Seleccione o cargue el nuevo conjunto de datos.
Actualizar el conjunto de datos
Haga lo siguiente:
-
En la pestaña Datos, Modelos o Analizar, seleccione el modelo que se utilizará como base para la siguiente versión.
-
Haga clic en Ver configuración.
Se abre el panel de configuración del experimento.
-
Haga clic en Nueva versión para configurar una nueva versión del experimento.
-
En Datos de entrenamiento, haga clic en Actualizar el conjunto de datos.
Se le notificará si hay disponible una actualización del conjunto de datos. Normalmente, un conjunto de datos se actualiza cuando el archivo de datos existente se sobrescribe por la creación de un nuevo archivo con el mismo nombre.
Ejecución de la versión perfeccionada
Cuando haya terminado de configurar la versión, puede ejecutarla.
Haga lo siguiente:
-
Haga clic en Ejecución v2 en la esquina inferior derecha de la pantalla.
(El texto del botón depende del número de versiones que haya ejecutado).
Comparar versiones de experimentos
Cuando la nueva versión haya terminado de formarse, compárela con la antigua para ver el efecto de sus cambios. Dispone de varias opciones para comparar modelos entre versiones de experimentos.
Análisis rápido
Utilice las pestañas Modelos y Datos del experimento para comparar la versión con versiones anteriores. En la pestaña Modelos, puede hacer lo siguiente:
-
Ver los resultados en la tabla Métricas del modelo.
-
Cambiar de modelo para ver las diferencias en el resumen de entrenamiento del modelo y en otros gráficos generados automáticamente.
Para obtener más información sobre el análisis rápido de modelos, consulte Gráfico de dispersión para una función numérica seleccionada, que permite analizar la distribución de los valores SHAP.
Análisis en profundidad
Puede profundizar en el análisis de su modelo cambiando a las pestañas Comparar y Analizar del experimento. Estas pestañas ofrecen una experiencia analítica integrada en la que puede evaluar interactivamente los modelos a un nivel más granular.
La pestaña Comparar ofrece la comparación de las puntuaciones de los modelos y los hiperparámetros de todos los modelos. La pestaña Analizar le permite centrarse en un modelo concreto para evaluar la exactitud de la predicción, la importancia de las características y otros detalles.
Para obtener más información, consulte Comparación de modelos y Realización de análisis detallados de modelos.
Cambio de los parámetros de optimización del modelo
Puede desactivar la optimización inteligente después de ejecutar una versión en la que estaba activada. Esto le permite utilizar la información proporcionada por la optimización inteligente, a la vez que le da el control necesario para realizar pequeños ajustes mínimos. Como alternativa, puede activar la optimización inteligente de modelos tras ejecutar una o varias versiones con el ajuste desactivado.
La optimización de hiperparámetros es un ajuste cuya activación puede resultar útil durante el proceso de perfeccionamiento del modelo. En general, no se recomienda tener activado este ajuste para la primera versión del experimento.
También puede cambiar si desea o no utilizar el entrenamiento basado en el tiempo, o cambiar la columna utilizada como índice de fechas.
Haga lo siguiente:
Haga clic en Ver configuración.
Si es necesario, haga clic en Nueva versión para configurar una nueva versión del experimento.
En el panel, expanda Optimización del modelo.
Cambie entre los ajustes Inteligente y Manual para activar o desactivar la optimización inteligente de modelos.
Si desea activar la optimización de hiperparámetros, haga clic en la casilla Optimización de hiperparámetros y establezca un tiempo máximo de entrenamiento.
En la división prueba-entrenamiento basada en el tiempo, puede cambiar la configuración para el entrenamiento basado en el tiempo:
Para activar el entrenamiento basado en el tiempo, cambie el valor predeterminado de Ninguno seleccionando una columna de índice de fecha específica en el conjunto de datos.
Para desactivar el entrenamiento en función de la hora, ajuste el índice de fechas en el valor de Ninguno.
Cambie la columna índice de fechas seleccionada a una columna diferente.
Eliminar versiones de experimentos
Puede eliminar las versiones del experimento que no desee conservar. Tenga en cuenta que todos los modelos de las versiones del experimento también se eliminarán y no se podrán recuperar.
Haga lo siguiente:
Cambie a la pestaña Modelos.
En la tabla Métricas del modelo, seleccione un modelo de la versión del experimento que desea eliminar.
Nota de sugerenciaTambién puede seleccionar un modelo cuando se encuentre en las pestañas Datos o Analizar , utilizando el menú desplegable de la barra de herramientas.En la parte inferior derecha, haga clic en Eliminar <número de versión>.
En el diálogo de confirmación, haga clic en Eliminar.