Saltar al contenido principal Saltar al contenido complementario

Refinar los modelos

Una vez que haya creado algunos modelos iniciales, es importante refinarlos para aumentar su eficacia y el grado de exactitud. Las puntuaciones del modelo indican diferentes medidas de rendimiento. Si bien el objetivo de refinar los modelos es aumentar estas puntuaciones, una puntuación más alta no siempre indica un mejor modelo.

Puede refinar sus modelos excluyendo o incluyendo características, cambiando los datos de entrenamiento y modificando otros parámetros de configuración. De este modo, podrá comparar diferentes versiones para ver qué efecto tienen sus cambios.

Al interpretar las puntuaciones, aprenderá a refinar el modelo. Los valores de las diferentes métricas pueden brindarle información sobre qué acciones realizar para mejorar el resultado.

Requisitos y permisos

Si desea más información sobre los requisitos de usuario para trabajar con experimentos de ML, vea Trabajar con experimentos.

Configurar una nueva versión

Después de ejecutar una versión experimental, puede perfeccionar sus modelos si es necesario creando una nueva versión.

  1. En la tabla Métricas del modelo, seleccione el modelo que desea refinar.

  2. En la parte inferior derecha, haga clic en Ver configuración para abrir el panel de Configuración del experimento.

  3. Haga clic en Nueva versión.

Después de crear una nueva versión, puede hacer cambios en su configuración, como:

  • Excluir características previas

  • Incluir elementos anteriormente excluidos

  • Cambiar o actualizar el conjunto de datos

  • Seleccionar o anular la selección de algoritmos

En las secciones siguientes encontrará más información sobre estas opciones.

Cuando redacte una nueva versión, haga clic en el icono Filtrar de filtro, debajo de Características en el panel de Configuración del experimento. Al filtrar, puede visualizar más fácilmente qué características se han introducido desde que cambió el conjunto de datos de entrenamiento. También puede ver qué características se han diseñado mediante ingeniería automática y cuáles no.

Mejorar el conjunto de datos

Si su modelo no obtiene una buena puntuación, es posible que desee revisar el conjunto de datos para solucionar cualquier problema. Obtenga más información sobre cómo mejorar el conjunto de datos en Cómo preparar su conjunto de datos para el entrenamiento.

Excluir características

Más características no necesariamente hacen un mejor modelo. Para refinar el modelo, deseamos excluir características que sean poco fiables e irrelevantes como:

  • Características con una correlación demasiado alta. De dos características correlacionadas, excluya la que tiene menos importancia como característica.

  • Características con una importancia demasiado baja. Esas características no proporcionan ninguna influencia sobre lo que está tratando de aprender.

  • Características con una importancia demasiado alta. Puede ser debido a la fuga de datos.

Pruebe a eliminar la característica de los datos de entrenamiento, luego ejecute el entrenamiento nuevamente y verifique si esto mejora el modelo. ¿Supone una gran diferencia o ninguna en la puntuación del modelo?

  1. Abra un experimento desde el Catálogo.

  2. Seleccione el modelo que desea refinar.

  3. En la parte inferior derecha, haga clic en Ver configuración para abrir el panel de Configuración del experimento.

  4. Haga clic en Nueva versión para configurar una nueva versión del experimento.

  5. En Características, desmarque las casillas de cualquier característica que no desee utilizar en el entrenamiento.

Nota de sugerenciaComo alternativa, puede anular la selección de características en las vistas de esquema y datos. Haga clic en Vista de esquema para cambiar a la vista de esquema. Haga clic en Vista de datos para cambiar a la vista de datos. Vuelva a la vista del modelo haciendo clic en Vista del modelo.

Agregar características

Si su modelo todavía no obtiene una buena puntuación, podría deberse a que las características que tienen una relación con el objetivo aún no están capturadas en el conjunto de datos. Puede volver a procesar y reutilizar su conjunto de datos para optimizar la calidad y añadir nuevas características e información. Cuando esté listo, el nuevo conjunto de datos podrá añadirse a futuras versiones del experimento. Vea Cambiar o actualizar el conjunto de datos.

Vea más información sobre cómo capturar o diseñar nuevas características en Crear nuevas columnas de características.

Seleccionar algoritmos

Según el tipo de datos de su columna objetivo, los algoritmos adecuados se seleccionan automáticamente para el entrenamiento. Es posible que desee excluir los algoritmos que no funcionan tan bien o que son más lentos. De esta manera no tendrá que perder tiempo en ellos para el entrenamiento.

Para obtener más información sobre cómo se eligen los algoritmos, consulte Algoritmos.

  1. Abra un experimento desde el Catálogo.

  2. Seleccione el modelo que desea refinar.

  3. En la parte inferior derecha, haga clic en Ver configuración para abrir el panel de Configuración del experimento.

  4. Haga clic en Nueva versión para configurar una nueva versión del experimento.

  5. En Algoritmos, desmarque las casillas de cualquier algoritmo que no desee utilizar en el entrenamiento.

Cambiar o actualizar el conjunto de datos

Si sus datos de entrenamiento han cambiado desde la última versión del experimento, puede cambiar o actualizar el conjunto de datos para futuras versiones del experimento.

Esto puede ser útil si desea comparar las métricas y el rendimiento del modelo para diferentes conjuntos de datos dentro del mismo experimento. Por ejemplo, esto es útil si:

  • Se dispone de un nuevo conjunto de registros de datos o se han realizado actualizaciones del conjunto original de registros de datos. Por ejemplo, las transacciones del último mes podrían estar disponibles y ser adecuadas para su uso en el entrenamiento, o se podría haber identificado y resuelto un problema de recopilación de datos.

  • El conjunto de datos de entrenamiento original se ha reprocesado o reutilizado, quizá con la intención de mejorar el entrenamiento del modelo. Por ejemplo, se puede haber mejorado la lógica para definir los valores de las columnas de características, o incluso haber añadido nuevas columnas de características.

Cambiar o actualizar el conjunto de datos no altera los modelos existentes que ya han sido entrenados a partir de versiones anteriores del experimento. Dentro de una versión del experimento, los modelos se entrenan sólo con los datos de entrenamiento definidos dentro de esa versión específica.

Requisitos

Cuando cambie o actualice el conjunto de datos para una nueva versión del experimento, el nuevo conjunto de datos debe cumplir los siguientes requisitos:

  • El nombre y el tipo de característica de la columna objetivo deben ser los mismos que los del conjunto de datos de entrenamiento original.

  • El número de valores distintos en la columna objetivo debe estar dentro del mismo rango que el requerido para el tipo de experimento determinado. Por ejemplo, para un experimento de clasificación multiclase, la columna objetivo del nuevo conjunto de datos debe tener entre tres y diez valores únicos. Para conocer los rangos específicos, consulte Determinar el tipo de modelo creado.

Las otras columnas de características pueden ser completamente nuevas, tener nombres diferentes y contener datos distintos.

Cambiar el conjunto de datos

  1. En la tabla Métricas del modelo en un experimento, seleccione un modelo.

  2. En la parte inferior derecha, haga clic en Ver configuración para abrir el panel de Configuración del experimento.

  3. Haga clic en Nueva versión para configurar una nueva versión del experimento.

  4. En Datos de entrenamiento, haga clic en Cambiar conjunto de datos.

  5. Seleccione o cargue el nuevo conjunto de datos.

Actualizar el conjunto de datos

  1. En la tabla Métricas del modelo en un experimento, seleccione un modelo.

  2. En la parte inferior derecha, haga clic en Ver configuración para abrir el panel de Configuración del experimento.

  3. Haga clic en Nueva versión para configurar una nueva versión del experimento.

  4. En Datos de entrenamiento, haga clic en Actualizar el conjunto de datos.

    Se le notificará si hay disponible una actualización del conjunto de datos. Normalmente, un conjunto de datos se actualiza cuando el archivo de datos existente se sobrescribe por la creación de un nuevo archivo con el mismo nombre.

Comparar versiones de experimentos

Una vez que haya realizado los cambios, vuelva a ejecutar el entrenamiento y compare la nueva versión con la anterior para ver el efecto de los cambios.

  1. Haga clic en Run v2 en la esquina inferior derecha de la pantalla para entrenar otra versión del experimento.

    (El texto del botón depende del número de versiones que haya ejecutado).

  2. En la tabla Métricas del modelo, puede filtrar los modelos usando los menús desplegables para algoritmo, versión y otras propiedades. La tabla también se puede ordenar por columnas de métricas individuales.

Comparar versiones de modelos

Tabla de métricas del modelo que muestra la comparación de las métricas del modelo en varias versiones del experimento.

Eliminar versiones de experimentos

Puede eliminar las versiones del experimento que no desee conservar. Tenga en cuenta que todos los modelos de las versiones del experimento también se eliminarán y no se podrán recuperar.

  1. En la tabla Métricas del modelo, seleccione un modelo de la versión del experimento que desea eliminar.

  2. En la parte inferior derecha, haga clic en Eliminar <número de versión>.

  3. En el diálogo de confirmación, haga clic en Eliminar.

Más información

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.