Crear y configurar el experimento
El primer paso es crear y configurar el experimento. Utilizará el conjunto de datos de entrenamiento que cargó anteriormente para entrenar el modelo hasta que esté listo para implementarse y hacer predicciones.
Crear un nuevo experimento
Haga lo siguiente:
-
Vaya a la página Crear del centro de actividades Analítica y seleccione Experimento de ML.
-
Escriba un nombre para su experimento, por ejemplo, Tutorial sobre abandono de clientes.
-
Si lo desea, agregue una descripción y etiquetas.
-
Elija un espacio para su experimento. Puede ser su espacio personal o un espacio compartido.
-
Haga clic en Crear.
-
Seleccione el archivo del conjunto de datos de entrenamiento. Será uno de los siguientes, dependiendo de si trabaja con CSV o QVD:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
Revisión de los datos
Ahora ya lo tiene todo listo para comenzar a configurar su experimento, pero antes de comenzar, echemos un vistazo al conjunto de datos.
Empezamos en la pestaña Datos. La vista predeterminada es la vista de esquema. Aquí podemos ver una tabla donde cada fila representa una columna de su conjunto de datos. Las estadísticas y los conocimientos se han generado en la preparación automática de datos. Es posible que deba desplazarse hacia el lado derecho del esquema para ver la información de Conocimientos.
Podemos ver que AccountID se ha excluido debido a la alta cardinalidad. Esto significa que la columna contiene demasiados valores únicos. La característica Country se ha excluido por el motivo contrario: el valor es el mismo para todas las filas.Estas dos características no proporcionarían ningún valor a los modelos de aprendizaje automático.
También podemos ver que la característica categórica Territory se ha codificado por impacto. Pase el cursor sobre los iconos de advertencia e información para más información.
Haga clic en Vista de datos. En esta vista, podremos obtener ver más información sobre cada columna, incluidos los datos de muestra.
Seleccionar un objetivo
Queremos que nuestro modelo de aprendizaje automático prediga el abandono de clientes, por lo que seleccionamos Churned como nuestro objetivo.
Haga lo siguiente:
-
Cambie de nuevo a la vista de esquema.
-
Pase el cursor sobre Churned y haga clic en el icono que aparece.
En el panel de configuración del experimento, ahora podemos ver que Churned está seleccionado. También podemos ver qué características se seleccionan y excluyen automáticamente. Como Churned es el objetivo, no se usará como característica. También podemos ver que este experimento se tratará como un problema de clasificación binaria.
Seleccionar características
Para esta primera ejecución de nuestro experimento, incluiremos todas las características y algoritmos seleccionados de manera predeterminada. No obstante, si ya sabe que ciertas características no tienen influencia en el objetivo, según su conocimiento del negocio, puede anular la selección en este punto para excluirlas del entrenamiento.
Cambio de los parámetros de optimización
La optimización inteligente de modelos está activada de forma predeterminada. Con la optimización inteligente de modelos, AutoML proporciona un refinamiento automático del entrenamiento de modelos. Sin embargo, el objetivo de este tutorial es mostrarle cómo identificar manualmente determinados problemas con sus datos de características y resultados del entrenamiento.
Para ver un ejemplo de cómo entrenar modelos con optimización inteligente de modelos, consulte Ejemplo: entrenamiento de modelos con aprendizaje automático.
Desactivemos la optimización inteligente del modelo para demostrar el refinamiento manual.
Haga lo siguiente:
-
En el panel de configuración del experimento, expanda la sección Optimización del modelo.
-
Cambie de Inteligente a Manual.
Entrenar el experimento
La configuración ya está preparada y estamos listos para comenzar el entrenamiento.
Haga lo siguiente:
-
En la esquina inferior derecha de la ventana del experimento, haga clic en Ejecutar experimento.
Cuando el experimento haya terminado de ejecutarse, podemos pasar al siguiente paso, que consiste en revisar las métricas resultantes del modelo.