Saltar al contenido principal Saltar al contenido complementario

Definir las preguntas de aprendizaje automático

Convertir un caso de uso empresarial en una pregunta de aprendizaje automático específica y útil puede ser un desafío. Siga un marco estructurado para evitar errores habituales y generar un buen modelo predictivo.

El marco describe cómo definir una pregunta de aprendizaje automático y cómo recopilar un conjunto de datos bien estructurado que esté listo para usarse. Para obtener más información sobre cómo preparar un conjunto de datos, consulte Cómo preparar su conjunto de datos para el entrenamiento.

El marco consta de cuatro partes:

  • Disparador de eventos

  • Objetivo

  • Características

  • Punto de predicción

Disparador de eventos

El disparador de eventos es una acción o evento que desencadena la creación de nuevas predicciones. Cada disparador de evento corresponde a una sola fila de datos.

Objetivo

El objetivo es el valor que estamos tratando de predecir. Debe ser específico tanto en la forma en que se define el valor, el resultado, como en el marco de tiempo en el que se determina el valor, el horizonte. Definir el resultado y el horizonte depende del contexto empresarial, así como de los datos disponibles. Asegúrese de que el objetivo sea relevante para el contexto empresarial y piense qué acción desea realizar con los valores previstos.

El objetivo se representa en una sola columna del conjunto de datos que utiliza para entrenar los algoritmos de aprendizaje automático.

Características

Las características son las otras columnas de su conjunto de datos que se utilizan para predecir un valor objetivo. Son sus hipótesis sobre qué variables influirán en el objetivo. Los algoritmos de aprendizaje automático usan las características para aprender patrones generales durante el entrenamiento y hacer predicciones sobre nuevas filas de datos.

Las columnas de características constituyen la mayor parte del conjunto de datos de entrenamiento, donde cada característica se representa como una sola columna. Las características deben agregarse al nivel del disparador del evento o superior.

Las características pueden ser fijas, lo que significa que se conocen en el momento de desencadenarse el evento o antes, o pueden depender de la ventana, lo que significa que los datos se recopilan después de desencadenarse el evento pero antes del punto de predicción.

Punto de predicción

El punto de predicción es el momento designado en el que se dejan de recoger datos para las características y se predice el objetivo de cada fila. Decidir dónde debe caer el punto de predicción es un equilibrio entre la precisión (predecir lo suficientemente tarde como para haber recopilado datos de características de calidad) y la capacidad de acción (predecir lo suficientemente temprano como para tomar medidas que afecten al resultado).

El tiempo transcurrido entre el desencadenante del evento y el punto de predicción es la ventana de acumulación de datos. Este es el tiempo que se utiliza para recopilar datos de características. El tiempo transcurrido entre el punto de predicción y el horizonte es la ventana de acción, que es el tiempo que se emplea para actuar sobre lo pronosticado. El punto de predicción puede estar en cualquier lugar entre el disparador del evento y el horizonte de destino.

Ejemplos: Marco estructurado

Los siguientes ejemplos muestran cómo se puede usar el marco estructurado en diferentes casos de uso empresarial. Para ver un ejemplo detallado en el que se aplica el marco paso a paso, consulte Aplicar el marco estructurado: Ejemplo de abandono de clientes.

Valor del ciclo de vida de un cliente

  • Disparador del evento: Un cliente hace su primer pedido

  • Objetivo: Importe total del pedido durante los tres primeros años

    • Resultado numérico: Cantidad en dólares

    • El horizonte se basa en la duración promedio del ciclo de vida del cliente

  • Características: Origen del cliente potencial, Importe del primer pedido, Descuento utilizado en el primer pedido (Sí o No), Estado de envío, Región de envío, Número de productos en el primer pedido

  • Punto de predicción: Tres meses después del primer pedido

  • Pregunta de aprendizaje automático: "Predecir tres meses después del primer pedido de un cliente, cuál será el total de dólares de su pedido durante los próximos 33 meses"

El cliente vuelve a comprar

  • Disparador del evento: Un cliente hace un pedido

  • Objetivo: Se realiza otro pedido al cabo de seis meses.

    • Resultado binario: Sí o No

    • El horizonte determinado por los datos de que el 90 por ciento de los clientes que vuelven a comprar lo hacen en seis meses o menos

  • Características: Fuente del tráfico, Número de pedidos anteriores, Descuento utilizado, Estado del envío, Región del envío, Número de productos solicitados, Correo electrónico de notificación del envío abierto (Sí o No), Regreso al sitio web en 10 días, Registrado para recibir comunicaciones de marketing (Sí o No)

  • Punto de predicción: Una semana después del pedido

  • Pregunta de aprendizaje automático: "Predecir una semana después de que un cliente realiza un pedido, si volverá a realizar un pedido dentro de seis meses"

Conversión de clientes potenciales en ventas cerradas

  • Disparador del evento: Se crea una oportunidad de venta (lead)

  • Objetivo: Se convierte en una venta cerrada en los 12 meses posteriores a su creación

    • Resultado binario: Sí o No

    • El horizonte está basado en la duración histórica del ciclo de ventas.

  • Características: Origen del contacto, Sector, Tamaño de la empresa, Número de contactos en los primeros 30 días, Reunión programada en un plazo de 30 días (Sí o No), Número de teléfono correcto (Sí o No)

  • Punto de predicción: 30 días después de la creación de la oportunidad o lead

  • Pregunta de aprendizaje automático: "Predecir 30 días después de la creación de una oportunidad de venta (lead), si esa oportunidad de venta o lead se convertirá en una venta cerrada en los próximos 11 meses"

Graduación de un estudiante

  • Disparador del evento: Se admite a un estudiante

  • Objetivo: El estudiante se gradúa dentro de los seis años posteriores al inicio del programa.

    • Resultado binario: Sí o No

    • El horizonte se basa en la duración histórica del tiempo para graduarse

  • Características: Tipo de instituto, nota media del instituto, nota SAT/ACT, nota del examen de acceso, distancia del instituto al campus, nivel de becas, nivel de estudios de los padres, nota media del primer semestre, número de créditos del primer semestre.

  • Punto de predicción: Fin del primer semestre matriculado

  • Pregunta de aprendizaje automático: "Predecir al final de su primer semestre, si un estudiante se graduará al final del sexto año"

Ventas al mes

  • Disparador del evento: Primer día del mes

  • Objetivo: Ventas en unidades durante el mes

    • Resultado numérico: Número de unidades vendidas

    • El horizonte se basa en el mes natural

  • Características: Tipo de producto, Nombre del mes, Trimestre, Ventas del año pasado en el mismo mes, Ventas de los dos años anteriores en el mismo mes, Ventas del mes anterior, Descuento promedio en %, Gasto en marketing

  • Punto de predicción: Primer día del mes

  • Pregunta de aprendizaje automático: "Predecir el primer día del mes cuál será el total de unidades vendidas a final de mes"

Más información

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.