Saltar al contenido principal Saltar al contenido complementario

Aplicar el marco estructurado: Ejemplo de abandono de clientes

Este ejemplo le guiará a través del proceso de definición de una pregunta de aprendizaje automático paso a paso. Aprenderá cómo combinar el conocimiento empresarial con el marco de activación de eventos, objetivo, punto de predicción y características para estructurar una pregunta bien definida.

El punto de partida es el caso de negocio "¿Se perderá un cliente?". Utilizando el marco estructurado, reduciremos esto a algo más específico que pueda predecirse mediante un algoritmo de aprendizaje automático.

Disparador de eventos

El disparador de eventos es una acción o evento que inicia la creación de una nueva predicción. Identificamos nuestro disparador de eventos como "un cliente se ha registrado para una suscripción". Esto se representa en los datos como: se crea un nuevo cliente. Queremos predecir a nivel de cliente si abandonarán, por lo que cada fila debe representar a un solo cliente.

Usando nuestro conocimiento de negocio y confirmando al verificar los datos, sabemos que el abandono es más alto entre nuevos clientes. Por lo tanto, decidimos centrarnos específicamente en nuevos clientes. El disparador de eventos es que se registre un nuevo cliente y podemos pensar que cada cliente tiene una línea de tiempo individual que comienza el día en que se inscribe.

El disparador del evento es cuando un nuevo cliente se suscribe. La línea horizontal representa el número de días desde que se suscribió.

Cronología para un nuevo cliente.

Objetivo

El objetivo es el resultado que tratamos de predecir. Deseamos predecir el abandono, por lo que sabemos que nuestro objetivo general es "¿Abandonará un cliente?". Pero para crear un modelo de aprendizaje automático de calidad necesitamos ser más específicos. Para empezar, decidimos que "abandono" significa que un cliente nos llama para cancelar su suscripción.

El resultado objetivo es cuando un cliente llama para cancelar su suscripción.

Cronología del cliente con un objetivo.

A continuación, decidimos el marco temporal (el horizonte) en el que se tiene que realizar esa llamada de cancelación. Al observar varios clientes que han cancelado, vemos que la cronología en el tiempo no es sistemática. Algunos clientes cancelan a los 45 días y otros mucho más tarde, a los 110 días.

Días que transcurren desde la suscripción hasta que el cliente llama para cancelar su suscripción. Cada línea representa a un cliente diferente.

Líneas de tiempo que muestran el número de días antes de que los clientes cancelen.

Tenemos un programa de prueba gratuita de 90 días y sabemos que muchos clientes abandonan la prueba. Basándonos en este contexto empresarial, nuestra idea inicial es utilizar un horizonte de 90 días. Al predecir quién se espera que cancele, planeamos llegar a esos clientes con antelación y ofrecerles incentivos (como descuentos o características adicionales de suscripción) para animarles a quedarse.

Un histograma de cuántos días después de darse de alta han cancelado los clientes confirma nuestra intuición comercial. En la figura podemos ver los datos de todos los clientes que han cambiado de proveedor en los últimos tres años.

Distribución de las llamadas de cancelación en función del número de días transcurridos desde la suscripción. La mayoría de las cancelaciones se producen alrededor de 90 días después de que un cliente se suscriba.

Histograma que muestra el número de días antes de que los clientes cancelen.

Elegir un horizonte de 90 días parece un buen punto de partida. Sin embargo, cuando trazamos ese horizonte en nuestro histograma nos damos cuenta de que hay muchos clientes que siguen abandonando durante unos días después del periodo de prueba de 90 días. El motivo puede ser que ven cómo se realiza el cargo en su tarjeta de crédito o reciben un aviso de que su método de pago ha sido rechazado unos días después y sólo entonces llaman para cancelar su suscripción.

Un horizonte a 90 días de la suscripción

Histograma con un horizonte de 90 días marcado.

Como queremos incluir a estos clientes en el grupo de "abandono" en nuestro modelo, decidimos que tiene más sentido utilizar 110 días como horizonte objetivo. Al utilizar 110 días, captamos a la mayoría de los clientes cuyo abandono está probablemente relacionado con el programa de prueba gratuita.

Un horizonte a 110 días de la suscripción

Histograma con un horizonte de 110 días marcado.

Ahora que hemos definido nuestro objetivo, podemos determinar dónde se almacenan los datos y cómo hay que limpiarlos para crear la columna objetivo en el conjunto de datos. En este ejemplo haremos lo siguiente:

  1. Extraiga el estado del cliente de Salesforce.

  2. Extraiga el estado, la fecha de creación del cliente y la fecha de cancelación del cliente:

    Tabla con datos de muestra.

  3. Limpie y transforme los datos extraídos en la columna de destino:

    Tabla con datos de muestra.

Ahora hemos definido nuestro disparador de eventos (un nuevo cliente registrado) y nuestro objetivo (el cliente llamó para cancelar su suscripción dentro de los 110 días posteriores a la suscripción). Se ilustran en la línea de tiempo de la figura.

El evento desencadenante es cuando un nuevo cliente se suscribe (1), el resultado objetivo es cuando el cliente llama para cancelar (2) y el horizonte objetivo es 110 días después de suscribirse (3).

Línea de tiempo que muestra el desencadenante del suceso, el objetivo y el horizonte objetivo.

Punto de predicción

El punto de predicción es el momento designado en el que se dejan de recoger datos para las características y se predice el objetivo de cada fila. El punto de predicción puede situarse en cualquier punto entre el evento desencadenante (el día de la suscripción) y el horizonte objetivo (el día 110 después de la suscripción). Para elegir un punto de partida podemos pensar en la acción que queremos emprender.

En nuestro ejemplo, puede que el equipo de atención al cliente haya pedido 30 días para ponerse en contacto con los clientes con ofertas de retención una vez que se haya pronosticado la rotación de clientes. Esto significa que, como muy tarde, querríamos predecir 30 días antes del horizonte objetivo, es decir, antes del día 80.

El punto de predicción (2) se fija en el día 80, entre el evento desencadenante (1) y el horizonte objetivo (3).

Línea de tiempo que muestra el punto de predicción.

Si elegimos el día 80 como punto de predicción, dispondremos de 80 días para recopilar datos sobre los nuevos clientes a medida que vayan llegando. Este lapso de tiempo entre el desencadenamiento del suceso y el punto de predicción se denomina ventana de acumulación de datos. Los datos recopilados durante la ventana de acumulación de datos se utilizan para generar características.

La ventana de acumulación de datos es el tiempo transcurrido entre el desencadenante del evento y el punto de predicción.

Línea de tiempo que muestra la ventana de acumulación de datos entre el evento desencadenante y el punto de predicción.

Utilizar el día 80 como punto de predicción deja una ventana de acción de 30 días, que es el tiempo entre el punto de predicción y el horizonte objetivo. Este es el plazo de 30 días que el equipo de atención al cliente solicitó para ponerse en contacto con los clientes.

La ventana de acción es el tiempo transcurrido entre el punto de predicción y el horizonte objetivo.

Línea de tiempo que muestra la ventana de acumulación de datos entre el punto de predicción y el horizonte.

Además de pensar en la ventana de acción mínima necesaria para tomar medidas sobre las predicciones, también tenemos que fijarnos en el histograma de días hasta el abandono. Aplicando el punto de predicción del día 80, obtendríamos lo siguiente:

La distribución de las llamadas de cancelación con la ventana de acumulación de datos y la ventana de acción.

Histograma con el punto de predicción y el horizonte marcados.

Observando este histograma nos damos cuenta de que utilizar un punto de predicción del día 80 no consigue maximizar el valor comercial. Aunque 80 días de datos ayudan a aumentar la precisión del modelo, tienen un alto coste para nuestra capacidad de actuación:

  • En primer lugar, muchos clientes ya se han dado de baja el día 80, por lo que lo habrán hecho durante el periodo de acumulación de datos, antes incluso de que hagamos ninguna predicción. Esto también significa que no querríamos incluirlos en nuestro conjunto de datos de entrenamiento porque conoceríamos el resultado antes de hacer la predicción.

  • En segundo lugar, muchos clientes dejan de serlo en torno a los 80 o 90 días, por lo que el equipo de éxito del cliente no dispondría de los 30 días para ponerse en contacto con ellos.

Los clientes que cancelaron su suscripción antes del punto de predicción no se incluirán en los datos de entrenamiento.

Histograma que muestra la proporción de clientes que abandonaron antes del punto de predicción.

Trasladar el punto de predicción al día 60 ofrece un mejor equilibrio entre precisión y capacidad de actuación. Aún nos quedan 60 días para recopilar datos que utilizaremos para las características de nuestro modelo, pero ahora estamos prediciendo con suficiente antelación como para que el equipo de éxito del cliente tenga 30 días para ponerse en contacto con la mayoría de los clientes que predecimos que abandonarán. Al reducir la ventana de acumulación de datos, podemos esperar una pequeña disminución de la precisión del modelo, pero una predicción mucho más útil.

Desplazar el punto de predicción al día 60 acorta la ventana de acumulación de datos pero nos da una ventana de acción más larga. Excluye a menos clientes de los datos de entrenamiento del modelo.

Histograma con un punto de predicción anterior en el tiempo y una ventana de acción más larga.

Características

Una vez definidos el disparador del evento, el objetivo y el punto de predicción, estamos listos para añadir la parte final a nuestro conjunto de datos: las características. Las características son los atributos conocidos, u observaciones, de cada fila de datos del conjunto de datos de entrenamiento a partir de los cuales los algoritmos de aprendizaje automático aprenden patrones generales. A continuación, los algoritmos utilizan las características para hacer predicciones cuando se les presenta una nueva fila de datos en el conjunto de datos aplicado.

Piense en las características como sus hipótesis basadas en el conocimiento empresarial sobre lo que influye en el resultado. En nuestro ejemplo, algunas características podrían ser la ubicación del cliente, la fuente de clientes potenciales, el mes de registro, el número de inicios de sesión o el número de usuarios activos.

Hay dos tipos de características:

  • Características fijas son las más sencillas porque no cambian con el tiempo. En nuestro ejemplo, la ubicación geográfica del cliente (en el momento del registro), el origen del cliente potencial y el mes del registro se consideran características fijas. Se conocen tan pronto como un cliente se registra (justo en el disparador desencadenante del evento) y no importa dónde pongamos nuestro punto de predicción, serán conocidos y constantes.

  • Características dependientes de la ventana son algo más complicadas. Son las características que se recogen a partir de la información recopilada entre el desencadenante del suceso y el punto de predicción. Es importante asegurarse de que sólo se utilizan datos que se conocerán a tiempo, de lo contrario el modelo podría tener fugas de datos. (Para más información, vea Fuga de datos.)

Un modelo simple solo puede usar información conocida en el día 0, es decir, solo características fijas. Esto daría un punto de predicción en el día 0, como se indica en la figura.

Con un punto de predicción en el día 0, tenemos 0 días para recopilar datos y solo podemos usar características fijas que se conocen en el día 0. La ventana de acción es de 110 días completos.

Histograma con el punto de predicción en el día 0.

El conjunto de datos resultante se vería así:

Datos de entrenamiento con características fijas únicamente

Tabla con datos de muestra.

No obstante, también es posible que queramos usar los datos recopilados una vez que el cliente se haya suscrito, como en nuestro ejemplo con el punto de predicción en el día 60.

El punto de predicción en el día 60 nos da 60 días para recopilar datos y 50 días para tomar medidas.

Histograma con el punto de predicción en el día 60.

Ahora podemos usar la información recopilada durante los primeros 60 días después de que un cliente se registra para agregar características dependientes de la ventana a nuestro modelo. Nuestro conjunto de datos para este modelo podría parecerse a la siguiente tabla, que ahora incluye las características dependientes de la ventana Inicios de sesión los primeros 60 días y Usuarios activos a los 60 días.

Datos de muestra con características dependientes de la ventana

Tabla con datos de muestra.

Tenga en cuenta que en este ejemplo, las características reflejan la ventana de acumulación de datos completa. También pueden ser más reducidos. Por ejemplo, podríamos medir los inicios de sesión de los primeros 10 días o los inicios de sesión del día 30 al 60, siempre que las características no incluyan información más allá del punto de predicción.

Las características dependientes de la ventana pueden ser más complicadas de recopilar porque requieren fechas y necesitan un esfuerzo adicional para garantizar que se encuentren dentro de la ventana de acumulación de datos para evitar la fuga de datos. Pero también pueden ser algunas de las características más útiles porque pueden reflejar información recopilada mucho más cerca del momento de la predicción.

La pregunta de aprendizaje automático resultante

Comenzamos con la pregunta simple: "¿Abandonará un cliente?". Después definimos nuestro disparador de eventos como "Se registra un nuevo cliente" porque queríamos hacer predicciones a nivel de cliente individual.

Definimos nuestro objetivo con un resultado específico: "El cliente llamó para cancelar su suscripción (Sí o No)" y establecimos el horizonte en 110 días porque ese es el tiempo en el que la mayoría de nuestros clientes de prueba han cancelado.

Al observar un histograma que indica cuántos días después de registrarse llamaron los clientes para cancelar durante los últimos tres años, decidimos un punto de predicción de 60 días tras el registro. Esto nos daría 60 días para recopilar información (la ventana de acumulación de datos) antes de hacer nuestra predicción, pero aún le daría tiempo al equipo de atención al cliente para tomar medidas sobre las predicciones a fin de reducir el abandono.

Por último, recopilamos datos sobre los clientes que estarían disponibles antes del día 60 para generar las características.

Nuestra pregunta de aprendizaje automático resultante es: "Después de los primeros 60 días de actividad, ¿llamará un cliente para cancelar el día 110?"

Y el conjunto de datos, que ahora está listo para usarse para el aprendizaje automatizado, se parece a la tabla a continuación. La ubicación (Location), la fuente u origen del cliente potencial (Lead Source), el mes en que se unió (Month) y la cantidad de la suscripción (Amount) son características fijas, los Inicios de sesión los primeros 60 días y los Usuarios activos a los 60 días son características que dependen de la ventana y Abandono en 110 días es la columna objetivo.

Datos de muestra con características fijas (1), características dependientes de la ventana (2) y objetivo (3)

Tabla con datos de muestra.

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.