Saltar al contenido principal Saltar al contenido complementario

Comprender el aprendizaje automático

El aprendizaje automático o Machine Learning es la práctica de utilizar algoritmos matemáticos para reconocer patrones en los datos y luego usar esos patrones para hacer predicciones.

Un ejemplo sencillo: Predecir ventas

Para comprender mejor el aprendizaje automático, veamos un ejemplo simple que predice las ventas de un producto durante el próximo trimestre. Es posible que sepamos que las ventas de este producto se ven afectadas por la cantidad de dinero que se gasta en publicidad del producto. Mirando los datos de trimestres anteriores sabemos:

  • Cuánto dinero se gasta (en miles de dólares) publicitando el producto en televisión.

  • Cuáles fueron las ventas (en millones de dólares).

Cuando graficamos los datos, es obvio que cuanto más dinero se gasta publicitando nuestro producto en televisión, más vendemos.

Gráfica de ventas versus inversión publicitaria en televisión

Gráfica de ventas versus inversión publicitaria en televisión.

Para predecir los ingresos de ventas durante el próximo trimestre, podemos ajustar una función a los datos históricos:

Una función lineal se ajusta a los datos.

Gráfica de ventas versus inversión publicitaria en televisión con una función lineal.

Basándonos en la cantidad de dinero que hemos presupuestado para gastar en publicidad televisiva durante el próximo trimestre, podemos evaluar la función en el valor correspondiente a esta cantidad. Supongamos que planeamos gastar 225.000 $ en publicidad televisiva el próximo trimestre. Evaluar la función en 225 nos da 17,7 y podemos pronosticar 17.700 $ millones en ventas para el próximo trimestre.

La función se evalúa para pronosticar las ventas de una cantidad específica gastada en publicidad.

Gráfica de ventas versus gasto en publicidad televisiva evaluando un punto en una función lineal.

Para mejorar aún más la precisión de nuestra predicción, podemos intentar encontrar una función que se ajuste mejor a los datos históricos, como se muestra en la figura, y hacer predicciones basadas en esta función.

Una función que se ajusta mejor a los datos.

Gráfica de ventas versus inversión publicitaria en televisión con una función no lineal.

En este ejemplo, hemos observado únicamente la cantidad de dinero invertido en publicidad televisiva. También podríamos considerar otros factores que influyen en las ventas futuras. En lugar de tener las ventas como una función únicamente de la inversión publicitaria en televisión, podríamos, por ejemplo, establecer las ventas como una función de las tres variables de inversión publicitaria en televisión, inversión publicitaria en radio y inversión publicitaria en periódicos. Podemos usar tantas variables como queramos, pero la idea general es siempre la misma.

Conceptos del aprendizaje automático

Desde una perspectiva de datos, el problema del aprendizaje automático se reduce a compilar una tabla con datos históricos Tenemos una columna en la tabla que representa lo que queremos predecir, que en nuestro ejemplo anterior eran las ventas. En el lenguaje del aprendizaje automático, esta columna se denomina objetivo. Las otras columnas se denominan características y se utilizan para predecir el valor de la columna objetivo. Las características son variables que potencialmente pueden contribuir al resultado objetivo. La idea fundamental tras el aprendizaje automático es:

Dado un conjunto de datos, encontramos una función que se ajusta a esos datos para que podamos predecir cuál será el valor de la columna de destino dados los valores de las columnas de características.

Se han desarrollado varios algoritmos sofisticados de aprendizaje automático para resolver diferentes tipos de problemas de aprendizaje automático. Cuando alimentamos datos a un algoritmo de aprendizaje automático y dejamos que aprenda patrones, decimos que estamos entrenando un algoritmo de aprendizaje automático.

Los problemas de aprendizaje automático se dividen en problemas de regresión o problemas de clasificación, dependiendo de si el objetivo que queremos predecir es un valor numérico o categórico. Vea ejemplos de esto en Problemas de clasificación y Problemas de regresión.

Aprendizaje automático automatizado

Con el aprendizaje automático automatizado, las características que mejor se ajustan se encuentran automáticamente durante el entrenamiento en sus datos históricos. Puede cargar fácilmente un conjunto de datos, seleccionar un objetivo y luego comenzar el entrenamiento con solo pulsar un botón.

Sin embargo, solo obtendrá un buen resultado predictivo si tiene una buena entrada. Un experimento de aprendizaje automático necesita una pregunta de aprendizaje automático bien definida y un conjunto de datos diseñado para responder a esa pregunta. Para comenzar con su primer experimento, siga estos pasos:

  1. Defina una pregunta de aprendizaje automático

    Convierta su caso de uso empresarial en una pregunta específica utilizando un marco estructurado.

    Definir las preguntas de aprendizaje automático

  2. Prepara tu conjunto de datos de entrenamiento

    Recopile datos de buena calidad que sean relevantes para su caso de uso.

    Cómo preparar su conjunto de datos para el entrenamiento

  3. Crear un experimento de aprendizaje automático automatizado

    Cuando terminen los preparativos, puede comenzar a experimentar.

    Trabajar con experimentos

APRENDIZAJE RELACIONADO:

Más información

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.