Ir para conteúdo principal Pular para conteúdo complementar

Noções básicas sobre o aprendizado de máquina

Aprendizado de máquina é a prática de usar algoritmos matemáticos para reconhecer padrões em dados e, em seguida, use esses padrões para fazer previsões.

Um exemplo simples: Prevendo vendas

Para entender melhor o aprendizado de máquina, vejamos um exemplo simples que prevê as vendas de um produto no próximo trimestre. Podemos saber que as vendas deste produto são afetadas por quanto dinheiro é gasto com publicidade do produto. Observando os dados dos trimestres anteriores, sabemos:

  • Quanto dinheiro é gasto (em milhares de dólares) com publicidade do produto na televisão.

  • De quanto foram as vendas (em milhões de dólares).

Quando plotamos os dados, fica óbvio que, quanto mais dinheiro se gasta anunciando nosso produto na televisão, mais vendemos.

Gráfico de vendas versus gastos com publicidade na televisão

Gráfico de vendas versus gastos com publicidade na televisão.

Para prever a receita de vendas durante o próximo trimestre de negócios, podemos ajustar uma função aos dados históricos:

Uma função linear é ajustada aos dados

Gráfico de vendas versus gastos com publicidade na televisão com uma função linear.

Com base na quantia de dinheiro que orçamos para gastar em publicidade televisiva durante o próximo trimestre comercial, podemos avaliar a função pelo valor correspondente a essa quantia. Digamos que estamos planejando gastar US$ 225.000 em publicidade na televisão no próximo trimestre. Avaliar a função em 225 nos dá 17,7, e podemos prever US$ 17,7 milhões em vendas para o próximo trimestre.

A função é avaliada para prever vendas para um valor específico gasto em publicidade

Gráfico de vendas versus gastos com publicidade na televisão avaliando um ponto em uma função linear.

Para aumentar ainda mais a exatidão de nossa previsão, podemos tentar encontrar uma função que melhor se ajuste aos dados históricos — conforme mostrado na figura — e fazer previsões com base nessa função.

Uma função que se ajusta melhor aos dados

Gráfico de vendas versus gastos com publicidade na televisão com uma função não linear.

Neste exemplo, examinamos apenas a quantidade de dinheiro gasto com publicidade na televisão. Poderíamos também considerar outros fatores que influenciam as vendas futuras. Em vez de ter as vendas como uma função apenas dos gastos com publicidade na televisão, poderíamos, por exemplo, ter as vendas como uma função das três variáveis: gastos com publicidade na televisão, gastos com publicidade no rádio e gastos com publicidade em jornais. Podemos usar quantas variáveis quisermos, mas a ideia geral é a mesma.

Conceitos de aprendizado de máquina

Do ponto de vista dos dados, o problema de aprendizado de máquina é reduzido à compilação de uma tabela com dados históricos. Temos uma coluna na tabela que representa o que queremos prever, que em nosso exemplo anterior foram as vendas. Na linguagem de aprendizado de máquina, essa coluna é chamada de alvo. As outras colunas são chamadas de recursos e são usadas para prever o valor da coluna alvo. Os recursos são variáveis que podem potencialmente contribuir para o resultado desejado. A ideia fundamental por trás do aprendizado de máquina é:

Dado um conjunto de dados, encontramos uma função que ajusta esses dados para que possamos prever qual será o valor da coluna alvo, dados os valores das colunas de recursos.

Vários algoritmos sofisticados de aprendizado de máquina foram desenvolvidos para resolver diferentes tipos de problemas de aprendizado de máquina. Quando alimentamos dados para um algoritmo de aprendizado de máquina e o deixamos aprender padrões, dizemos que estamos treinando um algoritmo de aprendizado de máquina.

Os problemas de aprendizado de máquina são divididos em problemas de regressão ou problemas de classificação, dependendo se o alvo que queremos prever é um valor numérico ou categórico. Veja exemplos em Problemas de classificação e em Problemas de regressão.

Aprendizado de máquina automatizada

Com aprendizado de máquina automatizado, as melhores funções de ajuste são encontradas automaticamente durante o treinamento sobre seus dados históricos. Você pode facilmente carregar um conjunto de dados, selecionar um alvo e, em seguida, iniciar o treinamento apertando um botão.

No entanto, você só obterá uma boa saída preditiva se tiver uma boa entrada. Um experimento de aprendizado de máquina precisa de uma pergunta de aprendizado de máquina bem definida e um conjunto de dados projetado para responder a essa pergunta. Para começar seu primeiro experimento, siga estas etapas:

  1. Defina uma pergunta de aprendizado de máquina

    Transforme seu caso de uso de negócios em uma pergunta específica usando um framework estruturado.

    Definindo perguntas de aprendizado de máquina

  2. Prepare seu conjunto de dados de treinamento

    Colete dados de boa qualidade que sejam relevantes para seu caso de uso.

    Preparando seu conjunto de dados para o treinamento

  3. Crie um experimento de aprendizado de máquina automatizado

    Quando os preparativos estiverem prontos, você pode começar a experimentar.

    Trabalhando com experimentos

APRENDIZADO RELACIONADO:

Saiba mais

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!