Noções básicas sobre o aprendizado de máquina
Aprendizado de máquina é a prática de usar algoritmos matemáticos para reconhecer padrões em dados e, em seguida, use esses padrões para fazer previsões.
Um exemplo simples: Prevendo vendas
Para entender melhor o aprendizado de máquina, vejamos um exemplo simples que prevê as vendas de um produto no próximo trimestre. Podemos saber que as vendas deste produto são afetadas por quanto dinheiro é gasto com publicidade do produto. Observando os dados dos trimestres anteriores, sabemos:
-
Quanto dinheiro é gasto (em milhares de dólares) com publicidade do produto na televisão.
-
De quanto foram as vendas (em milhões de dólares).
Quando plotamos os dados, fica óbvio que, quanto mais dinheiro se gasta anunciando nosso produto na televisão, mais vendemos.
Para prever a receita de vendas durante o próximo trimestre de negócios, podemos ajustar uma função aos dados históricos:
Com base na quantia de dinheiro que orçamos para gastar em publicidade televisiva durante o próximo trimestre comercial, podemos avaliar a função pelo valor correspondente a essa quantia. Digamos que estamos planejando gastar US$ 225.000 em publicidade na televisão no próximo trimestre. Avaliar a função em 225 nos dá 17,7, e podemos prever US$ 17,7 milhões em vendas para o próximo trimestre.
Para aumentar ainda mais a exatidão de nossa previsão, podemos tentar encontrar uma função que melhor se ajuste aos dados históricos — conforme mostrado na figura — e fazer previsões com base nessa função.
Neste exemplo, examinamos apenas a quantidade de dinheiro gasto com publicidade na televisão. Poderíamos também considerar outros fatores que influenciam as vendas futuras. Em vez de ter as vendas como uma função apenas dos gastos com publicidade na televisão, poderíamos, por exemplo, ter as vendas como uma função das três variáveis: gastos com publicidade na televisão, gastos com publicidade no rádio e gastos com publicidade em jornais. Podemos usar quantas variáveis quisermos, mas a ideia geral é a mesma.
Conceitos de aprendizado de máquina
Do ponto de vista dos dados, o problema de aprendizado de máquina é reduzido à compilação de uma tabela com dados históricos. Temos uma coluna na tabela que representa o que queremos prever, que em nosso exemplo anterior foram as vendas. Na linguagem de aprendizado de máquina, essa coluna é chamada de alvo. As outras colunas são chamadas de recursos e são usadas para prever o valor da coluna alvo. Os recursos são variáveis que podem potencialmente contribuir para o resultado desejado. A ideia fundamental por trás do aprendizado de máquina é:
Dado um conjunto de dados, encontramos uma função que ajusta esses dados para que possamos prever qual será o valor da coluna alvo, dados os valores das colunas de recursos.
Vários algoritmos sofisticados de aprendizado de máquina foram desenvolvidos para resolver diferentes tipos de problemas de aprendizado de máquina. Quando alimentamos dados para um algoritmo de aprendizado de máquina e o deixamos aprender padrões, dizemos que estamos treinando um algoritmo de aprendizado de máquina.
Os problemas de aprendizado de máquina são divididos em problemas de regressão ou problemas de classificação, dependendo se o alvo que queremos prever é um valor numérico ou categórico. Veja exemplos em Problemas de classificação e em Problemas de regressão.
Aprendizado de máquina automatizada
Com aprendizado de máquina automatizado, as melhores funções de ajuste são encontradas automaticamente durante o treinamento sobre seus dados históricos. Você pode facilmente carregar um conjunto de dados, selecionar um alvo e, em seguida, iniciar o treinamento apertando um botão.
No entanto, você só obterá uma boa saída preditiva se tiver uma boa entrada. Um experimento de aprendizado de máquina precisa de uma pergunta de aprendizado de máquina bem definida e um conjunto de dados projetado para responder a essa pergunta. Para começar seu primeiro experimento, siga estas etapas:
- Defina uma pergunta de aprendizado de máquina
Transforme seu caso de uso de negócios em uma pergunta específica usando um framework estruturado.
- Prepare seu conjunto de dados de treinamento
Colete dados de boa qualidade que sejam relevantes para seu caso de uso.
- Crie um experimento de aprendizado de máquina automatizado
Quando os preparativos estiverem prontos, você pode começar a experimentar.