Ir para conteúdo principal Pular para conteúdo complementar

Definindo perguntas de aprendizado de máquina

Transformar um caso de uso de negócios em uma questão de aprendizado de máquina específica e acionável pode ser um desafio. Siga um framework estruturado para evitar armadilhas comuns e gerar um bom modelo preditivo.

O framework descreve como definir uma questão de aprendizado de máquina e como coletar um conjunto de dados bem estruturado e pronto para ser usado. Para obter mais informações sobre como preparar um conjunto de dados, consulte Preparando seu conjunto de dados para o treinamento.

O framework consiste em quatro partes:

  • Gatilho de evento

  • Alvo

  • Recursos

  • Ponto de previsão

Gatilho de evento

O gatilho de evento é uma ação ou evento que aciona a criação de novas previsões. Cada gatilho de evento corresponde a uma única linha de dados.

Alvo

O alvo é o valor que você está tentando prever. Deve ser específico tanto em como você define o valor — o resultado — quanto o período pelo qual o valor é determinado: o horizonte. A definição do resultado e do horizonte depende do contexto de negócios, bem como dos dados disponíveis. Certifique-se de que o alvo seja relevante para o contexto de negócios e pense em qual ação deseja executar com os valores previstos.

O alvo é representado em uma única coluna no conjunto de dados que você usa para treinar os algoritmos de aprendizado de máquina.

Recursos

Os recursos são as outras colunas em seu conjunto de dados que são usadas para prever um valor alvo. São suas hipóteses sobre quais variáveis influenciarão o alvo. Os algoritmos de aprendizado de máquina usam os recursos para aprender padrões gerais durante o treinamento e fazer previsões para novas linhas de dados.

As colunas de recursos compõem a maior parte do conjunto de dados de treinamento, em que cada recurso é representado como uma única coluna. Os recursos devem ser agregados no nível do gatilho de evento ou superior.

Podem ser fixos, o que significa que eles são conhecidos antes ou no gatilho de evento, ou dependentes da janela, o que significa que os dados são coletados após o gatilho de evento, mas antes do ponto de previsão.

Ponto de previsão

O ponto de previsão é o tempo designado quando você para de coletar dados para recursos e prevê o alvo para cada linha. Decidir onde o ponto de previsão deve cair é um equilíbrio entre exatidão — prever tarde o suficiente para coletar dados de recursos de qualidade — e capacidade de ação — prever com antecedência suficiente para agir a fim de afetar o resultado.

O tempo entre o gatilho de evento e o ponto de previsão é a janela de acúmulo de dados. Esse é o tempo usado para coletar dados de recursos. O tempo entre o ponto de previsão e o horizonte é a janela de ação, que é o tempo usado para agir sobre o que foi previsto. O ponto de previsão pode cair em qualquer lugar entre o gatilho de evento e o horizonte alvo.

Exemplos: Framework estruturado

Os exemplos a seguir mostram como o framework estruturado pode ser usado em diferentes casos de uso de negócios. Para obter um exemplo detalhado em que o framework é aplicado passo a passo, consulte Aplicando o framework estruturado: Exemplo de rotatividade de clientes.

Valor vitalício do cliente

  • Gatilho de evento: Um cliente faz seu primeiro pedido

  • Alvo: Valor total do pedido nos primeiros três anos

    • Resultado numérico: Valor em dólares

    • O horizonte é baseado na duração média do ciclo de vida do cliente

  • Recursos: Origem do lead, Valor do primeiro pedido, Desconto usado no primeiro pedido (Sim ou Não), Estado do envio, Região do envio, Número de produtos no primeiro pedido

  • Ponto de previsão: Três meses após o primeiro pedido

  • Pergunta de aprendizado de máquina: "Prevendo três meses após o primeiro pedido de um cliente, qual será o valor total do pedido em dólares nos próximos 33 meses"

Recompra do cliente

  • Gatilho de evento: Um cliente faz um pedido

  • Alvo: Outro pedido é feito dentro de seis meses

    • Resultado binário: Sim ou Não

    • O horizonte determinado pelos dados de que 90% dos clientes que recompram o fazem em seis meses ou menos

  • Recursos: Origem do tráfego, Número de pedidos anteriores, Desconto usado, Estado do envio, Região do envio, Número de produtos solicitados, E-mail de notificação de envio aberto (Sim ou Não), Devolvido ao site em 10 dias, Inscrito para receber e-mails de marketing (Sim ou Não)

  • Ponto de previsão: Uma semana após o pedido

  • Pergunta de aprendizado de máquina: "Prevendo uma semana após um cliente fazer um pedido, ele fará o pedido novamente dentro de seis meses"

Conversão de leads de vendas

  • Gatilho de evento: Um lead de vendas é criado

  • Alvo: Converte para ganho fechado dentro de 12 meses a partir da criação

    • Resultado binário: Sim ou Não

    • O horizonte baseado na duração histórica do ciclo de vendas

  • Recursos: Origem do lead, Setor, Tamanho da empresa, Número de pontos de contato nos primeiros 30 dias, Reunião agendada em 30 dias (Sim ou Não), Número de telefone preciso (Sim ou Não)

  • Ponto de previsão: 30 dias após a criação do lead

  • Pergunta de aprendizado de máquina: "Prevendo 30 dias após a criação de um lead, esse lead será convertido em uma oportunidade de ganho fechado nos próximos 11 meses"

Formatura do aluno

  • Gatilho de evento: Um aluno é aceito

  • Alvo: O aluno se forma dentro de seis anos a partir do início do programa

    • Resultado binário: Sim ou Não

    • O horizonte é baseado na duração histórica do tempo para se formar

  • Recursos: Tipo de ensino médio, GPA do ensino médio, Pontuação SAT/ACT, Pontuações do exame de nivelamento, Distância do ensino médio até o campus matriculado, Nível da bolsa de estudos, Nível de escolaridade dos pais, GPA do primeiro semestre, Número de créditos do primeiro semestre

  • Ponto de previsão: Fim do primeiro semestre matriculado

  • Pergunta de aprendizado de máquina: "Prevendo no final do primeiro semestre, um aluno se formará no final do sexto ano"

Vendas por mês

  • Gatilho de evento: Primeiro dia do mês

  • Alvo: Vendas em unidades durante o mês

    • Resultado numérico: Número de unidades vendidas

    • O horizonte é baseado no mês do calendário

  • Recursos: Tipo de produto, Nome do mês, Trimestre, Vendas do ano passado no mesmo mês, Vendas de dois anos anteriores no mesmo mês, Vendas do mês anterior, % de desconto médio, Gastos com marketing

  • Ponto de previsão: Primeiro dia do mês

  • Pergunta de aprendizado de máquina: "Prevendo no primeiro dia do mês, qual será o total de vendas unitárias até o final do mês"

Saiba mais

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!