Ir para conteúdo principal Pular para conteúdo complementar

Criando novas colunas de recursos

A engenharia de recursos é o processo de criação de novas colunas de recursos a partir das atuais. Ela pode ajudá-la a obter poder preditivo adicional dos dados de origem que você coletou para responder a uma pergunta de negócios.

Por exemplo, o endereço de um cliente seria excluído dos dados de treinamento devido à alta cardinalidade. Em vez de usar o endereço, poderíamos projetar uma coluna de distância. Se conhecermos o endereço do cliente junto com várias localizações de lojas, as distâncias até as lojas podem ser calculadas. As novas colunas terão um valor numérico que pode ser usado para descobrir padrões mensuráveis nos dados.

Você pode realizar engenharia de recursos em seu conjunto de dados em preparação para uso no AutoML. Além disso, o AutoML sugere novos recursos que podem ser gerados automaticamente a partir de recursos existentes.

Novas colunas para distâncias a diferentes lojas

Tabela com dados de amostra.

Revise os recursos em seu conjunto de dados para determinar possíveis problemas que possam existir ou melhorias que possam ser feitas. A engenharia de bons recursos requer habilidade e experiência em negócios. Você deseja que os recursos sejam expressos de forma que estejam diretamente vinculados à coluna alvo.

Coisas a considerar:

  • O tempo deve ser fatorado no recurso?

  • A taxa de variação é importante?

  • Um recurso deve ser normalizado para levar em conta as diferenças entre subconjuntos de dados?

  • Valores nulos significam alguma coisa?

Recursos de engenharia automática

Com a engenharia automática de recursos, novos recursos são criados automaticamente a partir dos existentes.

O AutoML gera recursos de engenharia automática a partir de colunas que contêm informações de data e hora. Esses novos recursos separam cada componente dos valores da coluna em seus próprios recursos.

Além disso, o processamento especial pode ser aplicado a colunas que contenham texto livre. Os recursos originais de texto livre são transformados em novos recursos para melhorar o treinamento do modelo.

Os recursos de engenharia automática melhoram o valor preditivo e analítico dos seus modelos à medida que você os treina. Para obter mais informações, consulte Engenharia automática de recursos.

Exemplos: Recursos de engenharia

Use os exemplos a seguir para começar o brainstorming sobre como projetar recursos que possam aprimorar a natureza preditiva de seus dados.

Uma oportunidade de vendas será fechada?

A coluna alvo indica se a oportunidade de venda foi fechada (Sim ou Não).

  • Recurso original: Número de reuniões

  • Recursos alternativos: Reuniões por mês ou número de reuniões em um estágio específico

Transformar a medida em frequência de reunião explica melhor a mudança. Medir as reuniões em um estágio específico do processo de vendas expressa melhor o ímpeto de vendas e explica o ciclo.

Prever o valor de uma transação futura

A coluna alvo é o valor da próxima transação.

  • Recurso original: Valor do último pedido

  • Recursos alternativos: O valor médio do pedido ou a alteração percentual no valor do pedido

O valor médio fornece uma visão mais ampla do comportamento do pedido. A mudança no padrão de compra fornece um valor normalizado.

Um cliente vai cancelar?

A coluna alvo é se o cliente irá cancelar (Sim ou Não).

  • Recurso original: Sentimento do cliente

  • Recursos alternativos: Mudança no sentimento do cliente ou no número de dias com o sentimento atual

Medir a mudança no sentimento tem mais chances de levar à ação. O número de dias dá a duração do estado atual.

Um funcionário se demitirá voluntariamente?

A coluna alvo é se um funcionário será demitido (Sim ou Não).

  • Recurso original: Salário

  • Recursos alternativos: Salário em comparação com colegas ou salário em comparação com a média do setor

A comparação do salário com os colegas se alinha melhor à experiência ou sentimento do funcionário. A comparação com o salário médio do setor se alinha melhor ao custo de oportunidade do funcionário.

Um lead se converterá em uma oportunidade?

A coluna alvo é se um lead será convertido (Sim ou Não).

  • Recurso original: Como você nos encontrou?

  • Recursos alternativos: Respondido (Sim ou Não)

A ação é o que importa aqui e não qual foi a resposta. Observe que, neste caso, nulos significam algo: inação.

Datas

Com a funcionalidade automática de engenharia de recursos do AutoML, os componentes de datas e carimbos de data/hora são analisados automaticamente em colunas separadas.

As datas também podem ser projetadas de muitas outras maneiras para criar vários recursos em um conjunto de dados, como:

  • Agregue as datas em temporadas, trimestres ou semestres.

  • Calcule a diferença de datas, por exemplo, número de dias desde a última compra.

APRENDIZADO RELACIONADO:

Saiba mais

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!