Ir para conteúdo principal Pular para conteúdo complementar

Engenharia automática de recursos

Com a engenharia automática de recursos, o Qlik Predict pode usar recursos existentes em seus dados de treinamento para criar novos recursos. Esses novos recursos de engenharia automática permitem descobrir novos padrões em seus dados e podem melhorar muito o desempenho de seus modelos de aprendizado de máquina. O Qlik Predict suporta engenharia de recursos de data e engenharia de recursos de texto livre.

Plano de fundo

A engenharia de recursos é o processo de criação de novas colunas de recursos a partir das atuais. O Qlik Predict pode realizar engenharia de recursos automaticamente para melhorar o manuseio de determinados tipos de dados. Para obter informações gerais sobre engenharia de recursos, consulte Criando novas colunas de recursos.

Identificando quando a engenharia de recursos automática é possível

Depois de selecionar um conjunto de dados para uso em seu experimento, o conjunto de dados é analisado e as colunas dentro dele são identificadas como contendo determinados tipos de dados. Esses tipos de dados permitem que o Qlik Predict atribua um tipo de recurso a cada coluna do conjunto de dados. Cada coluna recebe um dos seguintes tipos de recursos:

  • Categórico

  • Numérico

  • Data

  • Texto livre

Quando possível, o Qlik Predict exibe uma lista de recursos de engenharia automática que podem ser criados a partir de recursos pai qualificados. Esta lista de recursos de engenharia automática é ainda mais refinada e reduzida à medida que o pré-processamento começa. A inclusão de recursos de engenharia automática em seu experimento é recomendada, mas é opcional. Você pode remover recursos individuais de engenharia automática antes de iniciar o treinamento e ao configurar cada nova versão do experimento.

Para obter mais informações sobre os processos concluídos antes do início do treinamento experimental, consulte Preparação e transformação automática de dados.

Engenharia de recursos de data

Quando colunas de data e de data e hora são detectadas nos seus dados de treinamento, novos recursos de data podem ser criados automaticamente a partir dessas colunas. Para obter mais informações, consulte Engenharia de recursos de data.

Tratamento de texto livre

O tratamento especial de dados de texto livre é suportado ao treinar modelos. Para obter mais informações, consulte Tratamento de dados de texto livre.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo – um erro de digitação, uma etapa ausente ou um erro técnico – avise-nos!