Engenharia automática de recursos
Com a engenharia automática de recursos, o Qlik Predict pode usar recursos existentes em seus dados de treinamento para criar novos recursos. Esses novos recursos de engenharia automática permitem descobrir novos padrões em seus dados e podem melhorar muito o desempenho de seus modelos de aprendizado de máquina. O Qlik Predict suporta engenharia de recursos de data e engenharia de recursos de texto livre.
Plano de fundo
A engenharia de recursos é o processo de criação de novas colunas de recursos a partir das atuais. O Qlik Predict pode realizar engenharia de recursos automaticamente para melhorar o manuseio de determinados tipos de dados. Para obter informações gerais sobre engenharia de recursos, consulte Criando novas colunas de recursos.
Identificando quando a engenharia de recursos automática é possível
Depois de selecionar um conjunto de dados para uso em seu experimento, o conjunto de dados é analisado e as colunas dentro dele são identificadas como contendo determinados tipos de dados. Esses tipos de dados permitem que o Qlik Predict atribua um tipo de recurso a cada coluna do conjunto de dados. Cada coluna recebe um dos seguintes tipos de recursos:
-
Categórico
-
Numérico
-
Data
-
Texto livre
Quando possível, o Qlik Predict exibe uma lista de recursos de engenharia automática que podem ser criados a partir de recursos pai qualificados. Esta lista de recursos de engenharia automática é ainda mais refinada e reduzida à medida que o pré-processamento começa. A inclusão de recursos de engenharia automática em seu experimento é recomendada, mas é opcional. Você pode remover recursos individuais de engenharia automática antes de iniciar o treinamento e ao configurar cada nova versão do experimento.
Para obter mais informações sobre os processos concluídos antes do início do treinamento experimental, consulte Preparação e transformação automática de dados.
Engenharia de recursos de data
Quando colunas de data e de data e hora são detectadas nos seus dados de treinamento, novos recursos de data podem ser criados automaticamente a partir dessas colunas. Para obter mais informações, consulte Engenharia de recursos de data.
Tratamento de texto livre
O tratamento especial de dados de texto livre é suportado ao treinar modelos. Para obter mais informações, consulte Tratamento de dados de texto livre.