Ir para conteúdo principal Pular para conteúdo complementar

Criando modelos com reconhecimento de tempo

Com o treinamento com reconhecimento de tempo, você pode criar modelos equipados para prever dados ao longo de uma coluna baseada em tempo que existe em seus dados de treinamento. Ative o treinamento com reconhecimento de tempo se precisar fazer previsões em um destino que é conhecido por ser impactado por essa coluna baseada em tempo.

O treinamento com reconhecimento de tempo ajuda a reduzir o vazamento de dados aplicando processamento de dados especializado aos dados de treinamento. Esse processamento permite que algoritmos de aprendizado de máquina interpretem melhor os dados e o contexto preditivo, como dependentes de uma dimensão específica de data ou tempo.

Para treinar modelos com reconhecimento de tempo, você precisa de uma coluna em seu conjunto de dados de treinamento que contenha dados de data ou carimbo de data/hora. Essa coluna é o índice de datas que é usado para classificar o conjunto de dados antes do treinamento. Para obter mais informações sobre o índice de datas, consulte Requisitos do índice de datas.

Quando usar

O treinamento de modelo com reconhecimento de tempo é ideal para modelos que estão prevendo alterações em uma métrica de tempo que já está presente no treinamento. Por exemplo:

  • Você deseja prever suas vendas para o próximo mês e tem uma coluna Data da Transação em seu conjunto de dados.

  • Você deseja prever métricas sobre entregas de remessas atrasadas e tem uma coluna Data de Entrega em seu conjunto de dados.

Considerações

Dependendo do seu caso de uso, o treinamento de modelo com reconhecimento de tempo pode ajudar você a criar melhores modelos. Em outros casos, você poderá obter melhores resultados com o processo de treinamento padrão fornecido pelo AutoML. Geralmente, se seus dados dependem significativamente de uma coluna baseada em tempo específica, é recomendável usar o treinamento de modelo com reconhecimento de tempo.

No Qlik AutoML, o treinamento com reconhecimento de tempo não executa engenharia de recursos automatizada para gerar recursos defasados para problemas de séries temporais. Para casos de uso baseados em tempo que exigem engenharia de recursos, é recomendável que você execute qualquer engenharia de recursos necessária durante o estágio de preparação do conjunto de dados.

Como funciona o treinamento com reconhecimento de tempo

Um problema comum no aprendizado de máquina é encontrar uma maneira de garantir que os modelos sejam treinados apenas em informações que estariam disponíveis no momento do treinamento. Se seus dados de treinamento contiverem dados proeminentes e informações de tempo, essas informações podem ser usadas para ajudar a evitar vazamento de dados.

Requisitos do índice de datas

Para ativar o treinamento com reconhecimento de tempo, você precisa ter uma coluna no seu conjunto de dados que contenha as informações de data e hora das quais o treinamento do modelo depende. Você seleciona a coluna ao configurar a otimização do modelo para o treinamento.

Para usar uma coluna como índice de datas no seu treinamento, a coluna deve ter todos os seguintes:

  • Datas completas. Por exemplo, colunas que consistem em valores de mês ou dia não podem ser usadas.

  • O tipo de dados de data ou carimbo de data/hora.

  • O tipo de recurso de data.

Retenção e validação cruzada

Ao escolher como os dados são separados para o processo de retenção e de validação cruzada, métodos de seleção aleatória podem introduzir dados futuros no treinamento do modelo. Quando você ativa o treinamento com reconhecimento de tempo, o AutoML usa o seguinte processo:

  • O conjunto de dados de treinamento é classificado ao longo da coluna de índice selecionada antes de ser separado em dados de treinamento e retenção.

  • Cada iteração do treinamento usa um tamanho de teste fixo e um tamanho de treinamento que aumenta gradualmente. A cada iteração, os dados se tornam cada vez mais recentes.

Para detalhes completos, consulte Validação cruzada baseada em tempo.

Outro processamento

O treinamento de modelo com reconhecimento de tempo também usa outros processos que são diferentes dos processos de treinamento padrão. Por exemplo, o treinamento com reconhecimento de tempo usa um processo modificado para imputação nula. Para obter mais informações, consulte Inferência de nulos.

Ativando o treinamento com reconhecimento de tempo

O treinamento de modelo com reconhecimento de tempo pode ser ativado ou desativado, ou reconfigurado, para cada versão executada em um experimento.

  1. Em um experimento, clique em Esquema Exibir configuração.

  2. Se você já executou pelo menos uma versão do experimento, clique em Nova versão.

  3. No painel, expanda Otimização do modelo.

  4. Em Divisão do treinamento de teste baseada em tempo, selecione o Índice de dados a ser usado para classificar os dados.

Você pode alterar o treinamento com reconhecimento de tempo durante o refinamento do modelo. Por exemplo, você pode desativar a configuração ou selecionar uma nova coluna como índice de datas. Para obter mais informações, consulte Refinando modelos.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!