Exemplo – Treinamento de modelos com aprendizado de máquina automatizado
Neste exemplo, você treinará modelos de aprendizado de máquina usando otimização de modelo inteligente. Com a otimização inteligente de modelos, o AutoML lida com o processo de iteração e refinamento dos seus modelos para você.
Para obter mais informações sobre otimização de modelo inteligente, consulte Otimização de modelo inteligente.
O que você aprenderá
Neste exemplo, você aprenderá:
-
Como criar e configurar um experimento de ML
-
Como a otimização inteligente pode fornecer refinamento automático do modelo
-
Como visualizar e analisar resultados de treinamento
Outras considerações
A otimização inteligente de modelos ajuda muito a refinar modelos com um conjunto de dados bem preparado. Para garantir que seus modelos sejam de alta qualidade em casos de uso do mundo real, é essencial que você comece seguindo a estrutura e prepare um conjunto de dados de treinamento com recursos e dados relevantes. Para obter mais informações, consulte:
A otimização inteligente de modelos pode ser desativada opcionalmente para cada versão do experimento. Ao desativar essa configuração, você está otimizando manualmente seus modelos. A otimização manual pode ser útil se você quiser fazer ajustes específicos na configuração do experimento. Você pode executar uma versão com otimização de modelo inteligente e, em seguida, desligá-la para fazer pequenos ajustes manuais, enquanto ainda se beneficia do refinamento automático que ela fornece.
Este exemplo abrange o treinamento de experimentos com otimização inteligente. Para um tutorial completo mostrando como usar a otimização manual, consulte Tutorial – Gerando e visualizando dados de previsão. O tutorial também fornece orientação de ponta a ponta na implementação de modelos, fazendo previsões e visualizando dados de previsão com aplicativos Qlik Sense interativos.
Quem deve concluir este exemplo
Você deve concluir este exemplo para aprender como usar a otimização de modelo inteligente para refinar seus modelos de aprendizado de máquina.
Para concluir este exemplo, você precisa do seguinte:
-
Direito de usuário Professional ou Full User
-
Função de segurança Automl Experiment Contributor no locatário
-
Se você estiver trabalhando em um espaço colaborativo, as funções de espaço necessárias nos espaços onde você estará trabalhando. Consulte: Gerenciando permissões em espaços compartilhados
Se você não conseguir visualizar ou criar recursos de ML, isso provavelmente significa que você não tem as funções, os direitos ou as permissões necessárias. Entre em contato com o administrador de locatários para obter mais informações.
Para obter mais informações, consulte Quem pode trabalhar com o Qlik AutoML.
O que você deve fazer antes de começar
Baixe este pacote e descompacte-o em seu desktop:
Exemplo do AutoML - Otimização de modelo inteligente
O pacote contém o conjunto de dados de treinamento que você usará para treinar modelos. O conjunto de dados contém informações sobre os clientes cujo prazo para renovação expirou e que tomaram a decisão de cancelar ou permanecer inscritos no serviço.
Faça o seguinte:
-
Abra o Análises do Analytics.
-
Vá para a página Criar, selecione Conjunto de dados e, em seguida, selecione Carregar arquivo de dados.
-
Arraste o arquivo AutoML Example - Churn data - training.csv para o diálogo de upload.
-
Selecione um espaço. Pode ser seu espaço pessoal ou um espaço compartilhado se você quiser que outros usuários possam acessar esses dados.
-
Clique em Carregar.
Agora que o conjunto de dados foi carregado, você pode prosseguir para criar um experimento.
Parte 1: Crie um experimento
Faça o seguinte:
-
Vá para a página Criar do centro de atividades do Análises e selecione Experimento de ML.
-
Digite um nome para seu experimento, por exemplo, Exemplo de otimização inteligente.
-
Opcionalmente, adicione uma descrição e tags.
-
Escolha um espaço para seu experimento. Pode ser seu espaço pessoal ou um espaço compartilhado.
-
Clique em Criar.
-
Selecione o arquivo AutoML Example - Churn data - training.csv.
Parte 2: Configure o experimento
Em seguida, podemos configurar o experimento.
A otimização inteligente de modelos requer menos configuração inicial do que a otimização manual. Neste caso, selecionaremos um alvo e usaremos todos os recursos que são incluídos por padrão.
Selecionando o alvo
Queremos que nosso modelo de aprendizado de máquina preveja o cancelamento de clientes, então selecionamos Churned, a coluna final do conjunto de dados, como nosso alvo.
No experimento, a guia Dados deve ser a única guia mostrada. Você pode selecionar um alvo de várias maneiras, mas aqui usamos a Exibição de esquema, que foi aberta por padrão.
Faça o seguinte:
-
No esquema, posicione o mouse sobre Churned e clique no ícone de destino que é exibido.
Confirmando a seleção de recursos
Após selecionar um alvo, todos os recursos disponíveis e recomendados são incluídos por padrão. Na Exibição de esquema, confirme se todos os recursos, exceto dois, estão incluídos. Deve haver caixas de seleção preenchidas ao lado de cada recurso incluído. Country não está disponível para uso. AccountID não é recomendado para uso devido à alta cardinalidade, por isso o deixamos desmarcado.
Confirmando a otimização inteligente
Um painel deve ser aberto no lado direito da página para configurar configurações adicionais. Queremos verificar se a otimização do modelo inteligente está ativada.
Faça o seguinte:
-
Se o painel de configuração do experimento não estiver aberto, clique em Exibir configuração para abri-lo.
-
No painel, expanda Otimização do modelo.
-
A opção de otimização selecionada deve ser Inteligente.
Execute o treinamento
Clique em Executar experimento no canto inferior direito da página para iniciar o treinamento do modelo.
Parte 3: Visualize os resultados
Após a conclusão do treinamento, a guia Modelos aparece e abre. É aqui que você pode visualizar quais otimizações foram realizadas durante o treinamento. O modelo superior, marcado com um ícone , é selecionado automaticamente. Vamos analisar este modelo.
Veja o Resumo do treinamento do modelo. Isso mostra os resultados da otimização inteligente para este modelo. Neste caso, podemos ver que os seguintes recursos foram descartados, e o motivo para sua remoção é fornecido:
-
DaysSinceLastService foi descartado devido a suspeita de vazamento de destino. Neste caso, a coluna continha dados com lógica imprópria. Os dias desde o último tíquete de serviço ainda estavam sendo contados ativamente para clientes que cancelaram seus serviços (em alguns casos, anos atrás). Este recurso precisava ser removido porque teria dado ao modelo pontuações de desempenho falsas e teria feito com que o modelo tivesse um desempenho muito ruim se fosse implementado. Consulte Vazamento de dados
-
PriorPeriodUsage e PriorPeriodUsage-Rounded foram descartados porque estavam muito correlacionados a outro recurso. O recurso com o qual eles estão correlacionados ainda estava incluído no treinamento. Consulte Correlação.
-
CurrentPeriodUsage, CustomerTenure, StartMonth, Territory, DeviceType e StartWeek foram todos descartados devido à baixa importância da permutação. Os recursos que têm baixo impacto no modelo são vistos como ruído estatístico e podem ser removidos para melhorar o desempenho. Consulte Entendendo a importância da permutação.
Agora que esses recursos foram removidos, podemos ver visualizações mostrando os recursos mais influentes, bem como alguns indicadores do desempenho preditivo do modelo. O que você vê nesses gráficos pode ajudar a avaliar se algo está faltando no conjunto de recursos ou se os resultados estão distorcidos.
Para obter mais informações sobre como analisar modelos com essas visualizações, consulte Executando análise rápida de modelo.
Mergulhe mais fundo na análise
Se quiser explorar mais as métricas do modelo, alterne para as guias Comparar e Analisar no experimento. Essas guias oferecem uma visão mais granular e interativa das métricas.
Para obter mais informações, consulte Comparando modelos e Executando análise detalhada de modelo.
Próximas etapas
Com um conjunto de dados de alta qualidade, a otimização inteligente cria modelos prontos para implementação com pouca ou nenhuma iteração adicional necessária. A partir deste ponto, é recomendável que você implemente o modelo de melhor desempenho. Caso contrário, você pode continuar refinando os modelos manualmente ou atualizar os dados de treinamento e executar a otimização inteligente de modelos novamente.
Para obter mais informações sobre as próximas etapas, consulte:
Obrigado!
Você concluiu este exemplo. Esperamos que você tenha aprendido como usar a otimização inteligente de modelos para treinar modelos de aprendizado de máquina prontos para implementação com facilidade.
Leituras e recursos adicionais
- O Qlik oferece uma ampla variedade de recursos quando você quiser aprender mais.
- A Ajuda online da Qlik está disponível.
- Treinamentos, incluindo cursos online gratuitos, estão disponíveis no Qlik Continuous Classroom.
- Fóruns de discussão, blogs e muitos outros recursos podem ser encontrados na Qlik Community.
Sua opinião importa
Agradecemos qualquer feedback que você possa ter. Use a seção abaixo para nos contar como estamos nos saindo.