Criando e configurando o experimento
A primeira etapa é criar e configurar o experimento. Você usará o conjunto de dados de treinamento que carregou anteriormente para treinar o modelo até que esteja pronto para ser implementado para fazer previsões.
Criando um novo experimento
Faça o seguinte:
-
Vá para a página Criar do Análises do Analytics e selecione Experimento de ML.
-
Insira um nome para seu experimento, por exemplo, Tutorial de desistência de clientes.
-
Opcionalmente, adicione uma descrição e tags.
-
Escolha um espaço para seu experimento. Pode ser seu espaço pessoal ou um espaço compartilhado.
-
Clique em Criar.
-
Selecione o arquivo do conjunto de dados de treinamento. Isso será um dos seguintes, dependendo se você está trabalhando com CSV ou QVD:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
Revisando os dados
Agora você está pronto para começar a configurar seu experimento, mas antes de começar, vamos dar uma olhada no conjunto de dados.
Começamos na guia Dados. A exibição padrão é a Exibição de esquema. Aqui podemos ver uma tabela em que cada linha representa uma coluna em seu conjunto de dados. Estatísticas e insights foram gerados na preparação automática de dados. Talvez seja necessário rolar para o lado direito do esquema para ver as Ideias.
Podemos ver que AccountID foi excluído devido à alta cardinalidade. Isso significa que a coluna contém muitos valores exclusivos. O recurso Country foi excluído pelo motivo contrário: o valor é o mesmo para todas as linhas.Esses dois recursos não forneceriam nenhum valor aos modelos de aprendizado de máquina.
Também podemos ver que o traço categórico Territory foi codificado por impacto. Posicione o mouse sobre os ícones de aviso e de informações para obter mais informações.
Clique em Exibição de dados. Nessa exibição, podemos ver mais informações sobre cada coluna, incluindo dados de amostra.
Selecionando um alvo
Queremos que nosso modelo de aprendizado de máquina preveja o cancelamento de clientes, então selecionamos Churned, a coluna final do conjunto de dados, como nosso alvo.
Faça o seguinte:
-
Volte para Exibição de esquema.
-
Posicione o mouse sobre Churned e clique no ícone de destino que é exibido.
No painel de configuração do experimento, agora podemos ver que Churned foi selecionado. Também podemos ver quais recursos são selecionados e excluídos automaticamente. Como Churned é o alvo, ele não será usado como recurso. Podemos ver também que este experimento será tratado como um problema de classificação binária.
Selecionando recursos
Para esta primeira execução do nosso experimento, incluiremos todos os recursos e algoritmos que foram selecionados por padrão. No entanto, se você já souber que certos recursos não têm influência sobre o alvo - com base em seu conhecimento de negócios - você pode desmarcá-los neste ponto para excluí-los do treinamento.
Alterando as configurações de otimização
A otimização de modelo inteligente é ativada por padrão. Com a otimização inteligente de modelos, o AutoML fornece refinamento automático do treinamento do modelo. No entanto, o objetivo deste tutorial é mostrar como identificar manualmente certos problemas com seus dados de recurso e resultados de treinamento.
Para um exemplo de como treinar modelos com otimização inteligente de modelos, consulte Exemplo – Treinamento de modelos com aprendizado de máquina automatizado.
Vamos desativar a otimização inteligente de modelos para demonstrar o refinamento manual.
Faça o seguinte:
-
No painel de configuração do experimento, expanda a seção Otimização de modelos.
-
Alterne de Inteligente para Manual.
Treinando o experimento
A configuração está concluída, e estamos prontos para iniciar o treinamento.
Faça o seguinte:
-
No canto inferior direito da janela do experimento, clique em Executar experimento.
Quando a execução do experimento terminar, podemos passar para a próxima etapa, que é revisar as métricas do modelo resultante.