Visualizando os dados de previsão em um aplicativo Qlik Sense
A etapa final do processo é criar um aplicativo de análise Qlik Sense para visualizar os dados das previsões que você gerou.
Fluxo de trabalho alternativo: fazer upload de aplicativo pré-configurado
Em vez de seguir as etapas restantes deste tópico, você pode carregar o aplicativo Customer churn predictions.qvf baixado no início deste tutorial, no Análises do Analytics.
As seções restantes desta página orientam você na criação de um aplicativo semelhante. Haverá algumas diferenças entre os dados de previsão no aplicativo e seus próprios dados de previsão.
O aplicativo para download contém uma pasta adicional chamada Individual Customer Analysis, que usa expressões condicionais para incentivar a análise granular de uma única conta de cliente por vez.
Iniciando
No centro de atividades do Análises, vá para a página Criar e clique em Aplicativo. Selecione um espaço para o aplicativo e chame-o de Previsões de cancelamento de clientes.
Clique em Criar.
Criando o modelo de dados
Selecionando seus dados
Você precisa adicionar os dados necessários ao seu aplicativo. Isso consiste no conjunto de dados de aplicação (carregado no início do tutorial) e nos dois conjuntos de dados gerados a partir da previsão.
Faça o seguinte:
-
No novo aplicativo, clique para adicionar dados do Catálogo de dados.
-
No Catálogo de dados, clique nas caixas de seleção ao lado dos três conjuntos de dados a seguir:
-
Conjunto de dados de aplicação: AutoML Tutorial - Churn data - apply.csv ou AutoML Tutorial - Churn data - apply.qvd
-
Conjunto de dados de previsão: AutoML Tutorial - Churn data - apply_Prediction.csv
-
Coordene o conjunto de dados SHAP: AutoML Tutorial - Churn data - apply_Prediction_Coordinate_SHAP.csv
-
-
Clique em Avançar.
-
Um painel de resumo é exibido. Clique no conjunto de dados AutoML Tutorial - Churn data - apply.csv para expandir os campos disponíveis para carregar.
-
Clique no ícone próximo aos recursos que foram desmarcados durante o treinamento do modelo. Deve ser DaysSinceLastService, assim como os recursos que você desmarcou devido à baixa influência no modelo.
-
Clique em Carregar no aplicativo.
Associando os dados
Neste ponto, você adicionou os dados ao aplicativo, mas um modelo de dados conectado não será construído até que você associe os conjuntos de dados. Nesse caso, o campo AccountID será o índice que vincula os conjuntos de dados.
No seu aplicativo, o Gerenciador de dados é aberto agora. Você verá os três conjuntos de dados, mas eles são mostrados como entidades separadas que não estão conectadas.
Faça o seguinte:
-
No seu aplicativo, o Gerenciador de dados é aberto agora. Você verá os três conjuntos de dados, mas eles são mostrados como entidades separadas que não estão conectadas.
-
No painel direito do Gerenciador de dados, encontre a sugestão de associação AccountID.
-
Clique em Aplicar. As tabelas agora devem estar conectadas.
-
Clique em Carregar dados.
Verificando suas associações no Visualizador do modelo de dados
Antes de criar qualquer visualização no aplicativo, verifique se os dados foram associados corretamente.
Faça o seguinte:
-
Na barra de navegação na parte superior da interface, abra o menu de navegação do aplicativo e selecione Visualizador do modelo de dados.
-
Verifique se os três conjuntos de dados foram conectados corretamente. O campo AccountID deve atuar como uma chave em todos os três conjuntos de dados. O modelo de dados do aplicativo deve ser semelhante à imagem a seguir.
Agora você está pronto para começar a criar conteúdo analítico. Clique em Pasta na guia Analisar na barra de navegação.
Primeira pasta: painel Previsões agregadas
A primeira pasta focará na análise das previsões de forma agregada.
Faça o seguinte:
-
Agora você deve estar no modo de edição de pasta. Clique em Opções avançadas.
-
Clique com o botão direito em qualquer visualização existente na pasta e exclua-a. Este é um recurso de sugestão de gráfico que não usaremos neste tutorial.
-
Dê um título à pasta, por exemplo, Previsões agregadas. Para fazer isso, clique em qualquer lugar da pasta em branco para abrir as Propriedades da pasta no lado direito da interface. Em Título, digite um nome para a pasta.
Gráfico de pizza
Um gráfico de pizza permite visualizar facilmente o detalhamento proporcional de seus dados. Neste caso, faz sentido decompor os dados pelos resultados previstos (yes ou no).
Faça o seguinte:
-
Arraste um gráfico de pizza até a pasta.
-
Adicione Churned_predicted como uma dimensão.
-
Adicione Count(AccountID) como uma medida.
-
Se desejar, desative o Rótulo de dimensão em Aparência > Apresentação no painel de propriedades.
-
Expanda a dimensão em Dados no painel de propriedades e modifique o Rótulo da dimensão para Com previsão de desistência.
O rótulo é atualizado na legenda.
Painel de filtro
Este painel servirá para uma análise ampla de todo o modelo de dados. No entanto, será quase certamente importante poder filtrar rapidamente os dados em várias dimensões para analisar coortes específicas.
Crie um painel de filtro com várias caixas de listagem. Cada caixa de listagem permite seleções de valores dentro de uma única dimensão.
Faça o seguinte:
-
Arraste um painel de filtro para a pasta.
-
Adicione campos ao painel de filtro. Podem ser dimensões que você espera que sejam significativas para os resultados previstos.
-
Modifique cada caixa de listagem conforme necessário clicando no campo em Dados no painel de propriedades. Isso abre as Propriedades da caixa de listagem.
Por exemplo, você pode querer alterar o rótulo do campo e definir Recolher caixa de listagem como Sempre para economizar espaço na pasta.
Redimensione o painel de filtro para que ele apareça como um painel em um lado da pasta.
Objetos KPI
KPIs são uma ótima maneira de exibir um único valor para uma análise particularmente importante dos seus dados. Aqui, criaremos três gráficos de KPI.
Faça o seguinte:
-
Crie um gráfico de KPI em branco. Adicione a seguinte medida:
=Count(Churned_predicted)
Isso calculará o número total de clientes para os quais geramos previsões de desistência.
-
Chame a medida de Número total de clientes.
-
Defina a Formatação de números como Número e apresente os valores no formato 1.000 (sem valores decimais ou percentuais).
-
Crie outro gráfico de KPI em branco. Adicione a seguinte medida:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Essa é uma expressão de conjunto que calcula o número de vezes que o valor de yes foi exibido no campo Churned_predicted.
-
Chame a medida de Com previsão de desistência.
-
Configure a formatação numérica do gráfico com as mesmas configurações do primeiro KPI.
-
Crie um terceiro gráfico de KPI em branco. Adicione a seguinte medida:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Isso calcula o número de vezes que o valor de no foi exibido no campo Churned_predicted.
-
Chame a medida de Com previsão de permanência.
Histograma
Você pode visualizar a distribuição dos valores de probabilidade de previsão com um histograma.
Arraste um histograma para a pasta e dê um título a ele. Adicione Churned_yes como a dimensão.
Gráficos de barras empilhadas
Para analisar as previsões por um campo categórico, como o tipo de plano, você pode criar um gráfico de barras com análises de conjuntos individuais empilhadas umas sobre as outras.
Faça o seguinte:
-
Arraste um gráfico de barras até a pasta e chame-o de Previsões de desistência por tipo de plano.
-
Adicione PlanType como uma dimensão. Chame-o de Tipo de plano.
-
Adicione a seguinte medida:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Chame a medida de Com previsão de permanência.
-
Adicione a seguinte medida:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Chame a medida de Com previsão de desistência.
-
Em Aparência > Apresentação, altere o layout de Agrupado para Empilhado.
-
Remova a barra de rolagem e defina Rótulos de valor como Ativado.
-
Configure Rótulos de segmento e Rótulos de totais como Automático.
Quando terminar, você pode criar um gráfico de barras semelhante com as mesmas duas medidas, mas com uma dimensão categórica diferente, como NumberOfPenalties.
Gráfico de distribuição para analisar valores de campos numéricos individuais
Um gráfico de distribuição pode ser usado para apresentar dados de previsões por meio de uma medida com diversos valores numéricos. Nesta seção, você criará um gráfico para exibir as previsões de desistência por taxa básica, com agrupamentos distintos para a classificação de serviço do cliente.
Faça o seguinte:
-
Arraste um gráfico de distribuição até a pasta e chame-o de Previsões de desistência por taxa básica e classificação de serviço.
-
Adicione AccountID como a dimensão para os pontos.
-
Adicione a seguinte medida no eixo X:
=Avg(BaseFee)
-
Adicione a seguinte dimensão calculada no eixo Y:
=Round(ServiceRating,2)
Isso cria agrupamentos ao longo do eixo y para valores aproximados de ServiceRating. Quanto maior o valor, maior será a avaliação do cliente na qualidade de seu serviço.
-
Em Aparência > Apresentação, reduza o Tamanho da bolha para 20 e ative Pontos de oscilação.
-
Em Cores e legenda, defina Cores como Personalizado.
-
Selecione a opção para colorir os dados com a seguinte dimensão:
=Churned_predicted
Isso atribuirá uma cor para cada um dos valores no campo Churned_predicted. Nesse caso, serão exibidas duas cores.
-
Adicione rótulos à dimensão e à medida e adicione o seguinte rótulo à configuração de cor personalizada: Com previsão de desistência.
Gráficos semelhantes podem ser criados para análises de diferentes campos numéricos, substituindo outras agregações de campo no lugar da medida BaseFee.
Configure as visualizações na pasta para que se pareçam com a imagem abaixo.
Segunda pasta: Painel SHAP agregado
A seguir, crie uma pasta dedicada à análise dos valores SHAP agregados.
Faça o seguinte:
-
Crie uma nova pasta e abra o modo de edição avançada.
-
Dê um título à pasta, por exemplo, (SHAP agregado).
Classificação de importância SHAP
Esse tipo de gráfico é semelhante ao gerado automaticamente que você pode ter visto ao configurar suas versões do experimento. Aqui, criaremos um para o conjunto de dados previsto.
O objetivo desse tipo de gráfico é mostrar os recursos que mais contribuem para o resultado visto na coluna Churned. Precisamos estar cientes de que, como usaremos valores absolutos, os resultados de SHAP podem ser positivos (valor yes) ou negativos (valor no). Se preferir, você também pode utilizar uma expressão que não calcule o valor absoluto.
Faça o seguinte:
-
Arraste um gráfico de barras até a pasta vazia.
-
Chame o gráfico de Importância SHAP por recurso.
-
Adicione automl_feature como uma dimensão e chame-a de Recurso.
Isso permite que você apresente os dados agregados em todos os recursos incluídos.
-
Adicione a seguinte medida calculada:
=fabs(Avg(SHAP_value))
-
Em Rótulo, digite SHAP médio absoluto.
-
No painel de propriedades, em Aparência > Apresentação, remova a barra de rolagem, se estiver presente, e defina a orientação do gráfico de Vertical para Horizontal.
-
Em Classificação, arraste a medida acima da dimensão, caso ainda não tenha sido concluída. Deixe a classificação de cada campo como Automático.
Isso classifica o gráfico por valores de medida em um padrão decrescente.
Contêiner de treliça
Você pode criar um contêiner de treliça para filtrar dados para valores de campo específicos em uma dimensão. Nesse caso, podemos detalhar os valores SHAP para cada um dos quatro tipos de planos oferecidos aos clientes.
Para criar um objeto de Treliça, você precisa especificar uma dimensão e uma visualização mestre. Converteremos a classificação de importância SHAP que acabamos de criar em uma visualização principal.
Faça o seguinte:
- Clique com o botão direito do mouse no gráfico SHAP médio absoluto na pasta e selecione Adicionar a itens mestre.
- Mantenha o nome padrão e clique em Adicionar.
-
Em Objetos personalizados > Pacote de visualização Qlik no painel de ativos, arraste um contêiner de Treliça até a pasta.
-
Adicione PlanType como uma dimensão.
-
Clique em Adicionar visualização mestre dentro do gráfico e, em seguida, adicione o gráfico SHAP médio absoluto.
-
Em Aparência > Geral no painel de propriedades, ative Mostrar títulos e atribua ao gráfico o título Importância SHAP por tipo de plano.
-
Redimensione o contêiner de Treliça para que ele seja largo o suficiente para exibir os nomes dos recursos nos gráficos. Se nem todas as etiquetas forem exibidas, ajuste o zoom na janela do navegador.
Como alternativa, você pode exibir esses dados criando gráficos individuais com expressões definidas para cada valor de dimensão que você deseja analisar. Nesse caso, você pode criar um gráfico separado para cada um dos quatro tipos de planos.
Reutilizando o painel de filtro
O painel de filtro criado na primeira pasta pode ser reutilizado nesta pasta. No modo de edição avançada, clique com o botão direito no painel de filtro e copie-o. Cole-o na pasta SHAP agregado.
Mapa de árvore
Você também pode visualizar a decomposição dos valores SHAP com um mapa de árvore. Arraste um mapa de árvore para a pasta e adicione a mesma dimensão e medida usada na classificação de importância SHAP.
Configure as visualizações na pasta para que se pareçam com a imagem abaixo.
Usando o aplicativo
Depois de terminar de construir o aplicativo, ele estará pronto para ser usado para análise de dados.
Clique em Editar pasta para alternar para o modo de análise. Nesta visualização, você pode fazer seleções (nos painéis de filtro ou em outro local da pasta) para filtrar os dados para análise específica de subconjuntos de dados. Por exemplo, você pode querer analisar um tipo ou região de plano de cliente específico e comparar as descobertas com outros subconjuntos de dados.
Obrigado!
Você chegou ao final deste tutorial. Esperamos que você tenha aprendido algumas coisas e percebido que o aprendizado de máquina automatizado é uma maneira rápida e fácil de gerar modelos preditivos. O Qlik Sense é uma ferramenta poderosa que facilita a visualização dos dados das suas previsões e fornece informações significativas sobre seus dados.