Descobrindo os determinantes chave por trás de seus dados usando a análise de determinante chave
Com a análise de determinante chave, você pode identificar e comparar as fontes de tendências específicas em seus dados. Uma análise de determinante chave ajuda a visualizar e classificar a influência que um conjunto definido de fatores tem nos dados atuais de um campo de destino específico. Use os insights que você descobrir para melhorar e aprimorar os processos analíticos e de tomada de decisão da sua organização.
A análise de determinante chave está disponível em um Qlik Sense Qlik Cloud. Execute a análise de determinante chave na exibição de pasta quando estiver no modo de análise.
A análise de determinante chave não está disponível no Qlik Sense Business, no Qlik Cloud Analytics Standard nem no Qlik Anonymous Access.
O que é análise de determinante chave?
Análise de determinante chave é uma forma de descoberta de dados estatísticos que permite identificar o grau em que vários fatores impactam o resultado de uma única métrica alvo. A análise é realizada para dados quantitativos e qualitativos. A intenção por trás de uma análise de determinante chave é descobrir exatamente o que está causando uma determinada tendência nos dados e usar esses insights para tomar medidas diretas ou melhorar a consciência organizacional.
Em business intelligence, os alvos comuns para os quais você gostaria de avaliar os influenciadores são campos como Vendas, Satisfação do Cliente, Margem, Cancelamento e Custo de Venda. Exemplos de fatores (determinantes chave) incluem Produto, Localização, Número da Loja e Gerente.
As métricas avaliadas em uma análise de determinante chave diferem para cada organização e caso de uso. A métrica alvo e os vários fatores que influenciam seus resultados dependem do problema que você está procurando resolver, dos dados disponíveis e de outros fatores.
Por que usar uma análise de determinante chave?
A análise de determinante chave é útil na inteligência de negócios porque pode ser aplicada de diversas maneiras para melhorar os indicadores de desempenho chave. Você pode usar uma análise de determinante chave para resolver problemas e obter insights relacionados ao investimento em produtos, expansão de receita, redução de custos, satisfação do cliente e muitos outros.
No Qlik Sense, a análise de determinante chave é integrada à experiência do consumidor do aplicativo. Usando os recursos de análise de dados em tempo real nativos do Qlik Sense, você pode executar uma nova análise de determinante chave sempre que os dados do aplicativo forem alterados. Isso permite monitorar continuamente seus dados em busca de mudanças e descobrir rapidamente tendências emergentes para que você possa tomar medidas imediatas e eficazes quando necessário.
Como funciona
A análise de determinante chave está centrada na ideia de influência. No Qlik Sense, a análise de determinante chave avalia a influência que campos específicos (recursos ou determinantes chave) têm em um determinado campo de interesse (o alvo).
Os dados usados na análise
Uma análise de determinante chave é um exame específico de um subconjunto de seus dados. Ao criar a análise, você seleciona determinados campos como componentes da análise.
Você precisa escolher os seguintes blocos de construção para cada análise:
-
Alvo
-
Vários recursos
Depois de selecionar esses componentes, um conjunto de dados específico será criado a partir do seu modelo de dados usando o alvo e os recursos. A análise de determinante chave usa esse conjunto de dados, e não todo o modelo de dados, para determinar a influência que os recursos estão exercendo no alvo. Os campos que você não inclui na configuração não são analisados.
Mais informações sobre cada componente são fornecidas abaixo.
Calculando a influência
No Qlik Sense, a análise de determinante chave é realizada calculando os valores de SHAP para cada valor de dados do recurso no subconjunto de dados que você está analisando. Esses valores SHAP são gerados a partir de um modelo treinado pelo Qlik AutoML. Os modelos usam o algoritmo de floresta aleatória para gerar os valores SHAP.
O valor de SHAP é um cálculo do grau de impacto que um valor de dados tem no valor alvo correspondente, em relação aos outros recursos no conjunto de dados criado especificamente a partir de sua configuração de análise de determinante chave. Ao visualizar os resultados de uma análise de determinante chave, você está visualizando agregações dos valores SHAP em todos ou em um conjunto específico de registros no conjunto de dados.
Para obter mais informações sobre a importância do SHAP no Qlik AutoML, consulte Entendendo a importância de SHAP no treinamento de experimento.
O alvo
O alvo é o campo para o qual você deseja analisar os determinantes chave. Por exemplo, você pode comparar como determinados fatores estão influenciando suas vendas. Nesse caso, você selecionaria uma medida de vendas como alvo.
Ao selecionar seu alvo, o tempo de disponibilidade dos dados é importante, principalmente em relação aos recursos que você opta por incluir em sua análise. Para obter mais informações sobre os prazos adequados de coleta de dados para seu alvo e recursos, consulte Recursos.
O número de valores exclusivos e o tipo de dados no alvo determinam o tipo de problema que a análise resolverá. Isso, por sua vez, afeta os requisitos que seus dados devem atender. Para obter mais informações, consulte Requisitos de dados.
A análise de determinante chave oferece suporte aos seguintes tipos de problema:
-
Regressão
-
Classificação binária
Análises de regressão
Análises de regressão são usadas quando o alvo contém um grande número de valores numéricos exclusivos. Se você usar um cálculo numérico (medida) como alvo, a análise de determinante chave provavelmente interpretará a configuração como um problema de regressão.
Ao escolher uma medida como alvo, você pode aplicar uma agregação básica diretamente ao campo na configuração ou selecionar um item mestre existente se desejar usar uma expressão mais complexa.
Análises de classificação binária
Se o seu alvo incluir apenas dois valores exclusivos (por exemplo, sim ou não), a análise de determinante chave interpretará a configuração como um problema de classificação binária. Análises de classificação binária são criadas selecionando uma dimensão binária como alvo.
Como um exemplo comum, se você tiver um campo Cancelamento em seu aplicativo para rastrear quais clientes cancelaram um determinado serviço, você pode selecionar o campo Cancelamento como o alvo para descobrir quais fatores estão impulsionando essas decisões do cliente.
Recursos
Os recursos são seus determinantes chave. Esses são os campos que contêm informações extraíveis sobre o que está influenciando as tendências nos dados. Por exemplo, ao criar uma análise de determinante chave para identificar os influenciadores por trás das vendas, você pode selecionar dimensões como Localização, Tipo de Produto, Número da Loja e Representante de Vendas como recursos. Medidas calculadas também podem ser usadas como recursos.
Você deve incluir apenas recursos que contenham dados que possam ser registrados e coletados antes do momento em que você coleta seus dados de destino. Se você incluir recursos contendo dados que você só conheceria no momento da coleta de dados para o alvo, a análise será distorcida e não fornecenrá valor analítico.
Por exemplo, se sua meta for Vendas, você não deverá incluir recursos que contenham dados derivados diretamente dela. Da mesma forma, se o seu alvo for um campo Cancelamento com um resultado binário (Sim ou Não), você não deve incluir um recurso contendo a data em que o cliente cancelou.
Para obter mais informações sobre como identificar resultados de análise inválidos, consulte Identificando resultados inválidos.
Um recurso é atribuído a um dos dois tipos a seguir:
-
Recurso categórico: aquele que contém valores de dados baseados em categorias distintas e recorrentes. Um exemplo de recurso categórico poderia ser um campo Continente, no qual há apenas alguns valores possíveis e esses não são interpretados como dados numéricos brutos, mas como texto. Números podem ser usados como categorias.
-
Recurso numérico: aquele em que os valores dos dados são dados puramente numéricos e não pertencem a categorias.
Todos os recursos incluídos são analisados especificamente para determinar quanta influência cada um tem nos dados atuais do alvo.
Para obter mais informações sobre os requisitos do alvo e dos recursos incluídos, consulte Requisitos de dados.
Seleções do aplicativo
As seleções que você faz no aplicativo são usadas na análise de determinante chave. Por exemplo, você pode descobrir os determinantes chave de vendas, mas, ao incluir uma dimensão Número da loja como um recurso, você pode analisar apenas a influência de cinco lojas específicas em sua organização. Para fazer isso, você pode selecionar os valores no aplicativo e, em seguida, configurar a análise de determinante chave.
Como as seleções são basicamente filtros aplicados ao modelo de dados, é importante estar ciente de que fazer seleções em um campo pode afetar os dados disponíveis que podem ser usados na análise.
Considerações para a assinatura do locatário
A análise de determinante chave depende do Qlik AutoML para calcular a influência dos recursos no alvo. Isso é feito criando modelos de aprendizado de máquina que são usados para calcular valores SHAP para os pontos de dados correspondentes aos recursos incluídos no subconjunto de dados selecionado.
A criação de uma análise de determinante chave consome serviços medidos pelo Qlik AutoML. Uma certa quantidade de uso do AutoML está incluída na maioria das assinaturas do Qlik Cloud. Se for necessária mais capacidade, será necessário fazer upgrade para um nível pago do AutoML.
Verifique com o proprietário da sua conta de serviço e consulte os termos da assinatura que você está usando para saber sua capacidade de uso da análise de determinante chave.
Os seguintes recursos podem fornecer detalhes adicionais:
-
A descrição do produto para Assinaturas do Qlik Cloud®
Requisitos de dados
Requisitos mínimos de volume de dados
O conjunto de dados criado a partir do alvo e recursos precisa ter pelo menos 400 células. Caso contrário, você não poderá executar a análise.
Outros requisitos
Os seguintes requisitos se aplicam ao conjunto de dados criado a partir da sua configuração de análise:
-
O alvo precisa conter pelo menos dois valores exclusivos.
-
Se o alvo contiver entre dois e dez valores exclusivos, cada valor exclusivo deverá aparecer em pelo menos dez registros no conjunto de dados.
Se você encontrar erros ao executar uma análise de determinante chave, pode ser que os dados selecionados para a análise não atendam a esses requisitos. Para outros problemas que você pode encontrar e uma lista de soluções possíveis, consulte Solução de problemas .
Usando a análise de determinante chave no Qlik Sense
Os tópicos de ajuda a seguir podem ajudá-lo a começar a criar e interpretar análises de determinante chave no Qlik Sense:
Limitações
Uma lista de limitações para a análise de determinante chave é fornecida abaixo:
-
Os campos que contêm os tipos de dados de data, hora ou carimbo de data/hora não têm suporte para uso como alvo ou como recursos.