O KMeansND() avalia as linhas do gráfico por meio da aplicação do agrupamento de k-means e, para cada linha do gráfico, exibe o ID do agrupamento ao qual esse ponto de dados foi atribuído. As colunas que são usadas pelo algoritmo de agrupamento são determinadas pelos parâmetros coordinate_1 e coordinate_2, etc., até n colunas. Todas são agregações. O número de agrupamentos criados é determinado pelo parâmetro num_clusters.
KMeansND retorna um valor por ponto de dados. O valor retornado é duplo e é o valor inteiro correspondente ao agrupamento ao qual cada ponto de dados foi atribuído.
O número de iterações de agrupamentos com centros de agrupamentos reinicializados.
coordinate_1
A agregação que calcula a primeira coordenada, geralmente o eixo X (de um gráfico de dispersão que pode ser criado a partir do gráfico). Os parâmetros adicionais calculam a segunda, a terceira e a quarta coordenadas, etc.
Neste exemplo, criamos um gráfico de dispersão usando o conjunto de dados Iris e, em seguida, usamos KMeans para colorir os dados por expressão.
Também criamos uma variável para o argumento num_clusters e, em seguida, usamos uma caixa de entrada de variável para alterar o número de agrupamentos.
Também criamos uma variável para o argumento num_iter e, em seguida, usamos uma segunda caixa de entrada de variável para alterar o número de iterações.
O conjunto de dados Iris está disponível publicamente em uma variedade de formatos. Fornecemos os dados como uma tabela inline para carregar usando o editor de carregamento de dados no Qlik Sense. Observe que adicionamos uma coluna Id à tabela de dados para este exemplo.
Depois de carregar os dados no Qlik Sense, faremos o seguinte:
Arraste um Gráfico de dispersão até uma nova pasta. Especifique o nome Petal (expressão de cor) para o gráfico.
Crie uma variável para especificar o número de agrupamentos. Para a variável Nome, insira KmeansPetalClusters. Para a variável Definição, insira =2.
Crie uma variável para especificar o número de iterações. Para a variável Nome, insira KmeansNumberIterations. Para a variável Definição, insira =1.
Configure Dados para o gráfico:
Em Dimensões, escolha id para o campo de Bolha. Insira ID do Agrupamento para o Rótulo.
Em Medidas, escolha Sum([petal.length]) para a expressão do Eixo X.
Em Medidas, escolha Sum([petal.width]) para a expressão do Eixo Y.
Configurações de dados para o gráfico Petal (expressão de cor)
Os pontos de dados são plotados no gráfico.
Pontos de dados no gráfico Petal (expressão de cor)
Configure a Aparência do gráfico:
Em Cores e legendas, escolha Personalizado para Cores.
Escolha colorir o gráfico Por expressão.
Insira o seguinte para Expressão: kmeansnd($(KmeansPetalClusters),$(KmeansNumberIterations), Sum([petal.length]), Sum([petal.width]),Sum([sepal.length]), Sum([sepal.width]))
Observe que KmeansPetalClusters é a variável que definimos como 2. KmeansNumberIterations é a variável que definimos como 1.
Como alternativa, insira o seguinte: kmeansnd(2, 2, Sum([petal.length]), Sum([petal.width]),Sum([sepal.length]), Sum([sepal.width]))
Desmarque a caixa de seleção para A expressão é um código de cor.
Insira o seguinte para Rótulo: ID do agrupamento
Configurações de aparência para o gráfico Petal (expressão de cor)
Os dois agrupamentos no gráfico são coloridos pela expressão KMeans.
Agrupamentos coloridos por expressão no gráfico Petal (expressão de cor)
Adicione uma caixa de Entrada variável para o número de agrupamentos.
Em Objetos personalizados no painel Ativos, escolha Pacote Dashboard da Qlik. Se não tivéssemos acesso ao pacote dashboard, ainda poderíamos alterar o número de agrupamentos usando a variável que criamos ou diretamente como um inteiro na expressão.
Arraste uma caixa de Entrada variável até a pasta.
Em Aparência, clique em Geral.
Insira o seguinte para Título: Agrupamentos
Clique em Variável.
Escolha a seguinte variável para Nome: KmeansPetalClusters.
Escolha Controle Deslizante para Mostrar como.
Escolha Valores e defina as configurações conforme necessário,
Aparência da caixa de entrada da variável Agrupamentos
Adicione uma caixa de Entrada variável para o número de iterações.
Arraste uma caixa de Entrada variável até a pasta.
Em Aparência, escolha Geral.
Insira o seguinte para Título: Iterações
Em Aparência, escolha Variável.
Escolha a seguinte variável em Nome: KmeansNumberIterations.
Defina as configurações adicionais conforme necessário,
Agora, podemos alterar o número de agrupamentos e iterações usando os controles deslizantes nas caixas de entrada de variáveis.
Agrupamentos coloridos por expressão no gráfico Petal (expressão de cor)
Agrupamento automático
Funções KMeans oferecem suporte para agrupamento automático usando um método chamado de diferença de profundidade (DeD). Quando um usuário define 0 para o número de agrupamentos, um número ideal de agrupamentos para esse conjunto de dados é determinado. Observe que, embora um número inteiro para o número de agrupamentos (k) não seja retornado explicitamente, ele é calculado dentro do algoritmo KMeans. Por exemplo, se 0 for especificado na função para o valor deKmeansPetalClusters ou definido por meio de uma caixa de entrada de variável, atribuições de agrupamentos serão calculadas automaticamente para o conjunto de dados com base em um número ideal de agrupamentos. Dado o conjunto de dados de Iris, se 0 for selecionado para o número de agrupamentos, o algoritmo determinará (agrupará automaticamente) um número ideal de agrupamentos (3) para esse conjunto de dados.
O método de diferença de profundidade KMeans determina o número ideal de agrupamentos quando (k) está definido como 0.
Conjunto de dados Iris: Carregamento inline para o editor de carregamento de dados no Qlik Sense
Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!