Ir para conteúdo principal Pular para conteúdo complementar

KMeansCentroid2D - função de gráfico

O KMeansCentroid2D() avalia as linhas do gráfico por meio da aplicação do agrupamento de k-means e, para cada linha do gráfico, exibe a coordenada desejada do agrupamento ao qual esse ponto de dados foi atribuído. As colunas que são usadas pelo algoritmo de agrupamento são determinadas pelos parâmetros coordinate_1 e coordinate_2, respectivamente. Ambas são agregações. O número de agrupamentos criados é determinado pelo parâmetro num_clusters. Os dados podem ser normalizados opcionalmente pelo parâmetro norm.

KMeansCentroid2D retorna um valor por ponto de dados. O valor retornado é duplo e é uma das coordenadas da posição correspondente ao centro do agrupamento ao qual o ponto de dados foi atribuído.

Sintaxe:  

KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])

Tipo de dados de retorno: dual

Argumentos:  

Argumentos
Argumento Descrição
num_clusters Inteiro que especifica o número de agrupamentos.
coordinate_no O número da coordenada desejada dos centroides (correspondendo, por exemplo, ao eixo X, Y ou Z).
coordinate_1 A agregação que calcula a primeira coordenada, geralmente o eixo X do gráfico de dispersão que pode ser criado a partir do gráfico. O parâmetro adicional, coordinate_2, calcula a segunda coordenada.
norm

O método de normalização opcional aplicado a conjuntos de dados antes do agrupamento KMeans.

Valores possíveis:

0 ou "none" para nenhuma normalização

1 ou "zscore" para normalização z-ponto

2 ou "minmax" para normalização mín-máx

Se nenhum parâmetro for fornecido ou se o parâmetro fornecido estiver incorreto, nenhuma normalização será aplicada.

Z-ponto normaliza os dados com base na média e no desvio padrão do recurso. Z-ponto não garante que cada recurso tenha a mesma escala, mas é uma abordagem melhor que mín-máx ao se lidar com discrepâncias.

A normalização mín-máx garante que os recursos tenham a mesma escala, usando os valores mínimo e máximo de cada um e recalculando cada ponto de dados.

Agrupamento automático

Funções KMeans oferecem suporte para agrupamento automático usando um método chamado de diferença de profundidade (DeD). Quando um usuário define 0 para o número de agrupamentos, um número ideal de agrupamentos para esse conjunto de dados é determinado. Observe que, embora um número inteiro para o número de agrupamentos (k) não seja retornado explicitamente, ele é calculado dentro do algoritmo KMeans. Por exemplo, se 0 for especificado na função para o valor deKmeansPetalClusters ou definido por meio de uma caixa de entrada de variável, atribuições de agrupamentos serão calculadas automaticamente para o conjunto de dados com base em um número ideal de agrupamentos.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!