Ir para conteúdo principal

KMeans2D - função de gráfico

O KMeans2D() avalia as linhas do gráfico por meio da aplicação do agrupamento de k-means e, para cada linha do gráfico, exibe o ID do agrupamento ao qual esse ponto de dados foi atribuído. As colunas que são usadas pelo algoritmo de agrupamento são determinadas pelos parâmetros coordinate_1 e coordinate_2, respectivamente. Ambas são agregações. O número de agrupamentos criados é determinado pelo parâmetro num_clusters. Os dados podem ser normalizados opcionalmente pelo parâmetro norm.

KMeans2D retorna um valor por ponto de dados. O valor retornado é duplo e é o valor inteiro correspondente ao agrupamento ao qual cada ponto de dados foi atribuído.

Syntax:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Return data type: dual

Arguments:  

Argumentos
Argumento Descrição
num_clusters Inteiro que especifica o número de agrupamentos.
coordinate_1 A agregação que calcula a primeira coordenada, geralmente o eixo X do gráfico de dispersão que pode ser criado a partir do gráfico. O parâmetro adicional, coordinate_2, calcula a segunda coordenada.
norm

O método de normalização opcional aplicado a conjuntos de dados antes do agrupamento KMeans.

Valores possíveis:

0 ou "none" para nenhuma normalização

1 ou "zscore" para normalização z-ponto

2 ou "minmax" para normalização mín-máx

Se nenhum parâmetro for fornecido ou se o parâmetro fornecido estiver incorreto, nenhuma normalização será aplicada.

Z-ponto normaliza os dados com base na média e no desvio padrão do recurso. Z-ponto não garante que cada recurso tenha a mesma escala, mas é uma abordagem melhor que mín-máx ao se lidar com discrepâncias.

A normalização mín-máx garante que os recursos tenham a mesma escala, usando os valores mínimo e máximo de cada um e recalculando cada ponto de dados.