Saltar al contenido principal

KMeans2D - función de gráfico

KMeans2D() evalúa las filas del gráfico aplicando agrupación en clústeres k-means, y para cada fila del gráfico muestra el ID del grupo al que se ha asignado este punto de datos. Las columnas que utiliza el algoritmo de agrupamiento están determinadas por los parámetros coordinate_1 y coordinate_2, respectivamente. Ambas son agregaciones. El número de clústeres que se crea viene determinado por el parámetro num_clusters. Los datos se pueden normalizar opcionalmente mediante el parámetro norma.

KMeans2D devuelve un valor por punto de datos. El valor que devuelve es dual y es el valor del entero correspondiente al clúster al que se ha asignado cada punto de datos.

Syntax:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Return data type: dual

Arguments:  

Argumentos
Argumento Descripción
num_clusters Entero que especifica el número de clústeres.
coordinate_1 La agregación que calcula la primera coordenada, generalmente el eje x del gráfico de dispersión que se puede hacer a partir del gráfico. El parámetro adicional, coordenada_2, calcula la segunda coordenada.
norm

El método de normalización opcional aplicado a los conjuntos de datos antes de la agrupación en clústeres KMeans.

Valores posibles:

0 o "ninguno" para ninguna normalización

1 o "zscore" para una normalización de puntuación z

2 o "minmax" para la normalización mínima-máxima

Si no se proporciona ningún parámetro o si el parámetro proporcionado es incorrecto, no se aplica ninguna normalización.

Z-score normaliza los datos según la media de la característica y la desviación estándar. Z-score no asegura que cada característica tenga la misma escala, pero es un mejor enfoque que min-max cuando se trata de valores atípicos.

La normalización mínimo-máximo asegura que las entidades tengan la misma escala tomando los valores mínimo y máximo de cada uno y recalculando cada punto de datos.