Saltar al contenido principal Saltar al contenido complementario

KMeansCentroid2D - función de gráfico

KMeansCentroid2D() evalúa las filas del gráfico aplicando agrupación en clústeres k-means y para cada fila del gráfico muestra la coordenada deseada del clúster al que se haya asignado este punto de datos. Las columnas que utiliza el algoritmo de agrupamiento vienen determinadas por los parámetros coordinate_1 y coordinate_2, respectivamente. Ambas son agregaciones. El número de clústeres que se crea viene determinado por el parámetro num_clusters. Los datos se pueden normalizar opcionalmente mediante el parámetro norma.

KMeansCentroid2D devuelve un valor por punto de datos. El valor que devuelve es dual y es una de las coordenadas de la posición correspondiente al centro de agrupación al que se ha asignado el punto de datos.

Sintaxis:  

KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])

Tipo de datos que devuelve: dual

Argumentos:  

Argumentos
Argumento Descripción
num_clusters Entero que especifica el número de clústeres.
coordinate_no El número de coordenadas deseado de los centroides (correspondiente, por ejemplo, al eje x, y o z).
coordinate_1 La agregación que calcula la primera coordenada, generalmente el eje x del gráfico de dispersión que se puede hacer a partir del gráfico. El parámetro adicional, coordenada_2, calcula la segunda coordenada.
norm

El método de normalización opcional aplicado a los conjuntos de datos antes de la agrupación en clústeres KMeans.

Valores posibles:

0 o "ninguno" para ninguna normalización

1 o "zscore" para una normalización de puntuación z

2 o "minmax" para la normalización mínima-máxima

Si no se proporciona ningún parámetro o si el parámetro proporcionado es incorrecto, no se aplica ninguna normalización.

Z-score normaliza los datos según la media de la característica y la desviación estándar. Z-score no asegura que cada característica tenga la misma escala, pero es un mejor enfoque que min-max cuando se trata de valores atípicos.

La normalización mínimo-máximo asegura que las entidades tengan la misma escala tomando los valores mínimo y máximo de cada uno y recalculando cada punto de datos.

Agrupamiento automático

Las funciones KMeans admiten la agrupación automática mediante un método llamado diferencia de profundidad (DeD). Cuando un usuario define 0 como el número de clústeres, se determina un número óptimo de clústeres para ese conjunto de datos. Tenga en cuenta que, si bien no se devuelve explícitamente un número entero para el número de clústeres (k), se calcula dentro del algoritmo KMeans. Por ejemplo, si se especifica 0 en la función para el valor de KmeansPetalClusters o se establece a través de un cuadro de entrada variable, las asignaciones de clústeres se calculan automáticamente para el conjunto de datos en función de un número óptimo de clústeres.

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.