KMeansCentroidND - función de gráfico
KMeansCentroidND() evalúa las filas del gráfico aplicando agrupación en clústeres k-means, y para cada fila del gráfico muestra la coordenada deseada del clúster al que se ha asignado este punto de datos. Las columnas que utiliza el algoritmo de agrupamiento vienen determinadas por los parámetros coordinate_1 y coordinate_2, etc., hasta n columnas. Esto son todo agregaciones. El número de clústeres que se crea viene determinado por el parámetro num_clusters.
KMeansCentroidND devuelve un valor por fila. El valor que devuelve es dual y es una de las coordenadas de la posición correspondiente al centro de clúster al que se ha asignado el punto de datos.
Sintaxis:
KMeansCentroidND((num_clusters, num_iter, coordinate_no, coordinate_1, coordinate_2 [,coordinate_3 [, ...]])
Tipo de datos que devuelve: dual
Argumentos:
Argumento | Descripción |
---|---|
num_clusters | Entero que especifica el número de clústeres. |
num_iter | El número de repeticiones de agrupación con centros de agrupación (clústeres) reinicializados. |
coordinate_no | El número de coordenadas deseado de los centroides (correspondiente, por ejemplo, al eje x, y o z). |
coordinate_1 | La agregación que calcula la primera coordenada, generalmente el eje x (de un gráfico de dispersión que se puede hacer a partir del gráfico). Los parámetros adicionales calculan la segunda, tercera y cuarta coordenadas, etc. |
Agrupamiento automático
Las funciones KMeans admiten la agrupación automática mediante un método llamado diferencia de profundidad (DeD). Cuando un usuario define 0 como el número de clústeres, se determina un número óptimo de clústeres para ese conjunto de datos. Tenga en cuenta que, si bien no se devuelve explícitamente un número entero para el número de clústeres (k), se calcula dentro del algoritmo KMeans. Por ejemplo, si se especifica 0 en la función para el valor de KmeansPetalClusters o se establece a través de un cuadro de entrada variable, las asignaciones de clústeres se calculan automáticamente para el conjunto de datos en función de un número óptimo de clústeres.