KMeansND - función de gráfico
KMeansND() evalúa las filas del gráfico aplicando agrupación en clústeres k-means, y para cada fila del gráfico muestra el ID del grupo al que se ha asignado este punto de datos. Las columnas que utiliza el algoritmo de agrupamiento vienen determinadas por los parámetros coordinate_1 y coordinate_2, etc., hasta n columnas. Esto son todo agregaciones. El número de clústeres que se crea viene determinado por el parámetro num_clusters.
KMeansND devuelve un valor por punto de datos. El valor que devuelve es dual y es el valor del entero correspondiente al clúster al que se ha asignado cada punto de datos.
Sintaxis:
KMeansND(num_clusters, num_iter, coordinate_1, coordinate_2 [,coordinate_3 [, ...]])
Tipo de datos que devuelve: dual
Argumentos:
Argumento | Descripción |
---|---|
num_clusters | Entero que especifica el número de clústeres. |
num_iter | El número de repeticiones de agrupación con centros de agrupación (clústeres) reinicializados. |
coordinate_1 | La agregación que calcula la primera coordenada, generalmente el eje x (de un gráfico de dispersión que se puede hacer a partir del gráfico). Los parámetros adicionales calculan la segunda, tercera y cuarta coordenadas, etc. |
Agrupación automática en clústeres
Las funciones KMeans admiten la agrupación automática mediante un método llamado diferencia de profundidad (DeD). Cuando un usuario define 0 como el número de clústeres, se determina un número óptimo de clústeres para ese conjunto de datos. Tenga en cuenta que, si bien no se devuelve explícitamente un número entero para el número de clústeres (k), se calcula dentro del algoritmo KMeans. Por ejemplo, si se especifica 0 en la función para el valor de KmeansPetalClusters o se establece a través de un cuadro de entrada variable, las asignaciones de clústeres se calculan automáticamente para el conjunto de datos en función de un número óptimo de clústeres.