Accéder au contenu principal Skip to complementary content

KMeansCentroidND - fonction de graphique

KMeansCentroidND() évalue les lignes du graphique en appliquant un algorithme des k-moyennes, et, pour chaque ligne du graphique, il affiche la coordonnée souhaitée du cluster auquel ce point de données a été affecté. Les colonnes utilisées par l’algorithme sont déterminées par les paramètres coordinate_1, coordinate_2, etc., jusqu'à n colonnes. Ces paramètres sont tous des agrégations. Le nombre de clusters créés est déterminé par le paramètre num_clusters.

KMeansCentroidND renvoie une valeur par ligne. La valeur renvoyée est une valeur double et est l'une des coordonnées de la position correspondant au centre de cluster auquel chaque point de données a été affecté.

Syntax:  

 

KMeansCentroidND((num_clusters, num_iter, coordinate_no, coordinate_1, coordinate_2 [,coordinate_3 [, ...]])

Return data type: double

Arguments:  

Arguments
Argument Description
num_clusters Entier qui spécifie le nombre de clusters.
num_iter Le nombre d'itérations de clustering avec des centres de cluster réinitialisés.
coordinate_no Le nombre de coordonnées souhaité des centroïdes (correspondant, par exemple, à l'axe x, y ou z).
coordinate_1 L'agrégation calcule la première coordonnée, généralement l'axe x (d'un nuage de points qui peut être obtenu à partir du graphique). Les paramètres supplémentaires calculent les deuxième, troisième et quatrième coordonnées, etc.

Clustering automatique

Les fonctions K-moyennes prennent en charge le clustering automatique via une méthode dite Différence de profondeur (DeD - Depth Difference). Quand un utilisateur définit 0 comme nombre de clusters, un nombre optimal de clusters est déterminé pour cet ensemble de données. Notez que même si entier n'est pas explicitement renvoyé pour le nombre de clusters (k), il est calculé dans l'algorithme K-moyennes. Par exemple, si 0 est spécifié dans la fonction pour la valeur de KmeansPetalClusters ou défini via une zone d'entrée de variable, les affectations de clusters sont automatiquement calculées pour l'ensemble de données en fonction d'un nombre optimal de clusters.