KMeansND - fonction de graphique
KMeansND() évalue les lignes du graphique en appliquant un algorithme des k-moyennes, et, pour chaque ligne du graphique, il évalue l'id du cluster auquel ce point de données a été affecté. Les colonnes utilisées par l’algorithme sont déterminées par les paramètres coordinate_1, coordinate_2, etc., jusqu'à n colonnes. Ces paramètres sont tous des agrégations. Le nombre de clusters créés est déterminé par le paramètre num_clusters.
KMeansND renvoie une valeur par point de données. La valeur renvoyée est une valeur double et est la valeur d'entier correspondant au cluster auquel chaque point de données a été affecté.
KMeansND(num_clusters, num_iter, coordinate_1, coordinate_2 [,coordinate_3 [, ...]])
double
Argument | Description |
---|---|
num_clusters | Entier qui spécifie le nombre de clusters. |
num_iter | Le nombre d'itérations de clustering avec des centres de cluster réinitialisés. |
coordinate_1 | L'agrégation calcule la première coordonnée, généralement l'axe x (d'un nuage de points qui peut être obtenu à partir du graphique). Les paramètres supplémentaires calculent les deuxième, troisième et quatrième coordonnées, etc. |
Regroupement automatique
Les fonctions K-moyennes prennent en charge le clustering automatique via une méthode dite Différence de profondeur (DeD - Depth Difference). Quand un utilisateur définit 0 comme nombre de clusters, un nombre optimal de clusters est déterminé pour cet ensemble de données. Notez que même si entier n'est pas explicitement renvoyé pour le nombre de clusters (k), il est calculé dans l'algorithme K-moyennes. Par exemple, si 0 est spécifié dans la fonction pour la valeur de KmeansPetalClusters ou défini via une zone d'entrée de variable, les affectations de clusters sont automatiquement calculées pour l'ensemble de données en fonction d'un nombre optimal de clusters.