KMeansND - Diagrammfunktion
KMeansND() wertet die Zeilen des Diagramms aus, indem K-means-Clustering angewandt wird. Für jede Diagrammzeile wird die Cluster-ID des Clusters angezeigt, dem dieser Datenpunkt zugewiesen wurde. Die vom Clustering-Algorithmus verwendeten Spalten werden von den Parametern coordinate_1, coordinate_2 usw. bis zu n Spalten festgelegt. Es handelt sich bei allen um Aggregierungen. Die Anzahl der erstellten Cluster wird durch den Parameter num_clusters bestimmt.
KMeansND gibt einen Wert pro Datenpunkt zurück. Der zurückgegebene Wert ist ein dualer Wert und ein Ganzzahlwert, der dem Cluster entspricht, dem der jeweilige Datenpunkt zugewiesen wurde.
Syntax:
KMeansND(num_clusters, num_iter, coordinate_1, coordinate_2 [,coordinate_3 [, ...]])
Rückgabe Datentyp: dual
Argumente:
Argument | Beschreibung |
---|---|
num_clusters | Ganze Zahl, die die Anzahl der Cluster angibt |
num_iter | Anzahl der Iterationen des Clustering mit neu initialisierten Cluster-Centern |
coordinate_1 | Die Aggregierung, die die erste Koordinate berechnet, in der Regel die x-Achse eines Punktdiagramms, das anhand des Diagramms erstellt werden kann. Mit den weiteren Parametern werden die zweite, dritte, vierte Koordinate usw. berechnet. |
Automatisches Clustering
KMeans-Funktionen unterstützen automatisches Clustering mit einer Methode, die als Tiefendifferenz bezeichnet wird. Wenn ein Benutzer 0 für die Anzahl der Cluster festlegt, wird eine optimale Anzahl Cluster für diesen Datensatz bestimmt. Beachten Sie, dass eine Ganzzahl für die Anzahl der Cluster (k) nicht explizit zurückgegeben, sondern im Rahmen des KMeans-Algorithmus berechnet wird. Wenn beispielsweise 0 in der Funktion für den Wert von KmeansPetalClusters oder über ein Variableneingabefeld festgelegt wird, werden Clusterzuweisungen automatisch für den Datensatz gestützt auf eine optimale Anzahl Cluster berechnet.