KMeansCentroid2D - Diagrammfunktion
KMeansCentroid2D() wertet die Zeilen des Diagramms aus, indem K-means-Clustering angewandt wird. Für jede Diagrammzeile wird die gewünschte Koordinate des Clusters angezeigt, dem dieser Datenpunkt zugewiesen wurde. Die vom Clustering-Algorithmus verwendeten Spalten werden von den Parametern coordinate_1 bzw. coordinate_2 festgelegt. Es handelt sich bei beiden um Aggregierungen. Die Anzahl der erstellten Cluster wird durch den Parameter num_clusters bestimmt. Daten können optional mit dem Normparameter normalisiert werden.
KMeansCentroid2D gibt einen Wert pro Datenpunkt zurück. Der zurückgegebene Wert ist ein dualer Wert und ist eine der Koordinaten der Position des Cluster-Zentrums, dem der jeweilige Datenpunkt zugewiesen wurde.
Syntax:
KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])
Rückgabe Datentyp: dual
Argumente:
Argument | Beschreibung |
---|---|
num_clusters | Ganze Zahl, die die Anzahl der Cluster angibt |
coordinate_no | Die gewünschte Koordinatennummer der Zentroiden (z. B. entsprechend der x-, y- oder z-Achse). |
coordinate_1 | Die Aggregierung, die die erste Koordinate berechnet, in der Regel die x-Achse des Punktdiagramms, das anhand des Diagramms erstellt werden kann. Der weitere Parameter, coordinate_2, berechnet die zweite Koordinate. |
norm |
Die optionale Normalisierungsmethode wird vor dem KMeans-Clustering auf Datensätze angewendet. Mögliche Werte: 0 oder „none“ für keine Normalisierung. 1 oder „zscore“ für z-score-Normalisierung 2 oder „minmax“ für min-max-Normalisierung Wenn kein Parameter bereitgestellt wird oder wenn der bereitgestellte Parameter falsch ist, wird keine Normalisierung angewendet. z-score normalisiert Daten gestützt auf Funktionsmittel und Standardabweichung. z-score stellt nicht sicher, dass jede Funktion die gleiche Skala hat, ist aber im Fall von Ausreißern eine besser geeignete Option als min-max. Min-max-Normalisierung sorgt dafür, dass die Funktionen die gleiche Skala haben, indem jeder Mindest- und Höchstwert erfasst und jeder Datenpunkt neu berechnet wird. |
Automatisches Clustering
KMeans-Funktionen unterstützen automatisches Clustering mit einer Methode, die als Tiefendifferenz bezeichnet wird. Wenn ein Benutzer 0 für die Anzahl der Cluster festlegt, wird eine optimale Anzahl Cluster für diesen Datensatz bestimmt. Beachten Sie, dass eine Ganzzahl für die Anzahl der Cluster (k) nicht explizit zurückgegeben, sondern im Rahmen des KMeans-Algorithmus berechnet wird. Wenn beispielsweise 0 in der Funktion für den Wert von KmeansPetalClusters oder über ein Variableneingabefeld festgelegt wird, werden Clusterzuweisungen automatisch für den Datensatz gestützt auf eine optimale Anzahl Cluster berechnet.