跳到主要內容

KMeansCentroid2D - 圖表函數

在此頁面

KMeansCentroid2D - 圖表函數

KMeansCentroid2D() 會套用 K 平均演算法叢集以評估圖表的列,而對於每個圖表列,會針對此資料點指派到的叢集顯示該叢集的所需座標。叢集演算法使用的欄由參數 coordinate_1 和 coordinate_2 分別判定。這些都是彙總。建立的叢集數量由 num_clusters 參數判定。可以選擇透過規範參數來正規化資料。

KMeansCentroid2D 每個資料點傳回一個值。傳回的值是雙值,也是對應於資料點指派到的叢集中心的位置座標之一。

Syntax:  

KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])

Return data type: 雙值

Arguments:  

引數
引數 描述
num_clusters 指定叢集數量的整數。
coordinate_no 所需的形心座標數 (例如對應至 x、y 或 z 軸)。
coordinate_1 計算第一個座標的彙總,通常是 x 軸 (屬於可從圖表製作的散佈圖)。其他參數 coordinate_2 會計算第二個座標。
norm

選用的正規化方法已在 KMeans 叢集之前套用至資料集。

可能值:

0 或「無」代表沒有正規化

1 或「zscore」代表 Z 分數正規化

2 或「minmax」代表最小-最大正規化

若沒有套用參數或者若套用的參數不正確,則不會套用任何正規化。

Z 分數根據功能平均值和標準差正規化資料。Z 分數無法確保每個功能都有相同的比例,但這在處理異常值時是優於最小-最大的方法。

最小-最大正規化可取用每一項的最小和最大值並重新計算每個資料點,以確保功能具有相同比例。

自動叢集

KMeans 函數使用稱為深度差 (DeD) 的方法支援自動叢集。若使用者對叢集數量設定 0,會判定該資料集的最佳叢集數量。請注意,若沒有明確以整數傳回叢集數量 (k),則會在 KMeans 演算法內計算。例如,若對 KmeansPetalClusters 的值在函數中指定 0,或透過變數輸入方塊設定 0,則會根據最佳叢集數量為資料集自動計算叢集指派。