KMeans2D - 圖表函數
KMeans2D() 會套用 K 平均演算法叢集以評估圖表的列,而對於每個圖表列,會針對此資料點指派到的叢集顯示叢集 ID。叢集演算法使用的欄由參數 coordinate_1 和 coordinate_2 分別判定。這些都是彙總。建立的叢集數量由 num_clusters 參數判定。可以選擇透過規範參數來正規化資料。
KMeans2D 每個資料點傳回一個值。傳回的值是雙值,也是對應於每個資料點指派到的叢集的整數值。
語法:
KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])
傳回的資料類型: 雙值
引數:
引數 | 描述 |
---|---|
num_clusters | 指定叢集數量的整數。 |
coordinate_1 | 計算第一個座標的彙總,通常是 x 軸 (屬於可從圖表製作的散佈圖)。其他參數 coordinate_2 會計算第二個座標。 |
norm |
選用的正規化方法已在 KMeans 叢集之前套用至資料集。 可能值: 0 或「無」代表沒有正規化 1 或「zscore」代表 Z 分數正規化 2 或「minmax」代表最小-最大正規化 若沒有套用參數或者若套用的參數不正確,則不會套用任何正規化。 Z 分數根據功能平均值和標準差正規化資料。Z 分數無法確保每個功能都有相同的比例,但這在處理異常值時是優於最小-最大的方法。 最小-最大正規化可取用每一項的最小和最大值並重新計算每個資料點,以確保功能具有相同比例。 |
自動叢集
KMeans 函數使用稱為深度差 (DeD) 的方法支援自動叢集。若使用者對叢集數量設定 0,會判定該資料集的最佳叢集數量。請注意,若沒有明確以整數傳回叢集數量 (k),則會在 KMeans 演算法內計算。例如,若對 KmeansPetalClusters 的值在函數中指定 0,或透過變數輸入方塊設定 0,則會根據最佳叢集數量為資料集自動計算叢集指派。