跳到主要內容 跳至補充內容

KMeans2D - 圖表函數

KMeans2D() 會套用 K 平均演算法叢集以評估圖表的列,而對於每個圖表列,會針對此資料點指派到的叢集顯示叢集 ID。叢集演算法使用的欄由參數 coordinate_1 和 coordinate_2 分別判定。這些都是彙總。建立的叢集數量由 num_clusters 參數判定。可以選擇透過規範參數來正規化資料。

KMeans2D 每個資料點傳回一個值。傳回的值是雙值,也是對應於每個資料點指派到的叢集的整數值。

語法:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

傳回的資料類型: 雙值

引數:  

引數
引數 描述
num_clusters 指定叢集數量的整數。
coordinate_1 計算第一個座標的彙總,通常是 x 軸 (屬於可從圖表製作的散佈圖)。其他參數 coordinate_2 會計算第二個座標。
norm

選用的正規化方法已在 KMeans 叢集之前套用至資料集。

可能值:

0 或「無」代表沒有正規化

1 或「zscore」代表 Z 分數正規化

2 或「minmax」代表最小-最大正規化

若沒有套用參數或者若套用的參數不正確,則不會套用任何正規化。

Z 分數根據功能平均值和標準差正規化資料。Z 分數無法確保每個功能都有相同的比例,但這在處理異常值時是優於最小-最大的方法。

最小-最大正規化可取用每一項的最小和最大值並重新計算每個資料點,以確保功能具有相同比例。

自動叢集

KMeans 函數使用稱為深度差 (DeD) 的方法支援自動叢集。若使用者對叢集數量設定 0,會判定該資料集的最佳叢集數量。請注意,若沒有明確以整數傳回叢集數量 (k),則會在 KMeans 演算法內計算。例如,若對 KmeansPetalClusters 的值在函數中指定 0,或透過變數輸入方塊設定 0,則會根據最佳叢集數量為資料集自動計算叢集指派。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!

加入分析現代化計畫

Remove banner from view

透過分析現代化程式進行現代化而不犧牲寶貴的 QlikView 應用程式。 按一下這裡 取得更多資訊或聯繫: ampquestions@qlik.com