KMeansCentroid2D - 图表函数
KMeansCentroid2D() 通过应用 k 均值集群计算图表的行,并且对于每个图表行,显示此数据点已分配到的集群的所需坐标。集群算法使用的列分别由参数 coordinate_1 和 coordinate_2 确定。二者都是聚合型。创建的集群数由 num_clusters 参数确定。数据可以通过规范参数进行规范化。
KMeansCentroid2D 每个数据点返回一个值。返回值是一个双重值,是与数据点分配到的集群中心相对应的位置坐标之一。
语法:
KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])
返回数据类型: 双
参数:
参数 | 说明 |
---|---|
num_clusters | 指定集群数的整数。 |
coordinate_no | 所需的质心坐标数字(例如,对应于 x、y 或 z 轴)。 |
coordinate_1 | 计算第一个坐标的聚合,通常是散点图的 x 轴,可以从图表中生成。另外的参数 coordinate_2 计算第二个坐标。 |
norm |
在 K-均值聚类之前应用于数据集的可选规范化方法。 可能的值: 对于规范化为 0 或 ‘none’ 对于 z-score 规范化为 1 或 ‘zscore’ 对于 min-max 规范化为 2 或 ‘minmax’ 如果未提供参数或提供的参数不正确,则不应用规范化。 Z-score 基于特征均值和标准差对数据进行标准化。Z-score 并不能保证每个特征具有相同的尺度,但在处理异常值时,它是一种比 min-max 更好的方法。 Min-max 规范化通过获取每个数据点的最小值和最大值并重新计算每个数据点,确保特征具有相同的比例。 |
自动集群
均值函数支持使用名为深度差 (DeD) 的方法支持自动聚合。如果用户为集群数设置 0,则会为该数据集确定最优集群数。注意,虽然没有显式返回集群数 (k) 的整数,但它是在均值算法中计算的。例如,如果在函数中为 KmeansPetalClusters 的值指定了 0 或通过变量输入框进行设置,则会根据最佳的集群数自动计算数据集的簇分配。