跳到主要内容

KMeans2D - 图表函数

KMeans2D() 通过应用 k 均值集群计算图表的行,并且对于每个图表行,显示此数据点已分配到的集群的集群 id。集群算法使用的列分别由参数 coordinate_1 和 coordinate_2 确定。二者都是聚合型。创建的集群数由 num_clusters 参数确定。数据可以通过规范参数进行规范化。

KMeans2D 每个数据点返回一个值。返回值是一个双重值,是与每个数据点分配到的集群相对应的整数值。

Syntax:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Return data type:

Arguments:  

参数
参数 说明
num_clusters 指定集群数的整数。
coordinate_1 计算第一个坐标的聚合,通常是散点图的 x 轴,可以从图表中生成。另外的参数 coordinate_2 计算第二个坐标。
norm

在 K-均值聚类之前应用于数据集的可选规范化方法。

可能的值:

对于规范化为 0 或 ‘none’

对于 z-score 规范化为 1 或 ‘zscore’

对于 min-max 规范化为 2 或 ‘minmax’

如果未提供参数或提供的参数不正确,则不应用规范化。

Z-score 基于特征均值和标准差对数据进行标准化。Z-score 并不能保证每个特征具有相同的尺度,但在处理异常值时,它是一种比 min-max 更好的方法。

Min-max 规范化通过获取每个数据点的最小值和最大值并重新计算每个数据点,确保特征具有相同的比例。