KMeans2D - チャート関数
KMeans2D() は、K 平均法クラスタリングを適用してチャートの行を評価し、チャートの各行に、このデータ ポイントが割り当てられているクラスターのクラスター ID を表示します。クラスタリング アルゴリズムで使用される列は,それぞれ,パラメーター coordinate_1 と coordinate_2 によって決定されます。これらはともに集計です。作成されるクラスターの数は、num_clusters パラメーターによって決定されます。データは、オプションで norm パラメーターによって正規化できます。
KMeans2D は、データ ポイントごとに 1 つの値を返します。戻り値はデュアル値であり、各データ ポイントが割り当てられているクラスターに対応する整数値です。
構文:
KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])
戻り値データ型: デュアル
引数:
引数 | 説明 |
---|---|
num_clusters | クラスターの数を指定する整数。 |
coordinate_1 | チャートから作成できる散布図の最初の座標 (通常は x 軸) を計算する集約です。追加のパラメーターである coordinate_2 は、2 番目の座標を計算します。 |
norm |
KMeans クラスタリングの前にデータセットに適用されるオプションの正規化方法。 考えられる値: 正規化なしの場合は 0 または「なし」 z-score の正規化の場合は 1 または「zscore」 min-max の正規化の場合は 2 または「minmax」 パラメーターが指定されていない場合、または指定されたパラメーターが正しくない場合、正規化は適用されません。 z-score は、機能平均と標準偏差に基づいてデータを正規化します。z-score は、各機能のスケールが同じであることを保証するものではありませんが、外れ値を処理する場合は、min-max よりも優れたアプローチです。 min-max の正規化は、それぞれの最小値と最大値を取得し、各データ ポイントを再計算することにより、機能が同じスケールを持つことを保証します。 |
自動クラスタリング
KMeans 関数は、深度差異 (DeD) と呼ばれる方法を使用した自動クラスタリングをサポートします。ユーザーがクラスターの数に 0 を設定すると、そのデータセットに最適なクラスターの数が決定されます。クラスター数 (k) の整数は明示的に返されませんが、KMeans アルゴリズム内で計算されることに注意してください。例えば、KmeansPetalClusters の値の関数で 0 が指定されている場合、または変数入力ボックスを介して設定されている場合、クラスターの割り当ては、クラスターの最適な数に基づいてデータセットに対して自動的に計算されます。