기본 콘텐츠로 건너뛰기

KMeansCentroid2D - 차트 함수

이 페이지에서

KMeansCentroid2D - 차트 함수

KMeansCentroid2D()는 k-평균클러스터링을 적용하여 차트의 행을 평가하고 각 차트 행에 이 데이터 포인트가 할당된 클러스터의 원하는 좌표를 표시합니다. 클러스터링 알고리즘에서 사용되는 열은 매개 변수 coordinate_1 및 coordinate_2에 의해 각각 결정됩니다. 둘 다 집계 열입니다. 생성된 클러스터 수는 num_clusters 매개 변수에 의해 결정됩니다. 데이터는 선택적으로 표준 매개 변수로 정규화할 수 있습니다.

KMeansCentroid2D는 데이터 포인트당 하나의 값을 반환합니다. 반환된 값은 이중 값이며 데이터 포인트가 할당된 클러스터 중심에 해당하는 위치의 좌표 중 하나입니다.

Syntax:  

KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])

Return data type: dual

Arguments:  

인수
인수 설명
num_clusters 클러스터 수를 지정하는 정수입니다.
coordinate_no 원하는 중심의 좌표 수(예: x 축, y 축 또는 z 축에 해당)입니다.
coordinate_1 첫 번째 좌표를 계산하는 집계는 일반적으로 차트로부터 만들 수 있는 스캐터 차트의 x 축입니다. 추가 매개 변수 coordinate_2는 두 번째 좌표를 계산합니다.
norm

선택적 정규화 방법이 KMeans 클러스터링 전에 데이터 집합에 적용됩니다.

가능한 값 :

정규화가 없는 경우 0 또는 '없음'

z 점수 정규화의 경우 1 또는 'zscore'

최소-최대 정규화의 경우 2 또는 'minmax'

매개 변수가 제공되지 않거나 제공된 매개 변수가 잘못된 경우 정규화가 적용되지 않습니다.

Z 점수는 기능 평균과 표준 편차를 기준으로 데이터를 정규화합니다. Z 점수는 각 기능이 동일한 척도를 갖도록 하지 않지만 이상값을 처리할 때 최소-최대보다 더 나은 접근 방식입니다.

최소-최대 정규화는 각각의 최솟값과 최댓값을 가져오고 각 데이터 포인트를 다시 계산하여 특성이 동일한 척도를 갖도록 합니다.

자동 클러스터링

KMeans 함수는 깊이 차(DeD)라는 방법을 사용하여 자동 클러스터링을 지원합니다. 사용자가 클러스터 수를 0으로 설정한 경우 해당 데이터 집합에 대한 최적의 클러스터 수가 결정됩니다. 클러스터 수의 정수(k)는 명시적으로 반환되지 않으며 KMeans 알고리즘 내에서 계산됩니다. 예를 들어 함수에서 0이 KmeansPetalClusters 값으로 지정되거나 변수 입력 상자를 통해 설정된 경우 최적의 클러스터 수를 기반으로 데이터 집합의 클러스터 할당이 자동으로 계산됩니다.