기본 콘텐츠로 건너뛰기

KMeans2D - 차트 함수

KMeans2D()는 k-평균클러스터링을 적용하여 차트의 행을 평가하고 각 차트 행에 이 데이터 포인트가 할당된 클러스터의 클러스터 ID를 표시합니다. 클러스터링 알고리즘에서 사용되는 열은 매개 변수 coordinate_1 및 coordinate_2에 의해 각각 결정됩니다. 둘 다 집계 열입니다. 생성된 클러스터 수는 num_clusters 매개 변수에 의해 결정됩니다. 데이터는 선택적으로 표준 매개 변수로 정규화할 수 있습니다.

KMeans2D는 데이터 포인트당 하나의 값을 반환합니다. 반환된 값은 이중 값이며 각 데이터 포인트가 할당된 클러스터에 해당하는 정수 값입니다.

Syntax:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Return data type: dual

Arguments:  

인수
인수 설명
num_clusters 클러스터 수를 지정하는 정수입니다.
coordinate_1 첫 번째 좌표를 계산하는 집계는 일반적으로 차트로부터 만들 수 있는 스캐터 차트의 x 축입니다. 추가 매개 변수 coordinate_2는 두 번째 좌표를 계산합니다.
norm

선택적 정규화 방법이 KMeans 클러스터링 전에 데이터 집합에 적용됩니다.

가능한 값 :

정규화가 없는 경우 0 또는 '없음'

z 점수 정규화의 경우 1 또는 'zscore'

최소-최대 정규화의 경우 2 또는 'minmax'

매개 변수가 제공되지 않거나 제공된 매개 변수가 잘못된 경우 정규화가 적용되지 않습니다.

Z 점수는 기능 평균과 표준 편차를 기준으로 데이터를 정규화합니다. Z 점수는 각 기능이 동일한 척도를 갖도록 하지 않지만 이상값을 처리할 때 최소-최대보다 더 나은 접근 방식입니다.

최소-최대 정규화는 각각의 최솟값과 최댓값을 가져오고 각 데이터 포인트를 다시 계산하여 특성이 동일한 척도를 갖도록 합니다.