Gå till huvudinnehåll

KMeans2D - diagramfunktion

KMeans2D() utvärderar raderna i diagrammet genom att tillämpa k-medelvärdesklustring och för varje diagramrad visas kluster-ID för klustret som den datapunkten tilldelats till. Kolumnerna som används av klusteralgoritmen avgörs av parametrarna coordinate_1 respektive coordinate_2. Dessa är båda aggregeringar. Antalet kluster som skapas avgörs av parametern num_clusters. Data normaliseras med normparametern (valfritt).

KMeans2D returnerar ett värde per datapunkt. Det returnerade värdet är en dual och är det heltalsvärde som motsvarar klustret varje datapunkt har tilldelats till.

Syntax:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Return data type: dual

Arguments:  

Argument
Argument Beskrivning
num_clusters Heltal som anger antalet kluster.
coordinate_1 Aggregeringen som beräknar den första koordinaten, vanligtvis x-axeln på spridningsdiagrammet som kan skapas från diagrammet. Den ytterligare parametern, coordinate_2, beräknar den andra koordinaten.
norm

Den valfria normaliseringsmetoden tillämpas på datauppsättningen före k-medelvärdesklustring.

Möjliga värden:

0 eller ”none” för ingen normalisering

1 eller ”zscore” för z-poängsnormalisering

2 eller ”minmax” för min-max-normalisering

Om ingen parameter anges eller om den angivna parametern är felaktig används ingen normalisering.

Z-poäng normaliserar data baserat på funktionens median och standardavvikelse. Z-poäng säkerställer inte att varje funktion har samma skala men det fungerar bättre än min-max för behandling av outliers.

Min-max-normalisering säkerställer att funktionerna har samma skala genom att ta de minsta och största värdena för varje och räkna om varje datapunkt.