Gå till huvudinnehåll

KMeans2D - diagramfunktion

KMeans2D() utvärderar raderna i diagrammet genom att tillämpa k-medelvärdesklustring, och för varje diagramrad visas kluster-ID för klustret som den datapunkten tilldelats till. Kolumnerna som används av klusteralgoritmen avgörs av parametrarna coordinate_1 respektive coordinate_2. Dessa är båda aggregeringar. Antalet kluster som skapas avgörs av parametern num_clusters. Data normaliseras med normparametern (valfritt).

KMeans2D returnerar ett värde per datapunkt. Det returnerade värdet är en dual och är det heltalsvärde som motsvarar klustret varje datapunkt har tilldelats till.

Syntax:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Returnerad datatyp: dual

Argument:  

Argument
Argument Beskrivning
num_clusters Heltal som anger antalet kluster.
coordinate_1 Aggregeringen som beräknar den första koordinaten, vanligtvis x-axeln på spridningsdiagrammet som kan skapas från diagrammet. Den ytterligare parametern, coordinate_2, beräknar den andra koordinaten.
norm

Den valfria normaliseringsmetoden tillämpas på datauppsättningen före k-medelvärdesklustring.

Möjliga värden:

0 eller ”none” för ingen normalisering

1 eller ”zscore” för z-poängsnormalisering

2 eller ”minmax” för min-max-normalisering

Om ingen parameter anges eller om den angivna parametern är felaktig används ingen normalisering.

Z-poäng normaliserar data baserat på funktionens median och standardavvikelse. Z-poäng säkerställer inte att varje funktion har samma skala men det fungerar bättre än min-max för behandling av outliers.

Min-max-normalisering säkerställer att funktionerna har samma skala genom att ta de minsta och största värdena för varje och räkna om varje datapunkt.

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!