Gå till huvudinnehåll Gå till ytterligare innehåll

KMeansCentroid2D - diagramfunktion

KMeansCentroid2D() utvärderar raderna i diagrammet genom att tillämpa k-medelvärdesklustring, och för varje diagramrad visas önskad koordinat för klustret som den datapunkten tilldelats till. Kolumnerna som används av klusteralgoritmen avgörs av parametrarna coordinate_1 respektive coordinate_2. Dessa är båda aggregeringar. Antalet kluster som skapas avgörs av parametern num_clusters. Data normaliseras med normparametern (valfritt).

KMeansCentroid2D returnerar ett värde per datapunkt. Det returnerade värdet är en dual och är en av koordinaterna för positionen som motsvarar klustercentret datapunkten har tilldelats till.

Syntax:  

KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])

Returnerad datatyp: dual

Argument:  

Argument
Argument Beskrivning
num_clusters Heltal som anger antalet kluster.
coordinate_no Önskat koordinatantal för centroiderna (motsvarande, till exempel, x-, y- eller z-axeln).
coordinate_1 Aggregeringen som beräknar den första koordinaten, vanligtvis x-axeln på spridningsdiagrammet som kan skapas från diagrammet. Den ytterligare parametern, coordinate_2, beräknar den andra koordinaten.
norm

Den valfria normaliseringsmetoden tillämpas på datauppsättningen före k-medelvärdesklustring.

Möjliga värden:

0 eller ”none” för ingen normalisering

1 eller ”zscore” för z-poängsnormalisering

2 eller ”minmax” för min-max-normalisering

Om ingen parameter anges eller om den angivna parametern är felaktig används ingen normalisering.

Z-poäng normaliserar data baserat på funktionens median och standardavvikelse. Z-poäng säkerställer inte att varje funktion har samma skala men det fungerar bättre än min-max för behandling av outliers.

Min-max-normalisering säkerställer att funktionerna har samma skala genom att ta de minsta och största värdena för varje och räkna om varje datapunkt.

Automatisk klustring

KMeans-funktioner stöder automatisk klustring med en metod som kallas djupskillnad (depth difference, DeD). När användaren anger 0 som antal kluster bestäms ett optimalt antal kluster för den datauppsättningen. Observera att medan ett heltal som anges för antalet kluster (k) inte returneras explicit, beräknas det inom KMeans-algoritmen. Om till exempel 0 specificeras i funktionen för värdet av KmeansPetalClusters eller anges via en variabelindataruta, beräknas klustertilldelningar automatiskt för datauppsättningen baserat på ett optimalt antal kluster.

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!