KMeans2D - diagramfunktion
KMeans2D() utvärderar raderna i diagrammet genom att tillämpa k-medelvärdesklustring, och för varje diagramrad visas kluster-ID för klustret som den datapunkten tilldelats till. Kolumnerna som används av klusteralgoritmen avgörs av parametrarna coordinate_1 respektive coordinate_2. Dessa är båda aggregeringar. Antalet kluster som skapas avgörs av parametern num_clusters. Data normaliseras med normparametern (valfritt).
KMeans2D returnerar ett värde per datapunkt. Det returnerade värdet är en dual och är det heltalsvärde som motsvarar klustret varje datapunkt har tilldelats till.
Syntax:
KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])
Returnerad datatyp: dual
Argument:
Argument | Beskrivning |
---|---|
num_clusters | Heltal som anger antalet kluster. |
coordinate_1 | Aggregeringen som beräknar den första koordinaten, vanligtvis x-axeln på spridningsdiagrammet som kan skapas från diagrammet. Den ytterligare parametern, coordinate_2, beräknar den andra koordinaten. |
norm |
Den valfria normaliseringsmetoden tillämpas på datauppsättningen före k-medelvärdesklustring. Möjliga värden: 0 eller ”none” för ingen normalisering 1 eller ”zscore” för z-poängsnormalisering 2 eller ”minmax” för min-max-normalisering Om ingen parameter anges eller om den angivna parametern är felaktig används ingen normalisering. Z-poäng normaliserar data baserat på funktionens median och standardavvikelse. Z-poäng säkerställer inte att varje funktion har samma skala men det fungerar bättre än min-max för behandling av outliers. Min-max-normalisering säkerställer att funktionerna har samma skala genom att ta de minsta och största värdena för varje och räkna om varje datapunkt. |
Automatisk klustring
KMeans-funktioner stöder automatisk klustring med en metod som kallas djupskillnad (depth difference, DeD). När användaren anger 0 som antal kluster bestäms ett optimalt antal kluster för den datauppsättningen. Observera att medan ett heltal som anges för antalet kluster (k) inte returneras explicit, beräknas det inom KMeans-algoritmen. Om till exempel 0 specificeras i funktionen för värdet av KmeansPetalClusters eller anges via en variabelindataruta, beräknas klustertilldelningar automatiskt för datauppsättningen baserat på ett optimalt antal kluster.