KMeansCentroidND - diagramfunctie
KMeansCentroidND() evalueert de rijen van het diagram door K-means clustering toe te passen. Voor elke rij van het diagram wordt de gewenste coördinaat weergegeven van het cluster waaraan dit gegevenspunt is toegewezen. De kolommen die worden gebruikt door het clustering-algoritme worden bepaald door de parameter coordinate_1 respectievelijk coordinate_2. Dit zijn beide aggregaties. De parameter num_clusters bepaalt het aantal clusters dat wordt gemaakt.
KMeansCentroidND retourneert één waarde per gegevenspunt. De geretourneerde waarde is een dubbele waarde en is een van de coördinaten van de positie die overeenkomt met het middenpunt van het cluster waaraan elk gegevenspunt is toegewezen.
Syntaxis:
KMeansCentroidND((num_clusters, num_iter, coordinate_no, coordinate_1, coordinate_2 [,coordinate_3 [, ...]])
Retourgegevenstypen: dual
Argumenten:
Argument | Beschrijving |
---|---|
num_clusters | Het geheel getal dat het aantal clusters aangeeft. |
num_iter | Het aantal iteraties voor clusters met opnieuw geïnitialiseerde middenpunten. |
coordinate_no | Het gewenste aantal coördinaten van de zwaartepunten (die bijvoorbeeld overeenkomen met de x-, y-, of z-as). |
coordinate_1 | De aggregatie die de eerste coördinaat berekent, meestal de x-as (van de verdelingsplot die op basis van het diagram kan worden gemaakt). De aanvullende parameters berekenen de tweede, derde en vierde coördinaat, etc. |
Automatische clustering
De functies voor KMeans bieden ondersteuning voor automatische clustering met behulp van de methode diepteverschil (DeD). Als een gebruiker het aantal clusters instelt op 0, wordt een optimaal aantal clusters voor die gegevensverzameling bepaalt. Houd er rekening mee dat een geheel getal voor het aantal clusters (k) niet expliciet wordt geretourneerd, maar wel wordt berekend binnen het KMeans-algoritme. Als bijvoorbeeld 0 is opgegeven in de functie voor de waarde van KmeansPetalClusters of is ingesteld via een invoervak voor variabelen, worden clustertoewijzingen automatisch berekend voor de gegevensverzameling die is gebaseerd op een optimaal aantal clusters.