Ga naar hoofdinhoud Ga naar aanvullende inhoud

KMeans2D - diagramfunctie

KMeans2D() evalueert de rijen van het diagram door K-means clustering toe te passen. Voor elke rij van het diagram wordt de cluster-id weergegeven van het cluster waaraan dit gegevenspunt is toegewezen. De kolommen die worden gebruikt door het clustering-algoritme worden bepaald door de parameter coordinate_1 respectievelijk coordinate_2. Dit zijn beide aggregraties. De parameter num_clusters bepaalt het aantal clusters dat wordt gemaakt. Gegevens kunnen optioneel worden genormaliseerd door de normparameter.

KMeans2D retourneert één waarde per gegevenspunt. De geretourneerde waarde is een dubbele waarde en is het gehele getal dat overeenkomt met het cluster waaraan elk gegevenspunt is toegewezen.

Syntaxis:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Retourgegevenstypen: dual

Argumenten:  

Argumenten
Argument Beschrijving
num_clusters Het geheel getal dat het aantal clusters aangeeft.
coordinate_1 De aggregatie die de eerste coördinaat berekent, meestal de x-as van de verdelingsplot die op basis van het diagram kan worden gemaakt. De aanvullende parameter, coordinate_2, berekent de tweede coördinaat.
norm

De optionele normalisatiemethode die is toegepast op gegevensverzamelingen voordat K-means clustering wordt toegepast.

Mogelijke waarden:

0 of ‘geen’ voor geen normalisatie

1 of ‘zscore’ for z-score normalisatie

2 of ‘minmax’ voor min-max normalisatie

Als er geen parameter is opgegeven of de opgegeven parameter is onjuist, wordt er geen normalisatie toegepast.

De Z-score normaliseert gegevens op basis van de gemiddelde- en standaardafwijking. De Z-score zorgt er niet voor dat elke functie dezelfde schaal toebedeeld krijgt, maar het is een betere manier om aan te gaan met uitschieters dan de min-max-methode.

De min-max normalisatie zorgt ervoor dat functies dezelfde schaal toebedeeld krijgen door gebruik te maken van de minimum- en maximumwaarden van elk gegevenspunt en elk gegevenspunt opnieuw te berekenen.

Auto-clustering

De functies voor KMeans bieden ondersteuning voor automatische clustering met behulp van de methode diepteverschil (DeD). Als een gebruiker het aantal clusters instelt op 0, wordt een optimaal aantal clusters voor die gegevensverzameling bepaalt. Houd er rekening mee dat een geheel getal voor het aantal clusters (k) niet expliciet wordt geretourneerd, maar wel wordt berekend binnen het KMeans-algoritme. Als bijvoorbeeld 0 is opgegeven in de functie voor de waarde van KmeansPetalClusters of is ingesteld via een invoervak voor variabelen, worden clustertoewijzingen automatisch berekend voor de gegevensverzameling die is gebaseerd op een optimaal aantal clusters.

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!

Neem deel aan het Analytics Modernization Program

Remove banner from view

Moderniseer zonder uw waardevolle QlikView-apps op het spel te zetten met het Analytics Modernization Program. Klik hier voor meer informatie of om contact op te nemen: ampquestions@qlik.com