Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

KMeans2D — funkcja wykresu

KMeans2D() poddaje ocenie wiersze wykresu, stosując algorytm centroidów oraz wyświetlając dla każdego wiersza wykresu identyfikator klastra, do którego został przypisany ten punkt danych. Kolumny wykorzystywane przez algorytm grupowania są określane przez odpowiednio parametry coordinate_1 i coordinate_2. Oba te parametry są agregacjami. Liczba tworzonych klastrów jest określana przez parametr num_clusters. Dane można opcjonalnie znormalizować za pomocą parametru norm.

KMeans2D zwraca jedną wartość na punkt danych. Zwrócona wartość jest podwójna i stanowi wartość liczby całkowitej odpowiadającej klastrowi, do którego został przypisany każdy punkt danych.

Składnia:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Typ zwracanych danych: podwójny

Argumenty:  

Argumenty
Argument Opis
num_clusters Liczba całkowita określająca liczbę klastrów.
coordinate_1 Agregacja obliczająca pierwszą współrzędną, zwykle osi X wykresu punktowego, która może zostać utworzona z wykresu. Dodatkowy paramert, coordinate_2, oblicza drugą współrzędną.
norm

Opcjonalna metoda normalizacji stosowana do zestawów danych przed algorytmem centroidów.

Możliwe wartości:

0 lub „none” w przypadku braku normalizacji

1 lub „zscore” w przypadku normalizacji z-score

2 lub „minmax” dla normalizacji min.-maks.

Jeśli nie podano żadnego parametru lub jeśli podany parametr jest nieprawidłowy, żadna normalizacja nie jest stosowana.

Normalizacja z-score normalizuje dane w oparciu o średnią cechy i odchylenie standardowe. Normalizacja z-score nie gwarantuje, że każda cecha będzie mieć taką samą skalę, ale jest lepszym podejściem niż min.-maks. w przypadku wartości odstających.

Normalizacja min.-maks. zapewnia, że cechy mają tę samą skalę, biorąc minimalne i maksymalne wartości każdej z nich i przeliczając każdy punkt danych.

Automatyczne klastrowanie

Funkcje KMeans obsługują automatyczne grupowanie za pomocą metody zwanej różnicą głębokości (DeD). Gdy użytkownik ustawia liczbę klastrów na 0, określana jest optymalna liczba klastrów dla tego zestawu danych. Należy zauważyć, że liczba całkowita dla liczby klastrów (k) nie jest wyraźnie zwracana, ale obliczana w ramach algorytmu KMeans. Na przykład jeśli 0 jest określone w funkcji dla wartości KmeansPetalClusters lub ustalone poprzez pole wprowadzania zmiennych, przypisania klastrów są automatyczne obliczane dla zestawu danych opartego na optymalnej liczbie klastrów.

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!

Dołącz do Programu Modernizacji Analityki

Remove banner from view

Przeprowadź modernizację bez szkody dla Twoich cennych aplikacji QlikView za pomocą programu Analytics Modernization Program. Kliknij tutaj aby uzyskać więcej informacji lub skontaktuj się z nami: ampquestions@qlik.com