KMeansND() poddaje ocenie wiersze wykresu, stosując algorytm centroidów oraz wyświetlając dla każdego wiersza wykresu identyfikator klastra, do którego został przypisany ten punkt danych. Kolumny wykorzystywane przez algorytm grupowania są określone przez odpowiednio parametry coordinate_1 i coordinate_2 itd., aż do n kolumn. Wszystkie te parametry są agregacjami. Liczba tworzonych klastrów jest określana przez parametr num_clusters.
KMeansND zwraca jedną wartość na punkt danych. Zwrócona wartość jest podwójna i stanowi wartość liczby całkowitej odpowiadającej klastrowi, do którego został przypisany każdy punkt danych.
Liczba iteracji grupowania z ponownie inicjalizowanymi centrami klastrów.
coordinate_1
Agregacja obliczająca pierwszą współrzędną, zwykle osi X (wykresu punktowego, która może zostać utworzona z wykresu). Dodatkowe parametry obliczają kolejne współrzędne.
W tym przykładzie ukazane jest tworzenie wykresu punktowego z użyciem zestawu danych Iris, a następnie wykorzystanie KMeans do kolorowania danych według wyrażenia.
Można także utworzyć argument num_clusters, a następnie użyć pola wprowadzania zmiennej, aby zmienić liczbę klastrów.
Dodatkowo można utworzyć zmienną dla argumentu num_iter, a następnie użyć drugiego pola wprowadzania zmiennej, aby zmienić liczbę iteracji.
Zestaw danych Iris jest ogólnodostępny w różnorodnych formatach. Zapewniono dane w formie wbudowanej tabeli do ładowania z użyciem edytora ładowania danych w Qlik Sense. Należy zauważyć, że w tym przykładzie do tabeli danych dodano identyfikator kolumny.
Usuń zaznaczenie pola wyboru Wyrażenie jest kodem koloru.
Wprowadź następujące dla opcji Etykieta: Identyfikator klastra
Ustawienia wyglądu dla wykresu Petal (kolor według wyrażenia)
Dwa klastry na wykresie są pokolorowane według wyrażenia KMeans.
Klastry pokolorowane według wyrażenia na wykresie Petal (kolor według wyrażenia)
Dodaj pole Wprowadzanie zmiennych dla liczby klastrów.
Pod obszarem Obiekty niestandardowe w panelu Zasoby wybierz pakiet Qlik Dashboard bundle. W przypadku braku dostępu do pakietu dashboard bundle nadal można zmieniać liczbę klastrów, korzystając z utworzonej zmiennej lub bezpośrednio jako liczbę całkowitą w wyrażeniu.
Przeciągnij pole Wprowadzanie zmiennych do arkusza.
W sekcji Wygląd kliknij pozycję Ogólny.
Dla obszaru Tytuł wprowadź następujące dane: Klastry
Kliknij pozycję Zmienna.
Wybierz następującą zmienną dla obszaru Nazwa: KmeansPetalClusters.
Wybierz Suwak dla opcji Pokaż jako.
Wybierz Wartości i skonfiguruj ustawienia zgodnie z wymaganiami
Wygląd dla pola wprowadzania zmiennych Klastry
Dodaj pole Wprowadzanie zmiennych dla liczby iteracji.
Przeciągnij pole Wprowadzanie zmiennych do arkusza.
Pod obszarem Wygląd wybierz Ogólne.
Dla obszaru Tytuł wprowadź następujące dane: Iteracje
Pod obszarem Wygląd wybierz Zmienna.
Wybierz następującą zmienną pod obszarem Nazwa: KmeansNumberIterations.
Skonfiguruj dodatkowe ustawienia zgodnie z wymaganiami
Teraz można zmienić liczbę klastrów i iteracji z użyciem suwaków w polach wprowadzania zmiennych.
Klastry pokolorowane według wyrażenia na wykresie Petal (kolor według wyrażenia)
Automatyczne grupowanie
Funkcje KMeans obsługują automatyczne grupowanie za pomocą metody zwanej różnicą głębokości (DeD). Gdy użytkownik ustawia liczbę klastrów na 0, określana jest optymalna liczba klastrów dla tego zestawu danych. Należy zauważyć, że liczba całkowita dla liczby klastrów (k) nie jest wyraźnie zwracana, ale obliczana w ramach algorytmu KMeans. Na przykład jeśli 0 jest określone w funkcji dla wartości KmeansPetalClusters lub ustalone poprzez pole wprowadzania zmiennych, przypisania klastrów są automatyczne obliczane dla zestawu danych opartego na optymalnej liczbie klastrów. Biorąc pod uwagę zestaw danych Iris, jeśli jako liczbę klastrów wybrano 0, algorytm określi (automatycznie pogrupuje) optymalną liczbę klastrów (3) dla tego zestawu danych.
Metoda różnicy głębokości KMeans określa optymalną liczbę klastrów, gdy (k) ma wartość 0.
Zestaw danych Iris: Wbudowane ładowanie dla edytora ładowania danych w Qlik Sense