KMeansND() wertet die Zeilen des Diagramms aus, indem K-means-Clustering angewandt wird. Für jede Diagrammzeile wird die Cluster-ID des Clusters angezeigt, dem dieser Datenpunkt zugewiesen wurde. Die vom Clustering-Algorithmus verwendeten Spalten werden von den Parametern coordinate_1, coordinate_2 usw. bis zu n Spalten festgelegt. Es handelt sich bei allen um Aggregierungen. Die Anzahl der erstellten Cluster wird durch den Parameter num_clusters bestimmt.
KMeansND gibt einen Wert pro Datenpunkt zurück. Der zurückgegebene Wert ist ein dualer Wert und ein Ganzzahlwert, der dem Cluster entspricht, dem der jeweilige Datenpunkt zugewiesen wurde.
Anzahl der Iterationen des Clustering mit neu initialisierten Cluster-Centern
coordinate_1
Die Aggregierung, die die erste Koordinate berechnet, in der Regel die x-Achse eines Punktdiagramms, das anhand des Diagramms erstellt werden kann. Mit den weiteren Parametern werden die zweite, dritte, vierte Koordinate usw. berechnet.
In diesem Beispiel erstellen wir ein Punktdiagramm anhand des Datensatzes Iris und verwenden dann KMeans, um die Daten nach Formel farblich zu kennzeichnen.
Daneben erstellen wir eine Variable für das Argument num_clusters und verwenden dann ein Variableneingabefeld, um die Anzahl der Cluster zu ändern.
Zudem erstellen wir eine Variable für das Argument num_iter und verwenden dann ein zweites Variableneingabefeld, um die Anzahl der Iterationen zu ändern.
Der Datensatz Iris ist in verschiedenen Formaten öffentlich verfügbar. Die Daten wurden als Inline-Tabelle bereitgestellt, die mit dem Dateneditor in Qlik Sense geladen werden kann. Beachten Sie, dass für dieses Beispiel der Datentabelle eine Spalte ID hinzugefügt wurde.
Nach dem Laden von Daten in Qlik Sense gehen wir wie folgt vor:
Ziehen Sie ein Punktdiagramm auf ein neues Arbeitsblatt. Geben Sie dem Diagramm den Namen Blütenblatt (Farbige Kennzeichnung nach Formel).
Erstellen Sie eine Variable, um die Anzahl der Cluster anzugeben. Geben Sie für die Variable NameKmeansPetalClusters ein. Geben Sie für die Variable Definition=2 ein.
Erstellen Sie eine Variable, um die Anzahl der Iterationen anzugeben. Geben Sie für die Variable NameKmeansNumberIterations ein. Geben Sie für die Variable Definition=1 ein.
Konfigurieren Sie Daten für das Diagramm:
Wählen Sie unter Dimensionen die Option ID für das Feld für Blase. Geben Sie als Bezeichnung die Cluster-ID ein.
Wählen Sie unter Kennzahlen die Option Sum([petal.length]) als Formel für X-Achse.
Wählen Sie unter Kennzahlen die Option Sum([petal.width]) als Formel für Y-Achse.
Dateneinstellungen für das Diagramm Blütenblatt (Farbige Kennzeichnung nach Formel)
Die Datenpunkte werden im Diagramm aufgetragen.
Datenpunkte im Diagramm Blütenblatt (Farbige Kennzeichnung nach Formel)
Konfigurieren Sie die Darstellung für das Diagramm:
Wählen Sie unter Farben und Legenden die Option Benutzerdefiniert für Farben.
Wählen Sie, die Farben des Diagramms Nach Formel festzulegen.
Geben Sie für Formel Folgendes ein: kmeansnd($(KmeansPetalClusters),$(KmeansNumberIterations), Sum([petal.length]), Sum([petal.width]),Sum([sepal.length]), Sum([sepal.width]))
Beachten Sie, dass KmeansPetalClusters die Variable ist, die wir auf 2 festlegen. KmeansNumberIterations ist die Variable, die wir auf 1 festlegen.
Geben Sie alternativ Folgendes ein: kmeansnd(2, 2, Sum([petal.length]), Sum([petal.width]),Sum([sepal.length]), Sum([sepal.width]))
Deaktivieren Sie das Kontrollkästchen für Die Formel ist ein Farbcode.
Geben Sie Folgendes für Bezeichnung ein: Cluster-ID
Darstellungseinstellungen für das Diagramm Blütenblatt (Farbige Kennzeichnung nach Formel)
Die beiden Cluster im Diagramm erhalten ihre Farbe entsprechend der KMeans-Formel.
Cluster mit Farbgebung nach Formel im Diagramm Blütenblatt (Farbige Kennzeichnung nach Formel)
Fügen Sie ein Variableneingabenfeld für die Anzahl der Cluster hinzu.
Wählen Sie unter Benutzerdefinierte Objekte im Extras-Fenster die Option Qlik Dashboard Bundle. Wenn kein Zugriff auf das Dashboard Bundle besteht, kann die Anzahl der Cluster dennoch mithilfe der erstellten Variable oder direkt als ganze Zahl in der Formel geändert werden.
Ziehen Sie ein Variableneingabenfeld auf das Arbeitsblatt.
Klicken Sie unter Darstellung auf Allgemein.
Geben Sie Folgendes als Titel ein: Cluster
Klicken Sie auf Variable.
Wählen Sie die folgende Variable für Name: KmeansPetalClusters.
Wählen Sie Schieberegler für Anzeigen als.
Wählen Sie Werte und konfigurieren Sie die Einstellungen wie erforderlich.
Darstellung für das Variableneingabefeld Cluster
Fügen Sie ein Variableneingabenfeld für die Anzahl der Iterationen hinzu.
Ziehen Sie ein Variableneingabenfeld auf das Arbeitsblatt.
Wählen Sie unter Darstellung die Option Allgemein.
Geben Sie Folgendes als Titel ein: Iterationen
Wählen Sie unter Darstellung die Option Variable.
Wählen Sie die folgende Variable unter Name: KmeansNumberIterations.
Konfigurieren Sie die zusätzlichen Einstellungen nach Bedarf.
Jetzt kann die Anzahl der Cluster und Iterationen anhand des Schiebereglers in den Variableneingabefeldern geändert werden.
Cluster mit Farbgebung nach Formel im Diagramm Blütenblatt (Farbige Kennzeichnung nach Formel)
Automatisches Clustering
KMeans-Funktionen unterstützen automatisches Clustering mit einer Methode, die als Tiefendifferenz bezeichnet wird. Wenn ein Benutzer 0 für die Anzahl der Cluster festlegt, wird eine optimale Anzahl Cluster für diesen Datensatz bestimmt. Beachten Sie, dass eine Ganzzahl für die Anzahl der Cluster (k) nicht explizit zurückgegeben, sondern im Rahmen des KMeans-Algorithmus berechnet wird. Wenn beispielsweise 0 in der Funktion für den Wert von KmeansPetalClusters oder über ein Variableneingabefeld festgelegt wird, werden Clusterzuweisungen automatisch für den Datensatz gestützt auf eine optimale Anzahl Cluster berechnet. Wenn im Iris-Datensatz 0 als Anzahl der Cluster ausgewählt wird, bestimmt der Algorithmus (mit automatischem Clustering) eine optimale Anzahl Cluster (3) für diesen Datensatz.
Die KMeans-Tiefendifferenzmethode bestimmt die optimale Anzahl an Clustern, wenn (k) auf 0 festgelegt wird.
Iris-Datensatz: Inline-Ladevorgang für Dateneditor in Qlik Sense
Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!