KMeans2D - funzione per grafici

KMeans2D() valuta le righe del grafico applicando il clustering K-means, e per ciascuna riga del grafico visualizza l'id cluster del cluster a cui è stato assegnato questo punto dati. Le colonne utilizzate dall'algoritmo di clustering sono determinate rispettivamente dai parametri coordinate_1 e coordinate_2. Sono entrambe aggregazioni. Il numero di cluster creati è determinato dal parametro num_clusters. I dati possono essere normalizzati in via opzionale dal parametro norm.

KMeans2D restituisce un valore per punto dati. Il valore restituito è duale ed è un valore intero corrispondente al cluster a cui ciascun punto dati è stato assegnato.

Sintassi:

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Tipo di dati restituiti: duale

Argomenti:

Argomenti
Argomento	Descrizione
num_clusters	Intero che specifica il numero di cluster.
coordinate_1	L'aggregazione che calcola la prima coordinata, in genere l'asse x del grafico a dispersione che può essere effettuato dal grafico. Il parametro aggiuntivo, coordinate_2, calcola la seconda coordinata.
norm	Il metodo di normalizzazione opzionale applicato alle serie di dati prima del clustering K-means. Possibili valori: 0 o ‘nessuno’ per l'assenza di normalizzazione 1 o ‘zscore’ per la normalizzazione z-score 2 o ‘minmax’ per la normalizzazione min-max Se non viene fornito alcun parametro o se il parametro fornito risulta errato, non viene applicata alcuna normalizzazione. Z-score normalizza i dati in base alla deviazione standard e media della funzionalità. Z-score non assicura che ciascuna funzionalità abbia la stessa scala, ma rappresenta un approccio migliore a min-max quando si ha a che fare con outlier. La normalizzazione min-max assicura che le funzionalità abbiano la stessa scala prelevando i valori minimo e massimo di ciascuna di esse e ricalcolando ciascun datapoint.

In questo esempio, creiamo un grafico a dispersione usando la serie di dati Iris, quindi utilizziamo KMeans per colorare i dati per espressione.

Creiamo inoltre una variabile per l'argomento num_clusters, quindi utilizziamo una casella di input variabile per modificare il numero di cluster.

La serie di dati Iris è disponibile pubblicamente in una serie di formati. I dati sono stati forniti come tabella inline da caricare usando l'editor caricamento dati in Qlik Sense. Notare che è stata aggiunta una colonna Id alla tabella dati per questo esempio.

Serie di dati Iris: Caricamento inline per l'editor caricamento dati in Qlik Sense

Dopo il caricamento dei dati in Qlik Sense, è possibile compiere le seguenti operazioni:

Trascinare un Grafico a dispersione in un nuovo foglio. Denominare il grafico Petal (colore per espressione).
Creare una variabile per specificare il numero di cluster. Per la variabile Nome, inserire KmeansPetalClusters. Per la variabile Definizione, inserire =2.
Configurare Dati per il grafico:
1. Sotto Dimensioni, scegliere id per il campo per Bolla. Inserire Id cluster per l'etichetta.
2. Sotto Misure, scegliere Sum([petal.length]) per l'espressione per asse X.
3. Sotto Misure, scegliere Sum([petal.width]) per l'espressione per asse Y.
Configurare Aspetto per il grafico:
1. Sotto Colori e legenda, scegliere Personalizzato per Colori.
2. Scegliere di colorare il grafico Per espressione.
3. Inserire quanto segue per Espressione: kmeans2d($(KmeansPetalClusters), Sum([petal.length]), Sum([petal.width]))
  Notare che KmeansPetalClusters è la variabile che impostiamo a 2.
  In alternativa, inserire quanto segue: kmeans2d(2, Sum([petal.length]), Sum([petal.width]))
4. Deselezionare la casella di controllo per L'espressione è un codice cromatico.
5. Inserire quanto segue per Etichetta: Id cluster
Aggiungere una casella Input variabile per il numero di cluster.
1. Sotto Oggetti personalizzati nel pannello Asset, scegliere Qlik Dashboard bundle. Se non si ha accesso al dashboard bundle, è comunque possibile modificare il numero di cluster utilizzando la variabile che abbiamo creato, oppure direttamente come intero nell'espressione.
2. Trascinare una casella Input variabile sul foglio.
3. Sotto Aspetto, fare clic su Generale.
4. Inserire quanto segue per Titolo: Cluster
5. Fare clic su Variabile.
6. Scegliere la seguente variabile per Nome: KmeansPetalClusters.
7. Scegliere Cursore per Mostra come.
8. Scegliere Valori, quindi configurare le impostazioni come richiesto.

Al termine della modifica, è possibile modificare il numero di cluster usando il cursore nella casella di input variabile Cluster.

Cluster colorati per espressione sul grafico Petal (colore per espressione). — Cluster colorati per espressione sul grafico Petal (colore per espressione)

Clustering automatico

Le funzioni KMeans supportano il clustering automatico mediante un metodo chiamato differenza di profondità (DeD, Depth Difference). Quando un utente imposta lo 0 per il numero di cluster, viene determinato un numero ottimale di cluster per tale set di dati. Notare che mentre un valore intero per il numero di cluster (k) non viene restituito esplicitamente, viene calcolato all'interno dell'algoritmo KMeans. Ad esempio, se viene specificato 0 nella funzione del valore di KmeansPetalClusters o se viene impostato mediante una casella di input variabile, le assegnazioni cluster vengono calcolate automaticamente per il set di dati in base a un numero ottimale di cluster.

Il metodo di differenza di profondità Kmeans determina il n. ottimale di cluster — Il metodo di differenza di profondità KMeans determina il numero ottimale di cluster quando (k) viene impostato a 0

Serie di dati Iris: Caricamento inline per l'editor caricamento dati in Qlik Sense

IrisData:
Load * Inline [
sepal.length, sepal.width, petal.length, petal.width, variety, id
5.1, 3.5, 1.4, 0.2, Setosa, 1
4.9, 3, 1.4, 0.2, Setosa, 2
4.7, 3.2, 1.3, 0.2, Setosa, 3
4.6, 3.1, 1.5, 0.2, Setosa, 4
5, 3.6, 1.4, 0.2, Setosa, 5
5.4, 3.9, 1.7, 0.4, Setosa, 6
4.6, 3.4, 1.4, 0.3, Setosa, 7
5, 3.4, 1.5, 0.2, Setosa, 8
4.4, 2.9, 1.4, 0.2, Setosa, 9
4.9, 3.1, 1.5, 0.1, Setosa, 10
5.4, 3.7, 1.5, 0.2, Setosa, 11
4.8, 3.4, 1.6, 0.2, Setosa, 12
4.8, 3, 1.4, 0.1, Setosa, 13
4.3, 3, 1.1, 0.1, Setosa, 14
5.8, 4, 1.2, 0.2, Setosa, 15
5.7, 4.4, 1.5, 0.4, Setosa, 16
5.4, 3.9, 1.3, 0.4, Setosa, 17
5.1, 3.5, 1.4, 0.3, Setosa, 18
5.7, 3.8, 1.7, 0.3, Setosa, 19
5.1, 3.8, 1.5, 0.3, Setosa, 20
5.4, 3.4, 1.7, 0.2, Setosa, 21
5.1, 3.7, 1.5, 0.4, Setosa, 22
4.6, 3.6, 1, 0.2, Setosa, 23
5.1, 3.3, 1.7, 0.5, Setosa, 24
4.8, 3.4, 1.9, 0.2, Setosa, 25
5, 3, 1.6, 0.2, Setosa, 26
5, 3.4, 1.6, 0.4, Setosa, 27
5.2, 3.5, 1.5, 0.2, Setosa, 28
5.2, 3.4, 1.4, 0.2, Setosa, 29
4.7, 3.2, 1.6, 0.2, Setosa, 30
4.8, 3.1, 1.6, 0.2, Setosa, 31
5.4, 3.4, 1.5, 0.4, Setosa, 32
5.2, 4.1, 1.5, 0.1, Setosa, 33
5.5, 4.2, 1.4, 0.2, Setosa, 34
4.9, 3.1, 1.5, 0.1, Setosa, 35
5, 3.2, 1.2, 0.2, Setosa, 36
5.5, 3.5, 1.3, 0.2, Setosa, 37
4.9, 3.1, 1.5, 0.1, Setosa, 38
4.4, 3, 1.3, 0.2, Setosa, 39
5.1, 3.4, 1.5, 0.2, Setosa, 40
5, 3.5, 1.3, 0.3, Setosa, 41
4.5, 2.3, 1.3, 0.3, Setosa, 42
4.4, 3.2, 1.3, 0.2, Setosa, 43
5, 3.5, 1.6, 0.6, Setosa, 44
5.1, 3.8, 1.9, 0.4, Setosa, 45
4.8, 3, 1.4, 0.3, Setosa, 46
5.1, 3.8, 1.6, 0.2, Setosa, 47
4.6, 3.2, 1.4, 0.2, Setosa, 48
5.3, 3.7, 1.5, 0.2, Setosa, 49
5, 3.3, 1.4, 0.2, Setosa, 50
7, 3.2, 4.7, 1.4, Versicolor, 51
6.4, 3.2, 4.5, 1.5, Versicolor, 52
6.9, 3.1, 4.9, 1.5, Versicolor, 53
5.5, 2.3, 4, 1.3, Versicolor, 54
6.5, 2.8, 4.6, 1.5, Versicolor, 55
5.7, 2.8, 4.5, 1.3, Versicolor, 56
6.3, 3.3, 4.7, 1.6, Versicolor, 57
4.9, 2.4, 3.3, 1, Versicolor, 58
6.6, 2.9, 4.6, 1.3, Versicolor, 59
5.2, 2.7, 3.9, 1.4, Versicolor, 60
5, 2, 3.5, 1, Versicolor, 61
5.9, 3, 4.2, 1.5, Versicolor, 62
6, 2.2, 4, 1, Versicolor, 63
6.1, 2.9, 4.7, 1.4, Versicolor, 64
5.6, 2.9, 3.6, 1.3, Versicolor, 65
6.7, 3.1, 4.4, 1.4, Versicolor, 66
5.6, 3, 4.5, 1.5, Versicolor, 67
5.8, 2.7, 4.1, 1, Versicolor, 68
6.2, 2.2, 4.5, 1.5, Versicolor, 69
5.6, 2.5, 3.9, 1.1, Versicolor, 70
5.9, 3.2, 4.8, 1.8, Versicolor, 71
6.1, 2.8, 4, 1.3, Versicolor, 72
6.3, 2.5, 4.9, 1.5, Versicolor, 73
6.1, 2.8, 4.7, 1.2, Versicolor, 74
6.4, 2.9, 4.3, 1.3, Versicolor, 75
6.6, 3, 4.4, 1.4, Versicolor, 76
6.8, 2.8, 4.8, 1.4, Versicolor, 77
6.7, 3, 5, 1.7, Versicolor, 78
6, 2.9, 4.5, 1.5, Versicolor, 79
5.7, 2.6, 3.5, 1, Versicolor, 80
5.5, 2.4, 3.8, 1.1, Versicolor, 81
5.5, 2.4, 3.7, 1, Versicolor, 82
5.8, 2.7, 3.9, 1.2, Versicolor, 83
6, 2.7, 5.1, 1.6, Versicolor, 84
5.4, 3, 4.5, 1.5, Versicolor, 85
6, 3.4, 4.5, 1.6, Versicolor, 86
6.7, 3.1, 4.7, 1.5, Versicolor, 87
6.3, 2.3, 4.4, 1.3, Versicolor, 88
5.6, 3, 4.1, 1.3, Versicolor, 89
5.5, 2.5, 4, 1.3, Versicolor, 90
5.5, 2.6, 4.4, 1.2, Versicolor, 91
6.1, 3, 4.6, 1.4, Versicolor, 92
5.8, 2.6, 4, 1.2, Versicolor, 93
5, 2.3, 3.3, 1, Versicolor, 94
5.6, 2.7, 4.2, 1.3, Versicolor, 95
5.7, 3, 4.2, 1.2, Versicolor, 96
5.7, 2.9, 4.2, 1.3, Versicolor, 97
6.2, 2.9, 4.3, 1.3, Versicolor, 98
5.1, 2.5, 3, 1.1, Versicolor, 99
5.7, 2.8, 4.1, 1.3, Versicolor, 100
6.3, 3.3, 6, 2.5, Virginica, 101
5.8, 2.7, 5.1, 1.9, Virginica, 102
7.1, 3, 5.9, 2.1, Virginica, 103
6.3, 2.9, 5.6, 1.8, Virginica, 104
6.5, 3, 5.8, 2.2, Virginica, 105
7.6, 3, 6.6, 2.1, Virginica, 106
4.9, 2.5, 4.5, 1.7, Virginica, 107
7.3, 2.9, 6.3, 1.8, Virginica, 108
6.7, 2.5, 5.8, 1.8, Virginica, 109
7.2, 3.6, 6.1, 2.5, Virginica, 110
6.5, 3.2, 5.1, 2, Virginica, 111
6.4, 2.7, 5.3, 1.9, Virginica, 112
6.8, 3, 5.5, 2.1, Virginica, 113
5.7, 2.5, 5, 2, Virginica, 114
5.8, 2.8, 5.1, 2.4, Virginica, 115
6.4, 3.2, 5.3, 2.3, Virginica, 116
6.5, 3, 5.5, 1.8, Virginica, 117
7.7, 3.8, 6.7, 2.2, Virginica, 118
7.7, 2.6, 6.9, 2.3, Virginica, 119
6, 2.2, 5, 1.5, Virginica, 120
6.9, 3.2, 5.7, 2.3, Virginica, 121
5.6, 2.8, 4.9, 2, Virginica, 122
7.7, 2.8, 6.7, 2, Virginica, 123
6.3, 2.7, 4.9, 1.8, Virginica, 124
6.7, 3.3, 5.7, 2.1, Virginica, 125
7.2, 3.2, 6, 1.8, Virginica, 126
6.2, 2.8, 4.8, 1.8, Virginica, 127
6.1, 3, 4.9, 1.8, Virginica, 128
6.4, 2.8, 5.6, 2.1, Virginica, 129
7.2, 3, 5.8, 1.6, Virginica, 130
7.4, 2.8, 6.1, 1.9, Virginica, 131
7.9, 3.8, 6.4, 2, Virginica, 132
6.4, 2.8, 5.6, 2.2, Virginica, 133
6.3, 2.8, 5.1, 1.5, Virginica, 134
6.1, 2.6, 5.6, 1.4, Virginica, 135
7.7, 3, 6.1, 2.3, Virginica, 136
6.3, 3.4, 5.6, 2.4, Virginica, 137
6.4, 3.1, 5.5, 1.8, Virginica, 138
6, 3, 4.8, 1.8, Virginica, 139
6.9, 3.1, 5.4, 2.1, Virginica, 140
6.7, 3.1, 5.6, 2.4, Virginica, 141
6.9, 3.1, 5.1, 2.3, Virginica, 142
5.8, 2.7, 5.1, 1.9, Virginica, 143
6.8, 3.2, 5.9, 2.3, Virginica, 144
6.7, 3.3, 5.7, 2.5, Virginica, 145
6.7, 3, 5.2, 2.3, Virginica, 146
6.3, 2.5, 5, 1.9, Virginica, 147
6.5, 3, 5.2, 2, Virginica, 148
6.2, 3.4, 5.4, 2.3, Virginica, 149
5.9, 3, 5.1, 1.8, Virginica, 150
];

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!

Lascia qui il tuo feedback