Vai al contenuto principale

KMeans2D - funzione per grafici

KMeans2D() valuta le righe del grafico applicando il clustering K-means, e per ciascuna riga del grafico visualizza l'id cluster del cluster a cui è stato assegnato questo punto dati. Le colonne utilizzate dall'algoritmo di clustering sono determinate rispettivamente dai parametri coordinate_1 e coordinate_2. Sono entrambe aggregazioni. Il numero di cluster creati è determinato dal parametro num_clusters. I dati possono essere normalizzati in via opzionale dal parametro norm.

KMeans2D restituisce un valore per punto dati. Il valore restituito è duale ed è un valore intero corrispondente al cluster a cui ciascun punto dati è stato assegnato.

Sintassi:  

KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])

Tipo di dati restituiti: duale

Argomenti:  

Argomenti
Argomento Descrizione
num_clusters Intero che specifica il numero di cluster.
coordinate_1 L'aggregazione che calcola la prima coordinata, in genere l'asse x del grafico a dispersione che può essere effettuato dal grafico. Il parametro aggiuntivo, coordinate_2, calcola la seconda coordinata.
norm

Il metodo di normalizzazione opzionale applicato alle serie di dati prima del clustering K-means.

Possibili valori:

0 o ‘nessuno’ per l'assenza di normalizzazione

1 o ‘zscore’ per la normalizzazione z-score

2 o ‘minmax’ per la normalizzazione min-max

Se non viene fornito alcun parametro o se il parametro fornito risulta errato, non viene applicata alcuna normalizzazione.

Z-score normalizza i dati in base alla deviazione standard e media della funzionalità. Z-score non assicura che ciascuna funzionalità abbia la stessa scala, ma rappresenta un approccio migliore a min-max quando si ha a che fare con outlier.

La normalizzazione min-max assicura che le funzionalità abbiano la stessa scala prelevando i valori minimo e massimo di ciascuna di esse e ricalcolando ciascun datapoint.