Vai al contenuto principale Passa a contenuto complementare

KMeansCentroid2D - funzione per grafici

KMeansCentroid2D() valuta le righe del grafico applicando il clustering K-means, e per ciascuna riga del grafico visualizza la coordinata desiderata del cluster a cui è stato assegnato questo punto dati. Le colonne utilizzate dall'algoritmo di clustering sono determinate rispettivamente dai parametri coordinate_1 e coordinate_2. Sono entrambe aggregazioni. Il numero di cluster creati è determinato dal parametro num_clusters. I dati possono essere normalizzati in via opzionale dal parametro norm.

KMeansCentroid2D restituisce un valore per punto dati. Il valore restituito è duale ed è una delle coordinate della posizione corrispondente al centro del cluster a cui ciascun punto dati è stato assegnato.

Sintassi:  

KMeansCentroid2D(num_clusters, coordinate_no, coordinate_1, coordinate_2 [, norm])

Tipo di dati restituiti: duale

Argomenti:  

Argomenti
Argomento Descrizione
num_clusters Intero che specifica il numero di cluster.
coordinate_no Il numero di coordinata desiderato dei centroid (corrispondente, ad esempio, all'asse x, y o z).
coordinate_1 L'aggregazione che calcola la prima coordinata, in genere l'asse x del grafico a dispersione che può essere effettuato dal grafico. Il parametro aggiuntivo, coordinate_2, calcola la seconda coordinata.
norm

Il metodo di normalizzazione opzionale applicato alle serie di dati prima del clustering K-means.

Possibili valori:

0 o ‘nessuno’ per l'assenza di normalizzazione

1 o ‘zscore’ per la normalizzazione z-score

2 o ‘minmax’ per la normalizzazione min-max

Se non viene fornito alcun parametro o se il parametro fornito risulta errato, non viene applicata alcuna normalizzazione.

Z-score normalizza i dati in base alla deviazione standard e media della funzionalità. Z-score non assicura che ciascuna funzionalità abbia la stessa scala, ma rappresenta un approccio migliore a min-max quando si ha a che fare con outlier.

La normalizzazione min-max assicura che le funzionalità abbiano la stessa scala prelevando i valori minimo e massimo di ciascuna di esse e ricalcolando ciascun datapoint.

Clustering automatico

Le funzioni KMeans supportano il clustering automatico mediante un metodo chiamato differenza di profondità (DeD, Depth Difference). Quando un utente imposta lo 0 per il numero di cluster, viene determinato un numero ottimale di cluster per tale set di dati. Notare che mentre un valore intero per il numero di cluster (k) non viene restituito esplicitamente, viene calcolato all'interno dell'algoritmo KMeans. Ad esempio, se viene specificato 0 nella funzione del valore di KmeansPetalClusters o se viene impostato mediante una casella di input variabile, le assegnazioni cluster vengono calcolate automaticamente per il set di dati in base a un numero ottimale di cluster.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!