Vai al contenuto principale
KMeansCentroidND - funzione per grafici

IN QUESTA PAGINA

KMeansCentroidND - funzione per grafici

KMeansCentroidND() valuta le righe del grafico applicando il clustering K-means, e per ciascuna riga del grafico visualizza la coordinata desiderata del cluster a cui è stato assegnato questo punto dati. Le colonne utilizzate dall'algoritmo di clustering sono determinate dai parametri coordinate_1, coordinate_2, ecc. fino a n colonne. Sono tutte aggregazioni. Il numero di cluster creati è determinato dal parametro num_clusters.

KMeansCentroidND restituisce un valore per riga. Il valore restituito è duale ed è una delle coordinate della posizione corrispondente al centro del cluster a cui ciascun punto dati è stato assegnato.

Sintassi:  

 

KMeansCentroidND((num_clusters, num_iter, coordinate_no, coordinate_1, coordinate_2 [,coordinate_3 [, ...]])

Tipo di dati restituiti: duale

Argomenti:  

Argomenti
Argomento Descrizione
num_clusters Intero che specifica il numero di cluster.
num_iter Il numero di ripetizioni di clustering con centri cluster reinizializzati.
coordinate_no Il numero di coordinata desiderato dei centroid (corrispondente, ad esempio, all'asse x, y o z).
coordinate_1 L'aggregazione che calcola la prima coordinata, in genere l'asse x (di un grafico a dispersione che può essere effettuato dal grafico). I parametri aggiuntivi calcolano le seconde, terze e quarte coordinate, ecc.

Clustering automatico

Le funzioni KMeans supportano il clustering automatico mediante un metodo chiamato differenza di profondità (DeD, Depth Difference). Quando un utente imposta lo 0 per il numero di cluster, viene determinato un numero ottimale di cluster per tale set di dati. Notare che mentre un valore intero per il numero di cluster (k) non viene restituito esplicitamente, viene calcolato all'interno dell'algoritmo KMeans. Ad esempio, se viene specificato 0 nella funzione del valore di KmeansPetalClusters o se viene impostato mediante una casella di input variabile, le assegnazioni cluster vengono calcolate automaticamente per il set di dati in base a un numero ottimale di cluster.