KMeans2D - grafik fonksiyonu
KMeans2D(), k-ortalama kümelemesi uygulayarak grafiğin satırlarını değerlendirir ve her bir grafik satırı için bu veri noktasının atandığı kümenin küme kimliğini görüntüler. Kümeleme algoritması tarafından kullanılan sütunlar sırasıyla coordinate_1 ve coordinate_2 parametreleri tarafından belirlenir. Bunların her ikisi de toplamadır. Oluşturulan küme sayısı, num_clusters parametresi tarafından belirlenir. Veriler isteğe bağlı olarak norm parametresi ile normalleştirilebilir.
KMeans2D, veri noktası başına tek bir değer döndürür. Döndürülen değer, ikili değerdir ve her bir veri noktasının atanmış olduğu kümeye karşılık gelen tamsayı değeridir.
Söz Dizimi:
KMeans2D(num_clusters, coordinate_1, coordinate_2 [, norm])
Dönüş verileri türü: dual
Bağımsız Değişkenler:
Bağımsız Değişken | Açıklama |
---|---|
num_clusters | Küme sayısını belirten tamsayı. |
coordinate_1 | Birinci koordinatı (genellikle grafikten oluşturulabilen dağılım grafiğinin x ekseni) hesaplayan toplama. coordinate_2 adlı ek parametre, ikinci koordinatı hesaplar. |
norm |
KMeans kümelemesinden önce veri kümelerine uygulanan isteğe bağlı normalleştirme yöntemi. Olası değerler: Normalleştirme yok için 0 veya "none" z puanı normalleştirme için "zscore" Min-maks normalleştirme için 2 veya "minmax" Hiç parametre sağlanmadıysa veya sağlanan parametre yanlışsa, normalleştirme yok uygulanır. Z puanı, özellik ortalamasına ve standart sapmaya göre verileri normalleştirir. Z puanı, her özelliğin aynı ölçeğe sahip olmasını sağlamaz, ancak aykırı değerlerle çalışırken min-maks'tan daha iyi bir yaklaşımdır. Min-maks normalleştirme, her birinin minimum ve maksimum değerlerini alarak ve her bir veri noktasını yeniden hesaplayarak özelliklerin aynı ölçeğe sahip olmasını sağlar. |
Otomatik kümeleme
KMeans işlevleri, derinlik farkı (DeD) adlı bir yöntem kullanılarak otomatik kümelemeyi destekler. Bir kullanıcı, küme sayısı için 0 değerini ayarladığında, o veri kümesi için optimum küme sayısı belirlenir. Küme sayısı (k) için bir tamsayı, belirtik şekilde döndürülmese de KMeans algoritması içinde hesaplanır. Örneğin, KmeansPetalClusters değeri için işlevde 0 değeri belirtilirse veya bir değişken giriş kutusu aracılığıyla ayarlanırsa optimum bir küme sayısına dayalı olarak veri kümesi için küme atamaları otomatik şekilde hesaplanır.