KMeans2D(), k-ortalama kümelemesi uygulayarak grafiğin satırlarını değerlendirir ve her bir grafik satırı için bu veri noktasının atandığı kümenin küme kimliğini görüntüler. Kümeleme algoritması tarafından kullanılan sütunlar sırasıyla coordinate_1 ve coordinate_2 parametreleri tarafından belirlenir. Bunların her ikisi de toplamadır. Oluşturulan küme sayısı, num_clusters parametresi tarafından belirlenir. Veriler isteğe bağlı olarak norm parametresi ile normalleştirilebilir.
KMeans2D, veri noktası başına tek bir değer döndürür. Döndürülen değer, ikili değerdir ve her bir veri noktasının atanmış olduğu kümeye karşılık gelen tamsayı değeridir.
Birinci koordinatı (genellikle grafikten oluşturulabilen dağılım grafiğinin x ekseni) hesaplayan toplama. coordinate_2 adlı ek parametre, ikinci koordinatı hesaplar.
norm
KMeans kümelemesinden önce veri kümelerine uygulanan isteğe bağlı normalleştirme yöntemi.
Olası değerler:
Normalleştirme yok için 0 veya "none"
z puanı normalleştirme için "zscore"
Min-maks normalleştirme için 2 veya "minmax"
Hiç parametre sağlanmadıysa veya sağlanan parametre yanlışsa, normalleştirme yok uygulanır.
Z puanı, özellik ortalamasına ve standart sapmaya göre verileri normalleştirir. Z puanı, her özelliğin aynı ölçeğe sahip olmasını sağlamaz, ancak aykırı değerlerle çalışırken min-maks'tan daha iyi bir yaklaşımdır.
Min-maks normalleştirme, her birinin minimum ve maksimum değerlerini alarak ve her bir veri noktasını yeniden hesaplayarak özelliklerin aynı ölçeğe sahip olmasını sağlar.
Bu örnekte, Iris veri kümesini kullanarak bir dağılım çizimi grafiği oluşturup verileri ifadeye göre renklendirmek için KMeans kullanırız.
Ayrıca num_clusters bağımsız değişkeni için bir değişken de oluşturur ve sonra küme sayısını değiştirmek için bir değişken giriş kutusu kullanırız.
Iris veri kümesi çeşitli biçimlerde genel kullanıma sunulur. Qlik Sense içinde veri yükleme düzenleyicisini kullanarak verileri yüklenecek satır içi tablo olarak sağladık. Bu örnek için veri tablosuna bir Kimlik sütunu eklediğimizi unutmayın.
Qlik Sense uygulamasına verileri yükledikten sonra şunları yaparız:
Bir Dağılım çizimi grafiğini yeni bir sayfaya sürükleyin. Grafiği Yaprak şema (ifadeye göre renk) olarak adlandırın.
Küme sayısını belirtmek için bir değişken oluşturun. Ad değişkeni için KmeansPetalClusters girin. Tanım değişkeni için =2 girin.
Grafik için Veri'yi yapılandırma:
Boyutlar bölümünde, Kabarcık için alanın kimlik bilgisini seçin. Etiket için Küme Kimliğini girin.
Hesaplamalar bölümünde, X ekseni ifadesi için Sum([petal.length]) seçeneğini belirleyin.
Hesaplamalar bölümünde, Y ekseni ifadesi için Sum([petal.width]) seçeneğini belirleyin.
Yaprak şema (ifadeye göre renk) grafiği için veri ayarları
Veri noktaları, grafikte çizilir.
Yaprak şema (ifadeye göre renk) grafiğindeki veri noktaları
Grafik için Görünüş'ü yapılandırma:
Renkler ve gösterge bölümünde, Renkler için Özel'i seçin.
Grafiği İfadeye göre renklendirmek için seçin.
İfade için şunu girin: kmeans2d($(KmeansPetalClusters), Sum([petal.length]), Sum([petal.width]))
KmeansPetalClusters öğesinin, 2 olarak ayarladığımız değişken olduğunu unutmayın.
Alternatif olarak şunu girin: kmeans2d(2, Sum([petal.length]), Sum([petal.width]))
İfade bir renk kodudur onay kutusunun seçimini kaldırın.
Etiket için şunu girin: Küme Kimliği
Yaprak (ifadeye göre renk) grafiğinin görünüş ayarları
Grafikteki iki küme, KMeans ifadesine göre renklendirilir.
Yaprak (ifadeye göre renk) grafiğinde ifadeye göre renklendirilen kümeler
Küme sayısı için bir Değişken girişi kutusu ekleyin.
Varlıklar panelindeki Özel nesneler bölümünde Qlik Gösterge Paneli paketi'ni seçin. Gösterge paneli paketine erişimimiz olmasaydı da oluşturduğumuz değişkeni kullanarak veya ifadede tamsayı olarak doğrudan küme sayısını değiştirebilirdik.
Bir Değişken girişi kutusunu sayfaya sürükleyin.
Görünüm bölümünde Genel'e tıklayın.
Başlık için şunu girin: Kümeler
Değişken'e tıklayın.
Ad için şu değişkeni seçin: KmeansPetalClusters.
Farklı göster için Kaydırıcı'yı seçin.
Değerler'i seçin ve ayarları gerektiği şekilde yapılandırın.
Kümeler değişkeni giriş kutusu görünümü
Düzenlememiz bittiğinde, Kümeler değişken giriş kutusundaki kaydırıcıyı kullanarak küme sayısını değiştirebiliriz.
Yaprak (ifadeye göre renk) grafiğinde ifadeye göre renklendirilen kümeler
Otomatik kümeleme
KMeans işlevleri, derinlik farkı (DeD) adlı bir yöntem kullanılarak otomatik kümelemeyi destekler. Bir kullanıcı, küme sayısı için 0 değerini ayarladığında, o veri kümesi için optimum küme sayısı belirlenir. Küme sayısı (k) için bir tamsayı, belirtik şekilde döndürülmese de KMeans algoritması içinde hesaplanır. Örneğin, KmeansPetalClusters değeri için işlevde 0 değeri belirtilirse veya bir değişken giriş kutusu aracılığıyla ayarlanırsa optimum bir küme sayısına dayalı olarak veri kümesi için küme atamaları otomatik şekilde hesaplanır.
K-Ortalamaları derinlik farkı yöntemi, (k) değeri 0 olarak ayarlandığı andaki optimum küme sayısını belirler
Iris veri kümesi: Qlik Sense içinde veri yükleme düzenleyicisi için satır içi yükleme