Kutu çizimi kullanarak sayısal verilerin aralık ve dağılımını görselleştirme

Bu örnekte, Qlik DataMarket uygulamasındaki günlük sıcaklık ölçümlerini kullanarak sayısal verilerin aralık ve dağılımını görselleştirmek için kutu çiziminin nasıl oluşturulacağı gösterilmektedir.

Veri kümesi

Bu örnekte Qlik DataMarket içindeki Weather for more than 2500 cities worldwide veri kaynağından yüklenen hava durumu verilerini kullanacağız. Veri kümesi Qlik DataMarket içindeki şu seçimleri temel almaktadır:

  • Location: Sweden > Gällivare Airport, Kiruna Airport, Kramfors Sollefteå Airport, Luleå Airport, Ostersund Froson, Skellefteå Airport, Umeå Airport, Örnsköldsvik Airport
  • Date: All time
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

Yüklü veri kümesi 2010 ile 2017 yılları arasında İsveç'in kuzeyindeki bir dizi hava durumu istasyonundan alınan ortalama günlük sıcaklık ölçümlerini içerir.

Hesaplama

Ana öğelerde Temperature degrees Celsius adlı bir hesaplama ve Avg([Average of the 24 hourly temperature observations in degrees Celsius]) ifadesini oluşturarak veri kümesindeki ortalama sıcaklık ölçümünü hesaplama olarak kullanıyoruz.

Görselleştirme

Sayfaya bir kutu çizimi ekliyor ve aşağıdaki özellikleri uyguluyoruz:

  • Boyut: Date (tarih) ve Year (yıl). Sıralama önemlidir. İlk boyutun Date olması gerekir.
  • Hesaplama: Temperature degrees Celsius, ana öğe olarak oluşturulan hesaplamadır.

Bu örnekte varsayılan kutu çizimi önayarı olan Standart (Tukey) değerini ve 1,5 çeyrek içi aralık yatay çizgiyi kullanıyoruz.

Box plot visualization.

Keşif

Kutu çizimi günlük sıcaklık hesaplamaları dağılımını görselleştirir. Görselleştirme ortalama sıcaklık sıralamasına göre düzenlenir. Her yılın ortalama sıcaklığı kutunun ortasındaki çizgiyle gösterilir. Kutu ilk çeyrekten üçüncü çeyreğe kadar uzanır ve yatay çizgiler 1,5 çeyrek içi aralıklarına uzanır. Aynı zamanda yatay çizgilerin dışında bulunan bir dizi aykırı değer de vardır. Fare işaretçisiyle aykırı değer noktası üzerine gelerek ayrıntıları görüntüleyebilirsiniz.

Kutu çiziminde 2010 yılının en uzun kutuya ve yatay çizgiye sahip olduğunu görebiliriz. Bu da 2010 yılının en geniş sıcaklık dağıtımı hesaplamasına sahip olduğunu gösterir. Bu yıl aynı zamanda en düşük sıcaklık ortalamasına sahip olan yıldır.

Veri kümesi yalnızca yılın ilk aylarındaki ölçümleri içerdiğinden 2017'nin aralığı küçüktür.