Dağılım grafiği kullanarak bir boyuttaki hesaplama değerlerinin dağılımını görüntüleme
Bu örnekte, hava durumu verileri kullanılarak hesaplama değerlerinin bir boyuttaki dağılımını görüntülemek için bir dağılım grafiğinin nasıl oluşturulacağı gösterilmektedir.
Veri kümesi
Bu örnekte, aşağıdaki hava durumu verilerini kullanacağız.
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
Yüklü veri kümesi 2010 ile 2017 yılları arasında İsveç'in kuzeyindeki bir hava durumu istasyonundan alınan ortalama günlük sıcaklık ölçümlerini içerir.
Hesaplama
Ana öğelerde Temperature degrees Celsius adlı bir hesaplama ve Avg([Average of the 24 hourly temperature observations in degrees Celsius]) ifadesini oluşturarak veri kümesindeki ortalama sıcaklık ölçümünü hesaplama olarak kullanıyoruz.
Görselleştirme
Sayfaya bir dağılım grafiği ekliyor ve aşağıdaki özellikleri uyguluyoruz:
- Boyut: Date (tarih) ve Year (yıl). Sıralama önemlidir. İlk boyutun Date olması gerekir.
- Hesaplama: Temperature degrees Celsius, ana öğe olarak oluşturulan hesaplamadır.
Keşif
Dağılım grafiği günlük sıcaklık hesaplamaları dağılımını görselleştirir. Görselleştirme yıla göre sıralanır ve her nokta bir sıcaklık hesaplamasını gösterir.
Görselleştirmede 2012 yılının yaklaşık -40 dereceyle en düşük sıcaklık hesaplamasına sahip olduğunu görebiliyoruz. Ayrıca 2016 yılının en büyük sıcaklık hesaplaması dağılımına sahip olduğunu da görebiliyoruz. Dağılım grafiğinde çok sayıda nokta olduğu için kümeleri ve aykırı değerleri tespit etmek zor olabilir ancak 2017 yılı iki düşük aykırı değere sahiptir. Fare işaretçisiyle noktanın üzerine gelerek ayrıntıları görüntüleyebilirsiniz.