Wizualizowanie zakresu i rozkładu danych liczbowych za pomocą wykresu pudełkowego
Ten przykład przedstawia sposób tworzenia wykresu pudełkowego w celu zwizualizowania zakresu i rozkładu danych liczbowych przy użyciu codziennych pomiarów temperatury z .
Zestaw danych
W tym przykładzie użyjemy następujących danych o pogodzie.
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
Ładowany zestaw danych zawiera średnie dzienne z wyników pomiarów temperatury na stacji meteorologicznej na północy Szwecji w latach od 2010 do 2017.
Miara
Użyjemy temperatur średnich z zestawu danych jako miary, tworząc w obszarze Elementy główne miarę o nazwie Temperature degrees Celsius oraz wyrażenie Avg([Average of the 24 hourly temperature observations in degrees Celsius]).
Wizualizacja
Dodajemy wykres pudełkowy do arkusza i ustawiamy następujące właściwości danych:
- Wymiar: Date (data) i Year (rok). Kolejność jest ważna, ponieważ Date musi być pierwszym wymiarem.
- Miara: Temperature degrees Celsius — miara, która została utworzona jako element główny.
W tym przykładzie używamy domyślnego wstępnie skonfigurowanego wykresu pudełkowego Standard (Tukey) z długością wąsa wynoszącą 1,5 rozstępu ćwiartkowego.
Wnioski
Wykres pudełkowy umożliwia wizualizację rozkładu temperatur dziennych. Wizualizacja jest posortowana w kolejności według temperatur średnich. Temperatura średnia dla każdego roku jest przedstawiana przez linię środkową w każdym polu. Pudełko rozciąga się od pierwszego kwartylu do trzeciego kwartylu, a wąsy obejmują zakresy 1,5 rozstępu ćwiartkowego. Istnieje również pewna liczba wartości odstających — są to punkty umieszczone poza wąsami. Aby zobaczyć szczegóły punktu wartości odstającej, można przesunąć wskaźnik myszy nad punkt.
Na wykresie pudełkowym widać, że rok 2010 ma najdłuższe pudełko i wąsy. To oznacza, że w roku 2010 wystąpił największy rozkład zmierzonych temperatur. Wygląda na to, że był to również rok z najniższymi temperatura średnimi.
Zakres roku 2017 jest niewielki, ponieważ zestaw danych zawiera tylko pomiary z pierwszych miesięcy roku.