Wizualizowanie zakresu i rozkładu danych liczbowych za pomocą wykresu pudełkowego

Ten przykład przedstawia sposób tworzenia wykresu pudełkowego w celu zwizualizowania zakresu i rozkładu danych liczbowych przy użyciu codziennych pomiarów temperatury z Qlik DataMarket.

Zestaw danych

W tym przykładzie użyjemy danych pogodowych załadowanych ze źródła danych Weather for more than 2500 cities worldwide, które jest dostępne w Qlik DataMarket. Ten zestaw danych jest oparty na następujących selekcjach w Qlik DataMarket:

  • Location: Sweden > Gällivare Airport, Kiruna Airport, Kramfors Sollefteå Airport, Luleå Airport, Ostersund Froson, Skellefteå Airport, Umeå Airport, Örnsköldsvik Airport
  • Date: All time
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

Ładowany zestaw danych zawiera średnie dzienne z wyników pomiarów temperatury z szeregu stacji pogodowych na północy Szwecji w latach od 2010 do 2017.

Miara

Użyjemy temperatur średnich z zestawu danych jako miary, tworząc w obszarze Elementy główne miarę o nazwie Temperature degrees Celsius oraz wyrażenie Avg([Average of the 24 hourly temperature observations in degrees Celsius]).

Wizualizacja

Dodajemy wykres pudełkowy do arkusza i ustawiamy następujące właściwości danych:

  • Wymiar: Date (data) i Year (rok). Kolejność jest ważna; ponieważ Date musi być pierwszym wymiarem.
  • Miara: Temperature degrees Celsius — miara, która została utworzona jako element główny.

W tym przykładzie używamy domyślnego wstępnie skonfigurowanego wykresu pudełkowego Standard (Tukey) z długością wąsa wynoszącą 1,5 rozstępu ćwiartkowego.

Box plot visualization.

Wnioski

Wykres pudełkowy umożliwia wizualizację rozkładu temperatur dziennych. Wizualizacja jest posortowana w kolejności według temperatur średnich. Temperatura średnia dla każdego roku jest przedstawiana przez linię środkową w każdym polu. Pudełko rozciąga się od pierwszego kwartylu do trzeciego kwartylu, a wąsy obejmują zakresy 1,5 rozstępu ćwiartkowego. Istnieje również pewna liczba wartości odstających — są to punkty umieszczone poza wąsami. Aby zobaczyć szczegóły punktu wartości odstającej, można przesunąć wskaźnik myszy nad punkt.

Na wykresie pudełkowym widać, że rok 2010 ma najdłuższe pudełko i wąsy. To oznacza, że w roku 2010 wystąpił największy rozkład zmierzonych temperatur. Wygląda na to, że był to również rok z najniższymi temperatura średnimi.

Zakres roku 2017 jest niewielki, ponieważ zestaw danych zawiera tylko pomiary z pierwszych miesięcy roku.