Visualisierung des Bereichs und der Verteilung von numerischen Daten mit einem Boxplot
Dieses Beispiel zeigt die Erstellung eines Boxplots zum Anzeigen des Bereichs und der Verteilung von numerischen Daten anhand von täglichen Temperaturmessungen.
Datensatz
In diesem Beispiel werden die folgenden Wetterdaten verwendet.
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
Der geladene Datensatz enthält eine tägliche Durchschnittstemperatur-Messung einer Wetterstation in Nordschweden im Zeitraum 2010 bis 2017.
Kennzahl
Wir verwenden die Durchschnittstemperatur-Messung im Datensatz als Kennzahl, indem eine Kennzahl in den Master-Elementen mit dem Namen Temperature degrees Celsius und der Formel Avg([Average of the 24 hourly temperature observations in degrees Celsius]) erstellt wird.
Visualisierung
Wir fügen dem Arbeitsblatt einen Boxplot hinzu und setzen die folgenden Dateneigenschaften fest:
- Dimension: Date (Datum) und Year (Jahr). Die Reihenfolge ist wichtig. Date muss die erste Dimension sein.
- Kennzahl: Temperature degrees Celsius; die Kennzahl, die als Master-Element erstellt wurde.
In diesem Beispiel verwenden wir die Voreinstellung des Standard-Boxplots Standard (Türkisch) mit der Whisker-Länge 1,5 Quartilsabstände.
Entdecken
Der Boxplot visualisiert der Verteilung der täglichen Temperaturmessungen. Die Visualisierung ist nach der mittleren Temperaturreihenfolge sortiert. Die mittlere Temperatur für jedes Jahr wird durch die mittlere Zeile in jedem Feld (Box) dargestellt. Das Feld erstreckt sich vom ersten Quartil bis zum dritten Quartil, und die Whiskers erstrecken sich über 1,5 Quartilabstände. Es gibt auch eine Reihe von Ausreißerwerten. Das sind die Punkte, die außerhalb der Whiskers platziert sind. Sie können den Mauszeiger über einen Ausreißerpunkt bewegen und die Details anzeigen.
Im Boxplot sehen wir, dass das Jahr 2010 über das längste Feld (Box) und die längsten Whiskers verfügt. Das zeigt, dass das Jahr 2010 über die größte Verteilung der gemessenen Temperaturen verfügt. Es scheint auch das kälteste Jahr im Durchschnitt zu sein.
Der Bereich des Jahres 2017 ist klein, da der Datensatz nur Messungen aus den ersten Monaten des Jahres enthält.