Ga naar hoofdinhoud

Visualisatie van bereik en verdeling van numerieke gegevens in boxplots

OP DEZE PAGINA

Visualisatie van bereik en verdeling van numerieke gegevens in boxplots

In dit voorbeeld ziet u hoe u een boxplot maakt voor het visualiseren van het bereik en de verdeling van numerieke gegevens, waarbij dagtemperatuurmetingen worden gebruikt.

Box plot visualization.

Gegevensset

In dit voorbeeld gebruiken we de volgende weergegevens.

  • Location: Sweden > G√§llivare Airport
  • Date range: all data from 2010 to 2017
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

De geladen gegevensbron bevat een dagelijkse gemiddelde temperatuurmeting van een weerstation in het noorden van Zweden gedurende de periode van 2010 tot 2017.

Meting

We gebruiken de gemiddelde temperatuurmeting in de gegevensset als de meting, door een .meting te maken in Masteritems met de naam Temperature degrees Celsius en de uitdrukking Avg([Average of the 24 hourly temperature observations in degrees Celsius]).

Visualisatie

We voegen de boxplot toe aan het werkblad en stellen de volgende gegevenseigenschappen in:

  • Dimensie: Date (datum) en Year (jaar). De volgorde is belangrijk; Date moet de eerste dimensie zijn.
  • Meting: Temperature degrees Celsius; de meting die is gemaakt als een masteritem.

In dit voorbeeld gebruiken we de standaardinstelling voor boxplot, Standaard (Tukey) met de whiskerlengte 1,5 inter-kwartielbereik.

Box plot visualization.

Ontdekken

De boxplot visualiseert de distributie van de dagelijkse temperatuurmetingen. De visualisatie wordt gesorteerd volgens de gemiddelde temperatuur. De gemiddelde temperatuur voor elk jaar wordt aangegeven met de middelste lijn in elke box. De box reikt van het eerste kwartiel tot het derde kwartiel en de whiskers beslaan 1,5 inter-kwartielbereiken. Er is ook een aantal uitschieters, de punten die buiten de whiskers liggen. U kunt met uw cursor op een uitschieter gaan staan en de gegevens bekijken.

In de boxplot zien we dat het jaar 2010 de langste box en whiskers heeft. Dat betekent dat het jaar 2010 de grootste distributie van gemeten temperaturen heeft. Het lijkt ook gemiddeld het koudste jaar te zijn.

Het bereik van 2017 is klein, omdat de gegevensset alleen metingen van de eerste maanden van het jaar bevat.