Ga naar hoofdinhoud

Visualisatie van bereik en verdeling van numerieke gegevens in boxplots

OP DEZE PAGINA

Visualisatie van bereik en verdeling van numerieke gegevens in boxplots

In dit voorbeeld ziet u hoe u een boxplot maakt voor het visualiseren van het bereik en de verdeling van numerieke gegevens, waarbij dagtemperatuurmetingen uit Qlik DataMarket worden gebruikt.

Box plot visualization.

Gegevensset

In dit voorbeeld gebruiken we weergegevens die zijn geladen vanuit de Weather for more than 2500 cities worldwide-gegevensbron in Qlik DataMarket. De gegevensbron is gebaseerd op de volgende selecties in Qlik DataMarket:

  • Location: Sweden > Gällivare Airport, Kiruna Airport, Kramfors Sollefteå Airport, Luleå Airport, Ostersund Froson, Skellefteå Airport, Umeå Airport, Örnsköldsvik Airport
  • Date: All time
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

De geladen gegevensbron bevat een dagelijkse gemiddelde temperatuurmeting van een aantal weerstations in het noorden van Zweden gedurende de periode van 2010 tot 2017.

Meting

We gebruiken de gemiddelde temperatuurmeting in de gegevensset als de meting, door een .meting te maken in Masteritems met de naam Temperature degrees Celsius en de uitdrukking Avg([Average of the 24 hourly temperature observations in degrees Celsius]).

Visualisatie

We voegen de boxplot toe aan het werkblad en stellen de volgende gegevenseigenschappen in:

  • Dimensie: Date (datum) en Year (jaar). De volgorde is belangrijk; Date moet de eerste dimensie zijn.
  • Meting: Temperature degrees Celsius; de meting die is gemaakt als een masteritem.

In dit voorbeeld gebruiken we de standaardinstelling voor boxplot, Standaard (Tukey) met de whiskerlengte 1,5 inter-kwartielbereik.

Box plot visualization.

Ontdekken

De boxplot visualiseert de distributie van de dagelijkse temperatuurmetingen. De visualisatie wordt gesorteerd volgens de gemiddelde temperatuur. De gemiddelde temperatuur voor elk jaar wordt aangegeven met de middelste lijn in elke box. De box reikt van het eerste kwartiel tot het derde kwartiel en de whiskers beslaan 1,5 inter-kwartielbereiken. Er is ook een aantal uitschieters, de punten die buiten de whiskers liggen. U kunt met uw cursor op een uitschieter gaan staan en de gegevens bekijken.

In de boxplot zien we dat het jaar 2010 de langste box en whiskers heeft. Dat betekent dat het jaar 2010 de grootste distributie van gemeten temperaturen heeft. Het lijkt ook gemiddeld het koudste jaar te zijn.

Het bereik van 2017 is klein, omdat de gegevensset alleen metingen van de eerste maanden van het jaar bevat.