Het weergeven van de distributie van metingswaarden in een dimensie met een verdelingsplot.
In dit voorbeeld ziet u hoe u een verdelingsplot maakt voor het weergeven van de verdeling van meetingswaarden in een dimensie, bijvoorbeeld met weergegevens.
Gegevensset
In dit voorbeeld gebruiken we de volgende weergegevens.
- Location: Sweden > Gällivare Airport
- Date range: all data from 2010 to 2017
- Measurement: Average of the 24 hourly temperature observations in degrees Celsius
De geladen gegevensbron bevat een dagelijkse gemiddelde temperatuurmeting van een weerstation in het noorden van Zweden gedurende de periode van 2010 tot 2017.
Meting
We gebruiken de gemiddelde temperatuurmeting in de gegevensset als de meting, door een .meting te maken in Masteritems met de naam Temperature degrees Celsius en de uitdrukking Avg([Average of the 24 hourly temperature observations in degrees Celsius]).
Visualisatie
We voegen de verdelingsplot toe aan het werkblad en stellen de volgende gegevenseigenschappen in:
- Dimensie: Date (datum) en Year (jaar). De volgorde is belangrijk; Date moet de eerste dimensie zijn.
- Meting: Temperature degrees Celsius; de meting die is gemaakt als een masteritem.
Ontdekken
De verdelingsplot visualiseert de distributie van de dagelijkse temperatuurmetingen. De visualisatie wordt gesorteerd op jaar en elk punt staat voor een temperatuurmeting.
In de visualisatie zien we dat het jaar 2012 de laagste extreme temperatuurmeting heeft, bijna -40 graden Celsius. We zien ook dat het jaar 2016 de grootste distributie van gemeten temperaturen lijkt te hebben. Als er zoveel punten in de verdelingsplot aanwezig zijn, kan het moeilijk zijn om clusters en uitschieters te ontdekken. Het jaar 2017 heeft echter twee lage temperatuurmetingen die opvallen. U kunt met uw cursor op een punt gaan staan en de gegevens bekijken.