Gå till huvudinnehåll

Visualisera intervall och fördelning av numeriska data med ett lådagram

PÅ DEN HÄR SIDAN

Visualisera intervall och fördelning av numeriska data med ett lådagram

Det här exemplet visar hur man gör ett lådagram för att visualisera intervall och fördelning av numeriska data Qlik DataMarket.

Box plot visualization.

Datauppsättning

I det här exemplet använder vi väderdata från datakällan Weather for more than 2500 cities worldwide i Qlik DataMarket. Datauppsättningen är baserad på följande urval i Qlik DataMarket:

  • Location: Sweden > Gällivare Airport, Kiruna Airport, Kramfors Sollefteå Airport, Luleå Airport, Ostersund Froson, Skellefteå Airport, Umeå Airport, Örnsköldsvik Airport
  • Date: All time
  • Measurement: Average of the 24 hourly temperature observations in degrees Celsius

Den hämtade datauppsättningen innehåller ett mått på den dagliga genomsnittstemperaturen från ett antal väderstationer i norra Sverige under perioden 2010–2017.

Mått

Vi använder genomsnittstemperaturmåttet i datauppsättningen som mått genom att skapa ett mått i Originalobjekt som kallas Temperature degrees Celsius och uttrycket Avg([Average of the 24 hourly temperature observations in degrees Celsius]).

Visualisering

Vi lägger till ett lådagram till arket och anger följande dataegenskaper:

  • Dimension: Date (datum) och Year (år). Ordningen är viktig, Date måste vara den första dimensionen.
  • Measure: Temperature degrees Celsius; det mått som skapades som ett originalobjekt.

I det här exemplet använder vi standardlådagrammets förinställningar, Standard (Tukey) med morrhårsvärdets längd 1,5 kvartilöverskridande intervall.

Box plot visualization.

Upptäckt

Lådagrammet visualiserar fördelningen av de dagliga temperaturmåtten. Visualiseringen sorteras i medeltemperaturs-ordning. Varje års medeltemperatur illustreras med en mittenlinje i varje låda. Rutan sträcker sig från den första kvartilen till den tredje kvartilen och morrhårsvärdet sträcker sin över intervallen på 1,5 interkvartiler. Det finns även ett antal outlier-värden, de punkter som är placerade utanför morrhårsvärdena. Du kan hovra med muspekaren över en outlier-punkt och visa informationen.

I lådagrammet ser vi att år 2010 har den längsta lådan och de längsta morrhårsvärdena. Det visar att år 2010 har den största fördelningen av uppmätta temperaturer. Det verkar även vara det i genomsnitt kallaste året.

Intervallet 2017 är litet eftersom datauppsättningen endast innehåller mått från årets första månader.