Boxplot
De boxplot is geschikt voor het vergelijken van de spreiding en verdeling voor groepen numerieke gegevens, geïllustreerd met een box met ‘whiskers’ (horizontale lijnen) en een middenlijn in het midden. De whiskers stellen hoge en lage referentiewaarden voor, op basis waarvan uitschieters worden uitgesloten.
U kunt de begin- en eindpunten van de box en de lengte van de whiskers definiëren met behulp van een aantal verschillende voorinstellingen, maar u kunt ook uw eigen instellingen definiëren met behulp van uitdrukkingen.
- Eerste whisker
- Begin van de box
- Middenlijn
- Einde van de box
- Laatste whisker
Wanneer gebruiken
De boxplot is geschikt voor het vergelijken van de spreiding en verdeling voor groepen numerieke gegevens.
Voordelen De boxplot ordent grote hoeveelheden gegevens en visualiseert waarden van uitschieters.
Nadelen De boxplot is niet relevant voor gedetailleerde analyse van de gegevens, omdat met een samenvatting van de gegevensverdeling wordt gewerkt.
Een boxplot maken
U kunt een boxplot maken op het werkblad dat u aan het bewerken bent.
In een boxplot moet u één of twee dimensies en één meting gebruiken. Als u één dimensie gebruikt, krijgt u een visualisatie met één box. Als u twee dimensies gebruikt, krijgt u één box voor elke waarde van de tweede, of buitenste, dimensie.
Doe het volgende:
- Sleep vanuit het bedrijfsmiddelenvenster een lege boxplot naar het werkblad.
-
Voeg de eerste dimensie toe.
Dit is de interne dimensie, die een box definieert.
-
Voeg een tweede dimensie toe.
Dit is de buitenste dimensie, die de boxen definieert die op de dimensie-as worden weergegeven.
-
Klik op Meting toevoegen en maak een meting van een veld. De meting hoeft geen aggregatie te bevatten.
Nadat u de boxplot hebt gemaakt, kunt u desgewenst het uiterlijk ervan en andere instellingen aanpassen in het eigenschappenvenster. Standaard wordt de Standaard (Tu-toets) voorinstelling gebruikt.
Ga voor meer informatie naar Het uiterlijk van een visualisatie wijzigen.
De definitie van de boxplot wijzigen
U kunt een boxplot definiëren met behulp van een van de drie voorinstellingen onder Boxplotelementen in het eigenschappenvenster.
-
Standaard (Tukey)
Deze voorinstelling is gebaseerd op de oorspronkelijke definitie van een boxplot door J. Tukey. De middenlijn staat voor de mediaan (tweede kwartiel) en de begin- en eindpunten van de box staan voor het eerste en derde kwartiel. De lengte van de whiskers kan worden ingesteld op 1, 1,5 of 2 interkwartielbereiken. Een interkwartielbereik geeft het verschil tussen het eerste en het derde kwartiel aan.
-
Gebaseerd op percentielen
In de definitie van deze voorinstelling staan het begin- en eindpunt van de box ook voor het eerste en derde kwartiel en de middenlijn voor de mediaan, maar hier past u de whiskerlengte aan door de whiskerpositie op basis van percentielen in te stellen.
-
Standaardafwijking
Deze voorinstelling is gebaseerd op standaardafwijkingen, waarbij de middenlijn voor de gemiddelde waarde staat en het begin- en eindpunt van de box voor één variantie van de standaardafwijking. U kunt de whiskerlengte instellen op een veelvoud van standaardafwijkingen.
U kunt ook een aangepaste boxplot definiëren, waarbij u de waarde van elk boxplotelement instelt met behulp van een uitdrukking.