Boxplot
De boxplot is geschikt voor het vergelijken van de spreiding en verdeling voor groepen numerieke gegevens, geïllustreerd met een box met ‘whiskers’ (horizontale lijnen) en een middenlijn in het midden. De whiskers stellen hoge en lage referentiewaarden voor, op basis waarvan uitschieters worden uitgesloten.
U kunt de begin- en eindpunten van de box en de lengte van de whiskers definiëren met behulp van een aantal verschillende voorinstellingen, maar u kunt ook uw eigen instellingen definiëren met behulp van uitdrukkingen.
- Eerste whisker
- Begin van de box
- Middenlijn
- Einde van de box
- Laatste whisker
Wanneer gebruiken
De boxplot is geschikt voor het vergelijken van de spreiding en verdeling voor groepen numerieke gegevens.
Voordelen: De boxplot ordent grote hoeveelheden gegevens en visualiseert waarden van uitschieters.
Nadelen: De boxplot is niet relevant voor gedetailleerde analyse van de gegevens, omdat met een samenvatting van de gegevensverdeling wordt gewerkt.
Standaard wordt de Standaard (Tu-toets) voorinstelling gebruikt.
De definitie van de boxplot wijzigen
U kunt een boxplot definiëren met behulp van een van de drie voorinstellingen onder Boxplotelementen in het eigenschappenvenster.
Standaard (Tukey)
Deze voorinstelling is gebaseerd op de oorspronkelijke definitie van een boxplot door J. Tukey. De middenlijn staat voor de mediaan (tweede kwartiel) en de begin- en eindpunten van de box staan voor het eerste en derde kwartiel. De lengte van de whiskers kan worden ingesteld op 1, 1,5 of 2 interkwartielbereiken. Een interkwartielbereik geeft het verschil tussen het eerste en het derde kwartiel aan.
Gebaseerd op percentielen
In de definitie van deze voorinstelling staan het begin- en eindpunt van de box ook voor het eerste en derde kwartiel en de middenlijn voor de mediaan, maar hier past u de whiskerlengte aan door de whiskerpositie op basis van percentielen in te stellen.
Standaardafwijking
Deze voorinstelling is gebaseerd op standaardafwijkingen, waarbij de middenlijn voor de gemiddelde waarde staat en het begin- en eindpunt van de box voor één variantie van de standaardafwijking. U kunt de whiskerlengte instellen op een veelvoud van standaardafwijkingen.
U kunt ook een aangepaste boxplot definiëren, waarbij u de waarde van elk boxplotelement instelt met behulp van een uitdrukking.