Data verwerken > Centrum en spreiding
12345Centrum en spreiding

Theorie

Een frequentieverdeling kun je samenvatten met centrummaten:

  • het gemiddelde, het evenwichtspunt van de verdeling (niet zichtbaar in een boxplot);

  • de mediaan, de middelste waarde van de verdeling, op de helft van de boxplot;

  • de modus, de meest voorkomende waarde (niet zichtbaar in een boxplot).

Daarnaast gebruik je spreidingsmaten:

  • de spreidingsbreedte, maximum `-` minimum (zichtbaar in een boxplot);

  • de interkwartielafstand, `Q_3 - Q_1` (zichtbaar in een boxplot).

Een frequentieverdeling kun je ook samenvatten in kwarten. Je krijgt de 5-getallensamenvatting.

  • het minimum, de laagste waarde;

  • het eerste kwartiel `Q_1` , de bovengrens van het eerste kwart;

  • de mediaan `Q_2` , de bovengrens van het tweede kwart (dus precies op de helft);

  • het derde kwartiel `Q_3` , de bovengrens van het derde kwart;

  • het maximum, de hoogste waarde.

De Q is afkomstig van het Engels woord "quartile" .

Je kunt de kwarten of kwartielen zichtbaar maken met een boxplot. De "box"  is het gebied tussen `Q_1` en `Q_3` . Elk kwartiel bevat `25` % van de waarnemingen.

Als je veel data hebt, is een boxplot overzichtelijker dan een dotplot of een staafdiagram. Met een boxplot verlies je echter ook informatie. In een boxplot kun je namelijk alleen nog het kwart aanwijzen waarin een bepaalde waarde zit.

Een uitschieter is een waarde die meer dan `1,5` keer de interkwartielafstand onder het eerste kwartiel of boven het derde kwartiel zit. Een uitschieter zie je niet in een boxplot, maar wel in een dotplot en ook in een staafdiagram.

verder | terug