Data verwerken > Centrum en spreiding
12345Centrum en spreiding

Uitleg

Bekijk de boxplot van de verdeling van de (gehele) eindcijfers van een groep examenkandidaten. In zo'n boxplot zijn de resultaten van deze groep in vier kwarten met evenveel eindcijfers verdeeld. De bovengrenzen van die delen heten kwartielen.

Een boxplot heeft dus vijf grenzen:

  • De linkergrens met het laagste getal.

  • De bovengrens `Q_1` van het eerste kwart, de mediaan van de eerste helft.

  • De bovengrens `Q_2` van het tweede kwart, de mediaan.

  • De bovengrens `Q_3` van het derde kwart, de mediaan van de tweede helft.

  • De rechtergrens met het hoogste getal.

Bestaan de waarnemingen uit een oneven aantal waarden, dan wordt de mediaan van de hele set niet meegenomen om `Q_1` en `Q_3` te berekenen.

In het eerste kwart zitten de eerste `25` %-waarden. Het kwartiel `Q_1` is de bovengrens van die `25` %- waarden, dus het cijfer 6.
De mediaan (de middelste) is de bovengrens van `50` % van de waarden, dus het cijfer 7.
Het derde kwartiel `Q_3` is de bovengrens van `75` % van de waarden, dat is het cijfer 8.
De "interkwartielafstand" is het verschil tussen het eerste kwartiel ( `Q_1` ) en het derde kwartiel ( `Q_3` ), dus `Q_3 - Q_1 = 8 - 6 = 2` .

Ook de gegevens, nodig voor het maken van een boxplot, kan Excel voor je berekenen. Alleen het maken van het boxplot zelf is in Excel niet zo eenvoudig, doe dat liever handmatig.

Een waarde die meer dan `1,5` keer de interkwartielafstand onder het eerste kwartiel of boven het derde kwartiel zit, wordt opgevat als een uitschieter.

Opgave 4

Bekijk de dotplots van de lengtes van de jongens en de meisjes gemaakt vanuit de dataset Gegevens 154 havo 4-leerlingen. Deze opgave kun je met Excel maken.

a

Bepaal van de lengtes van de jongens het minimum, het maximum, de kwartielen en de mediaan. Hoe groot is de interkwartielafstand?

Lees in Uitleg 2 nog eens wanneer je een gegeven een uitschieter noemt.

b

Laat zien dat bij de jongens de waarden `161` en `200` cm uitschieters zijn.

c

Laat deze uitschieters weg en maak een nieuw overzicht van de drie centrummaten en de twee spreidingsmaten.

d

Welke spreidingsmaat wordt door deze uitschieters sterk beïnvloed en welke niet?

e

Welke centrummaat wordt door deze uitschieters sterk beïnvloed?

f

Vind je het verantwoord om uitschieters weg te laten bij het samenvatten van een frequentieverdeling? Geef argumenten voor en tegen.

Opgave 5

Een bedrijf heeft `25` werknemers in vaste dienst met een volledige werkweek. De nettoweeklonen van deze werknemers zijn in klassen verwerkt in een frequentietabel. De weeklonen zijn verdeeld in klassen met een breedte van `50` . De ruwe data zijn niet bekend.

Waarom kun je met alleen een klassenindeling geen nauwkeurige boxplot maken?

verder | terug