Data verwerken > Centrum en spreiding
12345Centrum en spreiding

Uitleg

Bekijk de boxplot van de verdeling van de (gehele) eindcijfers van een groep examenkandidaten. In zo'n boxplot zijn de resultaten van deze groep in vier delen verdeeld. Die delen heten kwartielen.

Een boxplot heeft dus vijf grenzen:

  • Linkergrens met het laagste getal.

  • Rechtergrens met het hoogste getal.

  • Middelste grens `Q_2` , de mediaan.

  • De tweede grens `Q_1` tussen de linker grens en `Q_2` ; de mediaan van de eerste helft.

  • De vierde grens `Q_3` tussen `Q_2` en de rechtergrens; de mediaan van de tweede helft.

Bestaan de waarnemingen uit een oneven aantal waarden, dan wordt de mediaan van de hele set niet meegenomen om `Q_1` en `Q_3` te berekenen.

In het eerste kwartiel zitten de eerste `25` %-waarden. Dit kwartiel is de rechtergrens van die `25` %- waarden, dus het cijfer 6.
De mediaan (de middelste) is de rechtergrens van `50` % van de waarden, dus het cijfer 7.
Het derde kwartiel is de rechtergrens van `75` % van de waarden, dat is het cijfer 8.
De "interkwartielafstand" is het verschil tussen het eerste kwartiel ( `Q_1` ) en het derde kwartiel ( `Q_3` ), dus `Q_3 - Q_1 = 8 - 6 = 2` .

Ook de gegevens, nodig voor het maken van een boxplot, kan Excel voor je berekenen. Alleen het maken van het boxplot zelf is in Excel niet zo eenvoudig, doe dat liever handmatig.

Een waarde die meer dan `1,5` keer de interkwartielafstand onder het eerste kwartiel of boven het derde kwartiel zit, wordt opgevat als een uitschieter.

Opgave 4

Bekijk de dotplots van de lengtes van de jongens en de meisjes uit de dataset Gegevens 154 havo 4-leerlingen nog eens. Deze opgave kun je met Excel maken.

a

Bepaal van de lengtes van de jongens het minimum, het maximum, de kwartielen en de mediaan. Hoe groot is de interkwartielafstand?

Lees in de uitleg nog eens wat een uitschieter inhoudt.

b

Laat zien dat bij de jongens de waarden `161` en `200` cm uitschieters zijn.

c

Laat deze uitschieters weg en maak een nieuw overzicht van de drie centrummaten en de twee spreidingsmaten.

d

Welke spreidingsmaat wordt door deze uitschieters sterk beïnvloed en welke niet?

e

Welke centrummaat wordt door deze uitschieters sterk beïnvloed?

f

Vind je het verantwoord om uitschieters weg te laten bij het samenvatten van een frequentieverdeling? Geef argumenten voor en tegen.

Opgave 5

Een bedrijf heeft `25` werknemers in vaste dienst met een volledige werkweek. De nettoweeklonen van deze werknemers zijn in klassen verwerkt in een frequentietabel. De weeklonen zijn verdeeld in klassen met een breedte van `50` . De ruwe data zijn niet bekend.

Waarom kun je met alleen een klassenindeling geen nauwkeurige boxplot maken?

verder | terug