Data verwerken > Centrum en spreiding
12345Centrum en spreiding

Uitleg

Om snel belangrijke informatie over een grote dataset te krijgen, probeer je de dataset met een paar maten (getallen) samen te vatten. Je gebruikt hiervoor centrummaten en spreidingsmaten.

De bekende centrummaten zijn:

  • de modus: de meest voorkomende waarde (bij een klassenindeling zeg je: modale klasse);

  • de mediaan: de middelste waarde;

  • het gemiddelde: alle waarden opgeteld en gedeeld door het totaal aantal waarden.

Een bekende maat voor de spreiding is de spreidingsbreedte. Bekijk je bijvoorbeeld een frequentieverdeling van lengtes van meisjes, dan is de spreidingsbreedte het verschil tussen de langste lengte en de kortste lengte van de meisjes. Als het langste meisje `197` cm is en het kleinste meisje `156` cm, is de spreidingsbreedte `197 - 156 = 41` cm.

Bekijk wel eerst of centrummaten zinnig zijn voor je dataset. Bij de variabele geboortejaar is het gemiddelde bijvoorbeeld niet zinvol. En de spreidingsbreedte van het profiel van havo 4-leerlingen is ook onzinig.

In het practicum kun je vinden hoe je centrum- en spreidingsmaten kunt berekenen met de grafische rekenmachine en ook hoe dit gaat met Excel of VUstat.

Opgave 1

Bekijk de dotplots van de lengtes van de jongens en de meisjes uit de dataset Gegevens 154 havo 4- leerlingen. Deze opgave kun je met Excel maken.

a

Maak van de lengtes van de jongens een overzicht met de drie centrummaten en de spreidingsbreedte. Je kunt dit ook met de grafische rekenmachine doen.

b

Waarom zou je bij de meisjes de waarden `196` een uitschieter noemen? Heb je bij de jongens ook uitschieters?

c

Welke centrummaat wordt door deze uitschieters sterk beïnvloed?

d

Vind je het verantwoord om uitschieters weg te laten bij het samenvatten van een frequentieverdeling? Geef argumenten voor en tegen.

Opgave 2

Een bedrijf heeft `25` werknemers in vaste dienst met een volledige werkweek. De nettoweeklonen van deze werknemers zijn in klassen verwerkt in de frequentietabel. De weeklonen zijn verdeeld in klassen met een breedte van `50` . De ruwe data zijn niet bekend.

a

Waarom kun je vanuit de frequentietabel de gemiddelde lengte niet precies uitrekenen, maar alleen nog schatten?

b

Bepaal de klassenmiddens en bereken hiermee dit geschatte gemiddelde.

c

Welke klasse is de modale klasse?

d

In welke klasse zit de mediaan?

Opgave 3

Bekijk het staafdiagram van de profielkeuzes van `154` havo 4-leerlingen.

a

Waarom kun je geen spreidingsbreedte vaststellen?

b

Je kunt wel vaststellen welk profiel de meeste jongens of de meeste meisjes hebben. Waarom kun je dat toch geen centrummaat noemen?

c

Bestaat er een zinvolle centrummaat voor deze statistische variabele?

d

"Het staafdiagram van de profielkeuzes van de jongens is veel schever dan dat van de meisjes." Waarom is zo'n uitspraak hier niet zinvol?

verder | terug