Bij een statistische variabele zijn veel verschillende verdelingen mogelijk.
Als je frequentieverdelingen bij datasets in beeld brengt, dus in diagrammen verwerkt,
krijg je soms mooie symmetrische plaatjes, maar lang niet altijd. Sommige verdelingen
zijn scheef, sommige erg grillig. Maar ook kun je met meerdere toppen te maken hebben.
Let bijvoorbeeld eens op de vorm en de verdeling van een staafdiagram. Is het diagram
scheef of juist symmetrisch? Zijn er meerdere toppen of is er juist sprake van een
opvallende gelijkmatigheid? Zijn er veel uitschieters?
En aan de hand van deze centrummaten kun je goed vaststellen of een verdeling symmetrisch is of juist scheef: van een symmetrisch staafdiagram zijn gemiddelde en mediaan gelijk en zitten ze in het midden van het meetgebied, van een scheef staafdiagram zijn ze meestal verschillend en zitten ze niet in het midden van het meetbereik.
Voor lijndiagrammen en boxplots iets vergelijkbaars.
Bekijk de drie staafdiagrammen in de
Waarom kun je van zo'n frequentieverdeling het gemiddelde en de mediaan alleen schatten?
Uit welke klassen bestaan deze drie lengteverdelingen?
Schat met behulp van de klassenmiddens bij elk van deze drie lengteverdelingen de mediaan en het gemiddelde.
Welke van de drie verdelingen is het meest scheef?
Licht je antwoord toe met de berekende waarden voor mediaan en gemiddelde.
Welke van deze drie lengteverdelingen is meertoppig?
Waarom zal die bij de volleyballers horen?
Je ziet hier vier zogenaamde dotplots van datasets. Elk gegeven, elk datapunt, heeft
zijn eigen
dot
.
Beschrijf van elke dataset de vorm van de verdeling, gebruik daarbij de mediaan en
het gemiddelde.
Is er sprake van symmetrie, een gelijkmatige verdeling, meerdere toppen of uitschieters?