Statistiek > Verzamelen en ordenen
123456Verzamelen en ordenen

Theorie

De absolute frequentie is het aantal keren dat een waarneming voorkomt. Het bijhouden van het aantal keren dat een waarneming voorkomt, gebeurt vaak in een turftabel. Een frequentietabel is het overzicht van het aantal keren dat alle waarnemingen voorkomen. Dit is een frequentieverdeling.

De proportie is de frequentie van een waarneming gedeeld door het totale aantal waarnemingen. Dit is een relatieve frequentie.

Bij een frequentietabel kun je een somfrequentietabel maken door bij elke frequentie de voorafgaande frequenties op te tellen. Zo maak je ook een relatieve somfrequentietabel. Somfrequenties noem je cumulatieve frequenties (cumuleren betekent opstapelen).

Heb je veel verschillende waarnemingsgetallen, dan werk je met een klassenindeling. Klassen kun je op twee manieren noteren.

  • vanaf tot wordt: ( zelf zit in de volgende klasse)

  • vanaf tot en met wordt: (in deze klasse zit zowel als )

Voor continue kwantitatieve variabelen gebruik je de eerste notatie. Voor discrete kwantitatieve variabelen gebruik je de tweede notatie. Voor leeftijden (alleen hele getallen) is dit lastiger, want betekent dan .

De klassengrenzen zijn de onderste en bovenste waarnemingen van een klasse. Het verschil tussen twee opvolgende klassengrenzen is de klassenbreedte. Neem met betrekking tot het opstellen van klassen de volgende regels in acht:

  • Neem voor het aantal klassen minimaal vijf en maximaal twintig. Maak het aantal (ongeveer) gelijk aan de wortel uit het aantal waarnemingsgetallen.

  • Voor de klassenbreedte neem je het verschil tussen de grootste en de kleinste waarneming en dat deel je door het aantal klassen. Vaak rond je af op een geheel getal.

Het klassenmidden gebruik je voor het schatten van het gemiddelde van een frequentieverdeling.
Gaat het om de variabele leeftijd (discrete variabele), dan betekent hetzelfde als . Het is de klasse met de leeftijden , , , en . Het klassenmidden is .
Bij bijvoorbeeld bij de variabele lengte (continue variabele) wordt met de notatie de klasse bedoeld van tot . Omdat in deze klasse alle waarden tot zitten, is het klassenmidden .
Bij grote datasets ontkom je er niet aan om met klassenindelingen te werken.

verder | terug