Statistische methoden > Data ordenen
1234567Data ordenen

Uitleg

Een onderzoek levert veel data op. Je krijgt overzicht over al die gegevens door ze te ordenen, te sorteren en samen te vatten.

Bekijk de tabel met lengtes van `90` meisjes.

Om overzicht te krijgen kun je "turven" hoe vaak een lengte voorkomt. Dat heet de "(absolute) frequentie" van een bepaalde lengte.

Door de frequentie door het totale aantal waarnemingen te delen krijg je de "relatieve frequentie" (proportie) van die lengte. Met de relatieve frequenties kun je meerdere sets waarnemingen gemakkelijk vergelijken. De relatieve frequentie van lengte `150` cm is `2/90*100~~2,2` %.

Je ziet, dat er te veel mogelijke waarden zijn voor een overzichtelijke tabel. Dan gebruik je een klassenindeling.
Bij de lengtes van de groep meisjes is de kleinste waarde `150` cm en de grootste `193` cm. Daarbij kun je klassen maken met een klassenbreedte van `10` centimeter. De eerste klasse is `150- < 160` . De tweede klasse is `160- < 170` , enzovoort, tot en met `190- < 200` .
Bij continue variabelen schrijf je `- lt` om "vanaf ... tot ..." aan te duiden. Een meisje dat `160` cm lang is, zit in de tweede klasse.

Bij discrete variabelen met veel mogelijke waarden (zoals leeftijden) kun je ook een klassenindeling maken. Hierbij stel je de klassenindeling (bijvoorbeeld) als `1-10` , dan `11-20` , tot en met `91-100` . De notatie `-` betekent hier "vanaf ... tot en met ..." .

Opgave 1

Gebruik de gegevens van de `90` meisjes uit Uitleg 1.

a

De frequentietabel van alle afzonderlijke lengtes is niet handig. Waarom niet?

b

De frequentietabel die bestaat uit vijf lengteklassen is ook niet erg bruikbaar. Waarom niet?

Meestal kies je voor ongeveer tien verschillende klassen. In dit geval is het verstandig om negen lengteklassen te nemen.

c

Maak een frequentietabel met negen lengteklassen.

d

Maak van de tabel uit c een relatieve frequentietabel. Wanneer is zo'n tabel nuttig?

e

Waarom is er eigenlijk bij de gegevens zelf al direct sprake van een klassenindeling?

f

In feite kun je zeggen dat de lengtes in cm nauwkeurig een discrete variabele vormen. Wat zou dit betekenen voor de indeling in negen klassen?

Opgave 2

Voor een toets kun je maximaal `100` punten scoren. In de tabel is weergegeven hoe een groep van veertig personen de toets heeft gemaakt.

a

Welke klassenindeling is nu geschikt als het eindcijfer (lopend van `1` t/m `9` ) wordt bepaald door de score door `10` te delen?

Om snel te kunnen zien hoeveel procent van de deelnemers minder dan een `6` zouden krijgen, kun je een tabel maken van relatieve cumulatieve frequenties. Bij cumulatieve frequenties tel je bij een frequentie alle voorgaande op.

b

Maak een tabel van relatieve cumulatieve frequenties bij je klassenindeling.

verder | terug