Statistische methoden > Data ordenen
1234567Data ordenen

Antwoorden van de opgaven

Opgave V1
a

Rita Jeptoo was nummer 44 (Eliud Kipchoge was de snelste man).

b

Lhianne Torres (of Jack Fishman, maar dat lijkt gezien de voornamen onwaarschijnlijk).

c

Bedenk dat het totaal niet boeiend is om een onderzoeksvraag te stellen die alleen over deze marathon gaat, die was eenmalig en is geweest. Je wilt natuurlijk een vraag stellen over marathonlopers in het algemeen. En wat heb je dan aan deze steekproef, is hij representatief?

Denk aan onderzoeksvragen als:

  • Hoeveel procent van de marathonlopers is ouder dan 50 jaar?

  • Zijn mannen sneller dan vrouwen op de marathon?

  • Is er een verband tussen de tussentijd halverwege en de behaalde eindtijd?

  • Is er een verband tussen de leeftijd en de behaalde eindtijd?

d

Je gaat kleine, overzichtelijke tabellen en diagrammen maken bij deze enorme hoeveelheid gegevens. Gebruik daarbij een computerprogramma zoals MS Excel.

Opgave 1
a

Dan blijft de tabel onoverzichtelijk en erg lang.

b

Nu zijn verschillen in frequenties niet meer zo goed zichtbaar.

c

Zie figuur bij d. Er is gewerkt met Excel, daarom is ook de bovengrens van elke klasse aangegeven.

d

Zie figuur. Zo'n tabel is nuttig als je de lengtes van deze groep wilt vergelijken met die van een andere groep meisjes/jongens, zeker als het aantal personen in die groep anders is.

e

Alle lengtes zijn afgerond op gehele cm, dus zitten in klassen als `149,5 - lt 150,5` , etc.

f

Dat je ze eigenlijk moet schrijven als `150 - 154` , `155 - 159` , etc.

Opgave 2
a

Het handigst is `5 - 14` , `15 - 24` , `25 - 34` , ..., `85 - 94` , want dan zie je meteen hoeveel mensen `10` punten, `20` punten, etc., hebben en zie je ook meteen de verdeling van de eindcijfers.

b

Ook nu is met Excel werken erg handig.

Opgave 3
a

De variabele bij een histogram is altijd kwantitatief. Bij een staafdiagram kan de variabele zowel kwantitatief als kwalitatief zijn. De staven van een staafdiagram worden los getekend.

b

Je kunt zien hoe de (relatieve) frequentie verandert als je de waarde van de variabele verandert.

Opgave 4
a

Werk met Excel of met je GR, zie het Practicum .

b

Werk met Excel of met je GR, zie het Practicum .
Denk er om, dat je nu de rechter klassengrenzen moet gebruiken.

c

Bij het maken van je cumulatieve relatieve frequentiepolygoon heb je een tabel gemaakt, waaruit je `86,7` % als antwoord op de vraag kunt aflezen.

Opgave 5
a
b

Omdat beide groepen precies `100` personen betreffen.

c

Ga na, dat je dezelfde figuur krijgt als in het voorbeeld.

d

Vergelijk beide cumulatieve relatieve frequentiepolygonen en je ziet bijvoorbeeld dat `95` % van de vrouwen een voetlengte van `42,0` cm of kleiner heeft, terwijl maar `62` % van de mannen die voetlengte heeft. De cumulatieve relatieve frequentiepolygoon van de mannen stijgt in het begin veel langzamer dan die van de vrouwen.

Je kunt ook kijken naar beide lijndiagrammen bij a. De top van de mannen zit verder naar rechts dan die bij de vrouwen.

Opgave 6
a

Beide groepen zijn niet even groot.

b
c

Dat basketballers over het algemeen langer zijn dan hardlopers.

Opgave 7
a

De waarden zijn nominaal zodat je een beeld-, staaf- of cirkeldiagram kunt gebruiken. Omdat het om verschillende universiteiten gaat, ieder met redelijk wat studierichtingen, kun je de gegevens in één staafdiagram opnemen, maar je moet waarschijnlijk meerdere beeld- en cirkeldiagrammen gebruiken.

b

De dagelijkse gemiddelde tijd is een continue kwantitatieve variabele. Deze wil je in klassen onderverdelen, met een aantal turven per klasse. Hiervoor is een histogram of een frequentiepolygoon het meest geschikt. Een cumulatieve frequentiepolygoon is ook mogelijk, maar voegt in deze situatie nog niks toe.

c

De variabele is nominaal zodat een beeld-, staaf- of cirkeldiagram geschikt is. Omdat het maar vijf vliegvelden betreft is een cirkeldiagram het beste geschikt voor een vlot overzicht van de onderlinge verhoudingen, maar de andere twee kunnen ook prima.

Opgave 8
a

Een histogram.

b

In figuur a is de variabele "lengte van basketballers" weergegeven. Deze variabele is

kwantitatief

kwalitatief

c

De variabelen in een staafdiagram zijn kwalitatief. Onderling verwisselen van staven bij een kwalitatieve variabele maakt niet uit. Maar bijvoorbeeld de variabele lengte (cm) in een histogram is kwantitatief en loopt op van de kleinste lengte naar de langste lengte. Omdat de variabele op de horizontale as oploopt vanaf `0` , kun je de bij de lengte behorende staven niet verwisselen.

Opgave 9
a

Je krijgt vijf staven van elk `25` %, twee staven van elk `40` % en vijf staven van elk `35` %. Dat geeft een totaal van `380` % in plaats van `100` %.

b

De klasse `150 - lt 175` met `25` % van de mannen wordt onderverdeeld in vijf klassen van elk `5` cm breed. Elk van deze klassen bevat `25/5 = 5` % van de mannen. De klasse `175 - lt 185` met `40` % van de mannen wordt onderverdeeld in twee klassen van elk `5` cm breed. Beide klassen bevatten `40/2 = 20` % van de mannen. De klasse `185 - lt 210` met `35` % van de mannen wordt onderverdeeld in vijf klassen van elk `5` cm breed. Elk van deze klassen bevat `35/5 = 7` % van de mannen.

Opgave 10
a

De frequenties in deze tabel zijn:

absoluut

relatief

b

Is de indeling in klassen goed?

ja

nee

c

De klassenbreedte in deze frequentietabel is:

`99,00`

`99,99`

`100`

d

Welke beweringen zijn juist?

De relatieve frequentie van lonen tussen € 700,00 en € 800,00 is `16` %.

De proportie lonen van minstens € 1000,00 is ongeveer `0,11` .

De cumulatieve relatieve frequentie van lonen minder dan € 700,00 is `18` %.

Opgave 11
score frequentie relatieve frequentie (%)
`50 - 69` `2` `5`
`70 - 89` `1` `2,5`
`90 - 109` `5` `12,5`
`110 - 129` `20` `50`
`130 - 149` `6` `15`
`150 - 169` `4` `10`
`170 - 189` `2` `5`
totaal `40` `100`
Opgave 12
a

De ondergrens is € 900,00 en de bovengrens is € 1000,00 maar € 1000,00 hoort er niet bij, dit bedrag zit in de volgende klasse.

b

De tabellen hebben verschillende klassenindelingen en er staan absolute aantallen, terwijl de bedrijven een verschillend aantal werknemers hebben.

c

Neem voor beide bedrijven een klassenindeling van € 100,00 breed, startend met klasse `400 - lt 500` en eindigend met klasse `1100 - lt 1200` . Bereken voor iedere klasse de relatieve frequentie.

Bedrijf 1:

weekloon (euro) aantal werknemers relatieve frequentie (%)
`400 - lt 500` `0` `0`
`500 - lt 600` `8` `12,3`
`600 - lt 700` `10` `15,4`
`700 - lt 800` `16` `24,6`
`800 - lt 900` `14` `21,5`
`900 - lt 1000` `10` `15,4`
`1000 - lt 1100` `5` `7,7`
`1100 - lt 1200` `2` `3,1`
totaal `65` `100`

Bedrijf 2:

weekloon (euro) aantal werknemers relatieve frequentie (%)
`400 - lt 500` `5` `20`
`500 - lt 600` `12` `48`
`600 - lt 700` `5` `20`
`700 - lt 800` `3` `12`
`800 - lt 900` `0` `0`
`900 - lt 1000` `0` `0`
`1000 - lt 1100` `0` `0`
`1100 - lt 1200` `0` `0`
totaal `25` `100`
d

Je kunt dit direct aflezen uit een relatieve cumulatieve frequentietabel. Omdat het hier maar om één salarisgrens gaat, is het snel te berekenen: in bedrijf 2 verdient `20 + 48 = 68` % van de werknemers minder dan € 600,00, in bedrijf 1 is dat `12,3` %. In bedrijf 2 zijn er relatief meer mensen die minder dan € 600,00 per week verdienen.

e

Van het ene bedrijf heb je een klassenindeling van 100,00 breed. Per klasse weet je niet hoe de frequentie is verdeeld over die breedte van 100,00. Je weet wel dat er tien mensen zijn die tussen € 600,00 en € 700,00 verdienen, maar je weet niet of al deze mensen bijvoorbeeld € 675,00 verdienen of dat ze geheel verspreid over € 600,00 en € 700,00 verdienen of misschien wel alle tien precies € 600,00.
Je zou een schatting kunnen maken door te verwachten dat ze gelijkmatig verspreid over € 600,00 en € 700,00 verdienen. Vijf van deze tien mensen zullen dan naar schatting minder dan € 650,00 verdienen en deze vijf tel je mee in de totale somfrequentie die je nodig hebt.

Opgave 13
a

De klassen zijn niet allemaal even breed. De lengtes van deze jongens zijn heel gelijkmatig verdeeld; de gelijkmatigheid zit vooral bij de kortere jongens.

b

Met een wisselende klassenbreedte krijg je een verkeerde indruk van de gegevens.

c

Omdat je niet over de ruwe data beschikt, gebruik je de gegevens uit de frequentietabel. De breedste klasse is `150 - lt 165` . Het beste kun je de andere klassen even breed maken.

lengte (cm)

frequentie

rel. frequentie

cum. rel. frequentie (%)

`150 - lt 165`

`15`

`0,25`

`25`

`165 - lt 180`

`30`

`0,50`

`75`

`180 - lt 195`

`15`

`0,25`

`100`

totaal

`60`

`1`

`100`

Opgave 14
a

Een lijndiagram en een gestapeld staafdiagram.

b

Geboorteoverschot = geboorten minus sterfgevallen; buitenlands migratiesaldo = aantal immigranten minus emigranten (land in, land uit); binnenlands migratiesaldo = mensen die binnen Nederland verhuizen (stad in, stad uit).
geboorteoverschot 2004: ongeveer `4700`
buitenlands migratiesaldo 2004: ongeveer `900`
binnenlands migratiesaldo 2004: ongeveer `text(-)1800` .
Totaal: `4700 + 900 - 1800 = 3800` .
In het lijndiagram is te zien dat in 2004 de toename ongeveer `4000` is.

c

Met een positief migratiesaldo komen er meer mensen naar Amsterdam dan er vertrekken. Met een negatief saldo is dat andersom.

Opgave 15
a

Het aantal behaalde medailles van één metaalsoort.

b

Er worden drie gegevens (variabelen) tegelijk weergegeven. De assen geven land, medaillekleur en aantal.

c

De Verenigde Staten hebben de meeste gouden medailles gewonnen ( `46` ) en ook de meeste zilveren ( `29` ). Ook het grootste totaal aantal medailles is door de Verenigde Staten gewonnen ( `104` ).

d

Dat kan. Het voordeel is dat je de totalen gemakkelijker kunt vergelijken. Het nadeel is dat je het aantal medailles per kleur moeilijker kunt vergelijken.

e

Bijvoorbeeld een staafdiagram met per land drie staafjes naast elkaar op één as.

Opgave 16
a

Om continue kwantitatieve variabelen.

b

lengte: `137,5 - lt 138,5` cm, etc.

gewicht: `40,5 - lt 41,5` kg, etc.

c

Zie figuur.
De staven van het histogram vormen samen het silhouet van een kerkklok.
Je kunt daarmee gemakkelijk een indeling in lengtematen maken en bepalen hoeveel procent van de vrouwen die maat heeft.

d

Omdat de lengtes op hele cm zijn afgerond mag je de hele klasse `156` en de hele klasse `168` en alle klassen daar tussenin mee rekenen. Dat zijn in totaal `3426` vrouwen en dat is ongeveer `68,5` %. Je kunt natuurlijk ook Excel eerst alle frequenties laten omrekenen naar procenten (dat heb je voor het histogram ook moeten doen) en dan de percentages optellen.

e

Zie figuur.
De staven van het histogram vormen een meer scheve verdeling.
Een aantal vrouwen is nogal veel zwaarder dan de meeste vrouwen.

Opgave 17
a

Zie de figuur.

b

In de maanden `1` tot en met `8` , dus van januari tot en met augustus.

c

Er wordt dan verlies gedraaid.

d

€ 65000 winst.

Opgave 18
a

Kwalitatieve variabelen op de horizontale as.

b

In het staafdiagram worden twee dingen tegelijk vergeleken. Per regio de verdeling over de drie soorten brandstof en de regio's onderling. Dat lukt niet in één cirkeldiagram.

c

De percentages zijn: Noord-Amerika `4,2` ; Zuid-Amerika `4,1` ; Europa `3,2` ; Rusland `32,2` ; Midden-Oosten `40,8` ; Afrika `7,8` ; Azië en Australië `7,6` . De bijbehorende sectorhoeken vind je door deze getallen met `3,6` te vermenigvuldigen.

d

Een staafdiagram.

(bron: energie.nl)

verder | terug