Statistische methoden > Resultaten vergelijken
1234567Resultaten vergelijken

Antwoorden van de opgaven

Opgave V1
a

Voor het verschil in brandduur zou je vanuit de figuren kunnen zeggen:
Het verschil tussen

  • A en B is gering, want de boxen overlappen en er ligt geen mediaan buiten de andere box;

  • A en C is middelmatig, want de boxen overlappen en een mediaan (zelfs beide) ligt buiten de andere boxen;

  • A en D is groot, want de boxen overlappen niet.

Er bestaan daadwerkelijk dergelijke vuistregels voor het vergelijken van boxplots.

b

Je kunt bijvoorbeeld gemiddelden en spreiding vergelijken.

Opgave 1
a

Het modale cijfer is het cijfer dat het vaakst voorkomt. Hier zegt het niet veel, want misschien komt alleen `6,7` twee keer voor en zijn alle andere cijfers veel hoger of lager, maar wel onderling verschillend.

b

Klas A. Zet alle `23` cijfers van klein naar groot achter elkaar, dus `3,4; 3,4; 3,8 ... 8,2; 8,3; 8,5` . Het is een oneven nummer, dus de mediaan is het middelste getal in de rij. In dit geval het twaalfde getal en dat is `6,2` .

Zo werkt het ook voor klas B. Klas B heeft `25` cijfers, dus het dertiende getal is de mediaan. Dat is `6,5` .

c

De mediaan (middelste cijfer) zegt niet veel. Maar je weet dat de helft van de cijfers hoger dan of gelijk is aan de mediaan `6,2` (klas A) of `6,5` (klas B). En de andere helft is lager.

d

Klas A: tel alle `23` getallen bij elkaar op en deel de som door `23` ; gemiddeld een `6,0` .

Klas B: tel alle `25` getallen bij elkaar op en deel de som door `25` ; gemiddeld een `6,5` .

e

Klas B heeft het hoogste gemiddelde.

Omdat je nog niet naar de spreiding hebt gekeken, kun je nog geen volledige uitspraak doen. Misschien heeft klas B wel een paar hele hoge uitschieters en verder juist niet zoveel hoge cijfers. Welke klas heeft dan hoger gescoord?

Opgave 2
a

De cijfers van A liggen meer gespreid dan die van B.

b

Het gemiddelde van leerling C is behoorlijk hoger; de cijfers van C liggen meer naar rechts op de getallenlijn.

c

Nee, eigenlijk niet. De cijfers van D liggen dichter bij het gemiddelde cijfer.

d

Het gemiddelde van de verschillen is gelijk aan `(1,1+0,2+0,9-3,8+0,1+2,0-0,7)/7 ~~ text(-)0,03` .
Als je de afwijkingen van alle cijfers ten opzichte van het gemiddelde optelt, moet je op `0` uitkomen.

e

Het gemiddelde van de kwadraten is `3,0` . Om een goede spreidingsmaat te zijn, zouden de cijfers van A tussen `6,1 - 3,0 = 3,1` en `6,1 + 3,0 = 9,1` moeten liggen. Aan de linkerzijde klopt dat wel ongeveer, maar aan de rechterzijde is de `9,1` te hoog. Dat komt door het kwadrateren.

f

`sigma = sqrt(3,00) ~~ 1,73` , dus klopt.

g

Het gemiddelde van B is `6,1` . Verschillen met het gemiddelde zijn `text(-)0,2` , `1,3` , `text(-)0,5` , `0,6` , `0` , `0,2` en `text(-)1,4` en hun kwadraten respectievelijk `0,04` , `1,69` , `0,25` , `0,36` , `0` , `0,04` en `1,96` . De som van deze kwadraten is `4,34` en het gemiddelde van de kwadraten van de verschillen is `0,62` .

De standaardafwijking is `sigma = sqrt(0,62) ~~ 0,79` .

Opgave 3
a

`8,2 - 5,4 = 2,8`

b

De verschillende cijfers zijn `c_1 = 5,4` , `c_2 = 8,2` , ...

Bereken eerst het gemiddelde: `bar(c) ~~ 6,7` .

Maak vervolgens een lijst van de kwadraten van `c_i - bar(c)` en neem daar het gemiddelde van. Als je daar de wortel uit trekt vind je ongeveer `sigma ~~ 1,11` .

c

Voer in het statistiekmenu op de GR de verschillende cijfers en de bijbehorende frequenties in.
De GR geeft de standaardafwijking `sigma ~~ 1,11` .

Opgave 4
a

De mediaan is nu het 16e getal en dat is `6,4` .

b

Het eerste kwartiel en derde kwartiel blijven hetzelfde. dus `Q_1 = 5,1` en `Q_3 = 7,7` .

c

De hele boxplot schuift `0,5` op naar rechts.

Opgave 5
a

Je weet de werkelijke getallen niet. De eerste twee werknemers kunnen bijvoorbeeld beiden € 400,00 maar ook € 440,00 verdienen, of beiden een ander loon hebben.

b

Klassenmiddens: `425 - 475 - 525 - ... - 775` euro.
Het gemiddelde daarvan is: `577` euro.

c

De klasse `550 - < 600` .

d

Bepaal het 13e getal (middelste getal bij `25` getallen). Deze zit in de klasse `550 - < 600` .

e

De exacte weeklonen zijn niet bekend. Dan reken je met het mogelijke minimum en het mogelijke maximum: € 400,00 en € 800,00.
Dus `800 - 400 = 400` euro.

f

Het gemiddelde wordt € 601,00.
De modus blijft gelijk.
De mediaan blijft ook gelijk, hoewel je nu wel naar het 13e en 14e getal moet kijken.

Opgave 6
a

De som van de waarnemingsgetallen delen door het aantal metingen.

b

De hoogste min de laagste waarneming.

c

Het derde kwartiel min het eerste kwartiel.

d

Ze zijn correct. Gebruik eventueel de sorteerfunctie in Excel.

e
leeftijd mannen lengte mannen gewicht mannen
mediaan `55` `178` `84,5`
Q1 `37` `172,25` `75`
Q3 `68` `181,25` `91`

Zie de figuur.

f

Van elk waarnemingsgetal het verschil van het gemiddelde berekenen en dit kwadrateren. De som van al die kwadraten delen door het aantal waarnemingsgetallen. Je krijgt de variantie. Door de wortel te trekken uit de variantie krijg je de standaardafwijking.

Opgave 7
a

Zie de tabel.

leeftijd vrouwen lengte vrouwen gewicht vrouwen
gemiddelde `59,1` `166,0` `73,2`
modus bestaat niet `160` `80`
mediaan `64,5` `165` `74,5`
Q1 `50` `160` `64`
Q3 `73` `171,5` `80`
b

Spreidingsmaten:

Leeftijd: `80 - 21 = 59` jaar.

Lengte: `182 - 153 = 29` cm.

Gewicht: `93 - 54 = 39` kg.

Opgave 8

Zie de figuur.

Opgave 9

Voor mannen: boxplot van `60` tot en met `100` ; `Q_1 = 75` , mediaan `= 81` , `Q_3 = 87` .
Voor vrouwen: boxplot van `60` tot en met `100` ; `Q_1 = 81` , mediaan `= 86` , `Q_3 = 90` .

(bron: examen vwo wiskunde A in 2008, tweede tijdvak)

Opgave 10

Gebruik je GR: het gemiddelde is `5,37` en de standaardafwijking is `1,93` .

(bron: examen vwo wiskunde A in 2012, eerste tijdvak)

Opgave 11
a

Zie het antwoord bij e.

`16, 18, 22, 24, 26, 26, 28, 30, 36` : `Q_1 = 20` , mediaan `Q_2 = 26` en `Q_3 = 29` .

b

De getallen worden `20, 22, 26, 28, 30, 30, 32, 34` en `40` . Zie de boxplot bij e.

`Q_1 = 24` , mediaan `Q_2 = 30` en `Q_3 = 33` .

c

De getallen worden `text(-)24` , `text(-)22` , `text(-)18` , `text(-)16` , `text(-)14` , `text(-)14` , `text(-)12` , `text(-)10` en `text(-)4` . Zie de boxplot bij e.

`Q_1= 20` , mediaan `Q_2 = text(-)14` en `Q_3 = text(-)11` .

d

De getallen worden `8, 9, 11, 12, 13, 13, 14, 15` en `18` . Zie de boxplot bij e.

`Q_1 = 10` , mediaan `Q_2 = 13` en `Q_3 = 14,5` .

e

De getallen worden `48, 54, 66, 72, 78, 78, 84, 90` en `108` .

`Q_1 = 60` , mediaan `Q_2 = 78` en `Q_3 = 87` .

f

De boxplot (a, b en c) blijft dezelfde vorm houden en de afstanden tussen de kengetallen (maximum, minimum, eerste en derde kwartiel, mediaan) blijven gelijk. De boxplot verschuift in zijn geheel langs de as.

g

De afstanden tussen de kengetallen vergroten of verkleinen met het vermenigvuldigingsgetal. Dit betekent dat de boxplot (d, e) groter of kleiner wordt.

Opgave 12
a

Tot op de millimeter nauwkeurig. De lengte `3,0` hoort bij de tweede klasse.

b

De klasse `12,0 - lt 15,0` bevat het grootste aantal wormen.

c

Zie de figuur.

d

In de klasse `9,0 - lt 12,0` . Je kunt de mediaan niet bepalen, want de losse waarnemingen zijn niet bekend. Met behulp van de cumulatieve frequentiepolygoon kun je de mediaan schatten: ongeveer `11,8` .

e

Het gemiddelde `~~11,79` ; de standaardafwijking `~~4,92` .

Opgave 13

Omdat alle cijfers `0,5` hoger worden verandert wel het gemiddelde, maar niet de afwijking van een cijfers ten opzichte van dat gemiddelde.

Het gemiddelde wordt `5,8` en de standaardafwijking blijft `1,2` .

Opgave 14
a

Bij de tabel met bestedingen in euro's is de gemiddelde besteding per klant ongeveer € 112,50. De modale klasse is `100 - lt 150` euro. De mediaan is ongeveer `125` en `Q_1 ~~ 75` en `Q_3 ~~ 125` .

Bij de tabel met de tijd in minuten is de gemiddelde tijd per klant ongeveer `2,25` minuten. De modale klasse is `1 - lt 2` . De mediaan is ongeveer `2,5` en `Q_1 ~~ 1,5` en `Q_3 ~~ 2,5` .

Bereken het gemiddelde met behulp van de klassenmiddens. Voor de tabel met euro’s zijn dat `25, 75, ... 275` en `325` . Voor de tabel met minuten zijn dat `0,5; 1,5; ...; 4,5` en `5,5` .

b

Gebruik de klassenmiddens (van `25` tot en met `325` euro en van `0,5` tot en met `5,5` minuten). Gebruik je GR om de standaardafwijkingen te schatten.

Bij de tabel met de bestedingen in euro's is de standaardafwijking ongeveer `56,1` en bij de tabel met de tijd in minuten is de standaardafwijking ongeveer `1,17` .

c

Gebruik `Q_1` , de mediaan en `Q_3` zoals berekend bij a; gebruik ook de kleinste ( `0` euro en `0` minuten) en de grootste waarden ( `350` euro en `6` minuten).

d

Er zijn gemiddeld `150000/(112,50)~~1333` klanten per week. (De omzet delen door de gemiddelde besteding per klant.) Elke klant heeft een gemiddelde van `2,25` minuten tijd. Er is totaal `2,25` maal `1333` minuten aan kassawerk. Dit zijn `3000` minuten. Met een overcapaciteit van `25` % vermenigvuldig je dit getal met `1,25` om te weten hoeveel tijd de supermarkt aan caissières nodig heeft. Dit is `(1,25 *3000) /60=62,5` uur kassawerk. Er zijn dus `1,64` caissières nodig. Dat moet je afronden naar `2` .

Opgave 15
a

Zie de figuur.

b

Zie de figuur.

c

am: gemiddelde `~~17,0` °C en de standaarddeviatie `~~2,1` °C
pm: gemiddelde `~~20,0` °C en de standaarddeviatie `~~2,2` °C.

d

dag: gemiddelde `~~18,6` °C en de standaarddeviatie `~~2,6` °C.

e

's Morgens is het gemiddeld kouder dan 's middags en 's avonds. Het gemiddelde over de hele dag is het gemiddelde van beide gemiddelden per dagdeel (evenveel metingen per dagdeel). De temperaturen van pm liggen kennelijk wat meer gespreid dan die van am.

Opgave 16Lengte en gewicht
Lengte en gewicht
a

De modale lengte is `161` cm, de gemiddelde lengte is ongeveer `162,1` cm.

b

Je weet dat er `5001` tellingen zijn en de lengtes staan al op volgorde van klein naar groot.

De mediaan is te vinden bij de `2501` -ste telling (en is dus eigenlijk `162` cm);

`Q_1` is het gemiddelde van de `1250` -ste en de `1251` -ste telling (en is dus eigenlijk `158` cm);

`Q_3` is het gemiddelde van de `3750` ste en de `3751` ste telling (en is inderdaad `166` cm).

Het minimum is `139` cm en het maximum is `186` cm.

c

De kwartielafstand is `166-158=8` cm.

`158 - 1,5*8 = 146` cm en `166 + 1,5*8 = 178` cm.

Er zijn lengtes onder de `146` cm en ook boven de `178` cm, dus er zijn uitschieters.

d
lengte frequentie rel. freq. (%) cum. rel. freq. (%)
`135 - < 140` 1 0,0 0,0
`140 - < 145` 18 0,4 0,4
`145 - < 150` 122 2,4 2,8
`150 - < 155` 467 9,3 12,1
`155 - < 160` 1118 22,4 34,5
`160 - < 165` 1520 30,4 64,9
`165 - < 170` 1115 22,3 87,2
`170 - < 175` 489 9,8 97
`175 - < 180` 128 2,6 99,6
`180 - < 185` 22 0,4 100
`185 - < 190` 1 0,0 100
totaal 5001 100

De cumulatieve relatieve frequentiepolygoon heeft een soort S-vorm.

e

Lees de mediaan af bij `50` %: `162` cm. Lees het eerste kwartiel af bij `25` %: `158`  cm. Lees het derde kwartiel af bij `75` %: `166` cm. Nee, dat wijkt nauwelijks af.

Opgave 17Mouwlengte en kniehoogte
Mouwlengte en kniehoogte
a

Modus: `58` cm.

Omdat er `5001` vrouwen zijn opgemeten is de mediaan het `2501` -ste getal: `59`  cm.

Gemiddelde: `bar(m) ~~ 59,1` cm.

b

Je hebt hier te maken met een frequentietabel waarbij de waarden van de statistische variabele mouwlengte de klassenmiddens zijn. Hiervan kun je gemakkelijk de spreidingsbreedte aflezen: `71 - 49 = 22` cm.

Omdat er `5001` vrouwen zijn opgemeten is het eerste kwartiel het `1251` -ste getal en het derde kwartiel het `3751` -ste getal. De kwartielafstand is daarom `61 − 57 = 4` cm.

Het berekenen van de standaardafwijking is nu meer werk, want je moet met de frequenties rekening houden. Met Excel vind je dat `sigma_m ~~ 3,1` cm.

c

De afwijkende mouwlengte is `71` cm.

Het derde kwartiel is `61` cm en de kwartielafstand is `4` cm. Nu is er sprake van een uitschieter bij een mouwlengte van `61 + 1,5*4 = 67` cm. Dus is er inderdaad sprake van meerdere uitschieters.

Opgave 18Gewichten van 84 meisjes en 68 jongens
Gewichten van 84 meisjes en 68 jongens
  • De spreidingsbreedte van de meisjes is `29` kg (neem de uitschieters mee).

  • De modus van de jongens bestaat niet.

  • Het gemiddelde van de jongens is `65,2` kg.

  • De mediaan van de jongens is `65` kg.

  • `Q_1` van de jongens is `58,5` kg.

  • `Q_3` van de jongens is `70,5` kg.

  • De kwartielafstand van de jongens is `12` kg.

  • De spreidingsbreedte van de jongens is `41` kg.

  • De standaardafwijking van de jongens is `9,2` kg.

  • Uitschieters bij de jongens: alleen de `90` kg.

Meisjes:

  • De centrummaten liggen erg dicht bij elkaar; het gemiddelde is iets groter dan andere centrummaten. Dit wordt veroorzaakt door de zwaardere uitschieters, dus de mediaan is in dit geval de beste centrummaat (de modus is meer geschikt bij kwalitatieve variabelen).

  • De spreidingsbreedte is in dit geval minder geschikt, ook vanwege de uitschieters. De kwartielafstand of de standaardafwijking geeft een beter inzicht.

  • `Q_1` en `Q_3` liggen heel symmetrisch rond de mediaan. Dit is te zien in de cumulatieve relatieve frequentiepolygoon, want die stijgt daar constant.

  • De vorm van de boxplot kun je terugzien in de cumulatieve relatieve frequentiepolygoon. De spreiding van de lichtste `25` % is lager dan de daaropvolgende `25` % en dat zie je in de polygoon terug in de steilheid (eerst laag, dan hoog).

Jongens:

  • Dezelfde observaties over centrum- en spreidingsmaten als bij de meisjes. Ook hier is een zware uitschieter die het gemiddelde en de spreidingsbreedte te veel beïnvloedt.

  • Uit de boxplot volgt meteen dat er meer spreiding zit bij de zwaardere jongens dan in de groep lichtere jongens. Dit zie je terug in de cumulatieve relatieve frequentiepolygoon. De eerste `75` % stijgt vrij gelijkmatig, daarna is de stijging langzamer.

  • De mediaan ligt dichter bij `Q_3` dan bij `Q_1` . Er is minder spreiding tussen de `25` % gewichten tussen de mediaan en `Q_1` dan tussen de `25` % gewichten tussen `Q_3` en de mediaan. Anders gezegd: de `25` % net iets zwaardere jongens hebben een gewicht dat dicht bij elkaar ligt.

Verschillen tussen jongens en meisjes:

  • De meisjes zijn lichter dan de jongens. Dit is te zien aan de centrummaten en aan de diagrammen.

  • De meisjes kennen meer spreiding in de `25` % lichte meisjes, terwijl de jongens meer spreiding kennen in de `25` % zware jongens.

  • Bij de meisjes zijn de `25` % wat lichtere meisjes en de `25` % wat zwaardere meisjes symmetrisch verspreid, terwijl de jongens wat meer spreiding kennen in de lichtere `25` %.

  • De jongens kennen in het algemeen meer spreiding in gewicht (voor alle drie de spreidingsmaten geldt dat ze groter zijn dan de overeenkomende maten van de meisjes).

  • De `75` % lichtere jongens kennen een gelijkmatiger spreiding dan de `75` % lichtere meisjes (zie de cumulatieve relatieve frequentiepolygoon).

Overeenkomsten tussen jongens en meisjes:

  • Alleen uitschieters naar de zware kant.

  • Centrummaten liggen heel dicht tegen elkaar.

Een dataset met `84` meisjes en `68` jongens is niet heel erg groot. Het is de vraag of het verwijderen van uitschieters hier verantwoord is. Dat zou nader onderzocht moeten worden (de dataset is namelijk ook niet heel erg klein).

Opgave 19
a

Voor leeftijd en zakgeld de mediaan. Voor lengte en gewicht het gemiddelde. voor favoriete drankje en vervoermiddel de modus.

b

Voor leeftijd en zakgeld de kwartielafstand en spreidingsbreedte. Voor lengte en gewicht de standaarddeviatie. Voor favoriete drankje en vervoermiddel geen spreidingsmaat.

c

De doorsneefeestganger is 16-17 jaar, `181` cm lang, drinkt cola, weegt `71` kg, heeft € 22,13 zakgeld en komt met de fiets.

Opgave 20
a

Het modale salaris is ruim € 30000,00 per jaar.

b

De modus lees je af bij het hoogste punt, dus minder dan € 30000,00.

De mediaan zit waar links en rechts een even groot gebied ( `50` % van de werknemers) onder de grafiek ligt, dat is bij ruim € 30000,00.

De mediaan is groter dan de modus.

Opgave 21
a

Het gemiddelde is ongeveer `25,7` seconden, de mediaan is `23` en de modus is `17` .

b

De spreidingsbreedte is `28` en de standaardafwijking is ongeveer `7,9` .

c

Het minimum is `15` , het maximum is `43` . De kwartielen zijn `Q_1 =17,5` en `Q_3 =32` .

d
tijd frequentie
15 - < 20 `8`
20 - < 25 `7`
25 - < 30 `5`
30 - < 35 `3`
35 - < 40 `5`
40 - < 45 `1`
totaal `29`
e

Het gemiddelde is ongeveer `26,3` seconden en de standaardafwijking is ongeveer `7,7` seconden.

f

De mediaan is ongeveer `22,5` seconden.

verder | terug