Beschrijvende statistiek > Centrummaten
123456Centrummaten

Antwoorden van de opgaven

Opgave V1
a

Laborant A: `65` en `66` .

Laborant B: `65` en `66` .

Laborant C: `66` , `67` en `68` .

b

Laborant A: `65,2 ~~ 65` %.

Laborant B: `64,95 ~~ 65` %.

Laborant C: `67,25 ~~ 67` %.

c

Laborant A: `65` %.

Laborant B: `65` %.

Laborant C: `67` %.

d

Over de juistheid.

Opgave 1
a

Twee laboranten komen op hetzelfde gemiddelde uit, het gemiddelde van laborant C wijkt af. Maar het ging steeds over dezelfde `20` kuipjes. Vermoedelijk maakt laborant C dus een systematische fout en krijgt hij of zij een afwijking van de juiste waarde.
Omdat het natuurlijk ook zo kan zijn dat juist laborant C het goed heeft gedaan, moeten die metingen nog eens worden gedaan om te controleren wat er aan de hand is.

b

Laborant A: juistheid `|65,20 - 65| = 0,2` %.
Laborant B: juistheid `|64,95 - 65| = |text(-)0,05| = 0,05` %.
Laborant C: juistheid `|67,25 - 65| = 2,25` %.
Dus laborant C zit er dan `2,25` procentpunt naast.

c

Zie de figuur. Het resultaat is even precies, maar juister.

Opgave 2
a

Nee, je kunt beter meteen met het Excelbestand te gaan werken.

b

Het gemiddelde is `27,3` cm, de modus is `28,0` cm en de mediaan is `27,5` cm.

b

In sommige versies van Excel is dit nog wel lastig, bekijk het Practicum .
Maar je kunt wel altijd minimum, eerste kwartiel, mediaan, derde kwartiel en maximum laten berekenen door Excel. En daarmee kun je altijd op papier de twee boxplots tekenen. Zet je alle gegevens van de mannen en van de vrouwen in twee kolommen, dan kan Excel automatisch boxplots voor je maken.

c

Je ziet in ieder geval dat er bij de vrouwen minder verschil is in voetlengtes.
Verder zijn de voetlengtes bij de vrouwen over het algemeen kleiner, maar beslist niet altijd.

d

Het gemiddelde is `25,7` cm, de modus is `26,0` cm en de mediaan is `25,9` cm.
Bij de vrouwen is het gemiddelde lager.

Opgave 3
a

Nee, een gemiddelde partij bestaat niet, een modale partij (partij met de meeste zetels) zou misschien kunnen, de mediaan is echt onzin.
Wel kun je het gemiddelde aantal zetels per partij berekenen, dat is gewoon `150//` aantal partijen. Maar dat getal zegt helemaal niks.

b

Nee, wat je wel kunt doen is een likertschaal gebruiken bijvoorbeeld voor "geur" en punten geven van `1` t/m `5` . Daarvan kun je dan wel een gemiddelde berekenen en ook een modus.

c

Nee, dat getal is volslagen zinloos. Want het gaat om kwalitatieve variabelen die ook nog eens onbenoemd blijven omdat het niet verder gaat dan "je beleving" . Nu kun je zeggen dat je dan mooi zaken met elkaar kunt vergelijken, maar ook dat is onzin, want die gemiddelden zijn zeer waarschijnlijk niet op dezelfde steekproeven gebaseerd.

Opgave 4
a

Werk vooral bij het berekenen van het gemiddelde met Excel. Maak een extra kolom `m_i * f_1` waarin `m_i` een mouwlengte en `f_i` de bijbehorende frequentie is. Laat Excel het rekenwerk doen.

b

Een afwijking van `|59,05 - 59| = 0,05` cm. Dat is `(0,05)/59 * 100 ~~ 0,8` %.
Dus is de relatieve afwijking heel klein.

c

De minimale mouwlengte is `49` cm.
Het eerste kwartiel is het `1251` -ste getal, dus `Q_1 = 57` cm.
De mediaan (het tweede kwartiel) is het `2501` -ste getal, dus `Q_2 = 59` cm.
Het derde kwartiel is het `3751` -ste getal, dus `Q_3 = 61` cm.
De maximale mouwlengte is `71` cm.
Maak hiermee handmatig een boxplot.

Opgave 5
a

Werk met Excel, zie het Practicum .

b

Je krijgt: de modale concentratie is `25` , de mediaan is `25` en de gemiddelde concentratie is `~~25` .

c

Dan is de verdeling waarschijnlijk symmetrisch met een duidelijk herkenbaar centrum dat ook de hoogste frequentie heeft.

Opgave 6
a

Het gemiddelde en de mediaan totaal niet.
Je zou nog kunnen zeggen dat de modale (meest aanwezige) soort stof methaan is.

b

`0,05*120 = 6` m3.

Opgave 7
a

Het gemiddelde is `725` µg/kg.
Dit getal zegt iets over de juistheid van de metingen.

b

Nee, want er zijn ook acrylamidehoeveelheden aangetroffen die op of boven de `750`  µg/kg liggen.

c

Zet de gegevens op volgorde van klein naar groot.
minimum `690` , `Q_1 = 710` , mediaan `725` , `Q_3 = 740` en maximum `780` µg/kg.

d

Bestuderen waardoor de acrylamidehoeveelheden die op of boven de `750` µg/kg liggen worden veroorzaakt en daaruit de algemene richtlijnen voor het bakken van de frites aanscherpen.

Opgave 8
a

Gebruik Excel: het gemiddelde is `~~162,1` cm, de modus is `161` cm en de mediaan (het `2501` -ste getal) is `162` cm.

b

Zie figuur. De drie centrummaten liggen dicht bij elkaar omdat de figuur behoorlijk symmetrisch is.

c

Lees uit de frequentietabel af: minimum `139` , `Q_1 = 158` , mediaan `162` , `Q_3 = 166` en maximum `186`  cm. Maak hiermee een boxplot.

d

Die lengtes zijn vanaf `Q_3 = 166` en tot en met het maximum `186` cm, dus `166 le L le 186` .

e

Juistheid `|162,1 - 161| = 1,1` .
De relatieve juistheid is daarom `(1,1)/161 * 100 ~~ 0,7` %. Dus de relatieve afwijking is zeer gering.

Opgave 9
a

"gebruiksgemak" , "leesgemak" en "boeken toevoegen" .

b

Als je afspreekt dat elk van de testers een score opgeeft bijvoorbeeld op een schaal van `1` t/m `10` , kun je van die vijf scores een gemiddelde berekenen. Je gebruikt dan een likertschaal.

Opgave 10
a

`45,7`

b

In het meest gunstige geval heeft het eerste kwart van de renners een hematocrietwaarde van `41` , het tweede kwart `46` , het derde kwart `48` en het vierde kwart `50` (eigenlijk zelfs meer omdat ook het maximum moet voorkomen).

`0,25 * 41 + 0,25 * 46 + 0,25 * 48 + 0,25 * 50 = 46,25`

Dus het gemiddelde is in 1999 zeker groter dan `45,9` .

Opgave 11
a

`53,55 ~~ 54` km/h.
Voor de politie is dit getal niet erg van belang, aan gemiddelden kun je geen boetes uitdelen. Het is wel een getal dat aangeeft dat hier regelmatig te hard wordt gereden.

b

De modale snelheid is `56` km/h.

c

Lees uit het steelbladdiagram af: minimum `41` , `Q_1 = 47,5` , mediaan `52,5` , `Q_3 = 57,5` en maximum `75`  cm. Maak hiermee het boxplot.

d

`25` %.

Opgave A1
a

`75` %.

b

`25` % en `25` %.

c

Het derde kwartiel van de meisjes is kleiner dan het eerste kwartiel van de jongens.

d

Ja, de boxen overlappen niet.

Opgave A2
a

Het verschil is middelmatig, want de mediaan van donderdag ligt buiten de box van woensdag.

b

Bijvoorbeeld dat zondagbevallingen, al dan niet moedwillig, uitgesteld worden naar de maandag.

c

Ongeveer `50` %.

d

`~~455` bevallingen.

Opgave T1
a

Modus `12,7` , mediaan `12,7` en gemiddelde `~~12,65 ~~ 12,7` %.

b

Ze geven alle drie aan waar het centrum van de metingen ligt, maar zeggen niets over de spreiding ervan.

c

De juistheid van de metingen is dan `|12,65 - 12,70| = 0,05` %.

Opgave T2
a

`59` bacteriën per centiliter.

Nee, bij de ene melkboer kan veel meer melk opgehaald zijn dan bij een andere en dat heeft gevolgen voor het gemiddelde.

b

Staafdiagram, zie figuur.

Boxplot: minimum `0` , `Q_1 = 40` , mediaan `60` , `Q_3 = 70` en maximum `100` cm. Maak hiermee een boxplot.

c

De laagste waarden worden groter. Het gemiddelde is de som van alle waarden gedeeld door het aantal waarden. Als sommige waarden groter worden, wordt het gemiddelde dus ook groter.

d

De mediaan is de middelste waarde en was `60` . De twee kleinste waarden ( `0` en `10` ) worden groter, maar blijven in de kleinste helft ( `50 < 60` ) van de dataset, dus de mediaan blijft `60` .

verder | terug