Steekproef en Populatie > Populatie en steekproeven
12345Populatie en steekproeven

Antwoorden van de opgaven

Opgave V1
a

Welk deel van de jongeren (tussen `15` en `25` jaar) gebruikt internet via de telefoon? De onderzoeksvraag kan ook veel algemener zijn (bijv. “Wat doen jongeren met hun mobieltje?”), waarbij de genoemde uitspraak slechts het antwoord op een deelvraag is.

b

Bijvoorbeeld door een groot aantal jongeren (telefonisch) te bevragen

c

Eigen antwoord.

Opgave 1
a

Een zonnebloem heeft een lengte die tot op de centimeter maar ook tot op de millimeter of nog kleiner kan worden opgemeten: het is een getalsmatige en dus kwantitatieve toevalsvariabele.

De zonnebloemlengte is een natuurlijk fenomeen, net als de lengte van een mens, en zal waarschijnlijk daarom normaal verdeeld zijn.

b

Alle zonnebloemen die in het betreffende jaar in midden-Frankrijk gebloeid hebben.

c

Aselect:

Alle zonnebloemen die in het betreffende jaar in midden-Frankrijk bloeien, moeten een even grote kans hebben om in de steekproef terecht te komen. Meet daarom zonnebloemen geheel verspreid door het jaar en verspreid door midden-Frankrijk. Neem ook zonnebloemen mee die spontaan groeien, buiten akkers om. Meet zowel zonnebloemen aan de rand van een akker als in het midden, enzovoort.

Representatief:

Zorg ervoor dat de verhouding van zonnebloemtypes in je steekproef, zoals bij aselect beschreven, gelijk is aan de werkelijke verhoudingen in dat jaar in midden-Frankrijk.

d

In een jaar tijd zullen er heel erg veel zonnebloemen bloeien in midden-Frankrijk (honderdduizenden, miljoenen?) dus een steekproef van minder dan tien zonnebloemen zal veel te klein zijn om een betrouwbaar resultaat op te leveren. En een steekproef die uit alle zonnebloemen bestaat, is geen steekproef meer: je hebt dan de gehele populatie te pakken en dat is in praktijk niet te doen.

Opgave 2
a

Niet aselect, want alleen de leerlingen uit jouw klas hebben kans om in de steekproef terecht te komen. Niet representatief, want de steekproef mist nu bijvoorbeeld jongere/oudere leerlingen en leerlingen uit een ander schooltype en leerlingen uit een andere streek van Nederland.

b

Wel representatief, want in het bevolkingsregister zitten alle Nederlanders die mogen stemmen. Ook aselect want ze worden willekeurig gekozen: de kans dat ze er in komen is voor allemaal even groot.

Opgave 3
a

Dit volgt uit de centrale limietstelling. Het is daarbij niet nodig dat het gewicht van een pak suiker normaal verdeeld is.

b

Ja, dit volgt uit de centrale limietstelling.

c

Het gemiddelde is hetzelfde als het gemiddelde gewicht van een pak suiker, dus `1000`  gram.

De standaardafwijking is `(2,8)/(sqrt(100)) = 0,28` gram. (Denk aan de wortel-n-wet.)

d

`text(P)(bar S lt 999| mu = 1000 text( en ) sigma = 0,28) ~~ 0,0002`
Voer in: `text(normalcdf)(text(-)10^(99); 999; 1000; 0,28)` .

Opgave 4
a

A: zonnebloemlengte

B: gemiddelde zonnebloemlengte in een steekproef

b

Die van onderzoeker B, want als je meerdere steekproeven trekt, herhaal je eigenlijk telkens een kansexperiment.

c

De centrale limietstelling garandeert dat je met één steekproef een betrouwbare uitspraak over alle zonnebloemen kunt doen.

Opgave 5
a

Ja, want elke leerling heeft dezelfde kans om in de steekproef te komen, namelijk `10` %.

b

Dat kun je niet zeggen, want er staat niet bij wat de populatie is.

c

Nee, want klanten die de helpdesk niet bellen, horen wel bij de populatie, maar komen nooit in de steekproef.

Opgave 6
a

De steekproef kan niet representatief zijn. Waarschijnlijk wordt zijn koffie ook in andere winkels of online verkocht. Dus de steekproef komt niet uit de hele populatie. De steekproef onder zijn klanten is ook niet aselect. Klanten die niet in zijn winkel komen, hebben geen kans om in de steekproef te komen.

b

De steekproef is representatief, want de steekproef komt uit de hele populatie. De steekproef is aselect, want alle toegelaten voertuigen hebben evenveel kans om in de steekproef te komen.

c

Niet representatief, want de jongeren die geen sociale media gebruiken, worden niet bereikt. De steekproef is ook niet aselect. Jongeren die geen sociale media gebruiken, hebben geen kans om in de steekproef terecht te komen.

Opgave 7
a

Nee dat hoeft niet.

b

Voer in: `text(normalcdf)(text(-)10^(99), 500, 501, (2,9)/sqrt(50))` .

c

`text(P)(bar(X) lt 500 | mu = 501 text( en ) sigma = (2,9)/sqrt(100)) ~~ 0,0003`

Opgave 8

Als het aantal proefpersonen klein is, is de steekproefomvang dus klein.

Hoe kleiner de steekproefomvang, des te breder de normale verdeling van het steekproefgemiddelde is (als je ervan uit mag gaan dat er sprake is van een normale verdeling). Denk aan de wortel-n-wet: `n` is klein dus de standaardafwijking van het steekproefgemiddelde is dan groot.

Anders gezegd: hoe kleiner de steekproefomvang, des te afwijkender kan het effect van één steekproef zijn. Vandaar de moeilijkheid om het effect te reproduceren, áls het effect al zou bestaan, want dat is ook niet zeker. Juist omdat het een te kleine steekproefomvang is, is er geen sprake van de werking van de centrale limietstelling.

Opgave 9

Is dit een goede aanpak? Welk van de antwoorden is correct en waarom?

Ja, zo krijg je een juiste schatting.

Nee, zo krijg je een te lage schatting.

Nee, zo krijg je een te hoge schatting.

Opgave 10
a

Dit volgt uit de centrale limietstelling. De steekproef is groot genoeg. Daarom mag je ervan uitgaan dat de steekproevenverdeling normaal verdeeld is.

b

`text(P)(bar(S) < 1000| mu = 1002 text( en ) sigma = (6,5)/(sqrt(100))) ~~ 0,0010`

Opgave 11
a

De steekproef is niet aselect, want een Nederlander uit een provincie met veel inwoners heeft een kleinere kans om in de steekproef te komen dan een Nederlander uit een provincie met weinig inwoners.

De steekproefomvang lijkt voldoende te zijn.

b

Bijvoorbeeld:

  • aselect `1200` deelnemers uit alle Nederlanders trekken;

  • aselect een vast percentage deelnemers, bijvoorbeeld `0,5` %, per provincie trekken.

Opgave 12
a

Uitgaan van een normale verdeling is niet juist, omdat je naar de som van maar drie worpen met een dobbelsteen kijkt.

b

Uit de centrale limietstelling volgt dat je hier uit mag gaan van een normale verdeling.

c

De vraag is of de honderd kansexperimenten die gedaan worden onafhankelijk zijn. Misschien wordt de boogschieter moe of worden de weersomstandigheden anders. Als er sprake is van afhankelijkheid, mag je de centrale limietstelling niet toepassen. Overigens kan het best zo zijn dat de som van afhankelijke niet normaal verdeelde variabelen bij benadering normaal verdeeld is. Maar of dat hier het geval is, is niet bekend.

Opgave 13
a

Voer de frequentieverdeling als twee lijsten in je grafische rekenmachine in en laat de statistische berekeningen uitvoeren. Gebruik klassenmiddens.

Het steekproefgemiddelde is ongeveer `2,76` meter met een standaardafwijking van `0,73`  meter.

b

Uit de centrale limietstelling volgt dat de steekproevenverdeling bij benadering normaal verdeeld is. Dit wil niet zeggen dat de lengte van een zonnebloem normaal verdeeld is.

c

`text(P)(L < 2,76 | μ = 2,83 text( en ) σ = 0,76) ~~ 0,4633`

Opgave 14
a

Bij de gewone dobbelsteen. Dit komt doordat de kansverdeling van de gewone dobbelsteen symmetrisch is en die van de bijzondere dobbelsteen niet. Het is namelijk zo dat hoe symmetrischer de kansverdeling van een toevalsvariabele hoe kleiner de steekproef hoeft te zijn, om de centrale limietstelling te mogen gebruiken.

b

Ja, dit volgt uit de centrale limietstelling. Die zegt namelijk dat de toevalsvariabelen verschillend verdeeld mogen zijn.

Opgave 15Populaire webwinkel
Populaire webwinkel
a

`bar B` is het gemiddelde van de som van `50` normale verdelingen en is daarom zelf ook normaal verdeeld, met `μ(bar(B)) = 65000` en `σ(bar(B)) = (27500)/(sqrt(50)) ~~ 3889,1 ` .

b

`text(P)(bar B > 73000 | μ(bar B) = 65000 text( en ) σ(bar B) = (27500)/(sqrt(50))) ~~ 0,0198`

c

`mu(B) = mu(bar(B)) = 65000` , `sigma(B) = 27500` en `sigma(bar(B)) = 27500/(sqrt(50))` .

Omdat de gemiddeldes van `B` en `bar(B)` gelijk zijn en de standaardafwijking van `sigma(bar B)` kleiner is, is het waarschijnlijker dat er tijdens een willekeurig kantooruur minder dan `60000` bezoekers zijn dan dat het steekproefgemiddelde lager dan `60000` is.

d

Consequentie van de centrale limietstelling is dat het gemiddelde van een steekproef van voldoende omvang, ongeacht de kansverdeling van elk van de elementen uit de steekproef, in een normale verdeling rondom het gemiddelde van de totale populatie zal liggen. Hoe groter de steekproefomvang, hoe dichter deze normale verdeling in z'n geheel het populatiegemiddelde benadert.

Opgave 16
a

Nee. `0,01` % betekent dat de ziekte bij `1` op de `10000` voorkomt. Als je dan vijfduizend Nederlanders onderzoekt, is de kans groot dat je niemand met de ziekte vindt.

b

Of een steekproefomvang van dertig in dit geval genoeg is (of misschien zelfs wel te veel en daardoor het onderzoek te duur maakt), kun je niet met zekerheid zeggen als je niet weet hoeveel mensen in totaal op woensdagen de ijsbaan bezoeken.

Opgave 17
a

Aselect wel want iedere treinreiziger heeft dezelfde kans om de vragenlijst te krijgen.
Representatief niet, want niet alle bezitters van een OV-chipkaart gebruiken de trein (sommigen alleen de bus).

b

Niet aselect en niet representatief, want mensen die deze site niet bezoeken horen wel bij de populatie, maar komen nooit in de steekproef.

Opgave 18
a

`text(P)(bar(X) lt 18 | mu = 25 text( en ) sigma = 3/(sqrt(40))) ~~ 0`

b

De kans op een gemiddelde van minder dan `18` gram is wel heel klein: je zou terecht kunnen gaan twijfelen aan het gemiddelde van `25` gram.

verder | terug