Steekproef en Populatie > Populatie en steekproeven
12345Populatie en steekproeven

Uitleg

Er is een heel groot concert met tienduizenden bezoekers. De organisatoren van het concert willen de gemiddelde leeftijd van de bezoekers weten.
Bij elk van de `50` ingangen zetten ze een enquêteur die aan elke 10e bezoeker de leeftijd vraagt. Zo worden er `50` steekproeven genomen. Ga ervan uit dat deze steekproeven representatief zijn. Omdat niet iedereen wordt ondervraagd, kun je de gemiddelde leeftijd niet precies te weten komen. Je kunt deze alleen maar schatten. In het linker histogram zijn de gegevens van één van de `50` steekproeven weergegeven.

Het lijkt erop dat de leeftijden van de concertbezoekers niet normaal verdeeld zijn. Van alle `50` steekproeven die genomen zijn, is de gemiddelde leeftijd berekend, bekijk het rechter histogram. Het lijkt er op dat de steekproevenverdeling wel bij benadering normaal verdeeld is.

In de steekproef gaat het om `n` onafhankelijke gelijke toevalsvariabelen `X` . De som `S` van deze gelijke toevalsvariabelen is bij benadering normaal verdeeld met gemiddelde ` bar(S) = n*bar(X)` en standaardafwijking `sigma(S) = sqrt(n)*sigma(X)` . Ook het gemiddelde van `S` is bij benadering normaal verdeeld met een gemiddelde van `bar(S) = bar(X)` en een standaardafwijking van `sigma(bar(S)) = (sigma(X))/(sqrt(n))` .

Hoe meer steekproeven je doet, hoe beter de benadering is. In veel gevallen is `n ge 30` groot genoeg, maar de minimale steekproefomvang hangt af van wat je onderzoekt.

In het algemeen zijn de uitkomsten van een grote hoeveelheid onafhankelijke steekproeven uit dezelfde populatie bij benadering normaal verdeeld. Hoe groter het aantal steekproeven, hoe beter de benadering. Hieruit volgt dat de steekproevenverdeling bij benadering normaal verdeeld is. Dit wordt de centrale limietstelling genoemd.

Opgave 3

Een vulmachine vult pakken suiker. Het gemiddelde gewicht van een pak suiker is `1000` gram en de standaardafwijking `2,8` gram.
De Consumentenbond doet een steekproef van honderd pakken.

a

Waarom mag je zeggen dat het totale gewicht van die honderd pakken bij benadering normaal verdeeld is? Is het daarbij belangrijk dat het gewicht van een pak suiker normaal verdeeld is?

b

Is de steekproevenverdeling ook bij benadering normaal verdeeld?

c

Wat is het gemiddelde en de standaardafwijking van de steekproevenverdeling?

d

De Consumentenbond vindt het onacceptabel als het gemiddelde gewicht van de pakken suiker uit de steekproef kleiner is dan 999 gram.
Bereken in vier decimalen de kans dat dit het geval is.

Opgave 4

Twee onderzoekers geven elk een werkwijze die beide een bij benadering normale kansverdeling opleveren.

Onderzoeker A neemt een steekproef van `5000`  zonnebloemen uit midden-Frankrijk en meet de lengte ervan. Hij maakt er een histogram van.

Onderzoeker B neemt duizend steekproeven van ieder `5000`  zonnebloemen uit midden-Frankrijk en meet de lengte van al deze zonnebloemen. Van ieder van de `1000`  steekproeven berekent ze de gemiddelde zonnebloemlengte. Van de `5000`  gemiddelde zonnebloemlengtes maakt zij een histogram.

a

Beschrijf voor beide werkwijzen van welke toevalsvariabele de onderzoekers een histogram maken.

b

Geef aan welke van de twee werkwijzen vanwege de centrale limietstelling een normale kansverdeling oplevert.

c

Een groep scholieren wil ook aan de slag met zonnebloemlengtes.

Moeten de scholieren voor hun onderzoek meerdere steekproeven trekken of slechts één (die natuurlijk wel aselect, representatief en groot genoeg is) om toch een betrouwbare uitspraak over alle zonnebloemen te kunnen doen?

verder | terug