Stel dat men wil onderzoeken hoeveel procent van de populatie jongeren vanaf 12 t/m 16 jaar lid is van een sportvereniging (geen fitnessclub). Dit heet de populatieproportie.
Het is ondoenlijk om de hele populatie te bevragen. Dus wordt er een (aselecte, representatieve)
steekproef getrokken van
`n=500`
jongeren van 12 t/m 16. Er blijken
`360`
jongeren in de steekproef
"ja"
te antwoorden op de vraag of ze lid zijn van een sportvereniging.
De steekproefproportie is
`p = 360/500 = 0,72`
ofwel
`72`
%,
Maar wat zegt dit over de populatieproportie?
Bij
`sigma = sqrt((p * (1-p))/n)`
Volgens de vuistregels van een normale verdeling ligt in `95` % van de steekproeven `p` minder dan `2sigma` van de populatieproportie af. Nu is die populatieproportie nog onbekend, je hebt alleen `p` .
En als `p` minder dan `2sigma` van de populatieproportie af ligt, ligt de populatieproportie ook minder dan `2sigma` van `p` af. Dat gaat goed in `95` % van de gevallen.
In de beschreven situatie is
`sigma = sqrt((0,72*(1-0,72))/500)~~0,020`
.
Dus de populatieproportie ligt dan (met een betrouwbaarheid van
`95`
%) minder dan
`2 sigma = 2*0,020 = 0,04`
van
`p=0,72`
af, dus tussen
`0,72 - 0,04 = 0,68`
en
`0,72 + 0,04 = 0,76`
.
Of in procenten tussen
`68`
% en
`76`
%.
Dit heet het
`95`
% betrouwbaarheidsinterval voor de populatieproportie.
Bekijk
Reken zelf `p` en de standaardafwijking `sigma` van de steekproevenverdeling na.
Gebruik in het
Natuurlijk weet je in de praktijk niet hoe groot de populatieproportie is, dus kun
je zo'n simulatie dan niet gebruiken.
Maar ga na dat je door nieuwe simulaties te doen met populatieproportie
`72`
% en
`n=500`
je wel steeds op ongeveer dezelfde gemiddelde steekproevenproportie en standaardafwijking
uitkomt.
Er wordt een onderzoek gedaan naar welk deel van festivalgangers ouder dan 40 jaar is. Bij een festival is door middel van een steekproef aan `150` bezoekers de leeftijd gevraagd. Van deze groep blijken `50` bezoekers 40 jaar of ouder te zijn. Bereken in vier decimalen nauwkeurig de bijbehorende steekproefproportie en de standaardafwijking van de steekproevenverdeling. Geef ook het `95` % betrouwbaarheidsinterval voor de populatieproportie.
Er wordt in
Tussen welke grenzen ligt in `68` % van de steekproeven het "Ja" -deel van de populatie?
Tussen welke grenzen ligt in bijna `100` % van de steekproeven het "Ja" -deel van de populatie?
Om te bepalen hoeveel procent van de Nederlanders linkshandig is wordt een aselecte steekproef van `1500` Nederlanders getrokken. Daarvan waren er `136` linkshandig.
Bereken het deel van de steekproef dat linkshandig is.
Bereken de standaardafwijking van steekproevenverdeling in de steekproef. Rond je antwoord af op vier decimalen.
Tussen welke waarden ligt met `95` % betrouwbaarheid het deel van de populatie dat linkshandig is? Geef je antwoord in procenten in één decimaal nauwkeurig.