Bij statistische onderzoeken komen regelmatig vragen voor met maar twee mogelijke antwoorden, bijvoorbeeld:
Ben je man of vrouw?
Ben je ouder dan 40 jaar?
Als
`39`
% van de ondervraagden op de vraag
"Ben je man?"
met
"ja"
antwoordt is het deel van de ondervraagden dat man is
`p_(text(steekproef man)) = 0,39`
. Dit heet de steekproefproportie mannen.
Bij
"nee"
hoort in dit geval
`p_(text(steekproef vrouw)) = 0,61`
. Deze twee waarden van
`p`
zijn bij elkaar altijd
`1`
.
Elke keer dat er een steekproef wordt genomen, kan het deel van de mensen dat
"ja"
antwoordt, een iets andere waarde hebben. Omdat deze proporties
`p`
een steekproevenverdeling vormen, heeft
`p`
een normale verdeling mits de steekproef voldoende groot is.
Deze steekproevenverdeling heeft een standaardafwijking
`sigma`
die je kunt berekenen uit
`p_(text(steekproef))`
en het aantal mensen
`n`
in de steekproef.
`p_(text(steekproef))`
noteer je ook wel als
`hat(p)`
.
Dan is:
`sigma = sqrt((hat(p)*(1-hat(p)))/n)`
Stel dat in een steekproef van `50` uit een grote populatie `72` % een bepaalde eigenschap heeft.
Dan is `n = 50` en `hat(p) = 0,72` , zodat `sigma = sqrt((0,72*(1-0,72))/(50)) ~~ 0,063` .
Uit de vuistregels van de normale verdeling volgt dat `95` % van de proporties in de steekproevenverdeling tussen `0,72 - 2*0,063~~0,59` en `0,72 + 2*0,063~~0,85` liggen. (In plaats van `2` kun je ook de `z` -waarde `1,96` nemen.)
Dit betekent dat met `95` % betrouwbaarheid bij elke nieuwe steekproef het deel van de populatie met de eigenschap tussen `0,59` en `0,85` ligt. Het `95` %-betrouwbaarheidsinterval van de populatieproportie is dus `[0,59; 0,85]` .
Bereken in de volgende gevallen de steekproefproportie en de bijbehorende standaardafwijking.
Geef vervolgens het
`95`
%-betrouwbaarheidsinterval voor de populatieproportie.
Een steekproef van `200` personen, waarvan `130` personen "ja" antwoorden.
Een populatie van
`11000`
personen, waarvan
`12`
% als steekproef wordt genomen.
`63`
% van de mensen uit de steekproef zegt
"1 of meer kinderen te hebben"
.
Er wordt een onderzoek gedaan naar welk deel van de festivalgangers boven de 40 jaar is. Bij een festival is door middel van een steekproef van `150` bezoekers de leeftijd gevraagd. Van deze groep blijken `50` bezoekers 40 jaar of ouder te zijn. Bereken de standaardafwijking van de steekproevenverdeling. Rond af op vier decimalen. Schat hiermee welk percentage van de festivalgangers boven de 40 jaar is.