Statistisch onderzoek > Populatieproportie schatten
12345Populatieproportie schatten

Uitleg

Stel dat men wil onderzoeken hoeveel procent van de populatie jongeren vanaf 12 t/m 16 jaar lid is van een sportvereniging (geen fitnessclub). Dit heet de populatieproportie.

Het is ondoenlijk om de hele populatie te bevragen. Dus wordt er een (aselecte, representatieve) steekproef getrokken van `n=500` jongeren van 12 t/m 16. Er blijken `360` jongeren in de steekproef "ja" te antwoorden op de vraag of ze lid zijn van een sportvereniging.
De steekproefproportie is `p = 360/500 = 0,72` ofwel `72` %,

Maar wat zegt dit over de populatieproportie?

Bij Verkennen V1 heb je kunnen zien dat het trekken van veel even grote steekproeven uit een populatie een verzameling steekproefproporties `p` oplevert die normaal is verdeeld met een gemiddelde in de buurt van de populatieproportie. In de bijbehorende standaardafwijking gebruik je `p` in plaats van de onbekende populatieproportie:

`sigma = sqrt((p * (1-p))/n)`

Volgens de vuistregels van een normale verdeling ligt in `95` % van de steekproeven `p` minder dan `2sigma` van de populatieproportie af. Nu is die populatieproportie nog onbekend, je hebt alleen `p` .

En als `p` minder dan `2sigma` van de populatieproportie af ligt, ligt de populatieproportie ook minder dan `2sigma` van `p` af. Dat gaat goed in `95` % van de gevallen.

In de beschreven situatie is `sigma = sqrt((0,72*(1-0,72))/500)~~0,020` .
Dus de populatieproportie ligt dan (met een betrouwbaarheid van `95` %) minder dan `2 sigma = 2*0,020 = 0,04` van `p=0,72` af, dus tussen `0,72 - 0,04 = 0,68` en `0,72 + 0,04 = 0,76` .
Of in procenten tussen `68` % en `76` %.
Dit heet het `95` % betrouwbaarheidsinterval voor de populatieproportie.

Opgave 1

Bekijk Uitleg . Ga uit van het beschreven onderzoek onder jongeren vanaf 12 t/m 16 jaar.

a

Reken zelf `p` en de standaardafwijking `sigma` van de steekproevenverdeling na.

b

Gebruik in het Practicum de simulatie van VUstat. Stel een populatieproportie van `72` % in en simuleer eerst één steekproef met `n=500` en vervolgens een grote steekproevenverdeling. Ga na, dat het gemiddelde van de steekproevenverdeling ongeveer op `72` % uitkomt en dat de standaardafwijking van de steekproevenverdeling voldoet aan de formule in de uitleg.

c

Natuurlijk weet je in de praktijk niet hoe groot de populatieproportie is, dus kun je zo'n simulatie dan niet gebruiken.
Maar ga na dat je door nieuwe simulaties te doen met populatieproportie `72` % en `n=500` je wel steeds op ongeveer dezelfde gemiddelde steekproevenproportie en standaardafwijking uitkomt.

Opgave 2

Er wordt een onderzoek gedaan naar welk deel van festivalgangers ouder dan 40 jaar is. Bij een festival is door middel van een steekproef aan `150` bezoekers de leeftijd gevraagd. Van deze groep blijken `50` bezoekers 40 jaar of ouder te zijn. Bereken in vier decimalen nauwkeurig de bijbehorende steekproefproportie en de standaardafwijking van de steekproevenverdeling. Geef ook het `95` % betrouwbaarheidsinterval voor de populatieproportie.

Opgave 3

Er wordt in Uitleg geredeneerd met een betrouwbaarheid van `95` %.

a

Tussen welke grenzen ligt in `68` % van de steekproeven het "Ja" -deel van de populatie?

b

Tussen welke grenzen ligt in bijna `100` % van de steekproeven het "Ja" -deel van de populatie?

Opgave 4

Om te bepalen hoeveel procent van de Nederlanders linkshandig is wordt een aselecte steekproef van `1500` Nederlanders getrokken. Daarvan waren er `136` linkshandig.

a

Bereken het deel van de steekproef dat linkshandig is.

b

Bereken de standaardafwijking van steekproevenverdeling in de steekproef. Rond je antwoord af op vier decimalen.

c

Tussen welke waarden ligt met `95` % betrouwbaarheid het deel van de populatie dat linkshandig is? Geef je antwoord in procenten in één decimaal nauwkeurig.

verder | terug