Steekproef en Populatie > Populatieproporties schatten
12345Populatieproporties schatten

Antwoorden van de opgaven

Opgave V1
a

Dat zou wel heel toevallig zijn. Een andere steekproef heeft vast een ander percentage.

b

Er zal een soort interval omheen moeten, zoiets als `5,1` % plus of min een bepaald getal. Hoe je dit bepaalt is onderwerp van dit onderdeel.

Opgave 1
a

`hat(p) = 130/200 = 0,65`

`sigma = sqrt((0,65*(1-0,65))/200) ~~ 0,034`

`95` %-betrouwbaarheidsinterval is `[0,65 - 1,96*0,034; 0,65 + 1,96*0,034] ~~ [0,58; 0,70]` .

b

`hat(p) = 0,63`

`n = 0,12*11000 = 1320`

`sigma = sqrt((0,63*(1-0,63))/1320) ~~ 0,013`

`95` %-betrouwbaarheidsinterval is `[0,63 - 1,96*0,013; 0,63 + 1,96*0,013] ~~ [0,60; 0,66]` .

Opgave 2

`hat(p) = 50/150 = 1/3` en `n = 150` .

`sigma = sqrt((1/3*(1-1/3))/150) ~~ 0,0385`

Het `95` %-betrouwbaarheidsinterval is `[0,3333 - 1,96*0,0385; 0,3333 + 1,96*0,0385] ~~ [0,26; 0,37]` .
Dus in een nieuwe steekproef van `50` bezoekers is tussen `26` % en de `37` % boven de 40 met een betrouwbaarheid van `95` %.

Opgave 3
a

Een linkszijdige toets.

b

Nee, want `0,354 gt 0,1` .

c

`X` is het aantal leerlingen dat vanuit het havo is doorgestroomd.

`text(P)(X = 0) = 0,928^30 = 0,1062...`

`text(P)(X = 1) = 30*0,928^29*0,072 = 0,2473...`

`text(P)(X le 1) = 0,1062... + 0,2473... ~~ 0,354`

Of gebruik de binomiale verdeling op je GR.

Opgave 4

`text(H)_0` : `p = 0,072`

`text(H)_1` : `p lt 0,072`

De proportie havogediplomeerden is nu `1/35` .

Neem `X` voor het aantal havogediplomeerden.

`text(P)(X le 2) = text(P)(X = 0) + text(P)(X = 1) + text(P)(X = 2)`

`text(P)(X = 0) = 0,928^70 = 0,0053...`

`text(P)(X = 1) = 70*0,928^69*0,072 = 0,0295...`

`text(P)(X = 2) = ((70),(2))*0,928^68*0,072^2 = 0,0777...`

Dus: `text(P)(X le 2) ~~ 0,1122` .

Deze kans is groter dan `10` %. Dus ook op basis van deze gegevens is er geen reden om op basis van een steekproefproportie van `1/35` de nulhypothese te verwerpen.

Opgave 5
a

`hat(p) = 0,14` en `n = 50` .

b

linkergrens: `0,14 - 2 * sqrt((0,14*(1 - 0,14)) / 50) ~~ 0,042` .

rechtergrens: `0,14 + 2 * sqrt((0,14*(1 - 0,14)) / 50) ~~ 0,238` .

Het `95` %-betrouwbaarheidsinterval is `[0,042 ; 0,238]` , dus tussen `4,2` % en `23,8` %.

c

Ja, dat is mogelijk want er blijft een kans van `5` % dat ook bij een volgende steekproef de populatieproportie NIET in het `95` %-betrouwbaarheidsinterval ligt. En de werkelijke proportie van de totale populatie kun je alleen weten als je ook echt alle gamefiguren hebt gecontroleerd.

Opgave 6
a

`hat(p) = 41/50 = 0,82`

b

`sigma = sqrt((0,82*(1-0,82))/50) ~~ 0,0543`

c

linkergrens: `0,82 - 1,64 * sqrt((0,82*(1 - 0,82)) / 50) ~~ 0,731` .

rechtergrens: `0,82 + 1,64 * sqrt((0,82*(1 - 0,82)) / 50) ~~ 0,909 ` .

95%-betrouwbaarheidsinterval: `[0,73 ; 0,91]` .

d

Met  `90` % betrouwbaarheid ligt in een steekproef van `50` het percentage van dit type laptop dat `8` uur kan werken op de accu tussen `73` % en `91` %.

Opgave 7
a

`R` is een discrete toevalsvariabele. Als je de complementregel toepast, krijg je dat `text(P)(R ge 2) = 1-text(P)(R le 1)` .

b

`text(P)(R ge 2) = 1 - text(P)(R le 1) = 1 - text(P)(R = 0 text( of ) R = 1)`

`text(P)(R = 0) = (1 - 0,04)^10 ~~ 0,6648`

`text(P)(R = 1) = 10 * 0,04 * (1 - 0,04)^9 ~~ 0,2770`

`text(P)(R ge 2) = 1 - (0,6648 + 0,2770) ~~ 0,0582`

Of gebruik `text(P)(R ge 2) = 1 - text(P)(R le 1 | p = 0,04 text( en ) n = 10) ~~ 0,0582` met behulp van de binomiale kansverdeling.

Opgave 8

De kans op minimaal `2` rotte peren is groter dan het significantieniveau.

Check of dat ook zou gelden voor de kans op minimaal `3` rotte peren:

`text(P)(R ge 3) = text(P)(R ge 2) - text(P)(X = 2) = 0,0582 - text(P)(X = 2)`

`text(P)(X = 2) = ((10), (2)) * 0,04^2 * (1 - 0,04)^8 ~~ 0,0519` dus `text(P)(R ge 3) ~~ 0,0582 - 0,0519 = 0,0063` ofwel `0,6%` .

Deze kans is kleiner dan het significantieniveau. Hieruit kun je concluderen dat het kritieke gebied bestaat uit `3` t/m `10` rotte peren.

Opgave 9
a

`hat(p) = 833/1500 ~~ 0,555`

b

`sigma = sqrt((0,555 *(1-0,555))/1500) ~~ 0,0128`

c

`[0,555 - 1,96*0,0128; 0,555 + 1,96*0,0128] ~~ [0,53; 0,58]` , dus tussen `53` % en `58` %.

Opgave 10

`text(H)_0` : `p = 0,005`

`text(H)_1` : `p gt 0,005 `

Toevalsvariabele `K` is het kapotte lampen in de steekproef van `100` lampen.

Te berekenen: `text(P)(K ge 2)` als iedere lamp een kans van `0,05` heeft om kapot te zijn.

`text(P)(K ge 2) = 1 – text(P)(K le 1)`

`text(P)(K = 0) = 0,995^100 = 0,6057...`

`text(P)(K = 1) = 100*0,995^99*0,005 = 0,3044...`

`text(P)(K ge 2) = 1 - 0,6057... - 0,3044... ~~ 0,0898`

Deze kans is groter dan het significantieniveau van `5` %. De bewering van de fabrikant hoeft niet verworpen te worden.

Opgave 11
a

Linkergrens: `55 - 2*100*sqrt((0,55*(1-0,55))/1988) ~~ 52,8` %.

Rechtergrens: `55 + 2*100*sqrt((0,55*(1-0,55))/1988) ~~ 57,2` %.

Het 95%-betrouwbaarheidsinterval is `[52,8; 57,2]` .

b

`hat(p) = 0,61` en `sigma = sqrt((0,61*(1-0,61))/1988) ≈ 0,0109` .

Linkergrens: `61 - 2*100*sqrt((0,61*(1-0,61))/1988) ~~ 58,8` %.

Rechtergrens: `61 + 1,96*100*sqrt((0,61*(1-0,61))/1988) ~~ 63,2` %.

Het betrouwbaarheidsinterval is `[58,8; 63,2]` .

c

Met (minimaal) `95` % betrouwbaarheid is het aantal voorstanders gestegen (in een nieuwe steekproef van `1988` Belgen). Het interval bij b ligt geheel voorbij dat bij a.

Opgave 12
a

Dit is een rechtszijdige hypothesetoets met:

`text(H)_0` : `p = 0,08`

`text(H)_1` : `p gt 0,08 `

b

Toevalsvariabele `Z` is het aantal keer dat Bart 6 ogen gooit.

Te berekenen: `text(P)(Z ge 4)` als de kans op 6 ogen gooien `0,08` is.

`text(P)(K ge 4) = 1 – text(P)(K le 3)`

`text(P)(Z = 0) = 0,92^30 = 0,0819...`

`text(P)(Z = 1) = 30*0,92^29*0,08 = 0,2138...`

`text(P)(Z = 2) = ((30),(2))*0,92^28*0,08^2 = 0,2696...`

`text(P)(Z = 3) = ((30),(3))*0,92^27*0,08^3 = 0,2188...`

`text(P)(Z ge 4) = 1 - 0,0819... - 0,2138... - 0,2696... - 0,2188... ~~ 0,2158`

Deze kans is groter dan het significantieniveau van `10` %. De bewering van Minke hoeft niet verworpen te worden.

Opgave 13

Eerste peiling: `hat p = 30/150 = 0,20` en `sigma = sqrt((0,20*(1-0,20))/2000) ≈ 0,0089` .

De breedte van het betrouwbaarheidsinterval is `2*1,65*sigma ~~ 2,9` %.
`2,9` % van `150` zetels is `4,4` zetels.
Het aantal zetels kan dus `2,2` naar boven en naar beneden afwijken.
Ook bij de tweede peiling is dit zo.

Er is dus geen reden tot blijdschap, want het kan zelfs zo zijn dat het zetelaantal is gedaald. De `31` zetels kunnen net zo goed `29` zetels zijn.

Opgave 14
a

De breedte van het `95` %-betrouwbaarheidsinterval is `0,06` . DIt is (ongeveer) gelijk aan `4*sigma` . Hieruit volgt dat `sigma = (0,06)/4 = 0,015` .

b

`sigma = sqrt(hat(p)*( 1- hat(p)))/n` geeft `0,015 = sqrt((0,08*(1-0,08))/n)` .

Hieruit volgt `0,015^2 = (0,0736)/n` zodat `n ~~ 237` .

Opgave 15Lampen
Lampen
a

`34,5` is de kleinste waarde die afgerond `35` is.

b

`text(H)_0` : `p = 0,05`

`text(H)_1` : `p gt 0,05 `

Je mag de kans op `35` of meer kapotte lampen normaal benaderen.

`text(P)(X gt 34,5| mu = 25 text( en ) sigma = sqrt(23,75)) ~~ 0,0256`

Deze kans is kleiner dan `5` %, dus `text(H)_0` wordt verworpen.

De bewering van de fabrikant is niet juist.

Opgave 16Ja of nee?
Ja of nee?
a

Kleinste steekproefuitslag: `467` en grootste steekproefuitslag: `585` .

Gemiddelde steekproefuitslag: `(467 + 585) / 2 = 526` .

Gemiddelde steekproefproportie: `526 / 2000 = 0,263` .

Standaardafwijking: volgens de vuistregels is de afstand tussen de maximale waarde en de minimale waarde grofweg `6` keer de standaardafwijking: `(585 – 467) / 6 ~~ 19,7` .

De standaardafwijking is `(19,7)/2000 ~~ 0,01` .

b

linkergrens: `0,263 – 2 * 0,01 = 0,243`

rechtergrens: `0,263 + 2 * 0,01 = 0,283`

c

`95` % van de `400` steekproeven hebben een steekproefproportie die een waarde heeft tussen de `0,243` en de `0,283` .

Omdat de steekproeven een grote omvang hebben, zal de echte populatieproportie `p` een waarde hebben die heel dicht bij de gemiddelde proportie van deze steekproevenverdeling ligt; de kans dat `p` kleiner is dan `0,243` of groter is dan `0,283` is erg klein.

d

`hat(p) = 512/2000 = 0,256`

linkergrens: `0,256 - sqrt((0,256 * (1 - 0,256))/2000) ~~ 0,246`

rechtergrens: `0,256 + sqrt((0,256 * (1 - 0,256))/2000) ~~ 0,266`

`95` %-betrouwbaarheidsinterval: `[0,246 ; 0,266]`

Met een kans van `95` % ligt bij een nieuwe steekproef van `2000` het gemiddelde in het interval  `[0,246 ; 0,266]` en dat komt overeen met de gevonden gemiddelde proportie uit de steekproevenverdeling: die duidt op een gemiddelde dat rondom de `0,263` ligt en `0,263` ligt inderdaad in het `95` %-betrouwbaarheidsinterval van de laatst getrokken steekproef.

Opgave 17
a

In `95` % van dergelijke steekproeven zal tussen `33,7` % en `40,3` % van het stadspanel de lokale omroep niet kennen.

b

In `95` % van dergelijke steekproeven zal tussen `59,7` % en `66,3` % van het stadspanel de lokale omroep wel kennen.

c

Je weet niet of het onderzoek aselect en representatief is. En inwoners kunnen bijvoorbeeld lokale en regionale omroepen door elkaar halen.

Opgave 18

`n ~~ 2473` personen.

verder | terug