Bij statistisch onderzoek worden uitspraken gedaan over de populatie.
Er wordt vaak gebruik gemaakt van vragen met maar `2` mogelijke antwoorden. Het deel van de steekproef dat dan het ene antwoord geeft heet de steekproefproportie, `p` . Andere steekproeven van grootte `n` zullen vaak andere waarden van `p` geven. Maar deze steekproefproporties zijn altijd normaal verdeeld. Deze normale verdeling heet steekproevenverdeling met standaardafwijking `sigma` .
Er moet een conclusie worden getrokken over het deel van de populatie dat dit antwoord zou geven, de populatieproportie. De standaardafwijking van de steekproevenverdeling is:
`sigma = sqrt((p*(1-p))/n)`
Voor de populatieproportie geldt dan:
In
`68`
% van de steekproeven ligt de populatieproportie tussen
`p-sigma`
en
`p+sigma`
.
Dit heet het
`68`
%-betrouwbaarheidsinterval van
`p`
en de
`68`
% heet de betrouwbaarheid.
In
`95`
% van de steekproeven ligt de populatieproportie tussen
`p-2*sigma`
en
`p+2*sigma`
.
Dit heet het
`95`
%-betrouwbaarheidsinterval van
`p`
.
In bijna `100` % van de steekproeven ligt de populatieproportie tussen `p-3*sigma` en `p+3*sigma` .
De formule voor `sigma` en de vuistregel voor een betrouwbaarheid van `95` % vind je op deze formulekaart. In dit geval is `2*sigma` de foutmarge.