Verbanden en verschillen > Correlatie
12345Correlatie

Theorie

Met behulp van statistiek kunnen uitspraken worden gedaan over verbanden tussen twee verschillende variabelen. Als de twee variabelen kwantitatief zijn, kan hun mogelijke verband in beeld worden gebracht met een puntenwolk.

De correlatiecoëfficiënt `r` geeft de mate van correlatie, dat wil zeggen van samenhang, tussen de twee variabelen. Deze waarde is een getal tussen `text(-)1` en  `1` .

`r ~~ text(-)1`
goede correlatie
`r ~~ 0`
geen correlatie
`r ~~ 0,6`
matige correlatie
`r ~~ 1`
goede correlatie

De correlatie tussen twee variabelen wordt beter naarmate `r` dichter bij `1` of `text(-)1` ligt. Als `r` gelijk is aan `0` dan is er geen correlatie tussen de variabelen. In het Practicum zie je enkele vuistregels voor de mate van correlatie tussen twee kwantitatieve variabelen. Je vindt ze ook in dit Formuleoverzicht.

Als de correlatie redelijk is, kunnen met behulp van de regressielijn betrouwbare schattingen worden gemaakt. De richtingscoëfficiënt `a` van de regressielijn voor variabelen `x` en `y` bereken je met de formule:

`a = r_(xy) * (σ_y)/(σ_x)`

waarin `r_(xy)` de correlatiecoëfficiënt is van `x` en `y` en `σ_x` de standaardafwijking van variabele `x` is en `σ_y` de standaardafwijking van variabele `y` .

De volledige formule vind je uit het gegeven dat de regressielijn door `(bar(x), bar(y))` gaat.

Zowel de correlatiecoëfficiënt als de formule voor de regressielijn bereken je in de praktijk met de grafische rekenmachine of met Excel. Bekijk het Practicum .

Het kan ook zo zijn dat de waarden van de ene variabele veroorzaakt worden (geheel of gedeeltelijk) door die van een andere variabele. Er is dan sprake van een causaal verband. Als er statistische samenhang is tussen twee variabelen betekent dat niet dat er ook een causaal verband bestaat. De correlatiecoëfficiënt en de regressielijn zeggen helemaal niets over een mogelijk causaal verband tussen twee variabelen.

verder | terug