Verbanden en verschillen > Correlatie
12345Correlatie

Theorie

Met behulp van statistiek kunnen uitspraken worden gedaan over verbanden tussen twee verschillende variabelen. Als de twee variabelen kwantitatief zijn, kan hun mogelijke verband in beeld worden gebracht met een puntenwolk.

De correlatiecoëfficiënt r geeft de mate van correlatie, dat wil zeggen van samenhang, tussen de twee variabelen. Deze waarde is een getal tussen -1 en  1 .

r-1
goede correlatie
r0
geen correlatie
r0,6
matige correlatie
r1
goede correlatie

De correlatie tussen twee variabelen wordt beter naarmate r dichter bij 1 of -1 ligt. Als r gelijk is aan 0 dan is er geen correlatie tussen de variabelen. In het Practicum zie je enkele vuistregels voor de mate van correlatie tussen twee kwantitatieve variabelen. Je vindt ze ook in dit Formuleoverzicht.

Als de correlatie redelijk is, kunnen met behulp van de regressielijn betrouwbare schattingen worden gemaakt. De richtingscoëfficiënt a van de regressielijn voor variabelen x en y bereken je met de formule:

a=rxyσyσx

waarin rxy de correlatiecoëfficiënt is van x en y en σx de standaardafwijking van variabele x is en σy de standaardafwijking van variabele y .

De volledige formule vind je uit het gegeven dat de regressielijn door (x¯,y¯) gaat.

Zowel de correlatiecoëfficiënt als de formule voor de regressielijn bereken je in de praktijk met de grafische rekenmachine of met Excel. Bekijk het Practicum.

Het kan ook zo zijn dat de waarden van de ene variabele veroorzaakt worden (geheel of gedeeltelijk) door die van een andere variabele. Er is dan sprake van een causaal verband. Als er statistische samenhang is tussen twee variabelen betekent dat niet dat er ook een causaal verband bestaat. De correlatiecoëfficiënt en de regressielijn zeggen helemaal niets over een mogelijk causaal verband tussen twee variabelen.

Voorbeeld 1| Uitleg 2