Met behulp van statistiek kunnen uitspraken worden gedaan over verbanden tussen twee verschillende variabelen. Als de twee variabelen kwantitatief zijn, kan hun mogelijke verband in beeld worden gebracht met een puntenwolk.
De correlatiecoëfficiënt geeft de mate van correlatie, dat wil zeggen van samenhang, tussen de twee variabelen. Deze waarde is een getal tussen en .
goede correlatie |
geen correlatie |
matige correlatie |
goede correlatie |
De correlatie tussen twee variabelen wordt beter naarmate dichter bij of ligt. Als gelijk is aan dan is er geen correlatie tussen de variabelen. In het Practicum zie je enkele vuistregels voor de mate van correlatie tussen twee kwantitatieve variabelen. Je vindt ze ook in dit Formuleoverzicht.
Als de correlatie redelijk is, kunnen met behulp van de regressielijn betrouwbare schattingen worden gemaakt. De richtingscoëfficiënt van de regressielijn voor variabelen en bereken je met de formule:
waarin de correlatiecoëfficiënt is van en en de standaardafwijking van variabele is en de standaardafwijking van variabele .
De volledige formule vind je uit het gegeven dat de regressielijn door gaat.
Zowel de correlatiecoëfficiënt als de formule voor de regressielijn bereken je in de praktijk met de grafische rekenmachine of met Excel. Bekijk het Practicum.
Het kan ook zo zijn dat de waarden van de ene variabele veroorzaakt worden (geheel of gedeeltelijk) door die van een andere variabele. Er is dan sprake van een causaal verband. Als er statistische samenhang is tussen twee variabelen betekent dat niet dat er ook een causaal verband bestaat. De correlatiecoëfficiënt en de regressielijn zeggen helemaal niets over een mogelijk causaal verband tussen twee variabelen.