Hypothesen en verbanden > Correlatie
1234567Correlatie

Theorie

In een spreidingsdiagram van twee statistische variabelen `x` en `y` zet je alle combinaties `(x,y)` als een puntenwolk in een assenstelsel. Of er een sterk lineair statistisch verband bestaat tussen de variabelen wordt bepaald door de correlatiecoëfficiënt `r_(xy)` . Er geldt: `r_(xy) = (Sigma_(i=1)^N (x_i - bar(x))(y_i - bar(y)))/(N * sigma_x * sigma_y)` .

`r_(xy) = text(-)1`
`r_(xy) = 0`
`r_(xy) = 0,6`
`r_(xy) = 1`
  • Als `r_(xy) = 1` dan is er een perfecte positieve correlatie tussen `x` en `y` . De punten van de puntenwolk liggen dan precies op een stijgende lijn.

  • Als `r_(xy) = 0` dan is er geen enkele correlatie tussen `x` en `y` .

  • Als `r_(xy) = text(-)1` dan is er een perfecte negatieve correlatie tussen `x` en `y` . De punten van de puntenwolk liggen dan precies op een dalende lijn.

De correlatie tussen `x` en `y` wordt beter naarmate `r_(xy)` dichter bij `1` of `text(-)1` ligt.

Een verband waarbij de toename (of afname) van de éne variabele een gevolg is van een toename (of afname) van de andere heet een causaal verband: er is dan sprake van oorzaak en gevolg. Een statistisch verband tussen twee variabelen hoeft niet causaal te zijn. Andere variabelen kunnen de oorzaak zijn dat er bij twee variabelen een statistisch verband optreedt. Het is zeker niet zo, dat een grotere lengte veroorzaakt dat je daardoor automatisch ook een groter gewicht hebt.

verder | terug