Conclusies trekken > Samenhang tussen variabelen
123456Samenhang tussen variabelen

Theorie

Wanneer je binnen een dataset zoekt naar een verband tussen twee statistische variabelen, gebruik je een puntenwolk of spreidingsdiagram (Engels: scatter plot).

Afhankelijk van de vorm van een puntenwolk kun je vastellen of er een verband tussen beide variabelen is en zo ja, of dat verband sterk is. Een maat daarvoor is de correlatiecoëfficiënt `r` , een getal met waarden vanaf `text(-)1` tot en met `1` . Hoe dichter `r` bij `1` of `text(-)1` ligt, hoe sterker het verband. In een volgend voorbeeld staan vuistregels om aan te geven of de samenhang zwak, matig of sterk is.

In een spreidingsdiagram kun je met een trendlijn de (lineaire) samenhang weergeven. Hoe je deze trendlijn en de correlatiecoëfficiënt berekent, zie je in het Practicum .

`r_(xy) = text(-)1`
`r_(xy) = 0`
`r_(xy) = 0,6`
`r_(xy) = 1`

Let op! Je stelt alleen vast dat er een statistische samenhang tussen beide variabelen is. Het is de vraag of dat verband ook causaal is. Je kunt dus niets zeggen over oorzaak en gevolg. Er kan best een derde variabele de oorzaak zijn van de samenhang.

verder | terug