Verbanden en verschillen > Correlatie
12345Correlatie

Uitleg

Tot nu toe heb je meestal één kenmerk van een populatie afzonderlijk statistisch onderzocht. Maar met behulp van statistiek kun je ook betrouwbare uitspraken doen over een mogelijk statistisch verband tussen twee verschillende kenmerken.

Dit diagram, een puntenwolk of spreidingsdiagram, is de uitkomst van een dergelijk onderzoekje: in dit geval een onderzoek naar het mogelijke verband tussen gewicht en lengte van `22` leerlingen in 4Havo. Zie het werkblad LengteGewicht22h4.xls.

De puntenwolk lijkt een richting te hebben: hij loopt grofweg van linksonder naar rechtsboven. Er lijkt dus een vorm van samenhang, van "correlatie" , te zijn tussen deze twee variabelen: grofweg geldt dat naarmate de lengte groter wordt, het gewicht ook groter wordt. Dit lijkt op een lineair verband.

Statistische samenhang betekent niet dat er ook een causaal verband bestaat. Met andere woorden dat een grotere lengte ook een groter gewicht veroorzaakt. Dit is een heel andere vraag en om daar een uitspraak over te doen moet je meer onderzoek doen.

De mate waarin een lineair verband tussen twee variabelen bestaat, wordt aangeduid met de correlatiecoëfficiënt  `r` .

Als `r` een negatieve waarde heeft, is er sprake van negatieve correlatie en als `r` een positieve waarde heeft, is er sprake van positieve correlatie. Hoe dichter `r` bij `1` of `text(-)1` ligt, hoe sterker de correlatie tussen de twee variabelen is. Er kan ook sprake zijn van niet-lineaire vormen van samenhang, maar in dat geval heeft de correlatiecoëfficiënt geen zinvolle betekenis.

Je kunt de correlatiecoëfficiënt zowel met de grafische rekenmachine als in Excel berekenen. Ook zijn er vuistregels voor de mate van correlatie. Bekijk het Practicum .

Opgave 1

Bekijk de puntenwolk in de Uitleg 1.

a

Leg uit hoe je aan de puntenwolk kunt zien dat `r` ongelijk aan `0` is.

b

Leg uit waaraan je kunt zien dat `r` positief zal zijn.

c

Open het bestand LengteGewicht22h4.xls en bepaal de waarde van `r^2` die je ook in de figuur ziet. Doe dit met behulp van Excel, zie het Practicum .

d

Bereken de waarde van `r` en trek een conclusie op basis van de vuistregels.

Opgave 2

Er is altijd wel iemand nieuwsgierig naar de meest bijzondere weetjes. Zo zou je je kunnen afvragen: is er een verband tussen het soort "smiley" dat mensen gebruiken in hun communicatie op sociale media en het weertype op het moment van communicatie?
Als je hier gegevens over zou verzamelen, is dit een voorbeeld van de gegevenstabel.

a

Is een puntenwolk een bruikbare presentatiewijze voor deze gegevens?

Beargumenteer je antwoord, bijvoorbeeld met behulp van voorbeeldschetsjes van puntenwolken.

b

Zou er een verband mogelijk kunnen zijn tussen deze twee variabelen?

Zo ja, wat zou dan ongeveer de waarde zijn van `r` ?

c

Zou hier ook van causaliteit sprake kunnen zijn? Zo ja: welke variabele is dan de veroorzaker van de waarde van de andere variabele?

verder | terug