Verbanden en verschillen > Correlatie
12345Correlatie

Uitleg

Als er sprake is van lineaire correlatie tussen twee kwantitatieve variabelen, dan is het mogelijk om de formule op te stellen van een speciaal type trendlijn, de "regressielijn" .

De regressielijn is zo opgebouwd dat gemiddeld voor alle punten in de puntenwolk geldt dat de verticale afstand van het punt tot de regressielijn zo klein mogelijk is.

Dit is het geval als voor de richtingscoëfficiënt `a` van de regressielijn voor variabelen `x` en `y` geldt:

`a = r_(xy) * (σ_y)/(σ_x)`

waarin `r_(xy)` de correlatiecoëfficiënt is van `x` en `y` en `σ_x` de standaardafwijking van variabele `x` is en `σ_y` de standaardafwijking van variabele `y` .

De regressielijn loopt altijd door het punt `(bar(x), bar(y))` en daarmee kun je de bijbehorende formule opstellen.

Het is heel verleidelijk om ervan uit te gaan dat `y` ook echt volledig afhankelijk is van `x` en dat er dus sprake is van én volledige correlatie én van causaliteit. Dit is echter meestal niet het geval!

De formule van een regressielijn wordt opgesteld om een schatting te maken. Bijvoorbeeld: welk gewicht zal naar schatting horen bij een lengte van `2,00` m? De regressielijn van deze twee variabelen geeft op die vraag een betrouwbaar antwoord.

In het Practicum kun je zien hoe je de formule van een regressielijn opstelt met behulp van de grafische rekenmachine en Excel.

Opgave 3

In de Uitleg zie je de puntenwolk bij het werkblad LengteGewicht22h4.xls. Ook de regressielijn (of trendlijn) is getekend. Voer nu de gegevens van deze `22`  leerlingen in je grafische rekenmachine in.

a

Bereken de gemiddelde lengte `bar(x)` en de bijbehorende standaardafwijking `σ_x` en bereken ook het gemiddelde gewicht `bar(y)` en de bijbehorende standaardafwijking `σ_y` .

Ga uit van een lineaire correlatie tussen `x` en `y` . En gebruik de correlatiecoëfficiënt die je eerder hebt berekend of gebruik `r^2` in de figuur.

b

Stel met behulp van de gegevens bij a een formule op voor de lineaire regressielijn die je in de figuur ziet.

Je kunt ook je grafische rekenmachine zelf de correlatiecoëfficiënt en de formule van de regressielijn laten opstellen. Ga in het Practicum na hoe dat gaat.

c

Maak met je grafische rekenmachine de puntenwolk die je in de figuur in de uitleg ziet en laat de formule voor de trendlijn bepalen.

d

Voorspel met behulp van de bij c gevonden regressielijn het gewicht van een scholier die `2,00` m lang is.
Waarom zal deze voorspelling niet erg betrouwbaar zijn ondanks de hoge correlatie?

verder | terug