Hypothesen en verbanden > Correlatie
1234567Correlatie

Antwoorden van de opgaven

Opgave V1
a

Je leert in dit onderdeel een paar manieren om dit te doen. Bedenk eerst zelf een methode.

b

Bijvoorbeeld om te controleren of scholen hun slagingspercentages niet verhogen door hoge SE-cijfers te geven, dus te gemakkelijke SE-toetsen aan hun leerlingen voor te leggen.

c

Bijvoorbeeld om te controleren of scholen hun slagingspercentages niet verhogen door hoge SE-cijfers te geven, dus te gemakkelijke SE-toetsen aan hun leerlingen voor te leggen.

Opgave 1
a

Op het oog zeker!

b

Waarschijnlijk wel tussen de `0,9` en de `1` .

c

Een stijgende lineaire functie, dus een functie van de vorm `y = ax + b` met `a > 0` .

d

Je deelt door de standaarddeviaties.

Opgave 2
a

Doen.

b

Nee, deze steekproef is veel te klein. Bovendien zou je liever de jongens en de meisjes afzonderlijk bekijken.

c

Doen. Erg normaal verdeeld zijn ze niet, dat komt door de te kleine steekproef.

d

Je kunt dit handmatig doen in Excel door extra tabellen te maken voor `(x_i - bar(x))(y_i - bar(y))` .
Je kunt ook het Practicum eerst even doorwerken.

Opgave 3

Je vindt `r_(gl) ~~ 0,81` .

Opgave 4

Gebruik de grafische rekenmachine of werk met Excel. Je vindt `r_(cs) ~~ 0,89` .

Opgave 5
a

Het gemiddelde is ongeveer `69,5` en de standaarddeviatie is ongeveer `14,92` .

b

Het gemiddelde is ongeveer `71,4` en de standaarddeviatie is ongeveer `13,96` .

c

Omdat je werkt met klassenmiddens als je ze berekent met je grafische rekenmachine en/of omdat je afleest van normaal waarschijnlijkheidpapier.

d

Je gebruikt de klassenmiddens en maakt combinaties zoals `(75,65)` (eerst de Mathgrade en dan de Physicsgrade) en die komt dan `5` keer voor. En zo ga je met de rest door.

e

Ja, dat kan wel. Dan moet je alle `100` mogelijke combinaties (klassenmiddens!) onder elkaar invoeren in bijvoorbeeld Excel.

f

Doen met behulp van Excel.

g

Er is een redelijke correlatie.

Opgave 6

Haakjes uitwerken geeft:

`r_(xy) = (Sigma_(i=1)^(n) (x_i y_i - x_i bar(y) - y_1 bar(x) + bar(x) bar(y)))/(N sigma_X sigma_Y)` .

Daaruit volgt:

`r_(xy) = (Sigma_(i=1)^(n) (x_i y_i))/(N sigma_X sigma_Y) - (Sigma_(i=1)^(n) (x_i bar(y)))/(N sigma_X sigma_Y) - (Sigma_(i=1)^(n) (bar(x) y_i))/(N sigma_X sigma_Y) + (N bar(x) bar(y))/(N sigma_X sigma_Y)` .

en dus:

`r_(xy) = (bar(x * y))/(sigma_X sigma_Y) - (bar(x) * bar(y))/(sigma_X sigma_Y) - (bar(y) * bar(x))/(sigma_X sigma_Y) + (bar(x) * bar(y))/(sigma_X sigma_Y) = (bar(x * y) - bar(x) * bar(y))/(sigma_X sigma_Y)` .

Opgave 7
a

Nee, toch?

b

Een statistisch verband ligt wel voor de hand want beiden zullen toenemen met mooi zomerweer. Maar een causaal verband is er niet, een stijging van de verkoop van zonnebrillen is geen gevolg van een toenemende ijsverkoop (en omgekeerd ook niet).

Opgave 8
a

Gebruik je grafische rekenmachine.

b

`r_(vz) ~~ 0,70` .

c

Ja, hoewel de correlatie niet heel erg sterk is.

Opgave 9
a

Gebruik je grafische rekenmachine.

b

`r_(Lv) ~~ 0,59` , dus een zwakke correlatie.

c

De correlatie wordt duidelijk beter!

d

`r ~~ 0,90` .

e

Dit onderzoekje zou kunnen leiden tot de conclusie dat er een statistisch verband bestaat tussen beide. Dat is echter nogal gewaagd, want er zijn veel te weinig gegevens. Verder is er maar sprake van onderzoek bij één vak.

Opgave 10
a

Gebruik je grafische rekenmachine (of Excel). `c` op de verticale as is logisch, want de veronderstelling is dat `c` afhangt van `a` .

b

`r_(ca) ~~ -0,91` er is dus een sterke correlatie en er bestaat een statistisch verband (zie commentaar bij c).

c

Dit onderzoekje zou kunnen leiden tot de conclusie dat er een statistisch verband bestaat tussen beide. Dat is echter nogal gewaagd, want er zijn veel te weinig gegevens. Verder is er maar sprake van onderzoek bij één vak.

Opgave 11
a

Bij een maatsysteem voor kleding is het van belang te weten of er een verband bestaat tussen bijvoorbeeld iemands lengte en zijn beenmaat, of taillebreedte, e.d. Want bij het maken van kleding wil je bij één maat alle verhoudingen van het kledingstuk juist hebben. Bijvoorbeeld bij voetlengte en voetbreedte gaat het er om dat je bij de juiste schoenmaat (die is gebaseerd op de voetlengte) een correcte schoenbreedte hebt.

b

Je maakt weer een puntenwolk gebaseerd op de (hier gegeven) klassenmiddens, rekening houdend met het aantal keren dat een combinatie voorkomt.

c

Zie het antwoord bij b. Als je één grote tabel hebt met alle ruwe gegevens van elk van de 5001 onderzochte vrouwen, dan kun je met bijvoorbeeld Excel gemakkelijk de correlatiecoéfficiént berekenen.

verder | terug