Hypothesen en verbanden > Correlatie
1234567Correlatie

Antwoorden van de opgaven

Opgave V1
a

Het geslacht, de lengte in cm en het gewicht in kg.

b

Bijvoorbeeld recht tegen de muur staan, geen schoenen aan, hoofd recht vooruit, plankje op hoofd loodrecht op de muur, etc.

c

Je lijkt te kunnen zeggen dat een langer iemand ook zwaarder is. Dat is vooral een statistisch verband, een groter gewicht wordt beslist niet alleen veroorzaakt door een grotere lengte, de leefstijl speelt daar ook een grote rol bij.

Opgave 1
a

Op het oog zeker!

b

Waarschijnlijk wel tussen de `0,9` en de `1` .

c

Een stijgende lineaire functie, dus een functie van de vorm `y = ax + b` met `a > 0` .

d

Je deelt door de standaarddeviaties.

Opgave 2
a

Doen.

b

Nee, deze steekproef is veel te klein. Bovendien zou je liever de jongens en de meisjes afzonderlijk bekijken.

c

Doen. Erg normaal verdeeld zijn ze niet, dat komt door de te kleine steekproef.

d

Je kunt dit handmatig doen in Excel door extra tabellen te maken voor `(x_i - bar(x))(y_i - bar(y))` .
Je kunt ook het Practicum eerst even doorwerken.

Opgave 3

Je vindt `r_(gl) ~~ 0,81` .

Opgave 4

Gebruik de grafische rekenmachine of werk met Excel. Je vindt `r_(cs) ~~ 0,89` .

Opgave 5
a

Gebruik je grafische rekenmachine, voer de gegevens in een tabel in.

b

`r_(vz) ~~ 0,70` .

c

Ja, hoewel de correlatie niet heel erg sterk is.

Opgave 6

Haakjes uitwerken geeft:

`r_(xy) = (Sigma_(i=1)^(n) (x_i y_i - x_i bar(y) - y_1 bar(x) + bar(x) bar(y)))/(N sigma_X sigma_Y)` .

Daaruit volgt:

`r_(xy) = (Sigma_(i=1)^(n) (x_i y_i))/(N sigma_X sigma_Y) - (Sigma_(i=1)^(n) (x_i bar(y)))/(N sigma_X sigma_Y) - (Sigma_(i=1)^(n) (bar(x) y_i))/(N sigma_X sigma_Y) + (N bar(x) bar(y))/(N sigma_X sigma_Y)` .

en dus:

`r_(xy) = (bar(x * y))/(sigma_X sigma_Y) - (bar(x) * bar(y))/(sigma_X sigma_Y) - (bar(y) * bar(x))/(sigma_X sigma_Y) + (bar(x) * bar(y))/(sigma_X sigma_Y) = (bar(x * y) - bar(x) * bar(y))/(sigma_X sigma_Y)` .

Opgave 7
a

Nee, toch?

b

Een statistisch verband ligt wel voor de hand want beiden zullen toenemen met mooi zomerweer. Maar een causaal verband is er niet, een stijging van de verkoop van zonnebrillen is geen gevolg van een toenemende ijsverkoop (en omgekeerd ook niet).

Opgave 8
a

Gebruik je GR of Excel. `c` op de verticale as is logisch, want de veronderstelling is dat `c` afhangt van `a` .

b

`r_(ca)~~text(-)0,91` , er is dus een sterke correlatie en er bestaat een statistisch verband (zie commentaar bij c).

c

Dit onderzoekje zou kunnen leiden tot de conclusie dat er een statistisch verband bestaat tussen beide, dat de cijfers dus afhankelijk zijn van de klassengrootte. Dat is echter nogal gewaagd, want er zijn veel te weinig gegevens. Verder is er maar sprake van onderzoek bij één vak.

Opgave 9
a

Bij een maatsysteem voor kleding is het van belang te weten of er een verband bestaat tussen bijvoorbeeld iemands lengte en zijn beenmaat, of taillebreedte, e.d. Want bij het maken van kleding wil je bij één maat alle verhoudingen van het kledingstuk juist hebben. Bijvoorbeeld bij voetlengte en voetbreedte gaat het er om dat je bij de juiste schoenmaat (die is gebaseerd op de voetlengte) een correcte schoenbreedte hebt.

b

Je maakt weer een puntenwolk gebaseerd op de (hier gegeven) klassenmiddens, rekening houdend met het aantal keren dat een combinatie voorkomt.

c

Zie het antwoord bij b.
Als je één grote tabel hebt met alle ruwe gegevens van elk van de 5001 onderzochte vrouwen, dan kun je met bijvoorbeeld Excel gemakkelijk de correlatiecoëfficiënt berekenen.

Opgave 10Huwelijken
Huwelijken
a

Aan de vorm van puntenwolk is te zien dat de rechter wolk een grotere samenhang vertoont dan de linker wolk. In huwelijken is het waarschijnlijker dat beide partners ongeveer dezelfde leeftijd hebben dan dezelfde lengte. De linker puntenwolk zal dus betrekking hebben op de lengte.

b

Teken een lijn door de punten `(20, 20)` en `(60, 60)` . Er liggen meer punten onder de lijn dan erboven. De conclusie: het komt vaker voor dat de man ouder is dan de vrouw.

c

Bij een gegeven lengte van de man is de spreiding van de lengte van de vrouw groter dan de spreiding van de leeftijd van de vrouw bij een gegeven leeftijd van de man. Bij de puntenwolk met de leeftijden zal de schatting dus het meest betrouwbaar zijn.

d

Vuistregel: `95` % van de waarden tussen gemiddelde `± 2` maal standaardafwijking. Voor de mannen is dat tussen `159,2` (cm) en `186,8` (cm).

e

Vuistregel: `95` % van de waarden tussen gemiddelde `± 2` maal standaardafwijking. Voor de vrouwen liggen de lengtes tussen `147,6` (cm) en `172,4` (cm).

f

Er zijn echtparen waarvan de lengte van beide partners buiten de rechthoek valt.
Die punten worden dubbel meegeteld, zowel bij de ene `5` % als bij de andere `5` %.
Het aantal punten buiten de getekende rechthoek zal kleiner zijn dan `10` %.

(bron: voorbeeldopgave Statistiek – syllabus havo A)

Opgave 11Vliegsnelheid en lichaamslengte
Vliegsnelheid en lichaamslengte
a

Gebruik je grafische rekenmachine.

b

`r_(Lv) ~~ 0,59` , dus een zwakke correlatie.

c

De correlatie wordt duidelijk beter!

d

`r ~~ 0,90` .

e

Herleid `log(v) = a * log(L) + b` naar `v = 10^b * L^a` .

Opgave 12
a

Uit het bijbehorende spreidingsdiagram blijkt al een sterke mate van samenhang en dat wordt bevestigd door de correlatiecoëfficiënt: `r ~~ text(-)0,93` .

b

Dat lijkt wel zo. Er zijn echter maar betrekkelijk weinig gegevens beschikbaar, dus nader onderzoek is aan te bevelen.

verder | terug