Conclusies trekken > Regressielijnen
12345Regressielijnen

Antwoorden van de opgaven

Opgave V1
a

Het geslacht, de lengte in cm en het gewicht in kg.

b

Bijvoorbeeld recht tegen de muur staan, geen schoenen aan, hoofd recht vooruit, plankje op hoofd loodrecht op de muur, etc.

c

Je lijkt te kunnen zeggen dat een langer iemand ook zwaarder is. Dat is vooral een statistisch verband, een groter gewicht wordt beslist niet alleen veroorzaakt door een grotere lengte, de leefstijl speelt daar ook een grote rol bij.

Opgave 1
a

Haal het bestaande diagram eerst weg.
Kies bij Invoegen voor "Spreidings- of bellendiagram invoegen" .
Voeg aslabels toe.

b

Als `l` toeneemt, neemt in het algemeen `G` ook toe.

c

Bereken eerst `bar(l)` , `bar(G)` , `s_l` en `s_G` .

Maak in Excel kolommen voor `l_i - bar(L)` (b.v. E-kolom), `G_i - bar(G)` (b.v. F-kolom) en voor `(l_i - bar(L))(G_i - bar(G))` (b.v. G-kolom).
Tel deze laatste kolom op, daar komt `1125,45` uit.
Laat Excel met behulp hiervan `r_(lG)` berekenen: `r_(lG) ~~ 0,81` .

d

Je moet in de tabel kijken bij `n = 22` en `99` %.
Daarbij hoort een `r` -waarde: `0,505 lt r lt 0,561` .

Omdat `r_(lG) ~~ 0,81 gt r_(text(tabel))` bestaat er inderdaad zo'n verband met een betrouwbaarheid van `99` %.

Opgave 2
a

De steekproef is erg klein, eigenlijk te klein om iets over de groep mensen van 15 tot 17 jaar oud te kunnen zeggen. Bovendien zijn het studenten, dat is al een speciale groep. Verder is onduidelijk hoe de groep is samengesteld.

b

Je kunt zeker niet zeggen dat de lengte de oorzaak is van het gewicht. Het is wel één van de oorzaken, maar de leefstijl is waarschijnlijk een nog veel grotere oorzaak. Het verband is zeker statistisch en deels oorzakelijk.

Opgave 3
a

Als het goed is heb je het spreidingsdiagram (de puntenwolk) nog; maak hem anders opnieuw.
Voeg nu een "trendlijn" toe en kies (rechter muisknop op trendlijn) bij "Trendlijn opmaken" voor "Vergelijking in grafiek weergeven" en "R-kwadraat in grafiek weergeven" .

b

Je hebt al eerder gevonden: `(bar(l), bar(G)) = (174,3; 59,1)` en `a = r_(lG) * (s_G)/(s_l) = 0,81*(7,0)/(9,5) ~~ 0,60` .
De formule wordt: `G = 0,60*l + b` .
Vul daarin `l = 174,3` en `G = 59,1` in: `59,1 = 0,60*174,3+b` geeft `b~~ text(-)45,48` .
Dus de formule wordt `G ~~ 0,60*l - 45,48` .

c

`G ~~ 0,60*200 - 45,48 ~~ 74,5 ~~ 75` kg.

Opgave 4
a

Zet eerst de gegevens in Excel.
Kies bij Invoegen voor "Spreidings- of bellendiagram invoegen" .
Voeg aslabels en de trendlijn toe.
Stel bij "Trendlijn opmaken" (rechter muisknop op de trendlijn) voor "Vergelijking in grafiek weergeven" en "R-kwadraat in grafiek weergeven" .

b

`r_(ka) = text(-)sqrt(0,7243) ~~ text(-)0,851`

c

Hoe hoger de waarden van de éne variabele des te lager die van de andere.

d

Laat Excel gemiddelden en standaarddeviaties berekenen.
`a = r_(ka) * (s_a)/(s_k) ~~ text(-)0,851* (1455,571)/(38,983) ~~ text(-)31,775` .
Dan is `a = text(-)31,775*k + b` en deze lijn gaat door `(bar(k), bar(a)) = (48,75; 2777,75)` .
Dit punt invullen geeft `b ~~ 4326,8` .
Tenslotte nog afronden op gehele bezoekers.

e

Gebruik de r-tabel: `r_(ka) = text(-)0,851` en `r_(text(tabel)) = text(-)0,754` . Nu is `r_(ka) lt r_(text(tabel))` dus de negatieve correlatie is aangetoond met een betrouwbaarheid van `95` %.

f

`a = text(-)32*100 + 4327 = 1127` bezoekers.

Opgave 5
a

`r ~~ 0,912`

b

Een belangrijk argument tegen de zinvolle betekenis van dit onderzoek is dat je niet zeker weet dat de voorspelde zonuren de doorslag geven om te zwemmen en niet de ervaren weersomstandigheden op het moment zelf. Daar zou eerst onderzoek naar moeten worden gedaan.

Daarnaast betreft het hier een wel erg kleine steekproef. Dat betekent dat de betrouwbaarheid van de uitspraken die je op basis van deze correlatiecoëfficiënt kunt doen erg klein is.

Opgave 6
a

Gebruik Excel, als het goed is weet je hoe dit gaat.

b

`0,814 ~~ 0,0079*C - 0,0065` geeft `0,0079C ~~ 0,8205` en `C ~~ (0,8205)/(0,0079) ~~ 103,9` .

c

Er is een oorzakelijk verband tussen de absorptiewaarden en de concentratie ijzer in het bloed.

Opgave 7
a

kniehoogte

b

ruglengte, voetlengte, vuistomvang

c

de overige vijf lichaamsmaten

Opgave 8
a

Gebruik Excel.

b

`r_(vz) ~~ sqrt(0,4958) ~~ 0,704` , dus met `95` % betrouwbaarheid is er een positieve correlatie.

c

De regressielijn heeft vergelijking `z = 0,47*v + 95,44` .

d

`z = 0,47*195 + 95,44 ~~ 187` cm.

Opgave 9
a

Als je kijkt naar de figuur, lijkt er een (sterke) negatieve samenhang te zijn. Hoe korter de Tour de France, hoe hoger de gemiddelde snelheid van de winnaar.

Maar pas op met oorzaak en gevolg. De oorzaak van een hogere gemiddelde snelheid van de winnaar hoeft niet de afnemende lengte van het parcours te zijn.

b

Ze hebben allemaal dezelfde horizontale as met alle jaren waarin de Tour de France gereden is.

c

In die jaren is de Tour de France niet gereden vanwege WO I en WO II.

d

De grafieken I en II.

e

Bijvoorbeeld: beter materiaal, toenemend dopinggebruik, het aantal bergen in een etappe, de conditie van de renners, de lengte van een etappe, de grootte van een groep, de concurrentie tussen de renners, het aantal rustdagen.

Opgave 10
a

Uit het bijbehorende spreidingsdiagram blijkt al een sterke mate van samenhang en dat wordt bevestigd door de correlatiecoëfficiënt: `r ~~ text(-)0,93 lt r_(text(tabel)) = text(-)0,708` .

b

Formule regressielijn: `W = text(-)0,35T + 48,3` .

Als `T = 0^@` dan geldt `W = 48,3` %

Opgave A1
a

Zie figuur, de resultaten van laborant A zijn `x` die van laborant B `y` .

b

`r_(xy) = sqrt(0,581) ~~ 0,762 gt r_(text(tabel)) = 0,444` , dus beide meetmethoden komen overeen.

c

Zie figuur, voor de correlatie maakt het geen verschil, maar voor de regressielijn wel.

d

De correlatiecoëfficiënt wordt nu `r_(xy) = sqrt(0,8889) ~~ 0,943` .

Opgave A2
a

`r_(xy) = sqrt(0,3925) ~~ 0,626 gt r_(text(tabel)) = 0,444`

b

De metingen van laborant C zijn systematisch hoger dan die van laborant B. Hij maakt dus waarschijnlijk een systematische fout. Mogelijk is zijn meetinstrument niet geijkt.

Opgave T1
a

Ja, de puntenwolk lijkt iets op een lijn. De correlatiecoëfficiënt zal tussen `0,3` en `0,7` liggen.

b

Waarschijnlijk wel: Als een jongere zwaarder wordt, zal meestal het vetpercentage ook toenemen.

c

Noem het vetpercentage `v` en de BMI `b` . Dan is `v = 5/3 b - 8` de formule voor de trendlijn.

d

`v = 5/3*21 - 8 = 27` %.

Opgave T2
a

Je vindt ( `tL = x` en `tG = y` ):

De correlatiecoëfficiënt is `r_(xy) ~~ 0,919` .

b

Gebruik de r-tabel.
In dit geval is `r_(xy) ~~ 0,919 gt r_(text(tabel)) = 0,632` , dus er is een positieve correlatie.

c

De regressielijn is: `y = 0,7367x + 50,186` .

Met `tG = y = 300` wordt dit `300 = 0,7367x + 50,186` .
Dus `tL = x ~~ 339` ms.

verder | terug