Conclusies trekken > Regressielijnen
12345Regressielijnen

Antwoorden van de opgaven

Opgave V1
a

Het geslacht, de lengte in cm en het gewicht in kg.

b

Bijvoorbeeld recht tegen de muur staan, geen schoenen aan, hoofd recht vooruit, plankje op hoofd loodrecht op de muur, etc.

c

Je lijkt te kunnen zeggen dat een langer iemand ook zwaarder is. Dat is vooral een statistisch verband, een groter gewicht wordt beslist niet alleen veroorzaakt door een grotere lengte, de leefstijl speelt daar ook een grote rol bij.

Opgave 1
a

Haal het bestaande diagram eerst weg.
Kies bij Invoegen voor "Spreidings- of bellendiagram invoegen".
Voeg aslabels toe.

b

Als toeneemt, neemt in het algemeen ook toe.

c

Bereken eerst , , en .

Maak in Excel kolommen voor (b.v. E-kolom), (b.v. F-kolom) en voor (b.v. G-kolom).
Tel deze laatste kolom op, daar komt uit.
Laat Excel met behulp hiervan berekenen: .

d

Je moet in de tabel kijken bij en %.
Daarbij hoort een -waarde: .

Omdat bestaat er inderdaad zo'n verband met een betrouwbaarheid van %.

Opgave 2
a

De steekproef is erg klein, eigenlijk te klein om iets over de groep mensen van 15 tot 17 jaar oud te kunnen zeggen. Bovendien zijn het studenten, dat is al een speciale groep. Verder is onduidelijk hoe de groep is samengesteld.

b

Je kunt zeker niet zeggen dat de lengte de oorzaak is van het gewicht. Het is wel één van de oorzaken, maar de leefstijl is waarschijnlijk een nog veel grotere oorzaak. Het verband is zeker statistisch en deels oorzakelijk.

Opgave 3
a

Als het goed is heb je het spreidingsdiagram (de puntenwolk) nog; maak hem anders opnieuw.
Voeg nu een "trendlijn" toe en kies (rechter muisknop op trendlijn) bij "Trendlijn opmaken" voor "Vergelijking in grafiek weergeven" en "R-kwadraat in grafiek weergeven".

b

Je hebt al eerder gevonden: en .
De formule wordt: .
Vul daarin en in: geeft .
Dus de formule wordt .

c

kg.

Opgave 4
a

Zet eerst de gegevens in Excel.
Kies bij Invoegen voor "Spreidings- of bellendiagram invoegen".
Voeg aslabels en de trendlijn toe.
Stel bij "Trendlijn opmaken" (rechter muisknop op de trendlijn) voor "Vergelijking in grafiek weergeven" en "R-kwadraat in grafiek weergeven".

b

c

Hoe hoger de waarden van de éne variabele des te lager die van de andere.

d

.
Dan is en deze lijn gaat door .
Dit punt invullen geeft .
Tenslotte nog afronden op gehele bezoekers.

e

Gebruik de r-tabel: en . Nu is dus de negatieve correlatie is aangetoond met een betrouwbaarheid van %.

f

bezoekers.

Opgave 5
a

b

Een belangrijk argument tegen de zinvolle betekenis van dit onderzoek is dat je niet zeker weet dat de voorspelde zonuren de doorslag geven om te zwemmen en niet de ervaren weersomstandigheden op het moment zelf. Daar zou eerst onderzoek naar moeten worden gedaan.

Daarnaast betreft het hier een wel erg kleine steekproef. Dat betekent dat de betrouwbaarheid van de uitspraken die je op basis van deze correlatiecoëfficiënt kunt doen erg klein is.

Opgave 6
a

Gebruik Excel, als het goed is weet je hoe dit gaat.

b

geeft en .

c
Er is een oorzakelijk verband tussen de absorptiewaarden en de concentratie ijzer in het bloed.
Opgave 7
a

kniehoogte

b

ruglengte, voetlengte, vuistomvang

c

de overige vijf lichaamsmaten

Opgave 8
a

Gebruik Excel.

b

, dus met % betrouwbaarheid is er een positieve correlatie.

c

De regressielijn heeft vergelijking .

d

cm.

Opgave 9
a

Als je kijkt naar de figuur, lijkt er een (sterke) negatieve samenhang te zijn. Hoe korter de Tour de France, hoe hoger de gemiddelde snelheid van de winnaar.

Maar pas op met oorzaak en gevolg. De oorzaak van een hogere gemiddelde snelheid van de winnaar hoeft niet de afnemende lengte van het parcours te zijn.

b

Ze hebben allemaal dezelfde horizontale as met alle jaren waarin de Tour de France gereden is.

c

In die jaren is de Tour de France niet gereden vanwege WO I en WO II.

d

De grafieken I en II.

e

Bijvoorbeeld: beter materiaal, toenemend dopinggebruik, het aantal bergen in een etappe, de conditie van de renners, de lengte van een etappe, de grootte van een groep, de concurrentie tussen de renners, het aantal rustdagen.

Opgave 10
a

Uit het bijbehorende spreidingsdiagram blijkt al een sterke mate van samenhang en dat wordt bevestigd door de correlatiecoëfficiënt: .

b

Formule regressielijn: .

Als dan geldt %

Opgave 11
a

Omdat alleen de steekproefstandaardafwijking bekend is, gebruik je de -verdeling met .
Bij een (dubbelzijdige) betrouwbaarheid van % hoort .

Het % betrouwbaarheidsinterval is dus .
Dit levert op: gram.

b

Neem een steekproefgrootte van .
Het % betrouwbaarheidsinterval is dan .
Als groter wordt, wordt juist kleiner en komen de grenzen dichter bij elkaar te liggen.

Opgave A1
a

Zie figuur, de resultaten van laborant A zijn die van laborant B .

b

, dus beide meetmethoden komen overeen.

c

Zie figuur, voor de correlatie maakt het geen verschil, maar voor de regressielijn wel.

d

De correlatiecoëfficiënt wordt nu .

Opgave A2
a

b

De metingen van laborant C zijn systematisch hoger dan die van laborant B. Hij maakt dus waarschijnlijk een systematische fout. Mogelijk is zijn meetinstrument niet geijkt.

Opgave T1
a

Ja, de puntenwolk lijkt iets op een lijn. De correlatiecoëfficiënt zal tussen en liggen.

b

Waarschijnlijk wel: Als een jongere zwaarder wordt, zal meestal het vetpercentage ook toenemen.

c

Noem het vetpercentage en de BMI . Dan is de formule voor de trendlijn.

d

%.

Opgave T2
a

Je vindt ( en ):

De correlatiecoëfficiënt is .

b

Gebruik de r-tabel.
In dit geval is , dus er is een positieve correlatie.

c

De regressielijn is: .

Met wordt dit .
Dus ms.

verder | terug