Conclusies trekken > Samenhang tussen variabelen
123456Samenhang tussen variabelen

Antwoorden van de opgaven

Opgave V1
a

Het geslacht, de lengte en het gewicht.

b

Denk aan de wijze van meten, hoe meet je iemand's lengte bijvoorbeeld? (Rechtop staan tegen een muur, meetlint aan die muur op de goede hoogte, geodriehoek op het hoofd met de éne rechthoekszijde tegen de muur, etc. En doe je schoenen aan of schoenen uit? En hoe zit dat met het gewicht?

c

Een groter gewicht wordt ook wel door een grotere lengte veroorzaakt, maar niet alleen daardoor...

Opgave 1
a

Haal het bestaande diagram eerst weg.
Kies bij Invoegen voor "Spreidings- of bellendiagram invoegen" .
Voeg aslabels toe.

b

Als `l` toeneemt, neemt in het algemeen `G` ook toe.

c

Als het goed is heb je het spreidingsdiagram (de puntenwolk) nog; maak hem anders opnieuw.
Voeg nu een "trendlijn" toe en kies (rechter muisknop op trendlijn) bij "Trendlijn opmaken" voor "Vergelijking in grafiek weergeven" en "R-kwadraat in grafiek weergeven" .

Je vindt: `r_(lG) ~~ 0,81` .

d

Omdat `r_(lG) ~~ 0,81 gt 0,7` bestaat er inderdaad zo'n verband.

Opgave 2
a

De steekproef is erg klein, eigenlijk te klein om iets over de groep mensen van 15 tot 17 jaar oud te kunnen zeggen. Bovendien zijn het studenten, dat is al een speciale groep. Verder is onduidelijk hoe de groep is samengesteld.

b

Je kunt zeker niet zeggen dat de lengte de oorzaak is van het gewicht. Het is wel één van de oorzaken, maar de leefstijl is waarschijnlijk een nog veel grotere oorzaak. Het verband is zeker statistisch en deels oorzakelijk.

Opgave 3
a

De lijn gaat door `(160, 50)` en `(190, 68)` , dus `a = (68-50)/(190-160) = 0,6` .
De formule wordt: `G = 0,6*l + b` .
Vul daarin één van beide punten in, dit geeft `b = text(-)46` .
Dus de formule wordt `G ~~ 0,6*l - 46` .

b

`G ~~ 0,6*200 - 46 = 74` kg.

Opgave 4
a

Ze hebben allemaal dezelfde horizontale as met alle jaren waarin de Tour de France gereden is.

b

In die jaren is de Tour de France niet gereden vanwege WO I en WO II.

c

Grafieken I en II.

d

Grafieken I en III tonen de samenhang tussen de gemiddelde etappelengte en de tourlengte.
Grafieken II en III tonen de samenhang tussen de gemiddelde etappelengte en de gemiddelde snelheid van de tourwinnaar.

Opgave 5
a

Bijvoorbeeld: beter materiaal, toenemend dopinggebruik, het aantal bergen in een etappe, de conditie van de renners, de lengte van een etappe, de grootte van een groep, de concurrentie tussen de renners, het aantal rustdagen.

b

Bijvoorbeeld: etappelengte, gewicht van een fiets. Hier is waarschijnlijk sprake van een oorzakelijk verband.

c

Er bestaat geen oorzakelijk verband met bijvoorbeeld: het aantal vlinders in de provincie Drenthe, de hoeveelheid gewonnen steenkool in Limburg. Maar er kan wel een statistisch verband bestaan, bijvoorbeeld: met een toenemende gemiddelde snelheid van renners in de Tour de France kan tegelijk het aantal vlinders in Drenthe afnemen.

Opgave 6
a

Gebruik de grafische rekenmachine. Voer de lengtes van de vaders in onder L1 en die van de zonen onder L2. Maak de puntenwolk.

b

`r_(vz) ~~ 0,70`

c

De correlatie zit op de grens van matig positief tot sterk.
Dus is het opstellen van zo'n lineair verband gerechtvaardigd.

Je GR kan de bijbehorende formule opstellen: `z ~~ 0,47*v + 95,3` .

Opgave 7
a

Als twee punten dicht bij elkaar liggen, kun je bij onnauwkeurig aflezen een vergelijking vinden die behoorlijk afwijkt van de lijn die getekend is.

b

Met de afgelezen punten vind je `a = (3,9-0,5)/(39-13) ~~ 0,13` . Dus `ug ~~ 0,13* bnp + b` .

Punt `(13; 0,5)` invullen geeft `b = text(-)1,20` .

Dus `ug ~~ 0,13* bnp - 1,20` .

Opgave 8

Een sterke positieve samenhang. De correlatiecoëfficiënt kan zo'n `0,8` zijn.

Opgave 9
a

Kniehoogte, want de correlatiecoëfficiënt is groter dan `0,7` .

b

Ruglengte en voetlengte, want de correlatiecoëfficiënten liggen tussen `0,3` en `0,7` .

c

De overige, want die liggen tussen `text(-)0,3` en `0,3` .

Opgave 10

Waarschijnlijk is de oorzaak mooi zonnig weer. Bij mooi zonnig weer wordt er meer ijs verkocht en worden er meer zonnebrillen verkocht. Er gaan niet meer mensen zonnebrillen kopen, omdat er meer ijs verkocht wordt of omgekeerd.

Opgave 11
a

Links: een punt stelt een land in Europa voor.
Rechts: een punt stelt een provincie in Nederland voor.

b

Links: tussen ongelijkheid en de steun voor het verbod op het homohuwelijk.
Rechts: tussen aantal schoorsteenbranden en het percentage mensen dat vindt dat Zwarte Piet niet aangepast moet worden.

c

Links: matige positieve samenhang.
Rechts: sterke negatieve samenhang.

d

Links: hoe kleiner de ongelijkheid, hoe minder tegenstand tegen een homohuwelijk, wellicht omdat de mensen zich minder bedreigd of achtergesteld voelen.
Rechts: geen verklaring, dit is louter toeval.

Opgave 12
a

De trendlijn gaat ongeveer door `(20, 15)` en `(100, 80)` .
Dus `a=65/80=0,8125` , zodat `S=0,8125L+b` .
Eén van beide punten invullen geeft `b=text(-)1,25` .
Dus `S=0,8125L-1,25` .

b

`S=0,8125*80-1,25=63,75` %.

c

`10=0,8125L-1,25` geeft `11,25=0,8125L` en `L~~13,8` %.

Opgave 13Gapminder
Gapminder
a

Beide grafieken zijn getekend met minstens één logaritmische schaal. Dus je mag niet direct uit de afbeelding concluderen dat er lineaire samenhang is, zelfs niet als er een redelijk rechte lijn door de punten te trekken is.

Voor de grafiek met de enkele logaritmische schaal geldt: Het lijkt niet op een lineair verband, zelfs niet op logaritmische schaal. Het is niet waarschijnlijk dat er een lineair verband is, gezien de vorm van de wolk.

Voor de grafiek met beide assen logaritmische schaal: Deze wolk geeft geen aanleiding om te denken dat er een verband is. Dus ook geen lineair verband.

b

Bij geen van beide.

Opgave 14Huwelijken
Huwelijken
a

Aan de vorm van puntenwolk is te zien dat de rechter wolk een grotere samenhang vertoont dan de linker wolk. In huwelijken is het waarschijnlijker dat beide partners ongeveer dezelfde leeftijd hebben dan dezelfde lengte. De linker puntenwolk zal dus betrekking hebben op de lengte.

b

Teken een lijn door de punten `(20, 20)` en `(60, 60)` . Er liggen meer punten onder de lijn dan erboven. De conclusie: het komt vaker voor dat de man ouder is dan de vrouw.

c

Bij een gegeven lengte van de man is de spreiding van de lengte van de vrouw groter dan de spreiding van de leeftijd van de vrouw bij een gegeven leeftijd van de man. Bij de puntenwolk met de leeftijden zal de schatting dus het meest betrouwbaar zijn.

d

Vuistregel: `95` % van de waarden tussen gemiddelde `± 2` maal standaardafwijking. Voor de mannen is dat tussen `159,2` (cm) en `186,8` (cm).

e

Vuistregel: `95` % van de waarden tussen gemiddelde `± 2` maal standaardafwijking. Voor de vrouwen liggen de lengtes tussen `147,6` (cm) en `172,4` (cm).

f

Er zijn echtparen waarvan de lengte van beide partners buiten de rechthoek valt.
Die punten worden dubbel meegeteld, zowel bij de ene `5` % als bij de andere `5` %.
Het aantal punten buiten de getekende rechthoek zal kleiner zijn dan `10` %.

(bron: voorbeeldopgave Statistiek – syllabus havo A)

Opgave 15
a

Ja, de puntenwolk lijkt iets op een lijn. De correlatiecoëfficiënt zal tussen `0,3` en `0,7` liggen.

b

Waarschijnlijk wel: Als een jongere zwaarder wordt, zal meestal het vetpercentage ook toenemen.

c

Noem het vetpercentage `v` en de BMI `b` . Dan is `v = 5/3 b - 8` de formule voor de trendlijn.

d

`v =5/3*21 - 8 = 27` %.

verder | terug