Conclusies trekken > Samenhang tussen variabelen
123456Samenhang tussen variabelen

Verwerken

Opgave 11

Bekijk de spreidingskaart. Op de horizontale as staat het gewicht in kg en op de verticale as de heupomvang in cm. De getallen stellen het aantal vrouwen voor die bij een bepaald gewicht en heupomvang horen. Je kunt van deze kaart een puntenwolk maken.

Welke mate van samenhang verwacht je op grond van deze resultaten tussen de heupomvang (cm) en het gewicht (kg)?

Opgave 12

Bekijk de tabel met de correlatiecoëfficiënten van een aantal variabelen van de lengte van een vrouw.

gewicht bovenwijdte taille heup ruglengte rugbreedte vuistomvang kniehoogte voetlengte
lengte `0,2124` `text(-)0,0779` `text(-)0,1578` `text(-)0,0107` `0,5933` ` 0,0647` `0,2668` `0,8263` `0,6737`
a

Welke variabelen hebben een sterke samenhang met lengte?

b

Welke variabelen hebben een matige samenhang met lengte?

c

Welke variabelen hebben een zwakke samenhang met lengte?

Opgave 13

Soms is er wel een samenhang tussen twee statistische variabelen, maar kun je niet spreken van een causale (oorzaak-gevolg) relatie. Leg uit dat er een samenhang is tussen ijsverkoop en de verkoop van zonnebrillen, maar dat er geen oorzakelijk verband is tussen deze twee.

Opgave 14

Bekijk deze puntenwolken.

a

Wat stelt een punt voor in de rechter figuur? En in de linker figuur?

b

Tussen welke statistische variabelen wordt in de figuren gezocht naar samenhang?

c

Beschrijf de samenhang tussen de variabelen op grond van de puntenwolken en de getekende trendlijn.

d

Geef waar mogelijk een verklaring bij de puntenwolken.

Opgave 15

Met Gapminder (zie http://ww.gapminder.org/world) kun je puntenwolken bekijken. Je kunt de statistische variabelen zelf kiezen en door op play te drukken kun je het verloop in de tijd zien. Let wel op de schaalverdelingen: lin = lineair; log = logaritmisch. Wil je de lineaire samenhang zien, dan moeten beide schalen op lin staan.

a

Door de vorm van de puntenwolk kun je een uitspraak doen over de lineaire samenhang. Bekijk de afbeeldingen en doe een uitspraak over de lineaire samenhang.

b

Bij welke puntenwolk is er wel samenhang, maar geen lineaire samenhang?

Opgave 16

Bekijk de puntenwolk BMI - Vetpercentage. Daarin zijn de resultaten weergegeven van een onderzoek onder 90 jongeren. BMI is een getal dat samenhangt met lengte en gewicht, vetpercentage is het percentage van het lichaamsgewicht dat bestaat uit vet.

a

Is er een statistische samenhang?

b

Is er een oorzakelijk verband?

c

Stel een vergelijking op van een trendlijn die dit verband beschrijft.

Opgave 17

In een onderzoek onder `199` echtparen is gevraagd naar de lengte en de leeftijd van de man en de vrouw. Onder andere werd onderzocht of er bij bepaalde eigenschappen van de gehuwden sprake was van een bepaalde statistische samenhang. Dit heeft geresulteerd in de volgende twee puntenwolken:

Een van beide puntenwolken heeft betrekking op de leeftijden van de twee huwelijkspartners, waarbij de gegevens van de man op de horizontale as zijn uitgezet en die van de vrouw op de verticale as. De andere puntenwolk heeft betrekking op de lengte van beide partners. Ook hier zijn de gegevens van de man weer op de horizontale as uitgezet.

a

Beredeneer dat, op basis van de vorm van de puntenwolk, de linker puntenwolk zeer waarschijnlijk betrekking heeft op de lengte en de rechter puntenwolk op de leeftijd.

b

Bekijk de puntenwolk. Onderzoek met behulp van de puntenwolk of het in de betreffende `199` huwelijken vaker voorkomt dat de man ouder is dan de vrouw of dat het omgekeerde juist vaker voorkomt. Laat duidelijk zien hoe je tot je antwoord gekomen bent.

Op basis van dergelijke puntenwolken wil men soms een schatting maken van de lengte of de leeftijd van een vrouw als men de lengte of de leeftijd van de man kent. Hoewel dit soort schattingen altijd een grote mate van onzekerheid hebben, is het toch mogelijk om aan te geven bij welk van de twee puntenwolken een dergelijke schatting het meest betrouwbaar zal zijn.

c

Beredeneer bij welk van de twee puntenwolken, die met de leeftijden of die met de lengtes, een dergelijke schatting het meest betrouwbaar zal zijn.

In de tabel is een aantal kengetallen weergegeven uit het onderzoek.

leeftijd man (jaar) leeftijd vrouw (jaar) lengte man (cm) lengte vrouw (cm)
gemiddelde 42,6 40,7 173 160
minimum 20 18 156 141
maximum 64 64 195 176
standaardafwijking 11,6 11,4 6,9 6,2

Ervan uitgaande dat de lengtes en de leeftijden van de huwelijkspartners nagenoeg normaal verdeeld zijn, is met behulp van deze gegevens uit te rekenen dat `95` % van de lengtes van de mannen tussen de `159,2` cm en `186,8` cm zal liggen.

d

Leg uit hoe je aan deze waarden komt.

e

Bepaal tussen welke twee lengtes `95` % van de vrouwen zit.

Omdat `5` % van de mannen buiten de berekende grenzen zal vallen, evenals `5` % van de vrouwen, concludeert de onderzoeker dat in totaal `10` % van de punten uit de puntenwolk buiten de getekende rechthoek zullen vallen.

f

Beargumenteer of je het met die conclusie eens bent of niet.

bron: voorbeeldopgave Statistiek – syllabus havo A

verder | terug