Hypothesen en verbanden > Lineaire regressie
1234567Lineaire regressie

Verwerken

Opgave 6

Bekijk dit spreidingsdiagram uit de eerste opgave bij de Uitleg nog eens.

a

Stel een formule op voor de regressielijn van `x` op `y` .

b

Teken zelf het spreidingsdiagram met daarin beide regressielijnen.

c

Is er sprake van een regressie-effect? Zo ja, laat dit dan met een rekenvoorbeeld zien.

Opgave 7

Om te onderzoeken of er enig verband bestaat tussen de lengte van een vader en die van zijn zoon zijn de lengtes van `12` vaders en die van hun oudste zoons gemeten op het moment dat die zoons volwassen werden. De gegevens staan in deze tabel.

lengte vader `v` in cm 173 168 178 170 180 165 185 175 180 178 183 188
lengte zoon `z` in cm 180 175 180 173 183 175 180 173 188 178 180 185
a

Was er sprake van een positieve of een negatieve correlatie? Wat betekent dit in de praktijk?

b

Stel de regressielijn op van `z` op `v` bij deze gegevens.

c

Als een bepaalde vader `1,77` m lang is, hoe lang zou dan zijn oudste zoon moeten zijn?

d

Wat betekent het optredende regressie-effect voor de bepaling van de lengte van een zoon waarvan de vader bijvoorbeeld `2` m lang is?

Opgave 8

Een basisschool heeft een leestest en schrijftest Nederlands afgenomen bij de leerlingen in groep acht. De resultaten zijn verwerkt in een puntenwolk.

Er lijkt een verband te zijn tussen de schrijfscore `S` en de leesscore  `L` .

a

Stel een formule op voor de trendlijn die het verband tussen `S` en `L` weergeeft.

b

Geef met behulp van de formule uit a een schatting van de schrijfscore bij een leesscore van `80` %.

c

Geef met behulp van de formule uit a een schatting van de leesscore bij een schrijfscore van `10` %.

Opgave 9

In de tabel vind je het aantal inwoners `N` in een bepaalde stad.

Jaartal 1960 1970 1980 1990 2000
Aantal inwoners `N` 23.107 25.880 28.985 32.479 36.358

Er wordt aangenomen dat `N` een exponentiële functie is van `t` , de tijd in jaren met `t = 0` in 1960.

a

Maak het spreidingsdiagram van `log(N)` afhankelijk van `t` .

b

Bereken de correlatiecoëfficiënt van `log(N)` en `t` .

c

Voorspel met behulp van de regressielijn van `log(N)` op `t` het aantal inwoners in 2010 en 2020.

d

Waarom is er vrijwel geen regressie-effect?

Opgave 10

Om het verband tussen het gewicht `G` (in pounds) en de braadtijd voor kalkoenen te onderzoeken, werd onder gelijke omstandigheden nagegaan hoeveel minuten `t` het duurde tot het binnenste van een kalkoen de temperatuur van `85`  °C bereikte. Er werden diverse kalkoenen aan dit onderzoek onderworpen. Ze hadden een gemiddeld gewicht van `15,24` pounds met een standaardafwijking van `6,07` . Voor de waarden van `t` vonden de onderzoekers een gemiddelde van `205,4` minuten met een standaardafwijking van `59,1` .
De regressielijn van `t` op `G` had de vergelijking: `t = 9,65G + 58,40` .

Hoeveel bedroeg de correlatiecoëfficiënt?

Opgave 11

In 1947 hielden de wiskundigen Freudenthal en Sittig een statistisch onderzoek ten behoeve van een nieuw maatsysteem voor vrouwenkleding in opdracht van het warenhuis De Bijenkorf. Zij lieten daarbij een grote verscheidenheid aan lichaamsmaten opmeten van 5001 vrouwen. In het bestand StatFS-Bijenkorf1947.xls vind je enkele gegevens.
Gebruik de werkbladen "mouwlengte en kniehoogte" en "mouwlengte-kniehoogte" .
Op het werkblad "mouwlengte-kniehoogte" zie je een zogenaamde kruistabel waarin de combinaties mouwlengte-kniehoogte zijn weergegeven. De hierbij gevonden correlatiecoëfficiënt is ongeveer `0,6271` .

a

Bereken op het werkblad "mouwlengte-kniehoogte" de standaardafwijkingen van beide statistische variabelen.

b

Stel vergelijkingen op van de beide bijbehorende regressielijnen met de constanten in twee decimalen nauwkeurig.

c

Bereken met behulp van deze regressielijnen de gemiddelde kniehoogte van een vrouw met een mouwlengte van `60` cm. Is er sprake van een groot regressie-effect?

verder | terug