Hypothesen en verbanden > Lineaire regressie
1234567Lineaire regressie

Antwoorden van de opgaven

Opgave V1

Het wordt een formule van de vorm `y=a*x+b` waarvan je in ieder geval wilt dat hij door `(bar(x),bar(y))` gaat. Een ander punt van die lijn moet je nu nog op het oog schatten. En dan kun je de gewenste formule opstellen.

Opgave 1
a

Ga er van uit dat stippen die op het oog halverwege twee roosterpunten liggen, dat ook echt doen.

b

Gebruik je GR: `(4,3; 56)` .

c

Tussen `4` en `5` in.

d

`r_(xy) ~~ 0,9877` en `a ~~ 4,48` .

e

`y = 4,48x + 36,72` .

f

Ongeveer `81,5` .

Opgave 2
a

Werk de haakjes uit en maak gebruik van `b = y - a * x` . Je krijgt dan een nogal ingewikkelde uitdrukking in `a^2` en `a` .

b

Bedenk dat `sigma_x^2 = (Sigma_(i=1)^(N) (x_i - bar(x))^2)/(N)` en `sigma_y^2 = (Sigma_(i=1)^(N) (y_i - bar(y))^2)/(N)` .
Verder is het nogal lastig geknutsel met somtekens en zo.

c

Als je de formule voor `r_(xy)` vermenigvuldigt met `sigma_y` , dan werk je de `sigma_y` in de noemer weg. Vervolgens weer delen door `sigma_x` en je krijgt in de noemer `sigma_x * sigma_x` , hetgeen precies staat in de formule voor `a` .

Opgave 3
a

Doen. Je vindt `g ~~ 0,59 * l - 44,01` .

b

Als je van een 15-17 jarige de lengte weet, kun je met de formule voor de regressielijn het gewicht voorspellen.

c

Ongeveer `62,5` kg.

Opgave 4
a

Je verwisselt nu de twee assen, `l` komt nu op de verticale as.

b

Lengte `l = 174,27 + 9,30 = 183,57` geeft bij regressie van `g` op `l` een gewicht van ongeveer `64,30` kg en bij regressie van `l` op `g` een gewicht van ongeveer `67,36` kg.

c

Bij de regressie van `g` op `l` wijkt het resultaat minder dan één standaardafwijking af, in het andere geval meer.

Opgave 5

`a_(xy) = r_(xy) * (sigma_y)/(sigma_x)` en `a_(yx) = r_(xy) * (sigma_x)/(sigma_y)` , en dus is `a_(xy) * a_(yx) = r_(xy)^2` .

Opgave 6
a

Gebruik de tabel die je eerder hebt gemaakt. Je vindt `x ~~ 0,22y - 7,88` .

b

Doen.

c

Neem bijvoorbeeld voor `x` precies één keer de standaarddeviatie boven `bar(x)` . Je zult dan voor `y` een uitkomst vinden die minder dan `sigma_y` boven `bar(y)` zit.

Opgave 7
a

Een positieve correlatie, dus een zoon zal over het algemeen langer zijn dan zijn vader.

b

`z ~~ 0,47v + 95,44` .

c

Ongeveer `178,6` cm.

d

Het regressie-effect betekent dat de voorspelling van de lengte van de zoon aan de lage kant is.

Opgave 8
a

De trendlijn gaat ongeveer door `(20, 15)` en `(100, 80)` .
Dus `a=65/80=0,8125` , zodat `S=0,8125L+b` .
Eén van beide punten invullen geeft `b=text(-)1,25` .
Dus `S=0,8125L-1,25` .

b

`S=0,8125*80-1,25=63,75` %.

c

`10=0,8125L-1,25` geeft `11,25=0,8125L` en `L~~13,8` %.

Opgave 9
a

Maak een tabel waarin je `t` uitzet tegen `log(N)` .

b

Je vindt dan een bijna perfecte correlatie ( `r = 0,9999...` ).

c

De bijbehorende regressielijn is: `log(N) ~~ 0,005t + 4,364` , dus is: `N ~~ 23121 * 10^(0,005t)` . Dat betekent voor 2010 ongeveer `41text(.)116` inwoners en voor 2020 ongeveer `46text(.)132` inwoners.

d

Er is vrijwel geen regressie-effect omdat `r ~~ 1` .

Opgave 10

Gebruik `9,65 = r_(tG) * (59,1)/(6,07)` en je vindt `r_(tG) ~~ 0,99` .

Opgave 11
a

Neem `m` voor de mouwlengte in cm en `k` voor de kniehoogte in cm.
`sigma_m ~~ 3,04` en `sigma_k ~~ 2,70` .

b

`m ~~ 0,67k + 28,75` en `k ~~ 0,55m + 11,17` .

c

`k = 60` geeft bij regressie van `m` op `k` een mouwlengte van ongeveer `70,45` cm en bij regressie van `k` op `m` een mouwlengte van ongeveer `88,78` cm. Er is een nogal groot regressie-effect omdat `r ~~ 0,62` en dat is behoorlijk kleiner dan `1` .

Opgave 12Vliegsnelheid en lichaamslengte (vervolg)
Vliegsnelheid en lichaamslengte (vervolg)
a

Doen, zoek de bijpassende correlatiecoëfficiënt en de standaarddeviaties op.

b

Ongeveer `0,36` .

c

De regressielijn wordt: `log(v) ~~ 0,36 log(L) + 2,67` , dus de machtsfunctie wordt: `v ~~ 10^(2,67) * L^(0,36) ~~ 468 * L^(0,36)` .

Opgave 13
a

`r_(WF) ~~ text(-)0,94` , een duidelijke negatieve correlatie.

b

`W ~~ text(-)0,35F + 48,30`
De regressielijn van `W` op `F` ligt meer voor de hand omdat gezocht wordt naar een verband waarbij de werkzaamheid afhangt van de bewaartemperatuur.

c

`W ~~ text(-)0,63C + 37,10` .

d

Nee, want de schaalverdeling speelt geen rol bij de correlatie, het gaat alleen om de ligging van de meetpunten ten opzicht van de regressielijn.

e

Uit de formule voor de regressielijn volgt dat de werkzaamheid in `20` dagen bij `20`  °C terugloopt tot ongeveer `24,5` %. Voor een periode van `40` dagen loopt de werkzaamheid daarom terug tot `0,245 * 24,5 ~~ 6` %.

verder | terug