Conclusies trekken > Regressielijnen
12345Regressielijnen

Theorie

In een spreidingsdiagram van twee statistische variabelen en zet je alle combinaties als een puntenwolk in een assenstelsel. Of er een sterk lineair statistisch verband bestaat tussen de variabelen wordt bepaald door de correlatiecoëfficiënt . Er geldt in een steekproef van grootte : .

  • Als dan is er een perfecte positieve correlatie tussen en . De punten van de puntenwolk liggen dan precies op een stijgende lijn.

  • Als dan is er geen enkele correlatie tussen en .

  • Als dan is er een perfecte negatieve correlatie tussen en . De punten van de puntenwolk liggen dan precies op een dalende lijn.

De correlatie tussen en wordt beter naarmate dichter bij of ligt.
Gebruik de r-tabel.
Als bij positieve correlatie dan is het verband aangetoond, afhankelijk van de gewenste betrouwbaarheid.
Als bij negatieve correlatie dan is het verband aangetoond, afhankelijk van de gewenste betrouwbaarheid.
In Excel wordt vaak de determinatiecoëfficiënt gegeven.

Een verband waarbij de toename (of afname) van de éne variabele een gevolg is van een toename (of afname) van de andere heet een causaal verband: er is dan sprake van oorzaak en gevolg. Een statistisch verband tussen twee variabelen hoeft niet causaal te zijn. Andere variabelen kunnen de oorzaak zijn dat er bij twee variabelen een statistisch verband optreedt. Het is zeker niet zo, dat een grotere lengte veroorzaakt dat je daardoor automatisch ook een groter gewicht hebt.

Als de correlatie tussen de variabelen en groot genoeg is, kun je een formule van de vorm opstellen die het verband tussen en weergeeft. Deze formule heeft als grafiek een rechte lijn, de regressielijn van op . Zo’n regressielijn gaat door het punt en heeft als richtingscoëfficiënt (hellingsgetal):

Deze richtingscoëfficiënt heet wel de regressiecoëfficiënt van op . Met behulp van deze regressiecoëfficiënt en het feit dat de regressielijn door gaat, kun je de bijbehorende formule opstellen.

verder | terug