Verbanden en verschillen > Verschil kwantitatieve variabelen
1234Verschil kwantitatieve variabelen

Antwoorden van de opgaven

Opgave V1

Zie de uitleg.

Opgave 1
a

Conclusie: de 25% batterijen van type I met de kortste levensduur, gaan allemaal korter mee dan welke batterij van type II dan ook.

Dit weet je zeker omdat de linkersnorhaar van de bovenste boxplot in z’n geheel links ligt van de minimumlevensduur in de onderste boxplot.

Conclusie: meer dan 25% batterijen van type II heeft een langere levensduur dan welke batterij van type I dan ook.

Dit weet je zeker omdat de rechtersnorhaar van de onderste boxplot in z’n geheel rechts ligt van de maximumlevensduur in de bovenste boxplot.

Conclusie: er zit meer verschil in minimale en maximale levensduur van batterijen van type I dan bij die van type II.

Dit weet je zeker door van beide boxplots de spreidingsbreedte te bepalen.

b

Een middelmatig verschil.

Opgave 2
a
b

Het verschil is gering.

Opgave 3
a

Omdat "smaakvoller" en "minder smaakvol" door de tekens `+` en `-` worden weergegeven.

b

Als er geen wijziging merkbaar is, zal het aantal `+` gelijk zijn aan het aantal `-` .

c

Je wilt testen op de variabele met mogelijke waarden "smaakvoller" , "gelijke smaak" en "minder smaakvol" en dat zijn kwalitatieve waarden.
In plaats daarvan ga je toetsen op het aantal `+` en het aantal `-` en aantal is een kwantitatieve variabele.

Opgave 4
a

Er kan ook een aantal keer `0` uitgekomen zijn.

b

Nee.

Opgave 5
a

`μ_V = μ_X - μ_Y`

De fabrikant vermoedt dat de oorbeschermers van de webshop ( `Y` ) minder dempen dan de officiële ( `X` ), ofwel hij vermoedt dat `μ_Y < μ_X` .

`μ_Y`

`lt`

`μ_X`

`μ_X`

`gt`

`μ_Y`

`μ_X - μ_Y`

`gt`

`0`

`μ_V`

`gt`

`0`

b

`bar(X)`

`=`

`30,1`

`bar(Y)`

`=`

`27,2`

`bar(V)`

`=`

`bar(X) – bar(Y) = 2,9`

`H_1` maakt van deze toets een rechtszijdige toets ( `μ_V > 0` ) en daarom is de overschrijdingskans `text(P)(bar(V) > 2,9)` .

c

Deze standaardafwijking is de steekproefstandaardafwijking van `V` .

`V` is het verschil van twee normaal verdeelde kansvariabelen en voor de standaardafwijking van een verschilvariabele geldt (net als bij een somvariabele): `σ_V = sqrt((σ_X)^2 + (σ_Y)^2)`

Van `X` en `Y` is een steekproef genomen dus bij beide standaardafwijkingen geldt de wortel-n-wet: je gebruikt als afzonderlijke standaardafwijkingen `σ_X/sqrt(100)` en `σ_Y/sqrt(125)` .

Te gebruiken steekproefstandaardafwijking is daarom:

`σ_bar(V) = sqrt((σ_X/sqrt(100))^2 + (σ_Y/sqrt(125))^2)` ofwel:

`σ_bar(V) = sqrt(((σ_X)^2) /100 + ((σ_Y)^2)/125)`

d

Nu is `μ_V < 0` en `bar(V) = bar(Y) – bar(X) = text(-)2,9`

Overschrijdingskans:

`text(P)(bar(V) < -2,9 | μ_V = 0 text( en ) σ_V = sqrt(((6^2)/100) + ((6^2)/125)))) ~~ 0,0002`

Deze kans is gelijk aan de kans uit de uitleg en leidt daarom tot dezelfde conclusie.

Opgave 6

De fabrikant kan vast ook de benodigde gegevens voor de boxplots achterhalen uit zijn steekproeven. Maar de mate van verschil die je uit het vergelijken van boxplots kunt achterhalen is veel grover dan het gebruik van significantieniveau’s bij hypothesetoetsen.

Een tekentoets ligt minder voor de hand, omdat er geen natuurlijke relatie is tussen een oorbeschermer uit het officiële verkoopkanaal en oorbeschermers uit de webshop (het gaat niet om paren oorbeschermers waartussen je het verschil wilt weten).

Toch zou je een tekentoets kunnen inzetten, maar juist voor een normaal verdeelde variabele als geluidsdemping bestaat de hypothesetoets voor gemiddelden: het ligt daarom voor de hand om deze te gebruiken.

Opgave 7

Nee, er is geen significant verschil.

Opgave 8

Voor het verschil in brandduur geldt:

  • Het verschil tussen B en C is middelmatig.

  • Het verschil tussen B en D is middelmatig.

  • Het verschil tussen C en D is gering.

Opgave 9
a

Nee, want je kent alleen de steekproefgegevens en het kan zijn dat door toeval dit een steekproef van lamp E was met extreem lange branduren.

b

De conclusie verandert waarschijnlijk niet, maar de betrouwbaarheid is wel groter.

c

`25` %

Opgave 10
a

Verwijder de paren waarnemingen met een `0` uit de steekproef: er zijn alleen nog plussen en minnen. Daarmee hoort bij elke hoeveelheid plussen een unieke hoeveelheid minnen. Bereken vervolgens de kans op dezelfde situatie, of je nu de kans op het aantal plussen of op het aantal minnen berekent.

Dit geeft dezelfde uitkomst en dus ook dezelfde conclusie.

b
  • de steekproefgrootte is nu `19` in plaats van `18` (een `0` wordt een `-` )

  • overschrijdingskans `text(P)(X ge 12)`

  • nee: er is wel een min extra maar de steekproefgrootte is ook groter

Opgave 11
a

De verschilvariabele betreft het examencijfer en dat is een kwantitatieve variabele

(dit is anders dan in de uitleg van de tekentoets, over de smaak van gerechten: daar is de oorspronkelijke verschilvariabele een kwalitatieve variabele en daar kun je geen boxplot van maken).

b

Er is sprake van een gering verschil tussen de SE- en de CE-cijfers

c

Tekentoets: je kunt tot op significantieniveau nauwkeurig een uitspraak doen.

Boxplot: je hebt meer vergelijkingsgegevens, want uit de boxplots kun je bijvoorbeeld wel zien dat de middelste `50` % bij het CE veel minder variatie kent dan bij het SE.

Opgave 12
a

Het betreft een tweezijdige toets en dan vergelijk je de overschrijdingskans met de helft van het significantieniveau.

b

Het steekproefresultaat `bar(V)` is in dat geval gelijk aan `1,5` .

De overschrijdingskans is dan `text(P)(bar(V) > 1,5)` en omdat de normale verdeling symmetrisch is rondom `μ_bar(V)` en `text(-)1,5` even ver van `0` ligt als `1,5` geldt:

`text(P)(bar(V) > 1,5) = P(bar(V) < text(-)1,5)`

Opgave 13

Nee, ze verschillen niet significant.

Opgave 14
a

Een middelmatig verschil.

b

Ja

c

Van beide populaties moet de populatiestandaardafwijking bekend zijn.

Opgave 15
a

Vanwege de term "altijd" bekijk je de hele boxplots en niet alleen de boxen: het maximum van zondag ligt hoger dan elk minimum van alle andere dagen.

b

dinsdag, donderdag en vrijdag

c

Geen enkele dag.

Opgave 16
a

`X` is het aantal maanden dat het ziekteverzuim op afdeling A hoger is dan op afdeling B.
Je toetst eenzijdig `text(H)_0: p = 0,5` tegen `text(H)_1: p > 0,5` met `n = 12` . De te bepalen overschrijdingskans is `P(X ge 9)` .

b

Er is geen significant verschil in ziekteverzuim tussen beide afdelingen.

Opgave 17

Nee

Opgave 18
a

Toets met overschrijdingskans `text(P)(V < -3,5)` en gebruik daarbij `σ = sqrt(3,5^2 + 3,8^2)` .

Conclusie: er is geen significant verschil tussen deze spelers.

b

De overschrijdingskans is in dat geval kleiner dan `1/2 * α` en dus wordt `text(H)_0` verworpen.

De centrale limietstelling geeft aan dat de verdeling van steekproefgemiddelden altijd smaller is (dichter rondom het gemiddelde van de verdeling) dan de verdeling van het populatiegemiddelde. Dat betekent dat een verschil tussen twee steekproefgemiddelden ook sneller uitzonderlijk groot is dan het verschil tussen twee populatiegemiddelden.

Opgave 19
a

Bekijk de figuur. De cumulatieve relatieve frequentiepolygoon van de vaders ligt boven die van de zonen: dat betekent dat meer vaders een kleinere lengte hebben dan zonen. Echter: vanaf `185` cm lopen de vaders en zonen weer gelijk.

Het verschilt dus wel en het verschilt ook niet: een echte maat aan dit verschil geven is niet mogelijk met de cumulatieve relatieve frequentie polygonen (tenzij je de vuistregels over `max V_(cp)` gaat gebruiken, ook al betreft het nu een kwantitatieve in plaats van een kwalitatieve variabele: dat is hier `16,7` % en de vuistregel zegt dat het dan een gering verschil betreft).

b

De boxen overlappen elkaar; de medianen liggen binnen de box van de ander, dus volgens de regels over verschillen tussen boxplots is het verschil tussen de vaders en de zonen gering.

Je ziet nu meteen dat de `50` % kortste zonen echt langer zijn dan de `25` % kortste vaders. Bovendien kun je nu een maat aan het verschil geven (maar dat is wel een vrij grove maatvoering).

c

Het zijn eigenlijk gepaarde waarnemingen dus een tekentoets is hier zeer passend.

Te toetsen hypothese: zijn de zonen langer dan hun vaders?

`X` is het aantal `+` , waarbij een `+` staat voor een zoon die langer is dan zijn vader.

`text(H)_0 : p = 0,5`

`text(H)_1 : p > 0,5`

De overschrijdingskans is `text(P)(X ge 7)` en `n = 11` .

Na berekening van de overschrijdingskans kun je een significantieniveau meegeven aan het wel/niet verschillend zijn van de lengtes tussen vaders en zonen.

Opgave 20

Volgens de steekproefboxplots is er een groot verschil terwijl de verschiltoets voor gemiddelden dit alleen zou concluderen bij een significantieniveau dat groter is dan `10` %.

Opgave 21
a

Voor deze bestemmingen geldt:

  • Ocean Beach: minimum temperatuur `72` gr.F, maximum temperatuur `83` gr.F en mediaan `77` gr.F

  • Serene Shores: minimum temperatuur `70` gr.F, maximum temperatuur `88` gr.F en mediaan `83` gr.F

  • Whispering Palms: minimum temperatuur `83` gr.F, maximum temperatuur `95` gr.F en mediaan `87` gr.F

  • Pelican Beach: minimum temperatuur `80` gr.F, maximum temperatuur `98` gr.F en mediaan `85` gr.F

b

Tussen Ocean Beach en Serene Shores is er een gering verschil.

Tussen Ocean Beach en Pelican Beach is er een groot verschil.

c

Whispering Palms, weinig spreiding, temperaturen altijd tussen `83` en `95` gr.F.

Opgave 22
a

Een bout en moer passen niet als de bout te dun is en ook niet als de bout te dik is.

b

`text(H)_0: mu_V = mu_M - mu_B = 0,02` en `text(H)_1: mu_V != 0,02`

c

`sigma = (sqrt(0,05^2 + 0,03^2))/(sqrt(100)) ~~ 0,006` . De `sqrt(n)` -wet is nodig, omdat er `100` keer een bout en een moer worden gepast, en de gegeven standaardafwijkingen die van de populatie zijn en niet van de steekproef van `100` .

d

De machines worden bijgesteld als in de steekproef het gemiddelde verschil kleiner is dan `0,009` of groter is dan `0,031` .

Opgave 23
a

`text(H)_0: p = 0,5`

`text(H)_1: p != 0,5`

`alpha = 0,05`

b

`text(P)(X < = 4 | n = 19 text( en ) p = 0,5) ~~ 0,0096 < 0,025` dus de nulhypothese mag worden verworpen en middel B werkt significant beter dan middel A.

verder | terug