Conclusies trekken > Totaalbeeld
123456Totaalbeeld

Testen

Opgave 1
voorkeurshand
geslacht links rechts
man 5 29
vrouw 2 30

Op de Universiteit van Leiden is een onderzoek gedaan onder een groep studenten. Hierbij werden onder andere de lichaamslengte en de armlengte van de studenten gemeten. Ook werden het geslacht, de kleur van de ogen en de voorkeurshand genoteerd. In totaal ging het om `34` mannelijke studenten en `32` vrouwelijke studenten. Enkele resultaten zie je in deze tabel. Op basis van resultaten van dit onderzoek wil men uitspraken doen over alle mannelijke en vrouwelijke studenten in Leiden.

a

Noem de variabelen uit de tabel en geef van elk van de variabelen aan of deze nominaal of ordinaal is. Licht je antwoord toe.

b

Bepaal met behulp van het formulekaart of het verschil in voorkeurshand tussen de mannelijke en de vrouwelijke studenten in het onderzoek groot, middelmatig of gering is.

In de tabel hieronder staan het gemiddelde en de standaardafwijking van de lichaamslengte van de studenten.

lichaamslengte (cm)
geslacht aantal gemiddelde standaardafwijking
man 34 183,8 5,8
vrouw 32 170,8 8,1

Op basis van deze tabel kunnen voor de lichaamslengte van mannen en vrouwen `95` %-betrouwbaarheidsintervallen worden opgesteld.

c

Onderzoek welk van deze twee intervallen het smalst is. Welke informatie geeft zo'n `95` %-betrouwbaarheidsinterval in deze context?

Iemand die iets wil zeggen over de grootte van het verschil in lichaamslengte tussen de mannen en de vrouwen in het onderzoek, zou gebruik kunnen maken van de effectgrootte. Bij de berekening van de effectgrootte zijn de gemiddeldes en standaardafwijkingen van beide groepen van belang. Ga ervan uit dat het verschil van de gemiddeldes gelijk blijft.

d

Leg uit op welke wijze grotere standaardafwijkingen de grootte van het verschil (groot, middelmatig, gering) kunnen beïnvloeden.

De resultaten van de lichaamslengtes werden ook in boxplots verwerkt. Zie figuur 1.

figuur 1

Je kunt met behulp van de gegevens over de lichaamslengtes in de tabel bij c onderzoeken hoe groot het verschil in lichaamslengte in het onderzoek is. Dit kun je ook doen met behulp van de gegevens in figuur 1.

e

Toon met behulp van het formulekaart aan dat je met deze twee gegevensbronnen een verschillende conclusie trekt over de grootte van het verschil in lichaamslengte tussen de mannelijke en de vrouwelijke studenten.

f

Beargumenteer welk van beide conclusies het best te verdedigen is.

figuur 2

Om te onderzoeken of er een verband bestaat tussen de lichaamslengte en de armlengte van de studenten zijn de resultaten van het onderzoek in een spreidingsdiagram gezet. Zie figuur 2. Er blijkt in dit onderzoek bij benadering een lineair verband te zijn tussen de lichaamslengte `L` in centimeter en de armlengte `A` in centimeter. De getekende trendlijn geeft dit verband weer.

g

Stel een formule op van de trendlijn.

De punten in het spreidingsdiagram liggen niet precies op de trendlijn. Ga ervan uit dat de armlengte normaal verdeeld is bij alle mogelijke lichaamslengtes tussen `150` cm en `200` cm en dat bij elke lichaamslengte de standaardafwijking van de bijbehorende armlengte gelijk is aan `3` cm. Als we de resultaten van dit onderzoek gebruiken om op basis van de lichaamslengte de armlengte van studenten te voorspellen, kunnen we hierbij figuur 2 gebruiken.

h

Hoe kun je in figuur 2 het gebied waar de middelste `95` % van de armlengten ligt voor elk van de lichaamslengten tussen `150` en `200` cm aangeven?

bron: voorbeeldexamenopgaven statistiek wiskunde A

Opgave 2

In de Verenigde Staten is het gebruikelijk dat je in een restaurant een flinke fooi geeft aan degene die je bedient. Het basisloon is er zeer laag en daardoor is het bedienend personeel veel meer afhankelijk van fooien dan in Nederland. In New York bestudeerde een onderzoeker welke fooien er gegeven werden bij `500` rekeningen in restaurant A en `500` rekeningen in restaurant B.

In de figuur zijn de cumulatieve relatieve frequentiepolygonen van de fooien van de restaurants A en B getekend.

a

In welk restaurant werd in totaal meer fooi gegeven? Licht je antwoord toe.

b

In welk restaurant werden er relatief meer fooien tussen de `6` en de `8` dollar gegeven? Licht je antwoord toe.

Ruim driekwart van de fooien in restaurant B is hoger dan de `75` % laagste fooien van restaurant A.

c

Leg uit hoe je dit in de figuur terug kunt vinden.

Op grond van de figuur kun je met behulp van het formulekaart met twee verschillende vuistregels een uitspraak doen over het verschil tussen de fooien in restaurant A en die in restaurant B.

d

Beschrijf hoe je met twee verschillende vuistregels dit verschil kunt bepalen en geef bij beide de conclusie: is het verschil groot, middelmatig of gering?

bron: voorbeeldexamenopgaven statistiek wiskunde A

Opgave 3

figuur 1

Vulkanen kunnen heel lang niet actief zijn. Dan zijn er geen erupties (uitbarstingen). Tijdens een actieve periode van een vulkaan zijn er wel erupties. Bij een eruptie komt er gesmolten steen, gas en as uit de vulkaan. Dat duurt een tijdje. Daarna is de vulkaan weer rustig, totdat de volgende eruptie begint.

Je bekijkt in deze opgave één actieve periode van één vulkaan. De actieve periode start bij de eerste eruptie. Wetenschappers hebben tijdens deze actieve periode gemeten:

  • hoelang iedere eruptie duurt: de eruptieduur;

  • hoelang de vulkaan rustig is tot de volgende eruptie begint: de tussentijd tot de eerstvolgende eruptie.

Tijdens deze actieve periode was de langste tijd tussen twee erupties `108` minuten. Na de allerlaatste eruptie was de vulkaan weer lange tijd rustig.

De eruptieduur is gemeten in tienden van een minuut nauwkeurig en de tussentijd in gehele minuten. De metingen zijn verwerkt in een puntenwolk. De eruptieduur `E` staat langs de horizontale as, de tussentijd tot de eerstvolgende eruptie `T` staat langs de verticale as.

Het meest linkse punt in de figuur hoort bijvoorbeeld bij een eruptie die `0,8` minuten duurde en waarna de vulkaan `49` minuten rustig was. In deze actieve periode zijn er `184` erupties geweest. De eerste `183` zijn weergeven in het figuur. De allerlaatste eruptie van deze actieve periode duurde `1,7` minuten.

a

De allerlaatste eruptie van een actieve periode kan niet in de puntenwolk worden weergegeven. Waarom niet?

In de figuur zijn de gegevens verwerkt van alle erupties, waarbij zowel de eruptieduur als de tussentijden tussen de erupties verwerkt zijn. Op basis van deze figuur is ook een schets te maken van de verdeling van de eruptieduur.

b

Maak deze schets, met op de horizontale as de eruptieduur en op de verticale as het aantal erupties. Je hoeft hierbij niet het aantal erupties per eruptieduur exact te tellen, het gaat om een schets.

Iemand beweert op basis van deze schets van de eruptieduur te kunnen bepalen wat de standaardafwijking is van de eruptieduur. Hij doet dit door gebruik te maken van een van de vuistregels van de normale verdeling. Hij berekent het tijdsverschil tussen de langste eruptieduur en de kortste eruptieduur en deelt deze uitkomst door `6` . De uitkomst van deze berekening beschouwt hij als een schatting van de standaardafwijking.

c

Ben jij het met deze werkwijze eens? Geef duidelijk aan wat daarbij je argumenten zijn.

d

Je kunt voor de `184` erupties de gemiddelde duur van de tussentijd `T` schatten. Met behulp van dit gemiddelde kun je een schatting maken van de lengte van de actieve periode van de vulkaan. Maak een schatting van de gemiddelde tussentijd tot de volgende eruptie en toon hiermee aan dat deze actieve periode van de vulkaan langer dan een week heeft geduurd.

figuur 2

In figuur 2 is een lijn getrokken die zo goed mogelijk bij de metingen past. Deze lijn gaat door de punten `(2, 56)` en `(5, 90)` . Met behulp van deze lijn kun je bij een gegeven eruptieduur een grove schatting maken voor de tussentijd die je daarbij kunt verwachten.

e

Bereken met behulp van de getrokken lijn uit dit figuur wat de geschatte tussentijd is bij een eruptieduur van `6` minuten.

Ga ervan uit dat de tussentijden bij een eruptietijd van `4,5` minuten normaal verdeeld zijn met een standaard­afwijking van 4 minuten. Je kunt dan met een betrouwbaarheid van `95` % aangeven tussen welke twee waarden de tussentijd tot de eerstvolgende eruptie zal liggen bij een eruptieduur van `4,5` minuten.

f

Geef deze twee waarden.

g

Piet beweert op basis van de gegevens uit de figuur te kunnen concluderen dat de eruptieduur groter wordt naarmate de tussentijd tussen twee erupties groter is. Harm is het niet met Piet eens. Geef een argument dat Harm kan gebruiken om Piet te overtuigen van zijn ongelijk.

bron: voorbeeldopgave Statistiek syllabus havo A, ontleend aan examenopgave havo A1,2 2008 - II

Opgave 4

In een onderzoek onder `199` echtparen is onder meer gevraagd naar de lengte en de leeftijd van de man en de vrouw. Er werd onder andere onderzocht of er bij bepaalde eigenschappen van de gehuwden sprake was van een bepaalde statistische samenhang. Dit heeft geresulteerd in de volgende twee puntenwolken:

De rechter puntenwolk heeft betrekking op de leeftijden van de twee huwelijkspartners, waarbij de gegevens van de man op de horizontale as zijn uitgezet en die van de vrouw op de verticale as. De linker puntenwolk heeft betrekking op de lengte van beide partners. Ook hier zijn de gegevens van de man weer op de horizontale as uitgezet.

a

Waarom kun je door de rechter puntenwolk het beste een trendlijn tekenen?

b

Schets een trendlijn en stel de vergelijking op.

c

Teken de trendlijn in de figuur. Gebruik het werkblad.

d

Met welke trendlijn kun je het beste een voorspelling doen over de lengte of leeftijd van de vrouw als je die van de man weet? Hoe komt dat?

In de tabel is een aantal kentallen weergegeven uit het onderzoek.

leeftijd man

(jaren)

leeftijd vrouw

(jaren)

lengte man

(cm)

lengte vrouw

(cm)

gemiddelde 42,6 40,7 173 160
minimum 20 18 156 141
maximum 64 64 195 176
standaardafwijking 11,6 11,4 6,9 6,2
e

Bereken voor de leeftijden en de lengtes de effectgrootte om het verschil tussen mannen en vrouwen te vergelijken. Rond af op twee decimalen.

effectgrootte `= (m_1 −m_2)/(1/2⋅(s_1+s_2))`

`m_1` en `m_2` zijn de gemiddelden; `s_1` en `s_2` zijn de de standaardafwijkingen.

Kies `m_1` als grootste van de twee gemiddelden.

naar: voorbeeldopgave Statistiek syllabus havo A

verder | terug