Beschrijvende statistiek > Centrummaten
123456Centrummaten

Uitleg

In een laboratorium wordt de hoeveelheid eiwit in eiersalade gemeten. Van een bepaalde fabrikant worden `20` kuipjes eiersalade onderzocht. Er gaan drie laboranten mee aan het werk. Van dezelfde `20` kuipjes meten ze onafhankelijk van elkaar het eiwitgehalte. Je ziet hiernaast de resultaten.

Je wilt deze resultaten kunnen vergelijken. Zo is dat nogal lastig, zeker als de datasets groter worden. Een manier is het gebruik van frequentietabellen en diagrammen. Maar je kunt ook werken met centrummaten. Dan vat je de meetgegevens met één getal samen.
Er worden drie van die centrummaten gebruikt:

  • de modus: de meest voorkomende waarde (bij een klassenindeling zeg je: modale klasse);

  • de mediaan: de middelste waarde als de gegevens op volgorde van grootte staan;

  • het gemiddelde: alle waarden opgeteld en gedeeld door het totaal aantal waarden.

Bij laborant A zijn de modale eiwitgehaltes `65` % en `66` %, is de mediaan `65` % en is het gemiddelde eiwitgehalte `65,2 ~~ 65` %.
Je noteert het gemiddelde van een steekproef wel als `bar(x) = (x_1 + x_2 + ... + x_n)/n = (sum_(i=1)^n x_i)/n` .
In plaats van `x` mag je natuurlijk ook een andere letter gebruiken, zoals `E` voor eiwitgehalte.
De mediaan is het middelste getal in een boxplot.

Al deze centrummaten zeggen iets over de juistheid van de metingen. Als bijvoorbeeld het gemiddelde van de steekproef `bar(x)` afwijkt van het werkelijke gemiddelde `mu` van de populatie, dan is de juistheid `|bar(x) - mu|` , waarbij de verticale streepjes aangeven dat dit getal altijd positief wordt genomen.

Opgave 1

Bekijk de Uitleg . Je ziet meetgegevens van drie laboranten. De gemiddelde eiwitgehaltes zijn:

  • Laborant A: `65,20 ~~ 65` %.

  • Laborant B: `64,95 ~~ 65` %.

  • Laborant C: `67,25 ~~ 67` %.

Je kunt deze getallen zelf narekenen.

a

Doe dat (als je dit bij Verkennen V1 nog niet hebt gedaan) en leg uit wat deze gemiddelden met de juistheid van de metingen te maken hebben.

Neem aan dat van de totale populatie kuipjes eiersalade van deze fabrikant het eiwit gehalte `65` % is.

b

Hoe zit het nu met de juistheid van de metingen?

Je ziet de gegevens ook in de vorm van boxplots terug.
Een boxplot maak je door de gegevens eerst op volgorde van klein naar groot te zetten en dan in vier delen met gelijke aantallen data te verdelen, in vier kwarten. De mediaan is de middelste waarde (of het gemiddelde van de middelste twee), het eerste kwartiel is de mediaan van de eerste helft en het derde kwartiel de mediaan van de tweede helft.

Laborant C ijkt zijn meetinstrument en doet de meting opnieuw. Bekijk de resultaten.

c

Maak zelf een boxplot van deze controlemeting. Is het resultaat preciezer of juister?

Opgave 2
a

Is het gemakkelijk om uit de figuur het gemiddelde, de modus en de mediaan van deze gegevens te bepalen?

b

Bereken de gemiddelde voetlengte, de modale voetlengte en de mediaan van de voetlengtes van deze mannen.

In het bijgevoegde bestand vind je ook de voetlengtes van `100` vrouwen.
Met behulp van boxplots kun je de voetlengtes van de mannen en de vrouwen met elkaar vergelijken.

b

Maak deze twee boxplots.

c

Kun je door deze boxplots te vergelijken conclusies trekken?

d

Bereken de drie centrummaten bij de voetlengtes van de vrouwen.
Wat hebben die voor invloed op je conclusies?

Opgave 3

Je hebt gezien dat centrummaten bij kwantitatieve variabelen betekenis hebben.
Maar hoe zit het met kwalitatieve variabelen?

a

Bij de zetelverdeling in de Tweede Kamer heb je te maken met de kwalitatieve variabele "partij" , de behaalde zetels zijn de frequenties.
Hebben de centrummaten hier betekenis?

b

Bij het keuren van een bepaalde drank kan het gaan om variabelen als "geur" , "smaak" , etc.
Heb je hier iets aan de centrummaten?

c

Veel bedrijven (met name in de horeca) vragen om hen te waarderen met een cijfer.
En dan zie je op hun website een gemiddelde van bijvoorbeeld `8,3` staan. Is dat een zinnig getal?

verder | terug