Werken met data > Data ordenen
12345Data ordenen

Uitleg

Het woord statistiek ontstond in de tijd van Napoleon, toen het bestuur van de verschillende Europese staten (in de achttiende eeuw) zo ingewikkeld werd dat een nauwkeurige kennis van staatszaken belangrijk werd.

Tegenwoordig moet je dat wat ruimer opvatten: ook bedrijven, onderzoeksinstellingen en particulieren buiten de overheid verzamelen en ordenen gegevens en doen dus aan statistiek. Die gegevens worden in de vorm van tabellen, diagrammen, kaarten of een combinatie daarvan overzichtelijk weergegeven. Op de website van het CBS (Centraal Bureau voor de Statistiek) vind je hier veel voorbeelden van.

In de figuur van Minard gaat het om de soldaten van het Franse leger dat onder Napoleon naar Moskou trok. Deze soldaten vormen de elementen van een statistisch onderzoek naar hun wel en wee. Napoleons leger was de onderzochte populatie. Een van de onderwerpen van het onderzoek was het aantal soldaten afhankelijk van de vordering van de tocht. Dit aantal soldaten was een van de statistische variabelen die Minard onderzocht. De gegevens omtrent het aantal soldaten op een bepaald punt tijdens de tocht vormen de door Minard verzamelde data. Data zijn dus statistische gegevens. In Minards diagram zijn ook data over andere variabelen te vinden.

Bij het ordenen en weergeven van de data heeft de onderzoeker meestal een bepaald doel. Minard wilde kennelijk de verschrikkingen van deze veldtocht van Napoleon in beeld brengen. Hij heeft daarom de vorm van zijn diagram zo gekozen dat duidelijk zichtbaar wordt hoeveel kleiner het leger telkens werd tijdens de veldtocht.

Opgave 1

Bekijk in de Uitleg de gegevens uit Minards diagram over de veldtocht van 1812. (Door te klikken krijg je een grotere figuur.)

a

Welke variabelen zijn in het diagram terug te vinden?

b

Het grootste deel van Minards diagram heeft de vorm van een kaart. Welk voordeel heeft die keuze? En welk nadeel?

c

Welke variabele wordt vooral als nadere toelichting op de grote sterfte onderzocht?

Opgave 2

Open het bestand met data van de Nederlandse bevolking zoals dat in juli 2009 te vinden was op de website van het CBS.

a

Waarom staat achter het jaartal 2009 een sterretje? Zoek eventueel op het tabblad "Beschrijving" .

b

Over welke populatie gaat deze tabel?

c

Wat zijn de elementen van de populatie als het gaat over "bevolking" ? En wat zijn de elementen als het gaat over "huishoudens" ?

d

Over welke variabelen gaat het bij "bevolking naar geslacht" ?

e

Over welke variabelen gaat het bij "particuliere huishoudens" ?

f

Wat stelt de "bevolkingsdichtheid" voor? Wat betekent de toename van de bevolkingsdichtheid?

g

Hoe komt het dat het totale aantal Nederlanders gedeeld door de bevolkingsdichtheid niet voor elk jaar hetzelfde getal is? Geef minstens twee verklaringen.

verder | terug