Veel statistische variabelen kunnen alle reële waarden (tussen bepaalde grenzen) aannemen. Bij hun frequentieverdelingen worden dan de waarnemingen in klassen gegroepeerd. Dat is lastig als je wilt weten hoeveel procent van de waarnemingen ligt tussen grenzen die geen klassengrenzen zijn.
Bij statistische variabelen zoals lengte, gewicht, inhoud, etc., hebben de relatieve
frequentiehistogrammen vaak de kenmerkende klokvorm. Zo'n klokvormig histogram benader
je met een normaalkromme die wordt bepaald door het gemiddelde µ en de standaardafwijking σ van de verdeling.
Je ziet hier zo'n normaalkromme met en .
Er geldt:
in de klasse zit (bij klassenbreedte ) % van de waarnemingen.
het totale gebied onder de normaalkromme is ;
het hoogste punt zit bij en bepaalt de spreiding;
hij is symmetrisch t.o.v. de lijn en nadert de -as als ver van af ligt;
vuistregel 1: ongeveer % van het gebied onder de normaalkromme ligt tussen en ;
vuistregel 2: ongeveer % van het gebied onder de normaalkromme ligt tussen en .
Je zegt wel dat de variabele normaal verdeeld is.