Bekijk het bestand TK-Verkiezingen-NL-2012.
Je ziet hier een kruistabel waarin de variabelen "Links_rechts_zelfplaatsing" en "Conservatief_progressief_zelfplaatsing" zijn weergegeven.
Dit zijn twee kwalitatieve variabelen die echter wel in getallen zijn uitgedrukt. Daarom kun je beide variabelen ook in een puntenwolk tegen elkaar uitzetten.
Wat gaat er dan fout?
Je krijgt wel een plaatje met punten, maar geen inzicht hoeveel mensen er bij elk punt horen. Dit komt vooral omdat het aantal mogelijke waarden klein is ( `1` t/m `10` ) en de steekproef behoorlijk groot ( `1550` mensen).
In de kruistabel zie je bijvoorbeeld dat de combinatie `(7, 4)` wel `81` keer voorkomt en de combinatie `(2, 4)` maar `1` keer.
De gegeven trendlijn en correlatiecoƫfficiƫnt zijn echter wel gebaseerd op alle combinaties, ook al zie je die niet terug in je puntenwolk.
Bekijk in
Waarom geeft de kruistabel dit beter weer dan het spreidingsdiagram?
Laat zien dat je een correlatie krijgt die nogal klein is. Is dat in overeenstemming met je kruistabel?