Als een bepaalde variabele `X` van het toeval afhangt, noem je `X` een toevalsvariabele, een stochast. Stochast komt van het Griekse "stochastikos" dat gissend of mikkend betekent. Bij elke waarde die `X` kan aannemen, kun je de bijbehorende kans berekenen (vanuit een kansboom of frequentietabel of een histogram).
Zet je al die kansen op een rij, bijvoorbeeld in een tabel, dan is dat een kansverdeling van `X` . Noem je bij het werpen met twee dobbelstenen het aantal zessen `X` , dan is `X` een voorbeeld van zo'n toevalsvariabele. De bijbehorende kansverdeling haal je uit de kansboom.
`x` | `0` | `1` | `2` |
`text(P)(X = x)` | `25/36` | `10/36` | `1/36` |
Ga na dat de som van alle kansen in zo'n kansverdeling `1` is.
Gemiddeld komt er per worp met twee dobbelstenen `0*25/36 + 1 * 10/36 + 2 * 1/36 = 12/36 = 1/3` keer een zes voor. Dat heet de verwachtingswaarde van het aantal zessen bij het werpen met twee dobbelstenen. Bij gemiddeld één op elke drie worpen (met twee dobbelstenen) komt een zes voor, als je maar vaak genoeg gooit.
Als je van twee toevalsvariabelen `X` en `Y` elk een kansverdeling hebt en bovendien alle gecombineerde kansen `text(P)(X=x text( en ) Y=y)` via een steekproef verzameld hebt, dan is het mogelijk om te bepalen of `X` en `Y` (on)afhankelijk van elkaar zijn.
`X`
en
`Y`
zijn onafhankelijk als voor alle gecombineerde kansen de algemene productregel voor kansen geldt:
`text(P)(X=x text( en ) Y=y) = text(P)(X=x) * text(P)(Y=y)`
.
Dit is onderdeel van de bivariate statistiek waarin je onderzoek doet naar mogelijke samenhang tussen twee toevalsvariabelen.