Miksi bussi on aina keskimääräistä täydempi?
- Miksi kavereillasi on enemmän kavereita kuin sinulla?
- Miksi yökerhoissa on miesten mielestä mies-/naissuhde liian suuri; ja naisten mielestä toisinpäin?
- Miksi keskimäärin, lapsilta kysyttäessä, heidän perheessä on enemmän lapsia kuin maan keskiarvo?
Tarina:
Lähiöstä lähtee joka aamu 30 työntekijää busseilla kaupunkiin töihin. Siellä käy kolme bussia, ja jokainen lähtijä valitsee satunnaisesti yhden bussin.
Pertsan mielestä hänellä on aina huono tuuri, sillä yleensä hänen valitsemassa bussissa on enemmän kuin keskimäärin $10=30/3$ ihmistä. Miten se on mahdollista?
Ilman Pertsaa, kulkijoita on 29, joten keskimäärin bussissa on $29/3 = 9+\frac23$ ihmistä. Kun Pertsa tulee kyytiin, niitä on yksi enempi; $10+\frac23$; eli enemmän kuin ylempi keskiarvo $10=30/3$.
Selitys II.
Otetaan kahden ihmisen ja kahden bussin lähiö. $A$ ja $B$ valitsevat satunnaisesti toisen busseista. Todennäköisyydet ovat
- $1/4$: $A$ on bussissa 1 ja $B$ on bussissa 1.
- $1/4$: $A$ on bussissa 1 ja $B$ on bussissa 2.
- $1/4$: $A$ on bussissa 2 ja $B$ on bussissa 1.
- $1/4$: $A$ on bussissa 2 ja $B$ on bussissa 2.
Bussikuskilta saadaan bussien matkustajalukumäärät; ja klassisenkin todennäköisyyden perusteella ne ovat
- $p=1/4$: kaksi matkustajaa
- $p=1/2$: yksi matkustaja
- $p=1/4$: ei yhtään matkustajaa
Keskiarvo on siten
$\overline n=\frac14\times2 + \frac12\times1 +\frac14\times0 = 1$,
kuten voisi olettaa. Mutta, mitä $A$ näkee bussissa?
- Puolet ajasta hän näkee $B$:n (kaksi matkustajaa)
- Puolet ajasta vain itsensä (yksi matkustaja).
Siis keskiarvo $A$:n näkökulmasta on
$\overline n_A = \frac12 \times 2 + \frac12\times1 = 1+\frac12$
Eli enemmän! Täsmälleen sama tilanne saadaan $B$:lle! Siis $A$ ja $B$ kulkevat busseissa, joissa on keskimäärin $1,5$ matkustajaa, vaikka busseissa on keskimäärin vain $1$ matkustaja.
Syy tuohon näennäiseen paradoksiin on vääränläinen näytteistys (oversampling; parity paradox). Hävitimme tiedon bussista, jossa ei ollut yhtään matkustajaa kysymällä niiltä, jotka olivat busseissa. $A$ ja $B$ vaikuttavat keskiarvoon.
PS. juttu oli Udi Aharonin. Sieltä lisää mielenkiintoisia juttuja.