Születésnap-paradoxon
A Wikipédiából, a szabad lexikonból.
A születésnap-paradoxon azon a megállapításon alapszik, hogyha egy szobában 23-an vannak, akkor valamivel több, mint 50% az esélye annak, hogy legalább kettőjüknek ugyanarra a napra esik a születésnapja. Ha legalább 60 ember van a szobában (teremben), ugyanennek a valószínűsége több, mint 99%. Ez nem abban az értelemben paradoxon, hogy logikai ellentmondásra jutunk, hanem abban, hogy ellentmond az intuíció által sugalltaknak, a legtöbb ember ugyanis 50%-nál lényegesen alacsonyabbra becsüli a fenti esemény valószínűségét.
Tartalomjegyzék |
[szerkesztés] A valószínűség közelítő kiszámítása
A fenti esemény (és a hozzá hasonló) pontos valószínűségének kiszámítása klasszikus probléma, rendszeresen tanítják valószínűségszámítás-kurzusok részeként az egyetemeken.
A paradoxon megértéséhez kulcsfontosságú, hogy észrevegyük, noha kevés ember van a szobában, már így is nagyon sok pár van, akiknél a születésnapegyezést vizsgálni kell. 23 ember esetén 23 × 22 / 2 = 253 pár van, mindegyik pár egy lehetséges egyezés. Más szemszögből megközelítve: képzeljük el, hogy belépünk egy szobába, ahol már 22-en vannak, és azt vizsgáljuk, hogy a közülük valakinek ugyanakkor van-e a születésnapja, mint nekünk. Ez természetesen sokkal kisebb, mint 50%. A születésnap-paradoxon azonban azt kérdezi, hogy bármelyik két embernek a huszonháromból megegyezik-e a születésnapja.
A valószínűség közelítő kiszámításához elhanyagolunk pár részletet, így a szökőéveket, azt, hogy az emberek között lehetnek ikrek, valamint a különböző születési statisztikákat, ehelyett feltesszük, hogy ha valakinek nem ismerjük a születésnapját, akkor az a 365 napos év minden napján azonos valószínűséggel születhetett.
Az ötlet a következő: először számoljuk ki, hogy mi a valószínűsége annak, hogy n emberből mindenki más napon született:
mert ha (tetszőlegesen) sorbaállítjuk az embereket, akkor a másodiknak nem lehet ugyanakkor a születésnapja, mint az elsőnek (364/365), a harmadiknak nem lehet ugyanakkor, mint az első kettőnek (363/365), és így tovább. A faktoriális jelölést használva ugyanezt így is felírhatjuk:
Ezek után 1 − p annak a valószínűsége, hogy legalább két embernek egy napra esik a születésnapja. n = 23-ra ez az érték kb. 0.507.
Vegyük észre, hogy a két embert nem választjuk ki elsőre. Ha az a kérdés, hogy milyen valószínűséggel van n emberből legalább egynek ugyanakkor a születésnapja, mint egy konkrét embernek, akkor a válasz:
ami n = 22-re kb. 0.059, vagyis csak kicsivel több, mint 1/17. Ahhoz, hogy ennek a valószínűsége legyen több, mint 50%, nem 22, hanem 253 emberre lenne szükség!
A születésnap-paradoxon általánosítva értelmezhető hashfüggvényekre is: N-bites lenyomatokból (hashértékekből) valószínű ütközés nélkül sajnos nem 2N, hanem csak kb. 2N/2 generálható. Ezt használja ki az ún. születésnap-támadás különböző hashfüggvényeken alapuló titkosító algoritmusok ellen.
[szerkesztés] A paradoxon analitikus megközelítése
Így ír önéletrajzában Halmos Pál Richárd magyar származású matematikus:
- „A probléma megközelítésének egyik módja, hogy megfordítva tesszük fel a kérdést: »Legalább hány embernek kell a szobában lennie ahhoz, hogy kevesebb, mint 1/2 valószínűséggel legyen csupa különböző születésnapjuk?« [...] a probléma lényegében a következő: találjuk meg a legkisebb n-et, amire”
- A szorzat felülről becsülhető a következőképpen:
- Az első felső becslés a mértani és a számtani közepek közötti összefüggésből következik. Ez ismét becsülhető a határozott integrál definícióját felhasználva, amelynek analitikus módon kiszámított értéke pedig ismét felülről becsülhető az 1 − x < e−x összefüggést alapul véve. [...] Az bizonyítás olyan fontos eszközöket használ fel, amellyel minden matematikát tanulónak illik elsajátítania. Csodálatos példája annak, hogy tisztán gondolkodással mennyi számítástól megkímélhetjük magunkat: az egyenlőtlenségek egy-két perc alatt felírhatók, míg a szorzatok kiszámítása lényegesen több időt venne igénybe, és a hibázás lehetősége is nagyobb lenne, akár papíron-ceruzával, akár számítógéppel végezzük. A számológép hasznos eszköz, de nem segít a probléma mélyebb megértésében, matematikai képességek elsajátításában, sem összetettebb, általánosabb elméletek megalkotásában.”
[szerkesztés] Hiba Halmos bizonyításában
A fenti érvelésbe sajnos hiba csúszott, szerencsére nem végzetes. A
egyenlőtlenség bizony hibás, amint az számítással egyszerűen ellenőrizhető. De az érvelés korrigálható. A
szorzatban az első tényező értéke 1, ezért elhagyható. Innen
ahol az első egyenlőtlenség ismét számtani és mértani közepek egyenlőtlensége, a második pedig az 1 − x < e−x összefüggésből következik.
Az utolsó kifejezés értéke akkor és csak akkor kisebb, mint 1/2, ha
Ez „alig” kevesebb, mint 506, amelyel az n2 − n kifejezés pontosan n = 23 esetén egyenlő.
[szerkesztés] Kísérleti ellenőrzés
A születésnap-paradoxon jól szimulálható számítógépprogram segítségével. A következő parancs a Ruby programozási nyelv segítségét veszi igénybe:
ruby -e 'puts (1..30).collect {rand(365)+1}.uniq.length'
ahol 30 az emberek száma, 365 pedig az egy évbe eső napok száma. Ha az eredmény (szintén egy szám) megegyezik az emberek számával (tehát ez esetben 30-cal), akkor mindenkinek más-más napon van a véletlenül sorsolt születésnapja. Ha kisebb, akkor voltak egyezések (méghozzá pontosan annyi, amennyi a különbség a kiírt és az eredeti szám között).
A következő kódrészlet Perl programozási nyelven íródott. Ez kilistázza azokat a számokat, amelyek a generált számsorban ismétlődnek.
perl -e 'for (1..23) {$h{int(rand(365)+1)}++}; for (keys %h) {print $_, ": ", $h{$_}, " times\n" if $h{$_} > 1}'
[szerkesztés] Külső hivatkozás
- A paradoxon kísérleti igazolása Java applet segítségével (angol nyelvű)