Il massimo ritardo medio dei numeri del Lotto - digiTANTO.it
Il massimo ritardo medio dei numeri del Lotto - digiTANTO.it
Il massimo ritardo medio dei numeri del Lotto - digiTANTO.it
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
a cura di Francesco Romani<br />
<strong>Il</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong><br />
<strong>dei</strong> <strong>numeri</strong> <strong>del</strong> <strong>Lotto</strong><br />
Questo problema è sorto da alcune discussioni che si sono svolte<br />
sull'area Matenigmici (di MC-Link) e su altre aree di discussione <strong>it</strong>aliane.<br />
Lo spunto me lo ha dato il buon Dani Ferrari che lungi dal prendersela<br />
per la mia intrusione su cavalli e cani mi ha riversato addosso quasi<br />
un Megabyte di idee e messaggi. Gran parte <strong>del</strong> materiale che presento<br />
è frutto <strong>del</strong>le discussioni di Dani, Elio Fabri e Adam Atkinson, amici<br />
che i lettori <strong>del</strong>la rubrica Intelligiochi ormai ben conoscono<br />
e che qui ringrazio caldamente.<br />
<strong>Il</strong> Problema<br />
Con il vistoso sviluppo di giochi come il <strong>Lotto</strong> ed il Superenalotto<br />
ha ripreso vigore la annosa polemica tra i "r<strong>it</strong>ardisti"<br />
ovvero quelli che pensano" se qualcosa deve succedere prima<br />
o poi, e la aspetto da un po', adesso devo aspettare di<br />
meno" (la definizione è di Adam) e gli anti-r<strong>it</strong>ardisti che basano<br />
le loro argomentazioni sull'indipendenza <strong>del</strong>le successive<br />
estrazioni (e sulla conoscenza <strong>del</strong> calcolo <strong>del</strong>le probabil<strong>it</strong>à).<br />
Ho gia dedicato un articolo (MC n. 173, Maggio 1997)<br />
al problema <strong>del</strong> <strong>Lotto</strong> (cercando di dimostrare con varie simulazioni<br />
la totale inconsistenza <strong>del</strong>la teoria <strong>dei</strong> r<strong>it</strong>ardi) e<br />
Dani ne sta preparando un altro molto più completo.<br />
Quello di cui mi voglio occupare qui è un problema marginale,<br />
più tecnico, ma decisamente interessante: il problema<br />
<strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong>. Nel 1937 l'Ing. Samar<strong>it</strong>ani, nel<br />
libro" La teoria e il calcolo matematico <strong>dei</strong> r<strong>it</strong>ardi. Studio<br />
teorico e pratico sul giuoco <strong>del</strong> <strong>Lotto</strong>" cerca di stimare teoricamente<br />
qual è il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> che possiamo mediamente<br />
aspettarci di trovare se consideriamo una sequenza<br />
di n estrazioni (il che, evidentemente, è cosa ben diversa<br />
dal <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico che è sempre e comunque n).<br />
Samar<strong>it</strong>ani, con procedimenti poco convincenti, stabilisce la<br />
seguente formula:<br />
166<br />
(17/18)r =l/n ovvero r = 17.495 ... Log[n).<br />
(come sempre Log[n) indica il logar<strong>it</strong>mo naturale).<br />
Facciamo alcune considerazioni iniziali:<br />
•<br />
•<br />
•<br />
•<br />
•<br />
p=1I18 è la probabil<strong>it</strong>à che un particolare numero su 90<br />
sia estratto in una estrazione di 5 <strong>numeri</strong>;<br />
q=1-p=17/18 è la probabil<strong>it</strong>à che un particolare numero<br />
su 90 non sia estratto in una estrazione di 5 <strong>numeri</strong>;<br />
il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico su n estrazioni è, ovviamen-<br />
te, n e ha probabil<strong>it</strong>à qn di presentarsi (un po' bassina<br />
per n grande! i);<br />
se il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico t(n) fosse minore di n e un<br />
numero dopo n settimane tardasse proprio di t(n), allora<br />
quel numero dovrebbe uscire" certamente" la settimana<br />
successiva (la follia di una tale affermazione mi<br />
pare evidente);<br />
il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> "storico" <strong>del</strong> lotto <strong>it</strong>aliano sembra<br />
sia 202.<br />
MCmicrocomputer n. 191 - gennaio 1999
Figura 1<br />
200 400 600 800 1000 1200<br />
Nel segu<strong>it</strong>o prendiamo in considerazione n estrazioni di 5<br />
<strong>numeri</strong> su una ruota e definiamo:<br />
mr1(n) il valore atteso <strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> (ovvero<br />
la media <strong>dei</strong> massimi r<strong>it</strong>ardi che si presentano) di un numero<br />
prefissato;<br />
rj(x,n) il numero di r<strong>it</strong>ardi di lunghezza x di un numero pre-<br />
fissato;<br />
mra(n) il valore atteso <strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> di un<br />
numero qualsiasi;<br />
rj(x,n) il numero di r<strong>it</strong>ardi di lunghezza x di un numero qual-<br />
siasi.<br />
Mo<strong>del</strong>lo probabilistico<br />
per un numero<br />
<strong>Il</strong> mo<strong>del</strong>lo che segue è stato messo a punto da Elio (risultati<br />
simili per altra via sono stati ottenuti anche da Adam).<br />
Sia g [n, r] la probabil<strong>it</strong>à che entro la n-esima estrazione ci<br />
sia stato almeno un <strong>r<strong>it</strong>ardo</strong> di lunghezza almeno r.<br />
Questo evento si verifica se e solo se il <strong>r<strong>it</strong>ardo</strong> r si è presentato<br />
almeno una volta in qualcuna <strong>del</strong>le estrazioni tra 1<br />
ed n-l, oppure se si presenta alla n-esima estrazione.<br />
Valgono le condizioni iniziali:<br />
In{1]:=<br />
g[n_,r_]:=O/; n
2<br />
-2<br />
-4<br />
-6<br />
-8<br />
10<br />
Figura 2<br />
Out[4]=<br />
-40.7291 + 17.463 Log[x]<br />
La bontà <strong>del</strong> f<strong>it</strong> (in blu) rispetto ai valori teorici (in giallo) è<br />
evidente dal grafico di Figura 1.<br />
Conteggio <strong>dei</strong> r<strong>it</strong>ardi<br />
per un numero<br />
Ora studiamo una stima asintotica (cioè che vale per x ed n<br />
grandi) di rj(x,n).<br />
Si nota che:<br />
2 rj(x,n/2) ~ rj(x,n) ~ 2rj(x,n/2) + 1<br />
E quindi, la dipendenza da n può essere solo lineare.<br />
Supponiamo ora di avere aspettato un numero<br />
per x-1 estrazioni, la probabil<strong>it</strong>à che non si presenti<br />
alla successiva è p=1-q e questa probabil<strong>it</strong>à deve<br />
coincidere con il rapporto tra il numero atteso di r<strong>it</strong>ardi<br />
lunghi x e il numero totale di r<strong>it</strong>ardi attesi (infatti<br />
quel numero o r<strong>it</strong>arda x oppure x+1 oppure<br />
x+2 ...). Quindi indipendentemente da n e da x deve<br />
valere:<br />
rj·(x,n)<br />
-oo---=p=l-q<br />
168<br />
Lrj(i,n)<br />
I=X<br />
120<br />
110<br />
100<br />
90<br />
80<br />
70<br />
Figura 3<br />
che è una relazione ricorrente di ordine infin<strong>it</strong>o.<br />
Sost<strong>it</strong>uiamo a rj(x,n) un'espressione <strong>del</strong> tipo n a<br />
b X e risolviamo con Mathematica 3.0 (chi sa l'analisi<br />
lo poteva fare anche a mano).<br />
In[2]:=<br />
l-q==n a bAx/SUm[n a bAi,{i,x,=}]<br />
Out[2]=<br />
1-q==1-b<br />
Vale allora rj(x,n)=n a b r e resta il problema di de-<br />
terminare a.<br />
Sia rj(i,x,n) il numero <strong>medio</strong> <strong>dei</strong> r<strong>it</strong>ardi di lunghezza<br />
esattamente x <strong>del</strong> numero j che si presentano in n<br />
estrazioni (ovvero 5 n <strong>numeri</strong>) ad un tempo t tale<br />
che t mod n = i.<br />
Per un dato numero j vale rj(i,x,n) = Floor[n/x) p2 qX.<br />
Si nota che se un <strong>r<strong>it</strong>ardo</strong> viene contato in un qualche<br />
rj(i,x,n) non può apparire in nessun altro rj(k,x,n) con k;éi.<br />
I possibili valori di i vanno da O a x+ 1 e trascurando il Floor<br />
e i problemi ai bordi si ottiene la stima finale:<br />
Ora si può vedere per quale valore di r il numero atteso di r<strong>it</strong>ardi<br />
lunghi r ha un valore costante C:<br />
In[1]:=<br />
Expand [PowerExpand [x/ •<br />
MCmicrocomputer n. 191 - gennaio 1999
200<br />
190<br />
180<br />
170<br />
160<br />
150<br />
140<br />
Figura 4<br />
2000 4000 6000 8000<br />
Solve[qAx p A 2 n == C,{x}] [[1]]]]<br />
Out[1J=<br />
-101.135 - 17.4952 Log[C] + 17.4952 Log[n]<br />
Si ottiene anche in questo caso un andamento <strong>del</strong> tipo<br />
mr1 (n) = a+ b log(n). resta però aperto il problema <strong>del</strong>la<br />
scelta di C.<br />
Vediamo l'accordo tra teoria e pratica.<br />
È stata fatta (in Pasca l) una simulazione <strong>del</strong> <strong>Lotto</strong> che prevedeva<br />
k blocchi di 10000 estrazioni ogni volta calcolando il<br />
valore vero e quello stimato di r1(x,10000) e mr1(10000)<br />
con k che variava tra 3000 e 50000 (ovvero nella prova più<br />
lunga è stata simulata per 50000 volte l'attiv<strong>it</strong>à di circa 100<br />
anni di una ruota <strong>del</strong> <strong>Lotto</strong>).<br />
La Figura 2 mostra il confronto tra valori teorici (in rosso) e<br />
reali (in giallo) di r1(x,10000) per k=50000.<br />
La Figura 3 mostra il confronto tra valori teorici (con<br />
C=1/30) e reali di mr1 (1 0000) per k=50000, la stima vale:<br />
mr1 (n) = -41.63+17.495 log(n).<br />
in ottimo accordo con quanto predetto dalla teoria di Elio.<br />
Conteggio <strong>dei</strong> r<strong>it</strong>ardi<br />
per tutti i <strong>numeri</strong><br />
Ripetendo il ragionamento visto prima e considerando che<br />
l'inizio <strong>del</strong> <strong>r<strong>it</strong>ardo</strong> è libero e ad ogni estrazione<br />
escono 5 <strong>numeri</strong> si ottiene la stima:<br />
r(x,n) = 5 n p qX<br />
che coincide con quanto ottenibile semplicemente<br />
tenendo conto che i <strong>numeri</strong> sono 90 ed ognuno fa<br />
la sua parte. Per stimare quale è l'andamento tipico<br />
<strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> in funzione di n si può<br />
vedere per quale valore di r il numero atteso di r<strong>it</strong>ardi<br />
lunghi r ha un valore costante C.<br />
In[1]:=<br />
Expand [PowerExpand [xl.<br />
Out[1J=<br />
-22.4102<br />
10000 Log [n]<br />
Solve[S qAx p n == c, {x}] [[1]]]]<br />
17 .4952 Log [C] + 17. 4952<br />
La nostra stima prevede quindi una differenza di<br />
circa 80 un<strong>it</strong>à tra il <strong>r<strong>it</strong>ardo</strong> di un numero fissato e quello di<br />
un numero qualsiasi.<br />
La Figura 4 mostra il confronto tra valori teorici (con<br />
C=1/30) e reali di mra(10000) per k=50000.<br />
L'approssimazione comincia a divenire buona per valori<br />
grandi di n in quanto nelle prime estrazioni il numero <strong>dei</strong> r<strong>it</strong>ardi<br />
cresce in modo lineare e non logar<strong>it</strong>mico (per esempio<br />
alla 4" estrazione vi sono certamente almeno 70 <strong>numeri</strong> che<br />
r<strong>it</strong>ardano da 4 settimane).<br />
Conclusioni<br />
Riassumendo abbiamo visto quanto segue:<br />
•<br />
•<br />
•<br />
il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico vale n (con probabil<strong>it</strong>à qn)<br />
il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> di un numero qualunque può<br />
essere stimato con mra(n) = 37.09+17.495 log(n] circa<br />
37 un<strong>it</strong>à in più di quanto indicato dal Samar<strong>it</strong>ani<br />
le stime sono in buon accordo con gli esperimenti<br />
• la variabil<strong>it</strong>à è abbastanza alta: su 50000 prove il massi-<br />
mo <strong>r<strong>it</strong>ardo</strong> ottenuto in 10000 estrazioni è stato 411,<br />
contro un valore <strong>medio</strong> previsto e verificato di 198.2.<br />
Queste stime quindi hanno solo un valore speculativo<br />
ma non possono certo prevedere quello che succederà<br />
ai giocatori.<br />
Resta aperto il problema di quali considerazioni teoriche<br />
possano giustificare il valore C=1/30.<br />
MCmicrocomputer n. 191 - gennaio 1999 169