06.06.2013 Views

Il massimo ritardo medio dei numeri del Lotto - digiTANTO.it

Il massimo ritardo medio dei numeri del Lotto - digiTANTO.it

Il massimo ritardo medio dei numeri del Lotto - digiTANTO.it

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

a cura di Francesco Romani<br />

<strong>Il</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong><br />

<strong>dei</strong> <strong>numeri</strong> <strong>del</strong> <strong>Lotto</strong><br />

Questo problema è sorto da alcune discussioni che si sono svolte<br />

sull'area Matenigmici (di MC-Link) e su altre aree di discussione <strong>it</strong>aliane.<br />

Lo spunto me lo ha dato il buon Dani Ferrari che lungi dal prendersela<br />

per la mia intrusione su cavalli e cani mi ha riversato addosso quasi<br />

un Megabyte di idee e messaggi. Gran parte <strong>del</strong> materiale che presento<br />

è frutto <strong>del</strong>le discussioni di Dani, Elio Fabri e Adam Atkinson, amici<br />

che i lettori <strong>del</strong>la rubrica Intelligiochi ormai ben conoscono<br />

e che qui ringrazio caldamente.<br />

<strong>Il</strong> Problema<br />

Con il vistoso sviluppo di giochi come il <strong>Lotto</strong> ed il Superenalotto<br />

ha ripreso vigore la annosa polemica tra i "r<strong>it</strong>ardisti"<br />

ovvero quelli che pensano" se qualcosa deve succedere prima<br />

o poi, e la aspetto da un po', adesso devo aspettare di<br />

meno" (la definizione è di Adam) e gli anti-r<strong>it</strong>ardisti che basano<br />

le loro argomentazioni sull'indipendenza <strong>del</strong>le successive<br />

estrazioni (e sulla conoscenza <strong>del</strong> calcolo <strong>del</strong>le probabil<strong>it</strong>à).<br />

Ho gia dedicato un articolo (MC n. 173, Maggio 1997)<br />

al problema <strong>del</strong> <strong>Lotto</strong> (cercando di dimostrare con varie simulazioni<br />

la totale inconsistenza <strong>del</strong>la teoria <strong>dei</strong> r<strong>it</strong>ardi) e<br />

Dani ne sta preparando un altro molto più completo.<br />

Quello di cui mi voglio occupare qui è un problema marginale,<br />

più tecnico, ma decisamente interessante: il problema<br />

<strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong>. Nel 1937 l'Ing. Samar<strong>it</strong>ani, nel<br />

libro" La teoria e il calcolo matematico <strong>dei</strong> r<strong>it</strong>ardi. Studio<br />

teorico e pratico sul giuoco <strong>del</strong> <strong>Lotto</strong>" cerca di stimare teoricamente<br />

qual è il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> che possiamo mediamente<br />

aspettarci di trovare se consideriamo una sequenza<br />

di n estrazioni (il che, evidentemente, è cosa ben diversa<br />

dal <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico che è sempre e comunque n).<br />

Samar<strong>it</strong>ani, con procedimenti poco convincenti, stabilisce la<br />

seguente formula:<br />

166<br />

(17/18)r =l/n ovvero r = 17.495 ... Log[n).<br />

(come sempre Log[n) indica il logar<strong>it</strong>mo naturale).<br />

Facciamo alcune considerazioni iniziali:<br />

•<br />

•<br />

•<br />

•<br />

•<br />

p=1I18 è la probabil<strong>it</strong>à che un particolare numero su 90<br />

sia estratto in una estrazione di 5 <strong>numeri</strong>;<br />

q=1-p=17/18 è la probabil<strong>it</strong>à che un particolare numero<br />

su 90 non sia estratto in una estrazione di 5 <strong>numeri</strong>;<br />

il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico su n estrazioni è, ovviamen-<br />

te, n e ha probabil<strong>it</strong>à qn di presentarsi (un po' bassina<br />

per n grande! i);<br />

se il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico t(n) fosse minore di n e un<br />

numero dopo n settimane tardasse proprio di t(n), allora<br />

quel numero dovrebbe uscire" certamente" la settimana<br />

successiva (la follia di una tale affermazione mi<br />

pare evidente);<br />

il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> "storico" <strong>del</strong> lotto <strong>it</strong>aliano sembra<br />

sia 202.<br />

MCmicrocomputer n. 191 - gennaio 1999


Figura 1<br />

200 400 600 800 1000 1200<br />

Nel segu<strong>it</strong>o prendiamo in considerazione n estrazioni di 5<br />

<strong>numeri</strong> su una ruota e definiamo:<br />

mr1(n) il valore atteso <strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> (ovvero<br />

la media <strong>dei</strong> massimi r<strong>it</strong>ardi che si presentano) di un numero<br />

prefissato;<br />

rj(x,n) il numero di r<strong>it</strong>ardi di lunghezza x di un numero pre-<br />

fissato;<br />

mra(n) il valore atteso <strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> di un<br />

numero qualsiasi;<br />

rj(x,n) il numero di r<strong>it</strong>ardi di lunghezza x di un numero qual-<br />

siasi.<br />

Mo<strong>del</strong>lo probabilistico<br />

per un numero<br />

<strong>Il</strong> mo<strong>del</strong>lo che segue è stato messo a punto da Elio (risultati<br />

simili per altra via sono stati ottenuti anche da Adam).<br />

Sia g [n, r] la probabil<strong>it</strong>à che entro la n-esima estrazione ci<br />

sia stato almeno un <strong>r<strong>it</strong>ardo</strong> di lunghezza almeno r.<br />

Questo evento si verifica se e solo se il <strong>r<strong>it</strong>ardo</strong> r si è presentato<br />

almeno una volta in qualcuna <strong>del</strong>le estrazioni tra 1<br />

ed n-l, oppure se si presenta alla n-esima estrazione.<br />

Valgono le condizioni iniziali:<br />

In{1]:=<br />

g[n_,r_]:=O/; n


2<br />

-2<br />

-4<br />

-6<br />

-8<br />

10<br />

Figura 2<br />

Out[4]=<br />

-40.7291 + 17.463 Log[x]<br />

La bontà <strong>del</strong> f<strong>it</strong> (in blu) rispetto ai valori teorici (in giallo) è<br />

evidente dal grafico di Figura 1.<br />

Conteggio <strong>dei</strong> r<strong>it</strong>ardi<br />

per un numero<br />

Ora studiamo una stima asintotica (cioè che vale per x ed n<br />

grandi) di rj(x,n).<br />

Si nota che:<br />

2 rj(x,n/2) ~ rj(x,n) ~ 2rj(x,n/2) + 1<br />

E quindi, la dipendenza da n può essere solo lineare.<br />

Supponiamo ora di avere aspettato un numero<br />

per x-1 estrazioni, la probabil<strong>it</strong>à che non si presenti<br />

alla successiva è p=1-q e questa probabil<strong>it</strong>à deve<br />

coincidere con il rapporto tra il numero atteso di r<strong>it</strong>ardi<br />

lunghi x e il numero totale di r<strong>it</strong>ardi attesi (infatti<br />

quel numero o r<strong>it</strong>arda x oppure x+1 oppure<br />

x+2 ...). Quindi indipendentemente da n e da x deve<br />

valere:<br />

rj·(x,n)<br />

-oo---=p=l-q<br />

168<br />

Lrj(i,n)<br />

I=X<br />

120<br />

110<br />

100<br />

90<br />

80<br />

70<br />

Figura 3<br />

che è una relazione ricorrente di ordine infin<strong>it</strong>o.<br />

Sost<strong>it</strong>uiamo a rj(x,n) un'espressione <strong>del</strong> tipo n a<br />

b X e risolviamo con Mathematica 3.0 (chi sa l'analisi<br />

lo poteva fare anche a mano).<br />

In[2]:=<br />

l-q==n a bAx/SUm[n a bAi,{i,x,=}]<br />

Out[2]=<br />

1-q==1-b<br />

Vale allora rj(x,n)=n a b r e resta il problema di de-<br />

terminare a.<br />

Sia rj(i,x,n) il numero <strong>medio</strong> <strong>dei</strong> r<strong>it</strong>ardi di lunghezza<br />

esattamente x <strong>del</strong> numero j che si presentano in n<br />

estrazioni (ovvero 5 n <strong>numeri</strong>) ad un tempo t tale<br />

che t mod n = i.<br />

Per un dato numero j vale rj(i,x,n) = Floor[n/x) p2 qX.<br />

Si nota che se un <strong>r<strong>it</strong>ardo</strong> viene contato in un qualche<br />

rj(i,x,n) non può apparire in nessun altro rj(k,x,n) con k;éi.<br />

I possibili valori di i vanno da O a x+ 1 e trascurando il Floor<br />

e i problemi ai bordi si ottiene la stima finale:<br />

Ora si può vedere per quale valore di r il numero atteso di r<strong>it</strong>ardi<br />

lunghi r ha un valore costante C:<br />

In[1]:=<br />

Expand [PowerExpand [x/ •<br />

MCmicrocomputer n. 191 - gennaio 1999


200<br />

190<br />

180<br />

170<br />

160<br />

150<br />

140<br />

Figura 4<br />

2000 4000 6000 8000<br />

Solve[qAx p A 2 n == C,{x}] [[1]]]]<br />

Out[1J=<br />

-101.135 - 17.4952 Log[C] + 17.4952 Log[n]<br />

Si ottiene anche in questo caso un andamento <strong>del</strong> tipo<br />

mr1 (n) = a+ b log(n). resta però aperto il problema <strong>del</strong>la<br />

scelta di C.<br />

Vediamo l'accordo tra teoria e pratica.<br />

È stata fatta (in Pasca l) una simulazione <strong>del</strong> <strong>Lotto</strong> che prevedeva<br />

k blocchi di 10000 estrazioni ogni volta calcolando il<br />

valore vero e quello stimato di r1(x,10000) e mr1(10000)<br />

con k che variava tra 3000 e 50000 (ovvero nella prova più<br />

lunga è stata simulata per 50000 volte l'attiv<strong>it</strong>à di circa 100<br />

anni di una ruota <strong>del</strong> <strong>Lotto</strong>).<br />

La Figura 2 mostra il confronto tra valori teorici (in rosso) e<br />

reali (in giallo) di r1(x,10000) per k=50000.<br />

La Figura 3 mostra il confronto tra valori teorici (con<br />

C=1/30) e reali di mr1 (1 0000) per k=50000, la stima vale:<br />

mr1 (n) = -41.63+17.495 log(n).<br />

in ottimo accordo con quanto predetto dalla teoria di Elio.<br />

Conteggio <strong>dei</strong> r<strong>it</strong>ardi<br />

per tutti i <strong>numeri</strong><br />

Ripetendo il ragionamento visto prima e considerando che<br />

l'inizio <strong>del</strong> <strong>r<strong>it</strong>ardo</strong> è libero e ad ogni estrazione<br />

escono 5 <strong>numeri</strong> si ottiene la stima:<br />

r(x,n) = 5 n p qX<br />

che coincide con quanto ottenibile semplicemente<br />

tenendo conto che i <strong>numeri</strong> sono 90 ed ognuno fa<br />

la sua parte. Per stimare quale è l'andamento tipico<br />

<strong>del</strong> <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> in funzione di n si può<br />

vedere per quale valore di r il numero atteso di r<strong>it</strong>ardi<br />

lunghi r ha un valore costante C.<br />

In[1]:=<br />

Expand [PowerExpand [xl.<br />

Out[1J=<br />

-22.4102<br />

10000 Log [n]<br />

Solve[S qAx p n == c, {x}] [[1]]]]<br />

17 .4952 Log [C] + 17. 4952<br />

La nostra stima prevede quindi una differenza di<br />

circa 80 un<strong>it</strong>à tra il <strong>r<strong>it</strong>ardo</strong> di un numero fissato e quello di<br />

un numero qualsiasi.<br />

La Figura 4 mostra il confronto tra valori teorici (con<br />

C=1/30) e reali di mra(10000) per k=50000.<br />

L'approssimazione comincia a divenire buona per valori<br />

grandi di n in quanto nelle prime estrazioni il numero <strong>dei</strong> r<strong>it</strong>ardi<br />

cresce in modo lineare e non logar<strong>it</strong>mico (per esempio<br />

alla 4" estrazione vi sono certamente almeno 70 <strong>numeri</strong> che<br />

r<strong>it</strong>ardano da 4 settimane).<br />

Conclusioni<br />

Riassumendo abbiamo visto quanto segue:<br />

•<br />

•<br />

•<br />

il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> teorico vale n (con probabil<strong>it</strong>à qn)<br />

il <strong>massimo</strong> <strong>r<strong>it</strong>ardo</strong> <strong>medio</strong> di un numero qualunque può<br />

essere stimato con mra(n) = 37.09+17.495 log(n] circa<br />

37 un<strong>it</strong>à in più di quanto indicato dal Samar<strong>it</strong>ani<br />

le stime sono in buon accordo con gli esperimenti<br />

• la variabil<strong>it</strong>à è abbastanza alta: su 50000 prove il massi-<br />

mo <strong>r<strong>it</strong>ardo</strong> ottenuto in 10000 estrazioni è stato 411,<br />

contro un valore <strong>medio</strong> previsto e verificato di 198.2.<br />

Queste stime quindi hanno solo un valore speculativo<br />

ma non possono certo prevedere quello che succederà<br />

ai giocatori.<br />

Resta aperto il problema di quali considerazioni teoriche<br />

possano giustificare il valore C=1/30.<br />

MCmicrocomputer n. 191 - gennaio 1999 169

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!