Un possibile modello• Per quanto riguarda la prima domanda le risposte sonoprobabilmente tante quante le definizioni <strong>di</strong> probabilità.• Una possibilità consiste nel pensare ad infinite ripetizionidell’esperimento.• Ad esempio, potremmo pensare <strong>di</strong>, per un numero infinito <strong>di</strong>generazioni,(i) fare “auto-impollinare” metà dei “ver<strong>di</strong>” e metà dei “gialli” (lariproduzione separata ci serve per avere la materia prima pergli incroci)(ii) incrociare le restanti metà e poi fare “auto-impollinare” lepiante prodotte dall’incrocio.• Oppure potremmo pensare ad un numero infinito <strong>di</strong> appassionati<strong>di</strong> genetica che vadano al mercato, comprano dei semi <strong>di</strong> pisello,selezionano due ceppi, uno “verde” e l’altro “giallo” e poi ripetanol’esperimento <strong>di</strong> Mendel.• In ambedue i casi, tutto questo impollinare, far crescere, reimpollinare,.. . genera un numero infinito <strong>di</strong> piante <strong>di</strong> 2 ◦ generazionealcune <strong>delle</strong> quali con bacello verde, altre con bacellogiallo.• ϑ può essere identificato con la proporzione <strong>di</strong> piante “ver<strong>di</strong>” inquesto insieme infinito <strong>di</strong> piante.Stiamo, ovviamente, adottando una interpretazione frequentistadell’idea <strong>di</strong> probabilità.• In<strong>di</strong>chiamo con− y il numero <strong>di</strong> piante con bacello verde− n in numero totale <strong>delle</strong> piante <strong>di</strong> 2 ◦ generazione.Nel caso dell’esperimento descritto y = 39 e n = 56.• La seconda questione è che relazione esiste tra (y, n) e ϑ.Se accettiamo l’idea che Mendel non abbia fatto niente per influenzarei risultati ed abbia semplicemente lasciato lavorare il “caso”,possiamo assimilare l’esperimento all’estrazione casuale <strong>di</strong> n pianteda un’urna costituita da tutte le piante <strong>di</strong> 2 ◦ generazione cheabbiamo “evocato”.Ma allora 1 y ∼ Bi(n, ϑ) (C.1)ovvero, il numero <strong>di</strong> piante “ver<strong>di</strong>” tra le n estratte può esserevisto come una determinazione <strong>di</strong> una binomiale con probabilità <strong>di</strong>successo ϑ e numero <strong>di</strong> prove n.• Si osservi che la (C.1) è cruciale perchè precisa la relazione traquello che conosciamo (y e n) e quello che vogliamo conoscere (ϑ).1 [Probalità 22].59 Unità CDove un prete ortolano incontra una . . . 60
Stima <strong>di</strong> ϑ• Uno stimatore “naturale” 2 <strong>di</strong> ϑ è^ϑ = y novvero la proporzione <strong>di</strong> piante “ver<strong>di</strong>” nei dati.• Nel caso dell’esperimento <strong>di</strong> Mendel, ϑ = 39/56 ≈ 0,70.• Ovviamente, se y è una variabile casuale anche ^ϑ lo è.• Lo stu<strong>di</strong>o della sua <strong>di</strong>stribuzione è importante perchè permette <strong>di</strong>acquisire una idea sulla <strong>di</strong>mensione dell’errore <strong>di</strong> stima• La me<strong>di</strong>a e la varianza <strong>di</strong> ^ϑ sono facilmente calcolabili daimomenti primi e secon<strong>di</strong> <strong>di</strong> una binomiale 3 :E {^ϑ } = ϑ, var {^ϑ } =ϑ(1 − ϑ).nSi osservi che ^ϑ è uno stimatore non <strong>di</strong>storto della vera probabilità ϑ.• E’ inoltre possibile mostrare che ^ϑ è uno stimatore consistente insenso forte <strong>di</strong> ϑ.• Anche la <strong>di</strong>stribuzione esatta <strong>di</strong> ^ϑ può essere facilmentedeterminata.Infatti, ^ϑ ∈ Θ n = {0/n, 1/n, . . . , n/n} e, per qualsivoglia a ∈ Θ n ,risulta( ) naP(^ϑ = a) = P(y = na) = ϑ na (1 − ϑ) n−na .n• Da questa <strong>di</strong>stribuzione è possibile ottenere intervalli <strong>di</strong> confidenza(e test) esatti per ϑ. I calcoli non sono però del tutto facili edè necessario un calcolatore (in R è possibile utilizzare la funzionebinom.test).• Per questo motivo consideremo una procedura alternativache, per quanto approssimata, è frequentemente utilizzata nelleapplicazioni.2 forse l’unico “naturale” nel senso che qualsiasi altra scelta scelta sembra artefatta.3 [Probalità 24].61 Unità CApprossimazione normale• Il risultato <strong>di</strong> partenza è costituito dal fatto che per n non troppopiccolo la <strong>di</strong>stribuzione <strong>di</strong>^ϑ − ϑ√ϑ(1 − ϑ)/nè approssimabile con quella <strong>di</strong> una normale standard nel senso cheper ogni intervallo della retta reale [a, b]()^ϑ − ϑP a ≤ √ ≤ b ≈ P(a ≤ N(0, 1) ≤ b)ϑ(1 − ϑ)/n• Si ritiene generalmente che l’approssimazione normale “funzionialmeno decorosamente” quando sia nϑ che n(1−ϑ) sono più gran<strong>di</strong><strong>di</strong> 5.• Se (^ϑ − ϑ)/ √ ϑ(1 − ϑ)/n è approssimativamente una normalestandard allora, sempre approssimativamente,(errore <strong>di</strong> stima) = (^ϑ − ϑ) ∼ N(0, ϑ(1 − ϑ)/n).• Si osservi che questa <strong>di</strong>stribuzione, oltre ad essere approssimataè anche parzialmente ignota. Infatti, la varianza della <strong>di</strong>stribuzione<strong>di</strong>pende dal vero valore <strong>di</strong> ϑ.• Per acquisire <strong>delle</strong> informazioni sulla <strong>di</strong>mensione dell’errore <strong>di</strong>stima possiamo stimarne la varianza sostituendo ^ϑ a ϑ.Nel caso in esame troviamôvar(^ϑ − ϑ) = ^ϑ(1 − ^ϑ) 0.70(1 − 0.70)≈ ≈ 0,0038n56ovvero, approssimazione dopo approssimazione, siamo arrivati allaconclusione chel’errore <strong>di</strong> stima “subito” da Mendel è, grossomodo,normale <strong>di</strong> me<strong>di</strong>a zero e scarto quadratico me<strong>di</strong>o 0,<strong>06</strong>2.La densità <strong>di</strong> questa <strong>di</strong>stribuzione è mostrata nel lucido seguente.Dove un prete ortolano incontra una . . . 62