lucidi delle lezioni di inferenza statistica I (a.a 2005/06)

More documents

Recommendations

Info

Un possibile modello• Per quanto riguarda la prima domanda le risposte sonoprobabilmente tante quante le definizioni di probabilità.• Una possibilità consiste nel pensare ad infinite ripetizionidell’esperimento.• Ad esempio, potremmo pensare di, per un numero infinito digenerazioni,(i) fare “auto-impollinare” metà dei “verdi” e metà dei “gialli” (lariproduzione separata ci serve per avere la materia prima pergli incroci)(ii) incrociare le restanti metà e poi fare “auto-impollinare” lepiante prodotte dall’incrocio.• Oppure potremmo pensare ad un numero infinito di appassionatidi genetica che vadano al mercato, comprano dei semi di pisello,selezionano due ceppi, uno “verde” e l’altro “giallo” e poi ripetanol’esperimento di Mendel.• In ambedue i casi, tutto questo impollinare, far crescere, reimpollinare,.. . genera un numero infinito di piante di 2 ◦ generazionealcune delle quali con bacello verde, altre con bacellogiallo.• ϑ può essere identificato con la proporzione di piante “verdi” inquesto insieme infinito di piante.Stiamo, ovviamente, adottando una interpretazione frequentistadell’idea di probabilità.• Indichiamo con− y il numero di piante con bacello verde− n in numero totale delle piante di 2 ◦ generazione.Nel caso dell’esperimento descritto y = 39 e n = 56.• La seconda questione è che relazione esiste tra (y, n) e ϑ.Se accettiamo l’idea che Mendel non abbia fatto niente per influenzarei risultati ed abbia semplicemente lasciato lavorare il “caso”,possiamo assimilare l’esperimento all’estrazione casuale di n pianteda un’urna costituita da tutte le piante di 2 ◦ generazione cheabbiamo “evocato”.Ma allora 1 y ∼ Bi(n, ϑ) (C.1)ovvero, il numero di piante “verdi” tra le n estratte può esserevisto come una determinazione di una binomiale con probabilità disuccesso ϑ e numero di prove n.• Si osservi che la (C.1) è cruciale perchè precisa la relazione traquello che conosciamo (y e n) e quello che vogliamo conoscere (ϑ).1 [Probalità 22].59 Unità CDove un prete ortolano incontra una . . . 60
Stima di ϑ• Uno stimatore “naturale” 2 di ϑ è^ϑ = y novvero la proporzione di piante “verdi” nei dati.• Nel caso dell’esperimento di Mendel, ϑ = 39/56 ≈ 0,70.• Ovviamente, se y è una variabile casuale anche ^ϑ lo è.• Lo studio della sua distribuzione è importante perchè permette diacquisire una idea sulla dimensione dell’errore di stima• La media e la varianza di ^ϑ sono facilmente calcolabili daimomenti primi e secondi di una binomiale 3 :E {^ϑ } = ϑ, var {^ϑ } =ϑ(1 − ϑ).nSi osservi che ^ϑ è uno stimatore non distorto della vera probabilità ϑ.• E’ inoltre possibile mostrare che ^ϑ è uno stimatore consistente insenso forte di ϑ.• Anche la distribuzione esatta di ^ϑ può essere facilmentedeterminata.Infatti, ^ϑ ∈ Θ n = {0/n, 1/n, . . . , n/n} e, per qualsivoglia a ∈ Θ n ,risulta( ) naP(^ϑ = a) = P(y = na) = ϑ na (1 − ϑ) n−na .n• Da questa distribuzione è possibile ottenere intervalli di confidenza(e test) esatti per ϑ. I calcoli non sono però del tutto facili edè necessario un calcolatore (in R è possibile utilizzare la funzionebinom.test).• Per questo motivo consideremo una procedura alternativache, per quanto approssimata, è frequentemente utilizzata nelleapplicazioni.2 forse l’unico “naturale” nel senso che qualsiasi altra scelta scelta sembra artefatta.3 [Probalità 24].61 Unità CApprossimazione normale• Il risultato di partenza è costituito dal fatto che per n non troppopiccolo la distribuzione di^ϑ − ϑ√ϑ(1 − ϑ)/nè approssimabile con quella di una normale standard nel senso cheper ogni intervallo della retta reale [a, b]()^ϑ − ϑP a ≤ √ ≤ b ≈ P(a ≤ N(0, 1) ≤ b)ϑ(1 − ϑ)/n• Si ritiene generalmente che l’approssimazione normale “funzionialmeno decorosamente” quando sia nϑ che n(1−ϑ) sono più grandidi 5.• Se (^ϑ − ϑ)/ √ ϑ(1 − ϑ)/n è approssimativamente una normalestandard allora, sempre approssimativamente,(errore di stima) = (^ϑ − ϑ) ∼ N(0, ϑ(1 − ϑ)/n).• Si osservi che questa distribuzione, oltre ad essere approssimataè anche parzialmente ignota. Infatti, la varianza della distribuzionedipende dal vero valore di ϑ.• Per acquisire delle informazioni sulla dimensione dell’errore distima possiamo stimarne la varianza sostituendo ^ϑ a ϑ.Nel caso in esame troviamôvar(^ϑ − ϑ) = ^ϑ(1 − ^ϑ) 0.70(1 − 0.70)≈ ≈ 0,0038n56ovvero, approssimazione dopo approssimazione, siamo arrivati allaconclusione chel’errore di stima “subito” da Mendel è, grossomodo,normale di media zero e scarto quadratico medio 0,062.La densità di questa distribuzione è mostrata nel lucido seguente.Dove un prete ortolano incontra una . . . 62
Page 1 and 2: ...lucidi delle lezioni diinferenza
Page 3 and 4: Struttura del corso (e dell’esame
Page 5 and 6: Lo schema qui sotto cerca di esempl
Page 7 and 8: Popolazione e campione: dobbiamo co
Page 9 and 10: Inferenza Statistica e Probabilità
Page 11 and 12: Una possibile formulazione del prob
Page 13 and 14: Stima della mediaDensità stimataLe
Page 15 and 16: La distribuzione della media campio
Page 17 and 18: La distribuzione dell’errore di s
Page 19 and 20: Intervalli di confidenza per la dif
Page 21 and 22: Verifica di ipotesiAnalisi grafica
Page 23 and 24: Test con livello di significativit
Page 25 and 26: ⋆ Quindi, se n è sufficentemente
Page 27 and 28: 3. A questo punto per decidere se H
Page 29 and 30: • Proviamo a calcolarla. Ricordan
Page 31: Un esperimentoUnità CDove un prete
Page 35 and 36: Con i dati di Mendel• Supponiamo
Page 37 and 38: Confronto graficoUn test di dimensi
Page 39 and 40: Un grafico può aiutare−0.93 0.93
Page 41 and 42: Un caso giudiziarioUnità DDove un
Page 43 and 44: • Un discorso simile può essere
Page 45 and 46: Il problema e i datiUnità ETonsill
Page 47 and 48: Breve digressione sui bimbi norvege
Page 49 and 50: • Quindi, almeno approssimativame
Page 51 and 52: • La tabella riporta le frequenze
Page 53 and 54: • Supponiamo ora di voler determi
Page 55 and 56: Speriamo che sia femmina!• In un
Page 57 and 58: • Nel caso degli “streptococchi
Page 59 and 60: Un esperimento su un sonniferoUnit
Page 61 and 62: Normal probability plot e test di S
Page 63 and 64: Quantili di una distribuzione espon
Page 65 and 66: Un esperimento su di un sonniferoSt
Page 67 and 68: 0.0 0.1 0.2 0.3 0.4Analisi grafica
Page 69 and 70: Un intervallo di confidenza· Un in
Page 71 and 72: I datiUova deposte in nidi di petti
Page 73 and 74: • Si osservi che s 2 è facilment
Page 75 and 76: • Volendo un test di tipo accetto
Page 77 and 78: Ancora sul livello di significativi
Page 79 and 80: Perchè non utilizzare un test t a
Page 81 and 82: • Il normal probability plot, con
Page 83 and 84:
Tipo di carne e calorie (per pezzo)
Page 85 and 86:
La devianza totale è la somma dell
Page 87 and 88:
Un problema di verifica d’ipotesi
Page 89 and 90:
Trasformazione rangoUnità KDove fa
Page 91 and 92:
0.0 0.4 0.80.0 1.0 2.0 3.0funzioni
Page 93 and 94:
Un esempio• In una ricerca sono s
Page 95 and 96:
Wilcoxon o Student? Una guerra non
Page 97 and 98:
Probabilità 5 Seguendo un uso abba
Page 99 and 100:
Tre distribuzioni di probabilità l
Page 101 and 102:
Probabilità 25 [Approssimazione no
Page 103 and 104:
Probabilità 38 Siano Y 1 , . . . ,
Page 105 and 106:
Distribuzione delle medie e delle v
Page 107 and 108:
Probabilità 50 Legge forte dei gra
Page 109 and 110:
Φ(·), vedi distribuzione normalez
show all

lucidi delle lezioni di inferenza statistica I (a.a 2005/06)

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?