25.08.2015 Views

lucidi delle lezioni di inferenza statistica I (a.a 2005/06)

lucidi delle lezioni di inferenza statistica I (a.a. ... - Guido Masarotto

lucidi delle lezioni di inferenza statistica I (a.a. ... - Guido Masarotto

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

...<strong>luci<strong>di</strong></strong> <strong>delle</strong> <strong>lezioni</strong> <strong>di</strong><strong>inferenza</strong> <strong>statistica</strong> I(a.a. <strong>2005</strong>/<strong>06</strong>)guido masarotto11 maggio 20<strong>06</strong>copyright c○ 1999-20<strong>06</strong>guido masarottofacoltà <strong>di</strong> scienze statisticheuniversità <strong>di</strong> padovae-mail: guido.masarotto@unipd.itii


In<strong>di</strong>ceK Dove facciamo la conoscenza con <strong>delle</strong> statistiche <strong>di</strong> alto rango, 173Trasformazione rango, 174 Trasformata rango e variabili casuali i.i.d., 175 Test <strong>di</strong> Wilcoxon per due campioni, 176 Un esempio, 181Wilcoxon o Student? Una guerra non ci serve!, 185 Altri test <strong>di</strong> “alto rango”, 186Richiami e complementi <strong>di</strong> probabilità, 187La <strong>di</strong>stribuzione normale, 188 Tre <strong>di</strong>stribuzioni <strong>di</strong> probabilità legate alla <strong>di</strong>stribuzione normale: χ 2 , 191 Tre <strong>di</strong>stribuzioni <strong>di</strong> probabilitàlegate alla <strong>di</strong>stribuzione normale: t <strong>di</strong> Student, 193 Tre <strong>di</strong>stribuzioni <strong>di</strong> probabilità legate alla <strong>di</strong>stribuzione normale: F <strong>di</strong> Snedecor, 195La <strong>di</strong>stribuzione binomiale, 196 La <strong>di</strong>stribuzione multinomiale, 198 Me<strong>di</strong>a e varianza <strong>di</strong> “combinazioni lineari” <strong>di</strong> variabili casuali, 199Me<strong>di</strong>a e varianza della me<strong>di</strong>a campionaria, 202 Distribuzione della me<strong>di</strong>a e della varianza campionaria nel caso <strong>di</strong> un campione estrattoda una popolazione normale, 203 Distribuzione <strong>delle</strong> me<strong>di</strong>e e <strong>delle</strong> varianze campionarie e <strong>di</strong> alcune loro funzioni notevoli nel caso <strong>di</strong> duecampioni estratti da popolazioni normali, 205 Alcuni risultati asintotici, 207In<strong>di</strong>ce analitico, 213A Introduzione al corso, 1Struttura del corso (e dell’esame), 2 “Statistica Descrittiva” vs “Inferenza Statistica”, 3 Perchè indagini <strong>di</strong> tipo campionario sono frequenti?, 6Popolazione e campione: dobbiamo conoscerne la relazione, 9 Errare è l’unica certezza, 11 Inferenza Statistica e Probabilità, 13B Controllo <strong>di</strong> qualità in un impianto che produce lastre <strong>di</strong> metallo, 15Il problema ed i dati, 16 Una possibile formulazione del problema, 17 Tre possibili situazioni, 18 Informazioni aggiuntive sul processo, 19Un modello è buono perchè è utile non perchè è vero, 20 Stima della me<strong>di</strong>a, 21 Densità stimata, 22 Stima della “<strong>di</strong>fettosità”, 23 Stima<strong>di</strong> qui, stima <strong>di</strong> là,. . . , ma se c’è una stima c’è un errore, 24 La <strong>di</strong>stribuzione della me<strong>di</strong>a campionaria, 25 La <strong>di</strong>stribuzione dell’errore <strong>di</strong>stima, 29 Un intervallo <strong>di</strong> confidenza, 30 Intervalli <strong>di</strong> confidenza <strong>di</strong> livello prefissato, 32 Intervalli <strong>di</strong> confidenza per la <strong>di</strong>fettosità, 34Una prima conclusione, 35 Un approccio <strong>di</strong>verso, 36 Verifica <strong>di</strong> ipotesi, 37 Analisi grafica, 38 Un test statistico, 39 Se H0 è vera.. . , 40 Test con livello <strong>di</strong> significatività prefissato, 41 Sintesi della procedura delineata..., 42 ... e applicazione al caso in esame, 43Inferenza sulla me<strong>di</strong>a quando la numerosità campionaria è grande, 44 La varianza campionaria, 47 Verifica d’ipotesi: struttura <strong>di</strong> un teststatistico, 48 Distribuzione sotto H0 e valore osservato della <strong>statistica</strong> test, 50 Verifica d’ipotesi: tipi <strong>di</strong> errore e funzione <strong>di</strong> potenza, 51C Dove un prete ortolano incontra una binomiale che gli <strong>di</strong>ce “Hai ragione.Io sono d’accordo con te”, 57Un esperimento, 58 Un possibile modello, 59 Stima <strong>di</strong> ϑ, 61 Approssimazione normale, 62 Approssimazione della <strong>di</strong>stribuzione dell’errore<strong>di</strong> stima, 63 Intervalli <strong>di</strong> confidenza, 64 Con i dati <strong>di</strong> Mendel, 65 Per Mendel ϑ vale 0,75, 66 Verifica dell’ipotesi <strong>di</strong> Mendel, 68Confronto grafico, 69 Un test <strong>di</strong> <strong>di</strong>mensione prefissata. . . , 70 . . . [segue dal titolo precedente] è un pó troppo manicheo, 71 Livello <strong>di</strong>significatività osservato, 72 Un grafico può aiutare, 73 Interpretazione, 74D Dove un pe<strong>di</strong>atra anti-militarista incontra un giu<strong>di</strong>ce anti-femminista, 77Un caso giu<strong>di</strong>ziario, 78 Un possibile sistema <strong>di</strong> ipotesi, 80 Ha senso lo stesso fare un test?, 82 Il livello <strong>di</strong> significatività osservato, 84E Tonsille e Streptococcus pyogenes, 85Il problema e i dati, 86 Diagramma a barre, 87 La popolazione <strong>di</strong> riferimento, 88 Breve <strong>di</strong>gressione sui bimbi norvegesi, italiani,nigeriani,. . . , 89 Ascensori, aspirine e la mutabilità dei comportamenti umani, 90 Una tabella fantasma, 91 Che relazione esiste tra latabella osservata e quella fantasma?, 92 Verifica dell’ipotesi <strong>di</strong> in<strong>di</strong>pendenza, 94 Frequenze attese e X 2 : richiami e applicazione, 95 La<strong>di</strong>stribuzione approssimata <strong>di</strong> X 2 , 98 Analisi grafica del risultato, 99 Livello <strong>di</strong> significatività osservato (e suo calcolo approssimato dauna tavola dei percentili), 100F Dove parleremo <strong>di</strong> “rapporto” tra maschi e femmine e <strong>di</strong> demenza senile, 103Ancora sull’X 2 , 104 Speriamo che sia femmina!, 105 Demenza senile, 108G Dove facciamo conoscenza con uno statistico birraio, 113Un esperimento su un sonnifero, 114 Un possibile modello <strong>di</strong> riferimento, 115 Due precisazioni, 116 Normal probability plot e test <strong>di</strong>Shapiro-Wilk, 117 Stima dei parametri del modello, 126 Un problema <strong>di</strong> verifica d’ipotesi, 127 Quanto deve essere lontana da zero tossper concludere che H0 è implausibile?, 128 Analisi grafica del risultato, 129 Analisi me<strong>di</strong>ante il livello <strong>di</strong> significatività osservato, 130Una regola del tipo accetto/rifiuto, 131 Con i dati, 132 Un intervallo <strong>di</strong> confidenza, 133H Cuculi, scriccioli, pettirossi e Darwin, 135Il problema e i dati, 136 Test t a due campioni: la situazione <strong>di</strong> riferimento, 139 Test t a due campioni: la <strong>statistica</strong> test e la sua<strong>di</strong>stribuzione, 140 Applicazione alle lunghezze <strong>delle</strong> uove <strong>di</strong> cuculo, 142 La vera ipotesi è però unilaterale!, 144 E se le varianze neidue gruppi non sono uguali?, 146 Inferenza sulla <strong>di</strong>fferenza tra due me<strong>di</strong>e: campioni <strong>di</strong> numerosità elevata, 148 Ancora sul livello <strong>di</strong>significatività osservato, 149I Un piccolo esperimento sulla coltivazione <strong>delle</strong> fragole, 151Il problema e i dati, 152 Perchè non utilizzare un test t a due campioni?, 153 Il test t per dati appaiati, 155J Hot-dog e calorie, 159I dati, 160 Tipo <strong>di</strong> carne e calorie (per pezzo) per 54 confezioni <strong>di</strong> hot-dog, 161 Un primo sguardo ai dati, 162 Notazioni, 163 Lame<strong>di</strong>a totale è uguale alla me<strong>di</strong>a <strong>delle</strong> me<strong>di</strong>e dei gruppi, 164 La devianza totale è la somma <strong>delle</strong> devianze dei gruppi + la devianza <strong>delle</strong>me<strong>di</strong>e dei gruppi, 165 Una misura dell’importanza <strong>delle</strong> <strong>di</strong>fferenze tra le me<strong>di</strong>e dei vari gruppi, 166 E se tutto fosse dovuto al caso, 168Un problema <strong>di</strong> verifica d’ipotesi, 169 Analisi della varianza con un criterio <strong>di</strong> classificazione, 170iii


Struttura del corso (e dell’esame)Unità AIntroduzione al corsoIl corso è articolato in due parti che procedono in parallelo. Hainfatti due obbiettivi:primo obbiettivo: presentare, soprattutto partendo da sempliciproblemi applicativi, le idee e alcune <strong>delle</strong> tecniche <strong>di</strong> basedell’<strong>inferenza</strong> <strong>statistica</strong> (6 ore <strong>di</strong> lezione alla settimana in aula“normale”);secondo obbiettivo: fornirvi una introduzione ad un primoambiente per il calcolo statistico prendendo come pretesto letecniche viste durante il corso <strong>di</strong> Descrittiva e quelle che via viavi presenterò durante questo corso (2 ore <strong>di</strong> esercitazione inlaboratorio informatico alla settimana - <strong>di</strong>visi in due gruppi).L’ambiente scelto per il laboratorio è R scaricabile gratuitamenteda http://www.r-project.org e <strong>di</strong>sponibile nel CD della Facoltà(<strong>di</strong>sponibile sempre gratuitamente presso l’UID).Anche l’esame (e il voto) è <strong>di</strong>viso in due parti:prova pratica: una prova in laboratorio informatico (un ora,valutazione da 0 a 8, voto minimo per la sufficienza 4);prova scritta: uno scritto in cui dovete risolvere alcuni esercizi inaula “normale” (un ora e mezza, valutazione da 0 a 24, votominimo per la sufficienza 14).Il voto complessivo è dato dalla somma dei voti <strong>delle</strong> due prove (ese la somma vale più <strong>di</strong> 30 c’è la lode).Introduzione al corso 2


“Statistica Descrittiva” vs “Inferenza Statistica”Ricor<strong>di</strong>amoci, dal corso <strong>di</strong> “Descrittiva”, che:− il punto <strong>di</strong> partenza <strong>di</strong> una indagine <strong>statistica</strong> è costituito daun’insieme (che chiamiamo la popolazione <strong>di</strong> riferimento),<strong>di</strong>somogeneo all’interno (ovvero non tutti gli elementi sonouguali tra <strong>di</strong> loro) e che costituisce la “parte del mondo che ciinteressa”;− gli elementi <strong>di</strong> questo insieme, che <strong>di</strong> volta in volta nei problemiconcreti saranno persone, animali, batteri, immagini raccolteda un satellite,. . . ) vengono convenzionalmente in<strong>di</strong>cate comeunità statistiche;− l’analisi <strong>statistica</strong> vuole, nella sostanza, utilizzare i dati <strong>di</strong>sponibili(misurazioni/rilevazioni <strong>di</strong> alcune <strong>delle</strong> caratteristiche <strong>delle</strong>unità statistiche condotte su alcune o tutte le unità statisticheche appartengono alla popolazione <strong>di</strong> riferimento) per fare <strong>delle</strong>affermazioni sulla popolazione.Nel contesto brevemente schematizzato parliamo <strong>di</strong><strong>statistica</strong> descrittiva: (“quasi” sinonimi: esplorazione <strong>statistica</strong>dei dati, <strong>statistica</strong> senza modello probabilistico) se <strong>di</strong>sponiamo<strong>di</strong> dati riferiti a tutta la popolazione <strong>di</strong> riferimento (o,come spesso accade, ci comportiamo come se l’affermazioneprecedente fosse vera!).<strong>inferenza</strong> <strong>statistica</strong>: se, viceversa, i dati <strong>di</strong>sponibili sono statirilevati solamente su una parte <strong>delle</strong> unità statistiche (ilcampione da cui indagini campionarie). Vogliamo utilizzarele informazioni del campione per fare <strong>delle</strong> affermazioni sullecaratteristiche <strong>di</strong> tutta la popolazione.Tra Statistica Descrittiva ed Inferenza Statistica esiste una ovvia“fratellanza” ed, in realtà, nelle applicazioni, non sono facilmenteseparabili anche perchè i problemi <strong>di</strong> <strong>inferenza</strong> vengononormalmente affrontati in accordo allo schemadescrizionecaratteristichecampione→affermazionisulle caratteristichedella popolazioneQuesto però non vuol <strong>di</strong>re che l’insieme <strong>delle</strong> idee e dei meto<strong>di</strong>riferibili ai due contesti non sia ben <strong>di</strong>fferenziato.3 Unità AIntroduzione al corso 4


Lo schema qui sotto cerca <strong>di</strong> esemplificare la situazione.L’insieme delimitato dalla linea tratteggiata in<strong>di</strong>ca il campione. Levariabili <strong>di</strong> interesse sarebbero in questo caso rilevate solamentesulle sei unità statistiche che fanno parte del campione.Nonostante le informazioni sulla popolazione siano incomplete inun problema <strong>di</strong> <strong>inferenza</strong> siamo però ambiziosi: con le informazionirilevate sulle sei unità statistiche appartenenti al campione vogliamo“produrre” affermazioni su tutta la popolazione.Perchè indagini <strong>di</strong> tipo campionario sono frequenti?• tempo e/o costo.Esempi− L’ISTAT fornisce informazioni sulla <strong>di</strong>soccupazione in Italiacon cadenza trimestrale. Le informazioni provengono da unaindagine campionaria piuttosto ampia (parecchie decine <strong>di</strong>migliaia <strong>di</strong> nuclei familiari). Non però esaustiva (non tuttisono infatti intervistati). Intervistare tutti i citta<strong>di</strong>ni italianiogni tre mesi è infatti organizzativamente troppo onoroso(richiederebbe una struttura organizzativa “immensa”). Ilcosto ovviamente <strong>di</strong>minuirebbe se ci accontentassimo <strong>di</strong> unarilevazione fatta non ogni trimestre. Ma in questo casoperderemmo la tempestività dell’informazione.− Quanto tempo e denaro dovrebbe investire una aziendadolciaria per verificare, senza una rilevazione <strong>di</strong> tipo parziale,ovvero campionaria, se una nuova tortina potrebbe incontrarei gusti della clientela? Una rilevazione esaustiva richiederebbe<strong>di</strong> farla assaggiare a tutti i residenti in Italia o, perchè no, se ilpiano è <strong>di</strong> vendere la tortina anche all’estero, in tutta Europa,in tutti i paesi occidentali,. . .5 Unità AIntroduzione al corso 6


• la popolazione <strong>di</strong> interesse può essere infinita e virtualeEsempio: Una <strong>delle</strong> fasi dello stu<strong>di</strong>o <strong>di</strong> un nuovo farmaco ècostituita dalla verifica che la tossicità del farmaco sia sufficientementepiccola rispetto alla gravità della malattia che vuolecurare e alla tossicità <strong>di</strong> altri farmaci noti. Lasciando perderei dettagli (anche se, in questo caso, sono importanti perovvi aspetti etici), in pratica, questo si concretizza nel somministrareil farmaco ad alcuni pazienti e nel rilevare gli effettisecondari. La popolazione che ci interessa in questo casoè una popolazione teoricamente infinita e solamente virtuale:l’insieme <strong>di</strong> tutti i pazienti a cui potremmo voler somministrareil farmaco da oggi fino al giorno della fine del mondo.Non è ovviamente sensato somministrare il farmaco a tutta lapopolazione prima <strong>di</strong> pronunciarci sulla tossicità del farmaco.Concludere con certezza, ovvero sulla base <strong>di</strong> una somministrazioneesaustiva, che il farmaco è troppo “tossico” il giornodella fine del mondo è inutile. E per <strong>di</strong> più potrebbe esserenon etico: magari qualche millenio prima lo potevamo già <strong>di</strong>ree allora perchè abbiamo continuato a somministrarlo?.• la rilevazione “<strong>di</strong>strugge” le unità statistiche e quin<strong>di</strong>, dopouna rilevazione esaustiva, la popolazione <strong>di</strong> partenza noninteressa più perchè non esiste più!Esempio: Una azienda farmaceutica produce tra le altre cose<strong>delle</strong> “pasticche” antibiotiche. Tra i controlli effettuati c’è laverifica a posteriori della titolazione <strong>delle</strong> “pasticche” prodottein un determinato lotto <strong>di</strong> produzione. Un certo numero<strong>di</strong> “pasticche” vengono analizzate per verificare se la quantità<strong>di</strong> antibiotico che contengono è all’interno <strong>di</strong> certo prescrittointervallo <strong>di</strong> tolleranza che include ovviamente il titolonominale (che è quello in<strong>di</strong>cato sulla confezione, ad. esempio5mg <strong>di</strong> sostanza attiva per “pasticca”). La misurazione dellaquantità <strong>di</strong> sostanza attiva richiede <strong>di</strong> norma la <strong>di</strong>struzionedella “pillola” (la pillola viene triturata, mescolata a solventi,.. . ). Se dovessimo farlo per tutte le “pillole” prodotte in uncerto giorno non avremmo più pillole da dare ai pazienti!• precisione dei risultati: può sembrare strano ma <strong>delle</strong> volteè stato <strong>di</strong>mostrato che rilevazioni campionarie (incomplete)portano a risultati più precisi <strong>di</strong> rilevazioni esaustive.E’ ad esempio il caso <strong>di</strong> rilevazioni semplici ma noiose fatte daoperatori umani (non da macchine). La noia provoca cali <strong>di</strong>attenzione e quin<strong>di</strong> errori. Perciò . . .7 Unità AIntroduzione al corso 8


Popolazione e campione: dobbiamo conoscerne larelazione− supponiamo che la polazione <strong>di</strong> riferimento siate voi (gli studentipresenti alla prima lezione del corso <strong>di</strong> <strong>inferenza</strong> statista I pressola facoltà. . . )− e che per qualche strano motivo io voglia conoscere la vostraaltezza me<strong>di</strong>a ma che per qualche altro motivo ancora piùmisterioso possa misurare l’altezza solamente <strong>di</strong> 10 <strong>di</strong> voi.− Il primo problema <strong>di</strong>venta come scegliere i <strong>di</strong>eci da misurare; duetra le molte possibilità “teoriche” sono:A) scelgo completamente a caso 10 dei presenti (ad esempio,metto dei foglietti uguali con il vostro numero <strong>di</strong> matricolain un barattolo, mescolo bene, poi ne estraggo 10); misuropoi l’altezza dei 10 sorteggiati;B) vi faccio allineare lungo il muro, vi or<strong>di</strong>no dal più alto al piùpiccolo (ad occhio), scelgo i 10 più alti e misuro l’altezza <strong>di</strong>questi 10.− In ambedue i casi, alla fine ci troviamo tra le mani 10 numeri (lealtezze dei 10 studenti “misurati”). E’ però intuitivamente chiaroche per stimare l’altezza me<strong>di</strong>a <strong>di</strong> tutti i presenti nell’aula nonposso utilizzare questi numeri (i nostri dati) nella stessa maniera.− Ad esempio nel primo caso posso pensare <strong>di</strong> stimare l’altezzame<strong>di</strong>a utilizzando la me<strong>di</strong>a aritmetica <strong>delle</strong> 10 misurazioni fatte.Se non sono stato particolarmente sfortunato posso infatti pensare<strong>di</strong> non aver sorteggiato tutti studenti bassi o tutti studenti altie quin<strong>di</strong> che la me<strong>di</strong>a <strong>delle</strong> <strong>di</strong>eci misure “cada vicino” alla altezzame<strong>di</strong>a <strong>di</strong> tutti.− Nel secondo caso però non è sensato “stimare” l’altezza me<strong>di</strong>anella stessa maniera: con certezza sappiamo che in questamaniera sovrastimeremo la quantità che vogliamo conoscere.− E’ facile capire che quello che cambia nei due casi è la relazionetra il campione e la popolazione.− In generale quin<strong>di</strong> non possiamo pensare <strong>di</strong> affrontare un problema<strong>di</strong> <strong>inferenza</strong> senza sapere e saper descrivere appropriatamentela relazione tra il campione e la popolazione (o almeno traquello che abbiamo misurato sul campione e quello che dellapopolazione vogliamo conoscere).9 Unità AIntroduzione al corso 10


Errare è l’unica certezzaProdurre affermazioni esatte sulla popolazione conoscendo solamentele caratteristiche <strong>di</strong> un sottoinsieme <strong>delle</strong> unità statistiche èimpossibile (a meno che non supponiamo <strong>di</strong> avere ricevuto da MagoMerlino una sfera <strong>di</strong> cristallo!).Quin<strong>di</strong> a priori sappiamo che commetteremmo degli errori.Per rendere utili le nostre affermazioni dovremmo allora occuparcianche <strong>di</strong> capire <strong>di</strong> quanto sono sbagliate.Esempio. Supponiamo <strong>di</strong> sperimentare un nuovo farmaco su 20pazienti e che solo 1 <strong>di</strong> questi 20 pazienti mostri problemi gravi <strong>di</strong>tossicità (effetti secondari non voluti e non banali).Sembra naturale, sulla base <strong>di</strong> questi dati, “stimare” la probabilitàche il farmaco induca effetti tossici rilevanti in 5% (ovvero unpaziente ogni venti).In questo caso la popolazione <strong>di</strong> riferimento è data da tutti i pazientia cui potremmo pensare <strong>di</strong> somministrare il farmaco sotto analisi.E’ una popolazione virtuale e teoricamente infinita. E’ chiaro chenon ci aspettiamo che la percentuale <strong>di</strong> tutti i possibili pazienti chepotrebbero presentare problemi <strong>di</strong> tossicità sia esattamente ugualeal 5%. Saremmo stati troppo fortunati.Non è però irrilevante chiederci <strong>di</strong> quanto la nostra stima (5%)potrebbe essere <strong>di</strong>fferente dalla vera probabilità.Si considerino <strong>di</strong>fatti le seguenti due ipotetiche alternative:i) sulla base dei dati, procedendo in qualche maniera stranaancora da stu<strong>di</strong>are, arriviamo a concludere che la percentualeincognita <strong>di</strong> pazienti della popolazione che potrebbero esibireproblemi <strong>di</strong> tossicità è compresa tra il 2% e il 77%;ii) oppure, seconda alternativa, è compresa tra il 4,8% e il 5,8%.Le due alternative sono <strong>di</strong>fferenti tra <strong>di</strong> loro per il “<strong>di</strong>fferente errore”che attribuiscono alla “stima” <strong>di</strong> prima (5% <strong>di</strong> tossicità).La <strong>di</strong>fferenza non è solo accademica.Infatti, se fosse vera la prima alternativa, la conclusione a cui saremmoarrivati è che, con i dati <strong>di</strong>sponibili, non siamo in grado <strong>di</strong> <strong>di</strong>re,in pratica, niente della incognita probabilità <strong>di</strong> manifestare tossicità.Viceversa, nel caso arrivassimo alla seconda alternativa, potremmoconcludere che “certo la vera probabilità <strong>di</strong> manifestare tossicità nonla conosciamo esattamente ma che, sulla base dei dati possiamo <strong>di</strong>reche più o meno è uguale al 5%”.11 Unità AIntroduzione al corso 12


Inferenza Statistica e ProbabilitàIl “trucco” alla base dell’<strong>inferenza</strong> <strong>statistica</strong> si concretizza nel descriverela relazione tra la popolazione e il campione utilizzando ilcalcolo <strong>delle</strong> probabilità.Ovvero, nella sostanza, interpreteremmo i risultati sperimentali(ovvero i dati <strong>di</strong>sponibili) come uno dei tanti risultati cheun meccanismo probabilistico (un esperimento casuale) potevafornirci.Questa costruzione cercherò <strong>di</strong> illustrarvela nel seguito del corso(già a partire dalla prossima lezione). Inutile entrare quin<strong>di</strong> ora neidettagli.Una conseguenza importante sarà che potremmo utilizzare inmaniera naturale il calcolo <strong>delle</strong> probabilità “per misurare glierrori”.Una seconda conseguenza importante, e il vero motivo <strong>di</strong> questolucido, è il ricordarvi che i contenuti del corso <strong>di</strong> probabilità sono,almeno in parte, propedeutici a quelli <strong>di</strong> questo corso.13 Unità A Introduzione al corso 14


Il problema ed i datiUnità BControllo <strong>di</strong> qualità in un impianto cheproduce lastre <strong>di</strong> metalloUn primo esempio <strong>di</strong> <strong>inferenza</strong> <strong>statistica</strong>.• Me<strong>di</strong>a e varianza campionaria.• Inferenza sulla me<strong>di</strong>a (intervalli <strong>di</strong> confidenza e test) nel caso <strong>di</strong>un campione tratto da una v.c. normale <strong>di</strong> varianza nota.• Inferenza sulla me<strong>di</strong>a quando la numerosità campionaria ègrande.• Una industria metallurgica produce, tra l’altro, <strong>delle</strong> lastre <strong>di</strong>metallo con uno spessore nominale <strong>di</strong> 14mm.• In realtà esiste una tolleranza <strong>di</strong> ±0,5mm, ovvero, una lastra èconsiderata sod<strong>di</strong>sfacente, per quello che riguarda lo spessore, se13,5 ≤ spessore ≤ 14,5. (B.1)• La produzione è organizzata in turni <strong>di</strong> 6 ore.• All’inizio <strong>di</strong> ogni turno vengono estratte a caso 5 lastre tra quelleprodotte nel turno precedente e ne viene misurato lo spessore.• Queste 5 misure vengono utilizzate per decidere se le “macchine”stanno lavorando in maniera sod<strong>di</strong>sfacente, ovvvero se il numero <strong>di</strong>lastre che non rispettano la (B.1) è sufficientemente piccolo.• In particolare, se si decide per il si la produzione del nuovoturno inizia imme<strong>di</strong>atamente. Viceversa se si decide per il no, laproduzione viene bloccata e le macchine vengono “ritarate”.• I dati raccolti in un particolare turno (in mm) sono stati:14,33 14,19 14,39 14,43 14,17.Nel seguito consideremo il problema <strong>di</strong> utilizzare questi datiper decidere se bloccare o non bloccare temporaneamente laproduzione.Controllo <strong>di</strong> qualità in un impianto che . . . 16


Una possibile formulazione del problema• Nessun processo produttivo è in grado <strong>di</strong> produrre lastreesattamente dello stesso spessore.• Possiamo però pensare che, durante un certo turno, il processoproduttivo sia in un particolare “stato” dato dalle caratteristichetecnologiche dell’impianto, dalla qualità <strong>delle</strong> materie prime,. . . eche le lastre prodotte durante il turno siano il risultato <strong>di</strong> unesperimento casuale le cui caratteristiche <strong>di</strong>pendono dallo “stato”.• Questo formalizza l’idea che, all’inizio <strong>di</strong> un turno, solo MagoMerlino sarebbe in grado <strong>di</strong> indovinare esattamente lo spessore<strong>delle</strong> lastre che saranno prodotte ma che, però, possiamo pensare <strong>di</strong>descrivere gli spessori <strong>delle</strong> lastre che saranno prodotte utilizzandoil calcolo <strong>delle</strong> probabilità.• In particolare, possiamo guardare agli spessori che, durante uncerto turno, il processo produce come ad una variabile casualecontinua con funzione <strong>di</strong> densità f(·).• Il problema <strong>di</strong>venta allora quello <strong>di</strong> utilizzare 1 i dati <strong>di</strong>sponibiliper <strong>di</strong>re se la densità f(·) assegna una eccessiva probabilità all’evento“lastra <strong>di</strong>fettosa” (= lastra il cui spessore non sod<strong>di</strong>sfa la(B.1)).• Se questo accade, e quin<strong>di</strong> se il processo sta, almeno potenzialmente,producendo “troppe” lastre <strong>di</strong>fettose decideremo <strong>di</strong> sospenderela produzione.0 1 2 3 4Tre possibili situazioni13.0 13.5 14.0 14.5 15.0La densità <strong>di</strong>segnata con una linea continua in<strong>di</strong>ca una situazionesod<strong>di</strong>sfacente: la probabilità <strong>di</strong> ottenere una lastra <strong>di</strong>fettosa (spessoreinferiore a 13,5mm o maggiore <strong>di</strong> 14,5mm) è nulla (o quasi). Lealtre due raccontano storie <strong>di</strong>verse: l’impianto sta producendo unafrazione non piccola <strong>di</strong> lastre o troppo sottili o troppo spesse.1 si veda la pagina seguente, per alcuni esempi17 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 18


Informazioni aggiuntive sul processo• Cercare <strong>di</strong> stimare l’intera funzione <strong>di</strong> densità avendo a <strong>di</strong>sposizionesolo le nostre 5 osservazioni sembra essere un’operazioneeccessivamente avventurosa.• Fortunamente esistono <strong>delle</strong> conoscenze aggiuntive sul processo.• Infatti, precedentemente, le caratteristiche del processo sonostate stu<strong>di</strong>ate raccogliendo alcune migliaia <strong>di</strong> misurazioni peralcune decine <strong>di</strong> turni.• Le principali conclusioni <strong>delle</strong> analisi condotte su questi dati sonoche, in<strong>di</strong>cate con Y 1 , Y 2 , . . . le variabili casuali che descrivono lospessore della prima lastra prodotto in un turno, della seconda ecosì via,(a) non esiste nessun tipo <strong>di</strong> <strong>di</strong>pendenza tra le Y i ;(b) tutte le Y i hanno la stessa <strong>di</strong>stribuzione <strong>di</strong> probabilità;Un modello è buono perchè è utile non perchè è veroNel seguito adotteremo come “esattamente” vere le (a)-(c) dellucido 19.E’ importante però rendersi conto che possono al più essere considerateuna descrizione semplice ed operativamente utile <strong>di</strong> una realtàcomplessa.Ad esempio la <strong>di</strong>stribuzione dello spessore non può essere esattamentenormale: una normale con varianza non nulla può assumerequalsiasi valore reale, lo spessore è però non negativo; dall’altraparte una normale può assegnare una probabilità così piccola avalori negativi che possiamo considerare quest’ultima trascurabileda un punto <strong>di</strong> vista pratico.Analogo <strong>di</strong>scorso può essere fatto per l’identica <strong>di</strong>stribuzione el’in<strong>di</strong>pendenza.(c) questa <strong>di</strong>stribuzione comune è ben approssimata da una normale<strong>di</strong> me<strong>di</strong>a µ e varianza 0,01 dove µ è un parametro ignoto chepuò essere <strong>di</strong>verso da turno a turno.19 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 20


Stima della me<strong>di</strong>aDensità stimataLe informazioni aggiuntive ci portano a considerare le 5 misuredello spessore come 5 determinazioni in<strong>di</strong>pendenti “estratte” da unastessa variabile casuale Gaussiana <strong>di</strong> me<strong>di</strong>a µ ignota e varianza notaed uguale a 0,01.Un altra maniera <strong>di</strong> descrivere la situazione consiste nel <strong>di</strong>re chesiamo in presenza <strong>di</strong> determinazioni in<strong>di</strong>pendenti ed identicamente<strong>di</strong>stribuite (abbreviazione i.i.d.) tratte da una variabile casualenormale. . . .La funzione <strong>di</strong> densità dello spessore è quin<strong>di</strong> “quasi” nota.Sappiamo infatti che èf(x) = f(x; µ, σ 2 ) = 1σ √ 2π exp (− 1 2( ) ) 2 x − µcon σ 2 = 0,01 e per qualche ignoto “numero” µ.Per conoscere completamente la <strong>di</strong>stribuzione dei dati ci mancaquin<strong>di</strong> solo la me<strong>di</strong>a µ. Possiamo però utilizzare le osservazioni<strong>di</strong>sponibili (i “nostri” cinque spessori) per stimarla. Al propositosembra “ragionevole” utilizzare la me<strong>di</strong>a <strong>delle</strong> osservazioni come“stima” della vera me<strong>di</strong>a µ, ovvero porrestima della me<strong>di</strong>a = y =σ14,33 + · · · + 14,175= 14,302.Poichè y è la me<strong>di</strong>a <strong>delle</strong> osservazioni nel campione vieneusualmente chiamata la me<strong>di</strong>a campionaria.0 1 2 3 414.0 14.2 14.4 14.6Il grafico mostra la densità <strong>di</strong> una normale <strong>di</strong> me<strong>di</strong>a 14,302 evarianza 0,01.I “cerchietti” sull’asse <strong>delle</strong> x in<strong>di</strong>cano le osservazioni. Si osservicome il “modello costruito” sia quantomeno “possibile”: la<strong>di</strong>stribuzione potrebbe realmente “generare” le 5 osservazioni.L’area evidenziata rappresenta la probabilità (stimata) <strong>di</strong> produrreuna lastra troppo spessa. La probabilità (stimata) <strong>di</strong> produrre unalastra troppo sottile è praticamente nulla.21 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 22


Stima della “<strong>di</strong>fettosità”Due eventi particolarmente importanti nel presente contesto sonoA = {lastra troppo sottile} = {Y < 13,5}B = {lastra troppo spessa} = {Y > 14,5}dove Y in<strong>di</strong>ca la variabile casuale che descrive lo spessore.Ovviamente sia P(A) che P(B) sono funzione <strong>di</strong> µ. In particolarerisulta 2( ) 13,5 − µP(A) = P(N(µ, 0,01) < 13,5) = P(N(µ, 0,01) ≤ 13,5) = Φ0,1eP(B) = P(N(µ, 0,01) > 14,5) = 1 − P(N(µ, 0,01) ≤ 14,5) =( ) 14,5 − µ= 1 − Φ0,1dove Φ(·) è la funzione <strong>di</strong> ripartizione <strong>di</strong> una variabile casualenormale standard 3 .Possiamo ottenere <strong>delle</strong> stime <strong>di</strong> queste due probabilità sostituendoa µ, che è ignoto, la sua stima y.( )13,5 − 14,302^P(A) = Φ= Φ(−8,02) ≈ 00,1e( )14,5 − 14,302^P(B) = 1 − Φ= 1 − Φ(1,98) ≈ 0,0240,1ovvero, sulla base dei dati (e <strong>delle</strong> assunzioni fatte), stimiamo in2,4% la probabilità <strong>di</strong> produrre una lastra troppo “alta” mentrevalutiamo praticamente nulla la probabilità <strong>di</strong> produrre una lastratroppo sottile.Stima <strong>di</strong> qui, stima <strong>di</strong> là,. . . , ma se c’è una stima c’èun errore• Abbiamo incontrato due me<strong>di</strong>e: una “vera” µ e una campionariay; la prima la possiamo vedere come la me<strong>di</strong>a degli spessori <strong>di</strong>tutte le lastre che l’impianto potrebbe produrre se continuasse perun tempo infinito a produrre nelle con<strong>di</strong>zioni attuali; la seconda èla me<strong>di</strong>a degli spessori <strong>delle</strong> 5 lastre effetivamente misurate.• Abbiamo incontrato due probabilità <strong>di</strong> produrre una lastra troppo“alta”; una che calcoleremmo se conoscessimo la “vera” me<strong>di</strong>a,l’altra che possiamo calcolare (e <strong>di</strong>fatti abbiamo calcolato) utilizzandoy.• . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .• Ovvero abbiamo incontrato <strong>delle</strong> “vere” quantità (che hanno ache fare con la “vera” <strong>di</strong>stribuzione <strong>di</strong> probabilità che ha generato idati) e <strong>delle</strong> stime <strong>delle</strong> “vere” quantità.• Ma se y è solo una “stima”, ovvero una approssimazione, della“vera” me<strong>di</strong>a allora è spontaneo (e interessante da un punto <strong>di</strong>vista pratico) chiederci “quanto è buona?” ovvero “quanto è grandel’errore che commettiamo?”Esercizio. Si osservi che abbiamo sempre scritto vera tra virgolette. Lo studenteripensi a quanto detto nel lucido 20 e spieghi perchè.2 [Probalità 7]. Usiamo anche il fatto che se X è una variabile casuale continua allora, P(x


La <strong>di</strong>stribuzione della me<strong>di</strong>a campionaria• La me<strong>di</strong>a campionaria, y, può essere vista come una determinazione<strong>di</strong> una variabile casuale e quin<strong>di</strong> ha una sua <strong>di</strong>stribuzione <strong>di</strong>probabilità.• Infatti se i dati da cui è calcolata, y 1 , . . . , y n , sono il risultato <strong>di</strong>un esperimento casuale anchey = 1 novviamente lo è 4 .• La <strong>di</strong>stribuzione <strong>di</strong> probabilità <strong>di</strong> y, che viene chiamata la <strong>di</strong>stribuzionecampionaria dello stimatore, ci racconta “dove ci aspettiamo<strong>di</strong> trovare” y. Proviamo quin<strong>di</strong> a stu<strong>di</strong>arla nel caso che stiamoconsiderando.• Non <strong>di</strong>storsione della me<strong>di</strong>a campionaria. E’ possibile far vedere 5che, qualsiasi sia l’ignoto valore <strong>di</strong> µ,ovvero chen∑i=1E {y} = µy iE {stima <strong>di</strong> µ} = “vero” valore <strong>di</strong> µ.• Si osservi che avremmo potuto anche scrivereE {y − µ} = 0 ovvero E {errori <strong>di</strong> stima} = 0.• In generale, se la me<strong>di</strong>a <strong>di</strong> uno stimatore è uguale al valore chesi vuole stimare si parla <strong>di</strong> stimatore corretto o non <strong>di</strong>storto. Lerelazioni appena viste sono quin<strong>di</strong> equivalenti alla frase”la me<strong>di</strong>a campionaria è uno stimatore non <strong>di</strong>storto dellavera me<strong>di</strong>a”4 se ripetiamo l’esperimento, nel caso <strong>delle</strong> lastre, ad esempio, estraendone altre 5, troveremodei dati “<strong>di</strong>fferenti” e quin<strong>di</strong> una me<strong>di</strong>a campionaria “<strong>di</strong>fferente”.5 [Probalità 40].25 Unità B• La non <strong>di</strong>storsione ci garantisce che, qualsiasi sia µ, le determinazioni<strong>di</strong> y, ovvero le stime della me<strong>di</strong>a, sono posizionate “intorno”al vero valore della me<strong>di</strong>a.• Questa è ovviamente una proprietà fondamentale per uno stimatore.Si osservi comunque che perchè questo accada può, ingenerale, bastarci anche una non <strong>di</strong>storsione approssimata ovverocheE {y} ≈ µ.• Varianza della me<strong>di</strong>a campionaria. E’ inoltre possibile far vedere 6chevar {y} = σ2(B.2)ndove σ 2 è la varianza dei dati originali (nel nostro caso degli“spessori” e, quin<strong>di</strong>, σ 2 = 0,01);La (B.2), che può anche essere scritta comevar {errori <strong>di</strong> stima} = E { (y − µ) 2} = σ2nrende precisa l’idea che la me<strong>di</strong>a <strong>di</strong> n osservazioni è uno stimatoredella vera me<strong>di</strong>a “più preciso” <strong>di</strong> ciascuna <strong>delle</strong> singole osservazioni.Potremmo infatti scriverla comevar {me<strong>di</strong>a campionaria} =6 [Probalità 40].var {singola osservazione}.nControllo <strong>di</strong> qualità in un impianto che . . . 26


• Consistenza della me<strong>di</strong>a campionaria. La legge forte dei gran<strong>di</strong>numeri 7 ci assicura inoltre che, al tendere della numerosità campionariaad infinito, y converge con probabilità uno verso la vera me<strong>di</strong>aµ 8 .• In generale, se uno stimatore converge [in probabilità, quasicertamente] verso il vero parametro si parla <strong>di</strong> stimatore consistente[in probabilità, quasi certamente] o in senso [debole,forte].Equivalentemente quin<strong>di</strong>, la proprietà appena enunciata potevaessere raccontata <strong>di</strong>cendo“la me<strong>di</strong>a campionaria è uno stimatore consistente (in sensoforte) della vera me<strong>di</strong>a”• La consistenza è una proprietà <strong>di</strong> base <strong>di</strong> uno stimatore. Se lanumerosità campionaria aumenta fino ad infinito la “quantità <strong>di</strong>informazione” contenuta nel campione <strong>di</strong>venta infinita. Quin<strong>di</strong> lastima deve <strong>di</strong>ventare sempre più precisa e, almeno ad ∞, l’erroredeve essere nullo.• E’ importante osservare che le tre proprietà <strong>di</strong> y appena viste (non<strong>di</strong>storsione, consistenza, formula per la varianza) non <strong>di</strong>pendonodalla normalità dei dati ma solo dal fatto che la me<strong>di</strong>a campionariaè stata calcolato a partire da n osservazioni in<strong>di</strong>pendenti e identicamente<strong>di</strong>stribuite come una variabile casuale <strong>di</strong> me<strong>di</strong>a µ e varianzaσ 2 .• Distribuzione della me<strong>di</strong>a campionaria nel caso <strong>di</strong> un campionetratto da una popolazione normale. Nel caso in cui le osservazionisiano normali è però possibile mostrare anche che 9y ∼ N) (µ, σ2.nIn questo caso conosciamo quin<strong>di</strong> “tutta” la <strong>di</strong>stribuzione dellame<strong>di</strong>a campionaria.Il grafico mostra le funzioni <strong>di</strong> densità della me<strong>di</strong>a campionaria e<strong>delle</strong> osservazioni originali nel caso in cui µ = 14,3 e σ = 0,1.0 2 4 6 8dati originalime<strong>di</strong>a campionaria14.0 14.2 14.4 14.67 [Probalità 50]8 ovviamente, questa proprietà non è particolarmente interessante nel caso degli “spessori”visto che abbiamo solo 5 osservazioni ovvero siamo molto lontani da infinito. Si tratta però <strong>di</strong> unaproprietà in generale interessante della me<strong>di</strong>a campionaria.27 Unità B9 [Probalità 41]Controllo <strong>di</strong> qualità in un impianto che . . . 28


La <strong>di</strong>stribuzione dell’errore <strong>di</strong> stimaUn intervallo <strong>di</strong> confidenza0 2 4 6 8• Poichè la <strong>di</strong>stribuzione dell’errore <strong>di</strong> stima è completamente notapossiamo “costruire” <strong>delle</strong> affermazioni del tipo:Infatti,“la probabilità che l’errore <strong>di</strong> stima sia in valore assolutominore <strong>di</strong> 0,1 è uguale a 0,987”P(|y − µ| < 0,1) = P(|N(0, 0,002)| < 0,1) =( ) (0,1= Φ √ − Φ − 0,1 )√ =0,002 0,002= Φ(2,236) − Φ(−2,236) = 0,987.−0.15 −0.10 −0.05 0.00 0.05 0.10 0.15Il risultato precedente ci permette <strong>di</strong> calcolare anche la <strong>di</strong>stribuzionedell’errore <strong>di</strong> stima, ovvero <strong>di</strong> y − µ che risulta (lo studente lo<strong>di</strong>mostri)y − µ ∼ N(0, σ 2 /n).Si noti che nel caso in esame, poichè σ 2 è noto, la <strong>di</strong>stribuzionedell’errore <strong>di</strong> stima risulta anche essa nota ( è una normale <strong>di</strong> me<strong>di</strong>a0 e varianza 0,01/5 = 0,002).• L’affermazione precedente ci permette anche <strong>di</strong> <strong>di</strong>re cheInfatti“la probabilità che l’intervallo [14,202 ; 14,402] includa lavera me<strong>di</strong>a µ è 0,987”P(|y − µ| < 0,1) = P(−0,1 < µ − y < 0,1) == P(y − 0,1 < µ < y + 0,1) == P(14,302 − 0,1 < µ < 14,302 + 0,1) == P(14,202 < µ < 14,402)• In generale un intervallo che contiene il vero valore <strong>di</strong> un parametroignoto con probabilità 1 − α viene chiamato un intervallo <strong>di</strong>confidenza <strong>di</strong> livello 1 − α.29 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 30


• Gli intervalli <strong>di</strong> confidenza costituiscono forse la maniera piùsemplice <strong>di</strong> comunicare la precisione (od imprecisione) <strong>di</strong> unastima. Si confrontino ad esempio le due affermazioni:1. La stima della me<strong>di</strong>a è 14,302; la <strong>di</strong>stribuzione dell’errore <strong>di</strong> stimaè una normale <strong>di</strong> me<strong>di</strong>a nulla e varianza 0,002.2. Con probabilità molto alta, per la precisione 0,987, il “vero” valoredella me<strong>di</strong>a è compreso tra 14,202 e 14,402.La prima affermazione è più generale ma la sua “deco<strong>di</strong>fica” richiedenozioni non note a tutti (quale strana bestia è una <strong>di</strong>stribuzionenormale? E la varianza?). La seconda è molto più facile dainterpretare.Intervalli <strong>di</strong> confidenza <strong>di</strong> livello prefissatoQuasi sempre si calcolano intervalli <strong>di</strong> confidenza con un livellofissato a priori (le scelte più comuni sono 0,5 , 0,9 , 0,95 e 0,99).Nel caso che stiamo considerando, i passi da seguire sono i seguenti.• Ovviamente, per prima cosa, dobbiamo fissare un valore per 1−α.• Poi determiniamo o utilizzando un programma o le tavole dellanormale standard, il quantile 1 − α/2 <strong>di</strong> una normale standard,ovvero un punto, in<strong>di</strong>chiamolo con z 1−α/2 , tale cheP(N(0, 1) ≤ z 1−α/2 ) = 1 − α/2.Per la simmetria della densità <strong>di</strong> una normale intorno alla sua me<strong>di</strong>aalloraP(N(0, 1) ≤ −z 1−α/2 ) = α/2.Quin<strong>di</strong> 10 P(−z 1−α/2 ≤ N(0, 1) ≤ z 1−α/2 ) = 1 − α.• Ricordando che 11 y − µσ/ √ ∼ N(0, 1),npossiamo allora scrivere(P −z 1−α/2 ≤ y − µ )σ/ √ n ≤ z 1−α/2 = 1 − αda cui, con semplici passaggi, otteniamo(P y − z 1−α/2σ√ ≤ µ ≤ y + z )1−α/2σ√ = 1 − α.nn• Quin<strong>di</strong> [y − z 1−α/2σ√ ; y + z ]1−α/2σ√ n nè un intervallo <strong>di</strong> confidenza <strong>di</strong> livello 1 − α per µ.10 si veda il grafico a pagina 33.11 [Probalità 3] e [Probalità 41]31 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 32


Intervalli <strong>di</strong> confidenza per la <strong>di</strong>fettositàRicor<strong>di</strong>amoci che abbiamo ottenuto le formule( ) 13,5 − µπ B (µ) = P(“lastra troppo bassa”) = Φ0,01( ) 14,5 − µπ A (µ) = P(“lastra troppo alta”) = 1 − Φ0,01− z 1−α 2 0z 1−α 2dove con l’introduzione della nuova notazione π B (·) e π A (·) enfatizziamoil fatto che la probabilità <strong>di</strong> produrre una lastra <strong>di</strong>fettosa<strong>di</strong>pende dalla me<strong>di</strong>a.E’ facile verificare che π B (µ) e π A (µ) sono monotone in µ, la primadecrescente e la seconda crescente 12 Quin<strong>di</strong>, gli eventi{y : y − z 1−α/2σ√ ≤ µ ≤ y + z }1−α/2σ√ ,nn( {y : π B y + z )(1−α/2σ√ ≤ π B (µ) ≤ π B y − z )}1−α/2σ√ n ne ( {y : π A y − z )(1−α/2σ√ ≤ π A (µ) ≤ π A y + z )}1−α/2σ√ n nAmbedue le aree “annerite” sono uguali ad α/2. Quin<strong>di</strong> l’area “nonannerita” è uguale a 1 − α.coincidono e perciò hanno la medesima probabilità.Ricordando che il primo è vero con probabilità 1 − α, questo cipermette <strong>di</strong> <strong>di</strong>re che( [π B y + z ) (1−α/2σ√ ; π B y − z )]1−α/2σ√ n ne ( [π A y − z ) (1−α/2σ√ ; π A y + z )]1−α/2σ√ n nsono intervalli <strong>di</strong> confidenza <strong>di</strong> <strong>di</strong>mensione 1 − α, rispettivamente,per π B (µ) e π B (µ).12 ci si ricor<strong>di</strong> che Φ(y) è crescente in y.33 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 34


Una prima conclusioneSupponiamo <strong>di</strong> volere un intervallo <strong>di</strong> confidenza <strong>di</strong> livello 0,95 perµ e π(µ). Allora,α = 0,05, α 2 = 0,025, 1 − α 2 = 0,975.Utilizzando una funzione o consultando una tavola dei percentilidella normale standard troviamo z 0,975 = 1,96. Quin<strong>di</strong> l’intervallo <strong>di</strong>confidenza per µ è14,302 ±1,96 × 0,1√5= [14,21; 14,39].L’intervallo <strong>di</strong> confidenza per π B (µ) è quin<strong>di</strong>[π B (14,39) ; π B (14,21)].Ora, π B (14,39) < π B (14,21) < 10 −20 . Quin<strong>di</strong>, per quanto nonconosciamo esattamente la probabilità <strong>di</strong> produrre una lastra troppo“bassa”, possiamo <strong>di</strong>re è, visti i dati, che è praticamente irrilevante.Viceversa, l’intervallo <strong>di</strong> confidenza per π A (µ) è[π A (14,21) ; π A (14,39)] = [0,002 ; 0,135].Quin<strong>di</strong>, sulla base dei dati sul processo produttivo (e <strong>delle</strong> ipotesifatte), possiamo <strong>di</strong>re che la probabilità <strong>di</strong> produrre una lastra troppo“spessa” sta, con grande probabilità (esattamente 95%), tra il 2 permille e il 13%.La conclusione, se guar<strong>di</strong>amo all’estremo superiore, è che potrebbeessere “prudente” bloccare la produzione: una possibile <strong>di</strong>fettositàsuperiore al 10% sarebbe <strong>di</strong>sastrosa. Si tenga tra l’altro conto cheUn approccio <strong>di</strong>verso• Fino ad adesso ci siamo occupati <strong>di</strong> capire che cosa i dati cipotevano raccontare (e con quale affidabilità) sulla “vera” me<strong>di</strong>ae sulle “vere” probabilità <strong>di</strong> produrre lastre <strong>di</strong>fettose.L’idea era <strong>di</strong> bloccare la produzione e ritarare le macchine quando idati in<strong>di</strong>cano che la “<strong>di</strong>fettosità” dell’impianto è eccessiva.• Potremmo però anche ragionare lungo le seguenti linee:(i) ad ogni manutenzione (or<strong>di</strong>naria o straor<strong>di</strong>naria) l’impiantoviene “tarato” in maniera tale che la me<strong>di</strong>a degli spessoriprodotti risulti 14mm;(ii) quin<strong>di</strong> un valore <strong>di</strong> µ <strong>di</strong>verso, anche <strong>di</strong> poco, da 14mm in<strong>di</strong>cauna qualche “sregolazione in corso”;(iii) per questo motivo possiamo pensare <strong>di</strong> bloccare l’impiantoappena i dati suggeriscono che la me<strong>di</strong>a è cambiata.• Uno dei possibili vantaggi <strong>di</strong> questo approccio è che potremmoriuscire a bloccare la produzione quando la “sregolazione” è iniziatama la probabilità <strong>di</strong> produrre lastre <strong>di</strong>fettose è ancora piccola.• Una maniera <strong>di</strong>versa per descrivere l’approccio appena suggeritoconsiste nel <strong>di</strong>re che, all’inizio <strong>di</strong> ogni turno, vogliamo utilizzare idati per decidere tra le seguenti due ipotesi:H 0 : µ = 14mm verso H 1 : µ ≠ 14mm.L’interpretazione <strong>delle</strong> due ipotesi è (ovviamente):H 0H 1: l’impianto produce al meglio,: l’impianto ha iniziato a “sregolarsi”.π A (14) = π B (14) ≈ 2/10 6 ,ovvero, che l’impianto, quando ben “tarato”, può produrre unnumero <strong>di</strong> lastre <strong>di</strong>fettose veramente piccolo.35 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 36


Verifica <strong>di</strong> ipotesiAnalisi grafica• Problemi <strong>di</strong> scelta tra due (o più) alternative sono, in <strong>statistica</strong>,chiamati problemi <strong>di</strong> verifica <strong>di</strong> ipotesi.• Le ipotesi (quando sono due) vengono spesso in<strong>di</strong>cate comeipotesi nulla ed ipotesi alternativa.• Lo “strumento” utilizzato per affrontare i problemi <strong>di</strong> verifica <strong>di</strong>ipotesi, ovvero, la procedura che si segue per far “votare” i dati afavore o <strong>di</strong> H 0 o <strong>di</strong> H 1 , o meglio, come si usa <strong>di</strong>re, per deciderequale ipotesi accettare o rifiutare), viene chiamato test statistico.0 1 2 3 413.6 13.8 14.0 14.2 14.4La figura mostra la densità <strong>di</strong> una normale <strong>di</strong> me<strong>di</strong>a 14 e varianza0,01 (ovvero la <strong>di</strong>stribuzione ipotizzata da H 0 ) con i dati osservati“marcati” sull’asse <strong>delle</strong> x. Sembra improbabile che i dati sianostati generati dalla <strong>di</strong>stribuzione <strong>di</strong>segnata: sono troppo spostatia destra, anche in regioni a cui la <strong>di</strong>stribuzione ipotizzata da H 0assegna probabilità quasi nulla. Dall’altra parte H 1 “prevede” alcune<strong>di</strong>stribuzioni (ad es. si veda il grafico a pagina 22) che sembrano“più compatibili” con i dati. Quin<strong>di</strong>, i dati suggeriscono <strong>di</strong> rifiutareH 0 . Sfortunatamente, una analisi grafica del tipo descritto èpossibile solo nelle situazioni più semplici.37 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 38


Un test statistico• Volendo definire una procedura “analitica” per scegliere tra ledue ipotesi, sembra ragionevole basarsi sulla <strong>di</strong>fferenza tra la me<strong>di</strong>astimata, y, e la me<strong>di</strong>a ipotizzata da H 0 , 14.• Ad esempio, potremmo pensare <strong>di</strong> usare una “regola” del tipo√ n(y − 14)−h ≤≤ hσaccettiamoH 0sinorifiutiamoH 0Si osservi che abbiamo <strong>di</strong>viso la <strong>di</strong>fferenza per lo scarto quadraticome<strong>di</strong>o della me<strong>di</strong>a campionaria. Ovviamente, trattandosi nelnostro caso <strong>di</strong> una costante nota (n = 5 e σ = 0.1) ciò non cambial’interpretazione della “regola”.• Per rendere operativa la “regola” dobbiamo decidere quale valoreassegnare alla soglia h.Se H 0 è vera. . .. . . vorremmo, ovviamente, rifiutare H 1 . In altre parole non ci<strong>di</strong>spiacerebbe cheovvero, che( √ n(y − 14)P −h ≤σOra,P(accettare H 0 quando H 0 è vera) = 1(B.3))≤ h quando µ = 14 = 1. (B.4)√ n(y − 14)se H 0 : µ = 14 è vera allora∼ N(0, 1)σe quin<strong>di</strong> la (B.4) è equivalente aP(−h ≤ N(0, 1) ≤ h) = 1(B.5)La (B.5) mostra che l’unico valore <strong>di</strong> h che garantisce la (B.3) èh = +∞ (ci si ricor<strong>di</strong> che la densità <strong>di</strong> una normale è <strong>di</strong>versa dazero su tutta la retta reale).L’utilizzo <strong>di</strong> una soglia infinita non è però molto sensato. Infatti seponiamo h = +∞ non rifiuteremmo mai H 0 . In altre parole, seinsistiamo sulla (B.3) finiamo con una “regola” per cuiP(accettare H 0 quando H 0 è falsa) = 1.39 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 40


Test con livello <strong>di</strong> significatività prefissato• Chiedere che la (B.3) sia esattamente vera ci porta a determinareun valore <strong>di</strong> h inaccettabile.• Sarebbe però inacettabile anche una situazione in cui, adesempio,P(accettare H 0 quando H 0 è vera) = 0,1ovvero, una situazione in cui la (B.3) è pesantemente violata.Infatti, in questo caso, il test sbaglierebbe 9 volte su 10 quandol’ipotesi nulla è vera. E anche questo sembra poco sensato.• Non ci rimane quin<strong>di</strong> che considerare il caso in cui la (B.3) èapprossimativamente (ma non esattamente) rispettata, ovvero, incuiP(accettare H 0 quando H 0 è vera) = 1 − α (B.6)per un valore “piccolo” <strong>di</strong> α.• La (B.6) può essere riscritta nella formaP(−h ≤ N(0, 1) ≤ h) = 1 − α(B.7)ed è facile verificare (lo studente si aiuti con il grafico a pagina 33)che la soluzione in h della (B.7) èSintesi della procedura delineata...In definitiva, per verificare un sistema d’ipotesi del tipo{H0 : µ = µ 0H 1 : µ ≠ µ 0siamo arrivati alla seguente procedura:accettareH 0scegliere αdeterminare z 1−α/2√ n(y − µ0 )calcolare test =σverificare se−z 1−α/2 ≤ test ≤ z 1−α/2se la risposta è si se la risposta è norifiutareH 0h = z 1−α/2dove con z p abbiamo in<strong>di</strong>cato il quantile p-simo <strong>di</strong> una normale <strong>di</strong>me<strong>di</strong>a zero e varianza uno, ovvero il numero per cui Φ(z p ) = p.• La probabilità α che compare nella (B.6) viene chiamata il livello<strong>di</strong> significatività del test.• Per comunicare [l’accettazione,il rifiuto] <strong>di</strong> H 0 si utilizzano spessofrasi del tipo “i risultati sono [non significativi,significativi] al100α%”, o semplicemente, quando α è implicito, “i risultati sono[non significativi,significativi]” 13 .13 la significatività è quin<strong>di</strong> da intendersi “contro” H 041 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 42


... e applicazione al caso in esameα = 0,01 (ad es.)z 1−α/2 = z 0,995 = 2,58√5(14,302 − 14)test == 6,750.1−2,58 ≤ 6,75 ≤ 2,58 ?norifiutiamo H 0Il risultato è significativo al 1%.Inferenza sulla me<strong>di</strong>a quando la numerositàcampionaria è grande⋆ Gli intervalli <strong>di</strong> confidenza e il test sulla me<strong>di</strong>a che abbiamocostruito sono approssimativamente vali<strong>di</strong> e quin<strong>di</strong> possono essereutilizzati anche se i dati <strong>di</strong>sponibili, y 1 , . . . , y n ,(a) sono n determinazioni in<strong>di</strong>pendenti ed identicamente <strong>di</strong>stribuite<strong>di</strong> una variabile casuale non necessariamente normale <strong>di</strong>me<strong>di</strong>a µ, incognita, e varianza σ 2 nota purchè(b) la numerosità campionaria, n, sia “sufficentemente” grande.⋆ Infatti, il risultato alla base degli intervalli <strong>di</strong> confidenza e del testsulla me<strong>di</strong>a che abbiamo costruito è che, se i dati, y 1 , . . . , y n , sonodeterminazioni i.i.d. <strong>di</strong> una N(µ, σ) alloray − µσ/ √ ∼ N(0, 1).n⋆ Ma, se sono vere le (a)-(b), per il teorema del limite centrale 14 , sen tende ad infinito alloray − µσ/ √ converge in <strong>di</strong>stribuzione verso una N(0, 1),novvero, per qualsivoglia x( )y − µlim Pn→∞ σ/ √ n ≤ x = P(N(0, 1) ≤ x) = Φ(x).14 [Probalità 51].43 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 44


⋆ Quin<strong>di</strong>, se n è sufficentemente grande,( )y − µPσ/ √ n ≤ x ≈ P(N(0, 1) ≤ x) = Φ(x).e questo è sufficente, si ripercorra in<strong>di</strong>etro quanto fatto fino ad ora,per mostrare che- l’intervalloσy ± z 1−α/2√ncontiene l’incognito valore della me<strong>di</strong>a con una probabilitàapprossimativamente uguale a 1 − α- il livello <strong>di</strong> significatività del test descritto nel lucido 42 èapprossimativamente pari ad α.⋆ Se la varianza, σ 2 , non è nota ma ne è <strong>di</strong>sponibile una stimaconsistente 15 , in<strong>di</strong>chiamola con ^σ 2 , è possibile <strong>di</strong>mostrare che anchey − µ^σ/ √ converge in <strong>di</strong>stribuzione verso una N(0, 1).n⋆ Una domanda spontanea èquanto deve essere grande n perchè l’approssimazione siadecorosa?⋆ Purtroppo, la domanda non ha una risposta precisa: la velocità<strong>di</strong> convergenza della <strong>di</strong>stribuzione della me<strong>di</strong>a campionaria ad unanormale <strong>di</strong>pende dalla <strong>di</strong>stribuzione dei dati.⋆ Una regola a spanne è- n deve essere maggiore od uguale a 30 se la <strong>di</strong>stribuzionedei dati è (almeno approssimativamente) simmetrica;- n deve essere maggiore od uguale a 50 se la <strong>di</strong>stribuzionedei dati è non simmetrica.In ambedue i casi è inoltre importante verificare che nonci siano evidenti osservazioni anomale tra i dati.Per questo motivo gli intervalli <strong>di</strong> confidenza e il test sulla me<strong>di</strong>avisti in questa unità rimangono approssimativamente vali<strong>di</strong> anchesostituendo alla vera varianza una sua stima consistente purchè lanumerosità campionaria sia sufficentemente grande.Nota. Vedremo nelle prossime unità come trattare campioni “piccoli”provenienti da una popolazione normale quando la varianza nonè nota.15 una possibilità è <strong>di</strong>scussa nel lucido 47.45 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 46


La varianza campionaria⋆ Lo stimatore usuale della varianza considerato in problemi <strong>di</strong><strong>inferenza</strong> ès 2 = 1 n∑(y i − y) 2n − 1i=1dove, al solito, con- y 1 , . . . , y n abbiamo in<strong>di</strong>cato i dati <strong>di</strong>sponibili e- con y la loro me<strong>di</strong>a.⋆ s 2 è chiamato la varianza campionaria.⋆ Si osservi che, in s 2 , <strong>di</strong>vi<strong>di</strong>amo la somma dei quadrati degli scartidalla me<strong>di</strong>a per “n−1” non per n come è usuale fare in “Descrittiva”.⋆ Infatti è possibile far vedere che se i dati y 1 , . . . , y n sono determinazioniin<strong>di</strong>pendenti e identicamente <strong>di</strong>stribuiti <strong>di</strong> una variabilecasuale 16 <strong>di</strong> varianza σ 2 alloraovveroE { s 2} = σ 2“la varianza campionaria è uno stimatore non <strong>di</strong>storto dellavarianza della popolazione”⋆ Viceversa, visto che{}1n∑{ } nE (y i − y) 2 = Enn − 1 s2 = nn − 1 σ2 = σ 2 + 1n − 1 σ2 ,i=1“<strong>di</strong>videndo per n” otteremmo uno stimatore <strong>di</strong>storto.⋆ E’ possibile anche <strong>di</strong>mostrare 17 che“la varianza campionaria è uno stimatore consistente (insenso forte) della varianza della popolazione”Verifica d’ipotesi: struttura <strong>di</strong> un test statisticoQuanto abbiamo fatto per costruire il test sulla me<strong>di</strong>a illustra fedelmentela struttura <strong>di</strong> un test statistico. E’ quin<strong>di</strong> conveniente“ricapitolarlo”:1. Abbiamo definito una <strong>statistica</strong>, ovvero una funzione dei dati,scelta in maniera tale che i valori che ci aspettiamo che la <strong>statistica</strong>assuma quando H 0 e H 1 sono vere siano “tendenzialmente” <strong>di</strong>versi.Nell’ambito della teoria dei test, la <strong>statistica</strong> scelta viene chiamata 18<strong>statistica</strong> test.Nell’esempio considerato, la <strong>statistica</strong> utilizzata è√ n(y − µ0 )T(y 1 , . . . , y 5 ) =σe l’abbiamo scelta poichè ci aspettiamo cheipotesi “vera” valori assunti dalla <strong>statistica</strong> testH 0intorno allo zerolontani dallo zeroH 12. L’idea euristica “la <strong>statistica</strong> test assume <strong>di</strong>fferenti valori sotto H 0e H 1 ” si manifesta e concretizza da un punto <strong>di</strong> vista formale nell’osservareche T ha una <strong>di</strong>versa <strong>di</strong>stribuzione <strong>di</strong> probabilità nei duecasi.Ad esempio, nel caso in esame, se µ è la vera me<strong>di</strong>a degli spessoriallora 19 T ∼ N( √ n(µ − µ 0 )/σ, 1)ovvero,- se è vera H 0 , T ∼ N(0, 1) ma- se è vera H 1 , T ∼ N(η n , 1) con η n ≠ 0.16 non necessariamente normale17 [Probalità 53]47 Unità B18 ma va!19 lo studente lo <strong>di</strong>mostri utilizzando i risultati in appen<strong>di</strong>ceControllo <strong>di</strong> qualità in un impianto che . . . 48


3. A questo punto per decidere se H 0 doveva essere accettata orifiutata abbiamo “confrontato” il valore osservato della <strong>statistica</strong>,ovvero il valore <strong>di</strong> T calcolato dai dati, con la <strong>di</strong>stribuzione sottoH 0 20 .Poichè il valore osservato della <strong>statistica</strong> era “troppo estremo”(ovvero, troppo “poco probabile” per la <strong>di</strong>stribuzione <strong>di</strong> T sotto H 0 )abbiamo deciso <strong>di</strong> rifiutare H 0 .In particolare, si osservi che, desiderando una regola precisa, nellaprocedura operativa descritta dall’albero a pagina 42 abbiamoconvenuto che “troppo estremo” significa |T| > z 1−α/2 per qualchepre-scelto (e non troppo grande) valore <strong>di</strong> α.Distribuzione sotto H 0 e valore osservato della<strong>statistica</strong> testNota. Si osservi come in questo caso (ma in realtà accade sempre peri test che si “rispettano”) per ogni prefissato µ ≠ µ 0 la <strong>di</strong>stribuzionedella <strong>statistica</strong> test “scappi” verso o +∞ o −∞ all’aumentare <strong>di</strong> n.Ovvero, come all’aumentare del numero <strong>di</strong> osservazioni (= dellaquantità <strong>di</strong> informazioni nel campione) le <strong>di</strong>stribuzione <strong>di</strong> T sotto ledue ipotesi si “separino” sempre più.z 0.005 = − 2.58 z 0.995 = 2.58 T = 6.75Il valore osservato (6,75) non sembra essere stato generato dalla<strong>di</strong>stribuzione <strong>di</strong>segnata. Quin<strong>di</strong> rifiutiamo H 0 .Si noti la somiglianza con quanto fatto a pagina 38. Solamente quiusiamo la <strong>statistica</strong> test e non le osservazioni.20 si veda lucido seguente49 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 50


Verifica d’ipotesi: tipi <strong>di</strong> errore e funzione <strong>di</strong> potenza• In un problema <strong>di</strong> verifica d’ipotesi esistono due possibili mo<strong>di</strong>con cui sbagliare.Infatti può capitare <strong>di</strong>:1. rifiutare H 0 quando H 0 è vera; questo è usualmente chiamato 21un errore <strong>di</strong> primo tipo.2. accettare H 0 quando H 0 è falsa; questo è usualmente chiamatoun errore <strong>di</strong> secondo tipo.• Ovviamente(P(errore 1 ◦ tipo) = 1 − Paccettare H 0quando H 0 è veraQuin<strong>di</strong>, costruire, come abbiamo fatto noi, un test per cui()accettare H 0P= 1 − αquando H 0 è veraequivale ad utilizzare un test in cui la probabilità <strong>di</strong> commettere unerrore <strong>di</strong> 1 ◦ tipo sia prefissata ed uguale ad α.• O, in altre parole, il livello <strong>di</strong> significatività <strong>di</strong> un test è laprobabilità che il test “commetta” un errore <strong>di</strong> 1 ◦ tipo.• Si noti, viceversa, come, nella costruzione utilizzata, la probabilità<strong>di</strong> commettere un errore <strong>di</strong> 2 ◦ tipo non sia stata esplicitamenteconsiderata 22 .21 grande fantasia, giusto?22 con la sola eccezione <strong>di</strong> pagina 40 il cui contenuto può essere parafrasato come “se vogliamoun test in cui la probabilità <strong>di</strong> errore <strong>di</strong> primo tipo sia nulla finiamo per costruire un test in cui laprobabilità <strong>di</strong> errore <strong>di</strong> secondo tipo è uno”.51 Unità B)• Il motivo per cui ci si preoccupa <strong>di</strong> più degli errori <strong>di</strong> 1 ◦ tipo è chespesso la domanda a cui si vuole rispondere con un test statistico èA. I dati sperimentali sono compatibili con H 0 ?più cheB. Quale tra H 0 e H 1 è vera?Tra l’altro, come vedremo, a volte H 1 non è neanche specificabile.• Ovviamente esistono dei casi in cui B è la vera domanda. Diventaallora necessario considerare simultaneamente i due tipi <strong>di</strong> errore.Questo, all’interno della procedura delineata, può essere fattoscegliendo in maniera appropriata α e soprattutto, quando possibile,la numerosità compionaria (n).E’ infatti intuitivamente chiaro che più n è grande più possiamosperare <strong>di</strong> rendere piccoli ambedue i tipi <strong>di</strong> errore.Incidentalmente, è proprio così che l’azienda ha scelto <strong>di</strong>“campionare” 5 lastre (e non <strong>di</strong> più o non <strong>di</strong> meno).• Questo avviene, usualmente, utilizzando la funzione <strong>di</strong> potenzadel test.• Nel caso che stiamo considerando è definita come( )rifiutare H0 quando µ è laγ(µ) = Pvera me<strong>di</strong>a• Si osservi che la funzione <strong>di</strong> potenza riassume le proprietà deltest. Infatti⋆ γ(14), ovvero la funzione <strong>di</strong> potenza calcolata al valore dellame<strong>di</strong>a previsto da H 0 , è uguale alla probabilità <strong>di</strong> commettereun errore <strong>di</strong> I tipo e, nella costruzione <strong>di</strong> prima, γ(14) = α;⋆ γ(µ) con µ ≠ 14, ovvero i valori assunti dalla funzione <strong>di</strong> potenzaper i valori <strong>di</strong> µ non previsti da H 0 , forniscono le probabilità <strong>di</strong>non commettere un errore <strong>di</strong> II tipo.Controllo <strong>di</strong> qualità in un impianto che . . . 52


• Proviamo a calcolarla. Ricordando che la probabilità <strong>di</strong> accettareH 1 è ovviamente uguale a 1 meno la probabilità <strong>di</strong> accettare H 0scriviamoγ(µ) = 1 − P(−z 1−α/2 ≤ √ n(y − µ 0 )/σ ≤ z 1−α/2 )dove la probabilità deve essere calcolata supponendo che la me<strong>di</strong>adella normale che genera le osservazioni sia µ.Sommando e sottraendo √ nµ al numeratore della funzione testotteniamo( √ ) n(y − µ0 + µ − µ)γ(µ) = 1 − P −z 1− α2≤≤ zσ1− α2=( √ )n(y − µ)= 1 − P −z 1− α2≤+ δ n (µ) ≤ zσ1− α2dove δ n (µ) = √ n(µ − µ 0 )/σ.Ricordando che, quando µ è la vera me<strong>di</strong>a, y si <strong>di</strong>stribuisce comeuna normale <strong>di</strong> me<strong>di</strong>a µ e varianza σ 2 /n e che, quin<strong>di</strong>, √ n(y−µ)/σsi <strong>di</strong>stribuisce come una normale standard, otteniamo()γ(µ) = 1 − P= 1 −[Φ−z 1− α2− δ n (µ) ≤ N(0, 1) ≤ z 1− α2− δ n (µ)() ()]z 1− α2− δ n (µ) − Φ −z 1− α2− δ n (µ) .=Funzione <strong>di</strong> potenza del test considerato per trevalori della numerosità campionaria(α = 0,05 in tutti e tre i casi)γ(µ)0.2 0.4 0.6 0.8 1.0n = 1n = 5n = 2013.6 13.8 14.0 14.2 14.4(i) γ(14) = 0,05 per tutte e tre le curve; le tre curve sono infatti riferite a testcostruiti per avere una probabilità <strong>di</strong> errore µ <strong>di</strong> I tipo uguale a 0,05.(ii) A parità <strong>di</strong> n, la “potenza del test” aumenta man mano che µ si allontana daµ 0 = 14, ovvero, più ci allontaniamo da H 0 più <strong>di</strong>venta probabile che il test cisegnali che H 0 è falsa. Questo sembra molto “logico”. Comportamenti <strong>di</strong>fferentisarebbero “sospetti”.(iii) Se considero un valore <strong>di</strong> µ ≠ µ 0 , la potenza aumenta all’aumentare dellanumerosità campionaria (n). Ovvero, più n è grande, più il test è in grado <strong>di</strong>mettere in luce <strong>di</strong>fferenze della vera me<strong>di</strong>a dal valore previsto da H 0 .53 Unità BControllo <strong>di</strong> qualità in un impianto che . . . 54


Funzione <strong>di</strong> potenza del test considerato per trevalori <strong>di</strong> α(n = 5 in tutti e tre i casi)γ(µ)0.0 0.2 0.4 0.6 0.8 1.0α = 0.01α = 0.05α = 0.213.6 13.8 14.0 14.2 14.4Anche aumentando α possiamo migliorare la potenza del test, ovvero la suacapacità <strong>di</strong> rifiutare H 0 quando, effettivamente, µ H 0 non è vera.In questo caso però <strong>di</strong>minuisce anche la capacità del test <strong>di</strong> <strong>di</strong>chiarare H 0 veraquando è effettivamente vera.55 Unità B Controllo <strong>di</strong> qualità in un impianto che . . . 56


Un esperimentoUnità CDove un prete ortolano incontra unabinomiale che gli <strong>di</strong>ce “Hai ragione. Io sonod’accordo con te”Stima della probabilità <strong>di</strong> successo, intervalli <strong>di</strong> confidenza e verificad’ipotesi nel caso <strong>di</strong> una binomiale.Livello <strong>di</strong> significatività osservato (p-value).• Consideriamo in questa unità i risultati <strong>di</strong> uno dei primiesperimenti <strong>di</strong> Mendel, il grande genetista.• Mendel aveva selezionato, tra gli altri, due gruppi <strong>di</strong> piante <strong>di</strong>piselli:(i) il primo che presentava solo bacelli ver<strong>di</strong>(ii) il secondo che presentava solo bacelli gialli.• O, quanto meno, quello che Mendel sapeva era che impollinandopiante del primo (secondo) gruppo con polline <strong>di</strong> piante dello stessogruppo (procedura che aveva ripetuto per alcuni anni) nascevanosempre piante con bacello verde (giallo).• A questo punto ha impollinato un certo numero <strong>di</strong> piante delgruppo “giallo” con polline prelevato da piante del gruppo “verde”ottenendo così una 1 ◦ generazione <strong>di</strong> piante incrociate.Tutte le piante <strong>di</strong> questa generazione presentavano un bacello verde.• Poi ha “auto-impollinato” le piante <strong>di</strong> 1 ◦ generazione ottenendo56 piante <strong>di</strong> 2 ◦ generazione.Di queste 39 avevano un bacello verde e 17 viceversa presentavanoun bacello giallo.• Quello <strong>di</strong> cui ci occuperemmo è <strong>di</strong> utilizzare le informazionisperimentali per fare <strong>delle</strong> affermazioni su( )ottenere una pianta <strong>di</strong> 2◦ϑ = Pgenerazione con bacello verde• Abbiamo almeno due questioni da <strong>di</strong>scutere preliminarmente:1. esiste effettivamente un qualche spazio <strong>di</strong> probabilità in cui ϑ èdefinito?2. quale relazione esiste tra ϑ ed i risultati sperimentali (39 bacelliver<strong>di</strong> su 56 piante <strong>di</strong> 2 ◦ generazione)?Si osservi in particolare che se non rispon<strong>di</strong>amo alla secondadomanda non possiamo pensare <strong>di</strong> utilizzare i dati per farciraccontare che cosa sanno sul parametro <strong>di</strong> interesse.Dove un prete ortolano incontra una . . . 58


Un possibile modello• Per quanto riguarda la prima domanda le risposte sonoprobabilmente tante quante le definizioni <strong>di</strong> probabilità.• Una possibilità consiste nel pensare ad infinite ripetizionidell’esperimento.• Ad esempio, potremmo pensare <strong>di</strong>, per un numero infinito <strong>di</strong>generazioni,(i) fare “auto-impollinare” metà dei “ver<strong>di</strong>” e metà dei “gialli” (lariproduzione separata ci serve per avere la materia prima pergli incroci)(ii) incrociare le restanti metà e poi fare “auto-impollinare” lepiante prodotte dall’incrocio.• Oppure potremmo pensare ad un numero infinito <strong>di</strong> appassionati<strong>di</strong> genetica che vadano al mercato, comprano dei semi <strong>di</strong> pisello,selezionano due ceppi, uno “verde” e l’altro “giallo” e poi ripetanol’esperimento <strong>di</strong> Mendel.• In ambedue i casi, tutto questo impollinare, far crescere, reimpollinare,.. . genera un numero infinito <strong>di</strong> piante <strong>di</strong> 2 ◦ generazionealcune <strong>delle</strong> quali con bacello verde, altre con bacellogiallo.• ϑ può essere identificato con la proporzione <strong>di</strong> piante “ver<strong>di</strong>” inquesto insieme infinito <strong>di</strong> piante.Stiamo, ovviamente, adottando una interpretazione frequentistadell’idea <strong>di</strong> probabilità.• In<strong>di</strong>chiamo con− y il numero <strong>di</strong> piante con bacello verde− n in numero totale <strong>delle</strong> piante <strong>di</strong> 2 ◦ generazione.Nel caso dell’esperimento descritto y = 39 e n = 56.• La seconda questione è che relazione esiste tra (y, n) e ϑ.Se accettiamo l’idea che Mendel non abbia fatto niente per influenzarei risultati ed abbia semplicemente lasciato lavorare il “caso”,possiamo assimilare l’esperimento all’estrazione casuale <strong>di</strong> n pianteda un’urna costituita da tutte le piante <strong>di</strong> 2 ◦ generazione cheabbiamo “evocato”.Ma allora 1 y ∼ Bi(n, ϑ) (C.1)ovvero, il numero <strong>di</strong> piante “ver<strong>di</strong>” tra le n estratte può esserevisto come una determinazione <strong>di</strong> una binomiale con probabilità <strong>di</strong>successo ϑ e numero <strong>di</strong> prove n.• Si osservi che la (C.1) è cruciale perchè precisa la relazione traquello che conosciamo (y e n) e quello che vogliamo conoscere (ϑ).1 [Probalità 22].59 Unità CDove un prete ortolano incontra una . . . 60


Stima <strong>di</strong> ϑ• Uno stimatore “naturale” 2 <strong>di</strong> ϑ è^ϑ = y novvero la proporzione <strong>di</strong> piante “ver<strong>di</strong>” nei dati.• Nel caso dell’esperimento <strong>di</strong> Mendel, ϑ = 39/56 ≈ 0,70.• Ovviamente, se y è una variabile casuale anche ^ϑ lo è.• Lo stu<strong>di</strong>o della sua <strong>di</strong>stribuzione è importante perchè permette <strong>di</strong>acquisire una idea sulla <strong>di</strong>mensione dell’errore <strong>di</strong> stima• La me<strong>di</strong>a e la varianza <strong>di</strong> ^ϑ sono facilmente calcolabili daimomenti primi e secon<strong>di</strong> <strong>di</strong> una binomiale 3 :E {^ϑ } = ϑ, var {^ϑ } =ϑ(1 − ϑ).nSi osservi che ^ϑ è uno stimatore non <strong>di</strong>storto della vera probabilità ϑ.• E’ inoltre possibile mostrare che ^ϑ è uno stimatore consistente insenso forte <strong>di</strong> ϑ.• Anche la <strong>di</strong>stribuzione esatta <strong>di</strong> ^ϑ può essere facilmentedeterminata.Infatti, ^ϑ ∈ Θ n = {0/n, 1/n, . . . , n/n} e, per qualsivoglia a ∈ Θ n ,risulta( ) naP(^ϑ = a) = P(y = na) = ϑ na (1 − ϑ) n−na .n• Da questa <strong>di</strong>stribuzione è possibile ottenere intervalli <strong>di</strong> confidenza(e test) esatti per ϑ. I calcoli non sono però del tutto facili edè necessario un calcolatore (in R è possibile utilizzare la funzionebinom.test).• Per questo motivo consideremo una procedura alternativache, per quanto approssimata, è frequentemente utilizzata nelleapplicazioni.2 forse l’unico “naturale” nel senso che qualsiasi altra scelta scelta sembra artefatta.3 [Probalità 24].61 Unità CApprossimazione normale• Il risultato <strong>di</strong> partenza è costituito dal fatto che per n non troppopiccolo la <strong>di</strong>stribuzione <strong>di</strong>^ϑ − ϑ√ϑ(1 − ϑ)/nè approssimabile con quella <strong>di</strong> una normale standard nel senso cheper ogni intervallo della retta reale [a, b]()^ϑ − ϑP a ≤ √ ≤ b ≈ P(a ≤ N(0, 1) ≤ b)ϑ(1 − ϑ)/n• Si ritiene generalmente che l’approssimazione normale “funzionialmeno decorosamente” quando sia nϑ che n(1−ϑ) sono più gran<strong>di</strong><strong>di</strong> 5.• Se (^ϑ − ϑ)/ √ ϑ(1 − ϑ)/n è approssimativamente una normalestandard allora, sempre approssimativamente,(errore <strong>di</strong> stima) = (^ϑ − ϑ) ∼ N(0, ϑ(1 − ϑ)/n).• Si osservi che questa <strong>di</strong>stribuzione, oltre ad essere approssimataè anche parzialmente ignota. Infatti, la varianza della <strong>di</strong>stribuzione<strong>di</strong>pende dal vero valore <strong>di</strong> ϑ.• Per acquisire <strong>delle</strong> informazioni sulla <strong>di</strong>mensione dell’errore <strong>di</strong>stima possiamo stimarne la varianza sostituendo ^ϑ a ϑ.Nel caso in esame troviamôvar(^ϑ − ϑ) = ^ϑ(1 − ^ϑ) 0.70(1 − 0.70)≈ ≈ 0,0038n56ovvero, approssimazione dopo approssimazione, siamo arrivati allaconclusione chel’errore <strong>di</strong> stima “subito” da Mendel è, grossomodo,normale <strong>di</strong> me<strong>di</strong>a zero e scarto quadratico me<strong>di</strong>o 0,<strong>06</strong>2.La densità <strong>di</strong> questa <strong>di</strong>stribuzione è mostrata nel lucido seguente.Dove un prete ortolano incontra una . . . 62


Approssimazione della <strong>di</strong>stribuzione dell’errore <strong>di</strong>stima0 1 2 3 4 5 6−0.2 −0.1 0.0 0.1 0.2Si osservi che la densità è abbastanza “<strong>di</strong>spersa”, ovvero chepossiamo aspettare <strong>di</strong>fferenze tra il valore stimato (≈ 0,7) e ilvero valore dell’or<strong>di</strong>ne del ±10% senza fare riferimento ad eventiparticolarmente poco probabili.Intervalli <strong>di</strong> confidenza• La <strong>di</strong>stribuzione stimata per ^ϑ − ϑ può essere usata per costruireintervalli <strong>di</strong> confidenza (almeno approssimativamente) <strong>di</strong> livello 1−α prefissato.• Infatti se la <strong>di</strong>stribuzione <strong>di</strong> ^ϑ − ϑ è approssimativamente unanormale <strong>di</strong> me<strong>di</strong>a nulla e scarto quadratico me<strong>di</strong>o 0,<strong>06</strong>2 allorapossiamo scrivere 4P(−0,<strong>06</strong>2 × z 1−α/2 ≤ ^ϑ − ϑ ≤ 0,<strong>06</strong>2 × z 1−α/2 ) ≈ 1 − α(C.2)dove, al solito, con z p in<strong>di</strong>chiamo il quantile p-simo <strong>di</strong> una normalestandard.• La (C.2) può essere scritta comeP(^ϑ − 0,<strong>06</strong>2 × z 1−α/2 ≤ ϑ ≤ ^ϑ + 0,<strong>06</strong>2 × z 1−α/2 ) ≈ 1 − αovvero, ci mostra, ricordando come avevamo calcolato lo scartoquadra<strong>di</strong>co me<strong>di</strong>o dell’errore <strong>di</strong> stima, che⎡ √√ ⎤^ϑ(1 − ^ϑ)^ϑ(1 − ^ϑ)⎣^ϑ − z 1−α/2 ; ^ϑ + z 1−α/2⎦nncostituisce (approssimativamente) un intervallo <strong>di</strong> confidenza <strong>di</strong><strong>di</strong>mensione 1 − α per ϑ.4 perchè?63 Unità CDove un prete ortolano incontra una . . . 64


Con i dati <strong>di</strong> Mendel• Supponiamo <strong>di</strong> voler calcolare un intervallo <strong>di</strong> confidenza <strong>di</strong>livello1 − α = 0,9.Allora,α = 0,1 e quin<strong>di</strong> 1 − α/2 = 0,95.• Da una tavola della <strong>di</strong>stribuzione normale (o utilizzando unprogramma appropriato) troviamo chez 0,95 ≈ 1,65.• Sappiamo già che ^ϑ ≈ 0,7 e che√√^ϑ(1 − ^ϑ) 0,7 × 0,3=≈ 0,<strong>06</strong>2.n56Quin<strong>di</strong>, la semi-ampiezza dell’intervallo <strong>di</strong> confidenza è√^ϑ(1 − ^ϑ)z 1−α/2 = 1,65 × 0,<strong>06</strong>2 = 0,102.n• L’intervallo è quin<strong>di</strong>[0,7 − 0,102 ; 0,7 + 0,102] = [0,598 ; 0,802].Per Mendel ϑ vale 0,75• L’idea a cui stava lavorando Mendel è che ad ogni carattere osservabile(ad esempio, colore dei bacelli) corrisponda una coppia <strong>di</strong>geni.• Questa coppia si <strong>di</strong>vide al momento della riproduzione e la coppia<strong>di</strong> geni del “figlio” si forma combinando un gene del “padre” e ungene della “madre”.• In<strong>di</strong>chiamo con “V” un gene contenente l’informazione “bacelloverde” e con “g” un gene associato a “bacello giallo”.• Il fatto che il gruppo “verde” per generazioni abbia dato solopiante con bacelli ver<strong>di</strong> viene da Mendel interpretato come in<strong>di</strong>cazionedel fatto che per tutte le piante del gruppo la coppia <strong>di</strong> geni è“VV”.• Simmetricamente, nel gruppo “giallo” la coppia <strong>di</strong> geni <strong>di</strong> tutte lepiante deve essere “gg”.• Facendo incrociare piante del gruppo “giallo” con piante delgruppo “verde” dovremmo quin<strong>di</strong> ottenere una 1 ◦ generazione incui tutte piante hanno la coppia <strong>di</strong> geni uguale a “Vg” (o se vogliamoanche “gV” ma l’or<strong>di</strong>ne non è importante per Mendel).• Il fatto che tutte le piante <strong>di</strong> questa generazione mostrino unbacello verde viene da Mendel interpretato come una manifestazionedel fatto che “V domina su g”. Maiuscole e minuscole sonostate usate proprio per evidenziare questo aspetto.65 Unità CDove un prete ortolano incontra una . . . 66


• Arriviamo alla 2 ◦ generazione. Poichè tutte le piante <strong>di</strong> primagenerazione sono “Vg” al momento della riproduzione metà deigeni forniti dal “papà” sono “V” e metà “g”. Lo stesso vale per la“mamma”.• Quin<strong>di</strong>, le piante della 2 ◦ generazione possono essere o “VV” o“Vg” o “gg”.• Parte della teoria <strong>di</strong> Mendel è che le coppie si “ricompongonocasualmente” (ovvero un gene “V” del “papà” ha probabilità0,5 <strong>di</strong> “accasarsi” sia con un gene “V” che con un gene “g” della“mamma”).• Ma alloraP(“VV”) = 1 4P(“Vg”) = 1 2P(“gg”) = 1 4e quin<strong>di</strong>, ricordando che “V” domina su “g”,ϑ = P(“VV”) + P(“Vg”) = 3 4 .Verifica dell’ipotesi <strong>di</strong> Mendel• Mendel aveva condotto l’esperimento essenzialmente per verificareil seguente sistema <strong>di</strong> ipotesi:{H0 : ϑ = ϑ 0H 1 : ϑ ≠ ϑ 0con ϑ 0 = 0,75.• Volendo utilizzare un test statistico sembra ragionevole basare ladecisione sulla <strong>di</strong>stanza tra- la stima <strong>di</strong> ϑ calcolata dai dati e- il valore per ϑ previsto da H 0 .• Una possibile <strong>statistica</strong> test è 5T =^ϑ − ϑ 0√ϑ0 (1 − ϑ 0 )/n• Se l’ipotesi nulla è vera, ci aspettiamo che T assuma valori viciniallo zero (sia positivi che negativi).• Viceversa se la vera probabilità <strong>di</strong> ottenere una pianta <strong>di</strong> 2 ◦generazione è <strong>di</strong>fferente da ϑ 0 allora ci aspettiamo che T sia “piùlontana” da zero.• Quando è vera H 0 , ricordando l’approssimazione normale allabinomiale, sappiamo che T ha una <strong>di</strong>stribuzione approssimativamentenormale <strong>di</strong> me<strong>di</strong>a zero e varianza 1.• Quin<strong>di</strong> possiamo confrontare il valore <strong>di</strong> T calcolato dai dati conquesta <strong>di</strong>stribuzione.5 Si osservi che come nell’unità precedente preferiamo lavorare con una versione “standar<strong>di</strong>zzata”della <strong>di</strong>fferenza; la cosa è però irrilevante poichè il tutto si concretizza nella <strong>di</strong>visione peruna costante67 Unità CDove un prete ortolano incontra una . . . 68


Confronto graficoUn test <strong>di</strong> <strong>di</strong>mensione prefissata. . .• Volendo una regola precisa per accettare del tipo“se accade questo accetto H 0 altrimenti rifiuto”possiamo procedere come nell’unità precedente.• In particolare, non sembra irragionevole(a) accettare l’ipotesi nulla se |T| è sufficientemente piccolo, ovverousare una regola del tipo(b) e fissare h chiedendo che“accetto H 0 se |T| ≤ h”P(accettare H 0 quando H 0 è vera) = 1 − α(C.3)−4 −2 0 2 4per qualche valore prefissato e non troppo grande <strong>di</strong> α.• Ricordando che T è approssimativamente <strong>di</strong>stribuito come unanormale standard, possiamo concludere che ponendoh = z 1−α/2- Con i dati dell’esperimento che stiamo considerando T ≈ −0,93.- Il grafico mostra la densità <strong>di</strong> una normale standard con, sull’asse<strong>delle</strong> ascisse, in<strong>di</strong>cato il valore osservato, della <strong>statistica</strong> test.- Questo valore potrebbe benissimo essere stato generato dalla<strong>di</strong>stribuzione <strong>di</strong>segnata ovvero lo scostamento tra la percentuale<strong>di</strong> piante con bacello verde nel campione (≈ 70%) e quelloprevisto dalla teoria <strong>di</strong> Mendel (75%) potrebbe benissimo esseredovuto al caso.- Non sembrano quin<strong>di</strong> esserci elementi per rifiutare l’ipotesi <strong>di</strong>Mendel che ϑ = 0,75.otteniamo una regola che almeno approssimativamente sod<strong>di</strong>sfa la(C.3).• Quin<strong>di</strong>, a parte per la <strong>statistica</strong> test che è ovviamente <strong>di</strong>fferente,siamo arrivati ad una procedura “accetto/rifiuto” la cui meccanica èquella dell’unità B.• Nel caso in esame, ad esempio, se scegliamo α = 0,1 allora comegià ricordato z 0,95 ≈ 1,65 e poichè |T| ≈ 0,93 ≤ 1,65 accettiamo H 0 .69 Unità CDove un prete ortolano incontra una . . . 70


. . . [segue dal titolo precedente] è un pó troppomanicheo• Nell’unità precedente (controllo spessore lastre <strong>di</strong> metallo)dovevamo per forza arrivare ad una regola del tipo “accetto/rifiuto”.Infatti alle due alternative corrispondevano due azioni imme<strong>di</strong>ate.In un certo senso, eravamo ad un bivio e dovevamo deciderese andare verso destra o verso sinistra (= bloccare o continuare laproduzione).• Nel caso che stiamo considerando in questa unità questa urgenzanon esiste. Ed allora, ridurre il tutto a “confrontiamo |T| con unasoglia h e se è minore accettiamo mentre se è maggiore rifiutiamo”è quantomeno inutilmente manicheo.• Si pensi ad esempio al fatto che piccole <strong>di</strong>fferenze in T ci possonoportare a conclusioni drammaticamente <strong>di</strong>fferenti. Ad esempio, nelcaso in esame un valore <strong>di</strong> T pari a 1,649 od a 1,651 ci racconterebberoessenzialmente la stessa storia sulla teoria <strong>di</strong> Mendel. Peròinsistendo a fare un test con α = 0,1 in un caso concluderemmo cheMendel ha ragione e nell’altro che ha torto.Livello <strong>di</strong> significatività osservatoSe Mendel dovesse scrivere ai giorni nostri una memoria sulla suateoria e sui risultati degli esperimenti da lui condotti probabilmentepresenterebbe la parte <strong>di</strong> risultati che stiamo commentando con unafrase del tipo. . . <strong>delle</strong> 56 piante della 2 ◦ generazione 39 (70%)mostravano un bacello verde (p = 0,35). . .Quel “p = . . .” tra parentesi in<strong>di</strong>ca che è stato fatto un test. Vieneusualmente chiamato livello <strong>di</strong> significatività osservato o p-value osemplicemente p del test e costituisce la maniera più comune concui vengono presentati i risultati <strong>di</strong> una verifica d’ipotesi.In generale, la definizione è⎛⎞⎛⎜⎝livello <strong>di</strong>significativitàosservato⎞⎟⎠ =⎜⎝probabilità <strong>di</strong> osservaresotto H 0 un valore <strong>di</strong> T piùo ugualmente lontano daH 0 <strong>di</strong> quantoeffettivamente osservato⎟⎠71 Unità CDove un prete ortolano incontra una . . . 72


Un grafico può aiutare−0.93 0.93La curva mostra la densità <strong>di</strong> una normale standard. 0,93 è il valoredella <strong>statistica</strong> test calcolata con i dati <strong>di</strong> Mendel. Poichè “lontano da0 vuol <strong>di</strong>re lontano da H 0 ” l’area “annerita” fornisce una approssimazionedella probabilità <strong>di</strong> osservare quando è vera H 0 un valore piùlontano (o almeno ugualmente lontano) dall’ipotesi nulla <strong>di</strong> quantoosservato.Esercizio 1. Perchè solo una “approssimazione della probabilità.. . ”?Esercizio 2. Si verifichi, utilizzando una tavole della normale, chel’area vale circa 0,35.Interpretazione• Il livello <strong>di</strong> significatività osservato costituisce una misura <strong>di</strong>quanto l’ipotesi nulla è plausibile sulla base dei dati.• Varia tra 0 e 1 6 e più è grande più i dati “sono vicini ad H 0 ”.• In particolare si osservi che:– Se vale 0 vuol <strong>di</strong>re che sotto H 0 non è possibile osservare nessunaltro valore più lontano da H 0 , ovvero, il valore osservato per Tè uno dei più lontani possibili.– Se vale 1 vuol <strong>di</strong>re che sotto H 0 tutti i possibili valori osservabiliper T sono “più lontani” <strong>di</strong> quello osservato, ovvero, quelloosservato è uno dei “più vicini possibili”.• Inoltre conoscendo il livello <strong>di</strong> significatività osservato possiamofacilmente <strong>di</strong>re se i dati sono significativi contro H 0 per qualsiasivalore <strong>di</strong> α.Infatti,se (livello significatività osservato) < αallora i risultati sono significativi al 100α% (il test con α prefissatorifiuta H 0 ) mentrese (livello significatività osservato) ≥ αallora i risultati sono non significativi al 100α% (il test con αprefissato accetta H 0 )6 ovviamente, è una probabilità!73 Unità CDove un prete ortolano incontra una . . . 74


• Lo stretto legame esistente tra i test con livello <strong>di</strong> significatitàprefissato e il livello <strong>di</strong> significatività osservato giustifica, tra le altrecose, il fatto che è abbastanza usuale parlare <strong>di</strong> risultati· non significativi se il livello <strong>di</strong> significatività osservato è maggiore<strong>di</strong> 0,1 (10%);· significativi se è compreso tra 0,01 e 0,05 (tra uno su 100 e uno su20);· altamente significativi se è minore <strong>di</strong> 0,01.La “significatività” è da intendere contro H 0 e, <strong>di</strong>fatti, negli ultimidue casi i dati ci stanno suggerendo <strong>di</strong> rifiutare l’ipotesi nulla.I valori che mancano, ovvero quelli compresi tra 0,05 e 0,1 sonoi più <strong>di</strong>fficili da interpretare. Siamo in una situazione <strong>di</strong> sostanzialeindecisione, a volta in<strong>di</strong>cata come risultato ai margini dellasignificatività o borderline.Ovviamente, le soglie utilizzate (0,01, 0,05 e 0,1) fanno parte dellatra<strong>di</strong>zione ma non per questo hanno qualcosa <strong>di</strong> sacro.75 Unità C Dove un prete ortolano incontra una . . . 76


Un caso giu<strong>di</strong>ziarioUnità DDove un pe<strong>di</strong>atra anti-militarista incontraun giu<strong>di</strong>ce anti-femministaUn esempio <strong>di</strong> verifica d’ipotesi in cui l’ipotesi alternative non è bendefinita.• Benjamin Spock è stato uno dei più famosi pe<strong>di</strong>atri del secondodopo guerra. In particolare i suoi libri ed articoli hanno contribuitonotevolmente allo sviluppo <strong>di</strong> una pe<strong>di</strong>atria e pedagogia menoautoritaria, più orientata verso i bisogni dei bambini che verso le“regole da rispettare”.• Nel 1969 il dott. Spock fu processato da un tribunale federalestatunitense per cospirazione contro il Military Service Act (lalegge sul servizio <strong>di</strong> leva). Il processo, era la conseguenza dellapartecipazione <strong>di</strong> B. Spock al movimento contro la guerra nelVietnam.• La formazione <strong>delle</strong> giurie negli Stati Uniti era, ed è, unoperazione complicata.• In particolare nel caso in esame,- prima dovevano essere estratti da una lista contenente centinaia<strong>di</strong> migliaia <strong>di</strong> elegibili 350 possibili giurati; la legge prevedevache l’estrazione doveva essere casuale e fatta in maniera tale dagarantire a ciascun elegibile la stessa probabilità <strong>di</strong> estrazione- poi, sia l’accusa che la <strong>di</strong>fesa potevano ricusare parte <strong>di</strong> questipotenziali giurati- e, infine, la giuria effettiva veniva estratta tra i giurati “noneliminati”.Dove un pe<strong>di</strong>atra anti-militarista incontra un . . . 78


• Il processo fu affidato ad un giu<strong>di</strong>ce federale <strong>di</strong> nome Ford i cuicompiti comprendevano l’estrazione dei 350 potenziali giurati.• Era convinzione comune che giurati femminili avrebbero avvantaggiatola <strong>di</strong>fesa. Sia per un atteggiamento, in me<strong>di</strong>a, meno militarista<strong>delle</strong> donne sia per il prestigio del dott. Spock tra il pubblicofemminile.Ad esempio, quell’anno un avvocato scrisse sulla Chicago Law ReviewOf all defendants at such trials, Dr. Spock, who had givenwise and welcome advice on child-bearing to millions ofmothers, would haved liked women on his jury.• Il 53% della popolazione degli elegibili era composto <strong>di</strong> donne.Destò sorpresa e polemica il fatto che solo 102 su 350 potenzialigiurati risultarono donne.• Il giu<strong>di</strong>ce Ford si <strong>di</strong>fese affermando che il fatto che 102 donneerano state estratte <strong>di</strong>mostrava che non c’era stato nessun tentativo<strong>di</strong> escludere i possibili giurati <strong>di</strong> sesso femminile.79 Unità DUn possibile sistema <strong>di</strong> ipotesi• Possiamo inquadrare la questione <strong>di</strong> dare un giu<strong>di</strong>zio sul comportamentodel giu<strong>di</strong>ce Ford come un problema <strong>di</strong> verifica <strong>di</strong> ipotesi. Inprima battuta il sistema <strong>di</strong> ipotesi è{H0 : l’estrazione è stata fatta secondo la leggeH 1 : l’estrazione è stata “truccata”• I dati che possiamo utilizzare sono il risultato dell’estrazione (102donne su 350 estratti).• Per procedere abbiamo innanzitutto bisogno <strong>di</strong> specificare megliol’ipotesi nulla. Ovvero, dobbiamo capire quale meccanismoprobabilistico prevede la legge.• In<strong>di</strong>chiamo con– N il numero degli elegibili;– D il numero <strong>di</strong> donne tra gli elegibili.• La legge prevede che si debba− estrarre un primo in<strong>di</strong>viduo assegnando uguale probabilità a tuttigli elegibili;− poi estrarre un secondo in<strong>di</strong>viduo tra i restanti N − 1 assegnandoanche questa volta uguale probabilità;− e così via.• La probabilità che il primo in<strong>di</strong>viduo sia donna è quin<strong>di</strong> D/N.• Strettamente parlando, la probabilità che il secondo in<strong>di</strong>viduosia donna <strong>di</strong>pende dal risultato della prima estrazione. Infatti laprobabilità che il secondo estratto sia donna vale{ D−1N−1DN−1se il 1◦ estratto è donnase il 1◦ estratto è uomo• Nel nostro caso però N è molto grande (centinaia <strong>di</strong> migliaia) equin<strong>di</strong> queste due probablità sono “quasi” uguali tra <strong>di</strong> loro e “quasi”uguali a D/N. Ad esempio, se N = 300.000 e D = 159.000, alloraD/N = 0,53, (D − 1)/(N − 1) ≈ 0,529998 e D/(N − 1) ≈ 0,530002.Dove un pe<strong>di</strong>atra anti-militarista incontra un . . . 80


• Un <strong>di</strong>scorso simile può essere fatto per le successive estrazioni.• La conclusione è quin<strong>di</strong> che, con una buona approssimazione, sesi segue la legge,il numero <strong>di</strong> donne tra i potenziali giurati è il risultato delconteggio <strong>di</strong> quante donne vengono estratte in una serie <strong>di</strong>350 estrazioni tutte praticamente identiche nel senso chein tutte le estrazioni la probabilità <strong>di</strong> estrarre un giuratofemminile vale, approssimativamente, D/N.• Ma allora, ricordandoci che tra l’altro sappiamo che nel caso inesame D/N = 0,53, ovvero che il 53% degli eleggibili è donna( )numero donne∼ Bi(350, 0,53)estratte• Descrivere in termini probabilistici l’ipotesi alternativa è viceversacomplicato. Soprattutto perchè nessuno ci può garantire che, volendo“truccare” la giuria si sia seguito un meccanismo in un qualsiasisenso assimilabile ad un esperimento casuale.• Siamo quin<strong>di</strong> davanti ad un problema <strong>di</strong> verifica d’ipotesi in cuiH 0 è completamente specificata, ed in particolare, è esattamente deltipo che abbiamo considerato nella seconda parte dell’unità sui dati<strong>di</strong> Mendel. Viceversa, H 1 è essenzialmente nebulosa.Ha senso lo stesso fare un test?La risposta è si. Con un test statistico cerchiamo <strong>di</strong> valutare se i datipotrebbero essere stati generati dal meccanismo previsto dall’ipotesinulla. E questo è quello che vogliamo fare nel presente contestovisto che la domanda che ci stiamo ponendo è:“E’ plausibile che il giu<strong>di</strong>ce Ford abbia seguito la legge edestratto solo 102 donne?”.In maniera analoga a quanto fatto nell’unità precedente possiamo“misurare la <strong>di</strong>stanza” tra quanto osservato e quanto previsto dallalegge me<strong>di</strong>ante la <strong>statistica</strong> testT =numero donne estrattenumero potenziali giurati − 0,53√0,53(1 − 0,53)/350.81 Unità DDove un pe<strong>di</strong>atra anti-militarista incontra un . . . 82


Se H 0 è vera, T si <strong>di</strong>stribuisce, almeno approssimativamente, comeuna normale stardard. Quin<strong>di</strong>, confrontando il valore osservato <strong>di</strong> Ti valori “previsti” da questa <strong>di</strong>stribuzione possiamo dare una rispostaalla domanda.Il livello <strong>di</strong> significatività osservato- Il livello <strong>di</strong> significatività osservato in questo caso potrebbe esserecalcolato come (si veda il grafico a pagina 73)P(N(0, 1) ≤ −8,94) + P(N(0, 1) ≥ 8,94)- 8,94 è “fuori” da tutte le usuali tavole della normale. Peròpossiamo calcolare la probabilità che ci interessa utilizzando uncalcolatore ed una appropriata funzione.- Procedendo in questa maniera il valore che troviamo è ≈ 3,8 ×10 −19 .- Ora, è chiaro che tutto può capitare. Anche <strong>di</strong> estrarre solo 102donne. Però questo calcolo ci <strong>di</strong>ce che un valore tanto o più estremo<strong>di</strong> quello ottenuto ce lo aspettiamo meno <strong>di</strong> una volta ogni miliardo<strong>di</strong> miliardo <strong>di</strong> estrazioni. Un po’ troppo poco frequente per crederealle giustificazioni del giu<strong>di</strong>ce Ford!−10 −4 0 5 10- Il valore <strong>di</strong> T calcolato dai dati <strong>di</strong>sponibili (102 donne tra 350giurati potenziali) è −8,94.- Il grafico mostra la densità <strong>di</strong> una normale standard. L’asteriscosull’asse <strong>delle</strong> ascisse in<strong>di</strong>ca il valore osservato <strong>di</strong> T.- Il valore è troppo spostato verso destra. L’ipotesi nulla non sembraplausibile.83 Unità DDove un pe<strong>di</strong>atra anti-militarista incontra un . . . 84


Il problema e i datiUnità ETonsille e Streptococcus pyogenesVerifica dell’ipotesi <strong>di</strong> in<strong>di</strong>pendenza in una tabella a doppia entrata• Nel corso <strong>di</strong> uno stu<strong>di</strong>o sulla determinazione <strong>di</strong> possibili fattoriprognostici (pre<strong>di</strong>ttivi) per alcune malattia otorino-laringoiatrichesono state rilevate le seguenti due variabili su 1398 bimbi o ragazzi:(a) presenza (in un tampone nasale) <strong>di</strong> Streptococcuspyogenes; variabile <strong>di</strong>cotomica con modalità “portatore” e“non portatore”;(b) stato <strong>delle</strong> tonsille rilevato utilizzando la scala qualitativaor<strong>di</strong>nata:(i) normali (abbreviato in +),(ii) leggermente ingrossate (++)(iii) ingrossate (+ + +).• I bimbi erano stati scelti casualmente, me<strong>di</strong>ante sorteggio dalleliste anagrafiche, tra tutti gli in<strong>di</strong>vidui tra i 3 e i 15 <strong>di</strong> età residentiin un ampia e popolosa regione inglese.• La seguente tabella, che contiene le frequenze osservate nelcampione, riassume i dati raccolti.tonsillestreptococcus pyogenes + ++ + + + totaleportatore 19 29 24 72non portatore 497 560 269 1326totale 516 589 293 1398• Il problema che affrontiamo è se esiste o no una qualche forma <strong>di</strong>associazione tra le due variabili.Tonsille e Streptococcus pyogenes 86


Diagramma a barreLa popolazione <strong>di</strong> riferimento0.0 0.1 0.2 0.3 0.4+ ++ +++• Il grafico mostra le <strong>di</strong>stribuzione dello “stato <strong>delle</strong> tonsille”con<strong>di</strong>zionato a− “portatore” (barre nere) e− “non portatore” (barre bianche).L’altezza della barre è proporzionale alle frequenze relative.• I portatori sembrano avere le tonsille “più grosse”.• Il grafico a barre mostra chiaramente che la <strong>di</strong>stribuzione <strong>di</strong> “stato<strong>delle</strong> tonsille” è <strong>di</strong>versa tra i portatori e i non portatori.• Quin<strong>di</strong>, nei dati campionari c’è una qualche forma <strong>di</strong> <strong>di</strong>pendenzatra le due variabili.• Una domanda che è spontaneo porsi è se e a chi è possibileestendere questi risultati.• In realtà, se ci pensa questa è la vera domanda. Infatti, ci scusinoi 1398 ragazzi, ma le tonsille <strong>di</strong> alcuni sconosciuti, probabilmente,non sono uno dei nostri principali problemi.• I dati, viceversa, ci possono interessare per quello che cipossono raccontare sulla relazione intercorrente in generale traStreptococcos Pyogenes e tonsille.• Gli elementi del campione sono stati estratti casualmente tra ibimbi <strong>di</strong> una particolare regione geografica. Possiamo allora pensareche ci possano parlare <strong>di</strong>rettamente della relazione esistente trale due variabili in questo più grande gruppo <strong>di</strong> in<strong>di</strong>vidui. Ovvero,l’insieme dei bimbi e ragazzini tra 3 e 15 abitanti nella regione ingleseconsiderata costituisce quella che usualmente viene chiamata lapopolazione <strong>di</strong> riferimento.• Quello che vogliamo fare è “interrogare” i dati campionari perottenere informazioni sulle caratteristiche <strong>di</strong> questa popolazione.• Al solito, la prima cosa da <strong>di</strong>scutere sarà la relazione che esistetra il campione e la popolazione.87 Unità ETonsille e Streptococcus pyogenes 88


Breve <strong>di</strong>gressione sui bimbi norvegesi, italiani,nigeriani,. . .• Sarebbe interessante se i dati ci parlassero <strong>di</strong> tutti i bambini delmondo.• Però questo richiede che non ci siano <strong>di</strong>fferenze, rispetto ai carattericonsiderati, tra i bimbi inglesi (anzi <strong>di</strong> una particolare regionedell’Inghilterra) e, ad esempio, i bimbi nigeriani.• Infatti nel campione non ci sono bimbi nigeriani. E quin<strong>di</strong>,tutto quello <strong>di</strong> particolare che riguarda quest’ultimi non può esserestu<strong>di</strong>ato con questi dati.• Ovvero, un campione <strong>di</strong> bimbi inglesi è al più rappresentativo <strong>di</strong>tutti i bimbi inglesi 1 .• Noi possiamo anche decidere che le conclusioni che i dati cisuggeriscono valgono anche per i bimbi della Nigeria. Ma si trattaappunto <strong>di</strong> una nostra decisione.• E, come è ovvio, estendere le conclusioni <strong>di</strong> una indagine su <strong>di</strong>una popolazione ad altre popolazioni è intrisincamente pericoloso.L’estensione può avvenire solo tramite nuovi stu<strong>di</strong> (sulle altrepopolazioni). Fino a che questi non sono condotti, le conclusioni su<strong>di</strong> una popolazione sono, al più, ipotesi da verificare per le altre.Ascensori, aspirine e la mutabilità deicomportamenti umani• Quanto detto deve sempre essere tenuto presente.• Ovvero, dobbiamo sempre chiederci <strong>di</strong> quale popolazione i datisono rappresentativi. E dobbiamo stare attenti a non estendere inmaniera arbitraria la vali<strong>di</strong>tà <strong>delle</strong> storie che ci facciamo raccontaredai dati.• Questo è importante, in modo particolare, nell’ambito <strong>delle</strong>scienze sociali 2• I meccanismi fisici, chimici e biologici sono piuttosto stabili neltempo e nello spazio. Le leggi con cui si costruiscono gli ascensoria Oslo e a Sidney sono le stesse. E in tutte le farmacie delmondo contro il mal <strong>di</strong> testa si trovano prodotti che contengonoacido acetilsalicilico (il prodotto commerciale più comune è l’aspirina).E, sempre senza <strong>di</strong>fferenza tra razze e ambienti, l’abuso <strong>di</strong>acido acetilsalicilico aumenta il rischio <strong>di</strong> gastrite.• Lo stesso non si può <strong>di</strong>re per i fenomeni sociali. Due comunitàseparate da pochi chilometri possono avere comportamenti molto<strong>di</strong>versi. La stessa comunità a <strong>di</strong>stanza <strong>di</strong> pochi anni può presentarecomportamenti <strong>di</strong>versi,. . .1 ovvero della popolazione in cui è stato estratto. E può anche non esserlo se l’estrazione è statain qualche forma truccata (si pensi al giu<strong>di</strong>ce Ford!)89 Unità E2 che includono l’economia.Tonsille e Streptococcus pyogenes 90


Una tabella fantasma• Ritorniamo a considerare l’insieme dei bimbi tra i 3 e i 15 anniresidenti nella regione considerata.• Se le due variabili fossere state rilevate su tutti i bimbi avremmopotuto costruire una tabella, analoga a quella <strong>di</strong> pagina 86, del tipotonsillestreptococcus pyogenes + ++ + + + totaleportatore F 11 F 12 F 13 F 1+non portatore F 21 F 22 F 23 F 2+totale F +1 F +2 F +3 Ndove− N in<strong>di</strong>ca il numero <strong>di</strong> bimbi in quell’area dell’Inghilterra,− F 11 il numero <strong>di</strong> bimbi che sono portatori ma hanno le tonsillenormali,− F 12 il numero <strong>di</strong> bimbi che sono portatori e hanno le tonsilleleggermente ingrossate.− . . .• La tabella non la conosciamo visto che, ad esempio, per conoscereF 11 avremmo dovuto fare un tampone nasale a tutti i bimbi eragazzini della regione. Per questo è una tabella fantasma.• E’ però la tabella <strong>di</strong> interesse: ci racconta, o meglio, lo farebbe sela conoscessimo, che cosa accade nella popolazione <strong>di</strong> riferimento.Che relazione esiste tra la tabella osservata e quellafantasma?• Divi<strong>di</strong>amo tutte le frequenze della tabella fantasma per Nottenendotonsillestreptococcus pyogenes + ++ + + + totaleportatore π 11 π 12 π 13 π 1+non portatore π 21 π 22 π 23 π 2+totale π +1 π +2 π +3 1• Il campione è stato formato:− estraendo un bimbo tra gli N componenti della popolazione;− estraendo un altro bimbo tra gli N − 1 bimbi non estratti allaprima estrazione;− . . . ;− estraendo un bimbo tra gli N−1397 bimbi non estratti nelle prime1397 estrazioni.In tutte le estrazioni, è stata assegnata probabilità uguale a tutti ibimbi non ancora estratti.• Vista la maniera con cui è stato formato il campione,P(1 ◦ bimbo sia un (portatore,+)) = π 11P(1 ◦ bimbo sia un (non portatore,+)) = π 21.P(1 ◦ bimbo sia un (non portatore,+++)) = π 23• Le successive estrazioni non sono tra <strong>di</strong> loro in<strong>di</strong>pendenti. Infatti,escludere i bimbi già estratti altera, ovviamente, l’urna da cui stiamoestraendo.Nel caso in esame però N è molto grande e quin<strong>di</strong> la <strong>di</strong>pendenza ètrascurabile da un punto <strong>di</strong> vista pratico.91 Unità ETonsille e Streptococcus pyogenes 92


• Quin<strong>di</strong>, almeno approssimativamente, le frequenze osservatemostrano come si sono ripartiti nelle 6 “categorie” (portatori,+),(portatori,++), . . . , (non portatori,+ + +) i risultati <strong>di</strong> 1398esperimenti casuali in<strong>di</strong>pendenti tutti caratterizzati daP(estrarre un (portatore,+)) = π 11P(estrarre un (portatore,++)) = π 12.P(estrarre un (non portatore,+++)) = π 23• Ma allora la tabella <strong>delle</strong> frequenze osservate, ovvero i nostridati, è, approssimativamente, una determinazione <strong>di</strong> una variabilecasuale Multinomiale(n, (π 11 , π 12 , . . . , π 23 )).Verifica dell’ipotesi <strong>di</strong> in<strong>di</strong>pendenza• Una domanda interessante che possiamo fare ai dati è:nella tabella fantasma esiste in<strong>di</strong>pendenza in <strong>di</strong>stribuzione?ovvero, nella popolazione <strong>di</strong> riferimento l’essere o non essereportatore è in qualche maniera associato con lo stato <strong>delle</strong>tonsille?• In altre parolela <strong>di</strong>pendenza che abbiamo rilevato nel campione è unapeculiarità dei soli bimbi estratti e quin<strong>di</strong> l’abbiamo osservataper puro caso oppure è la manifestazione <strong>di</strong> una realeassociazione tra i due fenomeni esistente nella popolazione?• Si tratta, ovviamente, <strong>di</strong> un problema <strong>di</strong> verifica d’ipotesi che puòessere scritto nella forma{H0 : π ij = π i+ π +j , i = 1, 2 j = 1, 2, 3H 1 : le π ij non rispettano i vincoli previsti da H 0• Infatti se H 0 è vera allora, per x = +, ++, + + +,P(tonsille = x|portatore) = P(tonsille = x|non portatore)ovvero, la <strong>di</strong>stribuzione dello stato <strong>delle</strong> tonsille è uguale traportatori e non portatori.• La <strong>statistica</strong> test più usata è l’X 2 <strong>di</strong> Pearson. E’ certamente una<strong>statistica</strong> appropriata visto che assume valori, tendelzialmente,− piccoli quando H 0 è vera e− gran<strong>di</strong> quando è falsa.93 Unità ETonsille e Streptococcus pyogenes 94


Frequenze attese e X 2 : richiami e applicazione• La tabella osservata: notazioni Supponiamo che la seguente siauna generica tabella <strong>di</strong> frequenze (assolute) osservate.XY x 1 · · · x j · · · x c totaley 1.O 11.· · · O 1j.· · · O 1c.O 1+.y i.O i1.· · · O ij.· · · O ic.O i+.y r O r1 · · · O rj · · · O rc O r+totale O +1 · · · O +j · · · O +c n(i) X e Y sono le due variabili considerate,(ii) {x 1 , . . . , x c } e {y 1 , . . . , y r } in<strong>di</strong>cano le modalità rispettivamente<strong>di</strong> X e <strong>di</strong> Y,(iii) O ij è il numero <strong>di</strong> unità statistiche nel campione che presentanosimultaneamente la modalità x j <strong>di</strong> X e la modalità y i <strong>di</strong>Y,(iv) O +j , j = 1, . . . , c, e O i+ , i = 1, . . . , r sono i totalirispettivamente <strong>delle</strong> colonne e <strong>delle</strong> righe, ovvero,O +j =r∑O ij e O i+ =i=1c∑O ij .j=1• Frequenze attese sotto l’ipotesi <strong>di</strong> in<strong>di</strong>pendenza. Sono calcolabilicomeA ij = O +jO i+(i = 1, . . . , r; j = 1, . . . , c).nConsideriamo, ad esempio, la tabella <strong>delle</strong> frequenze osservate sucui stiamo lavorando 3 . L’applicazione della formula alla prima cella,i = j = 1, daA ij = O +1O 1+n=516 × 721398= 26,6.La logica è semplice:− in totale abbiamo trovato 516 bimbi su 1398 con tonsille normali;− se non c’è <strong>di</strong>fferenza tra lo stato <strong>delle</strong> tonsille dei portatori e deinon portatori, la percentuale <strong>di</strong> portatori con tonsille normalidovrebbe essere circa uguale a 516/1398;− ma il numero dei portatori nel campione è 72 e quin<strong>di</strong>, in ipotesi<strong>di</strong> in<strong>di</strong>pendenza, ci aspettiamo <strong>di</strong> trovare circa72 × 5161398portatori con tonsille normali nel campione;− e così via per le altre celle della tabella.3 lucido 86.95 Unità ETonsille e Streptococcus pyogenes 96


• La tabella riporta le frequenze attese per tutte le celle.tonsillestreptococcus pyogenes + ++ + + + totaleportatore 26,6 30,3 15,1 72non portatore 489,4 558,7 277,9 1326totale 516 589 293 1298Si osservi che, rispetto alla tabella attesa, nella tabella osservata cisono troppi portatori con tonsille ingrossata e troppo pochi portatoricon tonsille normali. E che il viceversa accade per i non portatori.• X 2 misura, sostanzialmente, la <strong>di</strong>stanza esistente tra le frequenzeosservate e le frequenze attese. E’ definito comeNel caso in esameX 2 =X 2 =(19 − 26,6)226,6r∑i=1c∑j=1+ · · · +(O ij − A ij ) 2A ij.(269 − 277,9)2277,9= 7,88.La <strong>di</strong>stribuzione approssimata <strong>di</strong> X 2• E’ possibile mostrare 4 che se l’ipotesi <strong>di</strong> in<strong>di</strong>pendenza è vera enessuna frequenza attesa è troppo piccola allora la <strong>di</strong>stribuzione <strong>di</strong>X 2 può essere approssimata con la <strong>di</strong>stribuzione <strong>di</strong> una variabilecasuale 5 χ 2 .• La <strong>di</strong>stribuzione χ 2 <strong>di</strong>pende da un solo parametro, chiamato igra<strong>di</strong> <strong>di</strong> libertà della <strong>di</strong>stribuzione, che nel caso che stiamo trattando(verifica dell’ipotesi <strong>di</strong> in<strong>di</strong>pendenza in una tabella <strong>di</strong> contingenza),deve essere posto uguale a[(numero righetabella)]− 1 ×[( )numero colonnetabella]− 1Ad esempio, per la tabella in esame, i gra<strong>di</strong> <strong>di</strong> libertà sono 2 =(2 − 1) × (3 − 1).• L’approssimazione è ritenuta “decorosa” se la più piccola <strong>delle</strong>frequenze attese 6 è più grande <strong>di</strong> 5 e migliora man mano che questeaumentano.4 rinviamo al solito la <strong>di</strong>mostrazione <strong>di</strong> questo risultato a corsi più avanzati5 si veda [Probalità 9] per la definizione e per alcune proprietà <strong>di</strong> una variabile casuale χ 2 .6 si noti, quelle attese, non quelle osservate97 Unità ETonsille e Streptococcus pyogenes 98


Analisi grafica del risultatoLivello <strong>di</strong> significatività osservato (e suo calcoloapprossimato da una tavola dei percentili)• “Lontano da H 0 ” vuol <strong>di</strong>re per il test che stiamo considerando“grande”.• Quin<strong>di</strong>, in questo caso il livello <strong>di</strong> significatività osservato è laprobabilità, <strong>di</strong> osservare quando è vera H 0 un valore uguale omaggiore <strong>di</strong> quello osservato. Per i dati presentati in questa unità,⎛⎝livello⎞ ⎛significatività⎠ = Posservato⎝ χ2 con 2gra<strong>di</strong> libertà≥ 7,88⎞⎠0 2 4 6 8 10− Il grafico mostra la densità <strong>di</strong> una v.c. χ 2 con 2 gra<strong>di</strong> <strong>di</strong> libertà.L’asterisco sull’asse <strong>delle</strong> ascisse in<strong>di</strong>ca il valore osservato della<strong>statistica</strong> test.− Il valore è “moderatamente” ma non “esageratamente” spostatoverso destra, ovvero, verso H 1 .− La conclusione potrebbe essere una sorta <strong>di</strong> “dubbioso rifiuto <strong>di</strong>H 0 ”.L’area annerita corrispondeal livello <strong>di</strong> significatività osservato0 1.39 4.61 5.99 7.88 9.21 1299 Unità ETonsille e Streptococcus pyogenes 100


• Supponiamo ora <strong>di</strong> voler determinare un intervallo che locontenga conoscendo solo alcuni percentili della <strong>di</strong>stribuzione.• Ad esempio, supponiamo <strong>di</strong> conoscere solamente la seguentetabellap 0,5 0,90 0,95 0,99χ 2 2,p 1,39 4,61 5,99 9,21in cui χ 2 p(2) in<strong>di</strong>ca il percentile p-simo <strong>di</strong> un χ 2 con 2 gra<strong>di</strong> <strong>di</strong> libertà.• Il valore osservato (7,88) è compreso tra il 95-simo e il 99-simopercentile. Ora, per definizione, la probabilità <strong>di</strong> assumere un valorepiù grande del 95-simo (99-simo) percentile è 5% (1%). Perciò0,01 ≤ (livello significatività osservato) ≤ 0,05 (E.1)• I risultati sono quin<strong>di</strong> significativi al 5% ma non all’1%. I dati cisuggeriscono tendelzialmente <strong>di</strong> rifiutare l’ipotesi nulla ma non cosìchiaramente come ci è accaduto in altri casi.101 Unità E Tonsille e Streptococcus pyogenes 102


Ancora sull’X 2Unità FDove parleremo <strong>di</strong> “rapporto” tra maschi efemmine e <strong>di</strong> demenza senile• Ancora su X 2 e χ 2 .• Test <strong>di</strong> bontà dell’adattamento <strong>di</strong> un modello teoricocompletamente specificato per una multinomiale.• Test <strong>di</strong> omogeneità (uguaglianza) tra più multinomiali.• La <strong>statistica</strong>X 2 = ∑ irisulta utile per confrontare(O i − A i ) 2– un insieme <strong>di</strong> frequenze osservate O i , i = 1, . . . , k,– con <strong>delle</strong> frequenze attese, A i , i = 1, . . . , k calcolate ipotizzandoun particolare modello per il fenomeno <strong>di</strong> interesse.• Nella unità su “streptococchi e tonsille” 1 abbiamo utilizzato X 2come <strong>statistica</strong> test per verificare l’ipotesi <strong>di</strong> in<strong>di</strong>pendenza tra duevariabili.• In questa unità, accenniamo ad un paio <strong>di</strong> <strong>di</strong> altre situazioni inviene usata.A i1 unità EDove parleremo <strong>di</strong> “rapporto” tra maschi e . . . 104


Speriamo che sia femmina!• In un indagine, tra le altre cose, sono state raccolte informazionisu 1659 coppie con esattamente tre figli biologici.• La tabella mostra la <strong>di</strong>stribuzione <strong>di</strong> queste coppie per numero <strong>di</strong>figlie femmine.figlie femmine 0 1 2 3coppie 248 643 580 188• Le assunzioni <strong>di</strong> un possibile “modello” sono(i) il genere 2 <strong>di</strong> un nato è in<strong>di</strong>pendente dal genere <strong>di</strong> altri natisiano essi figli della stessa coppia o no;(ii) la probabilità <strong>di</strong> nascere femmina è 1/2 per i figli <strong>di</strong> tutte lecoppie e in<strong>di</strong>pendentemente dall’or<strong>di</strong>ne <strong>di</strong> nascita 3• In<strong>di</strong>chiamo con y = (O 0 , O 1 , O 2 , O 3 ) = (248, 643, 580, 188) ilvettore <strong>delle</strong> frequenze osservate. Se sono vere le ipotesi (i)-(ii)allora y è una determinazione <strong>di</strong> una variabile casuale multinomialecon numero <strong>di</strong> prove uguale a n = 1659 e probabilità <strong>di</strong> “cadere”nelle varie celle pari a (p 0 , p 1 , p 2 , p 3 ) dove 4p i = P((numero <strong>di</strong> femmine) = i) =( ) ( i ( 3 1=1 −i 2)2) 1 3−i=( ) ( ) 3 3 1== 1 ( 3i = 0, 1, 2, 3.i 2 8 i)• Con qualche semplice calcolop 0 = 0,125 p 1 = 0,375 p 2 = 0,375 p 3 = 0,125.• Il numero <strong>di</strong> coppie con i figlie femmine che ci saremmo aspettati,sulla base modello, <strong>di</strong> osservare èA i = np i = (numero coppie) × (probabilità i figlie femmine)• Le frequenze osservate e le frequenze attese non sono uguali.figlie femmine (i) 0 1 2 3frequenze osservate (O i ) 248 643 580 188frequenze attese (A i ) 207,375 622,125 622,125 207,375• E’ chiaro però che una parte <strong>delle</strong> <strong>di</strong>fferenze è dovuta al caso,ovvero, al fatto che stiamo considerando quelle 1659 coppie e nonaltre.• E’ quin<strong>di</strong> spontaneo domandarsi sela <strong>di</strong>fferenza tra frequenze osservate e frequenze attesepotrebbe essere tutta dovuta al caso?• La domanda può essere formalizzata come un problema <strong>di</strong> verifica<strong>di</strong> ipotesi:H 0 = la <strong>di</strong>stribuzione <strong>di</strong> y è Multinomiale(1659, (p 0 , p 1 , p 2 , p 3 ))versoche equivale aversoH 1 : H 0 è falsa;H 0 : il modello formulato è veroH 1 : il modello formulato è falso.Vogliamo cioè valutare la bontà dell’adattamento del modello ai dati.2 femmina/maschio.3 ovvero, per il primo nato, per il secondo,. . .4 infatti nelle ipotesi del modello il numero <strong>di</strong> figlie femmine è una binomiale con numero <strong>di</strong>prove par a tre e probabilità <strong>di</strong> successo uguale a 1/2.105 Unità FDove parleremo <strong>di</strong> “rapporto” tra maschi e . . . 1<strong>06</strong>


• La <strong>statistica</strong>X 2 =3∑i=0(O i − A i ) 2A i=(248 − 207,375)2 (188 − 207,375)2+·+ ≈ 13,32207,75207,375misura la <strong>di</strong>stanza tra le frequenze osservate e quelle attese, ovvero,tra quello che conosciamo del mondo (i dati) e il modello.• Ovviamente più X 2 è grande più i dati “mettono in crisi” ilmodello.• Se H 0 è vera 5 , allora X 2 converge in <strong>di</strong>stribuzione ad una variabilecasuale χ 2 con k − 1 gra<strong>di</strong> <strong>di</strong> libertà dove k in<strong>di</strong>ca il “numero<strong>delle</strong> frequenze”, ovvero quello <strong>delle</strong> “celle” della <strong>di</strong>stribuzionemultinomiale, ovvero, nel caso in esame 4.• Il valore <strong>di</strong> X 2 deve quin<strong>di</strong> essere confrontato con i valori attesida questa <strong>di</strong>stribuzione.• Un’occhiata ad una tavola dei quantili mostra che il valore <strong>di</strong> X 2nel caso in esame è maggiore del quantile 0,99 <strong>di</strong> un χ 2 con tregra<strong>di</strong> <strong>di</strong> libertà. Il livello <strong>di</strong> significatività osservato è quin<strong>di</strong> minore<strong>di</strong> 0,01. I dati sono altamente significativi contro H 0 : il modello nonsembrerebbe quin<strong>di</strong> adeguato a spiegare la realtà.Esercizio (e spiegazione). Si ritiene che la proporzione <strong>di</strong> bimbetra i nati sia, in tutto il mondo, pari al 48,6% ovvero, ogni 100 nuovebimbe nascono me<strong>di</strong>amente circa 1<strong>06</strong> bimbi maschi. Verificare che ilmodello formulato sembra fornire una più che adeguata descrizionedei dati osservati quando si utilizza questa probabilità <strong>di</strong> nascerefemmina (e non 0,5, come precedentemente fatto).Demenza senile• Per capire se una particolare alterazione neuronale può essereassociata con la presenza <strong>di</strong> demenza senile 6 l’alterazione stessa èstata valutata su 100 persone affetti da demenza e su 100 personenon affette 7 .• Tutti gli in<strong>di</strong>vidui coinvolti nello stu<strong>di</strong>o hanno almeno 70 anni epossono essere pensati come scelti a caso, rispettivamente, nelle duepopolazioni:A. persone con almeno 70 con demenza senile conclamata;B. persone con almeno 70 senza segni <strong>di</strong> demenza senile.• I dati racolti sono riassunti nella seguente tabella.alterazione neuronaleassente leggera importante totaledemenza 2 41 57 100non demenza 11 57 32 100totale 13 98 89 200• La domanda a cui vogliamo tentare <strong>di</strong> dare una risposta con questidati è ovviamentela presenza della demenza è legata all’alterazione neuronaleconsiderata? ovvero, tra presenza della demenza ealterazione esiste una qualche forma <strong>di</strong> <strong>di</strong>pendenza?• La struttura dei dati e la domanda che ci poniamo è ugualea quanto incontrato quando abbiamo parlato <strong>di</strong> “streptococchi etonsille” 8 .• Il dati però sono stati raccolti seguendo un <strong>di</strong>segno campionario<strong>di</strong>fferente.5 ovvero se y è realmente una multinomiale con le probabilità <strong>di</strong> “cadere” nelle varie classisuggerite dal modello e quin<strong>di</strong> tra l’altro completamente specificate107 Unità F6 che costituisce una precisa patologia.7 o quantomeno senza segni clinici <strong>di</strong> demenza senile.8 unità EDove parleremo <strong>di</strong> “rapporto” tra maschi e . . . 108


• Nel caso degli “streptococchi e tonsille” la tabella <strong>di</strong> contingenzaera stata ottenuta(i) estraendo n in<strong>di</strong>vidui dalla popolazione <strong>di</strong> riferimento(ii) e poi rilevando su ciascun in<strong>di</strong>viduo le due variabili presenza<strong>di</strong> streptococco e stato <strong>delle</strong> tonsille.Il risultato è che le frequenze congiunte della tabella possono essere,tutte insieme, pensate come una determinazione <strong>di</strong> una variabilecasuale multinomiale.• Nel caso in esame viceversa le unità statistiche sono state estratteseparatamente da due <strong>di</strong>fferenti popolazioni: quella degli anzianicon e senza demenza. Poi su ciascun in<strong>di</strong>viduo è stata rilevata lavariabile alterazione neuronale.• In questo caso quin<strong>di</strong> possiamo pensare che– la prima riga della tabella sia la determinazione <strong>di</strong> una variabilecasuale multinomiale che descrive il comportamento dell’alterazioneneuronale nella popolazione degli anziani con demenzae– la seconda riga sia la determinazione <strong>di</strong> un altra variabilecasuale multinomiale che descrive il comportamento dell’alterazioneneuronale nella popolazione degli anziani senzademenza.• Potremmo <strong>di</strong>re che nel caso “streptococco e tonsille” i ricercatoriavevano utilizzato “una sola urna” mentre in questo caso perottenere i dati sono state utilizzate “due <strong>di</strong>fferenti urne”.• Questo fatto emerge anche dal fatto che, nel caso che stiamoconsiderando, la <strong>di</strong>stribuzione marginale della variabile presenza <strong>di</strong>demenza non è il risultato <strong>di</strong> un esperimento causale ma è statafissata a priori dai ricercatori prima dell’esperimento.Viceversa nel caso “streptococco e tonsille” nessuna marginale eranota a priori.• In una situazione del tipo considerato (campionamento separatoda più popolazioni) quello che vogliamo verificare è se le “multinomialicoinvolte” sono tra <strong>di</strong> loro omogenee ovvero assegnano lastessa probabilità alle varie modalità.• Sembra sensato anche in questo caso calcolare la tabella <strong>delle</strong>frequenze attese in maniera uguale a quanto fatto nel caso <strong>di</strong>in<strong>di</strong>pendenza.• Ad esempio, se non ci fossero <strong>di</strong>fferenze tra le <strong>di</strong>stribuzioni dellavariabile <strong>di</strong> interesse (alterazione neuronale) nelle due popolazioni(persone con e senza demenza) quante persone con “alterazioneimportanti” ci aspetteremmo <strong>di</strong> osservare tra le persone condemenza?Visto che le persone con “alterazione importante” sono 89 su untotale <strong>di</strong> 200 in<strong>di</strong>vidui e che le persone con demenza sono 100sembra sensato rispondere che, se non ci sono <strong>di</strong>fferenze tra le duepopolazioni, circa89100 = 44,5200persone con demenza dovrebbero presentare una “alterazionegrave”.• La tabella mostra le frequenze attese per tutte le cellealterazione neuronaleassente leggera importante totaledemenza 6,5 49 44,5 100non demenza 6,5 49 44,5 100totale 13 98 89 200109 Unità FDove parleremo <strong>di</strong> “rapporto” tra maschi e . . . 110


• Per misurare la “<strong>di</strong>stanza” tra le frequenze osservate e lefrequenze attese possiamo, al solito, usare X 2 .X 2 (2 − 6,5)2 (41 − 49)2 (57 − 44,5)2= + + +6,5 49 44,5(11 − 6,5)2 (57 − 49)2 (32 − 44,5)2+ + +6,5 49 44,5≈ 15,86=• Ovviamente, più X 2 è grande più i dati sono lontani da quanto ciaspettiamo nell’ipotesi <strong>di</strong> omogeneità.• Nonostante il <strong>di</strong>segno campionario sia <strong>di</strong>fferente da quello consideratonel caso “streptococco e tonsille” è possibile <strong>di</strong>mostrare chela <strong>di</strong>stribuzione asintotica della <strong>di</strong>stribuzione <strong>di</strong> X 2 rimane, almenosotto l’ipotesi nulla, la stessa 9 .• Quin<strong>di</strong>, per capire che cosa i dati ci raccontano sulla omegeità<strong>delle</strong> varie righe, possiamo confrontare il valore calcolato <strong>di</strong> X 2 coni valori plausibili per una <strong>di</strong>stribuzione χ 2 con gra<strong>di</strong> <strong>di</strong> libertà ugualia [( ) ] [( ) ]numero righenumero colonne− 1 ×− 1tabellatabellaOvvero, nel nostro caso (2 − 1) × (3 − 1) = 2.• 15,86 è più grande del quantile 0,999 <strong>di</strong> un χ 2 (2). Quin<strong>di</strong> il livello<strong>di</strong> significatività osservato è in questo caso minore <strong>di</strong> 0,001: i dati cistanno suggerendo che esistono <strong>delle</strong> <strong>di</strong>fferenze tra le due popolazionie quin<strong>di</strong> che l’alterazione neuronale considerata è associataalla presenza o meno <strong>di</strong> demenza.9 rimane anche invariata la “regola a spanne” per utilizzarla: le frequenze attese devono tutteessere maggiori <strong>di</strong> 5.111 Unità F Dove parleremo <strong>di</strong> “rapporto” tra maschi e . . . 112


Un esperimento su un sonniferoUnità GDove facciamo conoscenza con uno statisticobirraio· Test t <strong>di</strong> Student ad un campione.· Intervalli <strong>di</strong> confidenza per la me<strong>di</strong>a <strong>di</strong> una normale quando lavarianza non è nota.· Normal probability plot· Test <strong>di</strong> Shapiro-Wilk• Per verificare l’efficacia <strong>di</strong> una nuova sostanza “sonnifera” 1 , su<strong>di</strong>eci in<strong>di</strong>vidui, è stata misurata la variabile, denominata ore <strong>di</strong>extra sonno, definita come⎛⎞ ⎛⎞⎜⎟⎝⎠ − ⎜⎟⎝⎠ore <strong>di</strong> sonno in unanotte in cui vienesomministrato ilsonnifero• Le <strong>di</strong>eci osservazioni ottenute sonoore <strong>di</strong> sonno in unanotte in cui vienesomministrato unplacebo0,7 − 1,6 − 0,2 − 1,2 − 0,1 3,4 3,7 0,8 0,0 2,0• La me<strong>di</strong>a <strong>delle</strong> <strong>di</strong>eci misure <strong>di</strong>sponibili per questa variabile è 0,75.• Quin<strong>di</strong>, se restringiamo l’attenzione ai <strong>di</strong>eci in<strong>di</strong>vidui consideratie alle notti in cui è stato condotto l’esperimento, il sonniferoha avuto l’effetto atteso, ovvero gli in<strong>di</strong>vidui hanno me<strong>di</strong>amentedormito <strong>di</strong> più 2 .• E’ però spontaneo porsi la domanda:sulla base <strong>di</strong> questi risultati ci aspettiamo che la sostanzaabbia effetto in generale, ovvero anche su altri in<strong>di</strong>vidui acui potremmo somministrarla?1 a cui ho già accennato nei <strong>luci<strong>di</strong></strong> <strong>di</strong> Descrittiva2 anzi, parecchio <strong>di</strong> più (circa 45 minuti) visto che gli in<strong>di</strong>vidui a cui era stato somministrato ilsonnifero non avevano particolari problemi <strong>di</strong> insonnia.Dove facciamo conoscenza con uno statistico . . . 114


Un possibile modello <strong>di</strong> riferimento• Consideriamo l’insieme <strong>di</strong> tutti gli in<strong>di</strong>vidui a cui potremmosomministrare il farmaco. Si tratta ovviamente <strong>di</strong> un insieme moltogrande.• Le ore <strong>di</strong> extra sonno sono il risultato <strong>di</strong> un miriado <strong>di</strong>fattori (l’attitu<strong>di</strong>ne al sonno degli in<strong>di</strong>vidui, la resistenza al farmaco,che cosa gli in<strong>di</strong>vidui possono avere mangiato a cena, se unazanzara li ha punti durante la notte,. . . ). Ora se tutti questi fattorisi “compongono” in maniera ad<strong>di</strong>tiva possiamo pensare sulla basedel teorema del limite centrale che la <strong>di</strong>stribuzione <strong>delle</strong> ore <strong>di</strong>extra sonno nella popolazione possa essere ben approssimata dauna <strong>di</strong>stribuzione normale <strong>di</strong> appropriata me<strong>di</strong>a e varianza, <strong>di</strong>ciamoµ e σ 2 .• Supponiamo inoltre che gli in<strong>di</strong>vidui scelti per l’esperimentonon abbiano caratteristiche particolari e quin<strong>di</strong> siano assimilabiliad in<strong>di</strong>vidui estratti casualmente dalla popolazione. Ed anche,come del resto era effettivamente accaduto, che siano stati tenutiseparati durante l’esperimento in maniera tale che non si siano“con<strong>di</strong>zionati” a vicenda.• Allora, se tutto questo è vero, possiamo vedere i dati osservati,in<strong>di</strong>chiamoli al solito con y 1 , . . . , y 10 , come <strong>delle</strong> determinazioniin<strong>di</strong>pendenti ed identicamente <strong>di</strong>stribuiti <strong>di</strong> una N(µ, σ 2 ).Due precisazioni(i) In realtà la frase “tutti gli in<strong>di</strong>vidui a cui potremmosomministrare il farmaco” è eccessivamente generica.I risultati possono essere estesi propriamente solamente ad in<strong>di</strong>viduicon le stesse caratteristiche <strong>di</strong> quelli che fanno parte del campione.Ad esempio se il campione fosse costituito solo da “donne sopra i 50anni” l’insieme <strong>di</strong> queste donne costituirebbe la nostra popolazione<strong>di</strong> riferimento.(ii) Il modello suggerito per interpretare i dati è simile a quelloconsiderato nell’unità A. La <strong>di</strong>fferenza è che in quell’unità σ 2 eranoto (od almeno assunto tale). Qui è un parametro ignoto.115 Unità GDove facciamo conoscenza con uno statistico . . . 116


Normal probability plot e test <strong>di</strong> Shapiro-WilkDomanda. E’ plausibile il modello suggerito?Risposta. Beh, quando gli statistici non sanno qualcosa cercano <strong>di</strong>interrogare i dati.Come possiamo farlo? Per farlo useremo un proce<strong>di</strong>mento grafico(normal probability plot) e uno analitico (test <strong>di</strong> normalità <strong>di</strong>Shapiro-Wilk).Statistica or<strong>di</strong>nata. Siano y 1 , . . . , y n n osservazioni su <strong>di</strong> unavariabile numerica. Una permutazione y (1) , . . . , y (n) <strong>di</strong> y 1 , . . . , y ntale chey (1) ≤ y (2) ≤ · · · ≤ y (n−1) ≤ y (n)è detta <strong>statistica</strong> or<strong>di</strong>nata.In parole semplici: la <strong>statistica</strong> or<strong>di</strong>nata è l’insieme dei valori osservatior<strong>di</strong>nati dal più piccolo al più grande. Quin<strong>di</strong>, ad esempio, y (1)è l’osservazione più piccola.Statistica or<strong>di</strong>nata e quantili. y (j) può essere visto 3 come unastima del quantile-p della <strong>di</strong>stribuzione che ha generato i dati conp ≈ j/nInfatti, esattamente o approssimativamente, la frazione <strong>di</strong>osservazioni minori o uguali <strong>di</strong> y (j) è j/n.Quantili <strong>di</strong> una <strong>di</strong>stribuzione normale. E’ facile verificare 4 chese Y ∼ N(µ, σ 2 ) allora (quantile-p <strong>di</strong> Y) = µ + σz pdove z p in<strong>di</strong>ca il quantile-p <strong>di</strong> una normale standard.Normal probability plot. Consideriamo un grafico ottenuto <strong>di</strong>segnandosu <strong>di</strong> un piano cartesiano i punti(zj−0,5, y (j) ).nIl grafico (o sue varianti in cui z (j−0,5)/n è sostituito da analoghequantità “vicine” a z j/n ) è chiamato normal probability plot.Si osservi che si tratta <strong>di</strong> un grafico in cui <strong>di</strong>segnamo nella sostanzai quantili campionari verso i quantili <strong>di</strong> una <strong>di</strong>stribuzione teorica.Per questo motivo è un esempio dei cosidetti grafici “quantile versoquantile”.Per quanto riguarda l’interpretazione si osservi che:· se i dati sono normali ci aspettiamo <strong>di</strong> osservare un andamento,almeno approssimativamente, lineare; infatti, per quanto detto, ciaspettiamo, almeno se n non è piccolo 5 , chey (j) ≈ µ + σzj−0,5;n· viceversa se il grafico suggerisce un andamento non lineare questoin<strong>di</strong>ca che i quantili della <strong>di</strong>stribuzione dei dati non “si comportano”come quelli <strong>di</strong> una <strong>di</strong>stribuzione normale ovvero che la <strong>di</strong>stribuzionedei dati non è normale;La linearità del grafico può quin<strong>di</strong> essere utilizzata per dare ungiu<strong>di</strong>zio sulla normalità della <strong>di</strong>stribuzione che li ha generati.Domanda: Perchè usiamo z (j−0,5)/n e non z j/n ?Risposta: Perchè z 1 = z n/n = +∞ e quin<strong>di</strong> dovremmo <strong>di</strong>segnarel’osservazione più grande ad infinito.3 almeno nei casi in cui la <strong>di</strong>stribuzione dei dati non sia “troppo <strong>di</strong>screta” (ovvero, in cui i valori<strong>di</strong>stinti tra le osservazioni non siano molto pochi).4 [Probalità 8]117 Unità G5 ovvero, almeno quando i dati permettono una stima dei decorosa dei quantiliDove facciamo conoscenza con uno statistico . . . 118


Esempio: campioni generati da una <strong>di</strong>stribuzione normaleEsempio: campioni generati da una <strong>di</strong>stribuzione esponenzialequantili empirici−2 −1 0 1 2quantili empirici−1 0 1 2−2 −1 0 1 2−2 −1 0 1 2quantili teoriciquantili teoriciquantili empirici−2.0 −1.0 0.0 1.0quantili empirici−1 0 1 2 3quantili empirici0 1 2 3 40.0 1.0 2.0 3.0−2 −1 0 1 2−2 −1 0 1 2quantili teoriciquantili teoriciquantili empirici0.0 0.5 1.0 1.5 2.0quantili empirici0 1 2 3quantili empirici−2 −1 0 1 2−2 −1 0 1 2−2 −1 0 1 2−2 −1 0 1 2quantili teoriciquantili teoriciquantili teoriciquantili teoriciI grafici sono basati su 4 campioni <strong>di</strong> numerosità pari a 30 simulatida una <strong>di</strong>stribuzione normale standard. In questo caso le considerazioniprecedenti ci suggeriscono che i punti dovrebbero, come infattiaccade, stare intorno alla bisettrice del 1 ◦ e 3 ◦ quadrante.Si osservi inoltre come le maggiori deviazioni da una ipotetica rettasi osservano agli estremi. Questa è una conseguenza della maggiorevariabilità <strong>di</strong> y (j) quando j è “piccolo” (vicino a 1) e “grande” (vicinoa n).119 Unità GI grafici sono basati su 4 campioni <strong>di</strong> numerosità pari a 30 simulatida una <strong>di</strong>stribuzione esponenziale <strong>di</strong> me<strong>di</strong>a 1. Si osservi che ilquantile-p <strong>di</strong> questa <strong>di</strong>stribuzione vale − log(1 − p). Quin<strong>di</strong>, i puntili aspettiamo in questa caso intorno alla curva (z p , −log(1 − p)),0 < p < 1, che è <strong>di</strong>segnata a pagina 121.Dove facciamo conoscenza con uno statistico . . . 120


Quantili <strong>di</strong> una <strong>di</strong>stribuzione esponenziale <strong>di</strong> me<strong>di</strong>a 1 versoquelli <strong>di</strong> una normale standard.Esempio: campioni generati da una <strong>di</strong>stribuzione uniformequantili esponenziale0 1 2 3 4 5quantili empiriciquantili empirici0.2 0.4 0.6 0.80.0 0.2 0.4 0.6 0.8−2 −1 0 1 2quantili teoriciquantili empiriciquantili empirici0.0 0.2 0.4 0.6 0.8 1.00.2 0.4 0.6 0.8 1.0−2 −1 0 1 2quantili teorici−2 −1 0 1 2quantili normale−2 −1 0 1 2quantili teorici−2 −1 0 1 2quantili teoriciI grafici sono basati su 4 campioni <strong>di</strong> numerosità pari a 30 simulatida una <strong>di</strong>stribuzione con densità uniforme tra 0 e 1. Si osservi cheil quantile-p <strong>di</strong> questa <strong>di</strong>stribuzione vale p. Quin<strong>di</strong>, i punti li aspettiamoin questa caso intorno alla curva (z p , p), 0 < p < 1, che è<strong>di</strong>segnata a pagina 123.121 Unità GDove facciamo conoscenza con uno statistico . . . 122


Quantili <strong>di</strong> una <strong>di</strong>stribuzione uniforme tra 0 e 1 verso quelli <strong>di</strong>una normale standard.quantili uniforme0.0 0.2 0.4 0.6 0.8 1.0−2 −1 0 1 2quantili normaleSi osservi come la relativamente lunga parte lineare centrale possarendere <strong>di</strong>fficile <strong>di</strong>sciminare tra una <strong>di</strong>stribuzione normale e una<strong>di</strong>stribuzione uniforme. E’ ad esempio quello che accade nel graficoin basso a destra nella figura precedente.test <strong>di</strong> Shapiro-Wilk Sul normal probability plot è basato uno deimolti test <strong>di</strong> normalità esistenti, ovvero, uno dei molti test che sonostati proposti per verificare il sistema d’ipotesi{H0 : la <strong>di</strong>stribuzione dei dati è normaleH 1 : la <strong>di</strong>stribuzione dei dati non è normale .Il test, detto <strong>di</strong> Shapiro-Wilk dal nome degli autori, si basa su <strong>di</strong> una<strong>statistica</strong> che, nella sostanza, è il coefficiente <strong>di</strong> correlazione tra ipunti <strong>di</strong>segnati nel normal probability plot.Breve <strong>di</strong>alogoStudente: cosa vuol <strong>di</strong>re “nella sostanza”? E’ o non e’ il coefficiente <strong>di</strong> correlazione?Professore: la <strong>statistica</strong> test è una versione “appena appena” aggiustata del coefficiente<strong>di</strong> correlazione; l’aggiustamento apportato cerca <strong>di</strong> controbilanciare lacorrelazione che in ogni caso ci aspettiamo <strong>di</strong> trovare visto che i punti del normalprobability plot sono in ogni caso posti su <strong>di</strong> una curva non decrescente.S: ma come posso calcolare la <strong>statistica</strong> test?P: solo un masochista la calcola a mano! per il calcolo è necessario un calcolatorecon una funzione appropriata (in R la funzione si chiama shapiro.test); perquesto motivo, vista la natura introduttiva del corso, non ti annoio con la formulaprecisa.S: resta però inteso che rifiuto per valori troppo piccoli (lontani da uno) mentrepiù la <strong>statistica</strong> test è vicina ad uno più la interpreto come “i dati sostengono H 0 ”?P: certo.S: ma quanto lontana deve essere da uno questa benedetta <strong>statistica</strong> perchè iopossa iniziare a dubitare <strong>di</strong> H 0 ?P: se il programma che usi è ragionevole calcolerà per te il livello <strong>di</strong> significativitàosservato; oramai hai imparato ad interpretarlo; quin<strong>di</strong>. . .S: almeno un esempio svolto posso vederlo?P: beh, se tu girassi pagina al posto <strong>di</strong> fare sempre domande!123 Unità GDove facciamo conoscenza con uno statistico . . . 124


Un esperimento su <strong>di</strong> un sonniferoStima dei parametri del modelloquantili empirici−1 0 1 2 3−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5quantili teorici• Viste anche le verifiche effettuate, proviamo a rispondere alladomanda sull’efficacia del sonnifero assumendo il modello suggeritoprima, ovvero, ipotizzando che le osservazioni sulle ore <strong>di</strong> extrasonnosiano determinazioni in<strong>di</strong>pendenti <strong>di</strong> una variabile casualeN(µ, σ 2 ).• La <strong>di</strong>stribuzione del fenomeno considerato è nota con l’eccezionedei due parametri µ e σ 2 .• Sembra quin<strong>di</strong> ragionevole “iniziare” cercando <strong>di</strong> stimare questidue parametri dai dati.• Gli stimatori più usati per µ e σ 2 sono rispettivamente la me<strong>di</strong>a ela varianza campionaria ovveroey = 1 ns 2 = 1n − 1n∑y i ≈ 0,75i=1n∑(y i − y) 2 ≈ 3,20i=1dove, al solito, n in<strong>di</strong>ca il numero <strong>delle</strong> osservazioni (perl’esperimento considerato n = 10).Il grafico mostra il normal probability plot dei dati sulle ore <strong>di</strong> extrasonno.La linearità sembra buona.Il valore della <strong>statistica</strong> su cui è basato il test <strong>di</strong> Shapiro-Wilk vale inquesto caso 0,926, il relativo livello <strong>di</strong> significatività osservato 0,408.Questo valore è elevato per dubitare della normalità dei dati.125 Unità GDove facciamo conoscenza con uno statistico . . . 126


Un problema <strong>di</strong> verifica d’ipotesi• Un sistema d’ipotesi interessante in questo caso è{H0 : µ = µ 0H 1 : µ ≠ µ 0con µ 0 = 0.Accettare H 0 , infatti, equivale a <strong>di</strong>re che, in me<strong>di</strong>a, prendendo ilfarmaco non si dorme né <strong>di</strong> più né <strong>di</strong> meno.• Per verificare un sistema d’ipotesi analogo nell’unità B avevamoutilizzato come <strong>statistica</strong> test√ n(y − µ0 )z =.σPerò in questa unità noi non conosciamo σ. Quin<strong>di</strong> z non è<strong>di</strong>rettamente utilizzabile.• Dall’altra parte, poichè abbiamo a <strong>di</strong>sposizione una stima <strong>di</strong> σ,una <strong>statistica</strong> test analoga a z è√ n(y − µ0 )t oss =.sL’oss che abbiamo posto a denominatore è l’abbreviazione <strong>di</strong>“osservato”.• Se H 0 (H 1 ) è vera ci aspettiamo che t oss assuma valori intorno allo(lontani dallo) zero.Quanto deve essere lontana da zero t oss perconcludere che H 0 è implausibile?• Per rispondere alla domanda avremmo bisogno <strong>di</strong> sapere qual’èla <strong>di</strong>stribuzione <strong>di</strong> t oss quando H 0 è vera. Infatti, questa <strong>di</strong>stribuzioneci “racconta” quali sono i valori <strong>di</strong> t oss che ci aspettiamo sottol’ipotesi nulla.• Sappiamo che la <strong>di</strong>stribuzione <strong>di</strong> z è normale. Potremmo perciòpensare <strong>di</strong> approssimare la <strong>di</strong>stribuzione <strong>di</strong> t con quella <strong>di</strong> unaN(0, 1).• La sostituzione del vero σ con s non può però essere “indolore”nel caso <strong>di</strong> piccoli campioni in cui l’errore con cui s stima σ potrebbeanche essere grande.E’ però possibile nelle nostre ipotesi (normalità <strong>delle</strong> osservazioni,in<strong>di</strong>pendenza,. . . ) mostrare che 6t oss ∼ t <strong>di</strong> Student con n − 1 gra<strong>di</strong> <strong>di</strong> libertà.Il test che stiamo descrivendo viene usualmente chiamato test t a uncampione.6 [Probalità 14] e [Probalità 43]127 Unità GDove facciamo conoscenza con uno statistico . . . 128


0.0 0.1 0.2 0.3 0.4Analisi grafica del risultato−4 −2 0 2 4· Il valore <strong>di</strong> t oss calcolato sui dati del primo sonnifero è 1,33. Nelgrafico il valore è in<strong>di</strong>cato dall’asterisco sull’asse <strong>delle</strong> ascisse.· La curva mostra la densità <strong>di</strong> una t <strong>di</strong> Student con 9 gra<strong>di</strong> <strong>di</strong>libertà.· Il valore osservato sembra “compatibile” con la <strong>di</strong>stribuzione<strong>di</strong>segnata.· Quin<strong>di</strong>, non abbiamo elementi nei dati per rifiutare H 0 , ovvero,non possiamo affermare sulla base dei risultati sperimentali che ilnuovo sonnifero ha una qualche effetto sulla me<strong>di</strong>a.129 Unità GAnalisi me<strong>di</strong>ante il livello <strong>di</strong> significatività osservato• “Lontano da H 0 ” equivale a “lontano da zero in ambedue le<strong>di</strong>rezioni”. Quin<strong>di</strong>, nel caso del sonnifero,⎛⎞livello <strong>di</strong>⎝significatività⎠ = P(|t con 9 gra<strong>di</strong> <strong>di</strong> libertà| ≥ 1,33).osservatoche, per la simmetria della t <strong>di</strong> Student, possiamo anche calcolarecome ⎛ ⎞livello <strong>di</strong>⎝significatività⎠ = 2 × P(t con 9 gra<strong>di</strong> <strong>di</strong> libertà ≥ 1,33).osservato• Disponendo solo <strong>di</strong> una tabella dei percentili, del tipo ad esempiocontenuto in “Formule e Tavole”, possiamo, come fatto nell’unitàprecedente, determinare un intervallo che lo contiene.• In particolare, dalla tabella ve<strong>di</strong>amo che 1,33 è compreso tra il75% e il 90% percentile <strong>di</strong> una t con 9 gra<strong>di</strong> <strong>di</strong> libertà. Quin<strong>di</strong>,Ma allora0,10 < P(t con 9 gra<strong>di</strong> <strong>di</strong> libertà ≥ 1,33) < 0,25.⎛0,2 < ⎝livello <strong>di</strong>significativitàosservato⎞⎠ < 0,5• Per quello che riguarda l’interpretazione la prima <strong>di</strong>suguaglianzaè la più importante. Ci racconta infatti che se il sonnifero non ha uneffetto sulla me<strong>di</strong>a <strong>delle</strong> ore <strong>di</strong> extra sonno allora noi ci aspetteremmovalori “più lontani da H 0 <strong>di</strong> quanto osservato” con unafrequenza superiore al 20% (ovvero, più <strong>di</strong> una volta ogni 5 replicazionidell’esperimento). Questo, vuol <strong>di</strong>re che il valore osservato <strong>di</strong>t oss non è “strano” quando H 0 è vera.• In conclusione, i dati ci <strong>di</strong>cono che non abbiamo elementi perrifiutare l’ipotesi nulla.Dove facciamo conoscenza con uno statistico . . . 130


accettareH 0Una regola del tipo accetto/rifiutodeterminare t 1−α/2 (n − 1)√ n(y − µ0 )calcolare t oss =sallora se|t oss | ≤ t 1−α/2 (n − 1)altrimentirifiutareH 0Con i datiSupponiamo <strong>di</strong> porre α = 0,01. Allorat 1−α/2 (n − 1) = t 9,0,995 = 3,25t oss = 1,33−3,25 ≤ 1,33 ≤ 3,25 ?siaccettiamo H 0Nell’albero t p (g) in<strong>di</strong>ca il percentile p-simo <strong>di</strong> una t <strong>di</strong> Student cong gra<strong>di</strong> <strong>di</strong> libertà. E’ facile far vedere che l’albero fornisce una regolaper accettare/rifiutare l’ipotesi nulla che garantisce cheP(accettare H 0 quando H 0 è vera) = 1 − α131 Unità GDove facciamo conoscenza con uno statistico . . . 132


Un intervallo <strong>di</strong> confidenza· Un intervallo <strong>di</strong> confidenza per µ può essere determinato, dairisultati precedenti utilizzando lo stesso ragionamento seguitonell’unità B.· Infatti quello che sappiamo è che se µ è il vero valore della me<strong>di</strong>aalloraP(−t 1−α/2 (n − 1) ≤ √ n(y − µ)/s ≤ t 1−α/2 (n − 1)) = 1 − α.EsercizioPer una variante del sonnifero considerato si sono ottenute leseguenti ore <strong>di</strong> extra-sonno:1,9 0,8 1,1 0,1 − 0,1 4,4 5,5 1,6 4,6 3,4Discutere l’efficacia della variante.Ma allora, scrivendo le due <strong>di</strong>suguglianze in termini <strong>di</strong> µ, troviamocheP(y − st 1−α/2 (n − 1)/ √ n ≤ µ ≤ y + st 1−α/2 (n − 1)/ √ n) = 1 − αovvero che[y − st 1−α/2(n − 1)√ ; y − st ]1−α/2(n − 1)√ n nè un intervallo <strong>di</strong> confidenza <strong>di</strong> livello 1 − α per la me<strong>di</strong>a.· Applicazione ai dati. Supponiamo, ad esempio, <strong>di</strong> voler un intervalloche contenga con probabilità 90% il vero valore <strong>di</strong> µ. Allora,t 1−α/2 (n − 1) = t 0,95 (9) = 1,83. Ricordando che y = 0,75 e s 2 ≈ 3,2e quin<strong>di</strong> che s ≈ √ 3,2 ≈ 1,79, la semi-ampiezza dell’intervallorichiesto è1,79 × 1,831,04 = √10mentre l’intervallo stesso è[0,75 − 1,04 ; 0,75 + 1,04] = [−0,29 ; 1,79]· Si osservi che l’intervallo include lo zero. Questo era atteso vistoche avevamo visto, con il test <strong>di</strong>scusso precedentemente, che unvalore nullo per µ era plausibile sulla base dei dati <strong>di</strong>sponibili.133 Unità GDove facciamo conoscenza con uno statistico . . . 134


Il problema e i datiUnità HCuculi, scriccioli, pettirossi e DarwinTest t a due campioni.• E’ noto che i cuculi depongono le proprie uove nei ni<strong>di</strong> <strong>di</strong> altriuccelli a cui viene poi lasciato il compito della cova.• E’ possibile osservare una certa associazione tra territorio e uccelloscelto come “ospite”, ovvero, in certi territori i cuculi sembranopreferire una specie <strong>di</strong> uccello come “ospite”, in altri un altra.• Sulla base della teoria della selezione naturale, ci si aspetta quin<strong>di</strong>una qualche forma <strong>di</strong> adattamento dell’uovo del cuculo a quelladell’uccello “ospite”.Infatti, la probabilità <strong>di</strong> un uovo <strong>di</strong> essere covato (che viste le abitu<strong>di</strong>nidel cuculo influenza non poco la sopravvivenza del suo patrimoniogenetico) dovrebbe essere tanto più alta quanta più le uova“abusive” sono simili a quelle dell’uccello “ospite”.• Per verificare questa idea sono state misurate le lunghezze (inmm) <strong>di</strong> alcune uova <strong>di</strong> cuculo trovate in ni<strong>di</strong> <strong>di</strong> pettirossi e <strong>di</strong> scriccioliin due territori, uno in cui i cuculi “preferiscono” i pettirossi,l’altro in cui “preferiscono” gli scriccioli.Cuculi, scriccioli, pettirossi e Darwin 136


I datiUova deposte in ni<strong>di</strong> <strong>di</strong> pettirosso:21,05 21,85 22,05 22,05 22,05 22,25 22,45 22,4522,65 23,05 23,05 23,05 23,05 23,05 23,25 23,85Uova deposte in ni<strong>di</strong> <strong>di</strong> scricciolo:19,85 20,05 20,25 20,85 20,85 20,85 21,05 21,0521,05 21,25 21,45 22,05 22,05 22,05 22,2520 21 22 23 24ospite me<strong>di</strong>a me<strong>di</strong>ana sqm madpettirosso 22,57 22,55 0,68 0,5scricciolo 21,13 21,05 0,74 0,4pettirossiscriccioliPrimi commenti• Gli scriccioli sono scriccioli e quin<strong>di</strong> le loro uova sono più piccole<strong>di</strong> quelle dei pettirossi! La <strong>di</strong>fferenza che ci si aspetta a priori tra idue gruppi ha quin<strong>di</strong> a che fare con la posizione della <strong>di</strong>stribuzione.• A livello puramente descrittivo, ovvero senza tenere conto <strong>di</strong>eventuali errori dovuti al fatto che conosciamo solamente lelunghezze <strong>di</strong> 31 uova (16 in un gruppo, 15 nell’altro), gli in<strong>di</strong>ci<strong>di</strong> posizione (me<strong>di</strong>a e me<strong>di</strong>ana) e il <strong>di</strong>agramma a scatola con baffisuggeriscono che questo adeguamento all”’ospite” sia avvenuto.• La breve analisi fatta e in particolare il grafico suggerisconoinoltre che la <strong>di</strong>spersione dei due insiemi <strong>di</strong> dati è praticamente lastessa.• Una domanda interessante che ci possiamo fare è:“La <strong>di</strong>fferenza tra le lunghezze me<strong>di</strong>e che abbiamo osservatosui dati <strong>di</strong>sponibili può essere attribuita al caso?Ovvero, potrebbe essere dovuta al fatto che abbiamo consideratosola un piccolo numero <strong>di</strong> uova deposte? Oppure ciaspettiamo che valga più in generale?”• Una possibile formulazione dell’ultima domanda è il seguente:(a) La popolazione <strong>di</strong> riferimento è <strong>di</strong>visa in due gruppi Al primo(secondo) gruppo appartengono tutte le uova che i cuculi <strong>delle</strong>zone considerate depongono nei ni<strong>di</strong> <strong>di</strong> pettirosso (scricciolo).(b) In<strong>di</strong>chiamo con µ e η la me<strong>di</strong>a <strong>delle</strong> lunghezze <strong>delle</strong> uova deidue gruppi. Utilizzando i dati <strong>di</strong>sponibili siamo interessati averificare il sistema <strong>di</strong> ipotesi{H0 : µ = ηH 1 : µ ≠ η137 Unità HCuculi, scriccioli, pettirossi e Darwin 138


Test t a due campioni: la situazione <strong>di</strong> riferimentoUna semplice procedura è <strong>di</strong>sponibile nel caso in cui si accettino (omeglio, si verifichi con i dati che sono accettabili) le seguenti ipotesi:1. La <strong>di</strong>stribuzione della lunghezza <strong>delle</strong> uova in ambedue lepopolazioni è normale.2. Le due normali hanno una me<strong>di</strong>a µ, l’altra me<strong>di</strong>a η. Lavarianza è però la stessa, <strong>di</strong>ciamo σ 2 .3. Le uova per cui abbiamo la misura <strong>delle</strong> lunghezze (i nostridati) possono essere pensate come estratte a caso in manierain<strong>di</strong>pendente da una o dall’altra <strong>delle</strong> due popolazioni.Ovvero, se, in<strong>di</strong>cate con− y 1 , . . . , y n le lunghezze <strong>delle</strong> uova trovate in ni<strong>di</strong> <strong>di</strong> pettirossi e− x 1 , . . . , x m le lunghezze <strong>delle</strong> uova trovate in ni<strong>di</strong> <strong>di</strong> scriccioloalloray 1 , . . . , y n sono determinazioni i.i.d. <strong>di</strong>stribuite come una N(µ, σ 2 )x 1 , . . . , x m sono determinazioni i.i.d. <strong>di</strong>stribuite come una N(η, σ 2 )ele “y” e le “x” sono in<strong>di</strong>pendenti tra <strong>di</strong> loro.Test t a due campioni: la <strong>statistica</strong> test e la sua<strong>di</strong>stribuzione• La <strong>statistica</strong> test usualmente considerata per verificare l’ipotesiche le due me<strong>di</strong>e sono uguali è 1t oss = √ y − x1sn + 1 mdove y e x sone le me<strong>di</strong>e dei due gruppi <strong>di</strong> osservazioni mentre[ n∑]s 2 1m∑=(y i − y) 2 + (x i − x) 2n + m − 2i=1i=1può essere vista come una stima <strong>di</strong> σ 2 basata su tutti i dati.• t oss è una versione standar<strong>di</strong>zata della <strong>di</strong>fferenza tra le me<strong>di</strong>e neidue gruppi.• Il denominatore infatti è una stima <strong>di</strong>var {y − x} = var {y} + var {x} = σ2n + σ2m = σ2 ( 1n + 1 mNel primo passaggio abbiamo usato 2 l’in<strong>di</strong>pendenza tra le “y” e le“x”; nel secondo quello che sappiamo sulla varianza <strong>di</strong> una me<strong>di</strong>acampionaria <strong>di</strong> osservazioni i.i.d.• Ovviamente, più è grande, in valore assoluto, il valore <strong>di</strong> t oss piùi dati ci suggeriscono <strong>di</strong> “dubitare” dell’ipotesi nulla.• E’ possibile far vedere che se H 0 è vera, ovvero se realmente µ = η,allora t oss si <strong>di</strong>stribuisce come una t <strong>di</strong> Student con n + m − 2 gra<strong>di</strong><strong>di</strong> libertà 3 .• I valore della <strong>statistica</strong> test può quin<strong>di</strong> essere analizzato inmaniera analoga a quanto fatto nell’unità precedente.).1 t oss e s 2 in<strong>di</strong>cano quantità <strong>di</strong>verse rispetto al test t a un campione.2 [Probalità 36].3 [Probalità 45]139 Unità HCuculi, scriccioli, pettirossi e Darwin 140


• Si osservi che s 2 è facilmente calcolabile dalle varianzacampionarie <strong>delle</strong> “y” e <strong>delle</strong> “x”. Infatti , postos 2 y = 1n − 1n∑(y i − y) 2i=1e definito in maniera analoga s 2 x, risultaovveros 2 =1n + m − 2 [(n − 1)s2 y + (m − 1)s 2 x]“s 2 è una me<strong>di</strong>a ponderata <strong>di</strong> s 2 y e s 2 y con pesi proporzionaliai gra<strong>di</strong> <strong>di</strong> libertà”Applicazione alle lunghezze <strong>delle</strong> uove <strong>di</strong> cuculo• In questo caso, abbiamo 4Quin<strong>di</strong>,n = 16 y ≈ 22,47 s 2 y ≈ 0,46m = 15 x ≈ 21,13 s 2 x ≈ 0,55s ≈ √ (15 × 0,46 + 14 × 0,55)/29 ≈ 0,71e22,47 − 21,13t oss = √10,7116 + 1 ≈ 5,6415• La <strong>di</strong>stribuzione sotto H 0 è una t <strong>di</strong> Student con 29 gra<strong>di</strong> <strong>di</strong> libertà.• Dalla tabella dei quantili della t nell’unità precedente, ve<strong>di</strong>amoche il valore calcolato <strong>di</strong> t oss è più grande <strong>di</strong> t 29,0,9995 .Quin<strong>di</strong>, ci aspettiamo <strong>di</strong> osservare un valore più lontano da zero(in ambedue le <strong>di</strong>rezioni) meno <strong>di</strong> una volta ogni 1000 replicazionidell’esperimento o, in altre parole, il livello <strong>di</strong> significativitàosservato è ≤ 0,001.• Un livello così basso del livello <strong>di</strong> significatività osservato èusualmente considerato altamente significativo contro H 0 .• La conclusione è quin<strong>di</strong> che, sulla base dei dati, sembra pocoplausibile che la <strong>di</strong>fferenza osservata sia puramente dovuta al caso.Ci aspettiamo, viceversa, che la <strong>di</strong>fferenza osservata tra le dueme<strong>di</strong>e campionarie sia una manifestazione <strong>di</strong> una reale <strong>di</strong>fferenzatra le due popolazioni.4 Si ricor<strong>di</strong> che “y” vuol <strong>di</strong>re “pettirossi” e “x” scriccioli.141 Unità HCuculi, scriccioli, pettirossi e Darwin 142


Esercizio. La <strong>di</strong>stribuzione <strong>di</strong> t oss data prima è un caso particolare<strong>di</strong> un risultato generale che <strong>di</strong>ce che, nelle ipotesi con cui stiamolavorando,y − x − (µ − η)√1sn + 1 ∼ t n+m−2(H.1)mUtilizzando questo risultato, mostrare che⎡⎢⎣ y − x − t s1−α/2√ 1n + 1 m⎤s; y − x − t 1−α/2 √1n + 1 ⎥⎦mè un intervallo <strong>di</strong> confidenza (con grado <strong>di</strong> copertura pari a 1α) perla <strong>di</strong>fferenza tra le due me<strong>di</strong>e (ovvero per δ = µ − η).La vera ipotesi è però unilaterale!• Un sistema d’ipotesi uni<strong>di</strong>rezionale, del tipo 5{ {H0 : η = µH 1 : η < µ o, anche, H0 : η ≥ µH 1 : η < µsembra più appropriato <strong>di</strong> quello bilaterale considerato fino ad ora.• Infatti, l’ipotesi “sul mondo” che stiamo esplorando prevede chele uove deposte nei ni<strong>di</strong> <strong>di</strong> scricciolo siano più piccole (almenome<strong>di</strong>amente) <strong>di</strong> quelle deposte nei ni<strong>di</strong> <strong>di</strong> pettirosso.• La <strong>statistica</strong>t oss = √ y − x1sn + 1 msembra ancora appropriata.• Cambiano però i “valori attesi” sotto le due ipotesi.valori attesi per t oss sottoH 0 H 1bilaterale vicino a zero lontano in una<strong>delle</strong> due <strong>di</strong>rezioni(negativa opositiva) da zerounilaterale negativo o vicino a maggiore <strong>di</strong> zerozero• Quin<strong>di</strong>, nel caso del sistema <strong>di</strong> ipotesi unilaterale definito sopra,“lontano da H 0 ” vuole <strong>di</strong>re “valori positivi <strong>di</strong> t oss ” e perciò il livello<strong>di</strong> significatività osservato èP(t 29 ≥ 5,64)e, non, come nel caso bilaterale, P(t 29 ≤ −5,64) + P(t 29 ≥ 5,64).Nel caso in esame, il livello <strong>di</strong> significatività osservato risulta quin<strong>di</strong>minore <strong>di</strong> 0,005.5 si ricor<strong>di</strong> che 1 ◦ gruppo, me<strong>di</strong>a µ, pettirossi; 2 ◦ gruppo, me<strong>di</strong>a η, scriccioli]143 Unità HCuculi, scriccioli, pettirossi e Darwin 144


• Volendo un test <strong>di</strong> tipo accetto/rifiuto con un livello <strong>di</strong> significativitàprefissato α possiamo o utilizzare il livello <strong>di</strong> significativitàosservato 6 oppure, in maniera analoga, utilizzare una “regola” deltipo{ accettare se toss ≤ hrifiutarese t oss > h• Per ottenere una “regola” che ci garantisca che, per ogni µ e η conµ ≤ η, la probabilità <strong>di</strong> accettare H 0 è maggiore o al più uguale a1 − α dobbiamo porreh = t 1−α (n + m − 2).• Si osservi l’“1 − α” e non il solito “1 − α/2”.• Esempio. Supponiamo <strong>di</strong> porre α = 0.1. Allora, nella tabelladei percentili <strong>di</strong> una t <strong>di</strong> Student troviamo t 29,0,9 = 1,31. Il valoreosservato della <strong>statistica</strong> test (5,64) è maggiore <strong>di</strong> questo livello <strong>di</strong>soglia e quin<strong>di</strong>. . . continuamo a concludere a favore <strong>di</strong> Darwin.Attenzione. Tutte le considerazioni (grande, piccolo, a favore <strong>di</strong> H 0 ,a favore <strong>di</strong> H 1 ,. . . ) <strong>di</strong>pendono, quando si ha a che fare con ipotesiunilaterali, da come si formulano le ipotesi e da come si scrive la<strong>statistica</strong>!E se le varianze nei due gruppi non sono uguali?• La breve analisi preliminare condotta (ve<strong>di</strong> lucido 137) suggerisceche la <strong>di</strong>spersione all’interno dei due gruppi è sostanzialmente lastessa.• E’ però interessante, magari anche solo per assicurarsi che l’assunzionenon “pesa”, essere in grado <strong>di</strong> confrontare le me<strong>di</strong>e <strong>di</strong> duegruppi anche quando le varianze non sono tra <strong>di</strong> loro uguali.• Una possibilità approssimata in questo caso è offerta dallacosidetta correzione <strong>di</strong> Welch.• La <strong>statistica</strong> test da usare èt ∗ oss =√ y − x .s2yn + s2 xm• Se le due me<strong>di</strong>e sono uguali, la <strong>di</strong>stribuzione <strong>di</strong> t ∗ oss può essereapprossimata da una t <strong>di</strong> Student con gra<strong>di</strong> <strong>di</strong> libertà calcolati come( ) 2s2yn + s2 xm( ) 21 s2y+ 1 ( ) s2 2xn − 1 n m − 1 mOsservazione. I gra<strong>di</strong> <strong>di</strong> libertà calcolati con la formula precedentesono tipicamente non interi. Nell’utilizzo <strong>di</strong> una tabella dei quantili<strong>di</strong> una t <strong>di</strong> Student si può utilizzare l’intero più piccolo del valoreottenuto.6 si veda il lucido 74145 Unità HCuculi, scriccioli, pettirossi e Darwin 146


• Esempio. Nel caso dei dati che stiamo considerando in questaunitàt ∗ 22,47 − 21,13oss = √0,4616 + 0,55≈ 5,6315mentre applicando la formula per i gra<strong>di</strong> <strong>di</strong> libertà otteniamo( ) 20,46115( 0, 461616 + 0,5515) 2+ 1 14( ) 2= 28,310,5515e quin<strong>di</strong> il valore <strong>di</strong> t ∗ oss deve essere confrontato con i valori“previsti” da una t <strong>di</strong> Student con 28 gra<strong>di</strong> <strong>di</strong> libertà.E’ facile verificare che, anche procedendo in questa maniera, nullacambia nelle conclusioni: il valore <strong>di</strong> t ∗ oss rimane “troppo grande”perchè si possa pensare che i cuculi non si siano in qualche manieraadattati all’uccello ospite.“Troppo grande” è ovviamente da intendersi rispetto ai valoriprevisti dalla t <strong>di</strong> Student.Inferenza sulla <strong>di</strong>fferenza tra due me<strong>di</strong>e: campioni<strong>di</strong> numerosità elevata• E’ possibile <strong>di</strong>mostrare che se sia n che m tendono ad infinito,allora t oss se le varianza dei due gruppi sono uguali e t ⋆ oss in tutti icasi convergono in <strong>di</strong>stribuzione ad una normale standard anche sela <strong>di</strong>stribuzione dei due gruppi non è normale.• Quin<strong>di</strong>, quanto visto in questa unità (test e intervalli <strong>di</strong> confidenza)può essere applicato per confrontare le me<strong>di</strong>e <strong>di</strong> due gruppi <strong>di</strong>osservazioni purchè 7– ambedue le numerosità campionarie siano sufficentementegran<strong>di</strong> 8 ;– le osservazioni all’interno dei due gruppi siano in<strong>di</strong>pendenti e<strong>di</strong>denticamente <strong>di</strong>stribuite;– ambedue le <strong>di</strong>stribuzioni abbiano me<strong>di</strong>a e varianza finite;– le osservazioni <strong>di</strong> un gruppo siano in<strong>di</strong>pendenti dalleosservazioni dell’altro gruppo.Ovviamente la vali<strong>di</strong>tà <strong>delle</strong> procedure sarà solo approssimata se le<strong>di</strong>stribuzioni dei dati all’interno <strong>di</strong> ogni gruppo non è esattamentenormale.• Strettamente parlando dovremmo utilizzare i quantili <strong>di</strong> unanormale non quelli <strong>di</strong> una t. Però visto che stiamo pensando a situazioniin cui n e m sono gran<strong>di</strong>, utilizzare i quantili <strong>di</strong> una N(0, 1) o<strong>di</strong> una t(n + m − 2) è praticamente lo stesso.7 altrimenti non vale il risultato asintotico menzionato8 si veda il lucido 46 per alcune in<strong>di</strong>cazioni a spanne.147 Unità HCuculi, scriccioli, pettirossi e Darwin 148


Ancora sul livello <strong>di</strong> significatività osservatoLa varietà del pur limitato insieme <strong>di</strong> test che abbiamo presentatodovrebbe aver chiarito l’utilità del livello <strong>di</strong> significatività osservato.Il suo merito principale consiste nel nascondere i dettagli dei varitest e nel, viceversa, presentare i risultati utilizzando una “scala”sempre uguale.Conoscendo il livello <strong>di</strong> significatività osservato non abbiamobisogno <strong>di</strong> sapere, per trarre <strong>delle</strong> conclusioni, se sotto l’ipotesi nullala <strong>statistica</strong> test si <strong>di</strong>stribuisce come una normale, o come una t <strong>di</strong>Student o come . . .Non abbiamo neanche bisogno <strong>di</strong> conoscere il valore della <strong>statistica</strong>test.149 Unità H Cuculi, scriccioli, pettirossi e Darwin 150


Il problema e i datiUnità IUn piccolo esperimento sulla coltivazione<strong>delle</strong> fragoleTest t per dati appaiati• Per confrontare l’efficacia <strong>di</strong> due <strong>di</strong>fferenti fertilizzanti 1 ,– 10 appezzamenti, <strong>di</strong> uguale estensione, sono stati <strong>di</strong>visi in dueparti uguali;– tutti gli appezzamenti sono stati coltivati a fragole;– in una <strong>delle</strong> parti è stato però utilizzato il primo fertilizzante enell’altra il secondo;– al momento della raccolta è stata poi “pesata” la quantità <strong>di</strong>fragole prodotte nelle varie parti.• La tabella mostra i dati raccolti. I pesi <strong>delle</strong> fragole sono in kg.appezzamento 1 2 3 4 5fertilizzante A 216,7 149,9 136,9 211,2 171,4fertilizzante B 196,8 108,9 134,7 195,6 160,2appezzamento 6 7 8 9 10fertilizzante A 138,0 127,6 160,3 153,8 150,4fertilizzante B 141,9 114,1 130,6 116,2 150,2• Il problema che ci poniamo è se i <strong>di</strong>fferenti fertilizzanti hanno un<strong>di</strong>fferente effetto sulla me<strong>di</strong>a <strong>delle</strong> fragole prodotte.1 in realtà si tratta <strong>di</strong> terreni arricchiti con sali minerali e altre sostanze da mescolare con ilterreno prima della semina.Un piccolo esperimento sulla coltivazione . . . 152


Perchè non utilizzare un test t a due campioni?• In<strong>di</strong>chiamo con y i e x i , i = 1, . . . , 10, le quantità <strong>di</strong> fragoleraccolte nell’appezzamento i-simo. y i è la quantità raccolta nelsotto-appezzamento coltivato con A. x i l’analoga quantità riferitaal sotto-appezzamento coltivato con B.• In prima battuta potrebbe venire l’idea <strong>di</strong> utilizzare un test t a duecampioni per vericare la significatività della <strong>di</strong>fferenze <strong>delle</strong> me<strong>di</strong>e.• L’assunzione su cui si basa questo test sono 2 :– in<strong>di</strong>pendenza e normalità della <strong>di</strong>stribuzione dentro i duegruppi (ovvero sia le “y” che le “x” devono esseredeterminazioni in<strong>di</strong>pendenti <strong>di</strong> variabili casuali normali);– in<strong>di</strong>pendenza <strong>delle</strong> osservazioni nei due gruppi (ovvero le “y”devono essere in<strong>di</strong>pendenti dalle “x”).• Trascurando per il momento l’ipotesi <strong>di</strong> normalità, si osservi comenel caso che stiamo considerando possa essere inappropriata laseconda assunzione.• Ad esempio, se i vari appezzamenti hanno <strong>di</strong>fferenti livelli <strong>di</strong> fertilità,ci possiamo aspettare una <strong>di</strong>pendenza tra le quantità prodottenei sotto-appezzamenti coltivati con A e B.• Infatti, se l’appezzamento i-simo è particolarmente fertile (per laqualità del terreno, per il tipo <strong>di</strong> irrigazione, per l’esposizione alsole,. . . ), potrebbe capitare che sia y i che x i siano gran<strong>di</strong> rispettoalle altre osservazioni.2 viste le numerisità campionarie153 Unità IB120 140 160 180 200.140 160 180 200 220• Il <strong>di</strong>agramma <strong>di</strong> <strong>di</strong>spersione in cui abbiamo <strong>di</strong>segnato le coppie(y i , x i ) mostra chiaramente che qualcosa del genere è accaduto.Abbiamo una <strong>di</strong>screta relazione tra la produzione nei duesotto-appezzamenti (il coefficente <strong>di</strong> correlazione vale 0,875). Nonpossiamo quin<strong>di</strong> utilizzare il test t a due campioni per valutare lasignificatività <strong>delle</strong> <strong>di</strong>fferenze <strong>delle</strong> me<strong>di</strong>e.• Il problema nasce dal fatto che in questo caso abbiamo misureripetute sulla stessa unità sperimentale (l’appezzamento). Si tratta<strong>di</strong> situazioni abbastanza comuni. Si pensi ad esempio rilevazionifatte sugli stessi prima e dopo una terapia. O più in generale, aosservazioni fatte nel tempo sugli stessi soggetti.Un piccolo esperimento sulla coltivazione . . . 154A


Il test t per dati appaiati• Il grafico mostra per ogni appezzamento la produzione ottenutanel sotto-appezzamento coltivato con A (lettera A) e nelsotto-appezzamento coltivato con B (lettera B).100 120 140 160 180 200 220 240ABABABABABBA2 4 6 8 10appezzamentoABABABAB• In questa situazione, un possibile modello per le me<strong>di</strong>e, potrebbeessereE {y i } = µ i , E {x i } = µ i + δ (i = 1, . . . , 10)ovvero chiedere che– la me<strong>di</strong>a <strong>delle</strong> osservazioni <strong>di</strong>penda sia dal fertilizzante (via δ)ma anche dall’appezzamento (visto che le “µ” <strong>di</strong>pendono dai, ovvero dall’appezzamento, le osservazioni in appezzamenti<strong>di</strong>fferenti hanno me<strong>di</strong>e <strong>di</strong>fferenti)– richiedendo però che la <strong>di</strong>fferenza legata ai fertilizzanti siauguale in tutti gli appezzamenti (δ non <strong>di</strong>pende da i).• Si osservi che in questo modello il problema <strong>di</strong> verificare se idue fertilizzanti hanno un effetto <strong>di</strong>verso <strong>di</strong>venta il problema <strong>di</strong>verificareH 0 : δ = 0 verso H 1 : δ ≠ 0.• Si ponga z i = x i − y i , i = 1, . . . , 10. Se vale il modello precedenteE {z i } = E {x i } − E {y i } = µ i + δ − µ i = δ.• Quin<strong>di</strong> lavorando con le “z” il problema <strong>di</strong> verifica <strong>di</strong> ipotesiprecedente <strong>di</strong>venta un problema sulla me<strong>di</strong>a <strong>di</strong> un insieme <strong>di</strong>osservazioni univariate (non sulle <strong>di</strong>fferenze <strong>delle</strong> me<strong>di</strong>e <strong>di</strong> piùgruppi).• Se le “z” sono normali può essere affrontato utilizzando un test tad un campione.• Sembra evidente che oltre ad un effetto del fertilizzante sullequantità prodotte (in 9 appezzamenti su 10 le A sono più gran<strong>di</strong><strong>delle</strong> B) esiste anche un effetto dell’appezzamento. Ad esempio,ambedue le misure sul primo appezzamento sono superiori allemisure ottenute sugli appezzamenti 2 e 3. Quin<strong>di</strong>, il primoappezzamento sembra più fertile degli appezzamenti 2 e 3.155 Unità IUn piccolo esperimento sulla coltivazione . . . 156


• Il normal probability plot, confortato anche dal test <strong>di</strong> Shapiro-Wilks (livello <strong>di</strong> significatività osservato ≈ 0,6, lascia pochi dubbisulla normalità <strong>delle</strong> “z”.• E’ interessante osservare 4 che, se si fosse utilizzato un test t a duecampioni per confrontare i due gruppi, il livello <strong>di</strong> significativitàosservato sarebbe stato, utilizzando o no la correzione <strong>di</strong> Welch,≈ 0,24 ovvero saremmo arrivati ad una conclusione opposta.quantili empirici0 10 20 30 40−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5quantili teorici• Applicando 3 il test t ad un campione alle <strong>di</strong>fferenze (le “z”)otteniamo un livello <strong>di</strong> significatività osservato inferiore a 0,01 equin<strong>di</strong>, in definitiva, accettiamo l’ipotesi che ci siano <strong>delle</strong> <strong>di</strong>fferenzetra i due fertilizzanti (più precisamente che i due fertilizzantiabbiano effetti <strong>di</strong>fferenti sulle me<strong>di</strong>e <strong>delle</strong> fragole prodotte).3 lo studente per esercizio lo verifichi.157 Unità I4 un altro esercizio da fare <strong>di</strong>rei!Un piccolo esperimento sulla coltivazione . . . 158


I datiUnità JHot-dog e calorie(a) Scomposizione della devianza totale.(b) Misura della importanza <strong>delle</strong> <strong>di</strong>fferenze tra le me<strong>di</strong>e(c) Analisi della varianza con un criterio <strong>di</strong> classificazione.• Per cercare <strong>di</strong> capire se e <strong>di</strong> quanto la carne con cui vengonopreparati gli hot-dog (wurstel) influenza il contenuto calorico deglistessi sono state misurate le calorie (per hot-dog) <strong>di</strong> 54 confezioni <strong>di</strong><strong>di</strong>verse marche rilevando anche se l’hot-dog era stato preparato con:− solo carne bovina;− carne mista (tipicamente a maggioranza maiale);− pollame (pollo o tacchino).• I prossimi due <strong>luci<strong>di</strong></strong> mostrano:(i) i dati elementari;(ii) il <strong>di</strong>agramma scatola con baffi <strong>delle</strong> calorie classificate per tipo<strong>di</strong> carne e le numerosità, me<strong>di</strong>e e scarti quadratici me<strong>di</strong> dei tregruppi.• E’ evidente che, restringendo l’attenzione alle 54 misure<strong>di</strong>sponibili, il tipo <strong>di</strong> carne influenza il contenuto calorico.• Nel seguito dell’unità ci concentremo sulle <strong>di</strong>fferenze tra le me<strong>di</strong>erilevabili dalla tabella <strong>di</strong> pagina 162 ed in particolare cercheremo <strong>di</strong>dare una risposta alle seguenti domande:– come possiamo “misurare” l’importanza <strong>di</strong> queste <strong>di</strong>fferenze?– come verificare se è plausibile che le <strong>di</strong>fferenze osservate sianogeneralizzabili a tutti gli hot-dog (o almeno a quelli prodotti conmaterie prime e tecnologia simili a quella usata per produrre le54 confezioni)?Hot-dog e calorie 160


Tipo <strong>di</strong> carne e calorie (per pezzo) per 54 confezioni<strong>di</strong> hot-dogCarne Calorie Carne Calorie Carne CalorieBovina 186 Bovina 181 Bovina 176Bovina 149 Bovina 184 Bovina 190Bovina 158 Bovina 139 Bovina 175Bovina 148 Bovina 152 Bovina 111Bovina 141 Bovina 153 Bovina 190Bovina 157 Bovina 131 Bovina 149Bovina 135 Bovina 132 Mista 173Mista 191 Mista 182 Mista 190Mista 172 Mista 147 Mista 146Mista 139 Mista 175 Mista 136Mista 179 Mista 153 Mista 107Mista 195 Mista 135 Mista 140Mista 138 Pollame 129 Pollame 132Pollame 102 Pollame 1<strong>06</strong> Pollame 94Pollame 102 Pollame 87 Pollame 99Pollame 107 Pollame 113 Pollame 135Pollame 142 Pollame 86 Pollame 143Pollame 152 Pollame 146 Pollame 144100 140 180Un primo sguardo ai datiBovina Mista PollameCarne Numerosità y sBovina 20 156,85 22,64Mista 17 158,71 25,24Pollame 17 118,76 22,55Nota: s è la ra<strong>di</strong>ce della stima della varianza ottenuta“<strong>di</strong>videndo per n − 1”161 Unità JHot-dog e calorie 162


Notazioni• Per rendere il <strong>di</strong>scorso generale in<strong>di</strong>chiamo con− k il numero dei gruppi;− n i , i = 1, . . . , k il numero <strong>di</strong> osservazioni per ogni gruppo.Nel nostro caso, ovviamente, k = 3 e, convenendo che, 1 in<strong>di</strong>cacarne bovina, 2 carne mista e 3 pollame, n 1 = 20, n 2 = 17, n 3 = 17.• L’insieme <strong>di</strong> tutte le osservazioni può poi essere in<strong>di</strong>cato comey ij , i = 1, . . . , k, j = 1, . . . , n i .Si osservi che stiamo convenendo che il primo pe<strong>di</strong>ce in<strong>di</strong>ca ilgruppo mentre il secondo l’osservazione entro il gruppo.• Per ogni gruppo possiamo calcolare la me<strong>di</strong>a e la devianzacampionarian iy i = 1 ∑ ∑y ij d 2 i = (y ij − yn i ) 2ij=1Nel nostro caso, queste quantità sono riferibili alla posizione e alla<strong>di</strong>spersione <strong>delle</strong> <strong>di</strong>stribuzioni <strong>delle</strong> calorie con<strong>di</strong>zionate ai vari tipi<strong>di</strong> carne.• Possiamo inoltre anche calcolare la me<strong>di</strong>a e la devianza totaliovvero <strong>di</strong> tutte le osservazioni senza riferimento al gruppo <strong>di</strong>appartenenzadovey = 1 nn k∑ ∑ iy ij e d 2 =i=1j=1n =k∑i=1n in ij=1n k∑ ∑ i(y ij − y) 2in<strong>di</strong>ca il numero totale <strong>di</strong> osservazioni <strong>di</strong>sponibili.y e d 2 sono riferibili alla <strong>di</strong>stribuzione marginale <strong>delle</strong> calorie.163 Unità Ji=1j=1La me<strong>di</strong>a totale è uguale alla me<strong>di</strong>a <strong>delle</strong> me<strong>di</strong>e deigruppi• Pensiamo alla <strong>di</strong>stribuzione <strong>di</strong> frequenza in cui le modalità sonole me<strong>di</strong>e dei k gruppi e le frequenze (assolute) sono le numerosità<strong>delle</strong> osservazioni nei vari gruppi, ovvero, amodalità y 1 y 2 . . . y kfrequenze n 1 n 2 . . . n k• La me<strong>di</strong>a (ponderata) <strong>di</strong> questa <strong>di</strong>stribuzione è ovviamente1nk∑n i y ii=1• E’ imme<strong>di</strong>ato <strong>di</strong>mostrare che quest’ultima quantità coincide conla me<strong>di</strong>a y. Infattiy = 1 n k∑ ∑ iy ij .nMa, per qualsivoglia i, dalla definizione <strong>di</strong> y i segue chen ii=1j=1∑y ij = n i y ij=1e quin<strong>di</strong>, sostituendo, troviamoy = 1 nk∑n i y ii=1• Si osservi che questa relazione non vale solo nel campione maanche nella popolazione. E’ infatti, in generale, possibile <strong>di</strong>mostrare,e spesso molto utile da ricordare, che la me<strong>di</strong>a <strong>di</strong> una <strong>di</strong>stribuzionemarginale può essere calcolata come me<strong>di</strong>a <strong>delle</strong> me<strong>di</strong>econ<strong>di</strong>zionate.Hot-dog e calorie 164


La devianza totale è la somma <strong>delle</strong> devianze deigruppi + la devianza <strong>delle</strong> me<strong>di</strong>e dei gruppi• Ci si ricor<strong>di</strong> che d 2 in<strong>di</strong>ca la devianza <strong>di</strong> tutti i dati (= la devianzadella “<strong>di</strong>stribuzione marginale”), mentre d 2 i è la devianza dentro ilgruppo i-simo (= le devianze <strong>delle</strong> “<strong>di</strong>stribuzione con<strong>di</strong>zionate”).• Dimostreremo chek∑ k∑d 2 = d 2 i + n i (y i − y) 2 .(J.1)i=1i=1• Si osservi che il primo addendo sul lato destro è la somma <strong>delle</strong>devianze interne ai vari gruppi.• Viceversa, il secondo addendo è la devianza della <strong>di</strong>stribuzionemostrata all’inizio <strong>di</strong> pagina 164, ovvero è la “devianza <strong>delle</strong> me<strong>di</strong>edei gruppi”.• La verifica della (J.1) è agevole. Infatti 1d 2 =====n k∑ ∑ i(y ij − y) 2 =i=1j=1n ik∑ ∑[(y ij − y i ) + (y i − y)] 2 =i=1j=1n ik∑ ∑[(y ij − y i ) 2 + (y i − y) 2 + 2(y ij − y i )(y i − y)] =i=1j=1n ik∑ ∑(y ij − y i ) 2 +i=1j=1k∑d 2 i +i=1k∑n i (y i − y) 2 + 2i=1k∑n i (y i − y) 2 .i=1n k∑ ∑ i(y i − y) (y ij − y i ) =i=1j=1Una misura dell’importanza <strong>delle</strong> <strong>di</strong>fferenze tra leme<strong>di</strong>e dei vari gruppi• La (J.1) mostra come la devianza totale, d 2 , sia scomponibile indue parti:(i) la prima, il 1 ◦ addendo, legata alla <strong>di</strong>spersione all’interno deivari gruppi e(ii) la seconda, il 2 ◦ addendo, legata le <strong>di</strong>fferenze (in me<strong>di</strong>a) tra igruppi.Per questo motivo, i due adden<strong>di</strong> sono spesso in<strong>di</strong>cati come devianzaentro i gruppi e devianza tra i gruppi.• Si osservi che se la devianza tra i gruppi è nulla, allora le me<strong>di</strong>e <strong>di</strong>tutti i gruppi sono tutte uguali a y e quin<strong>di</strong> tutte uguali tra <strong>di</strong> loro.• Viceversa, se la varianza tra i gruppi è molto grande rispetto allavarianza entro i gruppi, allora buona parte della variabilità totaledei dati è interpretabile in termini <strong>di</strong> <strong>di</strong>fferenze tra le me<strong>di</strong>e deigruppi. Siamo quin<strong>di</strong> in presenza <strong>di</strong> una situazione in cui la <strong>di</strong>fferenzatra le me<strong>di</strong>e è importante (= “spiega” una larga frazione dellavariabilità che osserviamo nei dati).• Sembra allora ragionevole usareη 2devianza tra i gruppi= =devianza totaledevianza entro i gruppi= 1 −devianza totaleper misurare l’importanza <strong>delle</strong> <strong>di</strong>fferenze tra le me<strong>di</strong>e dei gruppi.1 nell’ultimo passaggio si ricor<strong>di</strong> che la somma <strong>delle</strong> osservazioni del gruppo i-simo dalla me<strong>di</strong>adel gruppo i-simo vale zero.165 Unità JHot-dog e calorie 166


• In particolare si osservi che(a) 0 ≤ η 2 ≤ 1.(b) η 2 = 0 implica che le me<strong>di</strong>e dei gruppi sono tutte uguali tra <strong>di</strong>loro (in<strong>di</strong>pendenza in me<strong>di</strong>a almeno nel campione).(c) η 2 = 1 implica che la devianza entro i gruppi è nulla. Siamoquin<strong>di</strong> in una situazione <strong>di</strong> <strong>di</strong>pendenza perfetta.(d) η 2 non è ovviamente definito quando d 2 = 0. Questo non è ungrande problema visto che d 2 uguale a zero vuol <strong>di</strong>re che tuttele osservazioni sono uguali tra <strong>di</strong> loro e quin<strong>di</strong> che non esistenessuna variabilità interessante da indagare.• Nel caso degli hot-dog, η 2 è facilmente calcolabile dai risultatidella tabella <strong>di</strong> pagina 162. 2 .devianza entro i gruppi ≈ 28<strong>06</strong>7,78devianza tra i gruppi ≈ 17698,32devianza totale ≈ 45766,11e, quin<strong>di</strong>, η 2 ≈ 0,39. Il valore trovato ci in<strong>di</strong>ca la presenza <strong>di</strong> una<strong>di</strong>screta ma non eccezionale <strong>di</strong>pendenza in me<strong>di</strong>a.E se tutto fosse dovuto al caso• Fino a questo punto abbiamo solo guardato ai dati <strong>di</strong>sponibili.• In realtà noi non compreremo mai nessuna <strong>delle</strong> 54 confezioni <strong>di</strong>wurstel analizzate.• Viceversa, potremmo essere interessati a sapere quanto le<strong>di</strong>fferenze evidenziate siano esten<strong>di</strong>bili ai wurstel che potremmomangiare.• Una maniera <strong>di</strong> vedere il problema consiste nel riconoscere chefino a questo punto abbiamo trascurato una fonte <strong>di</strong> variabilità,quella campionaria: almeno una parte <strong>delle</strong> <strong>di</strong>fferenze tra le me<strong>di</strong>e<strong>delle</strong> osservazioni dei vari gruppi è specifica alle 54 confezioni utilizzate,nel senso che, replicando l’esperimento (ovvero, prendendoaltre 54 confezioni,. . . ) ci aspettiamo <strong>di</strong> trovare risultati <strong>di</strong>versi.• La domanda è:“Di quanto <strong>di</strong>versi? Tanto <strong>di</strong>versi, ad esempio, da portarci aconcludere che le minore calorie osservate per gli hot-dog <strong>di</strong>pollo e tacchino sono solamente una specificità del campione<strong>di</strong>sponibile? Oppure, <strong>di</strong>versi si, ma non tanto da alterare leconclusioni suggerite dalla tabella?”2 la devianza entro i gruppi può essere calcolata come ∑ (n i − 1)s 2 i .167 Unità JHot-dog e calorie 168


Un problema <strong>di</strong> verifica d’ipotesi• Pensiamo all’insieme 3 dei milioni e milioni <strong>di</strong> possibili hot-dog chepotrebbero essere prodotti con gli ingre<strong>di</strong>enti e la tecnologia attuale.• Questa popolazione ovviamente può essere <strong>di</strong>visa in tre gruppi:− quelli prodotti con sola carne <strong>di</strong> bovino;− quelli prodotti con carne mista;− quelli prodotti con pollame.• Possiamo allora calcolare la me<strong>di</strong>a <strong>delle</strong> calorie per ciascuno <strong>di</strong>questi tre gruppi. In<strong>di</strong>chiamole rispettivamente con µ 1 , µ 2 e µ 3 .• Un sistema <strong>di</strong> ipotesi che può essere interessante verificare con idati èH 0 : µ 1 = µ 2 = µ 3H 1 : almeno una <strong>delle</strong> uguaglianze previste da H 0 è falsa• Infatti, se H 0 fosse vera, allora nella popolazione, contrariamentea quanto osservato nel campione, il tipo <strong>di</strong> carne utilizzatonon influenzerebbe il contenuto degli hot-dog. Ovvero, quelloche abbiamo osservato nei dati sarebbe un artefatto legato alcampionamento.• Si osservi come il problema sia molto simile a quello che ci siamoposti nell’unità F. La <strong>di</strong>fferenza è che adesso sono coinvolte più <strong>di</strong>due me<strong>di</strong>e.Analisi della varianza con un criterio <strong>di</strong>classificazione• Al solito, per arrivare ad una soluzione abbiamo bisogno <strong>di</strong> descriverela relazione che intercorre tra le osservazioni e la popolazione.In particolare, la relazione che intercorre tra le osservazioni e le treme<strong>di</strong>e µ 1 , µ 2 e µ 3 .• Una soluzione relativamente “semplice” esiste quando siacre<strong>di</strong>bile assumere che:1. la <strong>di</strong>stribuzione all’interno dell’i-gruppo è normale <strong>di</strong> me<strong>di</strong>a µ ie varianza σ 2 , ovvero,y ij ∼ N(µ i , σ 2 ) (i = 1, . . . , k; j = 1, . . . , n i );si osservi che stiamo supponendo che la varianza non <strong>di</strong>pendada i, ovvero, che tutti i gruppi abbiano la stessa variabilitàinterna.2. le osservazioni sono tutte in<strong>di</strong>pendenti tra <strong>di</strong> loro.• La <strong>statistica</strong> test comunemente usata èF oss =(devianza tra i gruppi)/(k − 1)(devianza entro i gruppi)/(n − k)• La <strong>statistica</strong> F oss è in stretta relazione con η 2 . Infatti, come è facileverificare,( ) ( )η2 n − kF oss =.1 − η 2 k − 1Si noti inoltre che la funzione f : x → x/(1 − x) è monotona crescentenell’intervallo [0, 1] Quin<strong>di</strong>, più è grande η 2 più è grande F oss eviceversa.3 un po’ stomachevole?169 Unità JHot-dog e calorie 170


• Ovviamente, poichè ci aspettiamo F oss grande quando H 0 è falsa,consideriamo evidenza contro l’ipotesi nulla valori elevati della<strong>statistica</strong>.• Il problema è al solitoquanto grande deve essere F oss per farci dubitare <strong>di</strong> H 0 ?• La risposta è facilitata dal fatto che è possibile <strong>di</strong>mostrare che,nelle ipotesi in cui ci siamo messi (normalità, in<strong>di</strong>pendenza,. . . ),F oss si <strong>di</strong>stribuisce come una variabile casuale F <strong>di</strong> Snedecor conk − 1 gra<strong>di</strong> <strong>di</strong> libertà al numeratore e n − k al denominatore 4 .Possiamo quin<strong>di</strong> confrontare il valore osservato <strong>di</strong> F oss con i valori“possibili” per questa variabile casuale.• Applicazione ai dati. Per i dati sugli hot-dog, F oss ≈ 16. Questovalore deve essere confrontato con i quantile <strong>di</strong> una F <strong>di</strong> Snedecorcon 2 e 51 gra<strong>di</strong> <strong>di</strong> libertà. Consultando una tabella dei quantili <strong>di</strong>una <strong>di</strong>stribuzione F possiamo vedere che il valore osservato è moltopiù grande del quantile 0,999 <strong>di</strong> questa <strong>di</strong>stribuzione e, quin<strong>di</strong>, cheun valore “uguale o più lontano da H 0 ” <strong>di</strong> quello osservato è moltoimprobabile quando l’ipotesi nulla è vera. In particolare, il livello <strong>di</strong>significatività osservato è inferiore a un millesimo.In conclusione, i dati ci suggeriscono che non solo le me<strong>di</strong>e nelcampione ma anche quelle nella popolazione dovrebbero essere tra<strong>di</strong> loro <strong>di</strong>verse.4 per la definizione <strong>di</strong> questa variabile casuale si veda [Probalità 19].171 Unità J Hot-dog e calorie 172


Trasformazione rangoUnità KDove facciamo la conoscenza con <strong>delle</strong>statistiche <strong>di</strong> alto rangoCenno ai test basati sui ranghi.Definizione. Sia z = (z 1 , . . . , z N ) un vettore <strong>di</strong> N numeri. Allora latrasformazione rango <strong>di</strong> z è il vettore <strong>di</strong> interi r = (r 1 , . . . , r N ) talechedover i = numero <strong>di</strong> “z” minori od uguali a z i =I(A) ={ 0 se A è falsa1 se A è vera .N∑I(z j ≤ z i )In altre parole, r j , ovvero il rango <strong>di</strong> z j , è la posizione <strong>di</strong> z j nellaseguenza or<strong>di</strong>nata dei numeri. Ad esempio se r 5 = 2 allora soloun’altra osservazione è più piccola o al più uguale a z 5 , tutte le altre“z” sono più gran<strong>di</strong>.Esempio. Supponiamoj=1Allora il vettore dei ranghi <strong>di</strong> z èz = (3,1 ; 0,4 ; 4,3 ; −1,6 ; 0,4).r = (4, 3, 5, 1, 3).Osservazione. Esistono altre “versioni” della trasformata rango <strong>di</strong>un insieme <strong>di</strong> osservazioni. Tutte coincidono nei casi in cui nonci siano valori ripetuti tra le “z” Trattano però in maniera <strong>di</strong>versaosservazioni uguali (nella definizione <strong>di</strong> prima viene assegnato il“rango più elevato”, in altre il “rango me<strong>di</strong>o”, in altre ancora un“rango casuale”,. . . ).Dove facciamo la conoscenza con <strong>delle</strong> . . . 174


Trasformata rango e variabili casuali i.i.d.Siano z 1 , . . . , z N <strong>delle</strong> determinazioni in<strong>di</strong>pendenti ed identicamente<strong>di</strong>stribuite <strong>di</strong> una variabile casuale assolutamente continua convalori in R. Si in<strong>di</strong>chi con r = (r 1 , . . . , r N ) il vettore dei ranghi <strong>di</strong>z 1 , . . . , z N .I ranghi sono tutti <strong>di</strong>stinti e quin<strong>di</strong> Il vettore dei ranghi è una<strong>delle</strong> N! permutazioni <strong>di</strong> (1, . . . , N). Infatti, con probabilità uno,le osservazioni sono <strong>di</strong>stinte (la probabilità che due determinazioni<strong>di</strong> una variabile casuale continua siano uguali è nulla).Tutti i valori che r può assumere sono equiprobabili. Ovvero,è possibile <strong>di</strong>mostrare è che per qualsivoglia s = (s 1 , . . . , s N ),permutazione <strong>di</strong> (1, . . . , N), alloraPr(r = s) = 1 N! .Importanza del risultato enunciato. Si osservi che la <strong>di</strong>stribuzionedel vettore dei ranghi non <strong>di</strong>pende dalla <strong>di</strong>stribuzione dei dati;le z 1 , . . . , z N potrebbero essere normali, esponenziali, beta,. . . mala <strong>di</strong>stribuzione dei ranghi <strong>delle</strong> osservazioni rimane costante ecompletamente nota (se le osservazioni sono determinazioni i.i.d.<strong>di</strong> una v.c. continua).Test <strong>di</strong> Wilcoxon per due campioniI dati. I dati sono del tipo <strong>di</strong> quelli considerati per il test t a duecampioni:− (y 1 , . . . , y n ) determinazioni in<strong>di</strong>pendenti <strong>di</strong> una variabile casualecontinua con funzione <strong>di</strong> ripartizione F(·);− (x 1 , . . . , x m ) determinazioni in<strong>di</strong>pendenti <strong>di</strong> una variabile casualecontinua con funzione <strong>di</strong> ripartizione G(·);− le “y” sono in<strong>di</strong>pendenti dalle “x”.Nessuna assunzione su F e G Tolta l’assoluta continuità, supporremmoperò F(·) e G(·) completamente ignote: sono due qualsiasifunzioni <strong>di</strong> ripartizione.Nelle unità precedenti, la <strong>di</strong>stribuzione <strong>di</strong> probabilità dei dati osservatiera nota a meno <strong>di</strong> un certo numero <strong>di</strong> parametri reali 1 Nellasituazione che stiamo considerando questo non è più vero. Perquesto motivo quello che stiamo per affrontare è un problema <strong>di</strong><strong>inferenza</strong> <strong>statistica</strong> non parametrica.Ipotesi L’ipotesi nulla prevede che i due gruppi abbiano la stessa<strong>di</strong>stribuzione:H 0 : F(x) = G(x), ∀x ∈ R.L’ipotesi alternativa che consideriamo è unilatelare e, lasciamolaespressa informalmente, prevede che la <strong>di</strong>stribuzione <strong>delle</strong> x sia“spostata verso destra” rispetto alla <strong>di</strong>stribuzione <strong>delle</strong> y 2 . Ovvero,l’ipotesi alternativa prevede che, tendelzialmente, le “x” siano piùgran<strong>di</strong> <strong>delle</strong> “y”.1 ad esempio la <strong>di</strong>stribuzione era normale <strong>di</strong> (i “parametri” della <strong>di</strong>stribuzione) me<strong>di</strong>a evarianza ignota2 come esercizio, lo studente può provare a formulare la versione “bilaterale” del test.175 Unità KDove facciamo la conoscenza con <strong>delle</strong> . . . 176


0.0 0.4 0.80.0 1.0 2.0 3.0funzioni <strong>di</strong> ripartizioni0.0 0.2 0.4 0.6 0.8 1.0funzioni <strong>di</strong> densità0.0 0.2 0.4 0.6 0.8 1.0Statistica test Formiamo il vettore (<strong>di</strong> <strong>di</strong>mensione N = n + m) <strong>di</strong>tutte le osservazioni <strong>di</strong>sponibili 3z = (x 1 , . . . , x m , y 1 , . . . , y n )e poi calcoliamone il vettore dei ranghir = (r 1 , . . . , r m , . . . , r N ).I primi m valori sono i ranghi <strong>delle</strong> “x” nel campione combinato. Irestanti valori sono i ranghi <strong>delle</strong> “y”.Si osservi che− quando è vera H 0 ci aspettiamo che i ranghi <strong>delle</strong> “x” siano“mescolati” con i ranghi <strong>delle</strong> “y”;− viceversa, quando è vera H 1 , ci aspettiamo che i ranghi <strong>delle</strong> “x”siano “più gran<strong>di</strong>” dei ranghi <strong>delle</strong> “y” visto che sotto H 1 le “x”sono tendelzialmente “più gran<strong>di</strong>” <strong>delle</strong> “y”.Poniamom∑ m(m + 1)W = r i − ==2i=1( )somma dei ranghi <strong>delle</strong>−“x”(costante che <strong>di</strong>pende solodal numero <strong>delle</strong> “x”)La figura mostra un esempio <strong>di</strong> una <strong>delle</strong> situazioni “previste” daH 1 : due <strong>di</strong>stribuzioni <strong>di</strong> probabilità <strong>di</strong>fferenti con quella a cui corrispondonole curve tratteggiate che “genera” valori tendelzialmentepiù verso destra dell’altra.Per il <strong>di</strong>scorso fatto ci aspettiamo valori <strong>di</strong> W più gran<strong>di</strong> sotto H 1che sotto H 0 . Possiamo quin<strong>di</strong> utilizzare W come <strong>statistica</strong> test.3 che per ipotesi sono tutte <strong>di</strong>stinte; ma ve<strong>di</strong> anche dopo. . .177 Unità KDove facciamo la conoscenza con <strong>delle</strong> . . . 178


Interpretazione alternativa della <strong>statistica</strong> test Si osservi chem∑ N∑W = I(z j ≤ x i ) − m(m + 1)/2 ==i=1m∑i=1j=1m∑I(x j ≤ x i ) +j=1m∑i=1n∑I(y j ≤ x i ) − m(m + 1)/2.E’ facile far vedere che, quando le osservazioni sono tutte <strong>di</strong>stinte,m∑ m∑m(m + 1)I(x j ≤ x i ) = 1 + 2 + · · · + m = .2Quin<strong>di</strong>i=1j=1W =m∑i=1j=1n∑I(y j ≤ x i ) =j=1= numero coppie (x i , y j ) con y j ≤ x i .Anche scritta in questa maniera è evidente che più i dati sono afavore <strong>di</strong> H 1 , ovvero, più le “x” sono a destra <strong>delle</strong> “y”, più Wassume valori gran<strong>di</strong>.La scrittura mostra inoltre imme<strong>di</strong>atamente che W è un numerointero che assume valori tra 0 e n × m.Distribuzione <strong>di</strong> W sotto l’ipotesi nulla La <strong>di</strong>stribuzione <strong>di</strong> r, ilvettore dei ranghi, è nota quanto è vera l’ipotesi nulla. Infatti, sottoH 0 , il “campione combinato” z è un vettore <strong>di</strong> N = n+m determinazioniin<strong>di</strong>pendenti ed identicamente <strong>di</strong>stribuite <strong>di</strong> variabile casualecontinua (l’ipotesi nulla prevede che la <strong>di</strong>stribuzione <strong>delle</strong> “x” siauguale a quella <strong>delle</strong> “y”).La <strong>statistica</strong> test W è semplicemente una trasformata <strong>di</strong> r e quin<strong>di</strong>se conosciamo la <strong>di</strong>stribuzione <strong>di</strong> r, possiamo calcolare anche la<strong>di</strong>stribuzione <strong>di</strong> W.Il punto importante è che riusciamo a determinare la <strong>di</strong>stribuzionesotto H 0 <strong>di</strong> W anche se non conosciamo la funzione <strong>di</strong> ripartizione<strong>delle</strong> osservazioni.179 Unità KLivello <strong>di</strong> significatività osservato Più W è grande più è “controH 0 ”. Quin<strong>di</strong> il livello <strong>di</strong> significatività osservato può essere calcolatocomeP(W ≥ W oss )dove con W oss è stato in<strong>di</strong>cato il valore <strong>di</strong> W calcolato dai dati.Ipotesi alternativa bilaterale. Il <strong>di</strong>scorso fatto è facilmente esten<strong>di</strong>bileal caso <strong>di</strong> ipotesi alternativa bilaterali, ovvero, quando, sottoH 1 , la <strong>di</strong>stribuzione <strong>delle</strong> “x” può essere o a destra o a sinistra della<strong>di</strong>stribuzione <strong>delle</strong> “y”.La <strong>statistica</strong> W continua ad essere appropriata. Sotto H 1 , ci aspettiamovalori <strong>di</strong> W o più gran<strong>di</strong> o più piccoli <strong>di</strong> quelli attesi sottoH 0 .Visto che è possibile far vedere che la <strong>di</strong>stribuzione 4 sotto H 0 èsimmetrica intorno anm2il livello <strong>di</strong> significatività osservato in questo caso èP(|W − nm/2| ≥ |W oss − nm/2|).E se ci sono dati uguali? Per il modello, dati uguali non possonocapitare. Nella realtà può capitare <strong>di</strong> trovare due o più dati uguali.Al proposito, e’ necessario considerare separatamente due casi:- la variabile considerata è fondamentalmente continua; i datiuguali sono pochi e semplicemente il frutto <strong>di</strong> arrotondamenti;in questo caso, possiamo nella sostanza ignorarli utilizzando unaqualsiasi conveniente definizione <strong>di</strong> rango.- la variabile considerata è realmente <strong>di</strong>screta e può assumere pochivalori; in questo caso non ci sono le con<strong>di</strong>zioni per applicare il testche stiamo considerando.4 ovviamente è la stessa sia se l’ipotesi alternativa è unilaterale sia se è bilaterale.Dove facciamo la conoscenza con <strong>delle</strong> . . . 180


Un esempio• In una ricerca sono state utilizzate due modalità <strong>di</strong>fferenti <strong>di</strong>coltivazione <strong>di</strong> una certa pianta (officinale):- 10 piante sono state coltivate con la tecnica “classica”; i pesi <strong>delle</strong>piante raccolte ed essiccate sono risultati (le “y”):4,81 4,17 4,41 3,59 5,873,83 6,03 4,89 4,32 4,69- altre 10 piante sono state coltivate con una tecnica “nuova”; i pesiin questo caso sono risultati (le “x”):4,17 5,58 5,18 6,11 4,504,61 5,17 4,53 5,33 5,14• Vogliamo verificare se la nuova tecnica è migliore <strong>di</strong> quella classicaovvero se la <strong>di</strong>stribuzione da cui provengono le “x” è in unqualche senso a destra della <strong>di</strong>stribuzione da cui provengono le “y”.• Il boxplot in<strong>di</strong>ca che nel campione la nuova tecnica si è“comportata meglio”.3.5 4.0 4.5 5.0 5.5 6.0yx• Proviamo ad utilizzare il test <strong>di</strong> Wilcoxon per verificare se la <strong>di</strong>fferenzaè significativa, ovvero se possiamo aspettarci che sia un risultato<strong>di</strong> una reale <strong>di</strong>fferenza tra le due tecniche e non un sempliceartefatto legato al campione.• Si osservi che due <strong>delle</strong> osservazioni sono uguali. In questocaso, possiamo attribuire l’uguaglianza ad un semplice effetto <strong>di</strong>arrotondamento e quin<strong>di</strong> procedere lo stesso.181 Unità KDove facciamo la conoscenza con <strong>delle</strong> . . . 182


• Osservazioni or<strong>di</strong>nate e ranghi. Per la coppia <strong>di</strong> osservazioniuguali sono utilizzate due definizioni alternative <strong>di</strong> rango (rangomassimo e rango me<strong>di</strong>o).dati x o y? rango rangomassimo me<strong>di</strong>o3,59 y 1 13,83 y 2 24,17 y 4 3,54,17 x 4 3,54,32 y 5 54,41 y 6 64,5 x 7 74,53 x 8 84,61 x 9 94,69 y 10 104,81 y 11 114,89 y 12 125,14 x 13 135,17 x 14 145,18 x 15 155,33 x 16 165,58 x 17 175,87 y 18 186,03 y 19 196,11 x 20 20m=(numero <strong>di</strong> “x”)= 10 10m(m + 1)/2 = 55 55somma ranghi “x”= 123,0 122,5W = 67 67,5• La <strong>statistica</strong> test vale 67 o 67,5 a seconda della definizione <strong>di</strong> rangoche si adotta.• Utilizzando o <strong>delle</strong> tavole o una funzione appropriata 5 troviamoche il livello <strong>di</strong> significatività osservato è all’incirca del 10%.• Il valore non è molto grande ma è ancora compatibile conH 0 . Siamo quin<strong>di</strong> in una situazione <strong>di</strong> accettazione, con qualchedubbio, dell’ipotesi che le due tecniche <strong>di</strong> coltivazione non abbiano<strong>di</strong>fferente efficienza.5 in R, la funzione che calcola la funzione <strong>di</strong> ripartizione della <strong>statistica</strong> test <strong>di</strong> Wilcoxon a duecampioni si chiama pwilcox.183 Unità KDove facciamo la conoscenza con <strong>delle</strong> . . . 184


Wilcoxon o Student? Una guerra non ci serve!Vantaggio del test <strong>di</strong> Wilcoxon E’ utilizzabile anche per piccolicampioni senza che sia necessario assumere la normalità dei dati.Vantaggio del test t a due campioni Se i dati sono normali, il testbasato sulla t è più potente, ovvero, a parità <strong>di</strong> errore <strong>di</strong> primo tipo,permette <strong>di</strong> ottenere una probabilità <strong>di</strong> errore <strong>di</strong> secondo tipo piùbassa (= <strong>di</strong>chiara più spesso che H 1 è vera quando H 1 è realmentevera).Nelle applicazioni. . . . . . è comunque conveniente utilizzarli inmaniera combinata.“. . . Per verificare l’ipotesi che la nuova tecnica sia miglioreabbiamo utilizzato il test t <strong>di</strong> Student (p = 0,125) e il test <strong>di</strong>Wilcoxon (p ≈ 0,109). . . ”Risultati simili (come nel caso illustrato qui sopra) si confermano avicenda. La <strong>di</strong>scussione <strong>di</strong> risultati contrastanti è spesso illuminante.Altri test <strong>di</strong> “alto rango”Esistono test basati sui ranghi, e quin<strong>di</strong> utilizzabili anche per piccolicampioni senza assunzione parametriche, per svariati problemi <strong>di</strong>verifica <strong>di</strong> ipotesi.Mi limito a menzionarne due.Wilcoxon a un campione. E’ un test sulla me<strong>di</strong>ana <strong>di</strong> un singolocampione e quin<strong>di</strong> “fratello” del test t ad un campione. Richiede lasimmetria della <strong>di</strong>stribuzione dei dati ma non la normalità.Può anche essere utilizzato confrontare due gruppi nel caso <strong>di</strong> datiappaiati.Kruskal-Wallis. E’ l’analogo basato sui ranghi dell’analisi dellavarianza ad un criterio <strong>di</strong> classificazione. Confronta quin<strong>di</strong> k gruppi.L’ipotesi nulla è che abbiano la stessa <strong>di</strong>stribuzione. L’ipotesi alternativaè che almeno un gruppo abbia una <strong>di</strong>stribuzione che generavalori o più piccole o più gran<strong>di</strong> <strong>delle</strong> altre.185 Unità KDove facciamo la conoscenza con <strong>delle</strong> . . . 186


La <strong>di</strong>stribuzione normaleAppen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilitàPer facilitarmi i richiami a lezione riporto in questa appen<strong>di</strong>ce alcuni“flash informali” <strong>di</strong> probabilità.Probabilità 1 Una variabile casuale continua, chiamiamola Y, si<strong>di</strong>ce normale <strong>di</strong> me<strong>di</strong>a µ e varianza σ 2 se la sua funzione <strong>di</strong> densitàèf(x; µ, σ) = 1σ √ 2π exp {− 1 2( ) } 2 x − µσ(−∞ < x < +∞).Scriveremo in questo caso Y ∼ N(µ, σ) dove il simbolo ∼ si legge “si<strong>di</strong>stribuisce come”. Sinonimo <strong>di</strong> <strong>di</strong>stribuzione normale è <strong>di</strong>stribuzionegaussiana o <strong>di</strong> Gauss. Nel caso in cui µ = 0 e σ = 1 <strong>di</strong>remo che Yè una normale standard.Probabilità 2 La densità è simmetrica intorno a µ. Il supporto, seσ > 0, è tutta la retta reale (ovvero una variabile casuale normalepuò assumere valori da −∞ a +∞). Però quasi tutta la sua massa èconcentrata nell’intervallo [µ − 3σ; µ + 3σ] visto chese Y ∼ N(µ, σ 2 ) allora P(µ − 3σ ≤ Y ≤ µ + 3σ) ≈ 0,9973.Probabilità 3 Se Y ∼ N(µ, σ 2 ) e v 0 e v 1 sono due costanti reali,allora v 0 + v 1 Y ∼ N(v 0 + v 1 µ, v 2 1 σ2 ), ovvero, trasformate lineari <strong>di</strong>una variabile casuale normale sono normali con me<strong>di</strong>a e varianzaappropriate.Quin<strong>di</strong>, ad esempio,Y ∼ N(µ, σ 2 ) ⇒ Y − µ ∼ N(0, 1).σProbabilità 4 Se Y 1 e Y 2 sono variabili casuali normali in<strong>di</strong>pendentitra loro allora anche le loro combinazioni lineari, ovvero le variabilicasuali del tipo Y = v 1 Y 1 +v 2 Y 2 dove v 1 e v 2 sono <strong>delle</strong> costanti reali,hanno <strong>di</strong>stribuzione normale con me<strong>di</strong>a e varianza appropriate 1 .Quin<strong>di</strong>, ad esempio, somme (Y = Y 1 + Y 2 ) e <strong>di</strong>fferenze (Y = Y 1 − Y 2 )<strong>di</strong> variabili casuali normali in<strong>di</strong>pendenti sono normali.1 per il calcolo della me<strong>di</strong>a e della varianza si veda [Probalità 33] e [Probalità 35].Richiami e complementi <strong>di</strong> probabilità 188


Probabilità 5 Seguendo un uso abbastanza comune, nei <strong>luci<strong>di</strong></strong>vengono in<strong>di</strong>cati con:• Φ(·) la funzione <strong>di</strong> ripartizione <strong>di</strong> una variabile casualenormale standard; quin<strong>di</strong>Densità <strong>di</strong> una variabile casuale normale per tre <strong>di</strong>fferentivalori <strong>di</strong> µ e σ 2Φ(x) = P(N(0, 1) ≤ x) = 1 √2π∫ x−∞e −x2 /2 dx• z p il quantile p-esimo della stessa <strong>di</strong>stribuzioneP(N(0, 1) ≤ z p ) = Φ(z p ) = p.Probabilità 6 Per il calcolo <strong>di</strong> Φ(·) e dei relativi quantili z p è necessarioutilizzare <strong>delle</strong> funzioni o <strong>delle</strong> tabelle appropriate. In R lefunzioni sono pnorm e qnorm. Una tabella dei quantili <strong>di</strong> unanormale standard è contenuta in “Formulario e tavole” scaricabiledalla pagina del corso.Probabilità 7 E’ importante notare che riuscendo a calcolare Φ(·)riusciamo a calcolare la funzione <strong>di</strong> ripartizione <strong>di</strong> una normale <strong>di</strong>me<strong>di</strong>a e varianza qualsiasi. Infatti se Y ∼ N(µ, σ 2 ) allora( ))Y − µP(Y ≤ x) = Pσ≤ x − µσ= P(N(0, 1) ≤ x − µσ( x − µ= ΦσProbabilità 8 Analogamente si osservi che riuscendo a calcolarei quantili <strong>di</strong> una normale standard riusciamo anche a calcolare iquantili <strong>di</strong> una normale qualsiasi. Infatti, se Y ∼ N(µ, σ 2 ) allora( ) Y − µp = P(N(0, 1) ≤ z p ) = P ≤ z p = P(Y ≤ µ + σz p )σovvero(quantile-p <strong>di</strong> una N(µ, σ 2 )) = µ + σ(quantile-p <strong>di</strong> una N(0, 1)).).0.0 0.1 0.2 0.3 0.4N(18,1)N(21,1)N(18,4)10 15 20 25189 Appen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilità 190


Tre <strong>di</strong>stribuzioni <strong>di</strong> probabilità legate alla<strong>di</strong>stribuzione normale: χ 2Densità <strong>di</strong> una variabile casuale χ 2 per tre valori dei gra<strong>di</strong> <strong>di</strong>libertàProbabilità 9 Siano Y 1 ,. . . ,Y k k variabili casuali in<strong>di</strong>pendenti traloro e tutte <strong>di</strong>stribuite come una normale standard (Y i ∼ N(0, 1),i = 1, . . . , k). Allora <strong>di</strong>remo cheX 2 = Y 2 1 + · · · + Y 2 k =è una variabile casuale χ 2 con k gra<strong>di</strong> <strong>di</strong> libertà. Scriveremo in questicasi X 2 ∼ χ 2 (k).Probabilità 10 Per costruzione, una variabile casuale χ 2 è continuae assume solamente valori non negativi.Probabilità 11 La me<strong>di</strong>a e la varianza <strong>di</strong> un χ 2 con k gra<strong>di</strong> <strong>di</strong> libertàvalgono rispettivamente k e 2k, ovverok∑i=1Y 2 iE { X 2} = k e var { X 2} = 2k.0.00 0.05 0.10 0.155 gra<strong>di</strong> <strong>di</strong> libertà10 gra<strong>di</strong> <strong>di</strong> libertà20 gra<strong>di</strong> <strong>di</strong> libertà0 10 20 30 40Probabilità 12 Siano X 2 1 e X2 2 due variabili casuali in<strong>di</strong>pendenti talicheX 2 1 ∼ χ 2 (k) e X 2 2 ∼ χ 2 (h).AlloraX 2 = X 2 1 + X 2 2 ∼ χ 2 (h + k).Si noti inoltre dal grafico come all’aumentare dei gra<strong>di</strong> <strong>di</strong> libertà ladensità si sposta verso destra (= un χ 2 tende ad assumere valorisempre più gran<strong>di</strong> più aumentano i gra<strong>di</strong> <strong>di</strong> libertà).Si osservi anche l’asimmetria positiva <strong>delle</strong> <strong>di</strong>stribuzioni.Probabilità 13 Per il calcolo della funzione <strong>di</strong> ripartizione e deiquantili è necessario utilizzare <strong>delle</strong> funzioni o <strong>delle</strong> tabelle appropriate.In R le funzioni sono pchisq e qchisq. Una tabella dei quantiliè contenuta in “Formulario e tavole” scaricabile dalla pagina delcorso.191 Appen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilità 192


Tre <strong>di</strong>stribuzioni <strong>di</strong> probabilità legate alla<strong>di</strong>stribuzione normale: t <strong>di</strong> StudentGrafico della densità della t <strong>di</strong> StudentProbabilità 14 Siano Y e X 2 due variabili casuali in<strong>di</strong>pendenti talicheY ∼ N(0, 1) e X 2 ∼ χ 2 (k).Allora <strong>di</strong>remo cheYt = √X2 /kè una variabile casuale t <strong>di</strong> Student con k gra<strong>di</strong> <strong>di</strong> libertà escriveremo t ∼ t(k).La <strong>di</strong>stribuzione prende il nome (e il simbolo) da W.S.Gosset, unostatistico che lavoravava alla birreria (nel senso <strong>di</strong> fabbrica <strong>di</strong> birra)Guiness. I lavori <strong>di</strong> Gosset furono pubblicati sotto lo pseudonimo <strong>di</strong>Student, e Gosset, come anche noi abbiamo fatto, usava la lettera tper in<strong>di</strong>care la <strong>di</strong>stribuzione, da cui, appunto, t <strong>di</strong> Student.0.0 0.1 0.2 0.3 0.4−4 −2 0 2 4N(0,1)t 2t 20Probabilità 15 La <strong>di</strong>stribuzione è simmetrica intorno allo zero. Ilsupporto coincide con la retta reale (= una t può assumere valorida −∞ a +∞).Probabilità 16 Per qualsiasi numero finito dei gra<strong>di</strong> <strong>di</strong> libertà k,una t ha code “più pesanti” <strong>di</strong> quelle <strong>di</strong> una normale standard (=può assumere con probabilità più grande valori “lontani” da zero);Nota: I pe<strong>di</strong>ci in<strong>di</strong>cano i gra<strong>di</strong> <strong>di</strong> libertà.Si osservi come già per k = 20 non ci siano più gran<strong>di</strong> <strong>di</strong>fferenze trala densità <strong>di</strong> una t <strong>di</strong> Student e quella <strong>di</strong> una normale standard.Probabilità 17 Per k → ∞ la <strong>di</strong>stribuzione converge in <strong>di</strong>stribuzionead una normale standard. Quin<strong>di</strong>, una variabile casuale t <strong>di</strong>Student può essere approssimata con una N(0, 1) se k è abbastanzagrande.Probabilità 18 Per il calcolo della funzione <strong>di</strong> ripartizione e deiquantili è necessario utilizzare <strong>delle</strong> funzioni o <strong>delle</strong> tabelle appropriate.In R le funzioni sono pt e qt. Una tabella dei quantiliè contenuta in “Formulario e tavole” scaricabile dalla pagina delcorso.193 Appen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilità 194


Tre <strong>di</strong>stribuzioni <strong>di</strong> probabilità legate alla<strong>di</strong>stribuzione normale: F <strong>di</strong> SnedecorProbabilità 19 Siano X 2 1 e X2 2 due variabili casuali in<strong>di</strong>pendenti talicheX 2 1 ∼ χ 2 (k) e X 2 2 ∼ χ 2 (h).Allora <strong>di</strong>remo cheF = X2 1 /kX 2 2 /hè una variabile casuale F <strong>di</strong> Snedecor con (k, h) gra<strong>di</strong> <strong>di</strong> libertà(o con k gra<strong>di</strong> <strong>di</strong> libertà al numeratore e h al denominatore) escriveremo F ∼ F(k, h).Probabilità 20 Per costruzione, una variabile casuale F <strong>di</strong> Snedecorè continua e assume solamente valori non negativi.Probabilità 21 Per il calcolo della funzione <strong>di</strong> ripartizione e deiquantili è necessario utilizzare <strong>delle</strong> funzioni o <strong>delle</strong> tabelle appropriate.In R le funzioni sono pf e qf. Una tabella dei quantiliè contenuta in “Formulario e tavole” scaricabile dalla pagina delcorso.La <strong>di</strong>stribuzione binomialeProbabilità 22 Una variabile casuale Y, <strong>di</strong>screta e con supporto{0, 1, . . . , n}, viene chiamata binomiale con numero <strong>di</strong> prove pariad n e probabilità <strong>di</strong> successo ϑ se⎧⎨P(Y = y) =⎩( ny)ϑ y (1 − ϑ) n−yScriveremo in questo caso Y ∼ Bi(n, ϑ).se y = 0, . . . , n0 altrimentiProbabilità 23 Una variabile casuale binomiale descrive il numero<strong>di</strong> “successi” ottenuto in n esperimenti casuali che possono risultareo in un “successo” o in un “insuccesso” quando(i) gli n esperimenti sono completamente in<strong>di</strong>pendenti tra <strong>di</strong> loro;(ii) la probabilità <strong>di</strong> ottenere un successo è uguale a ϑ in ciascunodegli esperimenti.Il racconto in termini <strong>di</strong> palline colorate e <strong>di</strong> urne è il seguente:(i) esiste un urna contenente palline <strong>di</strong> 2 colori <strong>di</strong>versi:“arancione” e “azzurro”;(ii) tutte le palline possono essere estratte con la stessaprobabilità;(iii) la frazione <strong>di</strong> palline <strong>di</strong> colore arancione è ϑ (ad esempio, se il12% <strong>delle</strong> palline dell’urna è “arancione” allora ϑ = 0,12);(iv) n palline sono estratte dall’urna in maniera in<strong>di</strong>pendente e conreintroduzione (quin<strong>di</strong> la composizione dell’urna è la stessa inogni estrazione)allora la variabile casuale Y che descrive il numero <strong>di</strong> palline estratte<strong>di</strong> colore arancione è una Bi(n, ϑ)..Probabilità 24 É possibile far vedere cheE {Y} = nϑ e var {Y} = nϑ(1 − ϑ).195 Appen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilità 196


Probabilità 25 [Approssimazione normale]. Se n è sufficentementegrande e ϑ è <strong>di</strong>fferente da 0 e da 1, la <strong>di</strong>stribuzione binomiale puòessere approssimata con una <strong>di</strong>stribuzione normale 2 . In particolareè possibile far vedere che se Y ∼ Bi(n, ϑ) allora, per qualsivogliareale x, 3 limn→∞P()Y − nϑ√ ≤ xnϑ(1 − ϑ)Quin<strong>di</strong>, se n è grande, risulta(Y − nϑP(Y ≤ y) = P √ ≤nϑ(1 − ϑ)= P(N(0, 1) ≤ x) = Φ(x).) (√ y − nϑ ≈ Φnϑ(1 − ϑ)L’approssimazione è considerata ragionevolmente buona senϑ ≥ 5 e n(1 − ϑ) ≥ 5.)y − nϑ√ .nϑ(1 − ϑ)2 si tratta <strong>di</strong> una <strong>delle</strong> tante versioni del teorema del limite centrale, in particolare,probabilmente della prima <strong>di</strong>mostrata3 si veda [Probalità 5] per la definizione della funzione Φ(·).197 Appen<strong>di</strong>ceLa <strong>di</strong>stribuzione multinomialeProbabilità 26 Costituisce la generalizzazione della <strong>di</strong>stribuzionebinomiale al caso <strong>di</strong> più classi/categorie.Il racconto, in termini <strong>di</strong> palline colorate e <strong>di</strong> urne, è:(i) esiste un urna contenente palline <strong>di</strong> k colori <strong>di</strong>versi;(ii) tutte le palline possono essere estratte con la stessaprobabilità;(iii) la frazione <strong>di</strong> palline del colore i-simo è π i (ad esempio, se l’isimocolore è “viola” allora π i = 0.12 in<strong>di</strong>ca che il 12% <strong>delle</strong>palline dell’urna è “viola”);(iv) n palline sono estratte dall’urna con reintroduzione (ovvero lacomposizione dell’urna non cambia)allora la variabile casuale k-<strong>di</strong>mensionale Y = (Y 1 , . . . , Y k ) chedescrive il numero <strong>di</strong> palline estratte del primo colore,del secondocolore,. . . , è una Multinomiale(n, (π 1 , . . . , π k )).Probabilità 27 Un esperimento su una variabile casuale multinomialeci fornisce un vettore <strong>di</strong> k interi.Ad esempio, se k = 3, i colori sono {blu, viola, arancione} e n = 10un possibile risultato sperimentale potrebbe essere y = (3, 1, 6) e ciin<strong>di</strong>cherebbe che nelle 10 estrazioni dall’urna abbiamo ottenuto, inor<strong>di</strong>ne qualsiasi, 3 palline blu, 1 pallina viola e 6 palline arancione.Probabilità 28 Si osservi che, in generale,Y i ∈ {0, . . . , n} (i = 1, . . . , k) e Y 1 + · · · + Y k = n.Probabilità 29 Si osservi inoltre che, “per costruzione”,Y i ∼ Bi(n, π i ) (i = 1, . . . , k)o che più in generale se i 1 , . . . , i h sono h interi, maggiori <strong>di</strong> zero,minori o uguali a k e <strong>di</strong>stinti tra loro (h ∈ {1, . . . , k}), alloraY = Y i1 + · · · + Y ih ∼ Bi(n, π i1 + · · · + π ih ).Richiami e complementi <strong>di</strong> probabilità 198


Me<strong>di</strong>a e varianza <strong>di</strong> “combinazioni lineari” <strong>di</strong>variabili casualiProbabilità 30 Una proprietà <strong>di</strong> base del valore atteso, conseguenzadella definizione, è la sua linearità:(i) se Y è una variabile casuale con valore atteso finito e v unacostante reale allora, E {vY} = vE {Y} ;(ii) se Y 1 e Y 2 sono due variabili casuali ed esistono E {Y 1 } e E {Y 2 }allora E {Y 1 + Y 2 } = E {Y 1 } + E {Y 2 } .Probabilità 31 Sia Y una variabile casuale e si supponga che esistaE {Y}. Allora, se v 0 e v 1 sono due costanti realiE {v 0 + v 1 Y} = v 0 + v 1 E {Y} .Per <strong>di</strong>mostrarla si usi [Probalità 30] ponendo Y 1 uguale ad una variabile casualedegenere tale che P(Y 1 = v 0 ) = 1 e Y 2 = v 1 Y.Probabilità 32 Sia Y una variabile casuale e si supponga che esistavar {Y}. Allora, se v 0 e v 1 sono due costanti realiInfatti,var {v 0 + v 1 Y} = v 2 1var {Y} .{var {v 0 + v 1 Y} = E [v 0 + v 1 Y − E {v 0 + v 1 Y}] 2} ={= E [v 0 + v 1 Y − (v 0 + v 1 E {Y})] 2} == E { v 2 1(Y − E {Y}) 2} == v 2 1E { (Y − E {Y}) 2} == v 2 1var {Y})Probabilità 33 Siano Y 1 e Y 2 due variabili casuali ambedue convalore atteso finito. Allora, se v 1 e v 2 sono due costanti realiE {v 1 Y 1 + v 2 Y 2 } = v 1 E {Y 1 } + v 2 E {Y 2 } .E’ nient’altro che una formulazione alternativa <strong>di</strong> [Probalità 30].199 Appen<strong>di</strong>ceProbabilità 34 Siano Y 1 e Y 2 due variabili casuali tali che var {Y 1 },var {Y 2 } e cov {Y 1 , Y 2 } esistono finiti 4 . Allora, se v 1 e v 2 sono duecostanti realiInfattivar {v 1 Y 1 + v 2 Y 2 } = v 2 1var {Y 1 } + v 2 2var {Y 2 } + 2v 1 v 2 cov {Y 1 , Y 2 } .{var {v 1 Y 1 + v 2 Y 2 } = E [v 1 Y 1 + v 2 Y 2 − E {v 1 Y 1 + v 2 Y 2 }] 2} ={= E [v 1 Y 1 + v 2 Y 2 − (v 1 E {Y 1 } + v 2 E {Y 2 })] 2} ={= E [v 1 (Y 1 − E {Y 1 }) + v 2 (Y 2 − E {Y 2 }))] 2} == v 2 1E { (Y 1 − E {Y 1 }) 2} + v 2 2E { (Y 2 − E {Y 2 }) 2} ++2v 1 v 2 E {(Y 1 − E {Y 1 })(Y 2 − E {Y 2 })} == v 2 1var {Y} + v 2 2var {Y 2 } + 2v 1 v 2 cov {Y 1 , Y 2 } .Probabilità 35 Siano Y 1 e Y 2 due variabili casuali con me<strong>di</strong>e evarianze finite e incorrelate tra <strong>di</strong> loro (cov {Y 1 , Y 2 } = 0). Alloravar {Y 1 + Y 2 } = var {Y 1 − Y 2 } = var {Y 1 } + var {Y 2 } .Si tratta <strong>di</strong> due casi particolari <strong>di</strong> [Probalità 34].Probabilità 36 L’in<strong>di</strong>pendenza implica l’incorrelazione. Quin<strong>di</strong>[Probalità 35] vale anche quando Y 1 e Y 2 sono in<strong>di</strong>pendenti (purchèovviamente var {Y 1 } e var {Y 2 } esistano).Probabilità 37 A proposito <strong>di</strong> [Probalità 35]. Capita <strong>di</strong> trovareutilizzata nei compiti d’esame la seguente “versione” <strong>di</strong> [Probalità35]:var {Y 1 − Y 2 } = var {Y 1 } − var {Y 2 } .La conseguenza è un compito non sufficente qualsiasi altra cosa lostudente faccia. Nei casi in cui var {Y 1 } < var {Y 2 } si possono anchesentire a Santa Caterina <strong>delle</strong> urla “poco <strong>di</strong>vertite” del docente chesta correggendo il compito.4 in realtà sarebbe possibile <strong>di</strong>mostrare che l’esistenza <strong>delle</strong> varianze implica l’esistenza dellacovarianza.Richiami e complementi <strong>di</strong> probabilità 200


Probabilità 38 Siano Y 1 , . . . , Y n n variabili casuali tutte <strong>di</strong> me<strong>di</strong>afinita e si ponga v 0 ,Y L = v 0 + v 1 Y 1 + · · · + v n Y n = v 0 +dove v 0 , . . . , v n sono n + 1 costanti reali. Allora,E {Y L } = v 0 + v 1 E {Y 1 } + · · · + v n E {Y n } = v 0 +n∑v i Y ii=1n∑v i E {Y i } .Può essere ottenuta utilizzando [Probalità 31] e, iterativamente, [Probalità 33] <strong>di</strong>cui la formula appena data costituisce una generalizzazione.Probabilità 39 Sia Y L definito come in [Probalità 38]. Allora, seesistono anche var {Y 1 },. . . ,var {Y n },var {Y L } = v 2 1var {Y 1 } + · · · + v 2 nvar {Y n } +==i=1+v 1 v 2 cov {Y 1 , Y 2 } + · · · + v n−1 v n cov {Y n−1 , Y n } =n∑v 2 i var {Y i } + ∑ v i v j cov {Y i , Y j } =ii≠jn∑v 2 i var {Y i } + 2 ∑ v i v j cov {Y i , Y j } .i


Distribuzione della me<strong>di</strong>a e della varianzacampionaria nel caso <strong>di</strong> un campione estratto dauna popolazione normaleProbabilità 41 Si supponga che (Y 1 , . . . , Y n ) siano <strong>delle</strong> variabilicasuali in<strong>di</strong>pendenti e identicamente <strong>di</strong>stribuite come una normale<strong>di</strong> me<strong>di</strong>a µ e varianza σ 2 .Si pongaY = 1 n∑Y i e S 2 = 1 n∑(Y i − Y) 2 .nn − 1i=1Allora è possibile <strong>di</strong>mostrare che:(i) la <strong>di</strong>stribuzione <strong>di</strong> Y è normale <strong>di</strong> me<strong>di</strong>a µ e varianza σ 2 /n,ovvero,)Y ∼ N(µ, σ2;ni=1Probabilità 43 Ricordando la definizione della t <strong>di</strong> Student [Probalità14], è imme<strong>di</strong>ato far vedere che [Probalità 41] implica ancheche √ n(Y − µ)∼ t(n − 1).SInfatti√ √ n(Y − µ)n(Y − µ)/σ= √S((n − 1)S2 /σ 2 )/(n − 1) ==N(0, 1)√ ∼ t(n − 1)χ2 (n − 1)/(n − 1)dove, nell’ultimo passaggio, oltre alla definizione della t <strong>di</strong> Student, abbiamoutilizzato il fatto che Y e S 2 sono tra <strong>di</strong> loro in<strong>di</strong>pendenti.(ii) la <strong>di</strong>stribuzione <strong>di</strong> (n − 1)S 2 /σ 2 è un χ 2 con n − 1 gra<strong>di</strong> <strong>di</strong>libertà, ovvero,(n − 1)S 2σ 2 ∼ χ 2 (n − 1);(iii) Y e S 2 sono stocasticamente in<strong>di</strong>pendenti.Probabilità 42 Utilizzando [Probalità 3], la parte riguardante lame<strong>di</strong>a campionaria dell’enunciato [Probalità 41] può anche esserescritta come √ n(Y − µ)∼ N(0, 1).σ203 Appen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilità 204


Distribuzione <strong>delle</strong> me<strong>di</strong>e e <strong>delle</strong> varianzecampionarie e <strong>di</strong> alcune loro funzioni notevoli nelcaso <strong>di</strong> due campioni estratti da popolazioni normaliProbabilità 44 Siano Y 1 , . . . , Y n <strong>delle</strong> variabili casuali in<strong>di</strong>pendentitra <strong>di</strong> loro e identicamente <strong>di</strong>stribuite come una normale <strong>di</strong> me<strong>di</strong>aµ y e varianza σ 2 y e X 1 , . . . , X n <strong>delle</strong> variabili casuali in<strong>di</strong>pendenti tra<strong>di</strong> loro e dalle “Y” e identicamente <strong>di</strong>stribuite come una normale <strong>di</strong>me<strong>di</strong>a µ x e varianza σ 2 x. DefiniamoY = 1 nn∑i=1Y i e S 2 y = 1n − 1n∑(Y i − Y) 2e in maniera analoga X e S 2 x.Allora, ricordando che “trasformate separate <strong>di</strong> variabili casualiin<strong>di</strong>pendenti sono in<strong>di</strong>pendenti” 5 , da [Probalità 41] segue che Y, X,S 2 y e S 2 x sono variabili casuali in<strong>di</strong>pendenti tra loro tali cheY ∼ NX ∼ N()µ y , σ2 y,n( )µ x , σ2 x,mi=1(n − 1)S 2 yσ 2 y∼ χ(n − 1),(m − 1)S 2 xσ 2 x∼ χ(m − 1).Probabilità 45 Nelle stessa situazione <strong>di</strong> [Probalità 44] si ipotizzicheσ 2 y = σ 2 x = σ 2ovvero che le “Y” e le “X” abbiano la stessa <strong>di</strong>spersione. Si pongaS 2 = (n − 1)S2 Y + (m − 1)S2 X.n + m − 2Allora, da [Probalità 12], [Probalità 14] e [Probalità 44] segue cheS 2 è una variabile casuale in<strong>di</strong>pendente da Y e X e tale cheInoltre,(n + m − 2)S 2σ 2 ∼ χ 2 (n + m − 2).Y − X − (µ − η)( 1Sn m) + 1 ∼ t(n + m − 2).Quin<strong>di</strong> da [Probalità 4] e [Probalità 19] segue che()Y − X ∼ Nµ y − µ x , σ2 yn + σ2 xmeS 2 y/σ 2 yS 2 x/σ 2 x∼ F(n − 1, m − 1).5 ovvero che se Z è una variabile casuale, eventualmente multi<strong>di</strong>mensionale, e W è un’altravariabile casuale, eventualmente multi<strong>di</strong>mensionale, in<strong>di</strong>pendente da Z allora f(Z) èin<strong>di</strong>pendente da g(W) per qualsiasi f(·) e g(·) per cui f(Z) e g(W) sono variabili casuali.205 Appen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilità 2<strong>06</strong>


Alcuni risultati asintoticiProbabilità 46 Mo<strong>di</strong> <strong>di</strong> convergenza Sia Y 1 , Y 2 , . . . , una successioni<strong>di</strong> variabili casuali, l una costante e Y ∞ una variabile casuale. Si<strong>di</strong>ce che1. la successione {Y n } converge quasi certamente o con probabilitàuno a l seP( limn→∞Y n = l) = 1;2. la successione {Y n } converge in probabilità a l se, ∀ɛ > 0lim P(|Y n − l| ≤ ɛ) = 1;n→∞3. la successione {Y n } converge in <strong>di</strong>stribuzione a Y ∞ se per ogniintervallo [a, b]lim P(a ≤ Y n ≤ b) = P(a ≤ Y ∞ ≤ b).n→∞La convergenza quasi certa implica la convergenza in probabilità.Per questo motivo la prima è volte chiamata convergenza forte e laseconda debole.Probabilità 47 Siano Y 1 , Y 2 , . . . una successione <strong>di</strong> variabili casualie f(·) una funzione da R in R.(i) Se Y n converge in probabilità/quasi certamente alla costantel e f(·) è continua in l allora f(Y n ) converge in probabilità/quasicertamente a f(l).(ii) Se Y n converge in <strong>di</strong>stribuzione alla variabile casuale Y ∞ e f(·)è continua, f(Y n ) converge in <strong>di</strong>stribuzione a f(Y ∞ ).Esempio 1. Se Y n converge in probabilità a 25, allora √ Y n convergein probabilità a 5.Esempio 2. Se Y n converge ad una N(0, 1), allora Y 2 n converge ad unχ 2 (1).Probabilità 48 Siano Y 1 , Y 2 , . . . e X 1 , X 2 , . . . due successioni <strong>di</strong> variabilicasuali convergenti in probabilità/quasi certamente rispettivamentea l e m. Sia inoltre f(·, ·) una funzione da R 2 a R continua in(l, m). Allora, f(Y n , X n ) converge in probabilità/quasi certamente af(l, m).Quin<strong>di</strong>, ad esempio, le successioni Y n +X n , Y n −X n , Y n X n e, se m ≠ 0Y n + X n convergono a l + m, l − m, lm e l/m.Probabilità 49 Siano Y 1 , Y 2 , . . . e X 1 , X 2 , . . . due successioni <strong>di</strong> variabilicasuali la prima convergente in <strong>di</strong>stribuzione a Y ∞ e la secondain probabilità a m. Sia inoltre f(·, ·) una funzione da R 2 a R continua.Allora, f(Y n , X n ) converge in <strong>di</strong>stribuzione a f(Y ∞ , m).Quin<strong>di</strong>, ad esempio, se Y n converge in <strong>di</strong>stribuzione ad una normalestandard, allora Y n + X n , Y n − X n , Y n X n e, se m ≠ 0 Y n + X n convergonoin <strong>di</strong>stribuzione rispettivamente ad una N(m, 1), N(−m, 1),N(0, m 2 ) e N(0, m −2 ).207 Appen<strong>di</strong>ceRichiami e complementi <strong>di</strong> probabilità 208


Probabilità 50 Legge forte dei gran<strong>di</strong> numeri. Sia Y 1 , Y 2 , . . .una successione <strong>di</strong> variabili casuali in<strong>di</strong>pendenti e identicamente<strong>di</strong>stribuite tali che E {Y 1 }, chiamiamolo µ, esista 6 . AlloraY n = 1 nconverge quasi certamente (e quin<strong>di</strong> anche in probabilità) a µ.Probabilità 51 Teorema del limite centrale. Nella stessa situazione<strong>di</strong> [Probalità 50] se esiste anche σ 2 = var {Y 1 } alloran∑i=1Y n − µσ√ nconverge in <strong>di</strong>stribuzione ad una normale standard.Probabilità 52 Limite centrale con varianza “stimata”. Nelle ipotesidel teorema del limite centrale [Probalità 51], si supponga <strong>di</strong>conoscere una successione ^σ n convergente (almeno) in probabilitàa σ.Allora ancheInfatti,Y − µ^σ n√ nconverge in <strong>di</strong>stribuzione ad una N(0, 1).Y − µ= Y − µ^σ√ nσ√n ne quin<strong>di</strong> il risultato segue da [Probalità 49].Y i× σ^σ n6 essendo le “Y” identicamente <strong>di</strong>stribuite ovviamente l’esistenza del valore atteso <strong>di</strong> Y 1 implical’esistenza del valore atteso <strong>di</strong> tutte le “Y”.209 Appen<strong>di</strong>ceProbabilità 53 Applicazione alla varianza campionaria. SiaY 1 , Y 2 , . . . una successione <strong>di</strong> variabili casuali in<strong>di</strong>pendenti e identicamente<strong>di</strong>stribuite con me<strong>di</strong>a µ e varianza σ 2 (che supponiamoesistere).PoniamoY n = 1 n∑Y i e S 2 n = 1 n∑(Y i − Y) 2 .nn − 1i=1Per la legge forte dei gran<strong>di</strong> numeri [Probalità 50], Y n converge conprobabilità uno a µ.S 2 , vista la presenza in tutti gli adden<strong>di</strong> <strong>di</strong> Y, non è però una somma<strong>di</strong> variabili casuali in<strong>di</strong>pendenti. Quin<strong>di</strong> non possiamo applicare<strong>di</strong>rettamente la legge forte dei gran<strong>di</strong> numeri. Però possiamoscriveredoveV 2 n = 1 nS 2 n =i=1nn − 1 (V2 n − D 2 n)n∑(Y i − µ) 2 e D n = Y n − µ.i=1Osserviamo che• n/(n − 1) è una successione numerica convergente a uno;• (Y 1 − µ) 2 , (Y 2 − µ) 2 , . . . è una successione <strong>di</strong> variabili casualiin<strong>di</strong>pendenti e identicamente <strong>di</strong>stribuite <strong>di</strong> me<strong>di</strong>a σ 2 ; la leggeforte dei gran<strong>di</strong> numeri ci garantisce quin<strong>di</strong> che Vn 2 converge quasicertamente a σ 2 ;• D n converge a zero con probabilità uno e per [Probalità 47] lostesso quin<strong>di</strong> accade a D 2 n;• quin<strong>di</strong>, applicando [Probalità 48], troviamo che S 2 n converge conprobabilità uno a σ 2 ;• per [Probalità 47] anche che√S n = S 2 n converge con probabilità uno a σRichiami e complementi <strong>di</strong> probabilità 210


Probabilità 54 Applicazione alla binomiale. Sia X 1 , X n , . . . unasuccessione <strong>di</strong> variabili casuali in<strong>di</strong>pendenti e identicamente<strong>di</strong>stribuite come una Bi(1, ϑ), 0 < ϑ < 1. Sappiamo che 7E {X i } = ϑ e var {X i } = ϑ(1 − ϑ), (i = 1, 2, . . .)ed inoltre che, per la stessa definizione <strong>di</strong> binomiale,PoniamoY n =n∑X i ∼ Bi(n, ϑ).i=1^ϑ n = Y nn = 1 nn∑X i .(i) Per la legge forte dei gran<strong>di</strong> numeri [Probalità 50], ^ϑ n convergecon probabilità uno a ϑ.(ii) Per il teorema del limite centrale [Probalità 51],i=1^ϑ n − ϑ√ϑ(1 − ϑ)converge in <strong>di</strong>stribuzione ad una normale standard.(iii) Combinando le due affermazioni appena viste e utilizzando[Probalità 47] e [Probalità 49] anchen^ϑ n − ϑ√^ϑ(1 − ^ϑ)nconverge in <strong>di</strong>stribuzione ad una normale standard.7 [Probalità 24]211 Appen<strong>di</strong>ce Richiami e complementi <strong>di</strong> probabilità 212


Φ(·), ve<strong>di</strong> <strong>di</strong>stribuzione normalez p , ve<strong>di</strong> <strong>di</strong>stribuzione normalecasicoltivazione <strong>di</strong> piante officinali,181controllo qualità spessorelastre, 16Darwin, cuculi e altri uccelli,136demenza senile, 108fragole e fertilizzanti, 152hotdog, 160speriamo sia femmina, 105tonsille e streptococchi, 86un esperimento <strong>di</strong> Mendel,58un esperimento su un sonnifero,114una giuria per il dottorSpock, 78consistenza, ve<strong>di</strong> stimatoriconvergenzacon probabilità uno, 207debole, 207forte, 207In<strong>di</strong>ce analitico213funzioni <strong>di</strong> variabili casuali,208in <strong>di</strong>stribuzione, 207in probabilità, 207quasi certa, 207<strong>di</strong>stribuzione χ 2 , 191definizione, 191funzione <strong>di</strong> ripartizione equantili, 191grafico della funzione <strong>di</strong>densità, 192me<strong>di</strong>a e varianza, 191somma <strong>di</strong> due χ 2 , 191<strong>di</strong>stribuzione F <strong>di</strong> Snedecor,195definizione, 195funzione <strong>di</strong> ripartizione equantili, 195<strong>di</strong>stribuzione t <strong>di</strong> Student, 193convergenza alla normale,193definizione, 193funzione <strong>di</strong> ripartizione equantili, 193grafico della funzione <strong>di</strong>densità, 194<strong>di</strong>stribuzione binomiale, 196approssimazione normale, 197definizione, 196me<strong>di</strong>a e varianza, 196<strong>di</strong>stribuzione campionaria, 25<strong>di</strong>stribuzione multinomiale, 198contiene “molte” binomiali,198definizione, 198<strong>di</strong>stribuzione normale, 188Φ(·), 189z p , 189combinazioni lineari, 188definizione, 188<strong>di</strong>stribuzione della me<strong>di</strong>a edella varianza campionaria,203funzione <strong>di</strong> ripartizione, 189funzione <strong>di</strong> ripartizione <strong>di</strong>una normale standard, 189grafico della densità, 190quantili, 189quantili <strong>di</strong> una normale standard,189trasformazioni lineari, 188i.i.d., ve<strong>di</strong> in<strong>di</strong>pendenti e identicamente<strong>di</strong>stribuitein<strong>di</strong>pendenti e identicamente<strong>di</strong>stribuite, 21intervalli <strong>di</strong> confidenzadefinizione, 30214<strong>di</strong>fferenza <strong>delle</strong> me<strong>di</strong>e <strong>di</strong> duenormali, 143<strong>di</strong>fferenze tra due me<strong>di</strong>equando la numerosità campionariaè elevata, 148me<strong>di</strong>a <strong>di</strong> osservazioni i.i.d.quando la numerosità campionariaè grande, 44me<strong>di</strong>a <strong>di</strong> una normale convarianza nota, 32me<strong>di</strong>a <strong>di</strong> una normale <strong>di</strong>varianza non nota, 133probabilità <strong>di</strong> successo <strong>di</strong>una binomiale, 64proporzione, 64legge forte dei gran<strong>di</strong> numeri,209livello <strong>di</strong> significatività, ve<strong>di</strong>testlivello <strong>di</strong> significatività osservato,ve<strong>di</strong> testme<strong>di</strong>a campionaria, 21<strong>di</strong>stribuzione asintotica, 209me<strong>di</strong>a e varianza, 202modelli consideratibinomiale, 60, 81due campioni, senza assunzioniparametriche, 176multinomiale, 93, 105, 108normale, 115, 170normale con me<strong>di</strong>a e varianzaignote, 126


normale con me<strong>di</strong>a ignota evarianza nota, 19normale, 2 gruppi, 139normale, k gruppi, 170non <strong>di</strong>storsione, ve<strong>di</strong> stimatorinormal probability plot, 117ranghi, 174relazione tra me<strong>di</strong>e e devianzecon<strong>di</strong>zionate e marginali,163significatività, ve<strong>di</strong> test<strong>statistica</strong> or<strong>di</strong>nata, 117stimame<strong>di</strong>a, 21probabilità <strong>di</strong> successo <strong>di</strong>una binomiale, 61proporzione, 61varianza, 47stimatoriconsistenza, 27correttezza, 25della probabilità <strong>di</strong> successo<strong>di</strong> una binomiale, 61<strong>di</strong> una proporzione, 61<strong>di</strong>stribuzione campionaria, 25<strong>di</strong>stribuzione della me<strong>di</strong>a campionaria,25me<strong>di</strong>a campionaria, 21non <strong>di</strong>storsione, 25varianza campionaria, 47215teorema del limite centrale,209testai margini della significatività,75altamente significativo, 75analisi della varianza ad uncriterio, 170binomiale, 82borderline, 75<strong>di</strong>fferenze tra due me<strong>di</strong>equando la numerosità campionariaè elevata, 148errori <strong>di</strong> I e II tipo, 51funzione <strong>di</strong> potenza, 52generalità, 48in<strong>di</strong>pendenza in una tabella<strong>di</strong> contingenza, 94livello <strong>di</strong> significatività, 41livello <strong>di</strong> significatività osservato,72, 149livello <strong>di</strong> significatività prefissato,41non significativo, 75normalità, ve<strong>di</strong> test, Shapiro-Wilkomogeneità <strong>di</strong> due o più<strong>di</strong>stribuzioni multinomiali,108Shapiro-Wilk, 124significativo, 75su una proporzione, 68sulla bontà <strong>di</strong> adattamento<strong>di</strong> un modello teorico(dati multinomiali), 105sulla me<strong>di</strong>a <strong>di</strong> osservazionii.i.d. quando la numerositàcampionaria è grande,44sulla me<strong>di</strong>a <strong>di</strong> una normale<strong>di</strong> varianza ignota, ve<strong>di</strong>test, t a un campionesulla me<strong>di</strong>a <strong>di</strong> una normale<strong>di</strong> varianza nota, 39sulla probabilità <strong>di</strong> successo<strong>di</strong> una binomiale, 68t a due campioni, 139, 205correzione <strong>di</strong> Welch, 146t a un campione, 127, 204t per dati appaiati, 155uguaglianza <strong>di</strong> due me<strong>di</strong>e,ve<strong>di</strong> test, t a due campioniuguaglianza <strong>di</strong> due o più<strong>di</strong>stribuzioni <strong>di</strong> frequenza(dati multinomiali), 108Wilcoxon a due campioni,176varianza campionaria, 47convergenza asintotica, 210verifica d’ipotesi, ve<strong>di</strong> test216

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!