10.07.2015 Views

confronti multipli e contrasti tra medie - Scuola di Scienze Ambientali

confronti multipli e contrasti tra medie - Scuola di Scienze Ambientali

confronti multipli e contrasti tra medie - Scuola di Scienze Ambientali

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Dall’ANOVA eseguita su tutti e 5 i gruppi risulta cheAnalisi varianza: ad un fattore Tutti i gruppiOrigine SS df MS F Signific. F critTra gruppi 1077,32 4 269,33 49,368024 6,7374E-16 2,578737In gruppi 245,5 45 5,4555556Totale 1322,82 49Si conclude che ci sono <strong>di</strong>fferenze significative dovute ai <strong>di</strong>fferenti terreni <strong>di</strong> coltura.Per eseguire <strong>confronti</strong> appaiati <strong>tra</strong> <strong>me<strong>di</strong>e</strong>, prestabiliti a priori, dobbiamo in<strong>di</strong>viduare un valore dettoLSD (Least Significant Difference) e verificare se la <strong>di</strong>fferenza <strong>tra</strong> due <strong>me<strong>di</strong>e</strong> superi (in valoreassoluto) o no questo valore. Questo valore critico è ottenuto utilizzando la seguente formula:t [v] *2MS withinnAttenzione: v è il numero <strong>di</strong> df associato alla MS within risultante dall'analisi <strong>di</strong> tutti i gruppi. Lo stesso <strong>di</strong>casiper la MS within .<strong>me<strong>di</strong>e</strong>= 70,1 59,3 58,2 64,1 582% Glucose 2% Fruct. 2% Sucr Glu+Fruc2 * 5.45LSD = t 0,05 [45] * control 10,8 11,9 6 12,1102% Gluc. - 1,1 4,8 1,3LSD = 2,014 * 1,04 = 2,10 2% Fruct. - 5,9 0,22% Sucr - 6,1Glu+Fruc -Dato che il valore delle minima <strong>di</strong>fferenza significativa è <strong>di</strong> 2,10, quando si osservano <strong>di</strong>fferenze <strong>tra</strong>due <strong>me<strong>di</strong>e</strong> superiori a questo valore minimo possiamo <strong>di</strong>re che esse sono significative e quin<strong>di</strong>imputabili al <strong>tra</strong>ttamento utilizzato nella crescita dei piselli. Il fatto che l’ANOVA eseguita su tutti igruppi aveva come risultato il rigetto dell’ipotesi nulla risulta pertanto dovuto all’effettosignificativo che i tre zuccheri e la miscela dei due hanno sulla crescita dei piselli. Le rispettive<strong>me<strong>di</strong>e</strong> sono, infatti, risultate significativamente inferiori a quella del controllo. In particolare,glucosio, fruttosio e la loro miscela sono gli zuccheri che hanno prodotto, in uguale misura, cresciteinferiori, mentre il saccarosio ha un effetto meno limitante, ma sempre significativo rispetto alcontrollo.Quando si fanno esperimenti programmati è sempre consigliabile avere gruppi con ugualenumerosità. Quando ciò non sia possibile occorre mo<strong>di</strong>ficare la formula per ottenere il valore delLSD 1 1t [v] *MSwithinn n 1 2 In questo caso però otteniamo un valore <strong>di</strong> LSD per ogni confronto a due a due.Con<strong>tra</strong>sti pianificati (a priori )Supponiamo ora <strong>di</strong> aver deciso, a priori, <strong>di</strong> voler testare la <strong>di</strong>fferenza <strong>tra</strong> il controllo e tutti glizuccheri, quin<strong>di</strong> dei <strong>di</strong>saccari<strong>di</strong> (saccarosio) contro monosaccari<strong>di</strong>( glucosio, fruttosio e miscela deidue), dei due monosaccari<strong>di</strong> contro la loro miscela ed, infine <strong>tra</strong> i due monosaccari<strong>di</strong>.71


In questo caso dobbiamo ricorrere a dei <strong>confronti</strong> ortogonali (<strong>con<strong>tra</strong>sti</strong>) i quali presentano duelimitazioni: 1) il numero dei <strong>confronti</strong>, k


control gluc frut suc mix4 -1 -1 -1 -1 control versus all sugar0 -1 1 0 0 monosac (glu) vs monosac (frut)0 1 -1 0 0 0control gluc frut suc mix0 -1 -1 3 -1 monosac versus <strong>di</strong>sac0 -1 -1 0 2 monosac versus mix0 1 1 0 -2 0control gluc frut suc mix0 -1 -1 3 -1 monosac versus <strong>di</strong>sac0 -1 1 0 0 monosac (glu) vs monosac (frut)0 1 -1 0 0 0control gluc frut suc mix0 -1 -1 0 2 monosac versus mix0 -1 1 0 0 monosac (glu) vs monosac (frut)0 1 -1 0 0 0In questo caso i <strong>confronti</strong> sono risultati essere ortogonali per cui, dopo aver verificato conl’ANOVA se esiste una <strong>di</strong>fferenza significativa <strong>tra</strong> le <strong>me<strong>di</strong>e</strong> dei 5 gruppi possiamo procedere con i<strong>confronti</strong> prestabiliti al fine <strong>di</strong> evidenziare quali sono i gruppi che hanno prodotto questa <strong>di</strong>fferenzasignificativaAnalisi varianza: ad un fattore Tutti i gruppiOrigine SS df MS F Signific. F 0.01(4, 45)Tra gruppi 1077,32 4 269,33 49,36802444 6,7374E-16 2,58In gruppi 245,5 45 5,4555556Totale 1322,82 49Si conclude che ci sono <strong>di</strong>fferenze significative dovute ai <strong>di</strong>fferenti terreni <strong>di</strong> coltura,Per i <strong>confronti</strong> pianificati si può procedere con una semplice ANOVA 1 tenendo presente chela MS within è quella che risulta dall'analisi <strong>di</strong> tutti i gruppi: 5,4555556ANALISI VARIANZA i) control versus all sugarOrigine SS df MS F Signific. F 0.01(1, 45)Tra gruppi 832,32 1 832,32 152,5637475 4,6798E-16 4,1In gruppi 245,5 45 5,4555556Totale 1077,82 46Si conclude che ci sono <strong>di</strong>fferenze altamente ( 0,001)significative dovute ai <strong>di</strong>fferenti terreni <strong>di</strong>coltura.ANALISI VARIANZA ii) Disaccharides versus monosaccharidesOrigine dellavariazione SQ gdl MQ F Valore <strong>di</strong> significatività F 0.01(1, 45)Tra gruppi 235,2 1 235,2 43,11202 4,49728E-08 4,1In gruppi 245,5 45 5,455556Totale 480,7 46Si conclude che ci sono <strong>di</strong>fferenze altamente ( 0,001)significative <strong>tra</strong> l’effetto prodotto dal <strong>di</strong>saccaride equelli dei monosaccari<strong>di</strong>.1 L’Anova è stata fatta utilizzando l’opzione Analisi dati (Analisi varianza: ad un fattore) <strong>di</strong> excel, ma il calcolo <strong>di</strong> F èstato fatto “manualmente” sostituendo l’appropriato valore <strong>di</strong> MS within. Esistono comunque software che eseguono inautomatico i vari <strong>con<strong>tra</strong>sti</strong>. In questo caso dobbiamo solamente specificare i <strong>con<strong>tra</strong>sti</strong> che ci interessano con i relativicoefficienti <strong>di</strong> comparazione lineare.73


ANALISI VARIANZAiii) Monosaccharides versus mixtureOrigine dellavariazione SQ gdl MQ F Valore <strong>di</strong> significatività F 0.01(1, 45)Tra gruppi 3,75 1 3,75 0,687373 0,411435717 4,1In gruppi 245,5 45 5,455556Totale 249,25 46Si conclude che non ci sono <strong>di</strong>fferenze significative <strong>tra</strong> l’effetto prodotto dai monosaccari<strong>di</strong> e quello della loromiscela.ANALISI VARIANZA iv) Monosaccharide (glu) vs monosaccharide (frut)Origine dellaValore <strong>di</strong>variazione SQ gdl MQ F significatività F 0.01(1, 45)Tra gruppi 6,05 1 6,05 1,108961 0,297929729 4,1In gruppi 245,5 45 5,455556Totale 61,75 19Si conclude che non ci sono <strong>di</strong>fferenze significative dovute <strong>tra</strong> l’effetto prodotto dai due monosaccari<strong>di</strong>.Avendo eseguito tutti i <strong>con<strong>tra</strong>sti</strong> possibili (4) ed essendo sod<strong>di</strong>sfatta la con<strong>di</strong>zione <strong>di</strong> ortogonalitàrisulta che abbiamo eseguito anche una scomposizione delle variabilità <strong>tra</strong> gruppi totale per cui lasomma delle devianze (SQ) osservate nei quattro <strong>confronti</strong> deve essere a quella osservatanell’ANOVA <strong>di</strong> tutti i 5 gruppi (lo stesso <strong>di</strong>casi per la somma dei gdl).SQ gdlcontrol versus all sugars 832,32 1monosaccharides versus <strong>di</strong>saccharides 235,2 1monosaccharides versus mixture 3,75 1monosaccharide (glu) vs monosaccharide (frut) 6,05 1All groups 1077,32 4Ovviamente, non era necessario eseguire tutti i <strong>confronti</strong> ortogonali possibili (4), ma potevamolimitarci anche ad alcuni <strong>di</strong> essi, ovvero a quelli che pensavamo essere <strong>di</strong> nostro interesse.Nel caso avessi voluto fare altri <strong>confronti</strong> come ad esempio i 3 zuccheri puri con la loro mistura,questo non sarebbe risultato ortogonale con i due monosaccari<strong>di</strong> contro la loro misturaNon ortogonalecontrol gluc frut suc mix0 -1 -1 -1 3 pure sugar vs mixture0 -1 -1 0 2 monosac versus mix0 1 1 0 6 8In questo caso, ovvero in <strong>confronti</strong> non ortogonali occorre sviluppare altri meto<strong>di</strong>, ad esempio:Dunn-Sidak, Bonferroni o metodo sequenziale <strong>di</strong> Dunn-Sidak (ve<strong>di</strong> Sokal pag. 521)74


Confronti non pianificati (Post Hoc)Sono quelli che si eseguono dopo aver visto i risultati delle <strong>me<strong>di</strong>e</strong> e dell'ANOVA.Per <strong>confronti</strong> appaiati in tutte le possibili combinazioni (spesso in<strong>di</strong>cati come multiplecomparisons) si usano meto<strong>di</strong> simili a quello riportato per trovare LSD, detti MSD (MinimumSignificant Difference) che <strong>di</strong>fferiscono <strong>tra</strong> loro sostanzialmente per la <strong>di</strong>stribuzione a cui fariferimento, ovvero la <strong>di</strong>stribuzione <strong>di</strong> Q. In questo caso il valore relativo alla <strong>di</strong>fferenza <strong>tra</strong> due<strong>me<strong>di</strong>e</strong> che deve essere superato perché esse risultino statisticamente significative èMSD= Q(valore critico) * SE (standard error)Esiste una gran confusione <strong>di</strong> sigle dovuta al fatto che a volte si fa riferimento alla statisticautlizzata, per esempio MSR (Minimum Significant Range) che si basa su un valore critico <strong>di</strong> Qdetto studentized range, a volte invece si fa riferimento all'autore del metodo.Se i gruppi sono bilanciati i test più <strong>di</strong>ffusi sono due: quello <strong>di</strong> Tukey (detto T- method o Tukey'sHonestly Significant Difference, abbreviato con Tukey HSD) e quello <strong>di</strong> Student-Newan-Keul(SNK). En<strong>tra</strong>mbi si basano sulla <strong>di</strong>stribuzione dello studentized range, ma <strong>di</strong>fferiscono per il fattoche il primo prevede un unico valore <strong>di</strong> Q, il secondo più valori <strong>di</strong> Q che <strong>di</strong>pendono dalla <strong>di</strong>stanzadelle <strong>me<strong>di</strong>e</strong> da confrontare, ovvero si devono or<strong>di</strong>nare le <strong>me<strong>di</strong>e</strong> in or<strong>di</strong>ne crescente e considerarel'intervallo che c'è <strong>tra</strong> le <strong>me<strong>di</strong>e</strong> prese in considerazione. Un altro metodo, sempre per gruppibilanciati, è quello <strong>di</strong> Welsch.Se consideriamo i dati dell’esempio precedente (tabella 1) e se volessimo testare l'ipotesi chel'aggiunta <strong>di</strong> zuccheri produca un qualche effetto sulla crescita cellulare, ma al momento nonavessimo nessuna idea sul tipo <strong>di</strong> effetto prodotto dai <strong>di</strong>fferenti zuccheri, potremmo analizzarequesti dati con un test a posteriori.Student-Newan-Keul (SNK).Se consideriamo i dati della tabella iniziale e se volessimo testare l'ipotesi che l'aggiunta <strong>di</strong> zuccheriproduca un qualche effetto sulla crescita cellulare, ma al momento non avessimo nessuna idea sultipo <strong>di</strong> effetto prodotto dai <strong>di</strong>fferenti zuccheri, potremmo analizzare questi dati con un test aposteriori.Dall'ANOVA unifattoriale fatta su tutti i 5 (a) gruppi <strong>di</strong> n = 10 osservazioni e con MS within =5,455556 risulta che esiste una <strong>di</strong>fferenza significativa <strong>tra</strong> le <strong>me<strong>di</strong>e</strong> dei 5 gruppi.Or<strong>di</strong>nando le <strong>me<strong>di</strong>e</strong> in or<strong>di</strong>ne crescente:1%Gluc.+ k = 2 k = 3 k = 4 k = 52%Fruct. 2%Fruct. 2%Gluc. 2%Sucr. Control58 58,2 59,3 64,1 70,1e utilizzando la formula:MS withinSNK= Q [k,v] * nDove è il livello <strong>di</strong> significatività (che può essere 0,05 o 0,01); k è la posizione che occupa unadata me<strong>di</strong>a or<strong>di</strong>nata in maniera crescente rispetto alla prima (più piccola) e v = n T - a = 45 (ovvero idf <strong>di</strong> Ms within ). Abbiamo pertanto 4 valori <strong>di</strong> Q 2 da utilizzare nella formula per il calcolo delminimum significant range (qui in<strong>di</strong>cato con SNK)Q 0,05[2, 45] = 2,858 Q 0,05[3, 45] = 3,44 Q 0,05[4, 45] = 3,845 Q 0,05[5, 45] = 4,102SNK = 2,11 SNK = 2,54 SNK = 2,84 SNK = 3,03Risulta pertanto che il valore <strong>di</strong> minimum significant range che deve essere superato perché la<strong>di</strong>fferenza <strong>tra</strong> due <strong>me<strong>di</strong>e</strong> contigue risulti significativa è <strong>di</strong> 2,11. mentre quelli <strong>tra</strong> due <strong>me<strong>di</strong>e</strong> che<strong>di</strong>stano <strong>di</strong> 3, 4 e 5 posizioni rispettivamente sono 2,54; 2,84; 3,03.2 I valori <strong>di</strong> Q sono valori tabulati75


1 a 2 a 3 a 4 a 5 a1%Gluc.+2%Fruct. 2%Fruct. 2%Gluc. 2%Sucr. Control1%Gluc.+2%Fruct. 0,2 1,3 6,1 12,1 SKN2%Fruct. 2,11 1,1 5,9 11,92%Gluc. 2,54 2,11 4,8 10,82%Sucr. 2,84 2,54 2,11 6Control 3,03 2,84 2,54 2,11<strong>di</strong>fferenza <strong>tra</strong> <strong>me<strong>di</strong>e</strong>Possiamo quin<strong>di</strong> concludere che tutti gli zuccheri producono un effetto significativo rispetto alcontrollo. Il massimo effetto risulta essere prodotto, in ugual misura, dai due monosaccari<strong>di</strong> e dallaloro miscela, mentre un effetto minore, ma pur sempre significativo rispetto al controllo è prodottodal <strong>di</strong>saccaride (saccarosio).Se avessimo usato il Tukey HSD test avremmo avuto un unico valore tabulare <strong>di</strong> Q [a,v], dove a èil numero <strong>di</strong> gruppi. Per un il livello <strong>di</strong> significatività <strong>di</strong> 0,05, questo valore è 4,025, per cui ilvalore critico con cui confrontare le <strong>di</strong>fferenze <strong>tra</strong> le varie <strong>me<strong>di</strong>e</strong> è:MSD (Tukey) = 4,025 * 0,738617327 = 2,97In questo caso le conclusioni sarebbero risultate identiche a quelle ottenute con il precedentemetodo.Se i gruppi sono sbilanciati esistono altri meto<strong>di</strong>:-T'-method (detto anche Tuckey's-B) che usa,come valore critico Q, lo studentized augmentedrange;- GT2-method (conosciuto anche con il nome del suo ideatore Hochberg, che utilizza lostudentized maximum modulus;-Tukey-Kramer,che utilizza lo studentized range ma nel calcolare SE (standard error) considerail valore me<strong>di</strong>o <strong>di</strong> n.Secondo Dunnett i primi due meto<strong>di</strong> sarebbero troppo conservativi, mentre l'ultimo, sempreconservativo, ma forse rispecchia <strong>di</strong> più il livello <strong>di</strong> significatività <strong>di</strong> alfa. Nel dubbio fare tutti i tested eventualmente considerare quello che da i valori più bassi <strong>di</strong> MSD.Con<strong>tra</strong>sti non pianificatiE' possibile anche analizzare dei <strong>con<strong>tra</strong>sti</strong> non pianificati a priori senza limitazioni <strong>di</strong> numero,ovvero k> a*(a -1) / 2, che coinvolgono sempre due set .Il metodo <strong>di</strong> Scheffe è il più potente quando i gruppi (a) e le osservazioni (n) bilanciate <strong>di</strong> ognigruppo sono poche, e quando molti dei coefficienti lineari sono <strong>di</strong>versi da 0.Diversamente, e con gruppi solo leggermente sbilanciati, il T-method è il migliore, mentre congruppisbilanciati (un forte sbilanciamento è comunque altamente sconsigliato) si usa il GT2-method.In alcuni casi si potrebbe voler analizzare <strong>con<strong>tra</strong>sti</strong> <strong>tra</strong> più <strong>di</strong> due set (ovvero raggruppamenti <strong>di</strong>gruppi). Un caso potrebbe essere quello del nostro esempio dove, a posteriori, si nota che ilcontrollo <strong>di</strong>fferisce dal saccarosio e questi a loro volta <strong>di</strong>fferiscono dagli altri tre zuccheri cheformano un set omogeneo. In questo caso si potrebbero analizzare contemporaneamente tre set. Unmetodo per testare "tutti i possibili set" (ovvero tutte le possibili coppie <strong>di</strong> <strong>me<strong>di</strong>e</strong>, e tutti i possibili76


<strong>con<strong>tra</strong>sti</strong> <strong>tra</strong> gruppi <strong>di</strong> <strong>me<strong>di</strong>e</strong>) è quello proposto da Gabriel con il nome <strong>di</strong> sum of squaressimultaneous test procedure, abbreviato con SS-STP.Per una <strong>tra</strong>ttazione <strong>di</strong> questi test si rimanda a test specialistici (ve<strong>di</strong> Sokal pag. 240), anche perché illoro svolgimento richiede dei software statistici appropriati.RiassuntoNel ANOVA tipo I siamo spesso interessati, nel caso i fattori fissi abbiano più <strong>di</strong> due livelli, avedere quali sono i livelli che <strong>di</strong>fferiscono* In case of planned (or a priori) comparisons and equal sample sizes, LSD method is used. In caseof unplanned (or Post-Hoc or multiple) comparisons there are the hereafter listed MSD methods,also named MSR when the critical value Q (called studentized range) is used. For equal sizesamples there is another MSR method called Student-Newman-keul (SNK).77

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!