10.07.2015 Views

1399920137611_Sentieri

1399920137611_Sentieri

1399920137611_Sentieri

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

9/Profilo di incidenza di tumore nei SINe&p anno 38 (2) marzo-aprile 2014 • Suppl. 1Iniziamo con l’introdurre una semplice graduatoria per k=1,K unità, per esempio per i 17 SIN considerando una solasede neoplastica. Possiamo definire un vettore di ranghiR=(R 1,…,R k,…,R K) come l’insieme di ranghi:KR k= rango(ϑ k) = ∑ I (ϑk ≥ϑ k’)k’=1dove I(⋅) è la funzione indicatrice e ϑ kil parametro di interesse(rischio relativo).In realtà noi vogliamo comparare i rischi relativi per le J seditumorali (j=1,…,J) e per le I aree (i=1,…,I). Abbiamoquindi due possibili matrici di ranghi:la matrice P I×Jle cui righe rappresentano il profilo di malattiaper area, cioè i vettori di ranghi per ciascuna areaP i.=(P i1,…,P ij,…,P iJ) con:JP ij= rango(ϑ ij) = ∑ I (ϑij ≥ϑ ij’)j’=1e la matrice S I×Jle cui colonne rappresentano l’impronta diarea per malattia, cioè il vettore di ranghi per ciascuna malattiaS .j=(S 1j,…,S ij,…,S Ij) con:IS ij= rango(ϑ ij) = ∑ I (ϑij ≥ϑ ij’)i’=1Marginalizzando (mediando) per colonna la matrice P I×Jdeiprofili di malattia otteniamo una graduatoria generale dimalattia, marginalizzando per riga la matrice S I×Jotteniamouna graduatoria generale di aree.Per ottenere le stime delle matrici di ranghi e la relativaincertezza abbiamo specificato un modello gerarchicomultivariato Bayesiano.Assumiamo quindi a livello della funzione di verosimiglianzache Y ij(il numero di casi osservati nell’i-esimo sito e j-esimacausa tumorale) segua una distribuzione di Poisson con mediaE ijϑ ij, dove E ijè il numero di casi attesi definiti comeesplicitato nel paragrafo sui materiali. Il parametro ϑ ijè il rischiorelativo per l’i-esimo sito e la j-esima causa tumorale.Al secondo livello, assumiamo che per ogni sito il vettorelog(ϑ i) sia indipendentemente tratto da una distribuzionenormale multivariata con vettore media µ i.=(µ i1,…,µ ij,…,µ iJ)e matrice di varianza e covarianza Σ di dimensione JxJ. 4 Abbiamospecificato pertanto che, a priori, i siti siano tra di loroindipendenti ma vi sia correlazione tra le sedi di neoplasia. Lascelta di tassi specifici di riferimento per area geografica ci rassicuracirca la plausibilità dell’assunzione di indipendenza trasiti, a meno di una residua correlazione geografica tra SIN.Al terzo livello della gerarchia sono state specificate distribuzioninormali debolmente informative (cioè con media=0e precisione=0,0001) per µ ije una distribuzione Wishart(Ω,ν) per ciascuna matrice di varianza e covarianza Σ; doveΩ è una matrice JxJ definita positiva e ν, il parametro diforma, sia ν ≥J. 5 L’assunzione a priori per Ω è quella di indipendenzatra malattie.L’inferenza è condotta sulle distribuzioni a posteriori per iparametri di interesse; nello specifico, abbiamo stimato ledistribuzioni a posteriori dei ranghi dalle catene Markovchain Monte Carlo (MCMC), dove il rango è calcolato aogni iterazione. 6 Le simulazioni MCMC approssimanol’intera distribuzione cumulativa a congiunta a posteriori[F|Y] a partire dalla quale è possibile ottenere tutte le informazionidi sintesi necessarie: per esempio, per ognirango il relativo intervallo di credibilità. 7-10 In particolare,i ranghi a posteriori e le distribuzioni a posteriori sono ottenutedalla [F|Y]:■ per le malattie entro ciascuna area, per esempio per ilprofilo di malattia P i.=(P i1,…,P ij,…,P iJ)Pˆij = E[P ij |Y] =J∑ F (ϑ ij ≥ϑ ij’ |Y)j’=1■ per area entro ciascuna malattia, per esempio per l’improntadi area S .j=(S 1j,…,S ij,…,S Ij)Ŝ ij= E[S ij|Y] =I∑ F (ϑ ij≥ϑ ij’|Y)i’=1■ per malattia, marginalizzando (cioè mediando) sulle aree,per esempio per P ..=(P .1,…,P .j,…,P .J);■ per area, marginalizzando sulle malattie, per esempio perS ..=(S 1.,…,S i.,…,S I.).Va notato che i ranghi così ottenuti, cioè come medie delledistribuzioni a posteriori, assumono valori non interi e sono«regrediti» verso il rango centrale .Nel caso dei ranghi marginali sulle aree o sulle malattie l’effettodi «regressione» è particolarmente evidente. Per riportareil grafico alle dimensioni attese, per un rango cioè da 1 aK se K sono le unità da classificare, si utilizza il rango deiranghi. 3Tutte le analisi sono state effettuate con WinBugs14 11 e STA-TA12 (StataCorp. 2011. Stata Statistical Software: Release12. College Station, TX:StataCorp LP).In sintesi, per chiarezza si ricordi che i ranghi sono stimaticon un metodo bayesiano, quindi sono sempre stime a posteriori.Presentiamo qui sia i ranghi per area o per malattia,ma anche i ranghi marginali (facciamo cioè una media)su tutte le aree o su tutte le malattie.a Cumulata perché il rango si ottiene disponendo della serie ordinata di rischi relativi, per esempio dal più grande al più piccolo. La cumulataè stimata dalla percentuale di rischi relativi maggiori o uguali a valori crescenti di rischio relativo sul totale delle simulazioni.164 SENTIERI: MORTALITÀ-INCIDENZA ONCOLOGICA-RICOVERI

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!