11.07.2015 Views

La valutazione degli stati di salute sulla base delle preferenze ...

La valutazione degli stati di salute sulla base delle preferenze ...

La valutazione degli stati di salute sulla base delle preferenze ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

INTRODUZIONEStabilire <strong>delle</strong> priorità razionali in sanità in presenza <strong>di</strong> risorse scarse richiede un’attenta<strong>valutazione</strong> dei costi e dei benefici <strong>delle</strong> varie forme <strong>di</strong> intervento possibili. Negli ultimi trent’annigli sforzi <strong>degli</strong> economisti hanno teso ad elaborare tecniche che determinino le priorità in manierascientifica e che possano superare le obiezioni tipicamente rivolte all’approccio economico alpriority setting in sanità. Proprio dal tentativo <strong>di</strong> superare il limite intrinseco dell’approcciotra<strong>di</strong>zionale dell’analisi costi-benefici – la quantificazione <strong>di</strong> benefici legati al miglioramento della<strong>salute</strong> in termini monetari – si sviluppa l’analisi costo utilità (ACU) e il concetto <strong>di</strong> QALY.L’ACU nasce dal riconoscimento che gli interventi ed i programmi sanitari producono effetti siain termini <strong>di</strong> quantità <strong>di</strong> vita (variazioni della mortalità) che in termini <strong>di</strong> qualità <strong>di</strong> vita (variazionidella morbilità) e dalla necessità <strong>di</strong> combinare in un’unica misura queste due <strong>di</strong>mensioni. I beneficiincrementali <strong>di</strong> interventi e programmi sanitari vengono generalmente espressi in termini <strong>di</strong> anni <strong>di</strong>vita aggiu<strong>stati</strong> per la qualità o QALY (dall’inglese quality-adjusted life years), introdotti daKlarman et al. (1968) e sviluppati da Busch et al. (1973), Weinstein e Stason (1976), Boyle et al.(1983) e Williams (1985). 1 I QALY generati da un intervento vengono confrontati con il costoincrementale dello stesso. I risultati dei programmi possono essere poi espressi in termini <strong>di</strong> costoper QALY guadagnato.I QALY si calcolano ponderando gli anni <strong>di</strong> vita guadagnati grazie all’intervento/programmaper dei “pesi”, in<strong>di</strong>canti l’utilità <strong>di</strong> ciascuno stato <strong>di</strong> <strong>salute</strong> rispetto a dei valori ancora che sono laperfetta <strong>salute</strong> e la morte. <strong>La</strong> strategia generalmente utilizzata per ottenere i pesi è la misurazione<strong>di</strong>retta <strong>delle</strong> <strong>preferenze</strong> relative agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, attraverso interviste condotte su un campionerappresentativo della popolazione o <strong>di</strong> pazienti affetti da una malattia. 2Esistono tre principalitecniche per calcolare i pesi attraverso l’intervista <strong>di</strong>retta: il metodo <strong>delle</strong> Scala <strong>di</strong> Valutazione, RS,1 Una misura alternativa proposta da Mehrez e Gafni (1989, 1991) sono gli anni equivalenti in buona <strong>salute</strong>, HYE(dall’inglese healthy years equivalents). Sul vivace <strong>di</strong>battito sull’opportunità <strong>di</strong> sostituire all’impiego dei QALY gliHYE si vedano Culyer e Wagstaff (1993), Gafni et al. (1993), Mehrez e Gafni (1993), Johannesson et al. (1993).2Questa strategia risulta generalmente preferita a causa <strong>delle</strong> <strong>di</strong>storsioni potenzialmente legate a strategie alternativequali (i) il giu<strong>di</strong>zio <strong>di</strong> un esperto, (ii) l’utilizzo <strong>di</strong> valori in letteratura. Si vedano a proposito Dolan, Gudex et al. (1996)e Groot (2000).2


dall’inglese Rating Scale, il metodo <strong>delle</strong> Scommesse, SG, dall’inglese Standard Gamble, ed ilmetodo <strong>delle</strong> Alternative Temporali, TTO, dall’inglese Time Trade-Off. Mentre il primo metodo èbasato essenzialmente <strong>sulla</strong> introspezione, i rimanenti due sono tipicamente “economici” nel sensoche sono basati <strong>sulla</strong> scelta tra alternative.Affinché i pesi generati dalle tre tecniche possano essere utilizzati nella costruzione dei QALY,una <strong>delle</strong> con<strong>di</strong>zioni da sod<strong>di</strong>sfare è che essi riflettano le <strong>preferenze</strong> per gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, in modoche lo stato <strong>di</strong> <strong>salute</strong> maggiormente preferito riceva il peso maggiore e venga così favorito. Nesegue che se le <strong>preferenze</strong> sono stabili e se tutte e tre le tecniche riescono a elicere in modo correttole <strong>preferenze</strong> relative agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, un in<strong>di</strong>viduo dovrebbe assegnare a n <strong>stati</strong> <strong>di</strong> <strong>salute</strong> lostesso or<strong>di</strong>namento a prescindere dalla tecnica <strong>di</strong> misurazione utilizzata.Inoltre, sotto alcunecon<strong>di</strong>zioni identificate da Pliskin (1980) i valori <strong>delle</strong> utilità assegnati a identiche descrizioni <strong>di</strong> unostato <strong>di</strong> <strong>salute</strong> dovrebbero essere sostanzialmente analoghi. Tuttavia, sin dagli anni settanta,numerose analisi empiriche [si vedano ad esempio Torrance (1976), Wolfson et al. (1982),Hornberger et al. (1992)] hanno evidenziato che le tre tecniche producono valori <strong>delle</strong> utilitàsignificativamente <strong>di</strong>fferenti, ponendo pertanto il problema <strong>di</strong> quale sia il metodo da privilegiare percostruire i pesi. Il <strong>di</strong>lemma della scelta della tecnica “first best” è <strong>di</strong>fficilmente risolvibile a priori subasi teoriche, poiché le due tecniche che vengono privilegiate dagli economisti in quanto basate<strong>sulla</strong> scelta tra alternative, SG e TTO, prevedono ipotesi restrittive sul comportamento <strong>degli</strong>in<strong>di</strong>vidui che vengono sistematicamente violate.In questo lavoro, seguendo alcuni lavori empirici in letteratura [Dolan et al. (1996), Ba<strong>di</strong>a et al.(1999) e Devlin et al. (2003)] proponiamo <strong>di</strong> impostare empiricamente il problema della sceltadella tecnica <strong>di</strong> <strong>valutazione</strong>, confrontando le tecniche <strong>sulla</strong> <strong>base</strong> della coerenza <strong>delle</strong> rispostegenerate. <strong>La</strong> coerenza <strong>delle</strong> risposte in<strong>di</strong>viduali rappresenta un parametro importante <strong>di</strong> razionalità.Dato che le risposte incoerenti introducono una <strong>di</strong>storsione nei valori <strong>di</strong> utilità, esse vengonogeneralmente eliminate dal campione <strong>di</strong> dati utilizzato per calcolare le utilità. Privilegiare il metodocon un tasso <strong>di</strong> risposte incoerenti più basso vuol <strong>di</strong>re pertanto fare un utilizzo più efficiente dei3


dati. Anche se l’esclusione <strong>degli</strong> in<strong>di</strong>vidui fosse a costo zero in termini <strong>di</strong> conduzione dello stu<strong>di</strong>ocosto-utilità, è importante comunque cercare <strong>di</strong> spiegare l’origine <strong>delle</strong> incoerenze. Se esse fosseroconcentrate in uno specifico sotto-gruppo della popolazione (es. gli anziani), l’esclusione <strong>delle</strong>risposte incoerenti comporterebbe de facto l’esclusione <strong>delle</strong> presenze <strong>di</strong> questo sottogruppo dalla<strong>valutazione</strong> della qualità <strong>di</strong> uno stato <strong>di</strong> <strong>salute</strong>. A scopo illustrativo, si supponga che i QALY sianoutilizzati come strumento <strong>di</strong> policy per stabilire la desiderabilità sociale <strong>di</strong> un programma <strong>di</strong>assistenza ai malati <strong>di</strong> Alzheimer. Si supponga inoltre che le risposte incoerenti riguardanti la<strong>valutazione</strong> della qualità <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> legati all’Alzheimer siano concentrate nel gruppo <strong>degli</strong>ultra sessantacinquenni. L’esclusione <strong>di</strong> queste risposte dal campione implicherebbe ignorare le<strong>preferenze</strong> riguardo al programma <strong>di</strong> assistenza del gruppo sociale che risulta maggiormente colpitodalla malattia. Se le <strong>preferenze</strong> <strong>di</strong> questo gruppo fossero <strong>di</strong>vrse da quelle del resto dellapopolazione, ciò comporterebbe QALY <strong>di</strong>storti.Utilizzando un campione <strong>di</strong> sessanta in<strong>di</strong>vidui partecipanti ad uno stu<strong>di</strong>o <strong>sulla</strong> <strong>valutazione</strong> dellaqualità <strong>delle</strong> vita in seguito all’infarto del miocar<strong>di</strong>o, abbiamo analizzato le risposte in<strong>di</strong>viduali peridentificare le incoerenze e per spiegarne le possibili cause. I meto<strong>di</strong> basati su un trade-off, cioè SGe TTO, risultano quelli con un tasso <strong>di</strong> incoerenza più elevato. I risultati dello stu<strong>di</strong>o, tuttavia,mostrano che i tassi <strong>di</strong> incoerenza possono essere ridotti con un’accorta conduzione <strong>delle</strong> interviste.Il lavoro è organizzato come segue: nella prima sezione presentiamo sinteticamente le treprincipali tecniche <strong>di</strong> costruzione dei pesi <strong>sulla</strong> <strong>base</strong> <strong>delle</strong> <strong>preferenze</strong> <strong>degli</strong> intervi<strong>stati</strong> e i lorofondamenti teorici. Nella seconda sezione la nostra attenzione si focalizza sui motivi – problemilegati al frame utilizzato nella tecnica o al fallimento <strong>delle</strong> ipotesi comportamentali sottostanti letecniche – che spiegano perché i valori ottenuti con le <strong>di</strong>verse tecniche sono significativamente<strong>di</strong>versi. Nella terza sezione, spieghiamo come è da intendere il concetto <strong>di</strong> incoerenza e le suepossibili cause e perché è opportuno privilegiare le tecniche con il tasso <strong>di</strong> incoerenza più basso. Lesezioni successive sono de<strong>di</strong>cate ad una descrizione del campione utilizzato e al confronto <strong>delle</strong>4


tecniche <strong>sulla</strong> <strong>base</strong> <strong>delle</strong> incoerenze rilevate. Una breve <strong>di</strong>scussione <strong>delle</strong> implicazioni dei nostririsultati conclude il lavoro.1. LA MISURAZIONE DELLE PREFERENZE DEGLI STATI DI SALUTEIn questa sezione descriveremo sinteticamente i tre principali meto<strong>di</strong> costruzione <strong>delle</strong> utilità<strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, RS, SG e TTO, relativamente al caso in cui gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> da valutare sonocronici. 3Le utilità sono valori car<strong>di</strong>nali che vengono assegnati ad ogni stato <strong>di</strong> <strong>salute</strong> su una scala<strong>di</strong> intervallo che in genere ha come estremi i valori arbitrari 1 (perfetta <strong>salute</strong>) e 0 (morte). 4 Esseriflettono la qualità <strong>di</strong> uno stato <strong>di</strong> <strong>salute</strong> e permettono pertanto <strong>di</strong> valutare una variazione <strong>degli</strong> anni<strong>di</strong> vita da un punto <strong>di</strong> vista qualitativo. Affinché dalle utilità in<strong>di</strong>viduali si passi a costruire unvalore collettivo, le utilità in<strong>di</strong>viduali sono aggregate attraverso una me<strong>di</strong>a aritmetica. Da qui lanecessità <strong>di</strong> avere dei valori car<strong>di</strong>nali, dato che Arrow (1963) ha <strong>di</strong>mostrato che le utilità or<strong>di</strong>nalinon possono essere aggregate.1.1. Standard GambleSG è il metodo classico <strong>di</strong> misura car<strong>di</strong>nale <strong>delle</strong> <strong>preferenze</strong> che ha come fondamento teorico lateoria dell’Utilità Attesa <strong>di</strong> von Neumann-Morgestern. SG deriva infatti dalla <strong>di</strong>retta applicazione <strong>di</strong>uno <strong>degli</strong> assiomi su cui è costruita la teoria dell’Utilità Attesa, l’assioma della continuità <strong>delle</strong><strong>preferenze</strong>. L‘impiego <strong>di</strong> SG è quin<strong>di</strong> attraente perché, se si accettano gli assiomi <strong>di</strong> tale teoria, essoè valido per definizione [Torrance (1986)]. 5Inoltre, esso permette <strong>di</strong> prendere in considerazionel’incertezza che permea le decisioni cliniche [Ben Zion e Gafni (1983); Richardson (1994); Gafni eBirch (1995); Torrance et al. (1995)].3 I tre meto<strong>di</strong> possono anche essere impiegati al fine <strong>di</strong> elicere le <strong>preferenze</strong> riguardanti <strong>stati</strong> <strong>di</strong> <strong>salute</strong> temporanei. Siveda a proposito Drummond et al. (1997).4 <strong>La</strong> scala <strong>di</strong> misurazione car<strong>di</strong>nale ad intervalli implica che le <strong>di</strong>fferenze tra valori possono essere confrontate, ma irapporti tra valori non hanno significato [si veda Torrance (1986)].5 Gli oppositori <strong>di</strong> SG, invece, lo avversano proprio per la rigi<strong>di</strong>tà del suo approccio assiomatico che ha subito <strong>di</strong>versecritiche [si veda tra tanti altri Loomes e McKenzie (1989)].5


Nel caso <strong>di</strong> <strong>valutazione</strong> <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> cronici preferiti alla morte, all’intervistato è chiesto <strong>di</strong>comparare una lotteria ad un’alternativa certa. <strong>La</strong> lotteria è descritta come un trattamento che ha duepossibili esiti: vivere con probabilità p in perfetta <strong>salute</strong>, per un periodo <strong>di</strong> tempo T dopo il qualesegue la morte, e la morte imme<strong>di</strong>ata con probabilità (1-p). L’alternativa certa corrisponde allo stato<strong>di</strong> <strong>salute</strong> ipeggiore della perfetta <strong>salute</strong> e preferito alla morte, per il periodo <strong>di</strong> tempo T. Si favariare il valore <strong>di</strong> p fino a che l’intervistato non si <strong>di</strong>chiara in<strong>di</strong>fferente tra la lotteria e l’alternativacerta. Il valore <strong>di</strong> p che viene così determinato è il peso che esprime la preferenza per lo stato <strong>di</strong><strong>salute</strong> i, la sua utilità, h i =p.1.2. Rating ScaleRS è un metodo molto semplice che deriva dalla tra<strong>di</strong>zione psicometrica. Nel caso <strong>di</strong><strong>valutazione</strong> <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> cronici, essi vengono descritti all’intervistato come irreversibili e tutti<strong>di</strong> eguale durata: l’età in cui il soggetto entra nello stato in questione e l’età in cui il soggetto esceda tale stato, in quanto sopraggiunge la morte, è uguale per tutti gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong>. Si chiedeall’intervistato <strong>di</strong> or<strong>di</strong>nare gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> dal più preferito al meno preferito e, successivamente,<strong>di</strong> posizionarli su <strong>di</strong> una scala (solitamente da 100 a 0 o da 1 a 0) in modo tale che la <strong>di</strong>stanza traogni coppia <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> corrisponda alla <strong>di</strong>fferenza <strong>di</strong> preferenza fra i due <strong>stati</strong> <strong>di</strong> <strong>salute</strong>considerati. <strong>La</strong> posizione <strong>sulla</strong> scala <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> valutati molto simili tra loro dovrebbe quin<strong>di</strong>risultare molto vicina. Il peso che esprime la preferenza per ogni stato <strong>di</strong> <strong>salute</strong> è pari al valore adesso attribuito <strong>sulla</strong> scala <strong>di</strong>viso 100 nel caso la scala sia da 100 a 0 o lasciato inalterato nel caso <strong>di</strong>scala da 1 a 0.RSè generalmente considerato un metodo “inferiore” in quanto non ha un fondamentoassiomatico. Dyer e Sarin (1982) hanno tuttavia implicitamente fornito un supporto teorico a favore<strong>di</strong> questo metodo: 6 RS non solo or<strong>di</strong>na gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> secondo le <strong>preferenze</strong> in<strong>di</strong>viduali ma or<strong>di</strong>naanche le <strong>di</strong>fferenze <strong>di</strong> preferenza tra <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, X [Torrance (1986)]. Essa può quin<strong>di</strong> essere6 si veda Bleichrodt e Johannesson (1997a) per una presentazione intuitiva.6


considerata una funzione <strong>di</strong> valore misurabile, v(X), che rappresenta l’intensità <strong>delle</strong> <strong>preferenze</strong> incon<strong>di</strong>zioni <strong>di</strong> certezza. Esiste inoltre una relazione teorica tra la funzione <strong>di</strong> valore misurabile, v(X),e la funzione <strong>di</strong> utilità von Neumann Morgestern, u(X), che rappresenta l’intensità <strong>delle</strong> <strong>preferenze</strong>in con<strong>di</strong>zioni <strong>di</strong> incertezza. 7In conclusione, affinché i valori ottenuti tramite RS possano essere considerati una misuracar<strong>di</strong>nale dell’intensità <strong>delle</strong> <strong>preferenze</strong>, una <strong>di</strong>stanza tra lo stato <strong>di</strong> <strong>salute</strong> A e lo stato B doppiarispetto alla <strong>di</strong>stanza tra gli <strong>stati</strong> C e D deve implicare che la <strong>di</strong>fferenza <strong>di</strong> desiderabilità tra A e B èpari a due volte la <strong>di</strong>fferenza <strong>di</strong> desiderabilità tra C e D. A tale fine, gli intervi<strong>stati</strong> dovrebberoessere istruiti a dare molta rilevanza alla <strong>di</strong>stanza tra <strong>stati</strong> <strong>di</strong> <strong>salute</strong> ed al confronto tra intervallipiuttosto che a i valori attribuiti a ciascun singolo stato <strong>di</strong> <strong>salute</strong> [Drummond et al. (1997)].Tuttavia, Drummond et al. (1997) evidenziano che RS è soggetto a <strong>di</strong>storsioni <strong>di</strong> misurazione.Le principali <strong>di</strong>storsioni sembrano essere la <strong>di</strong>storsione <strong>di</strong> fine scala (end of scale bias) a causa dellaquale gli intervi<strong>stati</strong> evitano <strong>di</strong> adoperare le estremità della scala e la <strong>di</strong>storsione <strong>di</strong> spaziatura(spacing-out bias) a causa della quale gli in<strong>di</strong>vidui tendono a <strong>di</strong>stribuire egualmente <strong>sulla</strong> scala gli<strong>stati</strong> <strong>di</strong> <strong>salute</strong> senza tenere conto <strong>delle</strong> natura <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> [Bleichrodt e Johannesson(1997a)]. Da ciò seguirebbe che i valori <strong>di</strong> preferenza risultanti dell’impiego dello RS nondeterminano una scala <strong>di</strong> intervallo.1.3. Time Trade-OffQuesto metodo sviluppato da Torrance et al. (1972) si basa <strong>sulla</strong> scelta tra riduzione del periodo<strong>di</strong> sopravvivenza in cambio <strong>di</strong> un incremento della qualità della vita. Nel caso <strong>di</strong> uno stato cronicopeggiore della buona <strong>salute</strong> ma preferito alla morte, l’intervistato viene posto nella con<strong>di</strong>zione <strong>di</strong>scegliere se vivere in tale stato per un periodo <strong>di</strong> tempo ben definito, T, oppure in buona <strong>salute</strong> perun periodo <strong>di</strong> tempo più breve, X. <strong>La</strong> durata <strong>di</strong> X viene fatta variare fino a che l’in<strong>di</strong>viduo non si7 Poiché infatti l’utilità von Neumann Morgestern riflette sia l’intensità <strong>delle</strong> <strong>preferenze</strong> sia l’attitu<strong>di</strong>ne al rischio, Dyere Sarin propongono una misura dell’attitu<strong>di</strong>ne al rischio che permetta <strong>di</strong> scorporare questa componente dalla funzione <strong>di</strong>valore misurabile v(X).7


<strong>di</strong>chiara in<strong>di</strong>fferente tra le due alternative. Il peso che rappresenta le <strong>preferenze</strong> per lo stato <strong>di</strong> <strong>salute</strong>cronico i è dato da h i =X/T.TTO comporta <strong>delle</strong> scelte che hanno un costo opportunità (qualità della vità in cambio <strong>di</strong>sopravvivenza) e questo, secondo alcuni autori, lega tale metodo alla teoria <strong>delle</strong> scelte delconsumatore [Grenn et. al (2000)]. Drummond et al. (1997) sottolineano tuttavia che le <strong>preferenze</strong>determinate tramite TTO, come quelle determinate tramite RS, non sono espresse da una funzione<strong>di</strong> utilità von Neumann Morgestern ma da una funzione <strong>di</strong> valori.Pliskin et al. (1980) hanno identificato le con<strong>di</strong>zioni che devono essere rispettate affinché i pesiSG, u(X) e quelli TTO, u(X), siano uguali. Esse sono: a) la mutua in<strong>di</strong>pendenza dell’utilità:considerando una funzione <strong>di</strong> utilità avente due attributi, la qualità della vita e la durata della vita,l’or<strong>di</strong>ne <strong>di</strong> preferenza <strong>delle</strong> scommesse relative ad un attributo è in<strong>di</strong>pendente dal valore dall’altroattributo; 8b) Il trade-off proporzionale costante: il periodo <strong>di</strong> sopravvivenza che si è <strong>di</strong>sposti acedere al fine <strong>di</strong> ottenere un determinato miglioramento della qualità <strong>di</strong> vita è in<strong>di</strong>pendente dallasperanza <strong>di</strong> vita attesa; c) la neutralità al rischio. 9 Se solo le prime due con<strong>di</strong>zioni sono rispettate, lafunzione <strong>di</strong> utilità rispetto alla durata della vita u(T) esprime un’avversione relativa al rischioArrow-Pratt costante. In tal caso, i pesi TTO <strong>di</strong>fferiranno dalle utilità SG e andranno corretti perl’attitu<strong>di</strong>ne al rischio affinché i QALY ottenuti con SG siano uguali ai QALY ottenuti con TTO[Johannesson (1995)]. 102. LA RELAZIONE EMPIRICA TRA METODILe tre tecniche descritte nel paragrafo precedente, in quanto sistemi alternativi per misurare le<strong>preferenze</strong> <strong>degli</strong> in<strong>di</strong>vidui riguardo agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, dovrebbero fornire risposte equivalenti. Ciòsarà vero se le <strong>preferenze</strong> sono stabili – come la teoria economica ortodossa assume - e se valgono8 Si vedano anche Gafni e Torrance (1984).9 Formalmente, sotto la con<strong>di</strong>zione <strong>di</strong> neutralità rispetto al rischio, v(X) = u(X), QALY(TTO) = v(X)T, mentreQALY(SG) = u(X)T.10 Formalmente, QALY(SG) = v(X) 1-r T, QALY(TTO) = v(X)T, dove r è l’in<strong>di</strong>ce <strong>di</strong> avversione relativa al rischio <strong>di</strong>Arrow-Pratt.8


le cosiddette descriptive invariance e procedure invariance, cioè l’invarianza <strong>delle</strong> <strong>preferenze</strong>elicitate al variare rispettivamente della descrizione dello stato <strong>di</strong> <strong>salute</strong> utilizzata, e del modo in cuiè misurata la preferenza. Se le descrizioni e le procedure sono logicamente equivalenti,l’or<strong>di</strong>namento <strong>delle</strong> <strong>preferenze</strong> che ne segue deve essere identico. Tuttavia, da Kahneman e Tversky(1981) in poi, è stato riconosciuto che la presenza <strong>di</strong> framing effects può condurre a valutazioni<strong>di</strong>fferenti a seconda del metodo utilizzato.Il contesto o frame sotto il quale le <strong>preferenze</strong> relative agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> sono misurate è molto<strong>di</strong>verso da un metodo all’altro. <strong>La</strong> tabella 1 seguente, in parte derivata da Pederzoli e Merzari(2000) e da noi estesa, sintetizza le principali <strong>di</strong>fferenze tra le tecniche in termini <strong>di</strong> frame.Innanzitutto, la “variabile” oggetto <strong>di</strong> risposta è <strong>di</strong>versa nei tre meto<strong>di</strong>, visto che è un numero tra 0 e100 (0 e 1) in RS, un valore <strong>di</strong> probabilità tra 0 e 1 in SG e un numero <strong>di</strong> anni tra zero e T in TTO:pertanto il cosiddetto response mode [si veda Tversky et al. (1988)] <strong>di</strong>fferisce in manierasostanziale. In secondo luogo, il modo <strong>di</strong> generare un or<strong>di</strong>namento <strong>di</strong> preferenza <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>è <strong>di</strong>verso tra RS da un lato e SG e TTO dall’altro. Infatti, mentre nel primo caso l’intervistatocompila <strong>di</strong>rettamente una graduatoria tra gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> assegnando a ciascuno <strong>di</strong> essi un valoresu un termometro tarato da 0 a 100 (0 a 1), per i rimanenti due, la graduatoria tra <strong>stati</strong> <strong>di</strong> <strong>salute</strong>emerge solo in<strong>di</strong>rettamente da una serie <strong>di</strong> scelte che l’intervistato effettua tra coppie <strong>di</strong> alternative.In terzo luogo, in quanto equivalente ad una “scommessa”, SG è una scelta in con<strong>di</strong>zione <strong>di</strong>incertezza, mentre TTO e RS sono scelte in con<strong>di</strong>zione <strong>di</strong> certezza. In ultimo, il punto <strong>di</strong> riferimentoin cui è posto l’intervistato è la buona <strong>salute</strong> solo nel caso <strong>di</strong> RS, mentre per gli altri due meto<strong>di</strong>all’intervistato è chiesto <strong>di</strong> immaginare <strong>di</strong> trovarsi in uno stato <strong>di</strong> <strong>salute</strong> interme<strong>di</strong>o tra la buona<strong>salute</strong> e la morte.[inserire la tabella 1]9


In effetti, numerosi stu<strong>di</strong> empirici hanno potuto verificare come i valori <strong>delle</strong> utilità relative agli<strong>stati</strong> <strong>di</strong> <strong>salute</strong> sono <strong>di</strong>versi tra <strong>di</strong> loro a secondo della tecnica <strong>di</strong> <strong>valutazione</strong> utilizzata. 11 <strong>La</strong> maggiorparte <strong>degli</strong> stu<strong>di</strong> sull’argomento [si vedano Dolan e Sutton (1997) per un resoconto] ha rilevato chela relazione osservata è SG > TTO > RS, da intendersi come segue: l’utilità <strong>di</strong> uno stato <strong>di</strong> <strong>salute</strong>risulta più alta se misurata con il metodo SG, più bassa se misurata con il metodo TTO, e ancoraminore se misurata con il metodo RS. Una graduatoria <strong>di</strong>fferente è stata riscontrata nello stu<strong>di</strong>o <strong>di</strong>Hornberger, Redelmaier et al. (1992) i quali invece osservano questo or<strong>di</strong>ne dei valori <strong>di</strong> utilità tra itre meto<strong>di</strong>: TTO > RS > SG. Come si vede, in quest’ultimo stu<strong>di</strong>o, la posizione dello standardgamble risulta capovolta. Un elemento importante che <strong>di</strong>fferenzia questo stu<strong>di</strong>o dagli altri è che gli<strong>stati</strong> <strong>di</strong> <strong>salute</strong> valutati non sono ipotetici, bensì quelli effettivi nei quali versavano gli intervi<strong>stati</strong>.Dolan, Gudex et al. (1996), analogamente, trovano che SG < TTO per <strong>stati</strong> <strong>di</strong> <strong>salute</strong> caratterizzatida una speranza <strong>di</strong> vita breve.Tenendo conto <strong>delle</strong> <strong>di</strong>fferenze tra meto<strong>di</strong> in termini <strong>di</strong> frame evidenziate nella tabella 1 e <strong>delle</strong>assunzioni richieste per l’equivalenza tra meto<strong>di</strong> descritte nella sezione 1, è in effetti possibileidentificare una serie <strong>di</strong> spiegazioni <strong>delle</strong> <strong>di</strong>fferenze tra i valori <strong>delle</strong> utilità generate dai tre meto<strong>di</strong>:a) l’utilizzo <strong>di</strong> un reference point nella <strong>valutazione</strong> <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>. Se ilriferimento è lo statu quo avremo che lo stato <strong>di</strong> <strong>salute</strong> meno che perfetto riceverà una<strong>valutazione</strong> più bassa se valutato con il metodo del rating scale (per il quale il reference pointè la buona <strong>salute</strong>) rispetto che con gli altri due meto<strong>di</strong> (per i quali il reference point è lo statuquo, cioè una <strong>salute</strong> meno che perfetta). Infatti, compilando la scala RS, un intervistatovaluterà uno stato <strong>di</strong> <strong>salute</strong> meno che buono come un deterioramento rispetto al referencepoint. Ciò determina RS < SG, RS < TTO. L’utilizzo <strong>di</strong> un reference point non è contemplatodalla teoria economica <strong>delle</strong> scelte tra<strong>di</strong>zionale, ma è uno dei car<strong>di</strong>ni della Prospect Theory <strong>di</strong>Kahneman e Tversky (1979).11 Inoltre, numerosi stu<strong>di</strong>, tra i quali Dolan (1996) e Dolan e Roberts (2002) <strong>di</strong>mostrano che i valori <strong>di</strong> utilità, oltre a<strong>di</strong>pendere dal metodo <strong>di</strong> misurazione utilizzato, sono legati alle caratteristiche socio-demografiche e allo stato <strong>di</strong> <strong>salute</strong><strong>degli</strong> intervi<strong>stati</strong>.10


) l’avversione al rischio: la preferenza del certo sull’incerto implica che un in<strong>di</strong>viduosarà meno <strong>di</strong>sposto ad accettare la scommessa insita in SG, specialmente se il rischiocontemplato è quello <strong>di</strong> morte. Ciò implica che SG sarà maggiore <strong>di</strong> RS e <strong>di</strong> TTO.c) Tasso <strong>di</strong> sconto temporale positivo; TTO assume che l’utilità sia una funzione linearedella durata dello stato <strong>di</strong> <strong>salute</strong>. Se l’utilità è invece concava, come proposto da alcuni autori[ad esempio Dolan e Jones-Lee (1997) e Bleichrodt e Johannesson (1997)] i valori <strong>delle</strong> utilitàsaranno tali che TTO < SG. Infatti, TTO chiede all’intervistato <strong>di</strong> rinunciare ad anni <strong>di</strong> vitache possono anche essere lontani del tempo (es. un anno su 20 <strong>di</strong> speranza <strong>di</strong> vita), laddoveSG chiede all’intervistato <strong>di</strong> correre il rischio <strong>di</strong> morte nell’imme<strong>di</strong>ato.Esistono altri fattori che agiscono in senso contrario rispetto a quelli identificati nei punti a-c eche, pertanto, possono spiegare perché in alcuni casi TTO > SG, come rilevato da Hornberger et al.(1992) e Dolan, Gudex, et al.(1996).c) avversione alle per<strong>di</strong>te (loss aversion); Oltre all’utilizzo del reference point nellescelte in<strong>di</strong>viduali, Prospect Theory implica che la funzione <strong>di</strong> <strong>valutazione</strong> dei risultati èconcava rispetto ai guadagni e convessa rispetto alle per<strong>di</strong>te. Di conseguenza, gli in<strong>di</strong>viduisono avversi alle per<strong>di</strong>te, nel senso che, dati una per<strong>di</strong>ta e un guadagno equivalenti, unavariazione marginale della per<strong>di</strong>ta ha un impatto maggiore sulle <strong>preferenze</strong> <strong>di</strong> una variazionemarginale del guadagno. 12Bleichrodt et al. (2002) <strong>di</strong>mostrano che l’avversione alle per<strong>di</strong>teprovoca una <strong>di</strong>storsione verso l’alto nei valori <strong>di</strong> TTO, che eccederanno le corrispondentiutilità SG per speranze <strong>di</strong> vita relativamente brevi (circa 10 anni). Al crescere della speranza<strong>di</strong> vita, il tasso <strong>di</strong> sostituibilità tra durata e qualità della vita aumenta e si osserva <strong>di</strong> nuovo cheSG > TTO.d) Il modello <strong>di</strong> Tversky et al. (1988) assume che le <strong>preferenze</strong> in<strong>di</strong>viduali <strong>di</strong>pendonodalla scala <strong>di</strong> <strong>valutazione</strong> utilizzata (scale compatibility bias): in particolare, gli attributi dellascelta compatibili con la scala <strong>di</strong> <strong>valutazione</strong> sono pesati <strong>di</strong> più. Sia in SG che in TTO l’utilità12 Si veda Tversky e Kahneman (1991) per una teoria formale della loss aversion.11


<strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> ha due attributi: la durata e la qualità della vita. In TTO è il primo attributoa ricevere più enfasi, in quanto è quello compatibile con la scala <strong>di</strong> risposta. Bleichrodt (2002)e Bleichrodt e Pinto (2002a) <strong>di</strong>mostrano formalmente che ciò può condurre nel TTO a darmaggior peso agli anni <strong>di</strong> vita ai quali si deve rinunciare in cambio della buona <strong>salute</strong>,cosicché è possibile che TTO > SG. Supponiamo che le utilità calcolate con SG abbiamocondotto a considerare in<strong>di</strong>fferenti vivere 10 anni nello stato <strong>di</strong> <strong>salute</strong> A (es. con l’emicraniatutti i giorni) e vivere per 5 anni nello stato <strong>di</strong> <strong>salute</strong> B (es. con l’emicrania una volta allasettimana). Una volta che le due combinazioni vengono valutate con TTO, il primo attributo(la durata) riceve più peso nelle <strong>preferenze</strong> e pertanto l’utilità dello stato <strong>di</strong> <strong>salute</strong> A risultamaggiore che in SG. 13Dato che le tre tecniche <strong>di</strong> <strong>valutazione</strong> forniscono valutazioni <strong>di</strong>verse, alcuni autori si sonochiesti se è almeno possibile stimare una relazione stabile tra valori RS da un lato e valori SG eTTO dall’altro. Se così fosse, si potrebbero condurre stu<strong>di</strong> costo-utilità utilizzando solamente RS,più semplice da somministrare e meno costoso rispetto agli altri meto<strong>di</strong>, e calcolaresuccessivamente le utilità secondo SG e TTO. <strong>La</strong> risposta a questo quesito è ambigua: mentreTorrance (1976) presenta <strong>delle</strong> tavole <strong>di</strong> conversione valide in me<strong>di</strong>a, i risultati <strong>di</strong> Dolan e Sutton(1997) su dati in<strong>di</strong>viduali hanno evidenziato un quadro più complesso. Infatti, non solo non èemersa una funzione <strong>di</strong> mappatura dei valori tra meto<strong>di</strong>, ma significative <strong>di</strong>fferenze sono staterilevate nei valori ottenuti tramite varianti dei singoli meto<strong>di</strong>, il che sottolinea ulteriormentel’importanza del frame <strong>di</strong> elicitazione <strong>delle</strong> utilità. 14<strong>La</strong> <strong>di</strong>fferenza rilevata nelle risposte ottenute con i tre meto<strong>di</strong> e l’assenza <strong>di</strong> una correlazionestabile pongono il problema <strong>di</strong> quale metodo utilizzare nella misurazione <strong>delle</strong> utilità <strong>degli</strong> <strong>stati</strong> <strong>di</strong><strong>salute</strong>. Come <strong>di</strong>scusso nel paragrafo 1, a priori la preferenza <strong>degli</strong> economisti ricade su SG, inquanto è il metodo dalle basi teoriche più forti. Alcuni autori (tra i quali Dolan e Williams) hannoosservato che poiché molte <strong>delle</strong> assunzioni teoriche alla <strong>base</strong> <strong>di</strong> TTO e SG sono spesso violate in13 Formalmente, se SG implica che (10,A)?(5,B), allora TTO implica che (10,A)? (5,B).14 Analogamente, anche Bleichrodt e Johannesson (1997) rigettano l’ipotesi <strong>di</strong> una relazione stabile tra SG e RS.12


pratica, la scelta tra tecniche dovrebbe effettuarsi su basi empiriche: la <strong>valutazione</strong> globale <strong>di</strong> unatecnica dovrebbe cioè prendere in considerazione proprietà psicometriche come la fattibilità, lavali<strong>di</strong>tà e l’affidabilità. Fattibilità in<strong>di</strong>ca che il metodo può essere applicato con successo, nel sensoche esso è comprensibile agli intervi<strong>stati</strong> e produce un elevato tasso <strong>di</strong> risposte complete. <strong>La</strong> vali<strong>di</strong>tàsi riferisce alla accuratezza con cui la tecnica misura il fenomeno oggetto <strong>di</strong> stu<strong>di</strong>o. Essa è statamisurata come “vali<strong>di</strong>tà convergente”, verificando cioè se le valutazioni ottenute con una tecnicasono significativamente <strong>di</strong>verse da quelle ottenute con meto<strong>di</strong>che <strong>di</strong>verse, oppure come “vali<strong>di</strong>tàcostruttiva”. In tal caso, si verifica se le valutazioni ottenute sono correlate con fattori con i quali cisi attende a priori che esista un legame [Dolan, Gudex, et al (1996)]. L’affidabilità riguarda invecela stabilità <strong>delle</strong> valutazioni ottenute nel tempo. 15Un criterio <strong>di</strong> scelta può essere inoltre la capacitàdella tecnica <strong>di</strong> produrre risposte coerenti. Poiché l’analisi della coerenza dei meto<strong>di</strong> ha ricevutofinora scarsa attenzione nella letteratura, su <strong>di</strong> essa ci soffermeremo più a lungo nella prossimasezione.3. <strong>La</strong> coerenza come criterio <strong>di</strong> scelta tra meto<strong>di</strong>Il fatto che un in<strong>di</strong>viduo assegni ad uno stato <strong>di</strong> <strong>salute</strong> valori <strong>di</strong> utilità significativamente<strong>di</strong>fferenti a secondo del metodo <strong>di</strong> <strong>valutazione</strong> utilizzato non è sufficiente a definire le sue rispostecome incoerenti. Al fine <strong>di</strong> identificare una incoerenza, è necessario che l’or<strong>di</strong>namento <strong>delle</strong><strong>preferenze</strong> relative agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> violi dei principi <strong>di</strong> razionalità analoghi a quelli <strong>di</strong> non sazietàe <strong>di</strong> transitività nella teoria standard del consumatore.In letteratura, si ritrovano due principali definizioni <strong>di</strong> <strong>valutazione</strong> incoerente <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>[si veda Ba<strong>di</strong>a et al. (1999)]:a) incoerenza interna o logica: questo tipo <strong>di</strong> incoerenza è chiamata interna in quanto vienevalutata metodo per metodo. Dati una serie <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, la <strong>valutazione</strong> dell’in<strong>di</strong>viduo è15 Si veda <strong>La</strong>londe et al. (1999) per un confronto <strong>delle</strong> tecniche <strong>sulla</strong> <strong>base</strong> <strong>delle</strong> proprietà psicometriche relativamente alcaso <strong>di</strong> patologie car<strong>di</strong>ache.13


incoerente se uno stato <strong>di</strong> <strong>salute</strong> logicamente peggiore è valutato meglio <strong>di</strong> uno stato <strong>di</strong> <strong>salute</strong>logicamente migliore. 16b) incoerenza <strong>di</strong> criterio: viene valutata rispetto all’or<strong>di</strong>namento <strong>di</strong>retto <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>(ranking). Le risposte generate da una tecnica saranno incoerenti se l’or<strong>di</strong>namento <strong>degli</strong> <strong>stati</strong> <strong>di</strong><strong>salute</strong> derivanti dai valori <strong>di</strong> utilità <strong>di</strong>fferisce dal ranking <strong>di</strong>retto assegnato a quegli stessi <strong>stati</strong> <strong>di</strong><strong>salute</strong>. Questa misura assume implicitamente che il ranking <strong>di</strong>retto sia da considerarsi esente daincoerenze, in quanto esso è semplice da comprendere ed inoltre permette agli intervi<strong>stati</strong> <strong>di</strong> vederesimultaneamente tutti gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> oggetto <strong>di</strong> <strong>valutazione</strong>. 17 Bleichrodt e Pinto (2002) e Dolane Stelmeier (2003) considerano <strong>delle</strong> incoerenze analoghe a quelle <strong>di</strong> criterio e le classificano comecasi <strong>di</strong> preference reversal, una <strong>di</strong>storsione del comportamento ben nota a psicologi e teorici <strong>delle</strong>decisioni [Lichtenstein e Slovic (1971), Grether e Plott (1979)].Poiché le incoerenze in<strong>di</strong>viduali implicano <strong>di</strong>storsioni <strong>delle</strong> utilità <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>,l’inclusione <strong>di</strong> valori incoerenti determina dei QALY <strong>di</strong>storti che non rifletteranno le <strong>preferenze</strong>[Devlin et al. (2003)]. <strong>La</strong> strategia generalmente seguita negli stu<strong>di</strong> costo-utilità è quin<strong>di</strong> quella <strong>di</strong>escludere le risposte incoerenti dal data set che conduce alla costruzione dei QALY. Ciò significache se le <strong>di</strong>storsioni non sono uniformemente <strong>di</strong>stribuite tra le tecniche <strong>di</strong> <strong>valutazione</strong>, sono dapreferire quelle meno soggette al fenomeno <strong>delle</strong> risposte incoerenti, in quanto esse permettono unutilizzo più efficiente del campione <strong>di</strong> dati raccolto.Fino ad ora, non è ancora chiarito se meto<strong>di</strong> <strong>di</strong>fferenti <strong>di</strong> costruzione <strong>delle</strong> utilità generano tipie/o livelli <strong>di</strong>versi <strong>di</strong> incoerenza. L’esigua evidenza esistente sull’argomento in<strong>di</strong>ca che TTOproduce un numero <strong>di</strong> incoerenze interne più elevato <strong>di</strong> RS e del ranking <strong>di</strong>retto. Ciò puòsemplicemente essere dovuto al fatto che in TTO l’intervistato non ha davanti tutti gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong>16 L’incoerenza logica può essere misurata su più <strong>di</strong>mensioni:a1) come percentuale <strong>di</strong> intervi<strong>stati</strong> che in ogni metodo presentano risposte incoerenti;a2) come proporzione <strong>di</strong> coppie <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> valutati incoerentemente rispetto a tutti <strong>di</strong> possibili confronti a due tra<strong>stati</strong> <strong>di</strong> <strong>salute</strong>;a3) come in<strong>di</strong>ce della gravità dell’incoerenza rilevata, costruito <strong>sulla</strong> <strong>base</strong> della <strong>di</strong>stanza tra tariffe assegnate agli <strong>stati</strong> <strong>di</strong><strong>salute</strong> valutati incoerentemente.Il trattamento <strong>di</strong> questi in<strong>di</strong>ci non è tuttavia univoco in letteratura come evidenziato e <strong>di</strong>scusso da Devlin et al. (2003).17 Gli stessi autori tuttavia notano come nei fatti il ranking non sia esente da incoerenze interne.14


oggetto <strong>di</strong> <strong>valutazione</strong> e può pertanto cadere facilmente in confusione. Inoltre, SG genera piùincoerenze logiche <strong>di</strong> TTO. Tali risultati non sono tuttavia comparabili e generalizzabili, in quantoderivanti da due stu<strong>di</strong> <strong>di</strong>versi. 18<strong>La</strong> presenza <strong>di</strong> risposte incoerenti può anche essere il risultato <strong>di</strong> fattori <strong>di</strong>versi dalla scelta delmetodo <strong>di</strong> <strong>valutazione</strong>: Dolan e Kind (1996) <strong>di</strong>stinguono tra incoerenza primaria, legata allecaratteristiche personali dell’intervistato, ed incoerenza secondaria, che invece <strong>di</strong>pende dal metodo<strong>di</strong> elicitazione utilizzato e costituisce pertanto un caso <strong>di</strong> framing effect [Kahenman e Tversky(1981)]. Sia Dolan e Kind (1996) che Ba<strong>di</strong>a et al. (1999), ad esempio, rilevano che gli intervi<strong>stati</strong>più anziani o con livello <strong>di</strong> istruzione più basso producono un numero <strong>di</strong> incoerenzesignificativamente più elevato. Le variabile socio-demografiche sono quin<strong>di</strong> possibili fattoriesplicativi <strong>delle</strong> risposte incoerenti. <strong>La</strong> concentrazione <strong>delle</strong> risposte incoerenti presso alcuni sottogruppidella popolazione implica che le risposte incoerenti non possono semplicemente essereescluse dall’analisi e dalla costruzione dei QUALY: l’esclusione <strong>delle</strong> risposte incoerenti comportade facto l’esclusione <strong>delle</strong> presenze <strong>di</strong> questi sottogruppi dalla <strong>valutazione</strong> della qualità <strong>di</strong> uno stato<strong>di</strong> <strong>salute</strong> [Dolan e Kind (1996)].Quali le possibili cause alla <strong>base</strong> <strong>delle</strong> incoerenze <strong>di</strong> tipo logico? L’origine può essere <strong>di</strong> tipocognitivo: ad esempio, poiché gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> hanno sempre natura multi-<strong>di</strong>mensionale (fisica,emotiva, sociale ecc.), gli intervi<strong>stati</strong> potrebbero avere <strong>di</strong>fficoltà ad or<strong>di</strong>narli secondo una scala cheli riconduca ad un’unica <strong>di</strong>mensione. Inoltre, poiché è stato rilevato che le risposte incoerenti<strong>di</strong>pendono anche dal formato dell’intervista [sono ad esempio minori nei questionari inviati perposta rispetto a quelli somministrati da un intervistatore, Dolan e Kind (1996)] e dalle modalità <strong>di</strong>descrizione <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, si pone il problema <strong>di</strong> rendere i meto<strong>di</strong> <strong>di</strong> elicitazione e ledescrizioni quanto meno ambigue possibile. Per far luce sul legame tra questionari, conduzionedell’intervista e descrizione <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> da un lato e risposte coerenti dall’altro,18 Dolan, Gudex et al (1996) comparano TTO e SG mentre Ba<strong>di</strong>a et al. (1999) comparano TTO e RS.15


occorrerebbe tuttavia effettuare una puntuale analisi <strong>delle</strong> incoerenze osservate a livello in<strong>di</strong>viduale;problema che, per nostra conoscenza, non è stato finora affrontato in letteratura.Per quanto riguarda le spiegazioni <strong>delle</strong> incoerenze <strong>di</strong> criterio, per esse non valgono lemotivazioni che la letteratura fornisce per il preference reversal, generalmente riconducibili almodello della scale compatibility <strong>di</strong> Tversky et al. (1988). 19Sembrano applicabili le cosiddetteteorie del gambling effect, secondo le quali la funzione <strong>di</strong> utilità è <strong>di</strong>versa a seconda che la sceltasia in con<strong>di</strong>zioni <strong>di</strong> certezza o <strong>di</strong> incertezza [si veda Bleichrodt e Pinto (2002)] e ciò può condurread una <strong>di</strong>versa graduatoria <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> nel TTO rispetto a SG. Queste teorie, tuttavia,riscuotono pochi consensi tra i teorici <strong>delle</strong> decisioni, in quanto presuppongono violazioni basilaridel principio della dominanza stocastica.Nella sezione 5 <strong>di</strong> questo lavoro cercheremo <strong>di</strong> confrontare le risposte incoerenti generate nelnostro stu<strong>di</strong>o dai tre meto<strong>di</strong> <strong>di</strong> <strong>valutazione</strong> <strong>delle</strong> utilità, al fine <strong>di</strong> stabilire se esiste un metodo conun più elevato tasso <strong>di</strong> risposte coerenti. Cercheremo inoltre <strong>di</strong> stabilire se le incoerenze primariesono più o meno rilevanti <strong>di</strong> quelle secondarie. Infine, attraverso un’analisi dei dati in<strong>di</strong>viduali,tenteremo <strong>di</strong> stabilire le possibili cause <strong>delle</strong> incoerenze e, in particolare, se esiste un legame con ilmetodo <strong>di</strong> conduzione <strong>delle</strong> interviste.4. LO STUDIOI dati da noi analizzati sono <strong>stati</strong> ottenuti da uno stu<strong>di</strong>o pilota svolto su un campione <strong>di</strong> 60in<strong>di</strong>vidui, pazienti e personale sanitario del reparto <strong>di</strong> Car<strong>di</strong>ologia <strong>di</strong> due ospedali siciliani. Lostu<strong>di</strong>o pilota è stato preliminare rispetto ad uno stu<strong>di</strong>o ACU su più vasta scala finanziato dallaRegione Sicilia <strong>sulla</strong> <strong>valutazione</strong> della qualità della vita in seguito ad un infarto del miocar<strong>di</strong>o. 20 Loscopo dello stu<strong>di</strong>o “pilota” era quello <strong>di</strong> produrre informazioni che aiutassero nella scelta della19 Nell’esempio tipico del preference reversal, date due lotterie con uguale valore atteso, la prima con elevataprobabilità <strong>di</strong> un premio basso e la seconda con bassa probabilità <strong>di</strong> un premio più elevato, la prima verrà preferita allaseconda. Tuttavia, la seconda avrà un equivalente certo più elevato della prima.20 Lo stu<strong>di</strong>o è attualmente in corso <strong>di</strong> realizzazione. Il questionario completo è <strong>di</strong>sponibile su richiesta, scrivendo agliautori.16


tecnica più appropriata per misurare la qualità della vita con una malattia car<strong>di</strong>aca e sul sistema <strong>di</strong>conduzione <strong>delle</strong> interviste ottimale per ridurre le <strong>di</strong>storsioni <strong>di</strong> <strong>valutazione</strong> e le incoerenze. Ilquestionario che ha permesso <strong>di</strong> ottenere le informazioni relative alla <strong>valutazione</strong> <strong>degli</strong> <strong>stati</strong> <strong>di</strong><strong>salute</strong> è stato somministrato nel corso <strong>di</strong> interviste “faccia a faccia” realizzate da una intervistatriceopportunamente addestrata. L’intervista me<strong>di</strong>a aveva la durata <strong>di</strong> circa venti minuti.Agli intervi<strong>stati</strong>, è stato chiesto <strong>di</strong> valutare tre plausibili <strong>stati</strong> <strong>di</strong> <strong>salute</strong> alternativi derivantidall’infarto del miocar<strong>di</strong>o. Dopo un’accurata consultazione con i clinici dei reparti <strong>di</strong> car<strong>di</strong>ologia,tali <strong>stati</strong> <strong>di</strong> <strong>salute</strong> sono <strong>stati</strong> descritti <strong>di</strong>stinguendo il periodo <strong>di</strong> degenza da quello postospedaliero:21 per quest’ultimo si è fissata arbitrariamente una speranza <strong>di</strong> vita pari a 10 anni. 22 Lecaratteristiche della fase ospedaliera sono state articolate in due <strong>di</strong>mensioni, a loro volta stratificatesu tre livelli: le con<strong>di</strong>zioni generali (non compromesse, compromesse o molto compromesse) e ildolore precor<strong>di</strong>ale (mo<strong>di</strong>co, intenso o insopportabile). Le caratteristiche della fase post-ospedalierasono invece state articolate in tre <strong>di</strong>stinte sfere: quella emotiva (poco ansiosi/depressi,ansiosi/depressi per parte della giornata, per tutta la giornata), quella relativa al ruolo (possibilità <strong>di</strong>lavorare con moderata cautela, con notevole cautela, lavoro impossibile) e quella della funzionalitàfisica (possibilità <strong>di</strong> svolgere le attività giornaliere con moderata cautela, con notevole cautela,impossibilità a svolgerle). L’appen<strong>di</strong>ce riporta la descrizione dei tre <strong>stati</strong>, denominati A, B ed E.Poiché l’obiettivo dello stu<strong>di</strong>o era quello <strong>di</strong> misurare la qualità della vita conseguente ad un infarto,la descrizione dello stato <strong>di</strong> <strong>salute</strong> è stata patologia-specifica. Sono <strong>stati</strong> pertanto scartati meto<strong>di</strong> <strong>di</strong>descrizione <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> non specifici come ad esempio EuroQol-5D [si veda EuroQol Group(1990)], molto <strong>di</strong>ffusi per la costruzione <strong>di</strong> tariffe sociali da applicare nella fissazione <strong>delle</strong> priorità<strong>degli</strong> interventi. Oltre ai tre <strong>stati</strong> <strong>di</strong> <strong>salute</strong> specificamente legati alle patologie considerate, agliintervi<strong>stati</strong> è stato chiesto <strong>di</strong> valutare i due <strong>stati</strong> <strong>di</strong> <strong>salute</strong> àncora, la perfetta <strong>salute</strong> e la morte.21 Per una descrizione che segua la stessa articolazione si veda Jones-Lee et al (1993).22Ciò rappresenta la prassi in molti stu<strong>di</strong> costo-utilità che utilizzano il metodo TTO [si veda ad esempio Torrance(1986)]. Per esigenze <strong>di</strong> comparabilità lo stesso orizzonte temporale è stato applicato anche alle altre meto<strong>di</strong>che.17


L’obiettivo della parte centrale del questionario è <strong>di</strong> misurare le utilità <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> con letre tecniche RS, SG e TTO. Le tre tecniche sono state applicate nella maniera standard: in RS agliintervi<strong>stati</strong> è stato chiesto <strong>di</strong> assegnare agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> in<strong>di</strong>viduati dal monitore un valoreall’interno <strong>di</strong> una scala che va da 0 a 100. In questa scala 100 corrisponde allo stato <strong>di</strong> <strong>salute</strong>ritenuto migliore, mentre 0 a quello ritenuto peggiore. I rimanenti tre <strong>stati</strong> <strong>di</strong> <strong>salute</strong> vanno or<strong>di</strong>natiall’interno della scala in maniera che gli intervalli tra i valori riflettano le <strong>di</strong>fferenze <strong>di</strong> utilità tra gli<strong>stati</strong>. SG e TTO sono <strong>stati</strong> applicati in maniera tale da rendere le risposte ai due tipi <strong>di</strong> quesitocomparabili per ogni intervistato. <strong>La</strong> tecnica SG impiega uno schema decisionale nel qualeall’intervistato viene chiesto <strong>di</strong> trovare un valore <strong>di</strong> in<strong>di</strong>fferenza (una probabilità p) tra uno stato <strong>di</strong><strong>salute</strong> certo corrispondente allo statu quo e una situazione aleatoria che porterà il paziente allabuona <strong>salute</strong> con probabilità p e alla morte con probabilità 1-p. Nel TTO il valore <strong>di</strong> in<strong>di</strong>fferenza èinvece il periodo <strong>di</strong> tempo trascorso in buona <strong>salute</strong> che l’in<strong>di</strong>viduo considera equivalente a 10 anni<strong>di</strong> vita nello status quo.Il questionario è stato somministrato in due versioni: nella versione che denomineremo da qui inavanti NO-CARD, la descrizione <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> avveniva preliminarmente al loro ranking<strong>di</strong>retto e nel rispondere alle sezioni RS, SG e TTO del questionario gli intervi<strong>stati</strong> visionavano<strong>di</strong>rettamente solo lo stato <strong>di</strong> <strong>salute</strong> oggetto <strong>di</strong> <strong>valutazione</strong>, anche se la descrizione <strong>degli</strong> altri <strong>stati</strong>poteva sempre essere rivista su richiesta dell’intervistato. Nella versione che denomineremo CARD,gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> venivano presentati su cartoncini <strong>di</strong> <strong>di</strong>verso colore che aiutavano gli intervi<strong>stati</strong> a<strong>di</strong>stinguerli l’uno dall’altro. Inoltre, per tutte le meto<strong>di</strong>che <strong>di</strong> costruzione <strong>delle</strong> utilità, la descrizione<strong>di</strong> tutti gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> era sempre visibile simultaneamente.Oltre alle sezioni relative alla <strong>valutazione</strong> della qualità <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, in alcune sezioniintroduttive del questionario sono <strong>stati</strong> raccolti i dati personali e gli eventuali fattori <strong>di</strong> rischio permalattie car<strong>di</strong>ache con l’obiettivo specifico <strong>di</strong> verificare l’eventuale effetto dellafamiliarità/esperienza della malattia sulle valutazioni fornite. Inoltre, una sezione ad hoc ha mirato averificare il grado <strong>di</strong> comprensione del concetto <strong>di</strong> rischio; questa sezione è stata motivata18


dall’esigenza <strong>di</strong> escludere fenomeni <strong>di</strong> incoerenza nella <strong>valutazione</strong> <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> derivantisemplicemente da mancata comprensione del concetto <strong>di</strong> probabilità. In questa sezione, oltre allaspiegazione del concetto <strong>di</strong> rischio, l’intervistato è stato sottoposto ad un vero e proprio test <strong>di</strong>comprensione.5. CONFRONTO TRA METODI SULLA BASE DELLE RIS POSTE INCOERENTIIl confronto che abbiamo effettuato tra i tre meto<strong>di</strong> <strong>di</strong> elicitazione <strong>delle</strong> <strong>preferenze</strong> in<strong>di</strong>vidualirelative agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> si basa <strong>sulla</strong> capacità <strong>di</strong> ognuna <strong>delle</strong> tre tecniche <strong>di</strong> generare rispostecomplete e coerenti. L’analisi è stata condotta in<strong>di</strong>viduo per in<strong>di</strong>viduo al fine <strong>di</strong> poter identificare lepossibili spiegazioni <strong>delle</strong> eventuali incoerenze.<strong>La</strong> nostra analisi comincia dalla presentazione <strong>delle</strong> osservazioni del sottocampione NO-CARDin quanto questa versione del questionario è stata da noi considerata quella “<strong>base</strong>”. Dal punto <strong>di</strong>vista della completezza, in RS solo un’osservazione su 30 è incompleta, mentre per SG 8 intervi<strong>stati</strong>e per TTO 2 intervi<strong>stati</strong> su 30 hanno fornito risposte incomplete. Ciò significa che questi intervi<strong>stati</strong>nel caso <strong>di</strong> SG non hanno accettato la scommessa relativa ad uno o più <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, mentre perTTO non hanno accettato il trade-off tra anni <strong>di</strong> vita e qualità della vita stessa. L’analisi in<strong>di</strong>vidualedei questionari ci ha mostrato che, per SG, la mancata risposta ha presumibilmente due tipialternativi <strong>di</strong> motivazione: per 3 in<strong>di</strong>vidui la scommessa che non è stata accettata è quella relativaagli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> A e/o B, cioè quelli corrispondenti a con<strong>di</strong>zioni generali non eccessivamentedeteriorate. Per questi due <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, un’avversione al rischio elevata può spiegare il rifiuto <strong>di</strong>accettare una scommessa in cui il fallimento equivale alla morte imme<strong>di</strong>ata. Gli altri 5 intervi<strong>stati</strong>invece non hanno valutato nessuno <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, il che riflette o una mancata comprensionedel metodo o un suo rifiuto su basi etiche. Questi risultati confermano quanto riscontrato adesempio da <strong>La</strong>londe et al. (2001) e da Lewis et al. (2001) relativamente alla <strong>valutazione</strong> dellaqualità della vita in seguito ad un infarto: un potenziale problema con il metodo SG è che un’elevataavversione rischio (innata o legata all’esperienza <strong>di</strong> una procedura chirurgica ad elevato rischio)19


genera valori dell’utilità prossimi a quelli della buona <strong>salute</strong>. <strong>La</strong> mancata risposta rappresenta uncaso estremo, in cui <strong>stati</strong> <strong>di</strong> <strong>salute</strong> meno che perfetti vengono implicitamente considerati equivalentialla buona <strong>salute</strong>. Per TTO, le due risposte incomplete riguardano la mancata <strong>valutazione</strong> <strong>degli</strong> <strong>stati</strong><strong>di</strong> <strong>salute</strong> A e B. Analogamente a SG, questi <strong>stati</strong> <strong>di</strong> <strong>salute</strong> non vengono considerati abbastanzadeteriorati da giustificare un sacrificio in termini <strong>di</strong> anni <strong>di</strong> vita.Nell’analisi <strong>delle</strong> risposte incoerenti generate a seconda della tecnica <strong>di</strong> <strong>valutazione</strong> abbiamorilevato sia incoerenze <strong>di</strong> tipo logico, che incoerenze <strong>di</strong> criterio. <strong>La</strong> nostra attenzione si focalizzaprincipalmente sulle incoerenze logiche in quanto sono quelle che più chiaramente esprimono<strong>di</strong>storsioni nelle <strong>preferenze</strong>. Va premesso che il ranking modale per tutti i meto<strong>di</strong> è stato il seguente:stato D (buona <strong>salute</strong>), seguito rispettivamente da B, A, E e C (morte). 23 <strong>La</strong> tabella 2 presenta la<strong>di</strong>stribuzione <strong>delle</strong> incoerenze logiche nei tre meto<strong>di</strong>, <strong>di</strong>stinguendo a seconda della sequenzaincoerente; le sequenze <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> che compaiono nella prima colonna in<strong>di</strong>cano lagraduatoria <strong>di</strong> preferenza dei cinque <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, dal più preferito al meno preferito, il simbolo ?tra due <strong>stati</strong> <strong>di</strong> <strong>salute</strong> in<strong>di</strong>ca che essi sono considerati in<strong>di</strong>fferenti; i valori nelle celle relative aimeto<strong>di</strong> in<strong>di</strong>cano il numero <strong>di</strong> intervi<strong>stati</strong> (sul totale <strong>delle</strong> risposte complete) che presentano quel tipo<strong>di</strong> sequenza incoerente. Nel riportare le incoerenze abbiamo seguito il criterio adottato da Ohinmaae Sintonen (1999) che calcolano il numero <strong>di</strong> incoerenze come numero <strong>delle</strong> coppie <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>valutati incoerentemente. Così ad esempio la sequenza DABEC contiene una sola incoerenza, cioèil fatto che lo stato A riceva un rating migliore <strong>di</strong> B, malgrado sia peggiore sotto tutte le <strong>di</strong>mensioni.Una <strong>di</strong>versa classificazione è invece utilizzata da Dolan e Kind (1996) che calcolano il numero <strong>di</strong>incoerenze come numero <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> valutati incoerentemente, cosicché ad esempio lasequenza DABEC conterrebbe due incoerenze, A e B.Come si vede dalla tabella, il metodo che dà luogo al numero minore <strong>di</strong> incoerenze interne è RS,seguito da TTO e da SG. Per SG, la maggior parte <strong>delle</strong> risposte incoerenti deriva dal fatto che lo23 Alcuni intervi<strong>stati</strong> hanno considerato lo stato E peggiore della morte, dando luogo pertanto al seguente rankingD,B,A,C,E.20


stato <strong>di</strong> <strong>salute</strong> A viene preferito allo stato <strong>di</strong> <strong>salute</strong> B, che è peggiore sotto tutte le <strong>di</strong>mensioniconsiderate. Analogamente, per TTO, la maggior parte <strong>delle</strong> risposte incoerenti (9 su 13) deriva dalpreferire lo stato A allo stato B o nel considerarli equivalenti. I due <strong>stati</strong> <strong>di</strong> <strong>salute</strong>, tuttavia, non sonocosì <strong>di</strong>versi l’uno dall’altro da non poter essere confusi, e questa confusione è abbastanza probabilesia in SG che in TTO, nei quali gli intervi<strong>stati</strong> non hanno continuamente a portata <strong>di</strong> vista tutti gli<strong>stati</strong> <strong>di</strong> <strong>salute</strong>. Questa osservazione ci ha suggerito <strong>di</strong> mo<strong>di</strong>ficare il questionario per verificare se lapresentazione simultanea della descrizione <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> su cartoncini <strong>di</strong> <strong>di</strong>verso coloreall’intervistato poteva ridurre la potenziale confusione e facilitare la coerenza nelle risposte. <strong>La</strong>stessa tabella 2, nelle colonne relative al sotto-campione CARD <strong>di</strong>mostra che questo è il caso.Mentre per RS il numero <strong>di</strong> risposte incoerenti è rimasto costante e pari a 2, per TTO le incoerenzesi sono più che <strong>di</strong>mezzate riducendosi a 5. Un <strong>di</strong>scorso a parte è quello relativo a SG dove leincoerenze non si sono ridotte sostanzialmente, ma sono <strong>di</strong>minuite sensibilmente le risposteincomplete: gli in<strong>di</strong>vidui accettano il rischio <strong>di</strong> morte per migliorare uno stato <strong>di</strong> <strong>salute</strong> deterioratoche adesso non rimane “imprecisatamente” <strong>di</strong>verso dalla buona <strong>salute</strong>. L’intervistato ha sempredavanti le mo<strong>di</strong>fiche relative alla <strong>di</strong>mensione emotiva, <strong>di</strong> ruolo e della funzionalità fisica checomporta il vivere nello stato da valutare piuttosto che in perfetta <strong>salute</strong>. 24<strong>La</strong> nostra interpretazione è quin<strong>di</strong> che, alla <strong>base</strong> <strong>delle</strong> riduzioni <strong>delle</strong> risposte incomplete e <strong>delle</strong>incoerenze (il tasso <strong>di</strong> incoerenza si riduce dal 32% al 20% in SG e dal 46% al 17% in TTO), lamaggior parte <strong>delle</strong> quali vede A ~ B , oppure A > B, c’è il fatto che gli in<strong>di</strong>vidui tramite CARDhanno sempre presenti gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> da valutare e vengono quin<strong>di</strong> eliminate le confusioni tra idue <strong>stati</strong> (A e B) più vicini. <strong>La</strong> spiegazione della più forte variazione del tasso <strong>di</strong> incoerenze delTTO potrebbe essere ricercata nell’or<strong>di</strong>ne <strong>di</strong> somministrazione <strong>delle</strong> tecniche. L’intervistatorisponde a domande TTO nell’ultima parte del questionario, ciò implica che nella versione NOCARD è in tale fase che egli si ricorda peggio <strong>delle</strong> <strong>di</strong>fferenze tra gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong>.24 Per ciò che riguarda le incoerenze <strong>di</strong> criterio esse sono pari a 1 per RS, a 15 per SG e a 17 per TTO nella versioneNO-CARD e 2 in RS, 6 in SG e 5 in TTO nella versione CARD.21


In letteratura, non esiste omogeneità tra i tassi <strong>di</strong> incoerenza osservati. Devlin et al. (2003), adesempio, riportano che in uno stu<strong>di</strong>o RS somministrato per via postale e nel quale la descrizione<strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> era quella del sistema EuroQol-5D, solo il 21% <strong>delle</strong> risposte non presentavaincoerenze, mentre il 57% presentava più <strong>di</strong> un’incoerenza. Lo stu<strong>di</strong>o <strong>di</strong> Dolan e Kind (1996) rilevache in me<strong>di</strong>a, ogni intervistato fornisce una classificazione incoerente del 13% <strong>delle</strong> coppie <strong>di</strong> <strong>stati</strong><strong>di</strong> <strong>salute</strong> valutati con RS. Ba<strong>di</strong>a et al. (1999) riportano una percentuale <strong>di</strong> intervi<strong>stati</strong> checommettono incoerenze logiche del 25,9% con RS e del 59,2% con TTO. Un confronto tra il tasso<strong>di</strong> incoerenze rilevato nel nostro stu<strong>di</strong>o e quello <strong>degli</strong> altri lavori in letteratura non è agevole inquanto, come accennato sopra, non esiste una definizione univoca <strong>di</strong> incoerenza adottate ed inoltreesistono <strong>di</strong>versi in<strong>di</strong>ci <strong>di</strong> incoerenza calcolabili.Dopo aver in<strong>di</strong>viduato le risposte incoerenti, il nodo fondamentale da chiarire è il loro eventualeeffetto sull’or<strong>di</strong>namento <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> e sul valore <strong>delle</strong> utilità dell’inclusione <strong>di</strong> risposteincoerenti. Poiché, infatti, le incoerenze non sono necessariamente sistematiche, in me<strong>di</strong>a essepotrebbero essere nulle: ciò vuol <strong>di</strong>re che il ranking <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> che emerge <strong>sulla</strong> <strong>base</strong> <strong>delle</strong>utilità potrebbe non riflettere alcuna incoerenza. Per lo stesso motivo, l’utilità me<strong>di</strong>a <strong>di</strong> uno stato <strong>di</strong><strong>salute</strong> ottenuta con un campione non depurato dalle risposte incomplete o incoerenti potrebbeessere non <strong>di</strong>ssimileda quella calcolata escludendo le osservazioni incomplete/incoerenti. Le<strong>di</strong>storsioni in<strong>di</strong>viduali, pertanto, non necessariamente sono rilevate nelle misure <strong>di</strong> tendenzacentrale.[Inserire la tabella 3]Per verificare l’effetto della presenza <strong>di</strong> incoerenze <strong>sulla</strong> <strong>valutazione</strong> della qualità <strong>degli</strong> <strong>stati</strong> <strong>di</strong><strong>salute</strong>, nella tabella 3 abbiamo confrontato me<strong>di</strong>a, deviazione standard e me<strong>di</strong>ana per tutti gli <strong>stati</strong> <strong>di</strong><strong>salute</strong>, valutati con le tre tecniche, nei due sottocampioni. I valori presentati in questa tabella sono<strong>stati</strong> ottenuti utilizzando tutte le osservazioni senza escludere quelle incomplete o incoerenti. 25Poiché i pesi per gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> considerati non sono <strong>di</strong>stribuiti normalmente, <strong>base</strong>remo la nostra25 Solo per il sottocampione NO-CARD abbiamo scartato un’osservazione perché il valore dell’utilità per uno stato <strong>di</strong><strong>salute</strong> risultava pari ad infinito.22


<strong>di</strong>scussione sull’andamento <strong>delle</strong> me<strong>di</strong>ane. In entrambi i sottocampioni il ranking <strong>degli</strong> <strong>stati</strong> <strong>di</strong><strong>salute</strong> è B > A > E con tutte le tecniche, come atteso; tuttavia, anche se tutte le tecniche dannoluogo allo stesso ranking, la <strong>di</strong>fferenza nella <strong>di</strong>stribuzione dei pesi tra RS, SG e TTO è sempre<strong>stati</strong>sticamente significativa tranne che per B (NO-CARD), come <strong>di</strong>mostrano i valori del chi-quadropresentati nella tabella 4. Questo risultato, in linea con la letteratura, sottolinea la mancataequivalenza <strong>delle</strong> tre tecniche le quali, a causa <strong>delle</strong> <strong>di</strong>fferenze <strong>di</strong> frame evidenziate nella primaparte <strong>di</strong> questo articolo, misurano fondamentalmente aspetti <strong>di</strong>versi della qualità della vita.[Inserire la tabella 4]<strong>La</strong> tabella 3 mostra che la <strong>di</strong>fferenza fondamentale che emerge tra i due sottocampioniCARD/NO-CARD è che nel primo, in cui il tasso <strong>di</strong> incoerenza è sensibilmente più basso rispetto alsecondo, aumenta la <strong>di</strong>fferenza tra il peso minimo (quello attribuito allo stato <strong>di</strong> <strong>salute</strong> E) e quellomassimo (quello attribuito allo stato <strong>di</strong> <strong>salute</strong> B). Questo aumento dello spread è dovuto al fattoche, nella versione CARD, per tutte e tre le tecniche i valori me<strong>di</strong>ani dei pesi relativi agli <strong>stati</strong> A e Baumentano o rimangono invariati, mentre per tutte le tecniche il valore me<strong>di</strong>ano del peso relativoallo stato E si riduce o rimane invariato. Questo risultato è apparentemente strano: per quantoriguarda il metodo SG, in NO-CARD è sicuramente presente una <strong>di</strong>storsione verso l’alto causata dalfatto che le mancate risposte vengono co<strong>di</strong>ficate come 1 (ovvero equivalenti alla perfetta <strong>salute</strong>).Tuttavia, i pesi me<strong>di</strong>ani <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> A e B in CARD crescono nonostante sia stata eliminatala <strong>di</strong>storsione verso l’alto dovuta alle risposte incomplete. <strong>La</strong> presentazione simultanea <strong>degli</strong> <strong>stati</strong> <strong>di</strong><strong>salute</strong> nella versione CARD porta evidentemente ad un miglior utilizzo della scala <strong>di</strong> valori possibili(0-1), che induce gli intervi<strong>stati</strong> a scegliere anche valori più estremi. Questo effetto predomina suquello determinato dalla riduzione <strong>delle</strong> mancate risposte. Nella tabella 3 gli asterischi in<strong>di</strong>cano icasi in cui la <strong>di</strong>fferenza nella <strong>di</strong>stribuzione dei pesi tra CARD e NO-CARD è <strong>stati</strong>sticamentesignificativa. 26Notiamo, infine, che nel trattamento CARD la deviazione standard è sempre più26 Il test applicato è il test U non parametrico <strong>di</strong> Mann-Whitney. Il livello <strong>di</strong> significatività è il 95%.23


piccola rispetto a NO-CARD, quin<strong>di</strong> la riduzione <strong>delle</strong> risposte incoerenti comporta anche unaminore variabilità dei pesi in<strong>di</strong>viduali.<strong>La</strong> tabella 5 mostra che la riduzione <strong>delle</strong> risposte incomplete ed incoerenti ha anche l’effetto <strong>di</strong>variare l’or<strong>di</strong>namento <strong>delle</strong> tecniche tra i due sottocampioni. In NO-CARD la relazione prevalentetra TTO e SG è SG = TTO o SG > TTO mentre in CARD essa è TTO > SGA > RS, che ècompatibile con quanto rilevato in letteratura a proposito della <strong>valutazione</strong> del proprio stato <strong>di</strong><strong>salute</strong> [Hornberger et al. (1982)] che a proposito <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> dalla durata breve [Dolan eKind(1996) e Bleichrodt e Pinto (2002)]. <strong>La</strong> spiegazione <strong>di</strong> questa variazione è da ricondursiall’aumento dello spread tra valori massimi e minimi, <strong>di</strong> cui si è parlato sopra.[Inserire la tabella 5]Tramite la tabella 3 abbiamo effettuato un test “in<strong>di</strong>retto” dell’effetto <strong>delle</strong> risposte incoerentisui pesi relativi alla qualità della vita, confrontando i pesi ottenuti da un campione con un elevatotasso <strong>di</strong> incoerenza con i pesi derivanti da un campione con un basso tasso; con la tabella 6effettuiamo un test <strong>di</strong>retto mostrando, per ognuno dei due sottocampioni, come si mo<strong>di</strong>ficanome<strong>di</strong>a, me<strong>di</strong>ana e deviazione standard una volta eliminate dai dati le osservazioni affette daincompletezza o da incoerenza. Notiamo che, rispetto a NO-CARD, in CARD la deviazionestandard è minore e che la <strong>valutazione</strong> me<strong>di</strong>a e me<strong>di</strong>ana <strong>di</strong> A e B è sempre più alta. Poiché questieffetti erano <strong>stati</strong> rilevati anche nella tabella 3, essi evidentemente prescindono dalle incoerenze esono invece legati alle caratteristiche della versione CARD del questionario. Confrontando infattiquesta tabella con la tabella 3 si vede che in NO-CARD la me<strong>di</strong>a senza incoerenze è più bassa(anche per la me<strong>di</strong>ana l’effetto c’è ma meno pronunciato); quin<strong>di</strong> l’effetto <strong>delle</strong> incoerenze (esoprattutto <strong>delle</strong> osservazioni incomplete co<strong>di</strong>ficate come 1) era <strong>di</strong> imprimere una <strong>di</strong>storsione versol’alto. Per CARD non si nota invece nessun effetto preciso, probabilmente perché le incoerenzeerano molte <strong>di</strong> meno e tutti i dati erano completi. Nella tabella l’asterisco in<strong>di</strong>ca che la <strong>di</strong>stribuzione<strong>delle</strong> risposte non affette da incoerenza è significativamente <strong>di</strong>versa da quella <strong>delle</strong> risposteincomplete o incoerenti. Come si vede, in NO-CARD, relativamente agli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> A ed E24


valutati con al tecnica SG, la <strong>di</strong>fferenza tra osservazioni affette o meno da incoerenza è<strong>stati</strong>sticamente significativa, proprio perché è con questa tecnica che la <strong>di</strong>storsione verso l’altocomportata dalle osservazioni incoerenti è più forte[Inserire la tabella 6]L’analisi precedente ha mostrato che la presenza <strong>di</strong> molte risposte incoerenti (come avviene nelsottocampione NO-CARD) ha l’effetto <strong>di</strong> imprimere una <strong>di</strong>storsione verso l’alto ai pesi me<strong>di</strong> eme<strong>di</strong>ani che sono quelli che vengono generalmente utilizzati per costruire le tariffe da applicare nelpriority setting in sanità. Quin<strong>di</strong>, i dati del nostro esperimento su piccola scala suggerisconol’opportunità <strong>di</strong> scartare dal data set le osservazioni mancanti. Uno dei problemi connessi a questaprocedura, come evidenziato da Dolan e Kind (1996) è che se le incoerenze sono <strong>di</strong> tipo “primario”,ossia legate a caratteristiche specifiche <strong>degli</strong> intervi<strong>stati</strong>, come età, scolarizzazione o altro,l’esclusione <strong>delle</strong> osservazioni incoerenti può comportare ignorare le <strong>preferenze</strong> <strong>di</strong> specificisottogruppi della popolazione dalle scelte <strong>di</strong> fissazione <strong>delle</strong> priorità in sanità.Al fine <strong>di</strong> verificare la presenza <strong>di</strong> incoerenze <strong>di</strong> tipo primario nei dati da noi analizzati, latabella 7 presenta i risultati del test del chi-quadro <strong>di</strong> Pearson relativamente all’effetto <strong>delle</strong> variabilisesso, titolo <strong>di</strong> stu<strong>di</strong>o, esperienza precedente della malattia, familiarità con la malattia, età superioreai sessantacinque anni <strong>sulla</strong> proporzione <strong>di</strong> incoerenze riscontrate. Tutti i test danno valori non<strong>stati</strong>sticamente significativi. Pertanto, si può escludere che le variabili identificate abbiano qualcheeffetto nel determinare incoerenze rilevate. Per effettuare questo test i due sottocampioni sono <strong>stati</strong>considerati congiuntamente assumendo che essi fossero omogenei riguardo alle caratteristichedell’intervistato. 27 [Inserire la tabella 7]6. IMPLICAZIONI E CONCLUSIONI27 Ciò potrebbe non essere vero riguardo alle variabili titolo <strong>di</strong> stu<strong>di</strong>o a causa della presenza <strong>di</strong> otto me<strong>di</strong>ci nel primosottocampione. Il test non è stato effettuato su RS perché sono presenti solo 2 incoerenze per sottocampione.25


In questo lavoro abbiamo analizzato alcune <strong>delle</strong> spiegazioni teoriche alla <strong>base</strong> della mancataequivalenza tra le tre principali tecniche<strong>di</strong> costruzione <strong>delle</strong> utilità in<strong>di</strong>viduali <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>.Poiché l’assenza dell’equivalenza comporta l’in<strong>di</strong>viduazione della tecnica “migliore”, abbiamoconfrontato RS, SG e TTO <strong>sulla</strong> <strong>base</strong> <strong>di</strong> un criterio eminentemente empirico: la capacità dellatecnica <strong>di</strong> determinare risposte che siano logicamente coerenti.<strong>La</strong> nostra analisi in<strong>di</strong>ca che, in generale, l’effetto <strong>delle</strong> incoerenze è <strong>di</strong> imprimere una<strong>di</strong>storsione ai valori <strong>di</strong> utilità osservati. Ciò suggerisce l’opportunità [ve<strong>di</strong> anche Devlin et al.(2003) e Ba<strong>di</strong>a et al. (1999)] <strong>di</strong> escludere le osservazioni incoerenti dal campione che deve essereutilizzato per stimare le utilità <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>. Le incoerenze osservate sono <strong>di</strong> tipo“secondario”, ovvero legate al frame della tecnica <strong>di</strong> <strong>valutazione</strong> utilizzata e non <strong>di</strong> tipo “primario”,cioè legate alle caratteristiche dell’intervistato. Questo risultato è confortante perché in<strong>di</strong>ca che larimozione <strong>delle</strong> osservazioni incoerenti dal campione non implica l’esclusione <strong>delle</strong> <strong>preferenze</strong> <strong>di</strong>particolari sottogruppi sociali dalla determinazione <strong>delle</strong> priorità in sanità. Questo risultato tuttaviacontrasta con quanto rilevato da Dolan e Kind (1996) relativamente al Regno Unito e da Ba<strong>di</strong>a et al.(1999) relativamente alla Spagna. In questi due stu<strong>di</strong>, le risposte incoerenti sono positivamentecorrelate con l’età ed inversamente correlate con il titolo <strong>di</strong> stu<strong>di</strong>o. Essendo i nostri risultati, pernostra conoscenza, i primi relativi all’Italia, la loro robustezza andrà verificata utilizzando uncampione più grande e rappresentativo della popolazione italiana.Per quanto concerne il confronto tra le tre tecniche, in accordo con la letteratura esistente, RSrisulta essere il metodo con la migliore performance in termini <strong>di</strong> completezza e coerenza. Pertanto,esso andrebbe preferito anche alla luce della semplicità <strong>di</strong> somministrazione; come già <strong>di</strong>scusso,esso è però avversato dagli economisti in quanto non è preference-<strong>base</strong>d, cioè non è costruito <strong>sulla</strong>scelta tra alternative, bensì su una semplice graduatoria <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>. I due meto<strong>di</strong> basati suun trade-off, tuttavia, sono risultati insod<strong>di</strong>sfacenti dal punto <strong>di</strong> vista della completezza <strong>delle</strong>risposte (principalmente SG) e dal punto <strong>di</strong> vista della coerenza. Su quest’ultimo punto, tuttavia,occorre rilevare che molto probabilmente la maggior parte <strong>delle</strong> incoerenze osservate potrebbero26


essere eliminate da una più attenta conduzione <strong>delle</strong> interviste, che utilizzi supporti visivi cheagevolino la comprensione ed il confronto tra gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> valutati. Evidenza empirica a questoproposito è fornita dalla versione CARD del questionario, nel quale gli <strong>stati</strong> <strong>di</strong> <strong>salute</strong> erano sempre<strong>di</strong>sponibili per essere visionati dall’intervistato simultaneamente ed inoltre la loro specificitàappariva più chiara per il fatto che essi erano stampati su cartoncini <strong>di</strong> <strong>di</strong>verso colore. Nelsottocampione CARD le risposte incomplete in SG si sono fortemente ridotte e così pure leincoerenze in TTO. Questo risultato ci induce a credere che ulteriori affinamenti del formato delquestionario potrebbero ridurre ulteriormente il tasso <strong>di</strong> incoerenza rilevato.Come parte della nostra agenda <strong>di</strong> ricerca futura ci proponiamo <strong>di</strong> estendere lo stu<strong>di</strong>o <strong>degli</strong> effetti<strong>delle</strong> risposte incoerenti <strong>sulla</strong> costruzione <strong>delle</strong> tariffe sociali in sanità. A tale fine, il nostroobiettivo è <strong>di</strong> investigare la sensibilità <strong>delle</strong> risposte incoerenti e dei valori <strong>delle</strong> utilità rispetto avariazioni del metodo <strong>di</strong> elicitazione, utilizzando descrizioni <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> non patologiaspecifici,come ad esempio Euro-QoL 5D, e un numero <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> superiore a quelloconsiderato nel presente stu<strong>di</strong>o.RingraziamentiRingraziamo la dott.ssa Maria Gabriella Cannone per la collaborazione prestata nella costruzionedel questionario pilota e nella raccolta dei dati e il dott. Ernesto Mossutti per la collaborazione nellacostruzione <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> oggetto dello stu<strong>di</strong>o.Questo saggio è frutto del lavoro congiunto dei due autori. I loro rispettivi contributi sono daconsiderarsi equivalenti.Riferimenti bibliograficiArrow K.J. (1963) –– Social Choice and In<strong>di</strong>vidual Values, Yale University Press, New Haven, CT.Ba<strong>di</strong>a X., Roset M. e Herdman M. (1999) – “Inconsistent responses in three preference-elicitationmethods for health states”, Social Science and Me<strong>di</strong>cine, 49, 943-950.Ben-Zion U. e Gafni A. (1983) – “Evaluation of Public Investment in Health Care: Is RiskIrrelevant?”, Journal of Health Economics, 2, 161-165.Bleichrodt, H. & M. Johannesson. (1997) – "The Vali<strong>di</strong>ty of QALYs: An Experimental Test ofConstant Proportional Trade-off and Utility Independence", Me<strong>di</strong>cal Decision Making 17, 21-32.Bleichrodt, H. & M. Johannesson. (1997a) – "An Experimental Test of a Theoretical Foundation forRating Scale Valuations." Me<strong>di</strong>cal Decision Making 17, 208-216.27


Bleichrodt, H. (2002) – "A New Explanation for the Difference Between SG and TTO Utilities."Health Economics, 11, 447-456.Bleichrodt H., Pinto J.L. (2002) “A New Type of Preference Reversal”, mimeo, ErasmusUniversity.Bleichrodt H., Pinto J.L. (2002a) – “Loss aversion and scale compatibility in two-attribute tradeoffs”,Journal of Mathematical Psychology, 46, 315-337.Bleichrodt H., Pinto J.L., Abellan-Perpinan J.M. (2002) – “A Consistency Test of the Time Tradeoff”,mimeo, Erasmus University.Boyle M. H., Torrance G. W e Sinclair J.C. (1983) – “Economic evaluation of neonatal intensivecare of very-low-birth-weight infants”, New England Journal of Me<strong>di</strong>cine, 308, 1330-1337.Bush, J.W., Chen, M. e Patrick, D.L. (1973) – “Cost-effectiveness Using a Health Status Index:Analysis of the New York State PKU Screening Program”, Health Status Indexes a cura <strong>di</strong> Berg.R., Chicago: Hospital Research and Educational Trust.Culyer A.J. e Wagstaff A. (1993) – “QALYs versus HYEs”, Journal of Health Economics, 11, 311-323.Devlin N.J., Hansen P., Kind P. e A.Williams (2003) – “Logical inconsistencies in surveyrespondents’ health state valuations – a methodological challenge for estimating social tariffs”,Health Economics, 12, 529-544.Dolan (1996) – “The effect of experience of illness on health state valuations”, Journal of ClinicalEpidemiology, 49, 551-564.Dolan P., Kind P. (1996) – “Inconsistency and health state valuations”; Social Science andMe<strong>di</strong>cine, 42, 609-615.Dolan P., Gudex, C., Kind, P., Williams A. (1996) – “The time trade-off method: results from aGeneral Population Study”, Health Economics, 5, 141-154.Dolan P., Jones-Lee M. (1997) –“The time trade-off : a note on the effect of lifetime reallocation ofconsumption and <strong>di</strong>scounting”, Journal of Health Economics, 16, 731-739.Dolan P., Roberts J. (2002) – “To what extent can we explain time trade-off values from otherinformation about respondents?”, Social Science and Me<strong>di</strong>cine, 54, 919-929.Dolan P., Sutton M. (1997) – “Mapping visual analogue scale health state onto standard gambleand time trade-off values”, Social Science and Me<strong>di</strong>cine, 44, 1519-1530.Drummond M.F., Stoddart, Torrance G.W. (1987) –Methods for Economic Evaluation of HealthCare Programmes, Oxford University Press, Oxford.Drummond M.F., Heyse J., Cooke J., McGuire A. (1993) – “A selection of end-points in economicevaluations of coronary-heart <strong>di</strong>sease interventions”, Me<strong>di</strong>cal Decision Making, 13, 184-90.Drummond M.F., O’Brien B., Stoddart G.L. e t Torrance G.W. (1997) – Methods for EconomicEvaluation of Health Care Programmes, Oxford University Press, Oxford.Dyer J.S. e Sarin R.K. (1982) – “Relative risk aversion”, Management Science, 28 (8), 875-886.Furlong W., Feeny D., Torrance G., Barr R., Horsman J. (1990) – Guide to design and developmentof health state utility instrumentation, Hamilton, Canada, McMaster University.Gafni A. (1994) – “The standard gamble method: what is being measured and how it is interpreted”,Health Service Review, 29, 207-224.Gafni A. e Birch S. (1993) –”Economics, health and health economics: HYEs versus QALYs”,Journal of Health Economics, 11, 325-339.28


Gafni A., Birch S. (1995) – “Preference for outcomes in economic evaluation: an economicapproach to solving economic problems“, Social Science and Me<strong>di</strong>cine, 40, 767-776.Gafni A. and Torrance G.W. (1984) – “Risk Attitude and Time-preference in Health”, ManagementScience, 30, 440-451.Grenn C., Brazier J. e Deverill M. (2000) – “Valuing health-related qualità of life: a review ofhealth state valueation techniques”, PharmacoEconomics, 17(2), 151-165.Grether D. e Plott C. (1979) – “Economic theory of choice and the Preference Reversalphenomenon, American Economic Review, 69.Groot W. (2000) “Adaptation and scale of reference bias in self-assessments of quality of life”,Journal of Health Economics, 19, 403-420.Hornberger J.C., Redelmeier D.A. and Peterson J. (1992) –“Variability among methods to assesspatients’ well being and consequent effect on a cost-effectiveness analysis“, Journal of ClinicalEpidemiology, 45, 505-512.Johannesson M., Plinskin J. e Weinstein M. (1993) – “Are healthy-years equivalents animprovement over quality-adjusted life years?”, Me<strong>di</strong>cal Decision Making, 13(4), 281-286.Jones-Lee M., Loomes G., O’Reilly D., e Philips P. (1993) –The value of preventing non fatal roa<strong>di</strong>njuries, Transport Research <strong>La</strong>boratory, Department of Transport, UK.Kahneman D. e A. Tversky (1979) – “Prospect Theory: an analysis of decision under risk”,Econometrica, 47, 263-291.Kahneman D. e A. Tversky (1981) –“ The framing of decisions and the psychology of choice“,Science, 211, 453-460Klarman, H.E., Francis, J.O.S., Rosental, G., (1968) – “Cost-Effectiveness Analysis Applied to theTreatment of Chronic Renal Disease”, Me<strong>di</strong>cal Care, 6(1), 48-54.<strong>La</strong>londe L., Clarke A.E. et al. (1999) – “Comparing the Psychometric properties of preference<strong>base</strong>dand non-preference-<strong>base</strong>d health-related quality of life in coronary heart <strong>di</strong>sease”, QualityLife Research, 8, 399-409.<strong>La</strong>londe L., Clarke A.E. et al. (2001) – “Health related quality of life with coronary heart <strong>di</strong>seaseprevention and treatment”, Journal of Clinical Epidemiology, 54, 1011-1018.Lewis E.F., Johnson P.A. et al. (2001) – “Preference for Quality of Life or Survival Expressed byPatients with Heart Failure”, Journal of Heart and Lung Transplantation, 20,1016-1024.Lichtenstein S. e Slovic P. (1971) – “Reversals of preference between bids and choices in gamblingdecisions“, Journal of Experimental Psychology, 89, 46-55.Loomes G. e McKenzie L. (1989) – “The use of QALYs in health care decision making”, SocialScience and Me<strong>di</strong>cine, 28, 299-308.Mehrez A. e Gafni A. (1989) – “Quality adjusted life years, utility theory, and healthy-yearsequivalents”, Me<strong>di</strong>cal Decision Making, 9, 142-149.Mehrez A. e Gafni A. (1991) – “The healthy-years equivalents: how to measure them using thestandard method approach”, Me<strong>di</strong>cal Decision Making, 11, 140-146.Mehrez A. e Gafni A. (1993) – “The healthy-years equivalents versus quality-adjusted life years: inpursuit of progress”, Me<strong>di</strong>cal Decision Making, 13, 287-292.29


Ohinmaa A. e Sintonen H. (1999) – “Inconsistencies and modeling of the Finnish Euro-Qol (EQ-5D) preference values”, in EuroQol Plenary Meeting 1998 Discussion Papers, a cura <strong>di</strong> Greiner W.,J.M. Graf vd Schulenburg e Piercy J.Pederzoli, V. e Merzari R.(2000) – <strong>La</strong> <strong>valutazione</strong> economica in Sanità, CEDAM, Padova.Pliskin J.S., Shepard D.S. e Weinstein M.C. (1980) – “Utility functions for life years and healthstatus”, Operation Research, 28, 206-224.Richardson J. (1994) “Cost Utility analysis: what should be measured?”, Social Science andMe<strong>di</strong>cine, 39, 7-20.Torrance G.W. (1976) – “Social Preferences for Health States: An Empirical Evaluation of ThreeMeasurement Techniques”, Socio-Economic Planning Sciences, 10(3), 129-136.Torrance G.W. (1986) – “Measurement of health state utilities for economic appraisal: a review”,Journal of Health Economics, 5, 1-30.Torrance, G.B., Furlong, W.J. e Feeny, D.H., (1995) – “Multi-attribute preference function: healthutilities index” PharmacoEconomics, 9, 503-20.Tversky A., Sattah S. e Slovic P. (1988) – “Contingent weighting in judgement and choice”,Psychological Review, 95, 371-384.Tversky A., Kaheneman D. (1991) –“Loss aversion in riskless choice: a reference dependentmodel“, Quarterly Journal of Economics, 106, 1039-1061.Weinstein M.C. e Stason W.B. (1976) – Hypertension: a Policy Perspective, Cambridge, MA,Harvard University Press.Weinstein M.C., Stason W.B. (1985) – “Cost effectiveness of interventions to prevent or treatcoronary heart <strong>di</strong>sease”, Ann. Rev. Public Health, 6, 41-63.Williams A. (1985) – “Economics of coronary artery bypass grafting”, British Me<strong>di</strong>cal Journal,291, 326-329.Wolfson A.D., Sinclair A.J., Bombar<strong>di</strong>er C. e McGeer A. (1982) – “Preference measurements forfunctional status in stroke patients: inter-rater and inter-technique comparisons” in Value and LongTerm Care curato da Kane R. e Kane R., pp.191-214. DC. Health Lexington.30


Appen<strong>di</strong>ce - Descrizione <strong>degli</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong>AIN OSPEDALE,- 1-2 settimane <strong>di</strong> degenza caratterizzata da:- all’ingresso dolore al petto intenso (dolore precor<strong>di</strong>ale intenso), che <strong>di</strong>minuisce con laterapia;- con<strong>di</strong>zioni generali compromesse;DOPO L'OSPEDALE, speranza <strong>di</strong> vita <strong>di</strong> 10 anni durante la quale:- ci si sente ansiosi e depressi per buona parte della giornata;- si ha possibilità <strong>di</strong> lavorare con notevole cautela;- si ha possibilità <strong>di</strong> svolgere attività giornaliere con notevole cautela.BIN OSPEDALE,- 1-2 settimane <strong>di</strong> degenza caratterizzata da:- all’ingresso una sensazione <strong>di</strong> fasti<strong>di</strong>o al petto (dolore precor<strong>di</strong>ale mo<strong>di</strong>co), che <strong>di</strong>minuiscecon la terapia;- con<strong>di</strong>zioni generali non compromesse;DOPO L'OSPEDALE, speranza <strong>di</strong> vita <strong>di</strong> 10 anni durante la quale:- ci si sente poco ansiosi e <strong>di</strong> umore abbastanza buono per buona parte della giornata;- si ha possibilità <strong>di</strong> lavorare con moderata cautela;- si ha possibilità <strong>di</strong> svolgere attività giornaliere con moderata cautela.EIN OSPEDALE,lungo periodo <strong>di</strong> degenza caratterizzato da:- all’ingresso dolore al petto insopportabile (dolore precor<strong>di</strong>ale insopportabile), che<strong>di</strong>minuisce con la terapia;- con<strong>di</strong>zioni generali molto compromesse;DOPO L'OSPEDALE, speranza <strong>di</strong> vita <strong>di</strong> 10 anni durante la quale:- ci si sente ansiosi e depressi per tutta la giornata;- si ha impossibilità <strong>di</strong> lavorare e bisogno <strong>di</strong> aiuto da parte <strong>di</strong> terzi;- si hanno restrizioni permanenti <strong>delle</strong> attività giornaliere.31


Tabella 1 – Differenze tra meto<strong>di</strong> <strong>di</strong> <strong>valutazione</strong> <strong>delle</strong> <strong>preferenze</strong>DIFFERENZE TRAMETODI DI VALUTAZIONEMETODIStandard Gamble Time trade-off Rating ScaleResponse mode probabilità anni <strong>di</strong> vita numero 0-100Tipologia <strong>di</strong> risposta scelta tra due alternative scelta tra due alternative graduatoriaCon<strong>di</strong>zione <strong>di</strong> scelta incertezza certezza certezzaReference point statu quo statu quo buona <strong>salute</strong>32


Tabella 2 – Numero <strong>di</strong> risposte affette da incoerenza logicaSequenzaincoerenteNo-CardRS SG TTOCardNo-CardCardNo-CardCard(29)*(30)(22)(30)(28)(30)DABCE (1)** 0 0 0 0 2 0DABEC (1) 1 0 5 2 2 0DA?BEC (1) 1 0 1 2 3 4DA?BCE (1) 0 0 0 0 2 0D?BAEC (1) 0 0 0 0 1 1DBEAC (1) 0 2 0 1 0 0DBE?AC (1) 0 0 0 1 0 0DEABC (2) 0 0 1 0 1 0DAB?EC (2) 0 0 0 0 2 0Totale risposte incoerenti 2 2 7 6 13 5Tasso <strong>di</strong> incoerenza 0,07 0,07 0,32 0,2 0,46 0,17* il numero in parentesi si riferisce alle risposte complete**il numero in parentesi si riferisce al numero <strong>di</strong> coppie <strong>di</strong> <strong>stati</strong> <strong>di</strong> <strong>salute</strong> valutati incoerentemente33


Tabella 3 - Variabili descrittive dei pesi RS, SG e TTO (tutte le osservazioni) aMe<strong>di</strong>a Deviazione standard Me<strong>di</strong>anaNO-CARD CARD NO-CARD CARD NO-CARD CARDRS 0,55 0,58 0,11 0,08 0,50 0,60Stato <strong>di</strong> <strong>salute</strong>SG 0,71 0,69 0,18 0,11 0,70 0,72A TTO* 0,64 0,74 0,22 0,11 0,70 0,77RS* 0,79 0,82 0,77 0,07 0,80 0,80Stato <strong>di</strong> <strong>salute</strong>SG 0,80 0,8 0,14 0,12 0,80 0,85B TTO* 0,72 0,88 0,15 0,04 0,70 0,90RS 0,19 0,25 0,23 0,13 0,30 0,23Stato <strong>di</strong> <strong>salute</strong>SG 0,35 0,31 0,53 0,13 0,40 0,32E TTO 0,17 b 0,38 1,8 0,20 0,40 0,40a le risposte mancanti sono state co<strong>di</strong>ficate come 1b me<strong>di</strong>a corretta per i valori estremi (5%)* la <strong>di</strong>fferenza nella <strong>di</strong>stribuzione tra CARD e NO-CARD è <strong>stati</strong>sticamente significativa al 95%(test U <strong>di</strong> Mann-Whitney)34


Tabella 4 – Analisi della varianza non parametrica <strong>di</strong> Friedman sui pesiottenuti con RS, SG e TTOStato <strong>di</strong> Salute Chi Quadro Livello <strong>di</strong> SignificativitàA (NO CARD)A (CARD)B (NO CARD)B (CARD)E (NO CARD)E (CARD)14,97031,1134,1519,07320,0207,3860,0100,0000,1260,0110,0000,02535


Tabella 5 - Graduatoria <strong>delle</strong> tre tecnicheStato <strong>di</strong> <strong>salute</strong>Graduatoria (basata <strong>sulla</strong> me<strong>di</strong>ana)A NO-CARD SG = TTO > RSCARDTTO > SGA > RSB NO-CARD SG = RS > TTOCARDTTO > SGA > RSE NO-CARD SG = TTO > RSCARDTTO > SGA > RS36


Tabella 6 - Variabili descrittive dei pesi RS, SG e TTO (dati depurati dalle osservazioniincomplete o incoerenti) a Me<strong>di</strong>a Deviazione standard Me<strong>di</strong>anaNO-CARD CARD NO-CARD CARD NO-CARD CARDRS 0,53 0,59 0,11 0,08 0,50 0,60Stato <strong>di</strong> <strong>salute</strong>SG 0,61* b 0,69 0,11 0,09 0,60 0,72A TTO 0,55 0,71 0,18 0,10 0,60* 0,70*RS 0,8 0,83 0,06 0,07 0,8 0,83Stato <strong>di</strong> <strong>salute</strong>SG 0,81 0,83* 0,08 0,06 0,8 0,85B TTO 0,72 0,87 0,14 0,04 0,8 0,90RS 0,18 0,23 0,24 0,12 0,25 0,20Stato <strong>di</strong> <strong>salute</strong>SG 0,11* 0,31 0,56 0,12 0,30 0,32E TTO 0,13 0,33 0,7 0,18 0,4 0,30a Numero <strong>di</strong> osservazioniNO CARD: RS = 28, SG = 15, TTO = 15;CARD: RS = 28, SG = 24, TTO = 25.b L’asterisco in<strong>di</strong>ca che per la tecnica e lo stato <strong>di</strong> <strong>salute</strong> in<strong>di</strong>cati la <strong>di</strong>fferenza nella <strong>di</strong>stribuzione dei pesi traosservazioni prive <strong>di</strong> incoerenze e osservazioni affette da incoerenza è <strong>stati</strong>sticamente significativa al 5%.37


Tabella 7 – Effetti <strong>delle</strong> caratteristiche dei rispondenti sul numero <strong>di</strong> risposte incoerenti(chi-quadro <strong>di</strong> Pearson, livello <strong>di</strong> significatività in parentesi)SessoCaratteristicadell’intervistatoEtà > 65Titolo <strong>di</strong> stu<strong>di</strong>oEsperienza malattiaFamiliarità malattiaSG0,041(0,839)0,388(0,533)0,314(0,957)0,361(0,548)2,51(0,113)TTO0,963(0,326)0,834(0,361)4,150(0,246)0,848(0,357)1,663(0,197)38


ALTRE TABELLE (DA INVIARE EVENTUALMENTE AI REFEREE)Tabella a – Confronto <strong>di</strong> omogeneità tra i due sottocampioni (Mann –Whitney U-test)Stato <strong>di</strong> Salute Tecnica <strong>di</strong> MW U-testLivello <strong>di</strong><strong>valutazione</strong>SignificativitàABERSSGTTORSSGTTORSSGTTO369418321314440135442428421,2190,6340,0540,0370,8870,000,0950,1030,78339


Tabella b – Confronto <strong>di</strong> omogeneità tra i due sottocampioni (t- test per l’uguaglianza <strong>delle</strong>me<strong>di</strong>e per campioni in<strong>di</strong>pendenti)Stato <strong>di</strong><strong>salute</strong>tSignificatività(a due code)RS(A) -1,483 ,144RS(B) -2,261 ,028RS(E) -1,372 ,175SG(A) 1,047 ,300SG(B) ,116 ,908SG(E) ,316 ,753TTO(A) -2,427 ,018TTO(B) -4,912 ,000TTO(E) 2,079 ,04240

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!