La valutazione degli stati di salute sulla base delle preferenze ...

INTRODUZIONEStabilire delle priorità razionali in sanità in presenza di risorse scarse richiede un’attentavalutazione dei costi e dei benefici delle varie forme di intervento possibili. Negli ultimi trent’annigli sforzi degli economisti hanno teso ad elaborare tecniche che determinino le priorità in manierascientifica e che possano superare le obiezioni tipicamente rivolte all’approccio economico alpriority setting in sanità. Proprio dal tentativo di superare il limite intrinseco dell’approcciotradizionale dell’analisi costi-benefici – la quantificazione di benefici legati al miglioramento dellasalute in termini monetari – si sviluppa l’analisi costo utilità (ACU) e il concetto di QALY.L’ACU nasce dal riconoscimento che gli interventi ed i programmi sanitari producono effetti siain termini di quantità di vita (variazioni della mortalità) che in termini di qualità di vita (variazionidella morbilità) e dalla necessità di combinare in un’unica misura queste due dimensioni. I beneficiincrementali di interventi e programmi sanitari vengono generalmente espressi in termini di anni divita aggiustati per la qualità o QALY (dall’inglese quality-adjusted life years), introdotti daKlarman et al. (1968) e sviluppati da Busch et al. (1973), Weinstein e Stason (1976), Boyle et al.(1983) e Williams (1985). 1 I QALY generati da un intervento vengono confrontati con il costoincrementale dello stesso. I risultati dei programmi possono essere poi espressi in termini di costoper QALY guadagnato.I QALY si calcolano ponderando gli anni di vita guadagnati grazie all’intervento/programmaper dei “pesi”, indicanti l’utilità di ciascuno stato di salute rispetto a dei valori ancora che sono laperfetta salute e la morte. La strategia generalmente utilizzata per ottenere i pesi è la misurazionediretta delle preferenze relative agli stati di salute, attraverso interviste condotte su un campionerappresentativo della popolazione o di pazienti affetti da una malattia. 2Esistono tre principalitecniche per calcolare i pesi attraverso l’intervista diretta: il metodo delle Scala di Valutazione, RS,1 Una misura alternativa proposta da Mehrez e Gafni (1989, 1991) sono gli anni equivalenti in buona salute, HYE(dall’inglese healthy years equivalents). Sul vivace dibattito sull’opportunità di sostituire all’impiego dei QALY gliHYE si vedano Culyer e Wagstaff (1993), Gafni et al. (1993), Mehrez e Gafni (1993), Johannesson et al. (1993).2Questa strategia risulta generalmente preferita a causa delle distorsioni potenzialmente legate a strategie alternativequali (i) il giudizio di un esperto, (ii) l’utilizzo di valori in letteratura. Si vedano a proposito Dolan, Gudex et al. (1996)e Groot (2000).2

dall’inglese Rating Scale, il metodo delle Scommesse, SG, dall’inglese Standard Gamble, ed ilmetodo delle Alternative Temporali, TTO, dall’inglese Time Trade-Off. Mentre il primo metodo èbasato essenzialmente sulla introspezione, i rimanenti due sono tipicamente “economici” nel sensoche sono basati sulla scelta tra alternative.Affinché i pesi generati dalle tre tecniche possano essere utilizzati nella costruzione dei QALY,una delle condizioni da soddisfare è che essi riflettano le preferenze per gli stati di salute, in modoche lo stato di salute maggiormente preferito riceva il peso maggiore e venga così favorito. Nesegue che se le preferenze sono stabili e se tutte e tre le tecniche riescono a elicere in modo correttole preferenze relative agli stati di salute, un individuo dovrebbe assegnare a n stati di salute lostesso ordinamento a prescindere dalla tecnica di misurazione utilizzata.Inoltre, sotto alcunecondizioni identificate da Pliskin (1980) i valori delle utilità assegnati a identiche descrizioni di unostato di salute dovrebbero essere sostanzialmente analoghi. Tuttavia, sin dagli anni settanta,numerose analisi empiriche [si vedano ad esempio Torrance (1976), Wolfson et al. (1982),Hornberger et al. (1992)] hanno evidenziato che le tre tecniche producono valori delle utilitàsignificativamente differenti, ponendo pertanto il problema di quale sia il metodo da privilegiare percostruire i pesi. Il dilemma della scelta della tecnica “first best” è difficilmente risolvibile a priori subasi teoriche, poiché le due tecniche che vengono privilegiate dagli economisti in quanto basatesulla scelta tra alternative, SG e TTO, prevedono ipotesi restrittive sul comportamento degliindividui che vengono sistematicamente violate.In questo lavoro, seguendo alcuni lavori empirici in letteratura [Dolan et al. (1996), Badia et al.(1999) e Devlin et al. (2003)] proponiamo di impostare empiricamente il problema della sceltadella tecnica di valutazione, confrontando le tecniche sulla base della coerenza delle rispostegenerate. La coerenza delle risposte individuali rappresenta un parametro importante di razionalità.Dato che le risposte incoerenti introducono una distorsione nei valori di utilità, esse vengonogeneralmente eliminate dal campione di dati utilizzato per calcolare le utilità. Privilegiare il metodocon un tasso di risposte incoerenti più basso vuol dire pertanto fare un utilizzo più efficiente dei3

dati. Anche se l’esclusione degli individui fosse a costo zero in termini di conduzione dello studiocosto-utilità, è importante comunque cercare di spiegare l’origine delle incoerenze. Se esse fosseroconcentrate in uno specifico sotto-gruppo della popolazione (es. gli anziani), l’esclusione dellerisposte incoerenti comporterebbe de facto l’esclusione delle presenze di questo sottogruppo dallavalutazione della qualità di uno stato di salute. A scopo illustrativo, si supponga che i QALY sianoutilizzati come strumento di policy per stabilire la desiderabilità sociale di un programma diassistenza ai malati di Alzheimer. Si supponga inoltre che le risposte incoerenti riguardanti lavalutazione della qualità degli stati di salute legati all’Alzheimer siano concentrate nel gruppo degliultra sessantacinquenni. L’esclusione di queste risposte dal campione implicherebbe ignorare lepreferenze riguardo al programma di assistenza del gruppo sociale che risulta maggiormente colpitodalla malattia. Se le preferenze di questo gruppo fossero divrse da quelle del resto dellapopolazione, ciò comporterebbe QALY distorti.Utilizzando un campione di sessanta individui partecipanti ad uno studio sulla valutazione dellaqualità delle vita in seguito all’infarto del miocardio, abbiamo analizzato le risposte individuali peridentificare le incoerenze e per spiegarne le possibili cause. I metodi basati su un trade-off, cioè SGe TTO, risultano quelli con un tasso di incoerenza più elevato. I risultati dello studio, tuttavia,mostrano che i tassi di incoerenza possono essere ridotti con un’accorta conduzione delle interviste.Il lavoro è organizzato come segue: nella prima sezione presentiamo sinteticamente le treprincipali tecniche di costruzione dei pesi sulla base delle preferenze degli intervistati e i lorofondamenti teorici. Nella seconda sezione la nostra attenzione si focalizza sui motivi – problemilegati al frame utilizzato nella tecnica o al fallimento delle ipotesi comportamentali sottostanti letecniche – che spiegano perché i valori ottenuti con le diverse tecniche sono significativamentediversi. Nella terza sezione, spieghiamo come è da intendere il concetto di incoerenza e le suepossibili cause e perché è opportuno privilegiare le tecniche con il tasso di incoerenza più basso. Lesezioni successive sono dedicate ad una descrizione del campione utilizzato e al confronto delle4

tecniche sulla base delle incoerenze rilevate. Una breve discussione delle implicazioni dei nostririsultati conclude il lavoro.1. LA MISURAZIONE DELLE PREFERENZE DEGLI STATI DI SALUTEIn questa sezione descriveremo sinteticamente i tre principali metodi costruzione delle utilitàdegli stati di salute, RS, SG e TTO, relativamente al caso in cui gli stati di salute da valutare sonocronici. 3Le utilità sono valori cardinali che vengono assegnati ad ogni stato di salute su una scaladi intervallo che in genere ha come estremi i valori arbitrari 1 (perfetta salute) e 0 (morte). 4 Esseriflettono la qualità di uno stato di salute e permettono pertanto di valutare una variazione degli annidi vita da un punto di vista qualitativo. Affinché dalle utilità individuali si passi a costruire unvalore collettivo, le utilità individuali sono aggregate attraverso una media aritmetica. Da qui lanecessità di avere dei valori cardinali, dato che Arrow (1963) ha dimostrato che le utilità ordinalinon possono essere aggregate.1.1. Standard GambleSG è il metodo classico di misura cardinale delle preferenze che ha come fondamento teorico lateoria dell’Utilità Attesa di von Neumann-Morgestern. SG deriva infatti dalla diretta applicazione diuno degli assiomi su cui è costruita la teoria dell’Utilità Attesa, l’assioma della continuità dellepreferenze. L‘impiego di SG è quindi attraente perché, se si accettano gli assiomi di tale teoria, essoè valido per definizione [Torrance (1986)]. 5Inoltre, esso permette di prendere in considerazionel’incertezza che permea le decisioni cliniche [Ben Zion e Gafni (1983); Richardson (1994); Gafni eBirch (1995); Torrance et al. (1995)].3 I tre metodi possono anche essere impiegati al fine di elicere le preferenze riguardanti stati di salute temporanei. Siveda a proposito Drummond et al. (1997).4 La scala di misurazione cardinale ad intervalli implica che le differenze tra valori possono essere confrontate, ma irapporti tra valori non hanno significato [si veda Torrance (1986)].5 Gli oppositori di SG, invece, lo avversano proprio per la rigidità del suo approccio assiomatico che ha subito diversecritiche [si veda tra tanti altri Loomes e McKenzie (1989)].5

Nel caso di valutazione di stati di salute cronici preferiti alla morte, all’intervistato è chiesto dicomparare una lotteria ad un’alternativa certa. La lotteria è descritta come un trattamento che ha duepossibili esiti: vivere con probabilità p in perfetta salute, per un periodo di tempo T dopo il qualesegue la morte, e la morte immediata con probabilità (1-p). L’alternativa certa corrisponde allo statodi salute ipeggiore della perfetta salute e preferito alla morte, per il periodo di tempo T. Si favariare il valore di p fino a che l’intervistato non si dichiara indifferente tra la lotteria e l’alternativacerta. Il valore di p che viene così determinato è il peso che esprime la preferenza per lo stato disalute i, la sua utilità, h i =p.1.2. Rating ScaleRS è un metodo molto semplice che deriva dalla tradizione psicometrica. Nel caso divalutazione di stati di salute cronici, essi vengono descritti all’intervistato come irreversibili e tuttidi eguale durata: l’età in cui il soggetto entra nello stato in questione e l’età in cui il soggetto esceda tale stato, in quanto sopraggiunge la morte, è uguale per tutti gli stati di salute. Si chiedeall’intervistato di ordinare gli stati di salute dal più preferito al meno preferito e, successivamente,di posizionarli su di una scala (solitamente da 100 a 0 o da 1 a 0) in modo tale che la distanza traogni coppia di stati di salute corrisponda alla differenza di preferenza fra i due stati di saluteconsiderati. La posizione sulla scala di stati di salute valutati molto simili tra loro dovrebbe quindirisultare molto vicina. Il peso che esprime la preferenza per ogni stato di salute è pari al valore adesso attribuito sulla scala diviso 100 nel caso la scala sia da 100 a 0 o lasciato inalterato nel caso discala da 1 a 0.RSè generalmente considerato un metodo “inferiore” in quanto non ha un fondamentoassiomatico. Dyer e Sarin (1982) hanno tuttavia implicitamente fornito un supporto teorico a favoredi questo metodo: 6 RS non solo ordina gli stati di salute secondo le preferenze individuali ma ordinaanche le differenze di preferenza tra stati di salute, X [Torrance (1986)]. Essa può quindi essere6 si veda Bleichrodt e Johannesson (1997a) per una presentazione intuitiva.6

considerata una funzione di valore misurabile, v(X), che rappresenta l’intensità delle preferenze incondizioni di certezza. Esiste inoltre una relazione teorica tra la funzione di valore misurabile, v(X),e la funzione di utilità von Neumann Morgestern, u(X), che rappresenta l’intensità delle preferenzein condizioni di incertezza. 7In conclusione, affinché i valori ottenuti tramite RS possano essere considerati una misuracardinale dell’intensità delle preferenze, una distanza tra lo stato di salute A e lo stato B doppiarispetto alla distanza tra gli stati C e D deve implicare che la differenza di desiderabilità tra A e B èpari a due volte la differenza di desiderabilità tra C e D. A tale fine, gli intervistati dovrebberoessere istruiti a dare molta rilevanza alla distanza tra stati di salute ed al confronto tra intervallipiuttosto che a i valori attribuiti a ciascun singolo stato di salute [Drummond et al. (1997)].Tuttavia, Drummond et al. (1997) evidenziano che RS è soggetto a distorsioni di misurazione.Le principali distorsioni sembrano essere la distorsione di fine scala (end of scale bias) a causa dellaquale gli intervistati evitano di adoperare le estremità della scala e la distorsione di spaziatura(spacing-out bias) a causa della quale gli individui tendono a distribuire egualmente sulla scala glistati di salute senza tenere conto delle natura degli stati di salute [Bleichrodt e Johannesson(1997a)]. Da ciò seguirebbe che i valori di preferenza risultanti dell’impiego dello RS nondeterminano una scala di intervallo.1.3. Time Trade-OffQuesto metodo sviluppato da Torrance et al. (1972) si basa sulla scelta tra riduzione del periododi sopravvivenza in cambio di un incremento della qualità della vita. Nel caso di uno stato cronicopeggiore della buona salute ma preferito alla morte, l’intervistato viene posto nella condizione discegliere se vivere in tale stato per un periodo di tempo ben definito, T, oppure in buona salute perun periodo di tempo più breve, X. La durata di X viene fatta variare fino a che l’individuo non si7 Poiché infatti l’utilità von Neumann Morgestern riflette sia l’intensità delle preferenze sia l’attitudine al rischio, Dyere Sarin propongono una misura dell’attitudine al rischio che permetta di scorporare questa componente dalla funzione divalore misurabile v(X).7

dichiara indifferente tra le due alternative. Il peso che rappresenta le preferenze per lo stato di salutecronico i è dato da h i =X/T.TTO comporta delle scelte che hanno un costo opportunità (qualità della vità in cambio disopravvivenza) e questo, secondo alcuni autori, lega tale metodo alla teoria delle scelte delconsumatore [Grenn et. al (2000)]. Drummond et al. (1997) sottolineano tuttavia che le preferenzedeterminate tramite TTO, come quelle determinate tramite RS, non sono espresse da una funzionedi utilità von Neumann Morgestern ma da una funzione di valori.Pliskin et al. (1980) hanno identificato le condizioni che devono essere rispettate affinché i pesiSG, u(X) e quelli TTO, u(X), siano uguali. Esse sono: a) la mutua indipendenza dell’utilità:considerando una funzione di utilità avente due attributi, la qualità della vita e la durata della vita,l’ordine di preferenza delle scommesse relative ad un attributo è indipendente dal valore dall’altroattributo; 8b) Il trade-off proporzionale costante: il periodo di sopravvivenza che si è disposti acedere al fine di ottenere un determinato miglioramento della qualità di vita è indipendente dallasperanza di vita attesa; c) la neutralità al rischio. 9 Se solo le prime due condizioni sono rispettate, lafunzione di utilità rispetto alla durata della vita u(T) esprime un’avversione relativa al rischioArrow-Pratt costante. In tal caso, i pesi TTO differiranno dalle utilità SG e andranno corretti perl’attitudine al rischio affinché i QALY ottenuti con SG siano uguali ai QALY ottenuti con TTO[Johannesson (1995)]. 102. LA RELAZIONE EMPIRICA TRA METODILe tre tecniche descritte nel paragrafo precedente, in quanto sistemi alternativi per misurare lepreferenze degli individui riguardo agli stati di salute, dovrebbero fornire risposte equivalenti. Ciòsarà vero se le preferenze sono stabili – come la teoria economica ortodossa assume - e se valgono8 Si vedano anche Gafni e Torrance (1984).9 Formalmente, sotto la condizione di neutralità rispetto al rischio, v(X) = u(X), QALY(TTO) = v(X)T, mentreQALY(SG) = u(X)T.10 Formalmente, QALY(SG) = v(X) 1-r T, QALY(TTO) = v(X)T, dove r è l’indice di avversione relativa al rischio diArrow-Pratt.8

le cosiddette descriptive invariance e procedure invariance, cioè l’invarianza delle preferenzeelicitate al variare rispettivamente della descrizione dello stato di salute utilizzata, e del modo in cuiè misurata la preferenza. Se le descrizioni e le procedure sono logicamente equivalenti,l’ordinamento delle preferenze che ne segue deve essere identico. Tuttavia, da Kahneman e Tversky(1981) in poi, è stato riconosciuto che la presenza di framing effects può condurre a valutazionidifferenti a seconda del metodo utilizzato.Il contesto o frame sotto il quale le preferenze relative agli stati di salute sono misurate è moltodiverso da un metodo all’altro. La tabella 1 seguente, in parte derivata da Pederzoli e Merzari(2000) e da noi estesa, sintetizza le principali differenze tra le tecniche in termini di frame.Innanzitutto, la “variabile” oggetto di risposta è diversa nei tre metodi, visto che è un numero tra 0 e100 (0 e 1) in RS, un valore di probabilità tra 0 e 1 in SG e un numero di anni tra zero e T in TTO:pertanto il cosiddetto response mode [si veda Tversky et al. (1988)] differisce in manierasostanziale. In secondo luogo, il modo di generare un ordinamento di preferenza degli stati di saluteè diverso tra RS da un lato e SG e TTO dall’altro. Infatti, mentre nel primo caso l’intervistatocompila direttamente una graduatoria tra gli stati di salute assegnando a ciascuno di essi un valoresu un termometro tarato da 0 a 100 (0 a 1), per i rimanenti due, la graduatoria tra stati di saluteemerge solo indirettamente da una serie di scelte che l’intervistato effettua tra coppie di alternative.In terzo luogo, in quanto equivalente ad una “scommessa”, SG è una scelta in condizione diincertezza, mentre TTO e RS sono scelte in condizione di certezza. In ultimo, il punto di riferimentoin cui è posto l’intervistato è la buona salute solo nel caso di RS, mentre per gli altri due metodiall’intervistato è chiesto di immaginare di trovarsi in uno stato di salute intermedio tra la buonasalute e la morte.[inserire la tabella 1]9

In effetti, numerosi studi empirici hanno potuto verificare come i valori delle utilità relative aglistati di salute sono diversi tra di loro a secondo della tecnica di valutazione utilizzata. 11 La maggiorparte degli studi sull’argomento [si vedano Dolan e Sutton (1997) per un resoconto] ha rilevato chela relazione osservata è SG > TTO > RS, da intendersi come segue: l’utilità di uno stato di saluterisulta più alta se misurata con il metodo SG, più bassa se misurata con il metodo TTO, e ancoraminore se misurata con il metodo RS. Una graduatoria differente è stata riscontrata nello studio diHornberger, Redelmaier et al. (1992) i quali invece osservano questo ordine dei valori di utilità tra itre metodi: TTO > RS > SG. Come si vede, in quest’ultimo studio, la posizione dello standardgamble risulta capovolta. Un elemento importante che differenzia questo studio dagli altri è che glistati di salute valutati non sono ipotetici, bensì quelli effettivi nei quali versavano gli intervistati.Dolan, Gudex et al. (1996), analogamente, trovano che SG < TTO per stati di salute caratterizzatida una speranza di vita breve.Tenendo conto delle differenze tra metodi in termini di frame evidenziate nella tabella 1 e delleassunzioni richieste per l’equivalenza tra metodi descritte nella sezione 1, è in effetti possibileidentificare una serie di spiegazioni delle differenze tra i valori delle utilità generate dai tre metodi:a) l’utilizzo di un reference point nella valutazione degli stati di salute. Se ilriferimento è lo statu quo avremo che lo stato di salute meno che perfetto riceverà unavalutazione più bassa se valutato con il metodo del rating scale (per il quale il reference pointè la buona salute) rispetto che con gli altri due metodi (per i quali il reference point è lo statuquo, cioè una salute meno che perfetta). Infatti, compilando la scala RS, un intervistatovaluterà uno stato di salute meno che buono come un deterioramento rispetto al referencepoint. Ciò determina RS < SG, RS < TTO. L’utilizzo di un reference point non è contemplatodalla teoria economica delle scelte tradizionale, ma è uno dei cardini della Prospect Theory diKahneman e Tversky (1979).11 Inoltre, numerosi studi, tra i quali Dolan (1996) e Dolan e Roberts (2002) dimostrano che i valori di utilità, oltre adipendere dal metodo di misurazione utilizzato, sono legati alle caratteristiche socio-demografiche e allo stato di salutedegli intervistati.10

) l’avversione al rischio: la preferenza del certo sull’incerto implica che un individuosarà meno disposto ad accettare la scommessa insita in SG, specialmente se il rischiocontemplato è quello di morte. Ciò implica che SG sarà maggiore di RS e di TTO.c) Tasso di sconto temporale positivo; TTO assume che l’utilità sia una funzione linearedella durata dello stato di salute. Se l’utilità è invece concava, come proposto da alcuni autori[ad esempio Dolan e Jones-Lee (1997) e Bleichrodt e Johannesson (1997)] i valori delle utilitàsaranno tali che TTO < SG. Infatti, TTO chiede all’intervistato di rinunciare ad anni di vitache possono anche essere lontani del tempo (es. un anno su 20 di speranza di vita), laddoveSG chiede all’intervistato di correre il rischio di morte nell’immediato.Esistono altri fattori che agiscono in senso contrario rispetto a quelli identificati nei punti a-c eche, pertanto, possono spiegare perché in alcuni casi TTO > SG, come rilevato da Hornberger et al.(1992) e Dolan, Gudex, et al.(1996).c) avversione alle perdite (loss aversion); Oltre all’utilizzo del reference point nellescelte individuali, Prospect Theory implica che la funzione di valutazione dei risultati èconcava rispetto ai guadagni e convessa rispetto alle perdite. Di conseguenza, gli individuisono avversi alle perdite, nel senso che, dati una perdita e un guadagno equivalenti, unavariazione marginale della perdita ha un impatto maggiore sulle preferenze di una variazionemarginale del guadagno. 12Bleichrodt et al. (2002) dimostrano che l’avversione alle perditeprovoca una distorsione verso l’alto nei valori di TTO, che eccederanno le corrispondentiutilità SG per speranze di vita relativamente brevi (circa 10 anni). Al crescere della speranzadi vita, il tasso di sostituibilità tra durata e qualità della vita aumenta e si osserva di nuovo cheSG > TTO.d) Il modello di Tversky et al. (1988) assume che le preferenze individuali dipendonodalla scala di valutazione utilizzata (scale compatibility bias): in particolare, gli attributi dellascelta compatibili con la scala di valutazione sono pesati di più. Sia in SG che in TTO l’utilità12 Si veda Tversky e Kahneman (1991) per una teoria formale della loss aversion.11

degli stati di salute ha due attributi: la durata e la qualità della vita. In TTO è il primo attributoa ricevere più enfasi, in quanto è quello compatibile con la scala di risposta. Bleichrodt (2002)e Bleichrodt e Pinto (2002a) dimostrano formalmente che ciò può condurre nel TTO a darmaggior peso agli anni di vita ai quali si deve rinunciare in cambio della buona salute,cosicché è possibile che TTO > SG. Supponiamo che le utilità calcolate con SG abbiamocondotto a considerare indifferenti vivere 10 anni nello stato di salute A (es. con l’emicraniatutti i giorni) e vivere per 5 anni nello stato di salute B (es. con l’emicrania una volta allasettimana). Una volta che le due combinazioni vengono valutate con TTO, il primo attributo(la durata) riceve più peso nelle preferenze e pertanto l’utilità dello stato di salute A risultamaggiore che in SG. 13Dato che le tre tecniche di valutazione forniscono valutazioni diverse, alcuni autori si sonochiesti se è almeno possibile stimare una relazione stabile tra valori RS da un lato e valori SG eTTO dall’altro. Se così fosse, si potrebbero condurre studi costo-utilità utilizzando solamente RS,più semplice da somministrare e meno costoso rispetto agli altri metodi, e calcolaresuccessivamente le utilità secondo SG e TTO. La risposta a questo quesito è ambigua: mentreTorrance (1976) presenta delle tavole di conversione valide in media, i risultati di Dolan e Sutton(1997) su dati individuali hanno evidenziato un quadro più complesso. Infatti, non solo non èemersa una funzione di mappatura dei valori tra metodi, ma significative differenze sono staterilevate nei valori ottenuti tramite varianti dei singoli metodi, il che sottolinea ulteriormentel’importanza del frame di elicitazione delle utilità. 14La differenza rilevata nelle risposte ottenute con i tre metodi e l’assenza di una correlazionestabile pongono il problema di quale metodo utilizzare nella misurazione delle utilità degli stati disalute. Come discusso nel paragrafo 1, a priori la preferenza degli economisti ricade su SG, inquanto è il metodo dalle basi teoriche più forti. Alcuni autori (tra i quali Dolan e Williams) hannoosservato che poiché molte delle assunzioni teoriche alla base di TTO e SG sono spesso violate in13 Formalmente, se SG implica che (10,A)?(5,B), allora TTO implica che (10,A)? (5,B).14 Analogamente, anche Bleichrodt e Johannesson (1997) rigettano l’ipotesi di una relazione stabile tra SG e RS.12

pratica, la scelta tra tecniche dovrebbe effettuarsi su basi empiriche: la valutazione globale di unatecnica dovrebbe cioè prendere in considerazione proprietà psicometriche come la fattibilità, lavalidità e l’affidabilità. Fattibilità indica che il metodo può essere applicato con successo, nel sensoche esso è comprensibile agli intervistati e produce un elevato tasso di risposte complete. La validitàsi riferisce alla accuratezza con cui la tecnica misura il fenomeno oggetto di studio. Essa è statamisurata come “validità convergente”, verificando cioè se le valutazioni ottenute con una tecnicasono significativamente diverse da quelle ottenute con metodiche diverse, oppure come “validitàcostruttiva”. In tal caso, si verifica se le valutazioni ottenute sono correlate con fattori con i quali cisi attende a priori che esista un legame [Dolan, Gudex, et al (1996)]. L’affidabilità riguarda invecela stabilità delle valutazioni ottenute nel tempo. 15Un criterio di scelta può essere inoltre la capacitàdella tecnica di produrre risposte coerenti. Poiché l’analisi della coerenza dei metodi ha ricevutofinora scarsa attenzione nella letteratura, su di essa ci soffermeremo più a lungo nella prossimasezione.3. La coerenza come criterio di scelta tra metodiIl fatto che un individuo assegni ad uno stato di salute valori di utilità significativamentedifferenti a secondo del metodo di valutazione utilizzato non è sufficiente a definire le sue rispostecome incoerenti. Al fine di identificare una incoerenza, è necessario che l’ordinamento dellepreferenze relative agli stati di salute violi dei principi di razionalità analoghi a quelli di non sazietàe di transitività nella teoria standard del consumatore.In letteratura, si ritrovano due principali definizioni di valutazione incoerente degli stati di salute[si veda Badia et al. (1999)]:a) incoerenza interna o logica: questo tipo di incoerenza è chiamata interna in quanto vienevalutata metodo per metodo. Dati una serie di stati di salute, la valutazione dell’individuo è15 Si veda Lalonde et al. (1999) per un confronto delle tecniche sulla base delle proprietà psicometriche relativamente alcaso di patologie cardiache.13

incoerente se uno stato di salute logicamente peggiore è valutato meglio di uno stato di salutelogicamente migliore. 16b) incoerenza di criterio: viene valutata rispetto all’ordinamento diretto degli stati di salute(ranking). Le risposte generate da una tecnica saranno incoerenti se l’ordinamento degli stati disalute derivanti dai valori di utilità differisce dal ranking diretto assegnato a quegli stessi stati disalute. Questa misura assume implicitamente che il ranking diretto sia da considerarsi esente daincoerenze, in quanto esso è semplice da comprendere ed inoltre permette agli intervistati di vederesimultaneamente tutti gli stati di salute oggetto di valutazione. 17 Bleichrodt e Pinto (2002) e Dolane Stelmeier (2003) considerano delle incoerenze analoghe a quelle di criterio e le classificano comecasi di preference reversal, una distorsione del comportamento ben nota a psicologi e teorici delledecisioni [Lichtenstein e Slovic (1971), Grether e Plott (1979)].Poiché le incoerenze individuali implicano distorsioni delle utilità degli stati di salute,l’inclusione di valori incoerenti determina dei QALY distorti che non rifletteranno le preferenze[Devlin et al. (2003)]. La strategia generalmente seguita negli studi costo-utilità è quindi quella diescludere le risposte incoerenti dal data set che conduce alla costruzione dei QALY. Ciò significache se le distorsioni non sono uniformemente distribuite tra le tecniche di valutazione, sono dapreferire quelle meno soggette al fenomeno delle risposte incoerenti, in quanto esse permettono unutilizzo più efficiente del campione di dati raccolto.Fino ad ora, non è ancora chiarito se metodi differenti di costruzione delle utilità generano tipie/o livelli diversi di incoerenza. L’esigua evidenza esistente sull’argomento indica che TTOproduce un numero di incoerenze interne più elevato di RS e del ranking diretto. Ciò puòsemplicemente essere dovuto al fatto che in TTO l’intervistato non ha davanti tutti gli stati di salute16 L’incoerenza logica può essere misurata su più dimensioni:a1) come percentuale di intervistati che in ogni metodo presentano risposte incoerenti;a2) come proporzione di coppie di stati di salute valutati incoerentemente rispetto a tutti di possibili confronti a due trastati di salute;a3) come indice della gravità dell’incoerenza rilevata, costruito sulla base della distanza tra tariffe assegnate agli stati disalute valutati incoerentemente.Il trattamento di questi indici non è tuttavia univoco in letteratura come evidenziato e discusso da Devlin et al. (2003).17 Gli stessi autori tuttavia notano come nei fatti il ranking non sia esente da incoerenze interne.14

oggetto di valutazione e può pertanto cadere facilmente in confusione. Inoltre, SG genera piùincoerenze logiche di TTO. Tali risultati non sono tuttavia comparabili e generalizzabili, in quantoderivanti da due studi diversi. 18La presenza di risposte incoerenti può anche essere il risultato di fattori diversi dalla scelta delmetodo di valutazione: Dolan e Kind (1996) distinguono tra incoerenza primaria, legata allecaratteristiche personali dell’intervistato, ed incoerenza secondaria, che invece dipende dal metododi elicitazione utilizzato e costituisce pertanto un caso di framing effect [Kahenman e Tversky(1981)]. Sia Dolan e Kind (1996) che Badia et al. (1999), ad esempio, rilevano che gli intervistatipiù anziani o con livello di istruzione più basso producono un numero di incoerenzesignificativamente più elevato. Le variabile socio-demografiche sono quindi possibili fattoriesplicativi delle risposte incoerenti. La concentrazione delle risposte incoerenti presso alcuni sottogruppidella popolazione implica che le risposte incoerenti non possono semplicemente essereescluse dall’analisi e dalla costruzione dei QUALY: l’esclusione delle risposte incoerenti comportade facto l’esclusione delle presenze di questi sottogruppi dalla valutazione della qualità di uno statodi salute [Dolan e Kind (1996)].Quali le possibili cause alla base delle incoerenze di tipo logico? L’origine può essere di tipocognitivo: ad esempio, poiché gli stati di salute hanno sempre natura multi-dimensionale (fisica,emotiva, sociale ecc.), gli intervistati potrebbero avere difficoltà ad ordinarli secondo una scala cheli riconduca ad un’unica dimensione. Inoltre, poiché è stato rilevato che le risposte incoerentidipendono anche dal formato dell’intervista [sono ad esempio minori nei questionari inviati perposta rispetto a quelli somministrati da un intervistatore, Dolan e Kind (1996)] e dalle modalità didescrizione degli stati di salute, si pone il problema di rendere i metodi di elicitazione e ledescrizioni quanto meno ambigue possibile. Per far luce sul legame tra questionari, conduzionedell’intervista e descrizione degli stati di salute da un lato e risposte coerenti dall’altro,18 Dolan, Gudex et al (1996) comparano TTO e SG mentre Badia et al. (1999) comparano TTO e RS.15

occorrerebbe tuttavia effettuare una puntuale analisi delle incoerenze osservate a livello individuale;problema che, per nostra conoscenza, non è stato finora affrontato in letteratura.Per quanto riguarda le spiegazioni delle incoerenze di criterio, per esse non valgono lemotivazioni che la letteratura fornisce per il preference reversal, generalmente riconducibili almodello della scale compatibility di Tversky et al. (1988). 19Sembrano applicabili le cosiddetteteorie del gambling effect, secondo le quali la funzione di utilità è diversa a seconda che la sceltasia in condizioni di certezza o di incertezza [si veda Bleichrodt e Pinto (2002)] e ciò può condurread una diversa graduatoria degli stati di salute nel TTO rispetto a SG. Queste teorie, tuttavia,riscuotono pochi consensi tra i teorici delle decisioni, in quanto presuppongono violazioni basilaridel principio della dominanza stocastica.Nella sezione 5 di questo lavoro cercheremo di confrontare le risposte incoerenti generate nelnostro studio dai tre metodi di valutazione delle utilità, al fine di stabilire se esiste un metodo conun più elevato tasso di risposte coerenti. Cercheremo inoltre di stabilire se le incoerenze primariesono più o meno rilevanti di quelle secondarie. Infine, attraverso un’analisi dei dati individuali,tenteremo di stabilire le possibili cause delle incoerenze e, in particolare, se esiste un legame con ilmetodo di conduzione delle interviste.4. LO STUDIOI dati da noi analizzati sono stati ottenuti da uno studio pilota svolto su un campione di 60individui, pazienti e personale sanitario del reparto di Cardiologia di due ospedali siciliani. Lostudio pilota è stato preliminare rispetto ad uno studio ACU su più vasta scala finanziato dallaRegione Sicilia sulla valutazione della qualità della vita in seguito ad un infarto del miocardio. 20 Loscopo dello studio “pilota” era quello di produrre informazioni che aiutassero nella scelta della19 Nell’esempio tipico del preference reversal, date due lotterie con uguale valore atteso, la prima con elevataprobabilità di un premio basso e la seconda con bassa probabilità di un premio più elevato, la prima verrà preferita allaseconda. Tuttavia, la seconda avrà un equivalente certo più elevato della prima.20 Lo studio è attualmente in corso di realizzazione. Il questionario completo è disponibile su richiesta, scrivendo agliautori.16

tecnica più appropriata per misurare la qualità della vita con una malattia cardiaca e sul sistema diconduzione delle interviste ottimale per ridurre le distorsioni di valutazione e le incoerenze. Ilquestionario che ha permesso di ottenere le informazioni relative alla valutazione degli stati disalute è stato somministrato nel corso di interviste “faccia a faccia” realizzate da una intervistatriceopportunamente addestrata. L’intervista media aveva la durata di circa venti minuti.Agli intervistati, è stato chiesto di valutare tre plausibili stati di salute alternativi derivantidall’infarto del miocardio. Dopo un’accurata consultazione con i clinici dei reparti di cardiologia,tali stati di salute sono stati descritti distinguendo il periodo di degenza da quello postospedaliero:21 per quest’ultimo si è fissata arbitrariamente una speranza di vita pari a 10 anni. 22 Lecaratteristiche della fase ospedaliera sono state articolate in due dimensioni, a loro volta stratificatesu tre livelli: le condizioni generali (non compromesse, compromesse o molto compromesse) e ildolore precordiale (modico, intenso o insopportabile). Le caratteristiche della fase post-ospedalierasono invece state articolate in tre distinte sfere: quella emotiva (poco ansiosi/depressi,ansiosi/depressi per parte della giornata, per tutta la giornata), quella relativa al ruolo (possibilità dilavorare con moderata cautela, con notevole cautela, lavoro impossibile) e quella della funzionalitàfisica (possibilità di svolgere le attività giornaliere con moderata cautela, con notevole cautela,impossibilità a svolgerle). L’appendice riporta la descrizione dei tre stati, denominati A, B ed E.Poiché l’obiettivo dello studio era quello di misurare la qualità della vita conseguente ad un infarto,la descrizione dello stato di salute è stata patologia-specifica. Sono stati pertanto scartati metodi didescrizione degli stati di salute non specifici come ad esempio EuroQol-5D [si veda EuroQol Group(1990)], molto diffusi per la costruzione di tariffe sociali da applicare nella fissazione delle prioritàdegli interventi. Oltre ai tre stati di salute specificamente legati alle patologie considerate, agliintervistati è stato chiesto di valutare i due stati di salute àncora, la perfetta salute e la morte.21 Per una descrizione che segua la stessa articolazione si veda Jones-Lee et al (1993).22Ciò rappresenta la prassi in molti studi costo-utilità che utilizzano il metodo TTO [si veda ad esempio Torrance(1986)]. Per esigenze di comparabilità lo stesso orizzonte temporale è stato applicato anche alle altre metodiche.17

L’obiettivo della parte centrale del questionario è di misurare le utilità degli stati di salute con letre tecniche RS, SG e TTO. Le tre tecniche sono state applicate nella maniera standard: in RS agliintervistati è stato chiesto di assegnare agli stati di salute individuati dal monitore un valoreall’interno di una scala che va da 0 a 100. In questa scala 100 corrisponde allo stato di saluteritenuto migliore, mentre 0 a quello ritenuto peggiore. I rimanenti tre stati di salute vanno ordinatiall’interno della scala in maniera che gli intervalli tra i valori riflettano le differenze di utilità tra glistati. SG e TTO sono stati applicati in maniera tale da rendere le risposte ai due tipi di quesitocomparabili per ogni intervistato. La tecnica SG impiega uno schema decisionale nel qualeall’intervistato viene chiesto di trovare un valore di indifferenza (una probabilità p) tra uno stato disalute certo corrispondente allo statu quo e una situazione aleatoria che porterà il paziente allabuona salute con probabilità p e alla morte con probabilità 1-p. Nel TTO il valore di indifferenza èinvece il periodo di tempo trascorso in buona salute che l’individuo considera equivalente a 10 annidi vita nello status quo.Il questionario è stato somministrato in due versioni: nella versione che denomineremo da qui inavanti NO-CARD, la descrizione degli stati di salute avveniva preliminarmente al loro rankingdiretto e nel rispondere alle sezioni RS, SG e TTO del questionario gli intervistati visionavanodirettamente solo lo stato di salute oggetto di valutazione, anche se la descrizione degli altri statipoteva sempre essere rivista su richiesta dell’intervistato. Nella versione che denomineremo CARD,gli stati di salute venivano presentati su cartoncini di diverso colore che aiutavano gli intervistati adistinguerli l’uno dall’altro. Inoltre, per tutte le metodiche di costruzione delle utilità, la descrizionedi tutti gli stati di salute era sempre visibile simultaneamente.Oltre alle sezioni relative alla valutazione della qualità degli stati di salute, in alcune sezioniintroduttive del questionario sono stati raccolti i dati personali e gli eventuali fattori di rischio permalattie cardiache con l’obiettivo specifico di verificare l’eventuale effetto dellafamiliarità/esperienza della malattia sulle valutazioni fornite. Inoltre, una sezione ad hoc ha mirato averificare il grado di comprensione del concetto di rischio; questa sezione è stata motivata18

dall’esigenza di escludere fenomeni di incoerenza nella valutazione degli stati di salute derivantisemplicemente da mancata comprensione del concetto di probabilità. In questa sezione, oltre allaspiegazione del concetto di rischio, l’intervistato è stato sottoposto ad un vero e proprio test dicomprensione.5. CONFRONTO TRA METODI SULLA BASE DELLE RIS POSTE INCOERENTIIl confronto che abbiamo effettuato tra i tre metodi di elicitazione delle preferenze individualirelative agli stati di salute si basa sulla capacità di ognuna delle tre tecniche di generare rispostecomplete e coerenti. L’analisi è stata condotta individuo per individuo al fine di poter identificare lepossibili spiegazioni delle eventuali incoerenze.La nostra analisi comincia dalla presentazione delle osservazioni del sottocampione NO-CARDin quanto questa versione del questionario è stata da noi considerata quella “base”. Dal punto divista della completezza, in RS solo un’osservazione su 30 è incompleta, mentre per SG 8 intervistatie per TTO 2 intervistati su 30 hanno fornito risposte incomplete. Ciò significa che questi intervistatinel caso di SG non hanno accettato la scommessa relativa ad uno o più stati di salute, mentre perTTO non hanno accettato il trade-off tra anni di vita e qualità della vita stessa. L’analisi individualedei questionari ci ha mostrato che, per SG, la mancata risposta ha presumibilmente due tipialternativi di motivazione: per 3 individui la scommessa che non è stata accettata è quella relativaagli stati di salute A e/o B, cioè quelli corrispondenti a condizioni generali non eccessivamentedeteriorate. Per questi due stati di salute, un’avversione al rischio elevata può spiegare il rifiuto diaccettare una scommessa in cui il fallimento equivale alla morte immediata. Gli altri 5 intervistatiinvece non hanno valutato nessuno degli stati di salute, il che riflette o una mancata comprensionedel metodo o un suo rifiuto su basi etiche. Questi risultati confermano quanto riscontrato adesempio da Lalonde et al. (2001) e da Lewis et al. (2001) relativamente alla valutazione dellaqualità della vita in seguito ad un infarto: un potenziale problema con il metodo SG è che un’elevataavversione rischio (innata o legata all’esperienza di una procedura chirurgica ad elevato rischio)19

genera valori dell’utilità prossimi a quelli della buona salute. La mancata risposta rappresenta uncaso estremo, in cui stati di salute meno che perfetti vengono implicitamente considerati equivalentialla buona salute. Per TTO, le due risposte incomplete riguardano la mancata valutazione degli statidi salute A e B. Analogamente a SG, questi stati di salute non vengono considerati abbastanzadeteriorati da giustificare un sacrificio in termini di anni di vita.Nell’analisi delle risposte incoerenti generate a seconda della tecnica di valutazione abbiamorilevato sia incoerenze di tipo logico, che incoerenze di criterio. La nostra attenzione si focalizzaprincipalmente sulle incoerenze logiche in quanto sono quelle che più chiaramente esprimonodistorsioni nelle preferenze. Va premesso che il ranking modale per tutti i metodi è stato il seguente:stato D (buona salute), seguito rispettivamente da B, A, E e C (morte). 23 La tabella 2 presenta ladistribuzione delle incoerenze logiche nei tre metodi, distinguendo a seconda della sequenzaincoerente; le sequenze degli stati di salute che compaiono nella prima colonna indicano lagraduatoria di preferenza dei cinque stati di salute, dal più preferito al meno preferito, il simbolo ?tra due stati di salute indica che essi sono considerati indifferenti; i valori nelle celle relative aimetodi indicano il numero di intervistati (sul totale delle risposte complete) che presentano quel tipodi sequenza incoerente. Nel riportare le incoerenze abbiamo seguito il criterio adottato da Ohinmaae Sintonen (1999) che calcolano il numero di incoerenze come numero delle coppie di stati di salutevalutati incoerentemente. Così ad esempio la sequenza DABEC contiene una sola incoerenza, cioèil fatto che lo stato A riceva un rating migliore di B, malgrado sia peggiore sotto tutte le dimensioni.Una diversa classificazione è invece utilizzata da Dolan e Kind (1996) che calcolano il numero diincoerenze come numero degli stati di salute valutati incoerentemente, cosicché ad esempio lasequenza DABEC conterrebbe due incoerenze, A e B.Come si vede dalla tabella, il metodo che dà luogo al numero minore di incoerenze interne è RS,seguito da TTO e da SG. Per SG, la maggior parte delle risposte incoerenti deriva dal fatto che lo23 Alcuni intervistati hanno considerato lo stato E peggiore della morte, dando luogo pertanto al seguente rankingD,B,A,C,E.20

stato di salute A viene preferito allo stato di salute B, che è peggiore sotto tutte le dimensioniconsiderate. Analogamente, per TTO, la maggior parte delle risposte incoerenti (9 su 13) deriva dalpreferire lo stato A allo stato B o nel considerarli equivalenti. I due stati di salute, tuttavia, non sonocosì diversi l’uno dall’altro da non poter essere confusi, e questa confusione è abbastanza probabilesia in SG che in TTO, nei quali gli intervistati non hanno continuamente a portata di vista tutti glistati di salute. Questa osservazione ci ha suggerito di modificare il questionario per verificare se lapresentazione simultanea della descrizione degli stati di salute su cartoncini di diverso coloreall’intervistato poteva ridurre la potenziale confusione e facilitare la coerenza nelle risposte. Lastessa tabella 2, nelle colonne relative al sotto-campione CARD dimostra che questo è il caso.Mentre per RS il numero di risposte incoerenti è rimasto costante e pari a 2, per TTO le incoerenzesi sono più che dimezzate riducendosi a 5. Un discorso a parte è quello relativo a SG dove leincoerenze non si sono ridotte sostanzialmente, ma sono diminuite sensibilmente le risposteincomplete: gli individui accettano il rischio di morte per migliorare uno stato di salute deterioratoche adesso non rimane “imprecisatamente” diverso dalla buona salute. L’intervistato ha sempredavanti le modifiche relative alla dimensione emotiva, di ruolo e della funzionalità fisica checomporta il vivere nello stato da valutare piuttosto che in perfetta salute. 24La nostra interpretazione è quindi che, alla base delle riduzioni delle risposte incomplete e delleincoerenze (il tasso di incoerenza si riduce dal 32% al 20% in SG e dal 46% al 17% in TTO), lamaggior parte delle quali vede A ~ B , oppure A > B, c’è il fatto che gli individui tramite CARDhanno sempre presenti gli stati di salute da valutare e vengono quindi eliminate le confusioni tra idue stati (A e B) più vicini. La spiegazione della più forte variazione del tasso di incoerenze delTTO potrebbe essere ricercata nell’ordine di somministrazione delle tecniche. L’intervistatorisponde a domande TTO nell’ultima parte del questionario, ciò implica che nella versione NOCARD è in tale fase che egli si ricorda peggio delle differenze tra gli stati di salute.24 Per ciò che riguarda le incoerenze di criterio esse sono pari a 1 per RS, a 15 per SG e a 17 per TTO nella versioneNO-CARD e 2 in RS, 6 in SG e 5 in TTO nella versione CARD.21

In letteratura, non esiste omogeneità tra i tassi di incoerenza osservati. Devlin et al. (2003), adesempio, riportano che in uno studio RS somministrato per via postale e nel quale la descrizionedegli stati di salute era quella del sistema EuroQol-5D, solo il 21% delle risposte non presentavaincoerenze, mentre il 57% presentava più di un’incoerenza. Lo studio di Dolan e Kind (1996) rilevache in media, ogni intervistato fornisce una classificazione incoerente del 13% delle coppie di statidi salute valutati con RS. Badia et al. (1999) riportano una percentuale di intervistati checommettono incoerenze logiche del 25,9% con RS e del 59,2% con TTO. Un confronto tra il tassodi incoerenze rilevato nel nostro studio e quello degli altri lavori in letteratura non è agevole inquanto, come accennato sopra, non esiste una definizione univoca di incoerenza adottate ed inoltreesistono diversi indici di incoerenza calcolabili.Dopo aver individuato le risposte incoerenti, il nodo fondamentale da chiarire è il loro eventualeeffetto sull’ordinamento degli stati di salute e sul valore delle utilità dell’inclusione di risposteincoerenti. Poiché, infatti, le incoerenze non sono necessariamente sistematiche, in media essepotrebbero essere nulle: ciò vuol dire che il ranking degli stati di salute che emerge sulla base delleutilità potrebbe non riflettere alcuna incoerenza. Per lo stesso motivo, l’utilità media di uno stato disalute ottenuta con un campione non depurato dalle risposte incomplete o incoerenti potrebbeessere non dissimileda quella calcolata escludendo le osservazioni incomplete/incoerenti. Ledistorsioni individuali, pertanto, non necessariamente sono rilevate nelle misure di tendenzacentrale.[Inserire la tabella 3]Per verificare l’effetto della presenza di incoerenze sulla valutazione della qualità degli stati disalute, nella tabella 3 abbiamo confrontato media, deviazione standard e mediana per tutti gli stati disalute, valutati con le tre tecniche, nei due sottocampioni. I valori presentati in questa tabella sonostati ottenuti utilizzando tutte le osservazioni senza escludere quelle incomplete o incoerenti. 25Poiché i pesi per gli stati di salute considerati non sono distribuiti normalmente, baseremo la nostra25 Solo per il sottocampione NO-CARD abbiamo scartato un’osservazione perché il valore dell’utilità per uno stato disalute risultava pari ad infinito.22

discussione sull’andamento delle mediane. In entrambi i sottocampioni il ranking degli stati disalute è B > A > E con tutte le tecniche, come atteso; tuttavia, anche se tutte le tecniche dannoluogo allo stesso ranking, la differenza nella distribuzione dei pesi tra RS, SG e TTO è semprestatisticamente significativa tranne che per B (NO-CARD), come dimostrano i valori del chi-quadropresentati nella tabella 4. Questo risultato, in linea con la letteratura, sottolinea la mancataequivalenza delle tre tecniche le quali, a causa delle differenze di frame evidenziate nella primaparte di questo articolo, misurano fondamentalmente aspetti diversi della qualità della vita.[Inserire la tabella 4]La tabella 3 mostra che la differenza fondamentale che emerge tra i due sottocampioniCARD/NO-CARD è che nel primo, in cui il tasso di incoerenza è sensibilmente più basso rispetto alsecondo, aumenta la differenza tra il peso minimo (quello attribuito allo stato di salute E) e quellomassimo (quello attribuito allo stato di salute B). Questo aumento dello spread è dovuto al fattoche, nella versione CARD, per tutte e tre le tecniche i valori mediani dei pesi relativi agli stati A e Baumentano o rimangono invariati, mentre per tutte le tecniche il valore mediano del peso relativoallo stato E si riduce o rimane invariato. Questo risultato è apparentemente strano: per quantoriguarda il metodo SG, in NO-CARD è sicuramente presente una distorsione verso l’alto causata dalfatto che le mancate risposte vengono codificate come 1 (ovvero equivalenti alla perfetta salute).Tuttavia, i pesi mediani degli stati di salute A e B in CARD crescono nonostante sia stata eliminatala distorsione verso l’alto dovuta alle risposte incomplete. La presentazione simultanea degli stati disalute nella versione CARD porta evidentemente ad un miglior utilizzo della scala di valori possibili(0-1), che induce gli intervistati a scegliere anche valori più estremi. Questo effetto predomina suquello determinato dalla riduzione delle mancate risposte. Nella tabella 3 gli asterischi indicano icasi in cui la differenza nella distribuzione dei pesi tra CARD e NO-CARD è statisticamentesignificativa. 26Notiamo, infine, che nel trattamento CARD la deviazione standard è sempre più26 Il test applicato è il test U non parametrico di Mann-Whitney. Il livello di significatività è il 95%.23

piccola rispetto a NO-CARD, quindi la riduzione delle risposte incoerenti comporta anche unaminore variabilità dei pesi individuali.La tabella 5 mostra che la riduzione delle risposte incomplete ed incoerenti ha anche l’effetto divariare l’ordinamento delle tecniche tra i due sottocampioni. In NO-CARD la relazione prevalentetra TTO e SG è SG = TTO o SG > TTO mentre in CARD essa è TTO > SGA > RS, che ècompatibile con quanto rilevato in letteratura a proposito della valutazione del proprio stato disalute [Hornberger et al. (1982)] che a proposito di stati di salute dalla durata breve [Dolan eKind(1996) e Bleichrodt e Pinto (2002)]. La spiegazione di questa variazione è da ricondursiall’aumento dello spread tra valori massimi e minimi, di cui si è parlato sopra.[Inserire la tabella 5]Tramite la tabella 3 abbiamo effettuato un test “indiretto” dell’effetto delle risposte incoerentisui pesi relativi alla qualità della vita, confrontando i pesi ottenuti da un campione con un elevatotasso di incoerenza con i pesi derivanti da un campione con un basso tasso; con la tabella 6effettuiamo un test diretto mostrando, per ognuno dei due sottocampioni, come si modificanomedia, mediana e deviazione standard una volta eliminate dai dati le osservazioni affette daincompletezza o da incoerenza. Notiamo che, rispetto a NO-CARD, in CARD la deviazionestandard è minore e che la valutazione media e mediana di A e B è sempre più alta. Poiché questieffetti erano stati rilevati anche nella tabella 3, essi evidentemente prescindono dalle incoerenze esono invece legati alle caratteristiche della versione CARD del questionario. Confrontando infattiquesta tabella con la tabella 3 si vede che in NO-CARD la media senza incoerenze è più bassa(anche per la mediana l’effetto c’è ma meno pronunciato); quindi l’effetto delle incoerenze (esoprattutto delle osservazioni incomplete codificate come 1) era di imprimere una distorsione versol’alto. Per CARD non si nota invece nessun effetto preciso, probabilmente perché le incoerenzeerano molte di meno e tutti i dati erano completi. Nella tabella l’asterisco indica che la distribuzionedelle risposte non affette da incoerenza è significativamente diversa da quella delle risposteincomplete o incoerenti. Come si vede, in NO-CARD, relativamente agli stati di salute A ed E24

valutati con al tecnica SG, la differenza tra osservazioni affette o meno da incoerenza èstatisticamente significativa, proprio perché è con questa tecnica che la distorsione verso l’altocomportata dalle osservazioni incoerenti è più forte[Inserire la tabella 6]L’analisi precedente ha mostrato che la presenza di molte risposte incoerenti (come avviene nelsottocampione NO-CARD) ha l’effetto di imprimere una distorsione verso l’alto ai pesi medi emediani che sono quelli che vengono generalmente utilizzati per costruire le tariffe da applicare nelpriority setting in sanità. Quindi, i dati del nostro esperimento su piccola scala suggerisconol’opportunità di scartare dal data set le osservazioni mancanti. Uno dei problemi connessi a questaprocedura, come evidenziato da Dolan e Kind (1996) è che se le incoerenze sono di tipo “primario”,ossia legate a caratteristiche specifiche degli intervistati, come età, scolarizzazione o altro,l’esclusione delle osservazioni incoerenti può comportare ignorare le preferenze di specificisottogruppi della popolazione dalle scelte di fissazione delle priorità in sanità.Al fine di verificare la presenza di incoerenze di tipo primario nei dati da noi analizzati, latabella 7 presenta i risultati del test del chi-quadro di Pearson relativamente all’effetto delle variabilisesso, titolo di studio, esperienza precedente della malattia, familiarità con la malattia, età superioreai sessantacinque anni sulla proporzione di incoerenze riscontrate. Tutti i test danno valori nonstatisticamente significativi. Pertanto, si può escludere che le variabili identificate abbiano qualcheeffetto nel determinare incoerenze rilevate. Per effettuare questo test i due sottocampioni sono staticonsiderati congiuntamente assumendo che essi fossero omogenei riguardo alle caratteristichedell’intervistato. 27 [Inserire la tabella 7]6. IMPLICAZIONI E CONCLUSIONI27 Ciò potrebbe non essere vero riguardo alle variabili titolo di studio a causa della presenza di otto medici nel primosottocampione. Il test non è stato effettuato su RS perché sono presenti solo 2 incoerenze per sottocampione.25

In questo lavoro abbiamo analizzato alcune delle spiegazioni teoriche alla base della mancataequivalenza tra le tre principali tecnichedi costruzione delle utilità individuali degli stati di salute.Poiché l’assenza dell’equivalenza comporta l’individuazione della tecnica “migliore”, abbiamoconfrontato RS, SG e TTO sulla base di un criterio eminentemente empirico: la capacità dellatecnica di determinare risposte che siano logicamente coerenti.La nostra analisi indica che, in generale, l’effetto delle incoerenze è di imprimere unadistorsione ai valori di utilità osservati. Ciò suggerisce l’opportunità [vedi anche Devlin et al.(2003) e Badia et al. (1999)] di escludere le osservazioni incoerenti dal campione che deve essereutilizzato per stimare le utilità degli stati di salute. Le incoerenze osservate sono di tipo“secondario”, ovvero legate al frame della tecnica di valutazione utilizzata e non di tipo “primario”,cioè legate alle caratteristiche dell’intervistato. Questo risultato è confortante perché indica che larimozione delle osservazioni incoerenti dal campione non implica l’esclusione delle preferenze diparticolari sottogruppi sociali dalla determinazione delle priorità in sanità. Questo risultato tuttaviacontrasta con quanto rilevato da Dolan e Kind (1996) relativamente al Regno Unito e da Badia et al.(1999) relativamente alla Spagna. In questi due studi, le risposte incoerenti sono positivamentecorrelate con l’età ed inversamente correlate con il titolo di studio. Essendo i nostri risultati, pernostra conoscenza, i primi relativi all’Italia, la loro robustezza andrà verificata utilizzando uncampione più grande e rappresentativo della popolazione italiana.Per quanto concerne il confronto tra le tre tecniche, in accordo con la letteratura esistente, RSrisulta essere il metodo con la migliore performance in termini di completezza e coerenza. Pertanto,esso andrebbe preferito anche alla luce della semplicità di somministrazione; come già discusso,esso è però avversato dagli economisti in quanto non è preference-based, cioè non è costruito sullascelta tra alternative, bensì su una semplice graduatoria degli stati di salute. I due metodi basati suun trade-off, tuttavia, sono risultati insoddisfacenti dal punto di vista della completezza dellerisposte (principalmente SG) e dal punto di vista della coerenza. Su quest’ultimo punto, tuttavia,occorre rilevare che molto probabilmente la maggior parte delle incoerenze osservate potrebbero26

essere eliminate da una più attenta conduzione delle interviste, che utilizzi supporti visivi cheagevolino la comprensione ed il confronto tra gli stati di salute valutati. Evidenza empirica a questoproposito è fornita dalla versione CARD del questionario, nel quale gli stati di salute erano sempredisponibili per essere visionati dall’intervistato simultaneamente ed inoltre la loro specificitàappariva più chiara per il fatto che essi erano stampati su cartoncini di diverso colore. Nelsottocampione CARD le risposte incomplete in SG si sono fortemente ridotte e così pure leincoerenze in TTO. Questo risultato ci induce a credere che ulteriori affinamenti del formato delquestionario potrebbero ridurre ulteriormente il tasso di incoerenza rilevato.Come parte della nostra agenda di ricerca futura ci proponiamo di estendere lo studio degli effettidelle risposte incoerenti sulla costruzione delle tariffe sociali in sanità. A tale fine, il nostroobiettivo è di investigare la sensibilità delle risposte incoerenti e dei valori delle utilità rispetto avariazioni del metodo di elicitazione, utilizzando descrizioni degli stati di salute non patologiaspecifici,come ad esempio Euro-QoL 5D, e un numero di stati di salute superiore a quelloconsiderato nel presente studio.RingraziamentiRingraziamo la dott.ssa Maria Gabriella Cannone per la collaborazione prestata nella costruzionedel questionario pilota e nella raccolta dei dati e il dott. Ernesto Mossutti per la collaborazione nellacostruzione degli stati di salute oggetto dello studio.Questo saggio è frutto del lavoro congiunto dei due autori. I loro rispettivi contributi sono daconsiderarsi equivalenti.Riferimenti bibliograficiArrow K.J. (1963) –– Social Choice and Individual Values, Yale University Press, New Haven, CT.Badia X., Roset M. e Herdman M. (1999) – “Inconsistent responses in three preference-elicitationmethods for health states”, Social Science and Medicine, 49, 943-950.Ben-Zion U. e Gafni A. (1983) – “Evaluation of Public Investment in Health Care: Is RiskIrrelevant?”, Journal of Health Economics, 2, 161-165.Bleichrodt, H. & M. Johannesson. (1997) – "The Validity of QALYs: An Experimental Test ofConstant Proportional Trade-off and Utility Independence", Medical Decision Making 17, 21-32.Bleichrodt, H. & M. Johannesson. (1997a) – "An Experimental Test of a Theoretical Foundation forRating Scale Valuations." Medical Decision Making 17, 208-216.27

Bleichrodt, H. (2002) – "A New Explanation for the Difference Between SG and TTO Utilities."Health Economics, 11, 447-456.Bleichrodt H., Pinto J.L. (2002) “A New Type of Preference Reversal”, mimeo, ErasmusUniversity.Bleichrodt H., Pinto J.L. (2002a) – “Loss aversion and scale compatibility in two-attribute tradeoffs”,Journal of Mathematical Psychology, 46, 315-337.Bleichrodt H., Pinto J.L., Abellan-Perpinan J.M. (2002) – “A Consistency Test of the Time Tradeoff”,mimeo, Erasmus University.Boyle M. H., Torrance G. W e Sinclair J.C. (1983) – “Economic evaluation of neonatal intensivecare of very-low-birth-weight infants”, New England Journal of Medicine, 308, 1330-1337.Bush, J.W., Chen, M. e Patrick, D.L. (1973) – “Cost-effectiveness Using a Health Status Index:Analysis of the New York State PKU Screening Program”, Health Status Indexes a cura di Berg.R., Chicago: Hospital Research and Educational Trust.Culyer A.J. e Wagstaff A. (1993) – “QALYs versus HYEs”, Journal of Health Economics, 11, 311-323.Devlin N.J., Hansen P., Kind P. e A.Williams (2003) – “Logical inconsistencies in surveyrespondents’ health state valuations – a methodological challenge for estimating social tariffs”,Health Economics, 12, 529-544.Dolan (1996) – “The effect of experience of illness on health state valuations”, Journal of ClinicalEpidemiology, 49, 551-564.Dolan P., Kind P. (1996) – “Inconsistency and health state valuations”; Social Science andMedicine, 42, 609-615.Dolan P., Gudex, C., Kind, P., Williams A. (1996) – “The time trade-off method: results from aGeneral Population Study”, Health Economics, 5, 141-154.Dolan P., Jones-Lee M. (1997) –“The time trade-off : a note on the effect of lifetime reallocation ofconsumption and discounting”, Journal of Health Economics, 16, 731-739.Dolan P., Roberts J. (2002) – “To what extent can we explain time trade-off values from otherinformation about respondents?”, Social Science and Medicine, 54, 919-929.Dolan P., Sutton M. (1997) – “Mapping visual analogue scale health state onto standard gambleand time trade-off values”, Social Science and Medicine, 44, 1519-1530.Drummond M.F., Stoddart, Torrance G.W. (1987) –Methods for Economic Evaluation of HealthCare Programmes, Oxford University Press, Oxford.Drummond M.F., Heyse J., Cooke J., McGuire A. (1993) – “A selection of end-points in economicevaluations of coronary-heart disease interventions”, Medical Decision Making, 13, 184-90.Drummond M.F., O’Brien B., Stoddart G.L. e t Torrance G.W. (1997) – Methods for EconomicEvaluation of Health Care Programmes, Oxford University Press, Oxford.Dyer J.S. e Sarin R.K. (1982) – “Relative risk aversion”, Management Science, 28 (8), 875-886.Furlong W., Feeny D., Torrance G., Barr R., Horsman J. (1990) – Guide to design and developmentof health state utility instrumentation, Hamilton, Canada, McMaster University.Gafni A. (1994) – “The standard gamble method: what is being measured and how it is interpreted”,Health Service Review, 29, 207-224.Gafni A. e Birch S. (1993) –”Economics, health and health economics: HYEs versus QALYs”,Journal of Health Economics, 11, 325-339.28

Gafni A., Birch S. (1995) – “Preference for outcomes in economic evaluation: an economicapproach to solving economic problems“, Social Science and Medicine, 40, 767-776.Gafni A. and Torrance G.W. (1984) – “Risk Attitude and Time-preference in Health”, ManagementScience, 30, 440-451.Grenn C., Brazier J. e Deverill M. (2000) – “Valuing health-related qualità of life: a review ofhealth state valueation techniques”, PharmacoEconomics, 17(2), 151-165.Grether D. e Plott C. (1979) – “Economic theory of choice and the Preference Reversalphenomenon, American Economic Review, 69.Groot W. (2000) “Adaptation and scale of reference bias in self-assessments of quality of life”,Journal of Health Economics, 19, 403-420.Hornberger J.C., Redelmeier D.A. and Peterson J. (1992) –“Variability among methods to assesspatients’ well being and consequent effect on a cost-effectiveness analysis“, Journal of ClinicalEpidemiology, 45, 505-512.Johannesson M., Plinskin J. e Weinstein M. (1993) – “Are healthy-years equivalents animprovement over quality-adjusted life years?”, Medical Decision Making, 13(4), 281-286.Jones-Lee M., Loomes G., O’Reilly D., e Philips P. (1993) –The value of preventing non fatal roadinjuries, Transport Research Laboratory, Department of Transport, UK.Kahneman D. e A. Tversky (1979) – “Prospect Theory: an analysis of decision under risk”,Econometrica, 47, 263-291.Kahneman D. e A. Tversky (1981) –“ The framing of decisions and the psychology of choice“,Science, 211, 453-460Klarman, H.E., Francis, J.O.S., Rosental, G., (1968) – “Cost-Effectiveness Analysis Applied to theTreatment of Chronic Renal Disease”, Medical Care, 6(1), 48-54.Lalonde L., Clarke A.E. et al. (1999) – “Comparing the Psychometric properties of preferencebasedand non-preference-based health-related quality of life in coronary heart disease”, QualityLife Research, 8, 399-409.Lalonde L., Clarke A.E. et al. (2001) – “Health related quality of life with coronary heart diseaseprevention and treatment”, Journal of Clinical Epidemiology, 54, 1011-1018.Lewis E.F., Johnson P.A. et al. (2001) – “Preference for Quality of Life or Survival Expressed byPatients with Heart Failure”, Journal of Heart and Lung Transplantation, 20,1016-1024.Lichtenstein S. e Slovic P. (1971) – “Reversals of preference between bids and choices in gamblingdecisions“, Journal of Experimental Psychology, 89, 46-55.Loomes G. e McKenzie L. (1989) – “The use of QALYs in health care decision making”, SocialScience and Medicine, 28, 299-308.Mehrez A. e Gafni A. (1989) – “Quality adjusted life years, utility theory, and healthy-yearsequivalents”, Medical Decision Making, 9, 142-149.Mehrez A. e Gafni A. (1991) – “The healthy-years equivalents: how to measure them using thestandard method approach”, Medical Decision Making, 11, 140-146.Mehrez A. e Gafni A. (1993) – “The healthy-years equivalents versus quality-adjusted life years: inpursuit of progress”, Medical Decision Making, 13, 287-292.29

Ohinmaa A. e Sintonen H. (1999) – “Inconsistencies and modeling of the Finnish Euro-Qol (EQ-5D) preference values”, in EuroQol Plenary Meeting 1998 Discussion Papers, a cura di Greiner W.,J.M. Graf vd Schulenburg e Piercy J.Pederzoli, V. e Merzari R.(2000) – La valutazione economica in Sanità, CEDAM, Padova.Pliskin J.S., Shepard D.S. e Weinstein M.C. (1980) – “Utility functions for life years and healthstatus”, Operation Research, 28, 206-224.Richardson J. (1994) “Cost Utility analysis: what should be measured?”, Social Science andMedicine, 39, 7-20.Torrance G.W. (1976) – “Social Preferences for Health States: An Empirical Evaluation of ThreeMeasurement Techniques”, Socio-Economic Planning Sciences, 10(3), 129-136.Torrance G.W. (1986) – “Measurement of health state utilities for economic appraisal: a review”,Journal of Health Economics, 5, 1-30.Torrance, G.B., Furlong, W.J. e Feeny, D.H., (1995) – “Multi-attribute preference function: healthutilities index” PharmacoEconomics, 9, 503-20.Tversky A., Sattah S. e Slovic P. (1988) – “Contingent weighting in judgement and choice”,Psychological Review, 95, 371-384.Tversky A., Kaheneman D. (1991) –“Loss aversion in riskless choice: a reference dependentmodel“, Quarterly Journal of Economics, 106, 1039-1061.Weinstein M.C. e Stason W.B. (1976) – Hypertension: a Policy Perspective, Cambridge, MA,Harvard University Press.Weinstein M.C., Stason W.B. (1985) – “Cost effectiveness of interventions to prevent or treatcoronary heart disease”, Ann. Rev. Public Health, 6, 41-63.Williams A. (1985) – “Economics of coronary artery bypass grafting”, British Medical Journal,291, 326-329.Wolfson A.D., Sinclair A.J., Bombardier C. e McGeer A. (1982) – “Preference measurements forfunctional status in stroke patients: inter-rater and inter-technique comparisons” in Value and LongTerm Care curato da Kane R. e Kane R., pp.191-214. DC. Health Lexington.30

Appendice - Descrizione degli stati di saluteAIN OSPEDALE,- 1-2 settimane di degenza caratterizzata da:- all’ingresso dolore al petto intenso (dolore precordiale intenso), che diminuisce con laterapia;- condizioni generali compromesse;DOPO L'OSPEDALE, speranza di vita di 10 anni durante la quale:- ci si sente ansiosi e depressi per buona parte della giornata;- si ha possibilità di lavorare con notevole cautela;- si ha possibilità di svolgere attività giornaliere con notevole cautela.BIN OSPEDALE,- 1-2 settimane di degenza caratterizzata da:- all’ingresso una sensazione di fastidio al petto (dolore precordiale modico), che diminuiscecon la terapia;- condizioni generali non compromesse;DOPO L'OSPEDALE, speranza di vita di 10 anni durante la quale:- ci si sente poco ansiosi e di umore abbastanza buono per buona parte della giornata;- si ha possibilità di lavorare con moderata cautela;- si ha possibilità di svolgere attività giornaliere con moderata cautela.EIN OSPEDALE,lungo periodo di degenza caratterizzato da:- all’ingresso dolore al petto insopportabile (dolore precordiale insopportabile), chediminuisce con la terapia;- condizioni generali molto compromesse;DOPO L'OSPEDALE, speranza di vita di 10 anni durante la quale:- ci si sente ansiosi e depressi per tutta la giornata;- si ha impossibilità di lavorare e bisogno di aiuto da parte di terzi;- si hanno restrizioni permanenti delle attività giornaliere.31

Tabella 1 – Differenze tra metodi di valutazione delle preferenzeDIFFERENZE TRAMETODI DI VALUTAZIONEMETODIStandard Gamble Time trade-off Rating ScaleResponse mode probabilità anni di vita numero 0-100Tipologia di risposta scelta tra due alternative scelta tra due alternative graduatoriaCondizione di scelta incertezza certezza certezzaReference point statu quo statu quo buona salute32

Tabella 2 – Numero di risposte affette da incoerenza logicaSequenzaincoerenteNo-CardRS SG TTOCardNo-CardCardNo-CardCard(29)*(30)(22)(30)(28)(30)DABCE (1)** 0 0 0 0 2 0DABEC (1) 1 0 5 2 2 0DA?BEC (1) 1 0 1 2 3 4DA?BCE (1) 0 0 0 0 2 0D?BAEC (1) 0 0 0 0 1 1DBEAC (1) 0 2 0 1 0 0DBE?AC (1) 0 0 0 1 0 0DEABC (2) 0 0 1 0 1 0DAB?EC (2) 0 0 0 0 2 0Totale risposte incoerenti 2 2 7 6 13 5Tasso di incoerenza 0,07 0,07 0,32 0,2 0,46 0,17* il numero in parentesi si riferisce alle risposte complete**il numero in parentesi si riferisce al numero di coppie di stati di salute valutati incoerentemente33

Tabella 3 - Variabili descrittive dei pesi RS, SG e TTO (tutte le osservazioni) aMedia Deviazione standard MedianaNO-CARD CARD NO-CARD CARD NO-CARD CARDRS 0,55 0,58 0,11 0,08 0,50 0,60Stato di saluteSG 0,71 0,69 0,18 0,11 0,70 0,72A TTO* 0,64 0,74 0,22 0,11 0,70 0,77RS* 0,79 0,82 0,77 0,07 0,80 0,80Stato di saluteSG 0,80 0,8 0,14 0,12 0,80 0,85B TTO* 0,72 0,88 0,15 0,04 0,70 0,90RS 0,19 0,25 0,23 0,13 0,30 0,23Stato di saluteSG 0,35 0,31 0,53 0,13 0,40 0,32E TTO 0,17 b 0,38 1,8 0,20 0,40 0,40a le risposte mancanti sono state codificate come 1b media corretta per i valori estremi (5%)* la differenza nella distribuzione tra CARD e NO-CARD è statisticamente significativa al 95%(test U di Mann-Whitney)34

Tabella 4 – Analisi della varianza non parametrica di Friedman sui pesiottenuti con RS, SG e TTOStato di Salute Chi Quadro Livello di SignificativitàA (NO CARD)A (CARD)B (NO CARD)B (CARD)E (NO CARD)E (CARD)14,97031,1134,1519,07320,0207,3860,0100,0000,1260,0110,0000,02535

Tabella 5 - Graduatoria delle tre tecnicheStato di saluteGraduatoria (basata sulla mediana)A NO-CARD SG = TTO > RSCARDTTO > SGA > RSB NO-CARD SG = RS > TTOCARDTTO > SGA > RSE NO-CARD SG = TTO > RSCARDTTO > SGA > RS36

Tabella 6 - Variabili descrittive dei pesi RS, SG e TTO (dati depurati dalle osservazioniincomplete o incoerenti) a Media Deviazione standard MedianaNO-CARD CARD NO-CARD CARD NO-CARD CARDRS 0,53 0,59 0,11 0,08 0,50 0,60Stato di saluteSG 0,61* b 0,69 0,11 0,09 0,60 0,72A TTO 0,55 0,71 0,18 0,10 0,60* 0,70*RS 0,8 0,83 0,06 0,07 0,8 0,83Stato di saluteSG 0,81 0,83* 0,08 0,06 0,8 0,85B TTO 0,72 0,87 0,14 0,04 0,8 0,90RS 0,18 0,23 0,24 0,12 0,25 0,20Stato di saluteSG 0,11* 0,31 0,56 0,12 0,30 0,32E TTO 0,13 0,33 0,7 0,18 0,4 0,30a Numero di osservazioniNO CARD: RS = 28, SG = 15, TTO = 15;CARD: RS = 28, SG = 24, TTO = 25.b L’asterisco indica che per la tecnica e lo stato di salute indicati la differenza nella distribuzione dei pesi traosservazioni prive di incoerenze e osservazioni affette da incoerenza è statisticamente significativa al 5%.37

Tabella 7 – Effetti delle caratteristiche dei rispondenti sul numero di risposte incoerenti(chi-quadro di Pearson, livello di significatività in parentesi)SessoCaratteristicadell’intervistatoEtà > 65Titolo di studioEsperienza malattiaFamiliarità malattiaSG0,041(0,839)0,388(0,533)0,314(0,957)0,361(0,548)2,51(0,113)TTO0,963(0,326)0,834(0,361)4,150(0,246)0,848(0,357)1,663(0,197)38

ALTRE TABELLE (DA INVIARE EVENTUALMENTE AI REFEREE)Tabella a – Confronto di omogeneità tra i due sottocampioni (Mann –Whitney U-test)Stato di Salute Tecnica di MW U-testLivello divalutazioneSignificativitàABERSSGTTORSSGTTORSSGTTO369418321314440135442428421,2190,6340,0540,0370,8870,000,0950,1030,78339

Tabella b – Confronto di omogeneità tra i due sottocampioni (t- test per l’uguaglianza dellemedie per campioni indipendenti)Stato disalutetSignificatività(a due code)RS(A) -1,483 ,144RS(B) -2,261 ,028RS(E) -1,372 ,175SG(A) 1,047 ,300SG(B) ,116 ,908SG(E) ,316 ,753TTO(A) -2,427 ,018TTO(B) -4,912 ,000TTO(E) 2,079 ,04240

La valutazione degli stati di salute sulla base delle preferenze ...

Create successful ePaper yourself

Delete template?

Save as template?