11.05.2013 Views

Uma escolha popular para relacionar a função hazard e um ...

Uma escolha popular para relacionar a função hazard e um ...

Uma escolha popular para relacionar a função hazard e um ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

MODELO DE RISCO PROPORCIONAL DE COX<br />

<strong>Uma</strong> <strong>escolha</strong> <strong>popular</strong> <strong>para</strong> <strong>relacionar</strong> a <strong>função</strong> <strong>hazard</strong> e <strong>um</strong> determinado número<br />

de covariáveis consiste no modelo de Cox.<br />

A <strong>função</strong> de risco h (t) (<strong>hazard</strong> function) também chamada taxa de risco (de falha) ou força<br />

de mortalidade, representa a taxa instantânea de morte de <strong>um</strong> indivíduo no intervalo de<br />

tempo t a t+1, sabendo que sobreviveu até ao momento t<br />

Não faz pressupostos acerca da distribuição da sobrevivência<br />

Ass<strong>um</strong>e que a taxa de risco (<strong>hazard</strong> rate) é <strong>função</strong> das variáveis independentes<br />

(covariáveis)<br />

h (t,X) = h 0 (t) exp {β 1 X 1 + …….+ β p X p } ou<br />

p<br />

∑ β<br />

i<br />

=<br />

Χ<br />

i<br />

i 1<br />

h (t,X)= h0 (t) e podemos linearizar este modelo dividindo os membros da equação<br />

por h0 (t) e depois aplicando logaritmos naturais nos dois lados


h 0 (t)= risco basal, <strong>hazard</strong> <strong>para</strong> o respectivo indivíduo quando todas as variáveis<br />

independentes são iguais a zero<br />

β 1 …..,β p = parâmetros do modelo<br />

X 1 ……, X p = variáveis explicativas (variáveis de exposição, variáveis confundidoras,<br />

variáveis de interacção)<br />

O modelo de Cox é essencialmente <strong>um</strong>a regressão linear múltipla do logaritmo do <strong>hazard</strong><br />

nas variáveis x i com <strong>um</strong> <strong>hazard</strong> de base que é o termo de intercepção que varia com o<br />

tempo<br />

Pressuposto do modelo : A relação entre hi (t) e hj (t) é constante ao longo do tempo .<br />

Método de estimação : Método de Máxima Verosimilhança Parcial (maxim<strong>um</strong> likelihood-<br />

ML estimation) os parâmetros são calculados ao maximizar a <strong>função</strong> likelihood,<br />

designada por L


Porque o modelo de Cox é muito <strong>popular</strong>?<br />

Podem-se obter estimativas dos coeficientes de regressão, <strong>hazard</strong><br />

ratios e curvas ajustadas<br />

É <strong>um</strong> modelo robusto, os resultados obtidos são muito próximos dos<br />

obtidos através de modelos <strong>para</strong>métricos<br />

É possível estimar os coeficientes na parte exponencial do modelo, e<br />

assim avaliar o efeito das variáveis explicativas. A medida do efeito<br />

<strong>hazard</strong> ratio, é calculada sem ter de se estimar o risco basal da <strong>função</strong>.<br />

De notar que a <strong>função</strong> <strong>hazard</strong> (t,X) e as curvas de sobrevivência<br />

correspondentes S(t,X) podem ser estimadas apesar de não ser<br />

especificada a <strong>função</strong> de risco basal (baseline <strong>hazard</strong> function)<br />

É preferido ao modelo logístico quando o tempo de sobrevivência é<br />

conhecido e há censurados


Desvantagens do modelo de Cox:<br />

• Proporciona estimativas constantes <strong>para</strong> o efeito das covariáveis ao longo de<br />

todo o estudo.<br />

• Dificuldade de interpretação de covariáveis dependentes no tempo.


Exemplo 1: estudo de <strong>um</strong> coorte fixo com <strong>um</strong> follow-up de 13 anos de 170<br />

homens de raça branca com 60 ou mais anos de idade em que o objectivo do<br />

estudo é determinar se o Índice de Apoio Social (SNI: Social Network Index)<br />

classificada de zero - sem apoio a 5 com - excelente apoio a<strong>um</strong>enta a<br />

sobrevivência<br />

→ Variáveis explicativas (explanatory variables):<br />

SNI→variável de exposição<br />

→Variáveis confundidoras (confounding variables)<br />

Idade (var. contínua)<br />

Tensão arterial (var. contínua)<br />

Doença crónica ( var. categórica Não=0; Sim=1)<br />

Índice de massa corporal (var. contínua)


Exemplo de <strong>um</strong>a variável de confundimento: idade<br />

Variável de exposição (casamento)<br />

Variável de confusão (idade)<br />

Variável Resultado (cancro)<br />

Conclusão errada : o casamento provoca cancro – os dois grupos<br />

estavam desajustados quanto à idade, os casados eram mais<br />

velhos<br />

As variáveis de confundimento (idade) estão sempre associadas tanto<br />

às variáveis de exposição (estado civil) como às variáveis resultado


Exemplo de interacção de <strong>um</strong>a variável interferente modificadora de efeito<br />

Variável de exposição (idade) Variável Resultado (Cancro)<br />

Variável de interacção (tabagismo)<br />

O hábito de f<strong>um</strong>ar também modifica a possibilidade de ter cancro, mesmo que os<br />

dois grupos (f<strong>um</strong>adores e não f<strong>um</strong>adores) estejam ajustados quanto á idade<br />

Existem duas variáveis tabaco e idade que têm efeito próprios e<br />

independentes na variável resultado


Exemplo 2<br />

Foi realizado <strong>um</strong> estudo em doentes com leucemia em remissão seguidos ao<br />

longo de várias semanas <strong>para</strong> ver em quanto tempo permanecem em remissão.<br />

Os dados envolvem dois grupos de doentes com leucemia, com 21 doentes em<br />

cada grupo. O grupo 1 é o grupo tratamento e o grupo 2 o grupo placebo. Os<br />

dados têm também os valores dos logaritmos do número de leucócitos a<br />

variável log WBC, que é <strong>um</strong> factor de prognóstico muito conhecido indicador<br />

da sobrevivência dos doentes<br />

Para este exemplo a questão principal de interesse refere-se à com<strong>para</strong>ção da<br />

experiência da sobrevivência dos dois grupos, ajustando <strong>para</strong> a possível<br />

variável de confusão e/ou efeitos de interacção dos log do nº de leucócitos


Temos assim <strong>um</strong> problema envolvendo duas variáveis explicativas como<br />

preditivas do tempo de sobrevivência T, em que T refere-se ao nº de semanas até<br />

à recidiva da doença.<br />

Designamos as variáveis explicativas:<br />

X1 (<strong>para</strong> o grupo status Rx: tratamento e placebo) e X2 (<strong>para</strong> log WBC: nº de<br />

leucócitos).<br />

A variável X1 é a variável de exposição de interesse.<br />

A variável X2 é <strong>um</strong>a variável que estamos a incluir como <strong>um</strong>a possível variável de<br />

confusão ou de efeito modificador.<br />

De notar se queremos avaliar o possível efeito de interacção do log WBC no<br />

grupo, temos de considerar <strong>um</strong>a terceira variável que é o produto de X1 e X2


1,97<br />

1,97<br />

1,97<br />

1,97<br />

23<br />

23<br />

23<br />

23<br />

1,45<br />

1,45<br />

1,45<br />

1,45<br />

35+<br />

35+<br />

35+<br />

35+<br />

2,73<br />

2,73<br />

2,73<br />

2,73<br />

22<br />

22<br />

22<br />

22<br />

1,47<br />

1,47<br />

1,47<br />

1,47<br />

34+<br />

34+<br />

34+<br />

34+<br />

2,95<br />

2,95<br />

2,95<br />

2,95<br />

17<br />

17<br />

17<br />

17<br />

2,53<br />

2,53<br />

2,53<br />

2,53<br />

32+<br />

32+<br />

32+<br />

32+<br />

2,30<br />

2,30<br />

2,30<br />

2,30<br />

15<br />

15<br />

15<br />

15<br />

2,20<br />

2,20<br />

2,20<br />

2,20<br />

32+<br />

32+<br />

32+<br />

32+<br />

3,06<br />

3,06<br />

3,06<br />

3,06<br />

12<br />

12<br />

12<br />

12<br />

1,78<br />

1,78<br />

1,78<br />

1,78<br />

25+<br />

25+<br />

25+<br />

25+<br />

1,50<br />

1,50<br />

1,50<br />

1,50<br />

12<br />

12<br />

12<br />

12<br />

2,01<br />

2,01<br />

2,01<br />

2,01<br />

20+<br />

20+<br />

20+<br />

20+<br />

2,12<br />

2,12<br />

2,12<br />

2,12<br />

11<br />

11<br />

11<br />

11<br />

2,05<br />

2,05<br />

2,05<br />

2,05<br />

19+<br />

19+<br />

19+<br />

19+<br />

3,49<br />

3,49<br />

3,49<br />

3,49<br />

11<br />

11<br />

11<br />

11<br />

2,16<br />

2,16<br />

2,16<br />

2,16<br />

17+<br />

17+<br />

17+<br />

17+<br />

3,26<br />

3,26<br />

3,26<br />

3,26<br />

8<br />

2,60<br />

2,60<br />

2,60<br />

2,60<br />

11+<br />

11+<br />

11+<br />

11+<br />

2,32<br />

2,32<br />

2,32<br />

2,32<br />

8<br />

2,70<br />

2,70<br />

2,70<br />

2,70<br />

10+<br />

10+<br />

10+<br />

10+<br />

3,05<br />

3,05<br />

3,05<br />

3,05<br />

8<br />

2,80<br />

2,80<br />

2,80<br />

2,80<br />

9+<br />

9+<br />

9+<br />

9+<br />

3,52<br />

3,52<br />

3,52<br />

3,52<br />

8<br />

3,20<br />

3,20<br />

3,20<br />

3,20<br />

6+<br />

6+<br />

6+<br />

6+<br />

3,97<br />

3,97<br />

3,97<br />

3,97<br />

5<br />

2,57<br />

2,57<br />

2,57<br />

2,57<br />

23<br />

23<br />

23<br />

23<br />

3,49<br />

3,49<br />

3,49<br />

3,49<br />

5<br />

2,32<br />

2,32<br />

2,32<br />

2,32<br />

22<br />

22<br />

22<br />

22<br />

2,42<br />

2,42<br />

2,42<br />

2,42<br />

4<br />

3,60<br />

3,60<br />

3,60<br />

3,60<br />

16<br />

16<br />

16<br />

16<br />

4,36<br />

4,36<br />

4,36<br />

4,36<br />

4<br />

2,88<br />

2,88<br />

2,88<br />

2,88<br />

13<br />

13<br />

13<br />

13<br />

4,01<br />

4,01<br />

4,01<br />

4,01<br />

3<br />

2,96<br />

2,96<br />

2,96<br />

2,96<br />

10<br />

10<br />

10<br />

10<br />

4,48<br />

4,48<br />

4,48<br />

4,48<br />

2<br />

4,43<br />

4,43<br />

4,43<br />

4,43<br />

7<br />

4,91<br />

4,91<br />

4,91<br />

4,91<br />

2<br />

3,28<br />

3,28<br />

3,28<br />

3,28<br />

6<br />

5,00<br />

5,00<br />

5,00<br />

5,00<br />

1<br />

4,06<br />

4,06<br />

4,06<br />

4,06<br />

6<br />

2,80<br />

2,80<br />

2,80<br />

2,80<br />

1<br />

2,31<br />

2,31<br />

2,31<br />

2,31<br />

6<br />

Log<br />

Log<br />

Log<br />

Log WBC<br />

WBC<br />

WBC<br />

WBC<br />

(log<br />

log<br />

log<br />

log nº leuc<br />

leuc<br />

leuc<br />

leucócitos)<br />

citos)<br />

citos)<br />

citos)<br />

t<br />

log<br />

log<br />

log<br />

log WBC (<br />

WBC (<br />

WBC (<br />

WBC (log<br />

log<br />

log<br />

log<br />

nºleuc<br />

leuc<br />

leuc<br />

leucócitos<br />

citos<br />

citos<br />

citos)<br />

t<br />

Grupo 2 (n=21)<br />

Grupo 2 (n=21)<br />

Grupo 2 (n=21)<br />

Grupo 2 (n=21)<br />

Grupo 1 (n=21)<br />

Grupo 1 (n=21)<br />

Grupo 1 (n=21)<br />

Grupo 1 (n=21)<br />

Nota + significa<br />

censurado<br />

Grupo =R x<br />

(1=placebo,<br />

0=tratamento)


R x<br />

Software utilizado :SPIDA<br />

Modelo 1:<br />

Coeff<br />

Coeficiente<br />

1.509<br />

StErr<br />

Erro<br />

padrão<br />

0.410<br />

p-value<br />

Valor de<br />

p<br />

N:42 % Cen: 28.571 -2log L:172.759<br />

h(t,X) = ĥ 0 (t) e β 1 Rx<br />

h(t,X) = ĥ 0 (t) e 1.509Rx<br />

HR=exp(1,509)(1-0)=e 1,509 =4,5<br />

0<br />

HR<br />

Risco de<br />

morrer<br />

4.523<br />

0,95<br />

Limite<br />

inferior<br />

do IC<br />

2.027<br />

CI<br />

Limite<br />

superior do<br />

IC<br />

10.094<br />

P(PH)<br />

Valor de p <strong>para</strong> o<br />

pressuposto de<br />

proporcionalidade<br />

HR=4.5 significa que os doentes que pertencem ao grupo placebo têm <strong>um</strong> risco a<strong>um</strong>entado de<br />

4.5 vezes maior de recidivarem com<strong>para</strong>dos com os do grupo em tratamento<br />

0.794


R x<br />

Log WBC<br />

Modelo 2:<br />

Coeff<br />

Coeficiente<br />

1.294<br />

1.604<br />

StErr<br />

Erro<br />

padrão<br />

0.422<br />

0.329<br />

p-value<br />

Valor de<br />

p<br />

0.002<br />

0.000<br />

N:42 % Cen: 28.571 -2log L:144.559<br />

Modelo estimado<br />

h(t,X)= ĥ0 (t)eβ1Rx + β2 log WBC<br />

h(t,X)= ĥ 0 (t)e<br />

1.294Rx + 1.604 log WBC<br />

HR<br />

Risco de<br />

morrer<br />

3.648<br />

4.975<br />

0,95<br />

Limite<br />

inferior<br />

do IC<br />

1.505<br />

2.609<br />

CI<br />

Limite<br />

superior<br />

do IC<br />

8.343<br />

9.486<br />

P(PH)<br />

Valor de p <strong>para</strong> o<br />

pressuposto de<br />

proporcionalidade<br />

0.944<br />

0.917<br />

HR=exp(1,294 (1-0) + 1,604(logWBC-logWBC))=exp(1,294(1)+1,604(0)=e 1,294<br />

HR=e 1,294 =3,6


R x<br />

Log WBC<br />

R x *log<br />

WBC<br />

Modelo 3:<br />

Coeff<br />

Coeficiente<br />

2.355<br />

1.803<br />

-0.342<br />

StErr<br />

Erro<br />

padrão<br />

1.681<br />

0.447<br />

0.520<br />

pvalue<br />

Valor<br />

de p<br />

0.161<br />

0.000<br />

0.510<br />

HR<br />

Risco de<br />

morrer<br />

10.537<br />

6.067<br />

0.710<br />

N:42 % Cen: 28.571 -2log L:144.131<br />

0,95<br />

Limite<br />

inferio<br />

r do IC<br />

0.391<br />

2.528<br />

0.256<br />

CI<br />

Limite<br />

superior<br />

do IC<br />

284.200<br />

14.561<br />

1.967<br />

P(PH)<br />

Valor de p <strong>para</strong> o<br />

pressuposto de<br />

proporcionalidade<br />

0.628<br />

0.996<br />

0.410<br />

HR=exp (2,355(1-0)+1,803(logWBC-logWBC)+ (-0,342)(1*logWBC-0*logWBC)<br />

=exp(2,355-0,342log WBC)<br />

HR=e2,355-0,342 log WBC<br />

exemplo <strong>para</strong> logWBC=2 HR=e 2,3551-0,342 (2) =5,32<br />

<strong>para</strong> log WBC=4 HR=e 2,3551-0,342 (4) =2,68


Logo que as estimativas dos ML forem obtidas estamos interessados em fazer inferências estatísticas<br />

sobre os <strong>hazard</strong> ratios (HR) definidos em termos dessas estimativas. O HR estimado é calculado ao<br />

elevar ao expoente o coeficiente de <strong>um</strong>a variável de exposição (0,1) de interesse.<br />

De notar que o modelo em que não há termos de interacção envolve exposição.<br />

Em geral o HR é definido como o risco de <strong>um</strong> indivíduo dividido pelo risco <strong>para</strong> outro indivíduo. Os<br />

dois indivíduos que estão a ser com<strong>para</strong>dos podem ser distinguidos pelos valores do conjunto de<br />

variáveis preditivas, ou seja os X<br />

HR=h(t,X * ) /h(t,X) HR=<br />

X*=(X* 1, X* 2,…., X* p) e X=(X 1, X 2,…., X p)<br />

representam os conjuntos dos X <strong>para</strong> os dois indivíduos<br />

HR=exp [<br />

p<br />

∑ =<br />

i 1<br />

β i (X i * -Xi )] é mais fácil interpretar o HR superior a 1, em que HR excede o<br />

valor nulo igual a 1<br />

O X * corresponde ao grupo com maior risco, o grupo placebo e X o grupo<br />

tratamento com menor risco.<br />

Suponhamos que só temos <strong>um</strong>a variável de interesse X1 que é a variável de exposição (0,1) logo p=1 .<br />

Logo o <strong>hazard</strong> ratio que com<strong>para</strong> expostos com não expostos é obtido por X*=1 e X=0 na formula da<br />

razão de risco.<br />

O valor estimado do HR é exp[β1(1-0) ]= e β1 .<br />

h<br />

h<br />

0<br />

0<br />

( t ) e<br />

( t ) e<br />

p<br />

∑<br />

i = 1<br />

p<br />

∑<br />

i = 1<br />

β<br />

β<br />

i<br />

i<br />

X<br />

X<br />

*<br />

i<br />

i<br />

REGRA GERAL : Se X1 é a variável de exposição (0,1) então HR= e β1 = efeito<br />

da exposição ajustada <strong>para</strong> as outras variáveis


COMO SE ANALISA O PRESSUPOSTO DE PROPORCIONALIDADE?<br />

Através de gráficos<br />

o mais <strong>popular</strong> com<strong>para</strong>r curvas log-log de sobrevivência em diferentes<br />

categorias das variáveis a serem analisadas. Curvas <strong>para</strong>lelas por exemplo<br />

com<strong>para</strong>ndo o grupo tratamento e placebo indicam que o PH foi satisfeito.


Através de testes de ajuste : goodness-of fit (GOF tests).<br />

São utilizados testes Z <strong>para</strong> amostras elevadas ou de testes do quiquadrado, que<br />

podem ser calculados <strong>para</strong> cada variável do modelo, ajustado <strong>para</strong> as outras<br />

variáveis do modelo.<br />

No exemplo utilizado da remissão da leucemia , a última coluna dos outputs<br />

contêm os valores de p dos testes GOF <strong>para</strong> as variáveis Rx e logWBC. Ambos os<br />

resultados são não significativos indicando que cada variável satisfaz o<br />

pressuposto de PH.


Vamos dar <strong>um</strong> exemplo em que o pressuposto de proporcionalidade não<br />

se verifica<br />

Consideremos <strong>um</strong> estudo em que os doentes com cancro são randomizados <strong>para</strong><br />

cirurgia ou terapia de radiação sem cirurgia. Temos o valor (0,1) variável<br />

exposição que representa a variável estatuto cirúrgico, em que 0 representa se<br />

foi operado e 1 que não foi operado. Considere que a a variável de exposição é a<br />

única de interesse logo o modelo de Cox contém <strong>um</strong>a única variável E,<br />

representando a exposição<br />

E = 0 se cirurgia ; E= 1 se não cirurgia<br />

h(t, X)=h 0 (t) e βE<br />

O modelo de Cox é apropriado?<br />

Verifica-se que após <strong>um</strong>a cirurgia de remoção de <strong>um</strong> t<strong>um</strong>or de cancro há <strong>um</strong><br />

risco elevado de complicações (mesmo de morte), no período após cirurgia mas<br />

após este período crítico (por exemplo 3 dias) verifica-se que o <strong>hazard</strong> dos<br />

operados passa a ser inferior ao dos não operados e as curvas cruzam ao fim de<br />

três dias, ou seja os <strong>hazard</strong>s não são constantes ao longo do tempo.<br />

Aqui não é apropriado utilizar o modelo de Cox porque o <strong>hazard</strong> ratio varia ao<br />

longo do tempo.


O que fazer quando não se verifica a proporcionalidade?<br />

São várias as opções<br />

Análise por estratos da variável exposição; ou seja não criar nenh<strong>um</strong> modelo e<br />

fazer curvas de Kaplan Meier <strong>para</strong> cada grupo se<strong>para</strong>damente<br />

Iniciar a análise aos três dias, e utilizar o modelo de Cox nos que sobreviveram<br />

após os três dias.<br />

Estimar <strong>um</strong> modelo de Cox até três dias e outro após os três dias de modo a<br />

obter duas diferentes estimativas de <strong>hazard</strong> ratio (HR) , <strong>um</strong>a <strong>para</strong> cada <strong>um</strong> dos<br />

períodos<br />

Estimar <strong>um</strong> modelo de Cox modificado que inclua <strong>um</strong>a variável de tempo<br />

dependente que meça a interacção da exposição com o tempo. Este modelo é<br />

designado por modelo de Cox estratificado ou estendido (extended Cox model)


O arquivo contem informação sobre o tempo (em dias) necessário<br />

<strong>para</strong> que dependentes de heroína se recuperem, em duas clínicas<br />

especializadas. Existem duas variáveis adicionais: registo de prisão anterior<br />

e dose máxima de <strong>um</strong> medicamento utilizado na recuperação (metadona)<br />

que, acredita-se que afecta o tempo de recuperação. Os dados também<br />

apresentam censura do tipo aleatória.<br />

Ajuste <strong>um</strong> modelo de Cox <strong>para</strong> o tempo de recuperação, incluindo como covariáveis . Clínica ( 1<br />

ou 2), prisão anterior (0:nenh<strong>um</strong>a, 1: alg<strong>um</strong>a) e dose (em mg/dia). Interprete cada <strong>um</strong> dos<br />

coeficientes com base nas estimativas obtidas.<br />

coef exp(coef) se(coef) z p<br />

Clinica2 -0.999 0.368 0.2152 -4.64 3.5e-06<br />

Prisãonão 0.279 1.321 0.1685 1.65 9.8e-02<br />

Metadona -0.034 0.967 0.0064 -5.30 1.1e-07<br />

•De acordo com o modelo ajustado acima, temos que as variáveis<br />

clínica e dose têm efeito no tempo de recuperação.<br />

•Interpretando os parâmetros, temos que, fixadas as outras covariáveis, <strong>um</strong> paciente<br />

que está na Clínica 2 tem <strong>um</strong>a taxa de chance de 64% ((1-0,368)*100) menor de ser<br />

recuperado que se ele estivesse na Clínica 1.<br />

•Já <strong>para</strong> a dose máxima do medicamento, temos que <strong>um</strong> a<strong>um</strong>ento de 1 mg/dia,<br />

fixadas as outras covariáveis, implica n<strong>um</strong>a taxa de chance de 3% ((1-0,967)*100)<br />

menor de recuperação em relação a <strong>um</strong> paciente sem esse acréscimo.<br />

(Introdução à Análise de Sobrevivência e Aplicações, Fernando Henrique F. P da Rosa e Vagner Pedro Júnior)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!