Uma escolha popular para relacionar a função hazard e um ...
Uma escolha popular para relacionar a função hazard e um ...
Uma escolha popular para relacionar a função hazard e um ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
MODELO DE RISCO PROPORCIONAL DE COX<br />
<strong>Uma</strong> <strong>escolha</strong> <strong>popular</strong> <strong>para</strong> <strong>relacionar</strong> a <strong>função</strong> <strong>hazard</strong> e <strong>um</strong> determinado número<br />
de covariáveis consiste no modelo de Cox.<br />
A <strong>função</strong> de risco h (t) (<strong>hazard</strong> function) também chamada taxa de risco (de falha) ou força<br />
de mortalidade, representa a taxa instantânea de morte de <strong>um</strong> indivíduo no intervalo de<br />
tempo t a t+1, sabendo que sobreviveu até ao momento t<br />
Não faz pressupostos acerca da distribuição da sobrevivência<br />
Ass<strong>um</strong>e que a taxa de risco (<strong>hazard</strong> rate) é <strong>função</strong> das variáveis independentes<br />
(covariáveis)<br />
h (t,X) = h 0 (t) exp {β 1 X 1 + …….+ β p X p } ou<br />
p<br />
∑ β<br />
i<br />
=<br />
Χ<br />
i<br />
i 1<br />
h (t,X)= h0 (t) e podemos linearizar este modelo dividindo os membros da equação<br />
por h0 (t) e depois aplicando logaritmos naturais nos dois lados
h 0 (t)= risco basal, <strong>hazard</strong> <strong>para</strong> o respectivo indivíduo quando todas as variáveis<br />
independentes são iguais a zero<br />
β 1 …..,β p = parâmetros do modelo<br />
X 1 ……, X p = variáveis explicativas (variáveis de exposição, variáveis confundidoras,<br />
variáveis de interacção)<br />
O modelo de Cox é essencialmente <strong>um</strong>a regressão linear múltipla do logaritmo do <strong>hazard</strong><br />
nas variáveis x i com <strong>um</strong> <strong>hazard</strong> de base que é o termo de intercepção que varia com o<br />
tempo<br />
Pressuposto do modelo : A relação entre hi (t) e hj (t) é constante ao longo do tempo .<br />
Método de estimação : Método de Máxima Verosimilhança Parcial (maxim<strong>um</strong> likelihood-<br />
ML estimation) os parâmetros são calculados ao maximizar a <strong>função</strong> likelihood,<br />
designada por L
Porque o modelo de Cox é muito <strong>popular</strong>?<br />
Podem-se obter estimativas dos coeficientes de regressão, <strong>hazard</strong><br />
ratios e curvas ajustadas<br />
É <strong>um</strong> modelo robusto, os resultados obtidos são muito próximos dos<br />
obtidos através de modelos <strong>para</strong>métricos<br />
É possível estimar os coeficientes na parte exponencial do modelo, e<br />
assim avaliar o efeito das variáveis explicativas. A medida do efeito<br />
<strong>hazard</strong> ratio, é calculada sem ter de se estimar o risco basal da <strong>função</strong>.<br />
De notar que a <strong>função</strong> <strong>hazard</strong> (t,X) e as curvas de sobrevivência<br />
correspondentes S(t,X) podem ser estimadas apesar de não ser<br />
especificada a <strong>função</strong> de risco basal (baseline <strong>hazard</strong> function)<br />
É preferido ao modelo logístico quando o tempo de sobrevivência é<br />
conhecido e há censurados
Desvantagens do modelo de Cox:<br />
• Proporciona estimativas constantes <strong>para</strong> o efeito das covariáveis ao longo de<br />
todo o estudo.<br />
• Dificuldade de interpretação de covariáveis dependentes no tempo.
Exemplo 1: estudo de <strong>um</strong> coorte fixo com <strong>um</strong> follow-up de 13 anos de 170<br />
homens de raça branca com 60 ou mais anos de idade em que o objectivo do<br />
estudo é determinar se o Índice de Apoio Social (SNI: Social Network Index)<br />
classificada de zero - sem apoio a 5 com - excelente apoio a<strong>um</strong>enta a<br />
sobrevivência<br />
→ Variáveis explicativas (explanatory variables):<br />
SNI→variável de exposição<br />
→Variáveis confundidoras (confounding variables)<br />
Idade (var. contínua)<br />
Tensão arterial (var. contínua)<br />
Doença crónica ( var. categórica Não=0; Sim=1)<br />
Índice de massa corporal (var. contínua)
Exemplo de <strong>um</strong>a variável de confundimento: idade<br />
Variável de exposição (casamento)<br />
Variável de confusão (idade)<br />
Variável Resultado (cancro)<br />
Conclusão errada : o casamento provoca cancro – os dois grupos<br />
estavam desajustados quanto à idade, os casados eram mais<br />
velhos<br />
As variáveis de confundimento (idade) estão sempre associadas tanto<br />
às variáveis de exposição (estado civil) como às variáveis resultado
Exemplo de interacção de <strong>um</strong>a variável interferente modificadora de efeito<br />
Variável de exposição (idade) Variável Resultado (Cancro)<br />
Variável de interacção (tabagismo)<br />
O hábito de f<strong>um</strong>ar também modifica a possibilidade de ter cancro, mesmo que os<br />
dois grupos (f<strong>um</strong>adores e não f<strong>um</strong>adores) estejam ajustados quanto á idade<br />
Existem duas variáveis tabaco e idade que têm efeito próprios e<br />
independentes na variável resultado
Exemplo 2<br />
Foi realizado <strong>um</strong> estudo em doentes com leucemia em remissão seguidos ao<br />
longo de várias semanas <strong>para</strong> ver em quanto tempo permanecem em remissão.<br />
Os dados envolvem dois grupos de doentes com leucemia, com 21 doentes em<br />
cada grupo. O grupo 1 é o grupo tratamento e o grupo 2 o grupo placebo. Os<br />
dados têm também os valores dos logaritmos do número de leucócitos a<br />
variável log WBC, que é <strong>um</strong> factor de prognóstico muito conhecido indicador<br />
da sobrevivência dos doentes<br />
Para este exemplo a questão principal de interesse refere-se à com<strong>para</strong>ção da<br />
experiência da sobrevivência dos dois grupos, ajustando <strong>para</strong> a possível<br />
variável de confusão e/ou efeitos de interacção dos log do nº de leucócitos
Temos assim <strong>um</strong> problema envolvendo duas variáveis explicativas como<br />
preditivas do tempo de sobrevivência T, em que T refere-se ao nº de semanas até<br />
à recidiva da doença.<br />
Designamos as variáveis explicativas:<br />
X1 (<strong>para</strong> o grupo status Rx: tratamento e placebo) e X2 (<strong>para</strong> log WBC: nº de<br />
leucócitos).<br />
A variável X1 é a variável de exposição de interesse.<br />
A variável X2 é <strong>um</strong>a variável que estamos a incluir como <strong>um</strong>a possível variável de<br />
confusão ou de efeito modificador.<br />
De notar se queremos avaliar o possível efeito de interacção do log WBC no<br />
grupo, temos de considerar <strong>um</strong>a terceira variável que é o produto de X1 e X2
1,97<br />
1,97<br />
1,97<br />
1,97<br />
23<br />
23<br />
23<br />
23<br />
1,45<br />
1,45<br />
1,45<br />
1,45<br />
35+<br />
35+<br />
35+<br />
35+<br />
2,73<br />
2,73<br />
2,73<br />
2,73<br />
22<br />
22<br />
22<br />
22<br />
1,47<br />
1,47<br />
1,47<br />
1,47<br />
34+<br />
34+<br />
34+<br />
34+<br />
2,95<br />
2,95<br />
2,95<br />
2,95<br />
17<br />
17<br />
17<br />
17<br />
2,53<br />
2,53<br />
2,53<br />
2,53<br />
32+<br />
32+<br />
32+<br />
32+<br />
2,30<br />
2,30<br />
2,30<br />
2,30<br />
15<br />
15<br />
15<br />
15<br />
2,20<br />
2,20<br />
2,20<br />
2,20<br />
32+<br />
32+<br />
32+<br />
32+<br />
3,06<br />
3,06<br />
3,06<br />
3,06<br />
12<br />
12<br />
12<br />
12<br />
1,78<br />
1,78<br />
1,78<br />
1,78<br />
25+<br />
25+<br />
25+<br />
25+<br />
1,50<br />
1,50<br />
1,50<br />
1,50<br />
12<br />
12<br />
12<br />
12<br />
2,01<br />
2,01<br />
2,01<br />
2,01<br />
20+<br />
20+<br />
20+<br />
20+<br />
2,12<br />
2,12<br />
2,12<br />
2,12<br />
11<br />
11<br />
11<br />
11<br />
2,05<br />
2,05<br />
2,05<br />
2,05<br />
19+<br />
19+<br />
19+<br />
19+<br />
3,49<br />
3,49<br />
3,49<br />
3,49<br />
11<br />
11<br />
11<br />
11<br />
2,16<br />
2,16<br />
2,16<br />
2,16<br />
17+<br />
17+<br />
17+<br />
17+<br />
3,26<br />
3,26<br />
3,26<br />
3,26<br />
8<br />
2,60<br />
2,60<br />
2,60<br />
2,60<br />
11+<br />
11+<br />
11+<br />
11+<br />
2,32<br />
2,32<br />
2,32<br />
2,32<br />
8<br />
2,70<br />
2,70<br />
2,70<br />
2,70<br />
10+<br />
10+<br />
10+<br />
10+<br />
3,05<br />
3,05<br />
3,05<br />
3,05<br />
8<br />
2,80<br />
2,80<br />
2,80<br />
2,80<br />
9+<br />
9+<br />
9+<br />
9+<br />
3,52<br />
3,52<br />
3,52<br />
3,52<br />
8<br />
3,20<br />
3,20<br />
3,20<br />
3,20<br />
6+<br />
6+<br />
6+<br />
6+<br />
3,97<br />
3,97<br />
3,97<br />
3,97<br />
5<br />
2,57<br />
2,57<br />
2,57<br />
2,57<br />
23<br />
23<br />
23<br />
23<br />
3,49<br />
3,49<br />
3,49<br />
3,49<br />
5<br />
2,32<br />
2,32<br />
2,32<br />
2,32<br />
22<br />
22<br />
22<br />
22<br />
2,42<br />
2,42<br />
2,42<br />
2,42<br />
4<br />
3,60<br />
3,60<br />
3,60<br />
3,60<br />
16<br />
16<br />
16<br />
16<br />
4,36<br />
4,36<br />
4,36<br />
4,36<br />
4<br />
2,88<br />
2,88<br />
2,88<br />
2,88<br />
13<br />
13<br />
13<br />
13<br />
4,01<br />
4,01<br />
4,01<br />
4,01<br />
3<br />
2,96<br />
2,96<br />
2,96<br />
2,96<br />
10<br />
10<br />
10<br />
10<br />
4,48<br />
4,48<br />
4,48<br />
4,48<br />
2<br />
4,43<br />
4,43<br />
4,43<br />
4,43<br />
7<br />
4,91<br />
4,91<br />
4,91<br />
4,91<br />
2<br />
3,28<br />
3,28<br />
3,28<br />
3,28<br />
6<br />
5,00<br />
5,00<br />
5,00<br />
5,00<br />
1<br />
4,06<br />
4,06<br />
4,06<br />
4,06<br />
6<br />
2,80<br />
2,80<br />
2,80<br />
2,80<br />
1<br />
2,31<br />
2,31<br />
2,31<br />
2,31<br />
6<br />
Log<br />
Log<br />
Log<br />
Log WBC<br />
WBC<br />
WBC<br />
WBC<br />
(log<br />
log<br />
log<br />
log nº leuc<br />
leuc<br />
leuc<br />
leucócitos)<br />
citos)<br />
citos)<br />
citos)<br />
t<br />
log<br />
log<br />
log<br />
log WBC (<br />
WBC (<br />
WBC (<br />
WBC (log<br />
log<br />
log<br />
log<br />
nºleuc<br />
leuc<br />
leuc<br />
leucócitos<br />
citos<br />
citos<br />
citos)<br />
t<br />
Grupo 2 (n=21)<br />
Grupo 2 (n=21)<br />
Grupo 2 (n=21)<br />
Grupo 2 (n=21)<br />
Grupo 1 (n=21)<br />
Grupo 1 (n=21)<br />
Grupo 1 (n=21)<br />
Grupo 1 (n=21)<br />
Nota + significa<br />
censurado<br />
Grupo =R x<br />
(1=placebo,<br />
0=tratamento)
R x<br />
Software utilizado :SPIDA<br />
Modelo 1:<br />
Coeff<br />
Coeficiente<br />
1.509<br />
StErr<br />
Erro<br />
padrão<br />
0.410<br />
p-value<br />
Valor de<br />
p<br />
N:42 % Cen: 28.571 -2log L:172.759<br />
h(t,X) = ĥ 0 (t) e β 1 Rx<br />
h(t,X) = ĥ 0 (t) e 1.509Rx<br />
HR=exp(1,509)(1-0)=e 1,509 =4,5<br />
0<br />
HR<br />
Risco de<br />
morrer<br />
4.523<br />
0,95<br />
Limite<br />
inferior<br />
do IC<br />
2.027<br />
CI<br />
Limite<br />
superior do<br />
IC<br />
10.094<br />
P(PH)<br />
Valor de p <strong>para</strong> o<br />
pressuposto de<br />
proporcionalidade<br />
HR=4.5 significa que os doentes que pertencem ao grupo placebo têm <strong>um</strong> risco a<strong>um</strong>entado de<br />
4.5 vezes maior de recidivarem com<strong>para</strong>dos com os do grupo em tratamento<br />
0.794
R x<br />
Log WBC<br />
Modelo 2:<br />
Coeff<br />
Coeficiente<br />
1.294<br />
1.604<br />
StErr<br />
Erro<br />
padrão<br />
0.422<br />
0.329<br />
p-value<br />
Valor de<br />
p<br />
0.002<br />
0.000<br />
N:42 % Cen: 28.571 -2log L:144.559<br />
Modelo estimado<br />
h(t,X)= ĥ0 (t)eβ1Rx + β2 log WBC<br />
h(t,X)= ĥ 0 (t)e<br />
1.294Rx + 1.604 log WBC<br />
HR<br />
Risco de<br />
morrer<br />
3.648<br />
4.975<br />
0,95<br />
Limite<br />
inferior<br />
do IC<br />
1.505<br />
2.609<br />
CI<br />
Limite<br />
superior<br />
do IC<br />
8.343<br />
9.486<br />
P(PH)<br />
Valor de p <strong>para</strong> o<br />
pressuposto de<br />
proporcionalidade<br />
0.944<br />
0.917<br />
HR=exp(1,294 (1-0) + 1,604(logWBC-logWBC))=exp(1,294(1)+1,604(0)=e 1,294<br />
HR=e 1,294 =3,6
R x<br />
Log WBC<br />
R x *log<br />
WBC<br />
Modelo 3:<br />
Coeff<br />
Coeficiente<br />
2.355<br />
1.803<br />
-0.342<br />
StErr<br />
Erro<br />
padrão<br />
1.681<br />
0.447<br />
0.520<br />
pvalue<br />
Valor<br />
de p<br />
0.161<br />
0.000<br />
0.510<br />
HR<br />
Risco de<br />
morrer<br />
10.537<br />
6.067<br />
0.710<br />
N:42 % Cen: 28.571 -2log L:144.131<br />
0,95<br />
Limite<br />
inferio<br />
r do IC<br />
0.391<br />
2.528<br />
0.256<br />
CI<br />
Limite<br />
superior<br />
do IC<br />
284.200<br />
14.561<br />
1.967<br />
P(PH)<br />
Valor de p <strong>para</strong> o<br />
pressuposto de<br />
proporcionalidade<br />
0.628<br />
0.996<br />
0.410<br />
HR=exp (2,355(1-0)+1,803(logWBC-logWBC)+ (-0,342)(1*logWBC-0*logWBC)<br />
=exp(2,355-0,342log WBC)<br />
HR=e2,355-0,342 log WBC<br />
exemplo <strong>para</strong> logWBC=2 HR=e 2,3551-0,342 (2) =5,32<br />
<strong>para</strong> log WBC=4 HR=e 2,3551-0,342 (4) =2,68
Logo que as estimativas dos ML forem obtidas estamos interessados em fazer inferências estatísticas<br />
sobre os <strong>hazard</strong> ratios (HR) definidos em termos dessas estimativas. O HR estimado é calculado ao<br />
elevar ao expoente o coeficiente de <strong>um</strong>a variável de exposição (0,1) de interesse.<br />
De notar que o modelo em que não há termos de interacção envolve exposição.<br />
Em geral o HR é definido como o risco de <strong>um</strong> indivíduo dividido pelo risco <strong>para</strong> outro indivíduo. Os<br />
dois indivíduos que estão a ser com<strong>para</strong>dos podem ser distinguidos pelos valores do conjunto de<br />
variáveis preditivas, ou seja os X<br />
HR=h(t,X * ) /h(t,X) HR=<br />
X*=(X* 1, X* 2,…., X* p) e X=(X 1, X 2,…., X p)<br />
representam os conjuntos dos X <strong>para</strong> os dois indivíduos<br />
HR=exp [<br />
p<br />
∑ =<br />
i 1<br />
β i (X i * -Xi )] é mais fácil interpretar o HR superior a 1, em que HR excede o<br />
valor nulo igual a 1<br />
O X * corresponde ao grupo com maior risco, o grupo placebo e X o grupo<br />
tratamento com menor risco.<br />
Suponhamos que só temos <strong>um</strong>a variável de interesse X1 que é a variável de exposição (0,1) logo p=1 .<br />
Logo o <strong>hazard</strong> ratio que com<strong>para</strong> expostos com não expostos é obtido por X*=1 e X=0 na formula da<br />
razão de risco.<br />
O valor estimado do HR é exp[β1(1-0) ]= e β1 .<br />
h<br />
h<br />
0<br />
0<br />
( t ) e<br />
( t ) e<br />
p<br />
∑<br />
i = 1<br />
p<br />
∑<br />
i = 1<br />
β<br />
β<br />
i<br />
i<br />
X<br />
X<br />
*<br />
i<br />
i<br />
REGRA GERAL : Se X1 é a variável de exposição (0,1) então HR= e β1 = efeito<br />
da exposição ajustada <strong>para</strong> as outras variáveis
COMO SE ANALISA O PRESSUPOSTO DE PROPORCIONALIDADE?<br />
Através de gráficos<br />
o mais <strong>popular</strong> com<strong>para</strong>r curvas log-log de sobrevivência em diferentes<br />
categorias das variáveis a serem analisadas. Curvas <strong>para</strong>lelas por exemplo<br />
com<strong>para</strong>ndo o grupo tratamento e placebo indicam que o PH foi satisfeito.
Através de testes de ajuste : goodness-of fit (GOF tests).<br />
São utilizados testes Z <strong>para</strong> amostras elevadas ou de testes do quiquadrado, que<br />
podem ser calculados <strong>para</strong> cada variável do modelo, ajustado <strong>para</strong> as outras<br />
variáveis do modelo.<br />
No exemplo utilizado da remissão da leucemia , a última coluna dos outputs<br />
contêm os valores de p dos testes GOF <strong>para</strong> as variáveis Rx e logWBC. Ambos os<br />
resultados são não significativos indicando que cada variável satisfaz o<br />
pressuposto de PH.
Vamos dar <strong>um</strong> exemplo em que o pressuposto de proporcionalidade não<br />
se verifica<br />
Consideremos <strong>um</strong> estudo em que os doentes com cancro são randomizados <strong>para</strong><br />
cirurgia ou terapia de radiação sem cirurgia. Temos o valor (0,1) variável<br />
exposição que representa a variável estatuto cirúrgico, em que 0 representa se<br />
foi operado e 1 que não foi operado. Considere que a a variável de exposição é a<br />
única de interesse logo o modelo de Cox contém <strong>um</strong>a única variável E,<br />
representando a exposição<br />
E = 0 se cirurgia ; E= 1 se não cirurgia<br />
h(t, X)=h 0 (t) e βE<br />
O modelo de Cox é apropriado?<br />
Verifica-se que após <strong>um</strong>a cirurgia de remoção de <strong>um</strong> t<strong>um</strong>or de cancro há <strong>um</strong><br />
risco elevado de complicações (mesmo de morte), no período após cirurgia mas<br />
após este período crítico (por exemplo 3 dias) verifica-se que o <strong>hazard</strong> dos<br />
operados passa a ser inferior ao dos não operados e as curvas cruzam ao fim de<br />
três dias, ou seja os <strong>hazard</strong>s não são constantes ao longo do tempo.<br />
Aqui não é apropriado utilizar o modelo de Cox porque o <strong>hazard</strong> ratio varia ao<br />
longo do tempo.
O que fazer quando não se verifica a proporcionalidade?<br />
São várias as opções<br />
Análise por estratos da variável exposição; ou seja não criar nenh<strong>um</strong> modelo e<br />
fazer curvas de Kaplan Meier <strong>para</strong> cada grupo se<strong>para</strong>damente<br />
Iniciar a análise aos três dias, e utilizar o modelo de Cox nos que sobreviveram<br />
após os três dias.<br />
Estimar <strong>um</strong> modelo de Cox até três dias e outro após os três dias de modo a<br />
obter duas diferentes estimativas de <strong>hazard</strong> ratio (HR) , <strong>um</strong>a <strong>para</strong> cada <strong>um</strong> dos<br />
períodos<br />
Estimar <strong>um</strong> modelo de Cox modificado que inclua <strong>um</strong>a variável de tempo<br />
dependente que meça a interacção da exposição com o tempo. Este modelo é<br />
designado por modelo de Cox estratificado ou estendido (extended Cox model)
O arquivo contem informação sobre o tempo (em dias) necessário<br />
<strong>para</strong> que dependentes de heroína se recuperem, em duas clínicas<br />
especializadas. Existem duas variáveis adicionais: registo de prisão anterior<br />
e dose máxima de <strong>um</strong> medicamento utilizado na recuperação (metadona)<br />
que, acredita-se que afecta o tempo de recuperação. Os dados também<br />
apresentam censura do tipo aleatória.<br />
Ajuste <strong>um</strong> modelo de Cox <strong>para</strong> o tempo de recuperação, incluindo como covariáveis . Clínica ( 1<br />
ou 2), prisão anterior (0:nenh<strong>um</strong>a, 1: alg<strong>um</strong>a) e dose (em mg/dia). Interprete cada <strong>um</strong> dos<br />
coeficientes com base nas estimativas obtidas.<br />
coef exp(coef) se(coef) z p<br />
Clinica2 -0.999 0.368 0.2152 -4.64 3.5e-06<br />
Prisãonão 0.279 1.321 0.1685 1.65 9.8e-02<br />
Metadona -0.034 0.967 0.0064 -5.30 1.1e-07<br />
•De acordo com o modelo ajustado acima, temos que as variáveis<br />
clínica e dose têm efeito no tempo de recuperação.<br />
•Interpretando os parâmetros, temos que, fixadas as outras covariáveis, <strong>um</strong> paciente<br />
que está na Clínica 2 tem <strong>um</strong>a taxa de chance de 64% ((1-0,368)*100) menor de ser<br />
recuperado que se ele estivesse na Clínica 1.<br />
•Já <strong>para</strong> a dose máxima do medicamento, temos que <strong>um</strong> a<strong>um</strong>ento de 1 mg/dia,<br />
fixadas as outras covariáveis, implica n<strong>um</strong>a taxa de chance de 3% ((1-0,967)*100)<br />
menor de recuperação em relação a <strong>um</strong> paciente sem esse acréscimo.<br />
(Introdução à Análise de Sobrevivência e Aplicações, Fernando Henrique F. P da Rosa e Vagner Pedro Júnior)