Thiago Gentil Ramires - Departamento de Estatística (UEM
Thiago Gentil Ramires - Departamento de Estatística (UEM
Thiago Gentil Ramires - Departamento de Estatística (UEM
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Universida<strong>de</strong> Estadual <strong>de</strong> Maringá<br />
<strong>Departamento</strong> <strong>de</strong> <strong>Estatística</strong><br />
<strong>Thiago</strong> <strong>Gentil</strong> <strong>Ramires</strong>
Analise <strong>de</strong> sobrevivência em pacientes<br />
com problemas renais.<br />
MARINGÁ<br />
OUTUBRO DE 2010<br />
INSTITUTO DO RIM DE MARINGÁ<br />
CURSO DE ESTATÍSTICA<br />
THIAGO GENTIL RAMIRES<br />
ii
RELATORIO DE ESTÁGIO CURRICULAR<br />
MARINGÁ<br />
OUTUBRO DE 2010<br />
Relatório submetido a<br />
Coor<strong>de</strong>nação do curso <strong>de</strong><br />
<strong>Estatística</strong> da Universida<strong>de</strong><br />
Estadual <strong>de</strong> Maringá como<br />
Requisito parcial para a<br />
Obtenção do diploma em<br />
Graduação em estatística<br />
Orientadora: Prof. Daniele<br />
Cristina Tita Granzotto<br />
iii
<strong>Thiago</strong> <strong>Gentil</strong> <strong>Ramires</strong><br />
Analise <strong>de</strong> sobrevivência em pacientes com problemas<br />
Aprovada em ___/___/_____<br />
renais.<br />
Banca Examinadora<br />
Relatório submetido a<br />
Coor<strong>de</strong>nação do curso <strong>de</strong><br />
<strong>Estatística</strong> da Universida<strong>de</strong><br />
Estadual <strong>de</strong> Maringá como<br />
Requisito parcial para a<br />
Obtenção do diploma em<br />
Graduação em estatística<br />
_________________________________________<br />
Profª Msc. Daniele Cristina Tita Granzotto(Orientadora)<br />
Universida<strong>de</strong> Estadual <strong>de</strong> Maringá – <strong>UEM</strong><br />
_________________________________________<br />
Profª Dra.Rosangela Getirana Santana<br />
Universida<strong>de</strong> Estadual <strong>de</strong> Maringá – <strong>UEM</strong><br />
_________________________________________<br />
Profº Dr. Carlos Aparecidos dos Santos<br />
Universida<strong>de</strong> Estadual <strong>de</strong> Maringá – <strong>UEM</strong><br />
iv
RESUMO<br />
Dada a relevância e o aumento <strong>de</strong> casos <strong>de</strong> Insuficiência Renal Crônica no<br />
Brasil, faz-se necessário o estudo <strong>de</strong> ferramentas estatísticas apropriadas que<br />
auxiliem na avaliação <strong>de</strong> fatores <strong>de</strong>terminantes na incidência <strong>de</strong> morte <strong>de</strong>ssa<br />
doença. Os dados disponibilizados pelo Instituto do Rim <strong>de</strong> Maringá, no período<br />
<strong>de</strong> 1978 à 2010. Adotou-se a metodologia <strong>de</strong> análise <strong>de</strong> sobrevivência foi feito a<br />
fim <strong>de</strong> para mo<strong>de</strong>lar os tempos <strong>de</strong> vida <strong>de</strong>stes pacientes e <strong>de</strong>terminar quais os<br />
fatores que mais afetam sua sobrevida. Durante a execução <strong>de</strong>ste trabalho, o<br />
mo<strong>de</strong>lo <strong>de</strong> regressão Weibull foi consi<strong>de</strong>rado e todas as técnicas necessárias<br />
para mo<strong>de</strong>lagem, verificação e inferências para este mo<strong>de</strong>lo citado são aqui<br />
apresentadas.<br />
Análise <strong>de</strong> sobrevivência, com o propósito <strong>de</strong> mo<strong>de</strong>lar o tempo <strong>de</strong> vida dos<br />
pacientes e assim i<strong>de</strong>ntificar fatores <strong>de</strong>terminantes com (sexo, pressão alta,<br />
diabetes, imc). O mo<strong>de</strong>lo <strong>de</strong> regressão Weibull foi consi<strong>de</strong>rado o mais bem<br />
ajustado, que apresentou sexo, pressão alta, cor, indicador <strong>de</strong> hepatite B entre<br />
outras, fatores que influenciam no tempo <strong>de</strong> vida <strong>de</strong> pacientes com problemas<br />
renais.<br />
Palavras-chave: Diálise renal, análise <strong>de</strong> sobrevivência, análise paramétrica e<br />
não paramétrica.<br />
v
estudos.<br />
AGRADECIMENTOS<br />
Primeiramente a Deus, por sempre me ajudar a conquistar meus sonhos.<br />
A minha mãe, Janet <strong>Gentil</strong> <strong>Ramires</strong>, que sempre me apoiou com meus<br />
Meu pai, A<strong>de</strong>mir <strong>Ramires</strong>, pessoa fundamental em nossa família.<br />
Ao meu avô, que nos <strong>de</strong>ixou esse ano, pessoa que sinto muito sauda<strong>de</strong> e que<br />
infelizmente não po<strong>de</strong> compartilhar esse momento da minha vida.<br />
A minha avó, pessoa que sempre batalhou na vida e que ainda continua muito<br />
forte fazendo parte da minha família.<br />
Ao meu irmão Juliano <strong>Gentil</strong> <strong>Ramires</strong>, que sempre esta disposto a me ajudar.<br />
A minha Prof. Rosangela, que foi um dos professores com que mais me<br />
i<strong>de</strong>ntifiquei na faculda<strong>de</strong> e que sempre me ajudou.<br />
A Prof. Daniele em que me ajudou com todas as duvidas em meu trabalho.<br />
A Andréa, orientadora do meu estagio, on<strong>de</strong> sem ela seria impossível ter<br />
realizado este trabalho.<br />
A todos do <strong>de</strong>partamento <strong>de</strong> estatística da <strong>UEM</strong><br />
Aos amigos das republicas Pé <strong>de</strong> Pano e Kubanacan, que vão <strong>de</strong>ixar<br />
sauda<strong>de</strong>s <strong>de</strong>sses 4 anos em que passamos juntos.<br />
vi
Sumário<br />
Capítulo 1 - Introdução ....................................................................................... 10<br />
1.1- Objetivos................................................................................................... 12<br />
Capítulo 2 – Hemodiálise.................................................................................... 13<br />
2.1. Historia da hemodiálise ......................................................................... 13<br />
2.2. Insuficiência renal crônica..................................................................... 13<br />
2.3. Tratamento............................................................................................. 14<br />
Capítulo 3 – Análise <strong>de</strong> Sobrevivência............................................................... 16<br />
3.1. Procedimentos para Analisar Dados na Ausência <strong>de</strong> Censura ............ 18<br />
3.2. Estimadores Não-Paramétricos ............................................................ 21<br />
3.2.1 Estimador <strong>de</strong> Kaplan-Meier................................................................. 22<br />
3.2.2 O Teste <strong>de</strong> Log-Rank........................................................................... 24<br />
3.3 Estimadores Paramétricos........................................................................ 24<br />
3.3.1 Mo<strong>de</strong>lo Exponencial .......................................................................... 25<br />
3.3.2 Mo<strong>de</strong>lo Weibull ................................................................................... 27<br />
3.3.3 Mo<strong>de</strong>lo Log-Normal............................................................................. 28<br />
3.3.4 Mo<strong>de</strong>lo Gama-Generalizada................................................................. 30<br />
3.4. Método <strong>de</strong> Estimação ............................................................................ 31<br />
3.5. Obtenção do Mo<strong>de</strong>lo Paramétrico......................................................... 32<br />
3.6 Comparação <strong>de</strong> mo<strong>de</strong>los e seleção das covariáveis .............................. 33<br />
3.7 Teste da razão <strong>de</strong> verossimilhanças....................................................... 34<br />
3.8 Escolha <strong>de</strong> um mo<strong>de</strong>lo paramétrico ...................................................... 34<br />
3.9 A<strong>de</strong>quação do mo<strong>de</strong>lo ajustado............................................................. 35<br />
Capítulo 4 - Resultados ....................................................................................... 37<br />
4.1 – Análise Não-Paramétrica........................................................................ 39<br />
4.2 – Análise Paramétrica ................................................................................ 42<br />
4.2.1 - Verificação do ajuste ....................................................................... 46<br />
4.2.2 - Estimativa dos Parâmetros do Mo<strong>de</strong>lo Ajustado Weibull............... 49<br />
4.2.3 - Análise <strong>de</strong> resíduos.......................................................................... 50<br />
Capítulo 5 – Conclusão ....................................................................................... 52<br />
Bibliografias ........................................................................................................ 54<br />
Anexo A Programa no SAS. .......................................................................... 57<br />
Anexo B Programa no R .................................................................................. 61<br />
vii
Capítulo 1 - Introdução<br />
No início da década <strong>de</strong> 60 a diálise era procedimento experimental e medida<br />
heróica utilizada em casos selecionados <strong>de</strong> insuficiência renal aguda. Evoluiu,<br />
tornando-se tratamento rotineiro capaz <strong>de</strong> manter vivos portadores <strong>de</strong> insuficiência<br />
renal crônica terminal (IRCT).<br />
Dada a relevância e o aumento <strong>de</strong> casos <strong>de</strong> Insuficiência Renal no Brasil,<br />
faz-se necessário o estudo <strong>de</strong> ferramentas estatísticas apropriadas que auxiliem no<br />
discernimento dos fatores que mais influenciam na incidência <strong>de</strong> morte <strong>de</strong>ssa<br />
doença. As técnicas <strong>de</strong> análise <strong>de</strong> sobrevivência são aqui consi<strong>de</strong>radas, pois se<br />
ajustam cada vez mais aos dados que frequentemente são encontrados em vários<br />
tipos <strong>de</strong> estudos, especialmente, os estudos clínicos e observacionais.<br />
Qualquer que seja o tipo <strong>de</strong> estudo com pacientes, geralmente há uma<br />
variável <strong>de</strong> interesse, também chamada <strong>de</strong> variável <strong>de</strong>pen<strong>de</strong>nte ou resposta. Essa<br />
variável po<strong>de</strong> ser o número <strong>de</strong> casos <strong>de</strong> <strong>de</strong>terminada doença, ou a sua incidência,<br />
ou a sua probabilida<strong>de</strong> <strong>de</strong> ocorrência, ou outra medida que vise <strong>de</strong>screver a<br />
freqüência com que a doença ocorre. Às vezes, a variável <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> interesse<br />
é o tempo <strong>de</strong>corrido até o aparecimento <strong>de</strong> algum evento, e aí se incluem os<br />
estudos <strong>de</strong> análise <strong>de</strong> sobrevivência. Há, ainda, uma ou mais variáveis,<br />
<strong>de</strong>nominadas in<strong>de</strong>pen<strong>de</strong>ntes, preditoras ou covariáveis, cujo relacionamento com a<br />
variável <strong>de</strong>pen<strong>de</strong>nte é o objetivo do estudo <strong>de</strong> hemodiálise, e nesse contexto, a<br />
análise quantitativa é imprescindível, pois os mo<strong>de</strong>los estatísticos expressam a<br />
variável <strong>de</strong>pen<strong>de</strong>nte como uma função matemática conhecida das variáveis<br />
in<strong>de</strong>pen<strong>de</strong>ntes. Há, então, o interesse em se verificar o efeito <strong>de</strong> fatores <strong>de</strong> risco ou<br />
<strong>de</strong> fatores prognósticos (sejam eles quantitativos ou qualitativos) no tempo <strong>de</strong><br />
sobrevivência <strong>de</strong> um indivíduo ou <strong>de</strong> um grupo, bem como <strong>de</strong>finir as probabilida<strong>de</strong>s<br />
<strong>de</strong> sobrevida em diversos momentos no seguimento do grupo. Consi<strong>de</strong>ra-se<br />
sobrevida, o tempo <strong>de</strong>s<strong>de</strong> a entrada do indivíduo no estudo (data do começo da<br />
hemodiálise) até a ocorrência do evento <strong>de</strong> interesse (falha) ou até a censura (perda<br />
por tempo <strong>de</strong> observação incompleto) na observação (Kleinbaum, 1995).<br />
10
O objetivo <strong>de</strong>ste trabalho é estudar as covariáveis que afetam (e como<br />
afetam) o tempo até a ocorrência do evento <strong>de</strong> interesse. As vaiáveis do estudo<br />
foram: Ida<strong>de</strong>, Sexo, Cor, Tempo (em meses), Tipo Sanguíneo, Transplante, IMC,<br />
AntiHBS, Diabetes, Censura e Pressão <strong>de</strong>ntro dos 306 casos.<br />
Os dados foram obtidos junto ao Instituto do Rim <strong>de</strong> Maringá, on<strong>de</strong><br />
observamos os pacientes inscritos no programa <strong>de</strong> hemodiálise do ano <strong>de</strong> 1978 ao<br />
ano <strong>de</strong> 2010. Essa coleta foi obtida diariamente pelo próprio Instituto respeitando as<br />
normas da empresa.<br />
A principal limitação do estudo foi a perda <strong>de</strong> informação (algumas variáveis<br />
<strong>de</strong>ixaram <strong>de</strong> ser observadas ou foram perdidas), <strong>de</strong>sta forma alguns pacientes foram<br />
excluídos da análise.<br />
Outro complicador nesta análise são as controvérsias <strong>de</strong> como tratar os óbitos<br />
por outra causa que não a doença <strong>de</strong> interesse ou os óbitos por causa<br />
<strong>de</strong>sconhecida. Há autores que analisam estes pacientes como falha e, neste caso, a<br />
taxa <strong>de</strong> sobrevida reflete a mortalida<strong>de</strong> geral para este grupo <strong>de</strong> pacientes<br />
(sobrevida global). Neste estudo consi<strong>de</strong>ramos todos os óbitos como falha, pois<br />
pacientes com problemas renais passam a apresentar diversos tipos <strong>de</strong> problemas<br />
no organismo, on<strong>de</strong> a maioria <strong>de</strong>les estão diretamente relacionados <strong>de</strong>vido ao mau<br />
funcionamento dos rins.<br />
A escolha do mo<strong>de</strong>lo a ser utilizado é um muito importante na análise<br />
paramétrica em confiabilida<strong>de</strong>, uma vez que a utilização <strong>de</strong> um mo<strong>de</strong>lo ina<strong>de</strong>quado<br />
para um <strong>de</strong>terminado conjunto <strong>de</strong> dados po<strong>de</strong> comprometer a análise estatística,<br />
provocando viés nos resultados obtidos. Neste estudo optou-se por utilizar uma<br />
estratégia <strong>de</strong> seleção <strong>de</strong> mo<strong>de</strong>los <strong>de</strong>rivada da proposta <strong>de</strong> Collett (1994). São<br />
utilizados seis passos no processo <strong>de</strong> seleção. Descritos no capitulo 3.5.<br />
Após a mo<strong>de</strong>lagem procurou-se ajustar o mo<strong>de</strong>lo à uma distribuição<br />
paramétrica, on<strong>de</strong> foram utilizados métodos gráficos e testes estatístico como o<br />
Teste da Razão <strong>de</strong> Verossimilhança. O mo<strong>de</strong>lo que melhor se a<strong>de</strong>quou aos dados<br />
foi um mo<strong>de</strong>lo Weibull.<br />
Com a verificação do ajuste do mo<strong>de</strong>lo, em geral obtemos um bom ajuste<br />
com as covariáveis selecionadas e as seguintes interpretações foram feitas para os<br />
parâmetros:<br />
11
1.1- Objetivos<br />
O objetivo <strong>de</strong>ste trabalho é estudar os fatores que afetam (e como afetam) o<br />
tempo até a ocorrência do óbito por insuficiência renal.<br />
Assim, temos o interesse em i<strong>de</strong>ntificar variáveis que estão associadas ao tempo<br />
<strong>de</strong> vida dos pacientes, construir um mo<strong>de</strong>lo <strong>de</strong> sobrevivência que explique o<br />
comportamento das variáveis no mo<strong>de</strong>lo e assim, estimar parâmetros, via método <strong>de</strong><br />
máxima verossimilhança, do mo<strong>de</strong>lo ajustado.<br />
À partir do mo<strong>de</strong>lo construído, temos por objetivo fazer algumas estimativas<br />
pertinentes, além <strong>de</strong> construir intervalos <strong>de</strong> confianças e teste <strong>de</strong> hipóteses para os<br />
parâmetros selecionados<br />
12
Capítulo 2 – Hemodiálise<br />
2.1. Historia da hemodiálise<br />
Melhorias importantes ocorreram nos serviços <strong>de</strong> diálise do Brasil, sendo<br />
reconhecido como programa <strong>de</strong> substituição renal no ano <strong>de</strong> 1974. Alguns<br />
parâmetros tornaram-se regra nas unida<strong>de</strong>s <strong>de</strong> diálise brasileiras, como o<br />
tratamento da água por osmose reversa e o uso <strong>de</strong> máquinas <strong>de</strong> proporção.<br />
Assim, na última década, várias inovações tecnológicas foram incorporadas<br />
ao procedimento <strong>de</strong> hemodiálise, tanto quanto à automação das máquinas como<br />
quanto aos dispositivos <strong>de</strong> segurança, medicações, <strong>de</strong>ntre outros. Apesar dos<br />
avanços tecnológicos, os registros <strong>de</strong> diálise do mundo não <strong>de</strong>monstram melhora da<br />
sobrevida concomitante a estes avanços. Logo, não está clara a influência da<br />
tecnologia sobre a mortalida<strong>de</strong> dos pacientes.<br />
2.2. Insuficiência renal crônica<br />
Uma doença que constitui um grave problema médico e <strong>de</strong> saú<strong>de</strong> pública,<br />
caracterizada pela incapacida<strong>de</strong> dos rins em excretar substâncias tóxicas do<br />
organismo <strong>de</strong> forma a<strong>de</strong>quada (Cardozo et al. 2006). As causas da Insuficiência<br />
Renal são muitas, algumas das quais acarretam uma diminuição rápida da função<br />
renal, muitas vezes, com valores inferiores a 1 ou 2% do índice normal (Insuficiência<br />
Renal Aguda). Outras causas <strong>de</strong> IR acarretam uma perda gradual e progressiva <strong>de</strong><br />
gran<strong>de</strong> parte dos néfrons funcionantes (Insuficiência Renal Crônica).<br />
Segundo Marques et al. (2005), os resultados finais da doença são sinais e<br />
sintomas tais como: cefaléia, fraqueza, anorexia, náuseas, vômitos, cãibras, diarréia,<br />
oligúria (secreção insuficiente <strong>de</strong> urina), e<strong>de</strong>ma, confusão mental, se<strong>de</strong>, perda do<br />
olfato e paladar, sonolência, hipertensão arterial e tendência à hemorragia<br />
13
<strong>de</strong>correntes da incapacida<strong>de</strong> renal, além <strong>de</strong> pali<strong>de</strong>z cutânea, xerose (ressecamento<br />
patológico da pele), dismenorréia (cólica antes ou durante a menstruação),<br />
amenorréia (ausência <strong>de</strong> fluxo menstrual), atrofia testicular, impotência, déficit <strong>de</strong><br />
atenção, espasmos musculares e coma.<br />
2.3. Tratamento<br />
Os pacientes que, por algum motivo, per<strong>de</strong>ram a função renal e<br />
irreparavelmente atingiram a fase terminal da doença, têm hoje três métodos <strong>de</strong><br />
tratamento: a hemodiálise, a diálise peritoneal e o transplante renal.<br />
De acordo com SBN (2009), a hemodiálise promove a retirada das<br />
substâncias tóxicas, água e sais minerais do organismo por meio da passagem do<br />
sangue por um filtro. Em geral, é realizada 3 vezes por semana, em sessões com<br />
duração média <strong>de</strong> 3 a 4 horas, com o auxílio <strong>de</strong> uma máquina, <strong>de</strong>ntro <strong>de</strong> clínicas<br />
especializadas neste tratamento como mostra a Figura2.1. Para que o sangue passe<br />
pela máquina é necessário a instalação <strong>de</strong> um cateter ou a confecção <strong>de</strong> uma fístula<br />
(procedimento realizado mais comumente nas veias do braço), permitindo que essas<br />
fiquem mais calibrosas e forneçam o fluxo <strong>de</strong> sangue a<strong>de</strong>quado para ser filtrado.<br />
Figura 2.1: Tratamento <strong>de</strong> hemodiálise.<br />
A diálise peritoneal funciona <strong>de</strong> maneira diferente. Ao invés <strong>de</strong> utilizar um filtro<br />
artificial para “limpar” o sangue, é utilizado o peritônio, que é uma membrana<br />
localizada <strong>de</strong>ntro do abdômen e que reveste os órgãos internos. É inserido um<br />
14
cateter flexível no abdômen, e assim, é feita a infusão <strong>de</strong> um líquido semelhante a<br />
um soro na cavida<strong>de</strong> abdominal. Esse líquido chamado “banho <strong>de</strong> diálise”, entra em<br />
contato com o peritônio, e por ele é feita a retirada das substâncias tóxicas do<br />
sangue. A diálise peritoneal po<strong>de</strong> ser feita na própria casa do paciente, ou ainda no<br />
local <strong>de</strong> trabalho, já que o processo <strong>de</strong> troca do banho <strong>de</strong> diálise é feito pelo próprio<br />
paciente ou por algum familiar.<br />
Segundo Santos (2005), os avanços recentes da terapia dialítica não têm se<br />
correlacionado diretamente com a redução da mortalida<strong>de</strong> nos últimos anos, talvez<br />
pelo fato <strong>de</strong> que os pacientes com doença renal crônica são mais idosos e<br />
apresentam maior número <strong>de</strong> co-morbida<strong>de</strong>s ao iniciarem a terapia dialítica.<br />
Os tratamentos dialíticos não chegam a substituir integralmente a função<br />
renal, mas fornecem condições para manter a sobrevida do paciente, permitindo que<br />
este retornem a uma vida normal e produtiva, prevenindo até a morte precoce. O<br />
transplante renal é o único tipo <strong>de</strong> terapia que po<strong>de</strong> oferecer uma reabilitação quase<br />
total. Segundo Castanheira et al. (2005), a diálise não é uma cura, permitindo<br />
apenas uma reposição da função renal normal.<br />
Para estudar os dados relacionados à diálise, utilizaremos <strong>de</strong> técnicas <strong>de</strong><br />
análise <strong>de</strong> sobrevivência, a qual será aplicada para estudar o tempo até os<br />
pacientes experimentarem o evento <strong>de</strong> interesse, neste caso, o óbito. Estas técnicas<br />
são justificadas, uma vez que, alguns dos tempos em estudo são parcialmente<br />
observados, ou seja, censurados. Neste caso, pacientes <strong>de</strong>ixam <strong>de</strong> experimentar o<br />
evento <strong>de</strong> interesse ou simplesmente abandonam ao tratamento.<br />
Ainda <strong>de</strong>vemos pensar: quais variáveis influenciam no tempo <strong>de</strong> vida <strong>de</strong><br />
pessoas com insuficiência renal; ou, qual o mo<strong>de</strong>lo mais a<strong>de</strong>quado para <strong>de</strong>screver o<br />
tempo <strong>de</strong> sobrevivência dos pacientes com insuficiência renal?<br />
Há controvérsias sobre como tratar os óbitos por outra causa que não a<br />
doença <strong>de</strong> interesse ou os óbitos por causa <strong>de</strong>sconhecida. Há autores que analisam<br />
estes pacientes como falha e, neste caso, a taxa <strong>de</strong> sobrevida reflete a mortalida<strong>de</strong><br />
geral para este grupo <strong>de</strong> pacientes (sobrevida global).<br />
Há ainda, casos em que o paciente morre por outros motivos on<strong>de</strong>, a causa<br />
principal é a insuficiência renal. Neste trabalho, qualquer que seja a causa morte,<br />
trataremos apenas do problema <strong>de</strong> insuficiência renal.<br />
15
Capítulo 3 – Análise <strong>de</strong> Sobrevivência<br />
Qualquer que seja o tipo <strong>de</strong> estudo com pacientes, geralmente há uma<br />
variável <strong>de</strong> interesse, também chamada <strong>de</strong> variável <strong>de</strong>pen<strong>de</strong>nte ou resposta. Essa<br />
variável po<strong>de</strong> ser o número <strong>de</strong> casos <strong>de</strong> <strong>de</strong>terminada doença, ou a sua incidência,<br />
ou a sua probabilida<strong>de</strong> <strong>de</strong> ocorrência, ou outra medida que vise <strong>de</strong>screver a<br />
freqüência com que a doença ocorre. Às vezes, a variável <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> interesse<br />
é o tempo <strong>de</strong>corrido até o aparecimento <strong>de</strong> algum evento, e aí se incluem os<br />
estudos <strong>de</strong> análise <strong>de</strong> sobrevivência. Outro fator <strong>de</strong>terminante para um estudo em<br />
analise <strong>de</strong> sobrevivência é a observação parcial da resposta, ou seja, a presença <strong>de</strong><br />
tempos censurados.<br />
Há, ainda, uma ou mais variáveis, <strong>de</strong>nominadas in<strong>de</strong>pen<strong>de</strong>ntes ou preditoras,<br />
cujo relacionamento com a variável <strong>de</strong>pen<strong>de</strong>nte é a influencia no tempo <strong>de</strong><br />
sobrevivência, e nesse contexto, a análise quantitativa é imprescindível, pois os<br />
mo<strong>de</strong>los estatísticos expressam a variável <strong>de</strong>pen<strong>de</strong>nte como uma função<br />
matemática conhecida das variáveis in<strong>de</strong>pen<strong>de</strong>ntes. Há, então, o interesse em se<br />
verificar o efeito <strong>de</strong> fatores <strong>de</strong> risco ou <strong>de</strong> fatores prognósticos (sejam eles<br />
quantitativos ou qualitativos) no tempo <strong>de</strong> sobrevivência <strong>de</strong> um indivíduo ou <strong>de</strong> um<br />
grupo, bem como <strong>de</strong>finir as probabilida<strong>de</strong>s <strong>de</strong> sobrevida em diversos momentos no<br />
seguimento do grupo. Consi<strong>de</strong>ra-se sobrevida, o tempo <strong>de</strong>s<strong>de</strong> a entrada do<br />
indivíduo no estudo (data do começo da hemodiálise) até a ocorrência do evento <strong>de</strong><br />
interesse (falha) ou até a censura (observação parcial da resposta) (Kleinbaum,<br />
1995).<br />
Em estudos <strong>de</strong> sobrevivência, as pessoas são acompanhadas por meio da<br />
ocorrência <strong>de</strong> um evento. Esse evento po<strong>de</strong> ser, por exemplo, o diagnóstico da<br />
doença, ou a realização <strong>de</strong> cirurgia, ou o inicio <strong>de</strong> um tratamento. Geralmente, as<br />
pessoas são incluídas no estudo em diferentes instantes, tempos estes chamados<br />
<strong>de</strong> zero, ou inicio do estudo. Os inícios são, portanto, truncados à esquerda, ou seja,<br />
a observação <strong>de</strong> cada indivíduo começa a partir <strong>de</strong> <strong>de</strong>terminado momento, sem<br />
levar em conta o que aconteceu no passado (Cox & Oakes, 1984). O evento final<br />
correspon<strong>de</strong> geralmente ao óbito ou a um <strong>de</strong>terminado evento que indique a<br />
modificação do estado inicial (cura, recorrência, retorno ao trabalho etc.) e como se<br />
comporta esta associação.<br />
16
Este evento final, ou evento <strong>de</strong> interesse, geralmente refere-se a eventos<br />
in<strong>de</strong>sejáveis, como o aparecimento <strong>de</strong> doença ou morte (Kleinbaum, 1995). Em<br />
estudos em que há necessida<strong>de</strong> <strong>de</strong> tempo para observar a resposta (ou<br />
acompanhamento), po<strong>de</strong> ocorrer que alguns indivíduos não sejam observados até a<br />
ocorrência da falha, ou seja, tenham seu tempo <strong>de</strong> observação incompleto. Esse tipo<br />
<strong>de</strong> perda no tempo <strong>de</strong> observação é <strong>de</strong>nominado censura. Isso po<strong>de</strong> ocorrer quando<br />
os indivíduos permanecem sem mudança <strong>de</strong> estado ao término do estudo, ou<br />
falecem por causas não relacionadas com a doença <strong>de</strong> interesse, ou abandonam o<br />
estudo, ou fogem à observação. Por vezes, a cura e/ou recuperação também po<strong>de</strong>m<br />
ser consi<strong>de</strong>radas como censura na observação. Os estudos em que existe censura<br />
são <strong>de</strong>nominados com observações incompletas. Uma suposição importante é a <strong>de</strong><br />
que os indivíduos censurados em <strong>de</strong>terminado tempo t são representativos <strong>de</strong> todos<br />
os indivíduos que estavam sujeitos ao risco <strong>de</strong> ter falha em t (Szklo & Nieto, 2000).<br />
Há dois tipos <strong>de</strong> estudos que po<strong>de</strong>m utilizar o tempo como variável <strong>de</strong><br />
interesse. Um <strong>de</strong>les é o estudo experimental (ensaios clínicos controlados<br />
aleatorizados), indicado para avaliar formas <strong>de</strong> tratamento. Outro tipo são os<br />
estudos <strong>de</strong> coorte observacionais, cujos dados po<strong>de</strong>m ser obtidos pela coleta direta<br />
em prontuários médicos ou em bases <strong>de</strong> dados já existentes (dados secundários).<br />
Essas fontes <strong>de</strong> dados secundários po<strong>de</strong>m ser <strong>de</strong> base hospitalar, por<br />
exemplo (registros hospitalares <strong>de</strong> câncer) ou populacional (registros <strong>de</strong> câncer <strong>de</strong><br />
base populacional). Registros <strong>de</strong> base hospitalar são aqueles que se referem a<br />
todos os casos tratados e acompanhados em uma instituição. Fornecem<br />
informações tanto para a administração do hospital quanto para pesquisadores<br />
interessados em informações sobre os resultados do tratamento nos diferentes<br />
grupos e fatores <strong>de</strong> risco ou fatores prognósticos. Contribuem ainda na atenção ao<br />
paciente individualmente, uma vez que asseguram o seguimento <strong>de</strong>stes pacientes<br />
(Young, 1991).<br />
Na análise <strong>de</strong> sobrevivência, os parâmetros mais importantes são as<br />
probabilida<strong>de</strong>s <strong>de</strong> sobrevivência no curso <strong>de</strong> cada um dos intervalos consi<strong>de</strong>rados e<br />
a probabilida<strong>de</strong> <strong>de</strong> sobrevida acumulada (tratada correntemente como taxa <strong>de</strong><br />
sobrevida), isto é, a probabilida<strong>de</strong> <strong>de</strong> sobreviver do tempo zero até o tempo final<br />
consi<strong>de</strong>rado. Esta última equivale à probabilida<strong>de</strong> <strong>de</strong> sobreviver em todos os<br />
intervalos anteriores ao momento consi<strong>de</strong>rado e, usualmente, é <strong>de</strong>nominada S(t)<br />
Função <strong>de</strong> sobrevivência. A escolha do mo<strong>de</strong>lo estatístico mais apropriado<br />
17
<strong>de</strong>pen<strong>de</strong>rá do tipo do <strong>de</strong>lineamento do estudo e <strong>de</strong> seus objetivos, das variáveis<br />
estudadas e da maneira pela qual foram coletados e categorizados os dados. A<br />
estimativa da probabilida<strong>de</strong> <strong>de</strong> sobrevida é, com certeza, mais válida e mais precisa<br />
para o período inicial do seguimento, no qual estão disponíveis informações sobre a<br />
maioria dos pacientes. Nos períodos posteriores, as informações po<strong>de</strong>m ficar<br />
limitadas <strong>de</strong>vido às perdas <strong>de</strong> seguimento e ao pequeno número <strong>de</strong> eventos<br />
(Fletcher et al., 1996).<br />
Somente nas décadas <strong>de</strong> 1950 e <strong>de</strong> 1960 apareceram as primeiras<br />
propostas <strong>de</strong> estimadores das probabilida<strong>de</strong>s <strong>de</strong> sobrevivência que incorporavam a<br />
censura, mo<strong>de</strong>los para observações incompletas.<br />
3.1. Procedimentos para Analisar Dados na Ausência <strong>de</strong><br />
Censura<br />
Seja T uma variável aleatória continua e positiva, normalmente caracterizada<br />
pelo tempo até a ocorrência <strong>de</strong> <strong>de</strong>terminado evento <strong>de</strong> interesse. A função<br />
<strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> f(t) é dada por:<br />
Esta função po<strong>de</strong> ser interpretada como a probabilida<strong>de</strong> do indivíduo experimentar<br />
um evento <strong>de</strong> interesse, ou falha, em um intervalo instantâneo <strong>de</strong> tempo.<br />
Na ausência <strong>de</strong> censura, (todos os pacientes experimentaram o evento antes<br />
do fim do estudo), a função f(t) po<strong>de</strong> ser estimada a partir <strong>de</strong> tabelas <strong>de</strong> distribuição<br />
<strong>de</strong> freqüência. Nestas tabelas os valores observados <strong>de</strong> T são distribuídos em<br />
classes e, para cada classe x, calcula-se f(t):<br />
A função <strong>de</strong> sobrevivência, ou seja, a probabilida<strong>de</strong> <strong>de</strong> um indivíduo<br />
sobreviver por mais <strong>de</strong> um <strong>de</strong>terminado t, é dada por:<br />
18
Uma relação importante a ser observada, é a função acumulada que po<strong>de</strong> ser<br />
escrita em termos da função <strong>de</strong> sobrevivência, sendo<br />
on<strong>de</strong><br />
Como estamos consi<strong>de</strong>rando dados não censurados, a função <strong>de</strong><br />
sobrevivência po<strong>de</strong> ser estimada por:<br />
on<strong>de</strong> tinf é o limite inferior do intervalo <strong>de</strong> tempo consi<strong>de</strong>rado x.<br />
Há ainda a fórmula da função <strong>de</strong> riscos (hazard function), ou λ(t), também<br />
conhecida como força instantânea <strong>de</strong> mortalida<strong>de</strong> ou taxa instantânea <strong>de</strong> falha em<br />
um período curto <strong>de</strong> tempo, dado que um indivíduo estava vivo até o instante t-1. A<br />
função λ(t) é dada por:<br />
que é inversamente proporcional à função <strong>de</strong> sobrevivência, ou seja, quando o risco<br />
aumenta a probabilida<strong>de</strong> <strong>de</strong> sobrevivência diminui e vice-versa.<br />
dado por:<br />
Um estimador para a função <strong>de</strong> risco com dados não censurados po<strong>de</strong> ser<br />
ˆ nº<br />
ocorrências<br />
_ na _ classe(<br />
x)<br />
λ<br />
X ( t)<br />
=<br />
nº<br />
que _ não _ falharam _ até _ a _ classe<br />
19
número <strong>de</strong> eventos observados no intervalo <strong>de</strong> classe x divididos pelo número <strong>de</strong><br />
pacientes em risco no inicio do intervalo x e amplitu<strong>de</strong> <strong>de</strong> x.<br />
A função <strong>de</strong> risco po<strong>de</strong> ter diversos formatos, po<strong>de</strong>ndo ser constante,<br />
crescente, <strong>de</strong>crescente ou ainda assumir outros formatos como, uma forma <strong>de</strong><br />
banheira, sino etc. A Figura seguir exemplifica alguns <strong>de</strong>stes casos.<br />
Figura 3.1 – Alguns tipos <strong>de</strong> comportamento da função <strong>de</strong> risco<br />
Po<strong>de</strong>mos também encontrar a função <strong>de</strong> risco acumulada Λ(t), on<strong>de</strong> me<strong>de</strong> o<br />
risco <strong>de</strong> ocorrência no intervalo <strong>de</strong> tempo, no qual também é uma taxa, mas não<br />
esta restrita ao intervalo [0;1]. A função <strong>de</strong> risco acumulada é dada por:<br />
on<strong>de</strong> seu estimador para dados não censurados é escrito como:<br />
20
A partir das funções e relações mostradas a cima é possível encontrar<br />
algumas relações fundamentais que po<strong>de</strong>m ajudar no estudo. As principais relações<br />
são dadas por:<br />
Se consi<strong>de</strong>rarmos uma análise <strong>de</strong> dados sem censura e também com<br />
censura, técnicas <strong>de</strong> análise estatística <strong>de</strong>scritiva po<strong>de</strong>m ser realizadas usando-se<br />
medidas <strong>de</strong> dispersão (média, mediana, amplitu<strong>de</strong>, <strong>de</strong>svio-padrão e freqüência),<br />
além das formulações apresentadas anteriormente.<br />
3.2. Estimadores Não-Paramétricos<br />
As principais técnicas é o estimador atuarial e o estimador do produto-limite<br />
<strong>de</strong> Kaplan-Meier. O método atuarial para dados incompletos (Lee, 1992; Selvin,<br />
1996) calcula as probabilida<strong>de</strong>s <strong>de</strong> sobrevida em intervalos fixados previamente, e o<br />
número dos expostos a risco correspon<strong>de</strong> aos pacientes vivos ao início <strong>de</strong> cada<br />
intervalo x. O número <strong>de</strong> expostos (lx), é ajustado <strong>de</strong> acordo com o número <strong>de</strong><br />
censuras que ocorreram neste período, sob a suposição <strong>de</strong> que as censuras<br />
ocorreram uniformemente durante o período x e que, a experiência subseqüente dos<br />
casos censurados é a mesma daqueles que permanecem em observação (Kahn &<br />
21
Sempos,1989). Neste trabalho, utilizaremos apenas do estimador <strong>de</strong> Kaplan-Meier,<br />
como apresentado aseguir.<br />
3.2.1 Estimador <strong>de</strong> Kaplan-Meier<br />
Na análise <strong>de</strong> sobrevida pelo método <strong>de</strong> Kaplan-Meier (Kaplan & Meier, 1958;<br />
Lee, 1992; Kleinbaum, 1995) os intervalos <strong>de</strong> tempo não são fixos, mas<br />
<strong>de</strong>terminados pelo aparecimento <strong>de</strong> uma falha (por exemplo, o óbito). Nessa<br />
situação, o número <strong>de</strong> óbitos em cada intervalo <strong>de</strong>ve ser um. Esse é um método não<br />
paramétrico, ou seja, que in<strong>de</strong>pen<strong>de</strong> da distribuição <strong>de</strong> probabilida<strong>de</strong> (Colton, 1979),<br />
e para calcular os estimadores, primeiramente, <strong>de</strong>ve-se or<strong>de</strong>nar os tempos <strong>de</strong><br />
sobrevida em or<strong>de</strong>m crescente. Os sobreviventes ao tempo t (lt) são ajustados pela<br />
censura, ou seja, os pacientes censurados entram no cálculo da função <strong>de</strong><br />
probabilida<strong>de</strong> <strong>de</strong> sobrevida acumulada até o momento <strong>de</strong> serem consi<strong>de</strong>rados como<br />
perda, o que propicia o uso mais eficiente das informações disponíveis (Szklo &<br />
Nieto, 2000).<br />
Define-se a função S(t) por um estimador conhecido como estimador produto<br />
limite <strong>de</strong> Kaplan-Meier, pois é o limite do produto dos termos até o tempo t:<br />
e lj = numero <strong>de</strong> expostos ao risco no inicio do período.<br />
Tendo que a função <strong>de</strong> risco acumulada é dada por:<br />
po<strong>de</strong>-se estimar qualquer das funções através das relações fundamentais(GIOLO,<br />
S. R).<br />
Métodos <strong>de</strong> cálculo para estimar a variância e os intervalos <strong>de</strong> confiança da<br />
probabilida<strong>de</strong> <strong>de</strong> sobrevivência estão disponíveis e são bem <strong>de</strong>scritos por Kleinbaum<br />
(1995), Lee (1992), Parkin & Hakulinen (1991), Selvin (1996), e Szklo & Nieto<br />
(2000). Esta estimativa enfatiza o tamanho do efeito e indica a faixa <strong>de</strong> valores<br />
22
plausíveis para a sobrevida. A variância do estimador <strong>de</strong> Kaplan-Meier, na qual é<br />
dada pelo estimador <strong>de</strong> Greenwood é dada por:<br />
on<strong>de</strong> dj é o numero <strong>de</strong> falhas em <strong>de</strong>terminado tj, e nj é o numero <strong>de</strong> quantos não<br />
falharam em <strong>de</strong>terminado tj (exclusive).<br />
Se formos construir um intervalo <strong>de</strong> confiança para o estimador <strong>de</strong> Kaplan-<br />
Meier os limites seriam calculados pela seguinte expressão:<br />
entretanto esse intervalo permite valores negativos e maiores que 1, o que é<br />
incompatível com a <strong>de</strong>finição <strong>de</strong> sobrevivência. Para evitar esse problema basta<br />
construir um intervalo simétrico para o risco aplicando ln assim a expressão fica:<br />
on<strong>de</strong> os limites são dados por:<br />
e o <strong>de</strong>svio padrão dado por:<br />
23
3.2.2 O Teste <strong>de</strong> Log-Rank<br />
A aplicação <strong>de</strong>sses mo<strong>de</strong>los permite comparar o conjunto <strong>de</strong> curvas <strong>de</strong><br />
sobrevida das diversas categorias <strong>de</strong> uma única variável in<strong>de</strong>pen<strong>de</strong>nte. Para<br />
comparar as curvas <strong>de</strong> sobrevida acumulada entre diferentes categorias <strong>de</strong> uma<br />
mesma variável, recomenda-se utilizar o teste log-rank (Cox & Oakes, 1984;<br />
Kleinbaum, 1995), que se baseia no confronto entre o evento <strong>de</strong> interesse<br />
observados nos dois grupos e aqueles esperados. A diferença entre o evento <strong>de</strong><br />
interesse observados e esperados é avaliada por meio do teste do Qui-quadrado.<br />
Com a estatística <strong>de</strong> log-rank po<strong>de</strong>mos testar as hipótese <strong>de</strong> que as curvas<br />
<strong>de</strong> sobrevivências são iguais para os dois grupos ou o oposto. A estatística é dada<br />
por:<br />
on<strong>de</strong> N1= total <strong>de</strong> eventos observados no estrato 1 e E1= total <strong>de</strong> eventos esperados<br />
no estrato 1. O calculo da variância é obtido por:<br />
A aplicabilida<strong>de</strong> <strong>de</strong>ste teste será vista nos resultados <strong>de</strong>sta pesquisa.<br />
3.3 Estimadores Paramétricos<br />
Para <strong>de</strong>terminarmos as variáveis que serão usadas no mo<strong>de</strong>lo, foi utilizado<br />
previamente a distribuição gama-generalizada, pois assume diversos formatos na<br />
função <strong>de</strong> risco e <strong>de</strong> sobrevivência facilitando a mo<strong>de</strong>lagem e também engloba as<br />
distribuições <strong>de</strong> probabilida<strong>de</strong>: Exponencial, Weibull e a Log-Normal. Estas<br />
distribuições são apresentadas a seguir.<br />
24
3.3.1 Mo<strong>de</strong>lo Exponencial<br />
A distribuição exponencial tem uma característica importante a ser utilizada<br />
em analise <strong>de</strong> sobrevivência, pois ela possui a taxa <strong>de</strong> risco constante, proprieda<strong>de</strong><br />
<strong>de</strong> falta <strong>de</strong> memória. Sua função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> é dada por:<br />
e sua função <strong>de</strong> sobrevivência dada por:<br />
Como já dito, a sua taxa <strong>de</strong> falha é constante, o que po<strong>de</strong> ser claramente<br />
visualizado dividindo a função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> pela função <strong>de</strong><br />
sobrevivência (“relações fundamentais“) o que resulta na função <strong>de</strong> risco que é dada<br />
por:<br />
Nas Figuras 3.2 e 3.3 estão presentes algumas formas que a função <strong>de</strong><br />
sobrevivência e a função <strong>de</strong> risco da distribuição exponencial po<strong>de</strong>m assumir,<br />
quando variamos os valores <strong>de</strong> seu parâmetro.<br />
25
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />
t<br />
α = 0,5<br />
α = 1,0<br />
α = 1,5<br />
α = 3,0<br />
Figura 3.2: Função <strong>de</strong> sobrevivência da exponencial<br />
h(t)<br />
0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />
0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />
t<br />
α = 0,5<br />
α = 1,0<br />
α = 1,5<br />
α = 3,0<br />
Figura 3.3: Função <strong>de</strong> risco da exponencial<br />
26
3.3.2 Mo<strong>de</strong>lo Weibull<br />
Proposto por Weibull (1954), este mo<strong>de</strong>lo representa uma generalização da<br />
distribuição exponencial e, <strong>de</strong> acordo com Lawless (1982), é bastante utilizada no<br />
ajuste <strong>de</strong> dados <strong>de</strong> confiabilida<strong>de</strong> nas diversas áreas do conhecimento, entre elas a<br />
medicina e engenharia. Na engenharia, a distribuição Weibull é a principal função <strong>de</strong><br />
confiabilida<strong>de</strong>, sendo utilizada para mo<strong>de</strong>lar a distribuição da vida útil e taxa <strong>de</strong> risco<br />
em produtos industriais.<br />
Uma característica <strong>de</strong>sta distribuição é que, se γ=1, a distribuição weibull é<br />
equivalente à distribuição exponencial. Sua função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> é<br />
dada por:<br />
on<strong>de</strong> α representa o 63º percentil. A função <strong>de</strong> sobrevivência e <strong>de</strong> risco será:<br />
e<br />
É muito importante salientar que o mo<strong>de</strong>lo Weibull é muito utilizado na prática<br />
por apresentar uma gran<strong>de</strong> varieda<strong>de</strong> na forma da função <strong>de</strong> risco sendo:<br />
• Crescente para γ>1<br />
• Decrescente para γ
h(t)<br />
0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />
0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />
t<br />
γ = 0,5<br />
γ = 1,0<br />
γ = 1,5<br />
γ = 3,0<br />
α = 1,5<br />
Figura 3.4: Função <strong>de</strong> sobrevivência da Weibull<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
3.3.3 Mo<strong>de</strong>lo Log-Normal<br />
0.0 0.5 1.0 1.5 2.0 2.5<br />
t<br />
γ = 0,5<br />
γ = 1,0<br />
γ = 1,5<br />
γ = 3,0<br />
α = 1,5<br />
Figura 3.5: Função <strong>de</strong> risco da Weibull<br />
A distribuição log-normal é muito usada para ajustar dados referentes a<br />
confiabilida<strong>de</strong>, assim como a distribuição Weibull. De acordo com Nelson (1990),<br />
existem diversas aplicações <strong>de</strong>ste mo<strong>de</strong>lo em testes para o tempo <strong>de</strong> falha <strong>de</strong><br />
28
produtos. Uma discussão <strong>de</strong>talhada sobre este mo<strong>de</strong>lo po<strong>de</strong> ser encontrada em<br />
Crow e Shimizu (1988). Essa distribuição é também muito utilizada neste tipo <strong>de</strong><br />
análise, pois o logaritmo do tempo possui uma distribuição normal com média µ e<br />
<strong>de</strong>svio-padrão σ, ou seja, os parâmetros estimados <strong>de</strong>sta distribuição é <strong>de</strong> fácil<br />
interpretação. A função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> da distribuição log-normal é<br />
dada por:<br />
A função taxa <strong>de</strong> falha da distribuição log-normal não tem uma forma fechada.<br />
Ela não é monótona, como o caso da distribuição Weibull. Ela cresce, atinge um<br />
valor máximo, e <strong>de</strong>pois <strong>de</strong>cresce, ou seja, o risco <strong>de</strong> falha instantânea diminui com o<br />
tempo. O comportamento da função <strong>de</strong> sobrevivência e função <strong>de</strong> risco são<br />
mostrados nas Figuras 3.6 e 3.7 para alguns valores <strong>de</strong> µ e σ.<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 2 4 6 8 10<br />
t<br />
σ = 0,5<br />
σ = 1,0<br />
σ = 1,5<br />
σ = 3,0<br />
µ = 1,5<br />
Figura 3.6: Função <strong>de</strong> sobrevivência da log-normal<br />
σ>0,<br />
µ>0<br />
29
h(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0.0 0.5 1.0 1.5 2.0 2.5<br />
t<br />
σ = 0,5<br />
σ = 1,0<br />
σ = 1,5<br />
σ = 3,0<br />
µ = 1,5<br />
Figura 3.7: Função <strong>de</strong> risco da log-normal<br />
3.3.4 Mo<strong>de</strong>lo Gama-Generalizada<br />
A distribuição Gama-Generalizada, tem uma gran<strong>de</strong> utilida<strong>de</strong> em análise <strong>de</strong><br />
sobrevivência, por englobar as três distribuições citadas anteriormente, <strong>de</strong>sta forma<br />
facilmente po<strong>de</strong>mos construir um mo<strong>de</strong>lo através <strong>de</strong>sta distribuição e em um<br />
segundo momento, inferir para um mo<strong>de</strong>lo mais simples. Sua função <strong>de</strong>nsida<strong>de</strong> é<br />
dada por:<br />
A função <strong>de</strong> sobrevivência será:<br />
on<strong>de</strong><br />
α>0<br />
k= inteiro positivo<br />
30
3.4. Método <strong>de</strong> Estimação<br />
Afim <strong>de</strong> estimar os parâmetros do mo<strong>de</strong>lo, utilizaremos o método <strong>de</strong> máxima<br />
verossimilhança, que trata o problema <strong>de</strong> estimação da seguinte forma: baseado nos<br />
resultados obtidos pela amostra, qual é a distribuição entre todas aquelas <strong>de</strong>finidas<br />
pelos possíveis valores <strong>de</strong> seus parâmetros, com maior possibilida<strong>de</strong> <strong>de</strong> ter gerado<br />
tal amostra? Em outras palavras, se por exemplo a distribuição <strong>de</strong> falha é a Weibull,<br />
para cada combinação diferente <strong>de</strong> α e β tem-se diferentes distribuições <strong>de</strong> Weibull.<br />
O estimador <strong>de</strong> máxima verossimilhança escolhe aquele par <strong>de</strong> α e β que melhor<br />
explique a amostra observada (Colosimo, 1995).<br />
Suponha uma amostra <strong>de</strong> observações t1, t2, ..., tn <strong>de</strong> uma certa população <strong>de</strong><br />
interesse. Consi<strong>de</strong>re inicialmente que todas as observações são não-censuradas. A<br />
população é caracterizada pela sua função <strong>de</strong> <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong>. Por<br />
exemplo, se f(t)=αexp(-tα), significa que as observações vem <strong>de</strong> uma distribuição<br />
exponencial com parâmetro a ser estimado. A função <strong>de</strong> verossimilhança para um<br />
parâmetro genérico θ é:<br />
A <strong>de</strong>pendência <strong>de</strong> f em θ é preciso agora ser mostrada pois L é função <strong>de</strong> θ .<br />
Nesta expressão, θ po<strong>de</strong> estar representando um único parâmetro ou um vetor <strong>de</strong><br />
parâmetros. Por exemplo, no mo<strong>de</strong>lo log-normal, θ =(µ,σ). A tradução em termos<br />
matemáticos para a frase “a distribuição que melhor explique a amostra observada”<br />
é achar o valor <strong>de</strong> θ que maximize a função L(θ). Isto é, achar o valor <strong>de</strong> θ que<br />
maximiza a probabilida<strong>de</strong> da amostra observada ter ocorrido.<br />
A função <strong>de</strong> verossimilhança L(θ) mostra que a contribuição <strong>de</strong> cada<br />
observação não-censurada é sua função <strong>de</strong> <strong>de</strong>nsida<strong>de</strong>. A observação parcial da<br />
resposta somente nos informam que o tempo <strong>de</strong> falha é maior que o tempo <strong>de</strong><br />
censura observado e portanto, que a sua contribuição para L(θ) é a sua função <strong>de</strong><br />
sobrevivência S(t). As observações po<strong>de</strong>m então ser divididas em dois conjuntos, as<br />
r primeiras são as não-censuras (1,2, ..., r) e as n-r seguintes, são as censuradas<br />
31
(r+1, r+2, ..., n). Assim a função <strong>de</strong> máxima verossimilhança assume a seguinte<br />
forma:<br />
Entretanto, se o mo<strong>de</strong>lo selecionado for usado ina<strong>de</strong>quadamente para certo<br />
conjunto <strong>de</strong> dados, toda a análise estatística fica comprometida e<br />
consequentemente, as inferências à partir do mo<strong>de</strong>lo, ficam <strong>de</strong>storcidas.<br />
3.5. Obtenção do Mo<strong>de</strong>lo Paramétrico<br />
A escolha do mo<strong>de</strong>lo a ser utilizado é muito importante na análise<br />
paramétrica, uma vez que a utilização <strong>de</strong> um mo<strong>de</strong>lo ina<strong>de</strong>quado para um<br />
<strong>de</strong>terminado conjunto <strong>de</strong> dados po<strong>de</strong> comprometer a análise estatística, provocando<br />
viés nos resultados obtidos. Existem diversas maneiras <strong>de</strong> se verificar a a<strong>de</strong>quação<br />
<strong>de</strong> um mo<strong>de</strong>lo para dados <strong>de</strong> sobrevivência. Há casos em que a utilização <strong>de</strong> um<br />
mo<strong>de</strong>lo é <strong>de</strong>finida por sua simplicida<strong>de</strong> computacional como, segundo Nelson<br />
(1990), e Souza (2001), é o caso do mo<strong>de</strong>lo exponencial que, por apresentar<br />
resultados simples e bastante conhecidos é muitas vezes utilizados <strong>de</strong> forma<br />
in<strong>de</strong>vida. Cain (2002) apresenta simulações <strong>de</strong> Monte Carlo para distinguir entre a<br />
distribuição log-normal e Weibull.<br />
Neste estudo optou-se por utilizar uma estratégia <strong>de</strong> seleção <strong>de</strong> mo<strong>de</strong>los<br />
<strong>de</strong>rivada da proposta <strong>de</strong> Collett (1994). São utilizados seis passos no processo <strong>de</strong><br />
seleção.<br />
Passo 1 – ajustar todos os mo<strong>de</strong>los contendo uma única covariável. Incluir todas as<br />
covariáveis que forem significativas ao nível <strong>de</strong> 0,10. É aconselhável utilizar o teste<br />
da razão <strong>de</strong> verossimilhanças neste passo.<br />
Passo 2 – as covariáveis significativas no passo 1 são, então, ajustadas<br />
conjuntamente. Na presença <strong>de</strong> certas covariáveis, outras po<strong>de</strong>m <strong>de</strong>ixar <strong>de</strong> ser<br />
32
significativas. Consequentemente, ajusta-se mo<strong>de</strong>los reduzidos, excluindo uma<br />
única covariável <strong>de</strong> cada vez. Verificam-se as covariáveis que provocam um<br />
aumento estatisticamente significativo na estatística da razão <strong>de</strong> verossimilhanças.<br />
Somente aquelas que atingirem a significância permanecem no mo<strong>de</strong>lo.<br />
Passo 3 – ajusta-se um novo mo<strong>de</strong>lo com as covariáveis retiradas no passo 2. Neste<br />
passo, as covariáveis excluídas no passo 2 retornam ao mo<strong>de</strong>lo para confirmar que<br />
elas não são estatisticamente significativas.<br />
Passo 4 – as eventuais covariáveis significativas no passo 3 são incluídas ao<br />
mo<strong>de</strong>lo juntamente com aquelas do passo 2. Neste passo, retorna-se com as<br />
covariáveis excluídas no passo 1 para confirmar que elas não são estatisticamente<br />
significativas.<br />
Passo 5 – ajusta-se um mo<strong>de</strong>lo incluindo-se as covariáveis significativas no passo 4.<br />
Neste passo é testado se alguma <strong>de</strong>las po<strong>de</strong> ser retirada do mo<strong>de</strong>lo.<br />
Passo 6 – utilizando as covariáveis que sobreviveram ao passo 5, ajusta-se o<br />
mo<strong>de</strong>lo final para os efeitos principais. Para completar a mo<strong>de</strong>lagem, <strong>de</strong>ve-se<br />
verificar a possibilida<strong>de</strong> <strong>de</strong> inclusão <strong>de</strong> termos <strong>de</strong> interação dupla entre as<br />
covariáveis incluídas no mo<strong>de</strong>lo. O mo<strong>de</strong>lo final fica <strong>de</strong>terminado pelos efeitos<br />
principais i<strong>de</strong>ntificados no passo 5 e os termos <strong>de</strong> interação significativos<br />
i<strong>de</strong>ntificados neste passo.<br />
Em cada passo do processo <strong>de</strong> seleção <strong>de</strong> covariáveis, a estatística <strong>de</strong> teste,<br />
apresentada, foi obtida utilizando-se o teste da razão <strong>de</strong> verossimilhanças com uma<br />
distribuição qui-quadrado <strong>de</strong> referência com graus <strong>de</strong> liberda<strong>de</strong> igual ao número <strong>de</strong><br />
termos excluídos (diferença entre o número <strong>de</strong> parâmetros dos dois mo<strong>de</strong>los a<br />
serem comparados).<br />
3.6 Comparação <strong>de</strong> mo<strong>de</strong>los e seleção das covariáveis<br />
33
Ao efetuar os passos <strong>de</strong> escolha das covariáveis “mo<strong>de</strong>lagem estatística”, é<br />
utilizado o teste da Razão <strong>de</strong> Verossimilhança (TRV), comparado com os mo<strong>de</strong>los<br />
nulos ou completos segundo Collett (1994), assim <strong>de</strong>cidindo quais serão as<br />
covariáveis do mo<strong>de</strong>lo.<br />
Uma vez escolhido o conjunto <strong>de</strong> covariáveis prognósticas, o interesse se<br />
concentra agora em investigar a utilização dos mo<strong>de</strong>los mais simples (casos<br />
especiais da gama generalizada), mas não menos a<strong>de</strong>quado aos dados. O teste da<br />
razão <strong>de</strong> verossimilhança também é utilizado neste caso.<br />
3.7 Teste da razão <strong>de</strong> verossimilhanças<br />
Este teste é baseado na função <strong>de</strong> verossimilhança e envolve a comparação<br />
dos valores do logaritmo da função <strong>de</strong> verossimilhança maximizada sem restrição e<br />
sob a hipótese nula <strong>de</strong> que os mo<strong>de</strong>los são a<strong>de</strong>quados. A estatística para esse teste<br />
tem uma distribuição qui-quadrado é dada por:<br />
3.8 Escolha <strong>de</strong> um mo<strong>de</strong>lo paramétrico<br />
A escolha do mo<strong>de</strong>lo a ser utilizado é muito importante na análise<br />
paramétrica, uma vez que a utilização <strong>de</strong> um mo<strong>de</strong>lo ina<strong>de</strong>quado para um<br />
<strong>de</strong>terminado conjunto <strong>de</strong> dados po<strong>de</strong> comprometer a análise estatística, provocando<br />
viés nos resultados obtidos. Existem diversas maneiras <strong>de</strong> se verificar a a<strong>de</strong>quação<br />
<strong>de</strong> um mo<strong>de</strong>lo para dados <strong>de</strong> sobrevivência. Há casos em que a utilização <strong>de</strong> um<br />
mo<strong>de</strong>lo é <strong>de</strong>finida por sua simplicida<strong>de</strong> computacional, como segundo Nelson<br />
(1990), e Souza (2001), é o caso do mo<strong>de</strong>lo exponencial que, por apresentar<br />
resultados simples e bastante conhecidos, é muitas vezes utilizados <strong>de</strong> forma<br />
in<strong>de</strong>vida. Cain (2002) apresenta simulações <strong>de</strong> Monte Carlo para distinguir entre a<br />
distribuição log-normal e Weibull.<br />
34
O ajuste do “melhor” mo<strong>de</strong>lo a ser usado para um conjunto <strong>de</strong> dados po<strong>de</strong> ser<br />
verificado, neste artigo, <strong>de</strong> duas formas: numericamente ou graficamente. A análise<br />
numérica é feita com base na estatística <strong>de</strong> máxima verossimilhança, a qual<br />
<strong>de</strong>termina como melhor mo<strong>de</strong>lo aquele que apresentar o menor valor em módulo, do<br />
log do estimador <strong>de</strong> máxima verossimilhança (Cavalcanti et al., 2002).<br />
O método gráfico utilizado comparação <strong>de</strong> mo<strong>de</strong>los ajustados é através da<br />
linearização da função <strong>de</strong> sobrevivência (Bolfarine et al., 1991). Consiste em fazer<br />
gráficos nos quais o mo<strong>de</strong>lo apropriado seja aproximadamente linear. A não<br />
linearida<strong>de</strong> po<strong>de</strong> ser percebida visualmente. Neste caso, o gráfico utilizado é <strong>de</strong> uma<br />
transformação que lineariza a função <strong>de</strong> sobrevivência do mo<strong>de</strong>lo proposto.<br />
Por exemplo, se o mo<strong>de</strong>lo exponencial for apropriado aos dados, o gráfico (–<br />
logS(t) vs t) irá resultar em uma linha reta, passando pela origem (0).<br />
A função <strong>de</strong> sobrevivência <strong>de</strong> uma distribuição log-normal po<strong>de</strong> ser<br />
linearizada na forma:<br />
on<strong>de</strong> Φ -1 são os percentis da normal padrão. Isso significa que o gráfico <strong>de</strong> Φ -1 (Sˆ(<br />
t)) vs log(t) <strong>de</strong>ve ser linear se o mo<strong>de</strong>lo log-normal for a<strong>de</strong>quado. Caso estamos<br />
interessados em linearizar o mo<strong>de</strong>lo Weibull, o gráfico log[-log(S(t))] vs. log(t) irá<br />
resultar em uma linha reta, passando pela origem (0); para a a<strong>de</strong>quação do mo<strong>de</strong>lo<br />
log-logístico o gráfico log[(1-S(t)/S(t)] vs. log (t).<br />
3.9 A<strong>de</strong>quação do mo<strong>de</strong>lo ajustado<br />
Uma avaliação da a<strong>de</strong>quação do mo<strong>de</strong>lo ajustado é parte fundamental da<br />
análise dos dados. No mo<strong>de</strong>lo <strong>de</strong> regressão linear usual, uma análise gráfica dos<br />
resíduos é usada para esta finalida<strong>de</strong>. Diversos resíduos têm sido propostos na<br />
literatura para avaliar o ajuste do mo<strong>de</strong>lo apresentado (Lawless, 1982, Klein e<br />
Moeschberger, 1997, Therneau e Grambsch, 2000).<br />
Nas seções que se seguem, os seguintes resíduos são <strong>de</strong>scritos<br />
35
• Resíduos <strong>de</strong> Cox-Snell (1968) e resíduos padronizados, úteis para examinar<br />
o ajuste global do mo<strong>de</strong>lo<br />
• Resíduos Martingale, úteis para <strong>de</strong>terminar a forma funcional (linear,<br />
quadrática etc.) <strong>de</strong> uma covariável, em geral contínua, sendo incluída no<br />
mo<strong>de</strong>lo <strong>de</strong> regressão.<br />
• Resíduos Deviance, que auxiliam a examinar a acurácia do mo<strong>de</strong>lo para cada<br />
indivíduo sob estudo.<br />
36
Capítulo 4 - Resultados<br />
Dentre os 306 pacientes observados, diversas variáveis foram inclusas no<br />
estudo, e apenas as que po<strong>de</strong>riam ter relação direta ou indireta com o tempo <strong>de</strong><br />
sobrevida do paciente permaneceram.<br />
A inclusão ou exclusão preliminar das variáveis levou em consi<strong>de</strong>ração<br />
estudos pré-realizados em hemodiálise e a opinião <strong>de</strong> pesquisadores da área, e<br />
assim, utilizamos para este estudo as variáveis da Tabela 4.1 (a altura e peso “em<br />
metros” foram transformados em uma nova variável, IMC).<br />
Tabela 4.1: Variáveis em estudo<br />
Variável Descrição Classificação<br />
Ida<strong>de</strong> Ida<strong>de</strong> em que iniciou o tratamento Contínua<br />
Sexo Masculino ou Feminino Categorica<br />
Cor Amarela, Branca, Negra ou Parda Categorica<br />
Tempo Meses em que o paciente permaneceu no estudo Contínua<br />
Sangue A, B, AB ou O Categorica<br />
FatorRH Positivo ou Negativo Categorica<br />
Transplante Indicador <strong>de</strong> transplante, Falso ou Verda<strong>de</strong> Categorica<br />
IMC Indice <strong>de</strong> massa corporica Contínua<br />
AntiHBS Indicador <strong>de</strong> vacina <strong>de</strong> hepatite B, Falso ou Verda<strong>de</strong> Categorica<br />
Censura 0 = Censurado e 1= Falha Categorica<br />
No estudo foram consi<strong>de</strong>rados 122 mulheres e 184 homens, on<strong>de</strong> 42<br />
homens apresentavam problemas <strong>de</strong> pressão alta enquanto as mulheres<br />
apenas 24 apresentavam problemas <strong>de</strong> pressão alta. A respeito do problema<br />
<strong>de</strong> Diabetes o sexo masculino também obteve uma maior freqüência, em um<br />
total <strong>de</strong> 57 homens enquanto o sexo feminino apresentou apenas 33<br />
mulheres com problemas <strong>de</strong> Diabetes.<br />
37
Consi<strong>de</strong>rando todos os pacientes a média <strong>de</strong> ida<strong>de</strong> foi <strong>de</strong><br />
aproximadamente 61 anos <strong>de</strong> ida<strong>de</strong>, on<strong>de</strong> 76% dos pacientes eram <strong>de</strong> cor<br />
branca. Outra informação relevante é que apenas 56 dos 306 pacientes<br />
conseguiram uma doação <strong>de</strong> rim. Além disso os tipos sanguíneo mais<br />
apresentados no estudo foram O, com 148 casos seguido <strong>de</strong> A com 115<br />
casos, levando em conta que o tipo sanguíneo AB obteve apenas 11 casos no<br />
estudo.<br />
Inicialmente, uma análise preliminar do tempo po<strong>de</strong> ser feita e<br />
visualizada à partir da tabela 4.2.<br />
Tabela 4.2: Medidas <strong>de</strong>scritivas dos tempos<br />
Média 49,82026<br />
Variância 2953,768<br />
Coeficiente <strong>de</strong> Variação 1,090893<br />
Mediana 29<br />
Primeiro Quartil 12<br />
Terceiro Quartil 68<br />
Mínimo 1<br />
Máximo 306<br />
Assim o tempo médio observado foi <strong>de</strong> aproximadamente 50 meses, com<br />
<strong>de</strong>svio padrão <strong>de</strong> 54,4 meses. Po<strong>de</strong>mos visualizar a assimetria e dispersão dos<br />
tempos à partir da Figura 4.1 que segue.<br />
38
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
0<br />
-50<br />
Figura 4.1: Boxplot dos tempos observados<br />
Var1<br />
Inicialmente, realizaremos uma análise não-paramétrica afim <strong>de</strong> verificarmos<br />
o comportamento dos tempos até que os pacientes experimentem o evento <strong>de</strong><br />
interesse (óbito).<br />
4.1 – Análise Não-Paramétrica<br />
O primeiro passo para analisar um conjunto <strong>de</strong> dados em sobrevivência é realizar<br />
uma análise <strong>de</strong>scritiva das variáveis através do Estimador Produto-Limite ou Kaplan-<br />
Meier (Kaplan e Meier, 1958). Uma análise não paramétrica dos tempos é<br />
apresentada afim <strong>de</strong> verificar o comportamento <strong>de</strong>sses tempos. Além do<br />
comportamento, temos o interesse em analisar as curvas <strong>de</strong> sobrevivência empírica<br />
na presença <strong>de</strong> covariáveis. Para isto aplicando o Testes Log-Rank é aplicado com<br />
o intuito <strong>de</strong> verificar as possíveis covariáveis do mo<strong>de</strong>lo <strong>de</strong> regressão.<br />
Para todas as variáveis classificas como categóricas foram construídas as curvas<br />
<strong>de</strong> sobrevivência, (Sexo, Cor, Sangue, FatorRH, Transplante, AntiHBS Diabetes e<br />
Pressão).<br />
39
S(t)<br />
S(t)<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 50 100 150 200 250 300<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
Tempo (meses)<br />
Masculino<br />
Feminino<br />
S (t)<br />
0 .0 0 .2 0 .4 0 .6 0 .8 1 .0<br />
COR como causa da insuficiência renal<br />
0 50 100 150 200 250 300<br />
Tempo (meses)<br />
(a) (b)<br />
0 50 100 150 200 250 300<br />
Tempo (meses)<br />
Negativo<br />
Positivo<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 50 100 150 200 250 300<br />
Tempo (meses)<br />
(c) (d)<br />
0 50 100 150 200 250 300<br />
Tempo (meses)<br />
Sim<br />
Não<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 50 100 150 200 250 300<br />
Tempo (meses)<br />
Sim<br />
Não<br />
Não<br />
Sim<br />
Amarela<br />
Branca<br />
Negra<br />
Parda<br />
40
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
(e) (f)<br />
0 50 100 150 200 250 300<br />
Tempo (meses)<br />
Sim<br />
Não<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
SANGUE como causa da insuficiência renal<br />
0 50 100 150 200 250 300<br />
Tempo (meses)<br />
(g) (h)<br />
Figura 4.2: Sobrevivências estimadas, via estimador <strong>de</strong> Kaplan-Meier, para<br />
as covariáveis: (a) Sexo; (b) Cor; (c) FatorRh; (d) Transplante; (e) AntiHBS;<br />
(f) Diabetes; (g) Pressão; (h) Tipo Sanguíneo.<br />
Através das figuras apresentadas em (Figura 4.2 a-h), po<strong>de</strong>mos verificar os<br />
comportamentos das funções <strong>de</strong> sobrevivência, pon<strong>de</strong>radas pelas covariáveis em<br />
estudo, covariáveis estas, categóricas.<br />
Nota-se para estas figuras que, visualmente, as curvas <strong>de</strong> Kaplan-Meier para as<br />
covariáveis Sexo, Cor, Transplante, AntiHBS, Diabetes e Pressão, se mostram<br />
distantes, o que pré-indica que os tempos <strong>de</strong> sobrevivência se comportam <strong>de</strong> forma<br />
diferenciadas para os distintos níveis <strong>de</strong>stas covariáveis..<br />
À partir <strong>de</strong>stas figuras, utilizamos do teste <strong>de</strong> log-rank para verificar, <strong>de</strong> forma<br />
quantitativa, o quanto as curvas <strong>de</strong> sobrevivência se comportam <strong>de</strong> forma distinta,<br />
ou não, para os níveis das covariáveis. O critério utilizado neste trabalho foi o <strong>de</strong><br />
manter as covariáveis que apresentarem valores p inferiores a 0,25 (ou 25%), no<br />
teste log-rank. Esta proposta em escolher um nível relativamente mo<strong>de</strong>sto <strong>de</strong><br />
significância é baseada em recomendações <strong>de</strong> Ben<strong>de</strong>l e Afifi (1997) para regressão<br />
linear, <strong>de</strong> Constanza e Afifi (1979) para análise discriminante e <strong>de</strong> Mickey e<br />
Greenland (1989) para mudanças nos coeficientes do mo<strong>de</strong>lo <strong>de</strong> regressão logística,<br />
Colosimo (2006). As estatísticas são apresentadas na Tabela 4.3.<br />
A<br />
AB<br />
B<br />
O<br />
41
Tabela 4.3: Resultados do teste <strong>de</strong> log-rank<br />
Covariáveis<br />
<strong>Estatística</strong> <strong>de</strong><br />
teste Log-rank Valor p<br />
Ida<strong>de</strong> 419,43 0,001<br />
Sexo 6,86<br />
0,008<br />
Cor 11,16<br />
0,01<br />
Sangue 0,033<br />
0,99<br />
Fator RH 1,1<br />
0,29<br />
Transplante 15,96 0,001<br />
IMC 800,76 0,001<br />
AntHBS 30,92 0,001<br />
Diabets 20,77<br />
7,53<br />
0,001<br />
Pressão 0,006<br />
Os testes indicaram que apenas as covariáveis Tipo Sanguíneo e FatorRH não<br />
apresentaram diferença nas curvas <strong>de</strong> sobrevivência. Portanto, as covariáveis Sexo,<br />
Cor, Transplante, IMC, AntiHBS, Diabetes e Pressão <strong>de</strong>vem ser incluídas no<br />
mo<strong>de</strong>lo, uma vez que estas apresentam diferença significativa no comportamento<br />
dos tempos <strong>de</strong> vida dos pacientes em estudo<br />
4.2 – Análise Paramétrica<br />
A próxima etapa é <strong>de</strong>finir qual distribuição <strong>de</strong> probabilida<strong>de</strong> melhor <strong>de</strong> ajusta ao<br />
tempo <strong>de</strong> sobrevida estudado. Para isto, partiu da distribuição Gama Generalizada.<br />
Foram, então, construídos os testes da razão <strong>de</strong> verossimilhança para indicar quais<br />
variáveis <strong>de</strong>veram continuar no mo<strong>de</strong>lo. Os testes são apresentados na Tabela 4.4.<br />
42
Tabela 4.4: Resultado dos testes da Razão <strong>de</strong><br />
verossimilhança<br />
Estatistica <strong>de</strong><br />
Passos Mo<strong>de</strong>lo -2logL(θ) teste (TRV) Valor p<br />
Passo 1 nulo 629,96 - -<br />
ida<strong>de</strong> (id) 594,08 35,880 0,000<br />
sexo (sx) 626,02 3,940 0,047<br />
cor (cr) 613,28 16,680 0,000<br />
transplante (tr) 603,46 26,500 0,000<br />
imc (im) 628,5 1,460 0,227<br />
antihbs (na) 598,5 31,460 0,000<br />
diabetes (di) 613,5 16,460 0,000<br />
pressao (pr) 622,44 7,520 0,006<br />
Passo 2 id+sx+cr+tr+na+di+pr 533,12 - 0,000<br />
sx+cr+tr+na+di+pr 555,46 22,34 0,000<br />
id+cr+tr+na+di+pr 539,92 6,8 0,009<br />
id+sx+tr+na+di+pr 541,66 8,54 0,003<br />
id+sx+cr+an+di+pr 535,78 2,66 0,103<br />
id+sx+cr+tr+im+di+pr 550,88 17,76 0,000<br />
id+sx+cr+tr+na+pr 533,3 0,18 0,671<br />
id+sx+cr+tr+na+di 544,68 11,56 0,001<br />
Passo 3 id+sx+cr+na+pr 535,92 - -<br />
id+sx+cr+na+pr+tr 533,3 2,62 0,106<br />
id+sx+cr+na+pr+di 535,78 0,14 0,708<br />
Passo 4 id+sx+cr+na+pr 535,92 - -<br />
id+sx+cr+na+pr+im 535,5 0,42 0,517<br />
Passo 5 id+sx+cr+na+pr 535,92 - -<br />
sx+cr+na+pr 571,84 35,92 0,000<br />
id+cr+na+pr 544,36 8,44 0,004<br />
id+sx+na+pr 546,4 10,48 0,001<br />
id+sx+cr+pr 557,88 21,96 0,000<br />
id+sx+cr+na 549,42 13,5 0,000<br />
Para análise, utilizamos Software SAS para obter as estimativas, e o Software<br />
R para a construção dos gráficos. Os resultados da Tabela 4.4 indicam que as<br />
covariáveis Ida<strong>de</strong>, Sexo, Cor, AntiHBS e Pressão são estatisticamente<br />
significativas para o mo<strong>de</strong>lo.<br />
A fim <strong>de</strong> verificar o ajuste <strong>de</strong>stas covariáveis, foram plotados os seus ajustes<br />
versos as curvas empíricas <strong>de</strong> Kaplan-Meier<br />
Primeiramente analisamos qual distribuição se ajusta melhor com as curvas<br />
<strong>de</strong> sobrevivência, não levando em conta as covariáveis. Os gráficos do tempo <strong>de</strong><br />
sobrevida com o ajuste paramétrico para as distribuições exponencial, weibull e<br />
log-normal estão dispostos na Figura 4.3.<br />
43
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
Kaplan-Meier<br />
exponencial<br />
0 50 100 150 200 250 300<br />
Tempos<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
Kaplan-Meier<br />
Weibull<br />
0 50 100 150 200 250 300<br />
Tempos<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
Kaplan-Meier<br />
Log-normal<br />
0 50 100 150 200 250 300<br />
Tempos<br />
Figura 4.3: Curvas <strong>de</strong> sobrevivência com os ajustes da<br />
Exponencial, weibull e log-normal<br />
Para tentar obter um melhor ajuste paramétrico graficamente, também<br />
utilizamos a linearização da função <strong>de</strong> sobrevivência da função exponencial,<br />
weibull e log-normal respectivamente mostrados na Figura 4.4 e 4.5.<br />
44
S(t): Exponencial<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
S(t): Kaplan-Meier<br />
S(t): Weibull<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
S(t): Kaplan-Meier<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
S(t): Kaplan-Meier<br />
Figura 4.4: Gráficos das sobrevivências estimadas por Kaplan-Meier versus<br />
as sobrevivências estimadas pelos mo<strong>de</strong>los exponencial, <strong>de</strong> Weibull e log-<br />
-Log(S(t))<br />
0.0 0.5 1.0 1.5 2.0 2.5<br />
0 50 100 200 300<br />
Tempos<br />
normal, respectivamente.<br />
log(-log(S(t)))<br />
-5 -4 -3 -2 -1 0 1<br />
0 1 2 3 4 5<br />
log(tempos)<br />
S(t): Log-Normal<br />
-1 0 1 2<br />
0 1 2 3 4 5<br />
log(tempos)<br />
Figura 4.5: Gráficos da linearização para os mo<strong>de</strong>los exponencial, weibull e<br />
log-normal respectivamente.<br />
Φ −1 (S(t))<br />
45
Após análise gráfica os três mo<strong>de</strong>los foram comparados através do valor da<br />
log verossimilhança. O valor das estatísticas estão na Tabela 4.5.<br />
Tabela 4.5: Resultados dos testes da razão <strong>de</strong> verossimilhança.<br />
Mo<strong>de</strong>lo Log-verossimilhança<br />
Exponencial 274,29<br />
Weibull 268,21<br />
Log-Normal 278,26<br />
O mo<strong>de</strong>lo que mais se a<strong>de</strong>qua aos tempos em estudo é o que apresenta<br />
menor valor em módulo do log da verossimilhança, sendo assim, consi<strong>de</strong>ramos<br />
para este estudo o ajuste através do mo<strong>de</strong>lo Weibull.<br />
4.2.1 - Verificação do ajuste<br />
Para verificar o ajuste foi construído as curvas estimatimadas <strong>de</strong> Kaplan-<br />
Meier versos o ajuste do mo<strong>de</strong>lo para cada um dos parâmetros. Assim os ajustes<br />
foram:<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 50 100 150 200 250 300<br />
t<br />
Masculino<br />
Feminino<br />
Figura 4.6: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />
Versus o ajuste do mo<strong>de</strong>lo Weibull para o fator sexo.<br />
46
Para o fator sexo, percebemos um bom ajuste a partir do mo<strong>de</strong>lo Weibull, isso<br />
significa que o mo<strong>de</strong>lo está prevendo bem os dados comparando com as<br />
estimativas <strong>de</strong> Kaplan-Meier. A análise indica que os homens com problemas<br />
renais possuem uma estimativa maior do tempo <strong>de</strong> vida comparado ao sexo<br />
feminino com problemas renais.<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 50 100 150 200 250 300<br />
Figura 4.7: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />
Versus o ajuste do mo<strong>de</strong>lo Weibull para a variável pressão.<br />
Para o fator Pressão o mo<strong>de</strong>lo ajustado Weibull também obteve uma boa<br />
precisão mesmo que a calda não esteja bem ajustada. A interpretação para esse<br />
gráfico é que os pacientes com problemas renais que possuem pressão alta<br />
possuem uma estimativa do tempo <strong>de</strong> vida menor que os pacientes com<br />
problemas renais que não têm problemas com pressão alta.<br />
t<br />
False<br />
True<br />
47
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
0 50 100 150 200 250 300<br />
Figura 4.8: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />
Versus o ajuste do mo<strong>de</strong>lo Weibull para o fator AntiHBS.<br />
t<br />
O fator AntiHBS mostra-se bem ajustada ao mo<strong>de</strong>lo paramétrico Weibull,<br />
on<strong>de</strong> po<strong>de</strong>-se interpretar que pacientes com problemas renais que tomaram<br />
vacina <strong>de</strong> hepatite B possuem uma estimativa maior do tempo <strong>de</strong> vida do que os<br />
pacientes com problemas renais não vacinados.<br />
Por fim, a Figura 4.9 apresenta o ajuste para a covariável cor do paciente.<br />
S(t)<br />
0.0 0.2 0.4 0.6 0.8 1.0<br />
False<br />
True<br />
0 50 100 150 200 250 300<br />
t<br />
Amarela<br />
Branca<br />
Negra<br />
parda<br />
Figura 4.9: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />
Versus o ajuste do mo<strong>de</strong>lo weibull para o fator cor.<br />
48
4.2.2 - Estimativa dos Parâmetros do Mo<strong>de</strong>lo Ajustado Weibull<br />
Consi<strong>de</strong>re o mo<strong>de</strong>lo Weibull ajustado dado por:<br />
S(t)= exp[ -[ t/µ(x)] γ ]<br />
on<strong>de</strong><br />
^ ^ ^ ^ ^ ^ ^ ^<br />
µ(x)= exp( β 0 β 1 x1 + β 2 x2<br />
+ β 3 x3<br />
+ β 4 x4<br />
+ β 5 x5<br />
+ β 6 x6<br />
+ β 7 x7<br />
e<br />
+ )<br />
X1=ida<strong>de</strong>, X2=sexo, X3=cor amarela, X4=cor branca, X5=cor negra, X6=AntiHBS e<br />
X7=Pressão.<br />
Assim as estimativas dos parâmetros são apresentadas na Tabela 4.6 que<br />
segue.<br />
Tabela 4.6: Estimativas dos parâmetros<br />
Parametros Estimativa <strong>Estatística</strong> Teste P-valor<br />
Intercepto 74,537 187,7
• Cor: O tempo mediano <strong>de</strong> vida dos pacientes com problemas renais <strong>de</strong> cor<br />
parda é 2,2, 2,6 e 1,9 vezes maior do que pacientes <strong>de</strong> cor amarela, branca e<br />
negra respectivamente.<br />
• AntiHBS: Pacientes que tomaram a vacina contra hepatite B e apresentam<br />
problemas renais tem o tempo mediano <strong>de</strong> vida 2 vezes maior que os<br />
pacientes que não tomaram vacina contra hepatite B e tem problemas renais.<br />
• Pressão: Pacientes que fazem tratamento renal e não possuem problemas <strong>de</strong><br />
pressão alta tem aproximadamente o dobro do tempo mediano <strong>de</strong> vida.<br />
4.2.3 - Análise <strong>de</strong> resíduos<br />
res.mart<br />
-2 -1 0 1<br />
0 50 100 150 200 250 300<br />
In<strong>de</strong>x<br />
Figura 4.10: Resíduos Martingale<br />
50
es.<strong>de</strong>vi<br />
-log(r.surv1$surv)<br />
-1 0 1 2 3<br />
0 1 2 3 4<br />
0 50 100 150 200 250 300<br />
In<strong>de</strong>x<br />
Figura 4.11: Resíduos Deviance<br />
0 1 2 3<br />
r.surv1$time<br />
Figura 4.12: Resíduos Cox-Snell<br />
51
Capítulo 5 – Conclusão<br />
Evi<strong>de</strong>nciou-se a importância dos estudos <strong>de</strong> sobrevivência nessa população<br />
<strong>de</strong> pacientes renais crônicos para elucidar muitas questões ainda obscuras,<br />
especialmente, pela escassez <strong>de</strong> estudos <strong>de</strong>ssa natureza em nosso meio.<br />
Recomenda-se um preenchimento mais cuidadoso dos prontuários por parte<br />
<strong>de</strong> médicos e <strong>de</strong>mais profissionais envolvidos no contato direto com os pacientes.<br />
Com o mo<strong>de</strong>lo ajustado, é possível fazer previsões aos pacientes <strong>de</strong><br />
hemodiálise do hospital Instituto do Rim <strong>de</strong> Maringá, lembrando que um mo<strong>de</strong>lo<br />
<strong>de</strong>ve estar sempre sendo reajustado, com novas observações, uma vez que pelo<br />
fato da população estar sempre em constante <strong>de</strong>senvolvimento, os mo<strong>de</strong>los vão<br />
per<strong>de</strong>ndo seus ajustes.<br />
Informações importantes pu<strong>de</strong>ram ser observadas, como as que o sexo<br />
feminino, pressão alta, vacina contra hepatite B e pacientes <strong>de</strong> cor branca são<br />
fatores em potencial para diminuir o tempo <strong>de</strong> vida <strong>de</strong> pacientes com problemas<br />
renais, sendo os fatores pressão e AntiHBS os mais significativos, pois diminuem o<br />
dobro do tempo <strong>de</strong> vida dos pacientes.<br />
Um cuidado especial <strong>de</strong>ve ser tomado com crianças que apresentam<br />
problemas renais, pois a cada ida<strong>de</strong> ganha sem problemas o tempo <strong>de</strong>vido a<br />
fatalida<strong>de</strong> cai em 3%.<br />
Analise <strong>de</strong> resíduos não é feita em dados <strong>de</strong> sobrevivência, pelo fato da<br />
ausência <strong>de</strong> normalida<strong>de</strong> dos resíduos. Existem já estudos para tal problema, on<strong>de</strong><br />
<strong>de</strong>vem ser concluídos para tal analise.<br />
52
Bibliografias<br />
Ben<strong>de</strong>l, R. e Afifi A. Comparison of Stopping Rules in Forward ‘Stepwise’<br />
Regression. En: Journal of the American Statistical Association, 72 (357): 46-53,<br />
1977.<br />
BOLFARINE, H.; RODRIGUES, J.; ACHCAR, J. A. Análise <strong>de</strong> Sobrevivência. 2ª<br />
Escola Nacional <strong>de</strong> Mo<strong>de</strong>los <strong>de</strong> Regressão, Rio <strong>de</strong> Janeiro, 1991.<br />
CAIN, S. R. Distinguishing Between Lognormal and Weibull distributions.<br />
International Journal of Reability, Quality and Safety Engineering, vol. 51, nº 01,<br />
2002.<br />
CASTANHEIRA J. ; PEREIRA T.; CONDE J. Impacto da hemodiálise versus diálise<br />
peritoneal na anatomia cardíaca em doentes com insuficiência renal crônica. In:<br />
CONGRESO VIRTUAL DE CARDIOLOGÍA, 4., 2005.<br />
COLLET, D. Mo<strong>de</strong>lling survival data in medical research. New York: Chapman and<br />
Hall, 1994.<br />
COLOSIMO, E. A. Análise <strong>de</strong> Sobrevivência Aplicada. In: 46ª Reunião Anual da<br />
Região Brasileira da Socieda<strong>de</strong> Internacional <strong>de</strong> Biometria (RBRAS) e 9º Simpósio<br />
<strong>de</strong> <strong>Estatística</strong> Aplicada e Experimentação Agronômica (SEAGRO). Piracicaba, 1995.<br />
COLOSIMO, E. A.; GIOLO, S. R. Análise <strong>de</strong> sobrevivência aplicada. São Paulo:<br />
Edgard Blücher, 2006. 369p.<br />
COLTON, T., 1979. Statistica in Medicine. Padova: Piccin Editore.<br />
Costanza M. C. and Afifi A, Comparison of stopping rules in forward stepwise<br />
discriminant analysis, Journal of the American Statistical Analysis, 74, 777-785,<br />
1979.<br />
CARDOZO, M.T.; VIEIRA, I.O.; CAMPANELLA, L.C.A. Alterações nutricionais em<br />
pacientes renais crônicos em programa <strong>de</strong> hemodiálise. Revista Brasileira <strong>de</strong><br />
Nutição Clínica, v. 21(4), p. 284-289, 2006.<br />
CAVAlLCANTE, U.M.T.; Maia, L.C.; Melo, A.M.M. & Santos, V.F. Influência da<br />
<strong>de</strong>nsida<strong>de</strong> <strong>de</strong> fungos micorrízicos arbusculares na produção <strong>de</strong> mudas <strong>de</strong><br />
maracujazeiro-amarelo. Pesquisa Agropecuária Brasileira 37: 643-649. 2002.<br />
COX, D. R.; OAXES, D. Analysis of Survival Data. 1ª Ed. London: Chapman & Hall,<br />
1984.<br />
54
COX, D. R.; SNELL, E. J. A general <strong>de</strong>finition of residuals. Journal of the Royal<br />
Statistical Society B, London, v. 30, n. 2, p. 248-254, Mar. 1968.<br />
CROW, E. L., SHIMIZU, K. Lognormal Distributions. New York: Marcel Dekker, 1988.<br />
FLETCHER, R. H.; FLETCHER, S. W. & WAGNER, E. H.. Epi<strong>de</strong>miologia Clínica:<br />
Elementos Essenciais, 3a Ed. Porto Alegre: Artes Médicas, 1996.<br />
KAHN, H. A. & SEMPOS, C. T., Statistical Methods in Epi<strong>de</strong>miology. New<br />
York/Oxford: Oxford University Press, 1989.<br />
KAPLAN, E. L. & MEIER, P., 1958. Non parametric estimation from incomplete<br />
observation. Journal of the American Statistics Association, 53:457-481, 1989.<br />
KLEIBAUM, D. G. Survival Analysis: a self-learning text. New York: Springer-Verlag,<br />
1996.<br />
Klein and Moeschberger, Survival Analysis Techniques for Censored and truncated<br />
data, Springer, 1997.<br />
KLEINBAUM, D. G., Survival Analysis: A Self-Learning Text. New York: Springer,<br />
1995.<br />
LAWLESS, J. F. Statistical Mo<strong>de</strong>ls and Methods for Lifetime Data. New York: Wiley,<br />
1982.<br />
LEE, E. T. Statistical methods for Survival data Analysis. 2ª Ed. New York: john Wiley<br />
& Sons, 1992.<br />
MARQUES, A. B.; PEREIRA, D. C.; RIBEIRO, R. C. H. M. Motivos e freqüência <strong>de</strong><br />
internação dos pacientes com IRC em tratamento hemodialítico. Arq. Ciênc. Saú<strong>de</strong>.,<br />
São José do Rio Preto, v.12, n.2, p.67-72, 2005.<br />
MICKEY, J., ANDS . GREENLAND. A study of the impacto f confoun<strong>de</strong>r-selection<br />
criteria on effect estimation. American Journal of Epi<strong>de</strong>miology 129:125-137, 1989.<br />
NELSON, W. Accelerated Life Testing: Statistical Mo<strong>de</strong>ls, data Analysis and Test<br />
Plans. New York: John Wiley & Sons, 1990.<br />
PARKIN, D. M. & HAKULINEN, T., Analysis of survival. In: Cancer Registration<br />
Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir & R.<br />
G. Skeet, ed.), IARC Scientific Publications 95, pp. 159-176, Lyon: International<br />
Agency for Research on Cancer, 1991.<br />
SANTOS, P. R. Associação <strong>de</strong> qualida<strong>de</strong> <strong>de</strong> vida com hospitalização e óbito em<br />
pacientes portadores <strong>de</strong> doença renal crônica em hemodiálise. J. Bras. Nefrol., São<br />
Paulo, v.27, n.4, 2005.<br />
55
SBN - Socieda<strong>de</strong> Brasileira <strong>de</strong> Nefrologia. Disponível em: <br />
.Acesso em: 18 maio 2009.<br />
SELVIN, S., Statistical Analysis of Epi<strong>de</strong>miologic Data. 2nd Ed. New York/Oxford:<br />
Oxford University Press, 1996.<br />
SOUZA, E. X. <strong>de</strong>. Análise <strong>de</strong> Confiabilida<strong>de</strong>: Um estudo sobre o Tempo <strong>de</strong> Vida <strong>de</strong><br />
Pneus. Natal. 62 p. Monografia (Graduação em <strong>Estatística</strong>). <strong>Departamento</strong> <strong>de</strong><br />
<strong>Estatística</strong>, Universida<strong>de</strong> Fe<strong>de</strong>ral do Rio Gran<strong>de</strong> do Norte, 2001.<br />
SZKLO, M. & NIETO, F. J., Epi<strong>de</strong>miology: Beyond the Basics. Annapolis: Aspen<br />
Publishers, 2000<br />
Therneau, T.M. y Grambsch, P.M. Mo<strong>de</strong>ling Survival Data: Extending the Cox Mo<strong>de</strong>l.<br />
N.Y.: Springer-Verlag, 2000.<br />
WEIBULL, W. A statistical representation of fatigue failure in solids. Royal Institute<br />
Technology, Stockholm, 1954.<br />
YOUNG, J. L., 1991. The hospital-based cancer registry. In: Cancer Resgistration:<br />
Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir, R. G.<br />
Skeet, ed.), IARC Scientific Publication 95, pp. 177-184, Lyon: International Agency<br />
for Research on Cancer.<br />
56
Anexo A Programa no SAS.<br />
PROC IMPORT OUT= WORK.TCCc<br />
DATAFILE= "C:\Documents and Settings\13\Desktop\Estagio\Thia<br />
go Estatistica\analise <strong>de</strong> sobrevivencia2.xls"<br />
DBMS=EXCEL REPLACE;<br />
SHEET="dados$";<br />
GETNAMES=YES;<br />
MIXED=NO;<br />
SCANTEXT=YES;<br />
USEDATE=YES;<br />
SCANTIME=YES;<br />
RUN;<br />
data rim;<br />
set tccc;<br />
run;<br />
/* variaveis<br />
Ida<strong>de</strong> SEXO COR Tempo SANGUE FATORRH TRANSPLANTE IMC<br />
ANTIHBS DIABETES censura pres<br />
*/<br />
proc lifetest data = rim;/* ida<strong>de</strong> */<br />
time tempo*censura(0);<br />
strata ida<strong>de</strong> ;<br />
run;<br />
proc lifetest data = rim;/* sexo */<br />
time tempo*censura(0);<br />
strata sexo cor;<br />
run;<br />
proc lifetest data = rim;/* cor */<br />
time tempo*censura(0);<br />
strata cor;<br />
run;<br />
proc lifetest data = rim;/* sangue */<br />
time tempo*censura(0);<br />
strata sangue;<br />
run;<br />
proc lifetest data = rim;/* fatorrh */<br />
time tempo*censura(0);<br />
strata fatorrh;<br />
run;<br />
proc lifetest data = rim;/* transplante */<br />
time tempo*censura(0);<br />
strata transplante;<br />
run;<br />
proc lifetest data = rim;/* imc */<br />
time tempo*censura(0);<br />
/* Testes <strong>de</strong> Log-Ranck e Wilcoxon para todas as covariaveis */<br />
57
un;<br />
strata imc;<br />
proc lifetest data = rim;/* antihbs */<br />
time tempo*censura(0);<br />
strata antihbs;<br />
run;<br />
proc lifetest data = rim;/* diabetes */<br />
time tempo*censura(0);<br />
strata diabetes;<br />
run;<br />
proc lifetest data = rim;/* pressao */<br />
time tempo*censura(0);<br />
strata pres;<br />
run;<br />
/* tipo sanguinio e fator RH nao entraram nos mo<strong>de</strong>los */<br />
/* ida<strong>de</strong> sexo cor transplante imc antihbs diabetes pres */<br />
/* Ajuste <strong>de</strong> mo<strong>de</strong>los gamma*/<br />
proc lifereg data = rim;/*nulo primeira etapa*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*ida<strong>de</strong> */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*sexo */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = sexo / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*cor */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = cor / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*transplante*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = transplante/ dist=gamma;<br />
run;<br />
proc lifereg data = rim;/* imc*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = imc/ dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*antihbs */<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = antihbs/ dist=gamma;<br />
58
proc lifereg data = rim;/*diabetes */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = diabetes / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*pres */<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = pres / dist=gamma;<br />
proc lifereg data = rim;/*completo segunda etapa sem a var IMC*/<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs diabetes pres / dist=gamma;<br />
proc lifereg data = rim;/*ida<strong>de</strong> */<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = sexo cor transplante antihbs diabetes pres / dist=gamma;<br />
proc lifereg data = rim;/*sexo */<br />
run;<br />
class cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> cor transplante antihbs diabetes pres / dist=gamma;<br />
proc lifereg data = rim;/*cor */<br />
run;<br />
class sexo transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo transplante antihbs diabetes pres / dist=gamma;<br />
proc lifereg data = rim;/*transplante */<br />
run;<br />
class sexo cor antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs diabetes pres / dist=gamma;<br />
proc lifereg data = rim;/*antihbs*/<br />
run;<br />
class sexo cor transplante diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante diabetes pres / dist=gamma;<br />
proc lifereg data = rim;/*diabets */<br />
run;<br />
class sexo cor transplante antihbs pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs pres / dist=gamma;<br />
proc lifereg data = rim;/*pres */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs diabetes / dist=gamma;<br />
59
un;<br />
proc lifereg data = rim;/*completo terceira etapa sem transplante e diabetes add uma por vez*/<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres / dist=gamma;<br />
proc lifereg data = rim;/*transplante*/<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs pres / dist=gamma;<br />
proc lifereg data = rim;/*diabetes */<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs diabetes pres / dist=gamma;<br />
proc lifereg data = rim;/*completo quarta etapa colocar as q sairao na fase 1 IMC*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/* IMC*/<br />
run;<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres imc / dist=gamma;<br />
proc lifereg data = rim;/*completo quinta etapa tirar um a um*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*ida<strong>de</strong>*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = sexo cor antihbs pres / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/* sexo*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> cor antihbs pres / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*cor*/<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo antihbs pres / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*antihbs*/<br />
class sexo cor transplante diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor pres / dist=gamma;<br />
run;<br />
proc lifereg data = rim;/*pres*/<br />
60
un;<br />
class sexo cor transplante antihbs pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs / dist=gamma;<br />
/* Ajuste a um mo<strong>de</strong>lo parametrico */<br />
proc lifereg data = rim; /*Gamma */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />
cor*pres sexo*cor cor*antihbs / dist=gamma;<br />
run;<br />
proc lifereg data = rim; /*exponencial */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />
cor*pres sexo*cor cor*antihbs/ dist=exponential;<br />
run;<br />
proc lifereg data = rim; /*weibull */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />
cor*pres sexo*cor cor*antihbs;<br />
run;<br />
proc lifereg data = rim; /*log-normal */<br />
class sexo cor transplante antihbs diabetes pres;<br />
mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />
cor*pres sexo*cor cor*antihbs/covb dist=lognormal;<br />
output out=wa cdf=f;<br />
run;<br />
Anexo B Programa no R<br />
dialise
legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0)<br />
legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0)<br />
ekm
ajust3<br />
ekm
ekm = survfit(Surv(tempo,censura)~sexo,type="kaplan-meier")<br />
masculino=0<br />
feminino=1<br />
sort(tempo)<br />
mu = 0.9897<br />
gama= 1.0104<br />
beta0= 4.892<br />
beta1= -0.4462<br />
S1 = exp(-(tempo/(exp(beta0+beta1*masculino)))^gama)<br />
S2 = exp(-(tempo/(exp(beta0+beta1*feminino)))^gama)<br />
plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")<br />
lines(tempo,S1,type="l",lty=2,col="blue")<br />
lines(tempo,S2,type="l",lty=2,col="red")<br />
legend(250,0.8, lty=c(1,2),c("Masculino", "Feminino"), bty="n", cex=0.8)<br />
text(150.5,0.93,c("Ajuste da variavel Sexo"),bty="n",cex=1.2)<br />
AntiHBS<br />
ekm = survfit(Surv(tempo,censura)~anthbs,type="kaplan-meier")<br />
false=1<br />
true=0<br />
sort(tempo)<br />
mu = 0.8951<br />
gama= 1.1172<br />
beta0= 5.1288<br />
beta1= -0.9557<br />
S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama)<br />
S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama)<br />
plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")<br />
lines(tempo,S1,type="l",lty=2,col="blue")<br />
lines(tempo,S2,type="l",lty=2,col="red")<br />
legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8)<br />
text(150.5,0.93,c("Ajuste da variavel AntiHBS"),bty="n",cex=1.2)<br />
Pressão<br />
ekm = survfit(Surv(tempo,censura)~pres,type="kaplan-meier")<br />
false=1<br />
true=0<br />
sort(tempo)<br />
mu = 0.9781<br />
gama= 1.0224<br />
beta0= 4.2038<br />
beta1= 0.6054<br />
S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama)<br />
S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama)<br />
plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")<br />
lines(tempo,S1,type="l",lty=2,col="blue")<br />
lines(tempo,S2,type="l",lty=2,col="red")<br />
legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8)<br />
text(150.5,0.93,c("Ajuste da variavel Pressão"),bty="n",cex=1.2)<br />
64
ekm = survfit(Surv(tempo,censura)~cor,type="kaplan-meier")<br />
amarela=1<br />
branca=1<br />
negra=1<br />
sort(tempo)<br />
mu = 0.9951<br />
gama= 1.0050<br />
beta0= 5.9623<br />
beta1= -1.1069<br />
beta2= -1.3950<br />
beta3= -1.0080<br />
S1 = exp(-(tempo/(exp(beta0+beta1*amarela)))^gama)<br />
S2 = exp(-(tempo/(exp(beta0+beta2*branca)))^gama)<br />
S3 = exp(-(tempo/(exp(beta0+beta3*negra)))^gama)<br />
S4 = exp(-(tempo/(exp(beta0)))^gama)<br />
plot(ekm,lty=c(1,2,3,4),xlab="t",ylab="S(t)")<br />
lines(tempo,S1,type="l",lty=2,col="blue")<br />
lines(tempo,S2,type="l",lty=2,col="red")<br />
lines(tempo,S3,type="l",lty=2,col="black")<br />
lines(tempo,S4,type="l",lty=2,col="green")<br />
legend(250,0.8, lty=c(1,2,3,4),c("Amarela", "Branca","Negra","parda"), bty="n",<br />
cex=0.8)<br />
text(150.5,0.93,c("Ajuste da variavel Cor"),bty="n",cex=1.2)<br />
#Analise <strong>de</strong> residuos<br />
# ajuste geral<br />
Cor<br />
dialisee
plot(res.<strong>de</strong>vi)<br />
# exponencial sobrevivencia e risco<br />
<strong>de</strong>v.off()<br />
pdf(file="C:\Documents and Settings\13\Desktop\Estagio\tcc\exp-survival.pdf")<br />
t
(beta/mu)*(t/mu)**(beta-1)<br />
}<br />
mu
<strong>de</strong>v.off()<br />
pdf(file="C:\Documents and Settings\13\Desktop\Estagio\tcc\graficos\\lnormrisco.pdf")<br />
t
lines(t,S,lty=5,lwd=2)<br />
legend(6,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres<br />
sion(sigma=="0,5"),<br />
expression(sigma=="1,0"),expression(sigma=="1,5"),expression(sigma=="3,0")))<br />
legend(8,0.93,col="black",bty="n",expression(mu=="1,5"))<br />
<strong>de</strong>v.off()<br />
69