18.04.2013 Views

Thiago Gentil Ramires - Departamento de Estatística (UEM

Thiago Gentil Ramires - Departamento de Estatística (UEM

Thiago Gentil Ramires - Departamento de Estatística (UEM

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Universida<strong>de</strong> Estadual <strong>de</strong> Maringá<br />

<strong>Departamento</strong> <strong>de</strong> <strong>Estatística</strong><br />

<strong>Thiago</strong> <strong>Gentil</strong> <strong>Ramires</strong>


Analise <strong>de</strong> sobrevivência em pacientes<br />

com problemas renais.<br />

MARINGÁ<br />

OUTUBRO DE 2010<br />

INSTITUTO DO RIM DE MARINGÁ<br />

CURSO DE ESTATÍSTICA<br />

THIAGO GENTIL RAMIRES<br />

ii


RELATORIO DE ESTÁGIO CURRICULAR<br />

MARINGÁ<br />

OUTUBRO DE 2010<br />

Relatório submetido a<br />

Coor<strong>de</strong>nação do curso <strong>de</strong><br />

<strong>Estatística</strong> da Universida<strong>de</strong><br />

Estadual <strong>de</strong> Maringá como<br />

Requisito parcial para a<br />

Obtenção do diploma em<br />

Graduação em estatística<br />

Orientadora: Prof. Daniele<br />

Cristina Tita Granzotto<br />

iii


<strong>Thiago</strong> <strong>Gentil</strong> <strong>Ramires</strong><br />

Analise <strong>de</strong> sobrevivência em pacientes com problemas<br />

Aprovada em ___/___/_____<br />

renais.<br />

Banca Examinadora<br />

Relatório submetido a<br />

Coor<strong>de</strong>nação do curso <strong>de</strong><br />

<strong>Estatística</strong> da Universida<strong>de</strong><br />

Estadual <strong>de</strong> Maringá como<br />

Requisito parcial para a<br />

Obtenção do diploma em<br />

Graduação em estatística<br />

_________________________________________<br />

Profª Msc. Daniele Cristina Tita Granzotto(Orientadora)<br />

Universida<strong>de</strong> Estadual <strong>de</strong> Maringá – <strong>UEM</strong><br />

_________________________________________<br />

Profª Dra.Rosangela Getirana Santana<br />

Universida<strong>de</strong> Estadual <strong>de</strong> Maringá – <strong>UEM</strong><br />

_________________________________________<br />

Profº Dr. Carlos Aparecidos dos Santos<br />

Universida<strong>de</strong> Estadual <strong>de</strong> Maringá – <strong>UEM</strong><br />

iv


RESUMO<br />

Dada a relevância e o aumento <strong>de</strong> casos <strong>de</strong> Insuficiência Renal Crônica no<br />

Brasil, faz-se necessário o estudo <strong>de</strong> ferramentas estatísticas apropriadas que<br />

auxiliem na avaliação <strong>de</strong> fatores <strong>de</strong>terminantes na incidência <strong>de</strong> morte <strong>de</strong>ssa<br />

doença. Os dados disponibilizados pelo Instituto do Rim <strong>de</strong> Maringá, no período<br />

<strong>de</strong> 1978 à 2010. Adotou-se a metodologia <strong>de</strong> análise <strong>de</strong> sobrevivência foi feito a<br />

fim <strong>de</strong> para mo<strong>de</strong>lar os tempos <strong>de</strong> vida <strong>de</strong>stes pacientes e <strong>de</strong>terminar quais os<br />

fatores que mais afetam sua sobrevida. Durante a execução <strong>de</strong>ste trabalho, o<br />

mo<strong>de</strong>lo <strong>de</strong> regressão Weibull foi consi<strong>de</strong>rado e todas as técnicas necessárias<br />

para mo<strong>de</strong>lagem, verificação e inferências para este mo<strong>de</strong>lo citado são aqui<br />

apresentadas.<br />

Análise <strong>de</strong> sobrevivência, com o propósito <strong>de</strong> mo<strong>de</strong>lar o tempo <strong>de</strong> vida dos<br />

pacientes e assim i<strong>de</strong>ntificar fatores <strong>de</strong>terminantes com (sexo, pressão alta,<br />

diabetes, imc). O mo<strong>de</strong>lo <strong>de</strong> regressão Weibull foi consi<strong>de</strong>rado o mais bem<br />

ajustado, que apresentou sexo, pressão alta, cor, indicador <strong>de</strong> hepatite B entre<br />

outras, fatores que influenciam no tempo <strong>de</strong> vida <strong>de</strong> pacientes com problemas<br />

renais.<br />

Palavras-chave: Diálise renal, análise <strong>de</strong> sobrevivência, análise paramétrica e<br />

não paramétrica.<br />

v


estudos.<br />

AGRADECIMENTOS<br />

Primeiramente a Deus, por sempre me ajudar a conquistar meus sonhos.<br />

A minha mãe, Janet <strong>Gentil</strong> <strong>Ramires</strong>, que sempre me apoiou com meus<br />

Meu pai, A<strong>de</strong>mir <strong>Ramires</strong>, pessoa fundamental em nossa família.<br />

Ao meu avô, que nos <strong>de</strong>ixou esse ano, pessoa que sinto muito sauda<strong>de</strong> e que<br />

infelizmente não po<strong>de</strong> compartilhar esse momento da minha vida.<br />

A minha avó, pessoa que sempre batalhou na vida e que ainda continua muito<br />

forte fazendo parte da minha família.<br />

Ao meu irmão Juliano <strong>Gentil</strong> <strong>Ramires</strong>, que sempre esta disposto a me ajudar.<br />

A minha Prof. Rosangela, que foi um dos professores com que mais me<br />

i<strong>de</strong>ntifiquei na faculda<strong>de</strong> e que sempre me ajudou.<br />

A Prof. Daniele em que me ajudou com todas as duvidas em meu trabalho.<br />

A Andréa, orientadora do meu estagio, on<strong>de</strong> sem ela seria impossível ter<br />

realizado este trabalho.<br />

A todos do <strong>de</strong>partamento <strong>de</strong> estatística da <strong>UEM</strong><br />

Aos amigos das republicas Pé <strong>de</strong> Pano e Kubanacan, que vão <strong>de</strong>ixar<br />

sauda<strong>de</strong>s <strong>de</strong>sses 4 anos em que passamos juntos.<br />

vi


Sumário<br />

Capítulo 1 - Introdução ....................................................................................... 10<br />

1.1- Objetivos................................................................................................... 12<br />

Capítulo 2 – Hemodiálise.................................................................................... 13<br />

2.1. Historia da hemodiálise ......................................................................... 13<br />

2.2. Insuficiência renal crônica..................................................................... 13<br />

2.3. Tratamento............................................................................................. 14<br />

Capítulo 3 – Análise <strong>de</strong> Sobrevivência............................................................... 16<br />

3.1. Procedimentos para Analisar Dados na Ausência <strong>de</strong> Censura ............ 18<br />

3.2. Estimadores Não-Paramétricos ............................................................ 21<br />

3.2.1 Estimador <strong>de</strong> Kaplan-Meier................................................................. 22<br />

3.2.2 O Teste <strong>de</strong> Log-Rank........................................................................... 24<br />

3.3 Estimadores Paramétricos........................................................................ 24<br />

3.3.1 Mo<strong>de</strong>lo Exponencial .......................................................................... 25<br />

3.3.2 Mo<strong>de</strong>lo Weibull ................................................................................... 27<br />

3.3.3 Mo<strong>de</strong>lo Log-Normal............................................................................. 28<br />

3.3.4 Mo<strong>de</strong>lo Gama-Generalizada................................................................. 30<br />

3.4. Método <strong>de</strong> Estimação ............................................................................ 31<br />

3.5. Obtenção do Mo<strong>de</strong>lo Paramétrico......................................................... 32<br />

3.6 Comparação <strong>de</strong> mo<strong>de</strong>los e seleção das covariáveis .............................. 33<br />

3.7 Teste da razão <strong>de</strong> verossimilhanças....................................................... 34<br />

3.8 Escolha <strong>de</strong> um mo<strong>de</strong>lo paramétrico ...................................................... 34<br />

3.9 A<strong>de</strong>quação do mo<strong>de</strong>lo ajustado............................................................. 35<br />

Capítulo 4 - Resultados ....................................................................................... 37<br />

4.1 – Análise Não-Paramétrica........................................................................ 39<br />

4.2 – Análise Paramétrica ................................................................................ 42<br />

4.2.1 - Verificação do ajuste ....................................................................... 46<br />

4.2.2 - Estimativa dos Parâmetros do Mo<strong>de</strong>lo Ajustado Weibull............... 49<br />

4.2.3 - Análise <strong>de</strong> resíduos.......................................................................... 50<br />

Capítulo 5 – Conclusão ....................................................................................... 52<br />

Bibliografias ........................................................................................................ 54<br />

Anexo A Programa no SAS. .......................................................................... 57<br />

Anexo B Programa no R .................................................................................. 61<br />

vii


Capítulo 1 - Introdução<br />

No início da década <strong>de</strong> 60 a diálise era procedimento experimental e medida<br />

heróica utilizada em casos selecionados <strong>de</strong> insuficiência renal aguda. Evoluiu,<br />

tornando-se tratamento rotineiro capaz <strong>de</strong> manter vivos portadores <strong>de</strong> insuficiência<br />

renal crônica terminal (IRCT).<br />

Dada a relevância e o aumento <strong>de</strong> casos <strong>de</strong> Insuficiência Renal no Brasil,<br />

faz-se necessário o estudo <strong>de</strong> ferramentas estatísticas apropriadas que auxiliem no<br />

discernimento dos fatores que mais influenciam na incidência <strong>de</strong> morte <strong>de</strong>ssa<br />

doença. As técnicas <strong>de</strong> análise <strong>de</strong> sobrevivência são aqui consi<strong>de</strong>radas, pois se<br />

ajustam cada vez mais aos dados que frequentemente são encontrados em vários<br />

tipos <strong>de</strong> estudos, especialmente, os estudos clínicos e observacionais.<br />

Qualquer que seja o tipo <strong>de</strong> estudo com pacientes, geralmente há uma<br />

variável <strong>de</strong> interesse, também chamada <strong>de</strong> variável <strong>de</strong>pen<strong>de</strong>nte ou resposta. Essa<br />

variável po<strong>de</strong> ser o número <strong>de</strong> casos <strong>de</strong> <strong>de</strong>terminada doença, ou a sua incidência,<br />

ou a sua probabilida<strong>de</strong> <strong>de</strong> ocorrência, ou outra medida que vise <strong>de</strong>screver a<br />

freqüência com que a doença ocorre. Às vezes, a variável <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> interesse<br />

é o tempo <strong>de</strong>corrido até o aparecimento <strong>de</strong> algum evento, e aí se incluem os<br />

estudos <strong>de</strong> análise <strong>de</strong> sobrevivência. Há, ainda, uma ou mais variáveis,<br />

<strong>de</strong>nominadas in<strong>de</strong>pen<strong>de</strong>ntes, preditoras ou covariáveis, cujo relacionamento com a<br />

variável <strong>de</strong>pen<strong>de</strong>nte é o objetivo do estudo <strong>de</strong> hemodiálise, e nesse contexto, a<br />

análise quantitativa é imprescindível, pois os mo<strong>de</strong>los estatísticos expressam a<br />

variável <strong>de</strong>pen<strong>de</strong>nte como uma função matemática conhecida das variáveis<br />

in<strong>de</strong>pen<strong>de</strong>ntes. Há, então, o interesse em se verificar o efeito <strong>de</strong> fatores <strong>de</strong> risco ou<br />

<strong>de</strong> fatores prognósticos (sejam eles quantitativos ou qualitativos) no tempo <strong>de</strong><br />

sobrevivência <strong>de</strong> um indivíduo ou <strong>de</strong> um grupo, bem como <strong>de</strong>finir as probabilida<strong>de</strong>s<br />

<strong>de</strong> sobrevida em diversos momentos no seguimento do grupo. Consi<strong>de</strong>ra-se<br />

sobrevida, o tempo <strong>de</strong>s<strong>de</strong> a entrada do indivíduo no estudo (data do começo da<br />

hemodiálise) até a ocorrência do evento <strong>de</strong> interesse (falha) ou até a censura (perda<br />

por tempo <strong>de</strong> observação incompleto) na observação (Kleinbaum, 1995).<br />

10


O objetivo <strong>de</strong>ste trabalho é estudar as covariáveis que afetam (e como<br />

afetam) o tempo até a ocorrência do evento <strong>de</strong> interesse. As vaiáveis do estudo<br />

foram: Ida<strong>de</strong>, Sexo, Cor, Tempo (em meses), Tipo Sanguíneo, Transplante, IMC,<br />

AntiHBS, Diabetes, Censura e Pressão <strong>de</strong>ntro dos 306 casos.<br />

Os dados foram obtidos junto ao Instituto do Rim <strong>de</strong> Maringá, on<strong>de</strong><br />

observamos os pacientes inscritos no programa <strong>de</strong> hemodiálise do ano <strong>de</strong> 1978 ao<br />

ano <strong>de</strong> 2010. Essa coleta foi obtida diariamente pelo próprio Instituto respeitando as<br />

normas da empresa.<br />

A principal limitação do estudo foi a perda <strong>de</strong> informação (algumas variáveis<br />

<strong>de</strong>ixaram <strong>de</strong> ser observadas ou foram perdidas), <strong>de</strong>sta forma alguns pacientes foram<br />

excluídos da análise.<br />

Outro complicador nesta análise são as controvérsias <strong>de</strong> como tratar os óbitos<br />

por outra causa que não a doença <strong>de</strong> interesse ou os óbitos por causa<br />

<strong>de</strong>sconhecida. Há autores que analisam estes pacientes como falha e, neste caso, a<br />

taxa <strong>de</strong> sobrevida reflete a mortalida<strong>de</strong> geral para este grupo <strong>de</strong> pacientes<br />

(sobrevida global). Neste estudo consi<strong>de</strong>ramos todos os óbitos como falha, pois<br />

pacientes com problemas renais passam a apresentar diversos tipos <strong>de</strong> problemas<br />

no organismo, on<strong>de</strong> a maioria <strong>de</strong>les estão diretamente relacionados <strong>de</strong>vido ao mau<br />

funcionamento dos rins.<br />

A escolha do mo<strong>de</strong>lo a ser utilizado é um muito importante na análise<br />

paramétrica em confiabilida<strong>de</strong>, uma vez que a utilização <strong>de</strong> um mo<strong>de</strong>lo ina<strong>de</strong>quado<br />

para um <strong>de</strong>terminado conjunto <strong>de</strong> dados po<strong>de</strong> comprometer a análise estatística,<br />

provocando viés nos resultados obtidos. Neste estudo optou-se por utilizar uma<br />

estratégia <strong>de</strong> seleção <strong>de</strong> mo<strong>de</strong>los <strong>de</strong>rivada da proposta <strong>de</strong> Collett (1994). São<br />

utilizados seis passos no processo <strong>de</strong> seleção. Descritos no capitulo 3.5.<br />

Após a mo<strong>de</strong>lagem procurou-se ajustar o mo<strong>de</strong>lo à uma distribuição<br />

paramétrica, on<strong>de</strong> foram utilizados métodos gráficos e testes estatístico como o<br />

Teste da Razão <strong>de</strong> Verossimilhança. O mo<strong>de</strong>lo que melhor se a<strong>de</strong>quou aos dados<br />

foi um mo<strong>de</strong>lo Weibull.<br />

Com a verificação do ajuste do mo<strong>de</strong>lo, em geral obtemos um bom ajuste<br />

com as covariáveis selecionadas e as seguintes interpretações foram feitas para os<br />

parâmetros:<br />

11


1.1- Objetivos<br />

O objetivo <strong>de</strong>ste trabalho é estudar os fatores que afetam (e como afetam) o<br />

tempo até a ocorrência do óbito por insuficiência renal.<br />

Assim, temos o interesse em i<strong>de</strong>ntificar variáveis que estão associadas ao tempo<br />

<strong>de</strong> vida dos pacientes, construir um mo<strong>de</strong>lo <strong>de</strong> sobrevivência que explique o<br />

comportamento das variáveis no mo<strong>de</strong>lo e assim, estimar parâmetros, via método <strong>de</strong><br />

máxima verossimilhança, do mo<strong>de</strong>lo ajustado.<br />

À partir do mo<strong>de</strong>lo construído, temos por objetivo fazer algumas estimativas<br />

pertinentes, além <strong>de</strong> construir intervalos <strong>de</strong> confianças e teste <strong>de</strong> hipóteses para os<br />

parâmetros selecionados<br />

12


Capítulo 2 – Hemodiálise<br />

2.1. Historia da hemodiálise<br />

Melhorias importantes ocorreram nos serviços <strong>de</strong> diálise do Brasil, sendo<br />

reconhecido como programa <strong>de</strong> substituição renal no ano <strong>de</strong> 1974. Alguns<br />

parâmetros tornaram-se regra nas unida<strong>de</strong>s <strong>de</strong> diálise brasileiras, como o<br />

tratamento da água por osmose reversa e o uso <strong>de</strong> máquinas <strong>de</strong> proporção.<br />

Assim, na última década, várias inovações tecnológicas foram incorporadas<br />

ao procedimento <strong>de</strong> hemodiálise, tanto quanto à automação das máquinas como<br />

quanto aos dispositivos <strong>de</strong> segurança, medicações, <strong>de</strong>ntre outros. Apesar dos<br />

avanços tecnológicos, os registros <strong>de</strong> diálise do mundo não <strong>de</strong>monstram melhora da<br />

sobrevida concomitante a estes avanços. Logo, não está clara a influência da<br />

tecnologia sobre a mortalida<strong>de</strong> dos pacientes.<br />

2.2. Insuficiência renal crônica<br />

Uma doença que constitui um grave problema médico e <strong>de</strong> saú<strong>de</strong> pública,<br />

caracterizada pela incapacida<strong>de</strong> dos rins em excretar substâncias tóxicas do<br />

organismo <strong>de</strong> forma a<strong>de</strong>quada (Cardozo et al. 2006). As causas da Insuficiência<br />

Renal são muitas, algumas das quais acarretam uma diminuição rápida da função<br />

renal, muitas vezes, com valores inferiores a 1 ou 2% do índice normal (Insuficiência<br />

Renal Aguda). Outras causas <strong>de</strong> IR acarretam uma perda gradual e progressiva <strong>de</strong><br />

gran<strong>de</strong> parte dos néfrons funcionantes (Insuficiência Renal Crônica).<br />

Segundo Marques et al. (2005), os resultados finais da doença são sinais e<br />

sintomas tais como: cefaléia, fraqueza, anorexia, náuseas, vômitos, cãibras, diarréia,<br />

oligúria (secreção insuficiente <strong>de</strong> urina), e<strong>de</strong>ma, confusão mental, se<strong>de</strong>, perda do<br />

olfato e paladar, sonolência, hipertensão arterial e tendência à hemorragia<br />

13


<strong>de</strong>correntes da incapacida<strong>de</strong> renal, além <strong>de</strong> pali<strong>de</strong>z cutânea, xerose (ressecamento<br />

patológico da pele), dismenorréia (cólica antes ou durante a menstruação),<br />

amenorréia (ausência <strong>de</strong> fluxo menstrual), atrofia testicular, impotência, déficit <strong>de</strong><br />

atenção, espasmos musculares e coma.<br />

2.3. Tratamento<br />

Os pacientes que, por algum motivo, per<strong>de</strong>ram a função renal e<br />

irreparavelmente atingiram a fase terminal da doença, têm hoje três métodos <strong>de</strong><br />

tratamento: a hemodiálise, a diálise peritoneal e o transplante renal.<br />

De acordo com SBN (2009), a hemodiálise promove a retirada das<br />

substâncias tóxicas, água e sais minerais do organismo por meio da passagem do<br />

sangue por um filtro. Em geral, é realizada 3 vezes por semana, em sessões com<br />

duração média <strong>de</strong> 3 a 4 horas, com o auxílio <strong>de</strong> uma máquina, <strong>de</strong>ntro <strong>de</strong> clínicas<br />

especializadas neste tratamento como mostra a Figura2.1. Para que o sangue passe<br />

pela máquina é necessário a instalação <strong>de</strong> um cateter ou a confecção <strong>de</strong> uma fístula<br />

(procedimento realizado mais comumente nas veias do braço), permitindo que essas<br />

fiquem mais calibrosas e forneçam o fluxo <strong>de</strong> sangue a<strong>de</strong>quado para ser filtrado.<br />

Figura 2.1: Tratamento <strong>de</strong> hemodiálise.<br />

A diálise peritoneal funciona <strong>de</strong> maneira diferente. Ao invés <strong>de</strong> utilizar um filtro<br />

artificial para “limpar” o sangue, é utilizado o peritônio, que é uma membrana<br />

localizada <strong>de</strong>ntro do abdômen e que reveste os órgãos internos. É inserido um<br />

14


cateter flexível no abdômen, e assim, é feita a infusão <strong>de</strong> um líquido semelhante a<br />

um soro na cavida<strong>de</strong> abdominal. Esse líquido chamado “banho <strong>de</strong> diálise”, entra em<br />

contato com o peritônio, e por ele é feita a retirada das substâncias tóxicas do<br />

sangue. A diálise peritoneal po<strong>de</strong> ser feita na própria casa do paciente, ou ainda no<br />

local <strong>de</strong> trabalho, já que o processo <strong>de</strong> troca do banho <strong>de</strong> diálise é feito pelo próprio<br />

paciente ou por algum familiar.<br />

Segundo Santos (2005), os avanços recentes da terapia dialítica não têm se<br />

correlacionado diretamente com a redução da mortalida<strong>de</strong> nos últimos anos, talvez<br />

pelo fato <strong>de</strong> que os pacientes com doença renal crônica são mais idosos e<br />

apresentam maior número <strong>de</strong> co-morbida<strong>de</strong>s ao iniciarem a terapia dialítica.<br />

Os tratamentos dialíticos não chegam a substituir integralmente a função<br />

renal, mas fornecem condições para manter a sobrevida do paciente, permitindo que<br />

este retornem a uma vida normal e produtiva, prevenindo até a morte precoce. O<br />

transplante renal é o único tipo <strong>de</strong> terapia que po<strong>de</strong> oferecer uma reabilitação quase<br />

total. Segundo Castanheira et al. (2005), a diálise não é uma cura, permitindo<br />

apenas uma reposição da função renal normal.<br />

Para estudar os dados relacionados à diálise, utilizaremos <strong>de</strong> técnicas <strong>de</strong><br />

análise <strong>de</strong> sobrevivência, a qual será aplicada para estudar o tempo até os<br />

pacientes experimentarem o evento <strong>de</strong> interesse, neste caso, o óbito. Estas técnicas<br />

são justificadas, uma vez que, alguns dos tempos em estudo são parcialmente<br />

observados, ou seja, censurados. Neste caso, pacientes <strong>de</strong>ixam <strong>de</strong> experimentar o<br />

evento <strong>de</strong> interesse ou simplesmente abandonam ao tratamento.<br />

Ainda <strong>de</strong>vemos pensar: quais variáveis influenciam no tempo <strong>de</strong> vida <strong>de</strong><br />

pessoas com insuficiência renal; ou, qual o mo<strong>de</strong>lo mais a<strong>de</strong>quado para <strong>de</strong>screver o<br />

tempo <strong>de</strong> sobrevivência dos pacientes com insuficiência renal?<br />

Há controvérsias sobre como tratar os óbitos por outra causa que não a<br />

doença <strong>de</strong> interesse ou os óbitos por causa <strong>de</strong>sconhecida. Há autores que analisam<br />

estes pacientes como falha e, neste caso, a taxa <strong>de</strong> sobrevida reflete a mortalida<strong>de</strong><br />

geral para este grupo <strong>de</strong> pacientes (sobrevida global).<br />

Há ainda, casos em que o paciente morre por outros motivos on<strong>de</strong>, a causa<br />

principal é a insuficiência renal. Neste trabalho, qualquer que seja a causa morte,<br />

trataremos apenas do problema <strong>de</strong> insuficiência renal.<br />

15


Capítulo 3 – Análise <strong>de</strong> Sobrevivência<br />

Qualquer que seja o tipo <strong>de</strong> estudo com pacientes, geralmente há uma<br />

variável <strong>de</strong> interesse, também chamada <strong>de</strong> variável <strong>de</strong>pen<strong>de</strong>nte ou resposta. Essa<br />

variável po<strong>de</strong> ser o número <strong>de</strong> casos <strong>de</strong> <strong>de</strong>terminada doença, ou a sua incidência,<br />

ou a sua probabilida<strong>de</strong> <strong>de</strong> ocorrência, ou outra medida que vise <strong>de</strong>screver a<br />

freqüência com que a doença ocorre. Às vezes, a variável <strong>de</strong>pen<strong>de</strong>nte <strong>de</strong> interesse<br />

é o tempo <strong>de</strong>corrido até o aparecimento <strong>de</strong> algum evento, e aí se incluem os<br />

estudos <strong>de</strong> análise <strong>de</strong> sobrevivência. Outro fator <strong>de</strong>terminante para um estudo em<br />

analise <strong>de</strong> sobrevivência é a observação parcial da resposta, ou seja, a presença <strong>de</strong><br />

tempos censurados.<br />

Há, ainda, uma ou mais variáveis, <strong>de</strong>nominadas in<strong>de</strong>pen<strong>de</strong>ntes ou preditoras,<br />

cujo relacionamento com a variável <strong>de</strong>pen<strong>de</strong>nte é a influencia no tempo <strong>de</strong><br />

sobrevivência, e nesse contexto, a análise quantitativa é imprescindível, pois os<br />

mo<strong>de</strong>los estatísticos expressam a variável <strong>de</strong>pen<strong>de</strong>nte como uma função<br />

matemática conhecida das variáveis in<strong>de</strong>pen<strong>de</strong>ntes. Há, então, o interesse em se<br />

verificar o efeito <strong>de</strong> fatores <strong>de</strong> risco ou <strong>de</strong> fatores prognósticos (sejam eles<br />

quantitativos ou qualitativos) no tempo <strong>de</strong> sobrevivência <strong>de</strong> um indivíduo ou <strong>de</strong> um<br />

grupo, bem como <strong>de</strong>finir as probabilida<strong>de</strong>s <strong>de</strong> sobrevida em diversos momentos no<br />

seguimento do grupo. Consi<strong>de</strong>ra-se sobrevida, o tempo <strong>de</strong>s<strong>de</strong> a entrada do<br />

indivíduo no estudo (data do começo da hemodiálise) até a ocorrência do evento <strong>de</strong><br />

interesse (falha) ou até a censura (observação parcial da resposta) (Kleinbaum,<br />

1995).<br />

Em estudos <strong>de</strong> sobrevivência, as pessoas são acompanhadas por meio da<br />

ocorrência <strong>de</strong> um evento. Esse evento po<strong>de</strong> ser, por exemplo, o diagnóstico da<br />

doença, ou a realização <strong>de</strong> cirurgia, ou o inicio <strong>de</strong> um tratamento. Geralmente, as<br />

pessoas são incluídas no estudo em diferentes instantes, tempos estes chamados<br />

<strong>de</strong> zero, ou inicio do estudo. Os inícios são, portanto, truncados à esquerda, ou seja,<br />

a observação <strong>de</strong> cada indivíduo começa a partir <strong>de</strong> <strong>de</strong>terminado momento, sem<br />

levar em conta o que aconteceu no passado (Cox & Oakes, 1984). O evento final<br />

correspon<strong>de</strong> geralmente ao óbito ou a um <strong>de</strong>terminado evento que indique a<br />

modificação do estado inicial (cura, recorrência, retorno ao trabalho etc.) e como se<br />

comporta esta associação.<br />

16


Este evento final, ou evento <strong>de</strong> interesse, geralmente refere-se a eventos<br />

in<strong>de</strong>sejáveis, como o aparecimento <strong>de</strong> doença ou morte (Kleinbaum, 1995). Em<br />

estudos em que há necessida<strong>de</strong> <strong>de</strong> tempo para observar a resposta (ou<br />

acompanhamento), po<strong>de</strong> ocorrer que alguns indivíduos não sejam observados até a<br />

ocorrência da falha, ou seja, tenham seu tempo <strong>de</strong> observação incompleto. Esse tipo<br />

<strong>de</strong> perda no tempo <strong>de</strong> observação é <strong>de</strong>nominado censura. Isso po<strong>de</strong> ocorrer quando<br />

os indivíduos permanecem sem mudança <strong>de</strong> estado ao término do estudo, ou<br />

falecem por causas não relacionadas com a doença <strong>de</strong> interesse, ou abandonam o<br />

estudo, ou fogem à observação. Por vezes, a cura e/ou recuperação também po<strong>de</strong>m<br />

ser consi<strong>de</strong>radas como censura na observação. Os estudos em que existe censura<br />

são <strong>de</strong>nominados com observações incompletas. Uma suposição importante é a <strong>de</strong><br />

que os indivíduos censurados em <strong>de</strong>terminado tempo t são representativos <strong>de</strong> todos<br />

os indivíduos que estavam sujeitos ao risco <strong>de</strong> ter falha em t (Szklo & Nieto, 2000).<br />

Há dois tipos <strong>de</strong> estudos que po<strong>de</strong>m utilizar o tempo como variável <strong>de</strong><br />

interesse. Um <strong>de</strong>les é o estudo experimental (ensaios clínicos controlados<br />

aleatorizados), indicado para avaliar formas <strong>de</strong> tratamento. Outro tipo são os<br />

estudos <strong>de</strong> coorte observacionais, cujos dados po<strong>de</strong>m ser obtidos pela coleta direta<br />

em prontuários médicos ou em bases <strong>de</strong> dados já existentes (dados secundários).<br />

Essas fontes <strong>de</strong> dados secundários po<strong>de</strong>m ser <strong>de</strong> base hospitalar, por<br />

exemplo (registros hospitalares <strong>de</strong> câncer) ou populacional (registros <strong>de</strong> câncer <strong>de</strong><br />

base populacional). Registros <strong>de</strong> base hospitalar são aqueles que se referem a<br />

todos os casos tratados e acompanhados em uma instituição. Fornecem<br />

informações tanto para a administração do hospital quanto para pesquisadores<br />

interessados em informações sobre os resultados do tratamento nos diferentes<br />

grupos e fatores <strong>de</strong> risco ou fatores prognósticos. Contribuem ainda na atenção ao<br />

paciente individualmente, uma vez que asseguram o seguimento <strong>de</strong>stes pacientes<br />

(Young, 1991).<br />

Na análise <strong>de</strong> sobrevivência, os parâmetros mais importantes são as<br />

probabilida<strong>de</strong>s <strong>de</strong> sobrevivência no curso <strong>de</strong> cada um dos intervalos consi<strong>de</strong>rados e<br />

a probabilida<strong>de</strong> <strong>de</strong> sobrevida acumulada (tratada correntemente como taxa <strong>de</strong><br />

sobrevida), isto é, a probabilida<strong>de</strong> <strong>de</strong> sobreviver do tempo zero até o tempo final<br />

consi<strong>de</strong>rado. Esta última equivale à probabilida<strong>de</strong> <strong>de</strong> sobreviver em todos os<br />

intervalos anteriores ao momento consi<strong>de</strong>rado e, usualmente, é <strong>de</strong>nominada S(t)<br />

Função <strong>de</strong> sobrevivência. A escolha do mo<strong>de</strong>lo estatístico mais apropriado<br />

17


<strong>de</strong>pen<strong>de</strong>rá do tipo do <strong>de</strong>lineamento do estudo e <strong>de</strong> seus objetivos, das variáveis<br />

estudadas e da maneira pela qual foram coletados e categorizados os dados. A<br />

estimativa da probabilida<strong>de</strong> <strong>de</strong> sobrevida é, com certeza, mais válida e mais precisa<br />

para o período inicial do seguimento, no qual estão disponíveis informações sobre a<br />

maioria dos pacientes. Nos períodos posteriores, as informações po<strong>de</strong>m ficar<br />

limitadas <strong>de</strong>vido às perdas <strong>de</strong> seguimento e ao pequeno número <strong>de</strong> eventos<br />

(Fletcher et al., 1996).<br />

Somente nas décadas <strong>de</strong> 1950 e <strong>de</strong> 1960 apareceram as primeiras<br />

propostas <strong>de</strong> estimadores das probabilida<strong>de</strong>s <strong>de</strong> sobrevivência que incorporavam a<br />

censura, mo<strong>de</strong>los para observações incompletas.<br />

3.1. Procedimentos para Analisar Dados na Ausência <strong>de</strong><br />

Censura<br />

Seja T uma variável aleatória continua e positiva, normalmente caracterizada<br />

pelo tempo até a ocorrência <strong>de</strong> <strong>de</strong>terminado evento <strong>de</strong> interesse. A função<br />

<strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> f(t) é dada por:<br />

Esta função po<strong>de</strong> ser interpretada como a probabilida<strong>de</strong> do indivíduo experimentar<br />

um evento <strong>de</strong> interesse, ou falha, em um intervalo instantâneo <strong>de</strong> tempo.<br />

Na ausência <strong>de</strong> censura, (todos os pacientes experimentaram o evento antes<br />

do fim do estudo), a função f(t) po<strong>de</strong> ser estimada a partir <strong>de</strong> tabelas <strong>de</strong> distribuição<br />

<strong>de</strong> freqüência. Nestas tabelas os valores observados <strong>de</strong> T são distribuídos em<br />

classes e, para cada classe x, calcula-se f(t):<br />

A função <strong>de</strong> sobrevivência, ou seja, a probabilida<strong>de</strong> <strong>de</strong> um indivíduo<br />

sobreviver por mais <strong>de</strong> um <strong>de</strong>terminado t, é dada por:<br />

18


Uma relação importante a ser observada, é a função acumulada que po<strong>de</strong> ser<br />

escrita em termos da função <strong>de</strong> sobrevivência, sendo<br />

on<strong>de</strong><br />

Como estamos consi<strong>de</strong>rando dados não censurados, a função <strong>de</strong><br />

sobrevivência po<strong>de</strong> ser estimada por:<br />

on<strong>de</strong> tinf é o limite inferior do intervalo <strong>de</strong> tempo consi<strong>de</strong>rado x.<br />

Há ainda a fórmula da função <strong>de</strong> riscos (hazard function), ou λ(t), também<br />

conhecida como força instantânea <strong>de</strong> mortalida<strong>de</strong> ou taxa instantânea <strong>de</strong> falha em<br />

um período curto <strong>de</strong> tempo, dado que um indivíduo estava vivo até o instante t-1. A<br />

função λ(t) é dada por:<br />

que é inversamente proporcional à função <strong>de</strong> sobrevivência, ou seja, quando o risco<br />

aumenta a probabilida<strong>de</strong> <strong>de</strong> sobrevivência diminui e vice-versa.<br />

dado por:<br />

Um estimador para a função <strong>de</strong> risco com dados não censurados po<strong>de</strong> ser<br />

ˆ nº<br />

ocorrências<br />

_ na _ classe(<br />

x)<br />

λ<br />

X ( t)<br />

=<br />

nº<br />

que _ não _ falharam _ até _ a _ classe<br />

19


número <strong>de</strong> eventos observados no intervalo <strong>de</strong> classe x divididos pelo número <strong>de</strong><br />

pacientes em risco no inicio do intervalo x e amplitu<strong>de</strong> <strong>de</strong> x.<br />

A função <strong>de</strong> risco po<strong>de</strong> ter diversos formatos, po<strong>de</strong>ndo ser constante,<br />

crescente, <strong>de</strong>crescente ou ainda assumir outros formatos como, uma forma <strong>de</strong><br />

banheira, sino etc. A Figura seguir exemplifica alguns <strong>de</strong>stes casos.<br />

Figura 3.1 – Alguns tipos <strong>de</strong> comportamento da função <strong>de</strong> risco<br />

Po<strong>de</strong>mos também encontrar a função <strong>de</strong> risco acumulada Λ(t), on<strong>de</strong> me<strong>de</strong> o<br />

risco <strong>de</strong> ocorrência no intervalo <strong>de</strong> tempo, no qual também é uma taxa, mas não<br />

esta restrita ao intervalo [0;1]. A função <strong>de</strong> risco acumulada é dada por:<br />

on<strong>de</strong> seu estimador para dados não censurados é escrito como:<br />

20


A partir das funções e relações mostradas a cima é possível encontrar<br />

algumas relações fundamentais que po<strong>de</strong>m ajudar no estudo. As principais relações<br />

são dadas por:<br />

Se consi<strong>de</strong>rarmos uma análise <strong>de</strong> dados sem censura e também com<br />

censura, técnicas <strong>de</strong> análise estatística <strong>de</strong>scritiva po<strong>de</strong>m ser realizadas usando-se<br />

medidas <strong>de</strong> dispersão (média, mediana, amplitu<strong>de</strong>, <strong>de</strong>svio-padrão e freqüência),<br />

além das formulações apresentadas anteriormente.<br />

3.2. Estimadores Não-Paramétricos<br />

As principais técnicas é o estimador atuarial e o estimador do produto-limite<br />

<strong>de</strong> Kaplan-Meier. O método atuarial para dados incompletos (Lee, 1992; Selvin,<br />

1996) calcula as probabilida<strong>de</strong>s <strong>de</strong> sobrevida em intervalos fixados previamente, e o<br />

número dos expostos a risco correspon<strong>de</strong> aos pacientes vivos ao início <strong>de</strong> cada<br />

intervalo x. O número <strong>de</strong> expostos (lx), é ajustado <strong>de</strong> acordo com o número <strong>de</strong><br />

censuras que ocorreram neste período, sob a suposição <strong>de</strong> que as censuras<br />

ocorreram uniformemente durante o período x e que, a experiência subseqüente dos<br />

casos censurados é a mesma daqueles que permanecem em observação (Kahn &<br />

21


Sempos,1989). Neste trabalho, utilizaremos apenas do estimador <strong>de</strong> Kaplan-Meier,<br />

como apresentado aseguir.<br />

3.2.1 Estimador <strong>de</strong> Kaplan-Meier<br />

Na análise <strong>de</strong> sobrevida pelo método <strong>de</strong> Kaplan-Meier (Kaplan & Meier, 1958;<br />

Lee, 1992; Kleinbaum, 1995) os intervalos <strong>de</strong> tempo não são fixos, mas<br />

<strong>de</strong>terminados pelo aparecimento <strong>de</strong> uma falha (por exemplo, o óbito). Nessa<br />

situação, o número <strong>de</strong> óbitos em cada intervalo <strong>de</strong>ve ser um. Esse é um método não<br />

paramétrico, ou seja, que in<strong>de</strong>pen<strong>de</strong> da distribuição <strong>de</strong> probabilida<strong>de</strong> (Colton, 1979),<br />

e para calcular os estimadores, primeiramente, <strong>de</strong>ve-se or<strong>de</strong>nar os tempos <strong>de</strong><br />

sobrevida em or<strong>de</strong>m crescente. Os sobreviventes ao tempo t (lt) são ajustados pela<br />

censura, ou seja, os pacientes censurados entram no cálculo da função <strong>de</strong><br />

probabilida<strong>de</strong> <strong>de</strong> sobrevida acumulada até o momento <strong>de</strong> serem consi<strong>de</strong>rados como<br />

perda, o que propicia o uso mais eficiente das informações disponíveis (Szklo &<br />

Nieto, 2000).<br />

Define-se a função S(t) por um estimador conhecido como estimador produto<br />

limite <strong>de</strong> Kaplan-Meier, pois é o limite do produto dos termos até o tempo t:<br />

e lj = numero <strong>de</strong> expostos ao risco no inicio do período.<br />

Tendo que a função <strong>de</strong> risco acumulada é dada por:<br />

po<strong>de</strong>-se estimar qualquer das funções através das relações fundamentais(GIOLO,<br />

S. R).<br />

Métodos <strong>de</strong> cálculo para estimar a variância e os intervalos <strong>de</strong> confiança da<br />

probabilida<strong>de</strong> <strong>de</strong> sobrevivência estão disponíveis e são bem <strong>de</strong>scritos por Kleinbaum<br />

(1995), Lee (1992), Parkin & Hakulinen (1991), Selvin (1996), e Szklo & Nieto<br />

(2000). Esta estimativa enfatiza o tamanho do efeito e indica a faixa <strong>de</strong> valores<br />

22


plausíveis para a sobrevida. A variância do estimador <strong>de</strong> Kaplan-Meier, na qual é<br />

dada pelo estimador <strong>de</strong> Greenwood é dada por:<br />

on<strong>de</strong> dj é o numero <strong>de</strong> falhas em <strong>de</strong>terminado tj, e nj é o numero <strong>de</strong> quantos não<br />

falharam em <strong>de</strong>terminado tj (exclusive).<br />

Se formos construir um intervalo <strong>de</strong> confiança para o estimador <strong>de</strong> Kaplan-<br />

Meier os limites seriam calculados pela seguinte expressão:<br />

entretanto esse intervalo permite valores negativos e maiores que 1, o que é<br />

incompatível com a <strong>de</strong>finição <strong>de</strong> sobrevivência. Para evitar esse problema basta<br />

construir um intervalo simétrico para o risco aplicando ln assim a expressão fica:<br />

on<strong>de</strong> os limites são dados por:<br />

e o <strong>de</strong>svio padrão dado por:<br />

23


3.2.2 O Teste <strong>de</strong> Log-Rank<br />

A aplicação <strong>de</strong>sses mo<strong>de</strong>los permite comparar o conjunto <strong>de</strong> curvas <strong>de</strong><br />

sobrevida das diversas categorias <strong>de</strong> uma única variável in<strong>de</strong>pen<strong>de</strong>nte. Para<br />

comparar as curvas <strong>de</strong> sobrevida acumulada entre diferentes categorias <strong>de</strong> uma<br />

mesma variável, recomenda-se utilizar o teste log-rank (Cox & Oakes, 1984;<br />

Kleinbaum, 1995), que se baseia no confronto entre o evento <strong>de</strong> interesse<br />

observados nos dois grupos e aqueles esperados. A diferença entre o evento <strong>de</strong><br />

interesse observados e esperados é avaliada por meio do teste do Qui-quadrado.<br />

Com a estatística <strong>de</strong> log-rank po<strong>de</strong>mos testar as hipótese <strong>de</strong> que as curvas<br />

<strong>de</strong> sobrevivências são iguais para os dois grupos ou o oposto. A estatística é dada<br />

por:<br />

on<strong>de</strong> N1= total <strong>de</strong> eventos observados no estrato 1 e E1= total <strong>de</strong> eventos esperados<br />

no estrato 1. O calculo da variância é obtido por:<br />

A aplicabilida<strong>de</strong> <strong>de</strong>ste teste será vista nos resultados <strong>de</strong>sta pesquisa.<br />

3.3 Estimadores Paramétricos<br />

Para <strong>de</strong>terminarmos as variáveis que serão usadas no mo<strong>de</strong>lo, foi utilizado<br />

previamente a distribuição gama-generalizada, pois assume diversos formatos na<br />

função <strong>de</strong> risco e <strong>de</strong> sobrevivência facilitando a mo<strong>de</strong>lagem e também engloba as<br />

distribuições <strong>de</strong> probabilida<strong>de</strong>: Exponencial, Weibull e a Log-Normal. Estas<br />

distribuições são apresentadas a seguir.<br />

24


3.3.1 Mo<strong>de</strong>lo Exponencial<br />

A distribuição exponencial tem uma característica importante a ser utilizada<br />

em analise <strong>de</strong> sobrevivência, pois ela possui a taxa <strong>de</strong> risco constante, proprieda<strong>de</strong><br />

<strong>de</strong> falta <strong>de</strong> memória. Sua função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> é dada por:<br />

e sua função <strong>de</strong> sobrevivência dada por:<br />

Como já dito, a sua taxa <strong>de</strong> falha é constante, o que po<strong>de</strong> ser claramente<br />

visualizado dividindo a função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> pela função <strong>de</strong><br />

sobrevivência (“relações fundamentais“) o que resulta na função <strong>de</strong> risco que é dada<br />

por:<br />

Nas Figuras 3.2 e 3.3 estão presentes algumas formas que a função <strong>de</strong><br />

sobrevivência e a função <strong>de</strong> risco da distribuição exponencial po<strong>de</strong>m assumir,<br />

quando variamos os valores <strong>de</strong> seu parâmetro.<br />

25


S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />

t<br />

α = 0,5<br />

α = 1,0<br />

α = 1,5<br />

α = 3,0<br />

Figura 3.2: Função <strong>de</strong> sobrevivência da exponencial<br />

h(t)<br />

0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />

0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />

t<br />

α = 0,5<br />

α = 1,0<br />

α = 1,5<br />

α = 3,0<br />

Figura 3.3: Função <strong>de</strong> risco da exponencial<br />

26


3.3.2 Mo<strong>de</strong>lo Weibull<br />

Proposto por Weibull (1954), este mo<strong>de</strong>lo representa uma generalização da<br />

distribuição exponencial e, <strong>de</strong> acordo com Lawless (1982), é bastante utilizada no<br />

ajuste <strong>de</strong> dados <strong>de</strong> confiabilida<strong>de</strong> nas diversas áreas do conhecimento, entre elas a<br />

medicina e engenharia. Na engenharia, a distribuição Weibull é a principal função <strong>de</strong><br />

confiabilida<strong>de</strong>, sendo utilizada para mo<strong>de</strong>lar a distribuição da vida útil e taxa <strong>de</strong> risco<br />

em produtos industriais.<br />

Uma característica <strong>de</strong>sta distribuição é que, se γ=1, a distribuição weibull é<br />

equivalente à distribuição exponencial. Sua função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> é<br />

dada por:<br />

on<strong>de</strong> α representa o 63º percentil. A função <strong>de</strong> sobrevivência e <strong>de</strong> risco será:<br />

e<br />

É muito importante salientar que o mo<strong>de</strong>lo Weibull é muito utilizado na prática<br />

por apresentar uma gran<strong>de</strong> varieda<strong>de</strong> na forma da função <strong>de</strong> risco sendo:<br />

• Crescente para γ>1<br />

• Decrescente para γ


h(t)<br />

0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />

0.0 0.5 1.0 1.5 2.0 2.5 3.0<br />

t<br />

γ = 0,5<br />

γ = 1,0<br />

γ = 1,5<br />

γ = 3,0<br />

α = 1,5<br />

Figura 3.4: Função <strong>de</strong> sobrevivência da Weibull<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

3.3.3 Mo<strong>de</strong>lo Log-Normal<br />

0.0 0.5 1.0 1.5 2.0 2.5<br />

t<br />

γ = 0,5<br />

γ = 1,0<br />

γ = 1,5<br />

γ = 3,0<br />

α = 1,5<br />

Figura 3.5: Função <strong>de</strong> risco da Weibull<br />

A distribuição log-normal é muito usada para ajustar dados referentes a<br />

confiabilida<strong>de</strong>, assim como a distribuição Weibull. De acordo com Nelson (1990),<br />

existem diversas aplicações <strong>de</strong>ste mo<strong>de</strong>lo em testes para o tempo <strong>de</strong> falha <strong>de</strong><br />

28


produtos. Uma discussão <strong>de</strong>talhada sobre este mo<strong>de</strong>lo po<strong>de</strong> ser encontrada em<br />

Crow e Shimizu (1988). Essa distribuição é também muito utilizada neste tipo <strong>de</strong><br />

análise, pois o logaritmo do tempo possui uma distribuição normal com média µ e<br />

<strong>de</strong>svio-padrão σ, ou seja, os parâmetros estimados <strong>de</strong>sta distribuição é <strong>de</strong> fácil<br />

interpretação. A função <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong> da distribuição log-normal é<br />

dada por:<br />

A função taxa <strong>de</strong> falha da distribuição log-normal não tem uma forma fechada.<br />

Ela não é monótona, como o caso da distribuição Weibull. Ela cresce, atinge um<br />

valor máximo, e <strong>de</strong>pois <strong>de</strong>cresce, ou seja, o risco <strong>de</strong> falha instantânea diminui com o<br />

tempo. O comportamento da função <strong>de</strong> sobrevivência e função <strong>de</strong> risco são<br />

mostrados nas Figuras 3.6 e 3.7 para alguns valores <strong>de</strong> µ e σ.<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 2 4 6 8 10<br />

t<br />

σ = 0,5<br />

σ = 1,0<br />

σ = 1,5<br />

σ = 3,0<br />

µ = 1,5<br />

Figura 3.6: Função <strong>de</strong> sobrevivência da log-normal<br />

σ>0,<br />

µ>0<br />

29


h(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0.0 0.5 1.0 1.5 2.0 2.5<br />

t<br />

σ = 0,5<br />

σ = 1,0<br />

σ = 1,5<br />

σ = 3,0<br />

µ = 1,5<br />

Figura 3.7: Função <strong>de</strong> risco da log-normal<br />

3.3.4 Mo<strong>de</strong>lo Gama-Generalizada<br />

A distribuição Gama-Generalizada, tem uma gran<strong>de</strong> utilida<strong>de</strong> em análise <strong>de</strong><br />

sobrevivência, por englobar as três distribuições citadas anteriormente, <strong>de</strong>sta forma<br />

facilmente po<strong>de</strong>mos construir um mo<strong>de</strong>lo através <strong>de</strong>sta distribuição e em um<br />

segundo momento, inferir para um mo<strong>de</strong>lo mais simples. Sua função <strong>de</strong>nsida<strong>de</strong> é<br />

dada por:<br />

A função <strong>de</strong> sobrevivência será:<br />

on<strong>de</strong><br />

α>0<br />

k= inteiro positivo<br />

30


3.4. Método <strong>de</strong> Estimação<br />

Afim <strong>de</strong> estimar os parâmetros do mo<strong>de</strong>lo, utilizaremos o método <strong>de</strong> máxima<br />

verossimilhança, que trata o problema <strong>de</strong> estimação da seguinte forma: baseado nos<br />

resultados obtidos pela amostra, qual é a distribuição entre todas aquelas <strong>de</strong>finidas<br />

pelos possíveis valores <strong>de</strong> seus parâmetros, com maior possibilida<strong>de</strong> <strong>de</strong> ter gerado<br />

tal amostra? Em outras palavras, se por exemplo a distribuição <strong>de</strong> falha é a Weibull,<br />

para cada combinação diferente <strong>de</strong> α e β tem-se diferentes distribuições <strong>de</strong> Weibull.<br />

O estimador <strong>de</strong> máxima verossimilhança escolhe aquele par <strong>de</strong> α e β que melhor<br />

explique a amostra observada (Colosimo, 1995).<br />

Suponha uma amostra <strong>de</strong> observações t1, t2, ..., tn <strong>de</strong> uma certa população <strong>de</strong><br />

interesse. Consi<strong>de</strong>re inicialmente que todas as observações são não-censuradas. A<br />

população é caracterizada pela sua função <strong>de</strong> <strong>de</strong>nsida<strong>de</strong> <strong>de</strong> probabilida<strong>de</strong>. Por<br />

exemplo, se f(t)=αexp(-tα), significa que as observações vem <strong>de</strong> uma distribuição<br />

exponencial com parâmetro a ser estimado. A função <strong>de</strong> verossimilhança para um<br />

parâmetro genérico θ é:<br />

A <strong>de</strong>pendência <strong>de</strong> f em θ é preciso agora ser mostrada pois L é função <strong>de</strong> θ .<br />

Nesta expressão, θ po<strong>de</strong> estar representando um único parâmetro ou um vetor <strong>de</strong><br />

parâmetros. Por exemplo, no mo<strong>de</strong>lo log-normal, θ =(µ,σ). A tradução em termos<br />

matemáticos para a frase “a distribuição que melhor explique a amostra observada”<br />

é achar o valor <strong>de</strong> θ que maximize a função L(θ). Isto é, achar o valor <strong>de</strong> θ que<br />

maximiza a probabilida<strong>de</strong> da amostra observada ter ocorrido.<br />

A função <strong>de</strong> verossimilhança L(θ) mostra que a contribuição <strong>de</strong> cada<br />

observação não-censurada é sua função <strong>de</strong> <strong>de</strong>nsida<strong>de</strong>. A observação parcial da<br />

resposta somente nos informam que o tempo <strong>de</strong> falha é maior que o tempo <strong>de</strong><br />

censura observado e portanto, que a sua contribuição para L(θ) é a sua função <strong>de</strong><br />

sobrevivência S(t). As observações po<strong>de</strong>m então ser divididas em dois conjuntos, as<br />

r primeiras são as não-censuras (1,2, ..., r) e as n-r seguintes, são as censuradas<br />

31


(r+1, r+2, ..., n). Assim a função <strong>de</strong> máxima verossimilhança assume a seguinte<br />

forma:<br />

Entretanto, se o mo<strong>de</strong>lo selecionado for usado ina<strong>de</strong>quadamente para certo<br />

conjunto <strong>de</strong> dados, toda a análise estatística fica comprometida e<br />

consequentemente, as inferências à partir do mo<strong>de</strong>lo, ficam <strong>de</strong>storcidas.<br />

3.5. Obtenção do Mo<strong>de</strong>lo Paramétrico<br />

A escolha do mo<strong>de</strong>lo a ser utilizado é muito importante na análise<br />

paramétrica, uma vez que a utilização <strong>de</strong> um mo<strong>de</strong>lo ina<strong>de</strong>quado para um<br />

<strong>de</strong>terminado conjunto <strong>de</strong> dados po<strong>de</strong> comprometer a análise estatística, provocando<br />

viés nos resultados obtidos. Existem diversas maneiras <strong>de</strong> se verificar a a<strong>de</strong>quação<br />

<strong>de</strong> um mo<strong>de</strong>lo para dados <strong>de</strong> sobrevivência. Há casos em que a utilização <strong>de</strong> um<br />

mo<strong>de</strong>lo é <strong>de</strong>finida por sua simplicida<strong>de</strong> computacional como, segundo Nelson<br />

(1990), e Souza (2001), é o caso do mo<strong>de</strong>lo exponencial que, por apresentar<br />

resultados simples e bastante conhecidos é muitas vezes utilizados <strong>de</strong> forma<br />

in<strong>de</strong>vida. Cain (2002) apresenta simulações <strong>de</strong> Monte Carlo para distinguir entre a<br />

distribuição log-normal e Weibull.<br />

Neste estudo optou-se por utilizar uma estratégia <strong>de</strong> seleção <strong>de</strong> mo<strong>de</strong>los<br />

<strong>de</strong>rivada da proposta <strong>de</strong> Collett (1994). São utilizados seis passos no processo <strong>de</strong><br />

seleção.<br />

Passo 1 – ajustar todos os mo<strong>de</strong>los contendo uma única covariável. Incluir todas as<br />

covariáveis que forem significativas ao nível <strong>de</strong> 0,10. É aconselhável utilizar o teste<br />

da razão <strong>de</strong> verossimilhanças neste passo.<br />

Passo 2 – as covariáveis significativas no passo 1 são, então, ajustadas<br />

conjuntamente. Na presença <strong>de</strong> certas covariáveis, outras po<strong>de</strong>m <strong>de</strong>ixar <strong>de</strong> ser<br />

32


significativas. Consequentemente, ajusta-se mo<strong>de</strong>los reduzidos, excluindo uma<br />

única covariável <strong>de</strong> cada vez. Verificam-se as covariáveis que provocam um<br />

aumento estatisticamente significativo na estatística da razão <strong>de</strong> verossimilhanças.<br />

Somente aquelas que atingirem a significância permanecem no mo<strong>de</strong>lo.<br />

Passo 3 – ajusta-se um novo mo<strong>de</strong>lo com as covariáveis retiradas no passo 2. Neste<br />

passo, as covariáveis excluídas no passo 2 retornam ao mo<strong>de</strong>lo para confirmar que<br />

elas não são estatisticamente significativas.<br />

Passo 4 – as eventuais covariáveis significativas no passo 3 são incluídas ao<br />

mo<strong>de</strong>lo juntamente com aquelas do passo 2. Neste passo, retorna-se com as<br />

covariáveis excluídas no passo 1 para confirmar que elas não são estatisticamente<br />

significativas.<br />

Passo 5 – ajusta-se um mo<strong>de</strong>lo incluindo-se as covariáveis significativas no passo 4.<br />

Neste passo é testado se alguma <strong>de</strong>las po<strong>de</strong> ser retirada do mo<strong>de</strong>lo.<br />

Passo 6 – utilizando as covariáveis que sobreviveram ao passo 5, ajusta-se o<br />

mo<strong>de</strong>lo final para os efeitos principais. Para completar a mo<strong>de</strong>lagem, <strong>de</strong>ve-se<br />

verificar a possibilida<strong>de</strong> <strong>de</strong> inclusão <strong>de</strong> termos <strong>de</strong> interação dupla entre as<br />

covariáveis incluídas no mo<strong>de</strong>lo. O mo<strong>de</strong>lo final fica <strong>de</strong>terminado pelos efeitos<br />

principais i<strong>de</strong>ntificados no passo 5 e os termos <strong>de</strong> interação significativos<br />

i<strong>de</strong>ntificados neste passo.<br />

Em cada passo do processo <strong>de</strong> seleção <strong>de</strong> covariáveis, a estatística <strong>de</strong> teste,<br />

apresentada, foi obtida utilizando-se o teste da razão <strong>de</strong> verossimilhanças com uma<br />

distribuição qui-quadrado <strong>de</strong> referência com graus <strong>de</strong> liberda<strong>de</strong> igual ao número <strong>de</strong><br />

termos excluídos (diferença entre o número <strong>de</strong> parâmetros dos dois mo<strong>de</strong>los a<br />

serem comparados).<br />

3.6 Comparação <strong>de</strong> mo<strong>de</strong>los e seleção das covariáveis<br />

33


Ao efetuar os passos <strong>de</strong> escolha das covariáveis “mo<strong>de</strong>lagem estatística”, é<br />

utilizado o teste da Razão <strong>de</strong> Verossimilhança (TRV), comparado com os mo<strong>de</strong>los<br />

nulos ou completos segundo Collett (1994), assim <strong>de</strong>cidindo quais serão as<br />

covariáveis do mo<strong>de</strong>lo.<br />

Uma vez escolhido o conjunto <strong>de</strong> covariáveis prognósticas, o interesse se<br />

concentra agora em investigar a utilização dos mo<strong>de</strong>los mais simples (casos<br />

especiais da gama generalizada), mas não menos a<strong>de</strong>quado aos dados. O teste da<br />

razão <strong>de</strong> verossimilhança também é utilizado neste caso.<br />

3.7 Teste da razão <strong>de</strong> verossimilhanças<br />

Este teste é baseado na função <strong>de</strong> verossimilhança e envolve a comparação<br />

dos valores do logaritmo da função <strong>de</strong> verossimilhança maximizada sem restrição e<br />

sob a hipótese nula <strong>de</strong> que os mo<strong>de</strong>los são a<strong>de</strong>quados. A estatística para esse teste<br />

tem uma distribuição qui-quadrado é dada por:<br />

3.8 Escolha <strong>de</strong> um mo<strong>de</strong>lo paramétrico<br />

A escolha do mo<strong>de</strong>lo a ser utilizado é muito importante na análise<br />

paramétrica, uma vez que a utilização <strong>de</strong> um mo<strong>de</strong>lo ina<strong>de</strong>quado para um<br />

<strong>de</strong>terminado conjunto <strong>de</strong> dados po<strong>de</strong> comprometer a análise estatística, provocando<br />

viés nos resultados obtidos. Existem diversas maneiras <strong>de</strong> se verificar a a<strong>de</strong>quação<br />

<strong>de</strong> um mo<strong>de</strong>lo para dados <strong>de</strong> sobrevivência. Há casos em que a utilização <strong>de</strong> um<br />

mo<strong>de</strong>lo é <strong>de</strong>finida por sua simplicida<strong>de</strong> computacional, como segundo Nelson<br />

(1990), e Souza (2001), é o caso do mo<strong>de</strong>lo exponencial que, por apresentar<br />

resultados simples e bastante conhecidos, é muitas vezes utilizados <strong>de</strong> forma<br />

in<strong>de</strong>vida. Cain (2002) apresenta simulações <strong>de</strong> Monte Carlo para distinguir entre a<br />

distribuição log-normal e Weibull.<br />

34


O ajuste do “melhor” mo<strong>de</strong>lo a ser usado para um conjunto <strong>de</strong> dados po<strong>de</strong> ser<br />

verificado, neste artigo, <strong>de</strong> duas formas: numericamente ou graficamente. A análise<br />

numérica é feita com base na estatística <strong>de</strong> máxima verossimilhança, a qual<br />

<strong>de</strong>termina como melhor mo<strong>de</strong>lo aquele que apresentar o menor valor em módulo, do<br />

log do estimador <strong>de</strong> máxima verossimilhança (Cavalcanti et al., 2002).<br />

O método gráfico utilizado comparação <strong>de</strong> mo<strong>de</strong>los ajustados é através da<br />

linearização da função <strong>de</strong> sobrevivência (Bolfarine et al., 1991). Consiste em fazer<br />

gráficos nos quais o mo<strong>de</strong>lo apropriado seja aproximadamente linear. A não<br />

linearida<strong>de</strong> po<strong>de</strong> ser percebida visualmente. Neste caso, o gráfico utilizado é <strong>de</strong> uma<br />

transformação que lineariza a função <strong>de</strong> sobrevivência do mo<strong>de</strong>lo proposto.<br />

Por exemplo, se o mo<strong>de</strong>lo exponencial for apropriado aos dados, o gráfico (–<br />

logS(t) vs t) irá resultar em uma linha reta, passando pela origem (0).<br />

A função <strong>de</strong> sobrevivência <strong>de</strong> uma distribuição log-normal po<strong>de</strong> ser<br />

linearizada na forma:<br />

on<strong>de</strong> Φ -1 são os percentis da normal padrão. Isso significa que o gráfico <strong>de</strong> Φ -1 (Sˆ(<br />

t)) vs log(t) <strong>de</strong>ve ser linear se o mo<strong>de</strong>lo log-normal for a<strong>de</strong>quado. Caso estamos<br />

interessados em linearizar o mo<strong>de</strong>lo Weibull, o gráfico log[-log(S(t))] vs. log(t) irá<br />

resultar em uma linha reta, passando pela origem (0); para a a<strong>de</strong>quação do mo<strong>de</strong>lo<br />

log-logístico o gráfico log[(1-S(t)/S(t)] vs. log (t).<br />

3.9 A<strong>de</strong>quação do mo<strong>de</strong>lo ajustado<br />

Uma avaliação da a<strong>de</strong>quação do mo<strong>de</strong>lo ajustado é parte fundamental da<br />

análise dos dados. No mo<strong>de</strong>lo <strong>de</strong> regressão linear usual, uma análise gráfica dos<br />

resíduos é usada para esta finalida<strong>de</strong>. Diversos resíduos têm sido propostos na<br />

literatura para avaliar o ajuste do mo<strong>de</strong>lo apresentado (Lawless, 1982, Klein e<br />

Moeschberger, 1997, Therneau e Grambsch, 2000).<br />

Nas seções que se seguem, os seguintes resíduos são <strong>de</strong>scritos<br />

35


• Resíduos <strong>de</strong> Cox-Snell (1968) e resíduos padronizados, úteis para examinar<br />

o ajuste global do mo<strong>de</strong>lo<br />

• Resíduos Martingale, úteis para <strong>de</strong>terminar a forma funcional (linear,<br />

quadrática etc.) <strong>de</strong> uma covariável, em geral contínua, sendo incluída no<br />

mo<strong>de</strong>lo <strong>de</strong> regressão.<br />

• Resíduos Deviance, que auxiliam a examinar a acurácia do mo<strong>de</strong>lo para cada<br />

indivíduo sob estudo.<br />

36


Capítulo 4 - Resultados<br />

Dentre os 306 pacientes observados, diversas variáveis foram inclusas no<br />

estudo, e apenas as que po<strong>de</strong>riam ter relação direta ou indireta com o tempo <strong>de</strong><br />

sobrevida do paciente permaneceram.<br />

A inclusão ou exclusão preliminar das variáveis levou em consi<strong>de</strong>ração<br />

estudos pré-realizados em hemodiálise e a opinião <strong>de</strong> pesquisadores da área, e<br />

assim, utilizamos para este estudo as variáveis da Tabela 4.1 (a altura e peso “em<br />

metros” foram transformados em uma nova variável, IMC).<br />

Tabela 4.1: Variáveis em estudo<br />

Variável Descrição Classificação<br />

Ida<strong>de</strong> Ida<strong>de</strong> em que iniciou o tratamento Contínua<br />

Sexo Masculino ou Feminino Categorica<br />

Cor Amarela, Branca, Negra ou Parda Categorica<br />

Tempo Meses em que o paciente permaneceu no estudo Contínua<br />

Sangue A, B, AB ou O Categorica<br />

FatorRH Positivo ou Negativo Categorica<br />

Transplante Indicador <strong>de</strong> transplante, Falso ou Verda<strong>de</strong> Categorica<br />

IMC Indice <strong>de</strong> massa corporica Contínua<br />

AntiHBS Indicador <strong>de</strong> vacina <strong>de</strong> hepatite B, Falso ou Verda<strong>de</strong> Categorica<br />

Censura 0 = Censurado e 1= Falha Categorica<br />

No estudo foram consi<strong>de</strong>rados 122 mulheres e 184 homens, on<strong>de</strong> 42<br />

homens apresentavam problemas <strong>de</strong> pressão alta enquanto as mulheres<br />

apenas 24 apresentavam problemas <strong>de</strong> pressão alta. A respeito do problema<br />

<strong>de</strong> Diabetes o sexo masculino também obteve uma maior freqüência, em um<br />

total <strong>de</strong> 57 homens enquanto o sexo feminino apresentou apenas 33<br />

mulheres com problemas <strong>de</strong> Diabetes.<br />

37


Consi<strong>de</strong>rando todos os pacientes a média <strong>de</strong> ida<strong>de</strong> foi <strong>de</strong><br />

aproximadamente 61 anos <strong>de</strong> ida<strong>de</strong>, on<strong>de</strong> 76% dos pacientes eram <strong>de</strong> cor<br />

branca. Outra informação relevante é que apenas 56 dos 306 pacientes<br />

conseguiram uma doação <strong>de</strong> rim. Além disso os tipos sanguíneo mais<br />

apresentados no estudo foram O, com 148 casos seguido <strong>de</strong> A com 115<br />

casos, levando em conta que o tipo sanguíneo AB obteve apenas 11 casos no<br />

estudo.<br />

Inicialmente, uma análise preliminar do tempo po<strong>de</strong> ser feita e<br />

visualizada à partir da tabela 4.2.<br />

Tabela 4.2: Medidas <strong>de</strong>scritivas dos tempos<br />

Média 49,82026<br />

Variância 2953,768<br />

Coeficiente <strong>de</strong> Variação 1,090893<br />

Mediana 29<br />

Primeiro Quartil 12<br />

Terceiro Quartil 68<br />

Mínimo 1<br />

Máximo 306<br />

Assim o tempo médio observado foi <strong>de</strong> aproximadamente 50 meses, com<br />

<strong>de</strong>svio padrão <strong>de</strong> 54,4 meses. Po<strong>de</strong>mos visualizar a assimetria e dispersão dos<br />

tempos à partir da Figura 4.1 que segue.<br />

38


350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0<br />

-50<br />

Figura 4.1: Boxplot dos tempos observados<br />

Var1<br />

Inicialmente, realizaremos uma análise não-paramétrica afim <strong>de</strong> verificarmos<br />

o comportamento dos tempos até que os pacientes experimentem o evento <strong>de</strong><br />

interesse (óbito).<br />

4.1 – Análise Não-Paramétrica<br />

O primeiro passo para analisar um conjunto <strong>de</strong> dados em sobrevivência é realizar<br />

uma análise <strong>de</strong>scritiva das variáveis através do Estimador Produto-Limite ou Kaplan-<br />

Meier (Kaplan e Meier, 1958). Uma análise não paramétrica dos tempos é<br />

apresentada afim <strong>de</strong> verificar o comportamento <strong>de</strong>sses tempos. Além do<br />

comportamento, temos o interesse em analisar as curvas <strong>de</strong> sobrevivência empírica<br />

na presença <strong>de</strong> covariáveis. Para isto aplicando o Testes Log-Rank é aplicado com<br />

o intuito <strong>de</strong> verificar as possíveis covariáveis do mo<strong>de</strong>lo <strong>de</strong> regressão.<br />

Para todas as variáveis classificas como categóricas foram construídas as curvas<br />

<strong>de</strong> sobrevivência, (Sexo, Cor, Sangue, FatorRH, Transplante, AntiHBS Diabetes e<br />

Pressão).<br />

39


S(t)<br />

S(t)<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 50 100 150 200 250 300<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

Tempo (meses)<br />

Masculino<br />

Feminino<br />

S (t)<br />

0 .0 0 .2 0 .4 0 .6 0 .8 1 .0<br />

COR como causa da insuficiência renal<br />

0 50 100 150 200 250 300<br />

Tempo (meses)<br />

(a) (b)<br />

0 50 100 150 200 250 300<br />

Tempo (meses)<br />

Negativo<br />

Positivo<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 50 100 150 200 250 300<br />

Tempo (meses)<br />

(c) (d)<br />

0 50 100 150 200 250 300<br />

Tempo (meses)<br />

Sim<br />

Não<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 50 100 150 200 250 300<br />

Tempo (meses)<br />

Sim<br />

Não<br />

Não<br />

Sim<br />

Amarela<br />

Branca<br />

Negra<br />

Parda<br />

40


S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

(e) (f)<br />

0 50 100 150 200 250 300<br />

Tempo (meses)<br />

Sim<br />

Não<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

SANGUE como causa da insuficiência renal<br />

0 50 100 150 200 250 300<br />

Tempo (meses)<br />

(g) (h)<br />

Figura 4.2: Sobrevivências estimadas, via estimador <strong>de</strong> Kaplan-Meier, para<br />

as covariáveis: (a) Sexo; (b) Cor; (c) FatorRh; (d) Transplante; (e) AntiHBS;<br />

(f) Diabetes; (g) Pressão; (h) Tipo Sanguíneo.<br />

Através das figuras apresentadas em (Figura 4.2 a-h), po<strong>de</strong>mos verificar os<br />

comportamentos das funções <strong>de</strong> sobrevivência, pon<strong>de</strong>radas pelas covariáveis em<br />

estudo, covariáveis estas, categóricas.<br />

Nota-se para estas figuras que, visualmente, as curvas <strong>de</strong> Kaplan-Meier para as<br />

covariáveis Sexo, Cor, Transplante, AntiHBS, Diabetes e Pressão, se mostram<br />

distantes, o que pré-indica que os tempos <strong>de</strong> sobrevivência se comportam <strong>de</strong> forma<br />

diferenciadas para os distintos níveis <strong>de</strong>stas covariáveis..<br />

À partir <strong>de</strong>stas figuras, utilizamos do teste <strong>de</strong> log-rank para verificar, <strong>de</strong> forma<br />

quantitativa, o quanto as curvas <strong>de</strong> sobrevivência se comportam <strong>de</strong> forma distinta,<br />

ou não, para os níveis das covariáveis. O critério utilizado neste trabalho foi o <strong>de</strong><br />

manter as covariáveis que apresentarem valores p inferiores a 0,25 (ou 25%), no<br />

teste log-rank. Esta proposta em escolher um nível relativamente mo<strong>de</strong>sto <strong>de</strong><br />

significância é baseada em recomendações <strong>de</strong> Ben<strong>de</strong>l e Afifi (1997) para regressão<br />

linear, <strong>de</strong> Constanza e Afifi (1979) para análise discriminante e <strong>de</strong> Mickey e<br />

Greenland (1989) para mudanças nos coeficientes do mo<strong>de</strong>lo <strong>de</strong> regressão logística,<br />

Colosimo (2006). As estatísticas são apresentadas na Tabela 4.3.<br />

A<br />

AB<br />

B<br />

O<br />

41


Tabela 4.3: Resultados do teste <strong>de</strong> log-rank<br />

Covariáveis<br />

<strong>Estatística</strong> <strong>de</strong><br />

teste Log-rank Valor p<br />

Ida<strong>de</strong> 419,43 0,001<br />

Sexo 6,86<br />

0,008<br />

Cor 11,16<br />

0,01<br />

Sangue 0,033<br />

0,99<br />

Fator RH 1,1<br />

0,29<br />

Transplante 15,96 0,001<br />

IMC 800,76 0,001<br />

AntHBS 30,92 0,001<br />

Diabets 20,77<br />

7,53<br />

0,001<br />

Pressão 0,006<br />

Os testes indicaram que apenas as covariáveis Tipo Sanguíneo e FatorRH não<br />

apresentaram diferença nas curvas <strong>de</strong> sobrevivência. Portanto, as covariáveis Sexo,<br />

Cor, Transplante, IMC, AntiHBS, Diabetes e Pressão <strong>de</strong>vem ser incluídas no<br />

mo<strong>de</strong>lo, uma vez que estas apresentam diferença significativa no comportamento<br />

dos tempos <strong>de</strong> vida dos pacientes em estudo<br />

4.2 – Análise Paramétrica<br />

A próxima etapa é <strong>de</strong>finir qual distribuição <strong>de</strong> probabilida<strong>de</strong> melhor <strong>de</strong> ajusta ao<br />

tempo <strong>de</strong> sobrevida estudado. Para isto, partiu da distribuição Gama Generalizada.<br />

Foram, então, construídos os testes da razão <strong>de</strong> verossimilhança para indicar quais<br />

variáveis <strong>de</strong>veram continuar no mo<strong>de</strong>lo. Os testes são apresentados na Tabela 4.4.<br />

42


Tabela 4.4: Resultado dos testes da Razão <strong>de</strong><br />

verossimilhança<br />

Estatistica <strong>de</strong><br />

Passos Mo<strong>de</strong>lo -2logL(θ) teste (TRV) Valor p<br />

Passo 1 nulo 629,96 - -<br />

ida<strong>de</strong> (id) 594,08 35,880 0,000<br />

sexo (sx) 626,02 3,940 0,047<br />

cor (cr) 613,28 16,680 0,000<br />

transplante (tr) 603,46 26,500 0,000<br />

imc (im) 628,5 1,460 0,227<br />

antihbs (na) 598,5 31,460 0,000<br />

diabetes (di) 613,5 16,460 0,000<br />

pressao (pr) 622,44 7,520 0,006<br />

Passo 2 id+sx+cr+tr+na+di+pr 533,12 - 0,000<br />

sx+cr+tr+na+di+pr 555,46 22,34 0,000<br />

id+cr+tr+na+di+pr 539,92 6,8 0,009<br />

id+sx+tr+na+di+pr 541,66 8,54 0,003<br />

id+sx+cr+an+di+pr 535,78 2,66 0,103<br />

id+sx+cr+tr+im+di+pr 550,88 17,76 0,000<br />

id+sx+cr+tr+na+pr 533,3 0,18 0,671<br />

id+sx+cr+tr+na+di 544,68 11,56 0,001<br />

Passo 3 id+sx+cr+na+pr 535,92 - -<br />

id+sx+cr+na+pr+tr 533,3 2,62 0,106<br />

id+sx+cr+na+pr+di 535,78 0,14 0,708<br />

Passo 4 id+sx+cr+na+pr 535,92 - -<br />

id+sx+cr+na+pr+im 535,5 0,42 0,517<br />

Passo 5 id+sx+cr+na+pr 535,92 - -<br />

sx+cr+na+pr 571,84 35,92 0,000<br />

id+cr+na+pr 544,36 8,44 0,004<br />

id+sx+na+pr 546,4 10,48 0,001<br />

id+sx+cr+pr 557,88 21,96 0,000<br />

id+sx+cr+na 549,42 13,5 0,000<br />

Para análise, utilizamos Software SAS para obter as estimativas, e o Software<br />

R para a construção dos gráficos. Os resultados da Tabela 4.4 indicam que as<br />

covariáveis Ida<strong>de</strong>, Sexo, Cor, AntiHBS e Pressão são estatisticamente<br />

significativas para o mo<strong>de</strong>lo.<br />

A fim <strong>de</strong> verificar o ajuste <strong>de</strong>stas covariáveis, foram plotados os seus ajustes<br />

versos as curvas empíricas <strong>de</strong> Kaplan-Meier<br />

Primeiramente analisamos qual distribuição se ajusta melhor com as curvas<br />

<strong>de</strong> sobrevivência, não levando em conta as covariáveis. Os gráficos do tempo <strong>de</strong><br />

sobrevida com o ajuste paramétrico para as distribuições exponencial, weibull e<br />

log-normal estão dispostos na Figura 4.3.<br />

43


S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

Kaplan-Meier<br />

exponencial<br />

0 50 100 150 200 250 300<br />

Tempos<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

Kaplan-Meier<br />

Weibull<br />

0 50 100 150 200 250 300<br />

Tempos<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

Kaplan-Meier<br />

Log-normal<br />

0 50 100 150 200 250 300<br />

Tempos<br />

Figura 4.3: Curvas <strong>de</strong> sobrevivência com os ajustes da<br />

Exponencial, weibull e log-normal<br />

Para tentar obter um melhor ajuste paramétrico graficamente, também<br />

utilizamos a linearização da função <strong>de</strong> sobrevivência da função exponencial,<br />

weibull e log-normal respectivamente mostrados na Figura 4.4 e 4.5.<br />

44


S(t): Exponencial<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

S(t): Kaplan-Meier<br />

S(t): Weibull<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

S(t): Kaplan-Meier<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

S(t): Kaplan-Meier<br />

Figura 4.4: Gráficos das sobrevivências estimadas por Kaplan-Meier versus<br />

as sobrevivências estimadas pelos mo<strong>de</strong>los exponencial, <strong>de</strong> Weibull e log-<br />

-Log(S(t))<br />

0.0 0.5 1.0 1.5 2.0 2.5<br />

0 50 100 200 300<br />

Tempos<br />

normal, respectivamente.<br />

log(-log(S(t)))<br />

-5 -4 -3 -2 -1 0 1<br />

0 1 2 3 4 5<br />

log(tempos)<br />

S(t): Log-Normal<br />

-1 0 1 2<br />

0 1 2 3 4 5<br />

log(tempos)<br />

Figura 4.5: Gráficos da linearização para os mo<strong>de</strong>los exponencial, weibull e<br />

log-normal respectivamente.<br />

Φ −1 (S(t))<br />

45


Após análise gráfica os três mo<strong>de</strong>los foram comparados através do valor da<br />

log verossimilhança. O valor das estatísticas estão na Tabela 4.5.<br />

Tabela 4.5: Resultados dos testes da razão <strong>de</strong> verossimilhança.<br />

Mo<strong>de</strong>lo Log-verossimilhança<br />

Exponencial 274,29<br />

Weibull 268,21<br />

Log-Normal 278,26<br />

O mo<strong>de</strong>lo que mais se a<strong>de</strong>qua aos tempos em estudo é o que apresenta<br />

menor valor em módulo do log da verossimilhança, sendo assim, consi<strong>de</strong>ramos<br />

para este estudo o ajuste através do mo<strong>de</strong>lo Weibull.<br />

4.2.1 - Verificação do ajuste<br />

Para verificar o ajuste foi construído as curvas estimatimadas <strong>de</strong> Kaplan-<br />

Meier versos o ajuste do mo<strong>de</strong>lo para cada um dos parâmetros. Assim os ajustes<br />

foram:<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 50 100 150 200 250 300<br />

t<br />

Masculino<br />

Feminino<br />

Figura 4.6: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />

Versus o ajuste do mo<strong>de</strong>lo Weibull para o fator sexo.<br />

46


Para o fator sexo, percebemos um bom ajuste a partir do mo<strong>de</strong>lo Weibull, isso<br />

significa que o mo<strong>de</strong>lo está prevendo bem os dados comparando com as<br />

estimativas <strong>de</strong> Kaplan-Meier. A análise indica que os homens com problemas<br />

renais possuem uma estimativa maior do tempo <strong>de</strong> vida comparado ao sexo<br />

feminino com problemas renais.<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 50 100 150 200 250 300<br />

Figura 4.7: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />

Versus o ajuste do mo<strong>de</strong>lo Weibull para a variável pressão.<br />

Para o fator Pressão o mo<strong>de</strong>lo ajustado Weibull também obteve uma boa<br />

precisão mesmo que a calda não esteja bem ajustada. A interpretação para esse<br />

gráfico é que os pacientes com problemas renais que possuem pressão alta<br />

possuem uma estimativa do tempo <strong>de</strong> vida menor que os pacientes com<br />

problemas renais que não têm problemas com pressão alta.<br />

t<br />

False<br />

True<br />

47


S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

0 50 100 150 200 250 300<br />

Figura 4.8: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />

Versus o ajuste do mo<strong>de</strong>lo Weibull para o fator AntiHBS.<br />

t<br />

O fator AntiHBS mostra-se bem ajustada ao mo<strong>de</strong>lo paramétrico Weibull,<br />

on<strong>de</strong> po<strong>de</strong>-se interpretar que pacientes com problemas renais que tomaram<br />

vacina <strong>de</strong> hepatite B possuem uma estimativa maior do tempo <strong>de</strong> vida do que os<br />

pacientes com problemas renais não vacinados.<br />

Por fim, a Figura 4.9 apresenta o ajuste para a covariável cor do paciente.<br />

S(t)<br />

0.0 0.2 0.4 0.6 0.8 1.0<br />

False<br />

True<br />

0 50 100 150 200 250 300<br />

t<br />

Amarela<br />

Branca<br />

Negra<br />

parda<br />

Figura 4.9: Gráficos das sobrevivências estimadas por Kaplan-Meier<br />

Versus o ajuste do mo<strong>de</strong>lo weibull para o fator cor.<br />

48


4.2.2 - Estimativa dos Parâmetros do Mo<strong>de</strong>lo Ajustado Weibull<br />

Consi<strong>de</strong>re o mo<strong>de</strong>lo Weibull ajustado dado por:<br />

S(t)= exp[ -[ t/µ(x)] γ ]<br />

on<strong>de</strong><br />

^ ^ ^ ^ ^ ^ ^ ^<br />

µ(x)= exp( β 0 β 1 x1 + β 2 x2<br />

+ β 3 x3<br />

+ β 4 x4<br />

+ β 5 x5<br />

+ β 6 x6<br />

+ β 7 x7<br />

e<br />

+ )<br />

X1=ida<strong>de</strong>, X2=sexo, X3=cor amarela, X4=cor branca, X5=cor negra, X6=AntiHBS e<br />

X7=Pressão.<br />

Assim as estimativas dos parâmetros são apresentadas na Tabela 4.6 que<br />

segue.<br />

Tabela 4.6: Estimativas dos parâmetros<br />

Parametros Estimativa <strong>Estatística</strong> Teste P-valor<br />

Intercepto 74,537 187,7


• Cor: O tempo mediano <strong>de</strong> vida dos pacientes com problemas renais <strong>de</strong> cor<br />

parda é 2,2, 2,6 e 1,9 vezes maior do que pacientes <strong>de</strong> cor amarela, branca e<br />

negra respectivamente.<br />

• AntiHBS: Pacientes que tomaram a vacina contra hepatite B e apresentam<br />

problemas renais tem o tempo mediano <strong>de</strong> vida 2 vezes maior que os<br />

pacientes que não tomaram vacina contra hepatite B e tem problemas renais.<br />

• Pressão: Pacientes que fazem tratamento renal e não possuem problemas <strong>de</strong><br />

pressão alta tem aproximadamente o dobro do tempo mediano <strong>de</strong> vida.<br />

4.2.3 - Análise <strong>de</strong> resíduos<br />

res.mart<br />

-2 -1 0 1<br />

0 50 100 150 200 250 300<br />

In<strong>de</strong>x<br />

Figura 4.10: Resíduos Martingale<br />

50


es.<strong>de</strong>vi<br />

-log(r.surv1$surv)<br />

-1 0 1 2 3<br />

0 1 2 3 4<br />

0 50 100 150 200 250 300<br />

In<strong>de</strong>x<br />

Figura 4.11: Resíduos Deviance<br />

0 1 2 3<br />

r.surv1$time<br />

Figura 4.12: Resíduos Cox-Snell<br />

51


Capítulo 5 – Conclusão<br />

Evi<strong>de</strong>nciou-se a importância dos estudos <strong>de</strong> sobrevivência nessa população<br />

<strong>de</strong> pacientes renais crônicos para elucidar muitas questões ainda obscuras,<br />

especialmente, pela escassez <strong>de</strong> estudos <strong>de</strong>ssa natureza em nosso meio.<br />

Recomenda-se um preenchimento mais cuidadoso dos prontuários por parte<br />

<strong>de</strong> médicos e <strong>de</strong>mais profissionais envolvidos no contato direto com os pacientes.<br />

Com o mo<strong>de</strong>lo ajustado, é possível fazer previsões aos pacientes <strong>de</strong><br />

hemodiálise do hospital Instituto do Rim <strong>de</strong> Maringá, lembrando que um mo<strong>de</strong>lo<br />

<strong>de</strong>ve estar sempre sendo reajustado, com novas observações, uma vez que pelo<br />

fato da população estar sempre em constante <strong>de</strong>senvolvimento, os mo<strong>de</strong>los vão<br />

per<strong>de</strong>ndo seus ajustes.<br />

Informações importantes pu<strong>de</strong>ram ser observadas, como as que o sexo<br />

feminino, pressão alta, vacina contra hepatite B e pacientes <strong>de</strong> cor branca são<br />

fatores em potencial para diminuir o tempo <strong>de</strong> vida <strong>de</strong> pacientes com problemas<br />

renais, sendo os fatores pressão e AntiHBS os mais significativos, pois diminuem o<br />

dobro do tempo <strong>de</strong> vida dos pacientes.<br />

Um cuidado especial <strong>de</strong>ve ser tomado com crianças que apresentam<br />

problemas renais, pois a cada ida<strong>de</strong> ganha sem problemas o tempo <strong>de</strong>vido a<br />

fatalida<strong>de</strong> cai em 3%.<br />

Analise <strong>de</strong> resíduos não é feita em dados <strong>de</strong> sobrevivência, pelo fato da<br />

ausência <strong>de</strong> normalida<strong>de</strong> dos resíduos. Existem já estudos para tal problema, on<strong>de</strong><br />

<strong>de</strong>vem ser concluídos para tal analise.<br />

52


Bibliografias<br />

Ben<strong>de</strong>l, R. e Afifi A. Comparison of Stopping Rules in Forward ‘Stepwise’<br />

Regression. En: Journal of the American Statistical Association, 72 (357): 46-53,<br />

1977.<br />

BOLFARINE, H.; RODRIGUES, J.; ACHCAR, J. A. Análise <strong>de</strong> Sobrevivência. 2ª<br />

Escola Nacional <strong>de</strong> Mo<strong>de</strong>los <strong>de</strong> Regressão, Rio <strong>de</strong> Janeiro, 1991.<br />

CAIN, S. R. Distinguishing Between Lognormal and Weibull distributions.<br />

International Journal of Reability, Quality and Safety Engineering, vol. 51, nº 01,<br />

2002.<br />

CASTANHEIRA J. ; PEREIRA T.; CONDE J. Impacto da hemodiálise versus diálise<br />

peritoneal na anatomia cardíaca em doentes com insuficiência renal crônica. In:<br />

CONGRESO VIRTUAL DE CARDIOLOGÍA, 4., 2005.<br />

COLLET, D. Mo<strong>de</strong>lling survival data in medical research. New York: Chapman and<br />

Hall, 1994.<br />

COLOSIMO, E. A. Análise <strong>de</strong> Sobrevivência Aplicada. In: 46ª Reunião Anual da<br />

Região Brasileira da Socieda<strong>de</strong> Internacional <strong>de</strong> Biometria (RBRAS) e 9º Simpósio<br />

<strong>de</strong> <strong>Estatística</strong> Aplicada e Experimentação Agronômica (SEAGRO). Piracicaba, 1995.<br />

COLOSIMO, E. A.; GIOLO, S. R. Análise <strong>de</strong> sobrevivência aplicada. São Paulo:<br />

Edgard Blücher, 2006. 369p.<br />

COLTON, T., 1979. Statistica in Medicine. Padova: Piccin Editore.<br />

Costanza M. C. and Afifi A, Comparison of stopping rules in forward stepwise<br />

discriminant analysis, Journal of the American Statistical Analysis, 74, 777-785,<br />

1979.<br />

CARDOZO, M.T.; VIEIRA, I.O.; CAMPANELLA, L.C.A. Alterações nutricionais em<br />

pacientes renais crônicos em programa <strong>de</strong> hemodiálise. Revista Brasileira <strong>de</strong><br />

Nutição Clínica, v. 21(4), p. 284-289, 2006.<br />

CAVAlLCANTE, U.M.T.; Maia, L.C.; Melo, A.M.M. & Santos, V.F. Influência da<br />

<strong>de</strong>nsida<strong>de</strong> <strong>de</strong> fungos micorrízicos arbusculares na produção <strong>de</strong> mudas <strong>de</strong><br />

maracujazeiro-amarelo. Pesquisa Agropecuária Brasileira 37: 643-649. 2002.<br />

COX, D. R.; OAXES, D. Analysis of Survival Data. 1ª Ed. London: Chapman & Hall,<br />

1984.<br />

54


COX, D. R.; SNELL, E. J. A general <strong>de</strong>finition of residuals. Journal of the Royal<br />

Statistical Society B, London, v. 30, n. 2, p. 248-254, Mar. 1968.<br />

CROW, E. L., SHIMIZU, K. Lognormal Distributions. New York: Marcel Dekker, 1988.<br />

FLETCHER, R. H.; FLETCHER, S. W. & WAGNER, E. H.. Epi<strong>de</strong>miologia Clínica:<br />

Elementos Essenciais, 3a Ed. Porto Alegre: Artes Médicas, 1996.<br />

KAHN, H. A. & SEMPOS, C. T., Statistical Methods in Epi<strong>de</strong>miology. New<br />

York/Oxford: Oxford University Press, 1989.<br />

KAPLAN, E. L. & MEIER, P., 1958. Non parametric estimation from incomplete<br />

observation. Journal of the American Statistics Association, 53:457-481, 1989.<br />

KLEIBAUM, D. G. Survival Analysis: a self-learning text. New York: Springer-Verlag,<br />

1996.<br />

Klein and Moeschberger, Survival Analysis Techniques for Censored and truncated<br />

data, Springer, 1997.<br />

KLEINBAUM, D. G., Survival Analysis: A Self-Learning Text. New York: Springer,<br />

1995.<br />

LAWLESS, J. F. Statistical Mo<strong>de</strong>ls and Methods for Lifetime Data. New York: Wiley,<br />

1982.<br />

LEE, E. T. Statistical methods for Survival data Analysis. 2ª Ed. New York: john Wiley<br />

& Sons, 1992.<br />

MARQUES, A. B.; PEREIRA, D. C.; RIBEIRO, R. C. H. M. Motivos e freqüência <strong>de</strong><br />

internação dos pacientes com IRC em tratamento hemodialítico. Arq. Ciênc. Saú<strong>de</strong>.,<br />

São José do Rio Preto, v.12, n.2, p.67-72, 2005.<br />

MICKEY, J., ANDS . GREENLAND. A study of the impacto f confoun<strong>de</strong>r-selection<br />

criteria on effect estimation. American Journal of Epi<strong>de</strong>miology 129:125-137, 1989.<br />

NELSON, W. Accelerated Life Testing: Statistical Mo<strong>de</strong>ls, data Analysis and Test<br />

Plans. New York: John Wiley & Sons, 1990.<br />

PARKIN, D. M. & HAKULINEN, T., Analysis of survival. In: Cancer Registration<br />

Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir & R.<br />

G. Skeet, ed.), IARC Scientific Publications 95, pp. 159-176, Lyon: International<br />

Agency for Research on Cancer, 1991.<br />

SANTOS, P. R. Associação <strong>de</strong> qualida<strong>de</strong> <strong>de</strong> vida com hospitalização e óbito em<br />

pacientes portadores <strong>de</strong> doença renal crônica em hemodiálise. J. Bras. Nefrol., São<br />

Paulo, v.27, n.4, 2005.<br />

55


SBN - Socieda<strong>de</strong> Brasileira <strong>de</strong> Nefrologia. Disponível em: <br />

.Acesso em: 18 maio 2009.<br />

SELVIN, S., Statistical Analysis of Epi<strong>de</strong>miologic Data. 2nd Ed. New York/Oxford:<br />

Oxford University Press, 1996.<br />

SOUZA, E. X. <strong>de</strong>. Análise <strong>de</strong> Confiabilida<strong>de</strong>: Um estudo sobre o Tempo <strong>de</strong> Vida <strong>de</strong><br />

Pneus. Natal. 62 p. Monografia (Graduação em <strong>Estatística</strong>). <strong>Departamento</strong> <strong>de</strong><br />

<strong>Estatística</strong>, Universida<strong>de</strong> Fe<strong>de</strong>ral do Rio Gran<strong>de</strong> do Norte, 2001.<br />

SZKLO, M. & NIETO, F. J., Epi<strong>de</strong>miology: Beyond the Basics. Annapolis: Aspen<br />

Publishers, 2000<br />

Therneau, T.M. y Grambsch, P.M. Mo<strong>de</strong>ling Survival Data: Extending the Cox Mo<strong>de</strong>l.<br />

N.Y.: Springer-Verlag, 2000.<br />

WEIBULL, W. A statistical representation of fatigue failure in solids. Royal Institute<br />

Technology, Stockholm, 1954.<br />

YOUNG, J. L., 1991. The hospital-based cancer registry. In: Cancer Resgistration:<br />

Principles and Methods (O. M. Jensen, D. M. Parkin, R. Maclennan, C. S. Muir, R. G.<br />

Skeet, ed.), IARC Scientific Publication 95, pp. 177-184, Lyon: International Agency<br />

for Research on Cancer.<br />

56


Anexo A Programa no SAS.<br />

PROC IMPORT OUT= WORK.TCCc<br />

DATAFILE= "C:\Documents and Settings\13\Desktop\Estagio\Thia<br />

go Estatistica\analise <strong>de</strong> sobrevivencia2.xls"<br />

DBMS=EXCEL REPLACE;<br />

SHEET="dados$";<br />

GETNAMES=YES;<br />

MIXED=NO;<br />

SCANTEXT=YES;<br />

USEDATE=YES;<br />

SCANTIME=YES;<br />

RUN;<br />

data rim;<br />

set tccc;<br />

run;<br />

/* variaveis<br />

Ida<strong>de</strong> SEXO COR Tempo SANGUE FATORRH TRANSPLANTE IMC<br />

ANTIHBS DIABETES censura pres<br />

*/<br />

proc lifetest data = rim;/* ida<strong>de</strong> */<br />

time tempo*censura(0);<br />

strata ida<strong>de</strong> ;<br />

run;<br />

proc lifetest data = rim;/* sexo */<br />

time tempo*censura(0);<br />

strata sexo cor;<br />

run;<br />

proc lifetest data = rim;/* cor */<br />

time tempo*censura(0);<br />

strata cor;<br />

run;<br />

proc lifetest data = rim;/* sangue */<br />

time tempo*censura(0);<br />

strata sangue;<br />

run;<br />

proc lifetest data = rim;/* fatorrh */<br />

time tempo*censura(0);<br />

strata fatorrh;<br />

run;<br />

proc lifetest data = rim;/* transplante */<br />

time tempo*censura(0);<br />

strata transplante;<br />

run;<br />

proc lifetest data = rim;/* imc */<br />

time tempo*censura(0);<br />

/* Testes <strong>de</strong> Log-Ranck e Wilcoxon para todas as covariaveis */<br />

57


un;<br />

strata imc;<br />

proc lifetest data = rim;/* antihbs */<br />

time tempo*censura(0);<br />

strata antihbs;<br />

run;<br />

proc lifetest data = rim;/* diabetes */<br />

time tempo*censura(0);<br />

strata diabetes;<br />

run;<br />

proc lifetest data = rim;/* pressao */<br />

time tempo*censura(0);<br />

strata pres;<br />

run;<br />

/* tipo sanguinio e fator RH nao entraram nos mo<strong>de</strong>los */<br />

/* ida<strong>de</strong> sexo cor transplante imc antihbs diabetes pres */<br />

/* Ajuste <strong>de</strong> mo<strong>de</strong>los gamma*/<br />

proc lifereg data = rim;/*nulo primeira etapa*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*ida<strong>de</strong> */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*sexo */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = sexo / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*cor */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = cor / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*transplante*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = transplante/ dist=gamma;<br />

run;<br />

proc lifereg data = rim;/* imc*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = imc/ dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*antihbs */<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = antihbs/ dist=gamma;<br />

58


proc lifereg data = rim;/*diabetes */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = diabetes / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*pres */<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = pres / dist=gamma;<br />

proc lifereg data = rim;/*completo segunda etapa sem a var IMC*/<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs diabetes pres / dist=gamma;<br />

proc lifereg data = rim;/*ida<strong>de</strong> */<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = sexo cor transplante antihbs diabetes pres / dist=gamma;<br />

proc lifereg data = rim;/*sexo */<br />

run;<br />

class cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> cor transplante antihbs diabetes pres / dist=gamma;<br />

proc lifereg data = rim;/*cor */<br />

run;<br />

class sexo transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo transplante antihbs diabetes pres / dist=gamma;<br />

proc lifereg data = rim;/*transplante */<br />

run;<br />

class sexo cor antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs diabetes pres / dist=gamma;<br />

proc lifereg data = rim;/*antihbs*/<br />

run;<br />

class sexo cor transplante diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante diabetes pres / dist=gamma;<br />

proc lifereg data = rim;/*diabets */<br />

run;<br />

class sexo cor transplante antihbs pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs pres / dist=gamma;<br />

proc lifereg data = rim;/*pres */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs diabetes / dist=gamma;<br />

59


un;<br />

proc lifereg data = rim;/*completo terceira etapa sem transplante e diabetes add uma por vez*/<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres / dist=gamma;<br />

proc lifereg data = rim;/*transplante*/<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor transplante antihbs pres / dist=gamma;<br />

proc lifereg data = rim;/*diabetes */<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs diabetes pres / dist=gamma;<br />

proc lifereg data = rim;/*completo quarta etapa colocar as q sairao na fase 1 IMC*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/* IMC*/<br />

run;<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres imc / dist=gamma;<br />

proc lifereg data = rim;/*completo quinta etapa tirar um a um*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*ida<strong>de</strong>*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = sexo cor antihbs pres / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/* sexo*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> cor antihbs pres / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*cor*/<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo antihbs pres / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*antihbs*/<br />

class sexo cor transplante diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor pres / dist=gamma;<br />

run;<br />

proc lifereg data = rim;/*pres*/<br />

60


un;<br />

class sexo cor transplante antihbs pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs / dist=gamma;<br />

/* Ajuste a um mo<strong>de</strong>lo parametrico */<br />

proc lifereg data = rim; /*Gamma */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />

cor*pres sexo*cor cor*antihbs / dist=gamma;<br />

run;<br />

proc lifereg data = rim; /*exponencial */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />

cor*pres sexo*cor cor*antihbs/ dist=exponential;<br />

run;<br />

proc lifereg data = rim; /*weibull */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />

cor*pres sexo*cor cor*antihbs;<br />

run;<br />

proc lifereg data = rim; /*log-normal */<br />

class sexo cor transplante antihbs diabetes pres;<br />

mo<strong>de</strong>l tempo*censura(0) = ida<strong>de</strong> sexo cor antihbs pres ida<strong>de</strong>*antihbs ida<strong>de</strong>*pres ida<strong>de</strong>*cor<br />

cor*pres sexo*cor cor*antihbs/covb dist=lognormal;<br />

output out=wa cdf=f;<br />

run;<br />

Anexo B Programa no R<br />

dialise


legend(260.5,0.9,lty=c(4),c("Não"),bty="n",cex=1.0)<br />

legend(260.5,0.8,lty=c(1),c("Sim"),bty="n",cex=1.0)<br />

ekm


ajust3<br />

ekm


ekm = survfit(Surv(tempo,censura)~sexo,type="kaplan-meier")<br />

masculino=0<br />

feminino=1<br />

sort(tempo)<br />

mu = 0.9897<br />

gama= 1.0104<br />

beta0= 4.892<br />

beta1= -0.4462<br />

S1 = exp(-(tempo/(exp(beta0+beta1*masculino)))^gama)<br />

S2 = exp(-(tempo/(exp(beta0+beta1*feminino)))^gama)<br />

plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")<br />

lines(tempo,S1,type="l",lty=2,col="blue")<br />

lines(tempo,S2,type="l",lty=2,col="red")<br />

legend(250,0.8, lty=c(1,2),c("Masculino", "Feminino"), bty="n", cex=0.8)<br />

text(150.5,0.93,c("Ajuste da variavel Sexo"),bty="n",cex=1.2)<br />

AntiHBS<br />

ekm = survfit(Surv(tempo,censura)~anthbs,type="kaplan-meier")<br />

false=1<br />

true=0<br />

sort(tempo)<br />

mu = 0.8951<br />

gama= 1.1172<br />

beta0= 5.1288<br />

beta1= -0.9557<br />

S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama)<br />

S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama)<br />

plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")<br />

lines(tempo,S1,type="l",lty=2,col="blue")<br />

lines(tempo,S2,type="l",lty=2,col="red")<br />

legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8)<br />

text(150.5,0.93,c("Ajuste da variavel AntiHBS"),bty="n",cex=1.2)<br />

Pressão<br />

ekm = survfit(Surv(tempo,censura)~pres,type="kaplan-meier")<br />

false=1<br />

true=0<br />

sort(tempo)<br />

mu = 0.9781<br />

gama= 1.0224<br />

beta0= 4.2038<br />

beta1= 0.6054<br />

S1 = exp(-(tempo/(exp(beta0+beta1*false)))^gama)<br />

S2 = exp(-(tempo/(exp(beta0+beta1*true)))^gama)<br />

plot(ekm,lty=c(1,4),xlab="t",ylab="S(t)")<br />

lines(tempo,S1,type="l",lty=2,col="blue")<br />

lines(tempo,S2,type="l",lty=2,col="red")<br />

legend(250,0.8, lty=c(1,2),c("False", "True"), bty="n", cex=0.8)<br />

text(150.5,0.93,c("Ajuste da variavel Pressão"),bty="n",cex=1.2)<br />

64


ekm = survfit(Surv(tempo,censura)~cor,type="kaplan-meier")<br />

amarela=1<br />

branca=1<br />

negra=1<br />

sort(tempo)<br />

mu = 0.9951<br />

gama= 1.0050<br />

beta0= 5.9623<br />

beta1= -1.1069<br />

beta2= -1.3950<br />

beta3= -1.0080<br />

S1 = exp(-(tempo/(exp(beta0+beta1*amarela)))^gama)<br />

S2 = exp(-(tempo/(exp(beta0+beta2*branca)))^gama)<br />

S3 = exp(-(tempo/(exp(beta0+beta3*negra)))^gama)<br />

S4 = exp(-(tempo/(exp(beta0)))^gama)<br />

plot(ekm,lty=c(1,2,3,4),xlab="t",ylab="S(t)")<br />

lines(tempo,S1,type="l",lty=2,col="blue")<br />

lines(tempo,S2,type="l",lty=2,col="red")<br />

lines(tempo,S3,type="l",lty=2,col="black")<br />

lines(tempo,S4,type="l",lty=2,col="green")<br />

legend(250,0.8, lty=c(1,2,3,4),c("Amarela", "Branca","Negra","parda"), bty="n",<br />

cex=0.8)<br />

text(150.5,0.93,c("Ajuste da variavel Cor"),bty="n",cex=1.2)<br />

#Analise <strong>de</strong> residuos<br />

# ajuste geral<br />

Cor<br />

dialisee


plot(res.<strong>de</strong>vi)<br />

# exponencial sobrevivencia e risco<br />

<strong>de</strong>v.off()<br />

pdf(file="C:\Documents and Settings\13\Desktop\Estagio\tcc\exp-survival.pdf")<br />

t


(beta/mu)*(t/mu)**(beta-1)<br />

}<br />

mu


<strong>de</strong>v.off()<br />

pdf(file="C:\Documents and Settings\13\Desktop\Estagio\tcc\graficos\\lnormrisco.pdf")<br />

t


lines(t,S,lty=5,lwd=2)<br />

legend(6,1,col=c("black","black","black","black"),bty="n",lty=c(1,3,4,5),lwd=2,c(expres<br />

sion(sigma=="0,5"),<br />

expression(sigma=="1,0"),expression(sigma=="1,5"),expression(sigma=="3,0")))<br />

legend(8,0.93,col="black",bty="n",expression(mu=="1,5"))<br />

<strong>de</strong>v.off()<br />

69

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!