12.07.2015 Views

Capitulo 8 Analisis_..

Capitulo 8 Analisis_..

Capitulo 8 Analisis_..

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Capítulo 8ANÁLISIS e interpretación de los datosRichard C. DickersLa finalidad de muchas investigaciones de campo es identificar las causas, los factores de riesgo,las fuentes, los vehículos, las vías de transmisión, u otros factores que ponen en mayor riesgo aalgunos miembros de la población de tener un evento adverso para la salud si se comparan conotros. En algunas investigaciones de campo es suficiente identificar un culpable, si el culpablepuede eliminarse, el problema se resuelve. En otros contextos la meta puede ser cuantificar larelación entre la exposición (o cualquier característica de la población) y un evento adverso para lasalud. La cuantificación de ésta relación puede conducir no sólo a implementar intervencionesapropiadas, sino también a avanzar en el conocimiento sobre la causalidad de las enfermedades.Ambos tipos de investigación de campo requiere del uso apropiado de métodos epidemiológicos,pero no necesariamente del empleo de sofisticados métodos analíticos. Este capítulo describe laestrategia para planificar un análisis, los métodos para conducir ése análisis y las guías parainterpretar los resultados.PLANIFICACIÓN pre análisis¿Que analizar?El primer paso de un análisis exitoso es establecer previamente una estrategia de análisis. Unanálisis planeado y ejecutado en forma cuidadosa y a conciencia es tan crítico para unainvestigación de campo como lo es para un estudio basado en un protocolo de investigación. Laplanificación es necesaria para asegurar que las hipótesis apropiadas seran consideradas y quelos datos relevantes seran recolectados, registrados, administrados, analizados e interpretadosapropiadamente para evaluar esas hipótesis. Por consiguiente, el tiempo para decidir que (y como)se van a analizar los datos debe darse antes de diseñar el cuestionario, no después que usted harecolectados los datos. Como se muestra en la figura 8-1 las hipótesis de que usted desea evaluarson las que dirigen el análisis. Estas hipótesis generalmente se desarrollan al considerar lascausas y modos de transmisión de la condición bajo investigación; conversando con pacientes ycon personal médico y salud pública local; observando los patrones dominantes en laepidemiología descriptiva; e identificando los resultados diferentes (outliers) en la epidemiologíadescriptiva. Dependiendo de la situación de salud que se está investigando, estas hipótesis debenabordar la fuente del agente, el modo (y vehículo o vector) de la transmisión y las exposiciones quecausan la enfermedad. Estas hipótesis deben ser verificables, ya que la función del análisis seráevaluar estas hipótesis.Una vez que usted ha definido la hipótesis, usted necesita decidir sobre los datos que recolectarápara evaluar esas hipótesis. (Usted también deberá determinar el mejor diseño de estudio segúnse describió en el capítulo anterior). Haciendo referencia de la medicina clínica, la ley X de la casade Dios fue: "si usted no toma una temperatura, usted no puede encontrar la fiebre". En formasimilar en el campo de la epidemiología si usted olvida preguntar acerca de un factor de riesgopotencialmente importante en su cuestionario, usted no puede evaluar si está implicado en el brote.Ya que las hipótesis que usted quiere analizar determinar los datos que usted necesita recolectar,el tiempo para planear el análisis es previo al diseño de su cuestionario.El cuestionario y otros instrumentos de recolección de datos no están limitados a los factores deriesgo. Ellos también deben incluir información sobre la identificación del caso, datos clínicos yvariables descriptivas. La información de la identificación (o códigos de ID que permitan vincular elcaso con información almacenada en otro sitio) le permite re-contactar al encuestado para hacerpreguntas adicionales o proporcionar información de seguimiento. Información clínica suficiente sedebe recolectar para determinar si un paciente cumple verdaderamente con la definición del caso.1


Los datos clínicos sobre el espectro y la gravedad de la enfermedad, hospitalización y las secuelastambién pueden ser útiles. Factores descriptivos sobre tiempo, lugar y personas deben recogersepara caracterizar adecuadamente la población, evaluar la comparabilidad entre grupos (casos ycontroles en un estudio de casos y controles; grupos expuestos y no expuestos en un estudio decohortes) y a ayudar a usted a generar hipótesis acerca de las relaciones causales.EDICIÓN de datosGeneralmente, los datos para un estudio analítico se recopilan en cuestionarios de papel. Estosdatos son luego introducidos en una computadora. Menos comúnmente, los datos se introducendirectamente en una computadora tan pronto son obtenidos. En cualquiera de las situaciones, lasbuenas prácticas de manejo de datos facilitarán el análisis. Estas prácticas incluyen, como mínimo:• Asegurar que usted tenga el número correcto de registros sin duplicados y• tener chequeos en los campos de los datos que controlen la calidadRevise que el número de ficha en la base de datos coincida con el número del cuestionario.Entonces revise para controlar fichas duplicadas. No es inusual en los cuestionarios habersesaltado o metido datos dos veces. Más aún si no se han metido de una sola vez.Dos tipos de chequeos de control de calidad pueden ser realizados antes de comenzar el análisis:el chequeos de rango y el chequeos de lógica o consistencia. El chequeo de rango identificavalores para cada variable que están "fuera del rango". Si, para la variable "género", "masculino"será codificado como 1 y "femenino" como 2, el chequeo de rango puede identificar fichas oindividuos con cualquier otro valor diferente a 1 o 2. Si hay un número 3, o una letra F, o espaciossin llenar, revise el cuestionario original, revise la respuesta o re codifica como valores "datosfaltantes". Para la variable "peso (en libras)" un rango permisible para adultos podría ser de 90 a250. Es muy posible que algunos sujetos podrán pesar más o menos de lo establecido por esterango, pero también es posible que valores fuera del ser rango sean más bien errores decodificación. De nuevo usted debe decidir entre verificar la información o dejarla como ha sidointroducida. El esfuerzo necesario para confirmar y completar la información debería serconsiderado contra el efecto de una pérdida de datos al momento del análisis. Bajo ningunacircunstancia usted deberá cambiar un dato solamente porque usted cree que ése dato estáincorrecto.El chequeo lógico comparar las respuestas de dos diferentes preguntas y marcar aquellas que soninconsistentes. Por ejemplo, un individuo que tiene la variable género codificada como masculino yen la variable "histerectomía" tiene la respuesta si probablemente será marcada. Las fechastambién son variables que deben ser revisadas y comparadas por ejemplo la fecha de inicio de lossíntomas usualmente precede la fecha de la hospitalización (excepto en los brote de infeccionesnosocomiales cuando la fecha hospitalización precede la fecha de inicio de síntomas) asimismo lafecha de inicio deberá preceder a la fechas del reporte. De nuevo usted debe decidir como deberámanejar las inconsistencias.Dos principios adicionales deberían guiar el manejo de los datos. Primero, documentar todo,particularmente sus decisiones. Tome una copia del cuestionario en blanco y escriba en nombre decada una de las variables próximas a la correspondiente pregunta del cuestionario. Si, la variablegénero usted decide recodificarla de la letra F como un número 2 y cambiar el código número 3 aespacio en blanco y la letra T como datos faltantes, escriba toda esas decisiones para saber en elfuturo como será el manejo de las variables y sus valores.Muchas inconsistencias en la base de datos tienden a descubrirse solamente durante el análisis.Trate esta inconsistencias de la misma forma como ha decidido manejarlas y entonces documentesus decisiones.2


El segundo principio es "nunca permita que un error de los datos crezca". Enfrente este problematan pronto como usted lo descubra. Bajo las distintas presiones de una investigación de campo, esmuy común olvidarnos acerca del error de un dato, se analizan los datos tal y como están, lo quepuede traer como consecuencia pasar una vergüenza durante una presentación cuando loscálculos o los valores de un cuadro no parecen tener sentido.Desarrollo de la estrategia de análisisDespués que se hayan editado los datos, usted está preparado para analizarlos. Pero antes de queusted se siente A analizar los datos, primero desarrolle la estrategia de análisis. La estrategia deanálisis es equivalente al esquema que desarrollaría antes de sentarse a escribir el artículo finalprocedido incorpore los componentes clave del análisis en una secuencia lógica y elabore una guíapara continuar el análisis. Una estrategia analítica que se planifica con antelación en formaapropiada, acelera el análisis una vez que se recopilan los datos.TABLA 8-1: Secuencia de la estrategia de análisis epidemiológico1 Establecer, como se recolectaron los datos y de acuerdo a ello, el plan de análisis.2 Identificar listas las variables más importantes a la luz de lo que usted conocesobre el tema en estudio, hipótesis biológicamente plausibles, y la forma en que elestudio será o fue conducido:• exposiciones de interés• efecto de interés• potenciales confusores• variables para análisis de sub grupos3 Para familiarizarse con los datos, planee desarrollar distribuciones de frecuencia yestadística descriptiva de las variables identificadas en el paso número 24 Para caracterizar la población en estudio, construya cuadros de manifestacionesclínicas y epidemiología descriptiva (deben crearse previamente los cuadros y estarlistos para escribir los datos)5 Para evaluar las asociaciones entre exposición-enfermedad, elabore tablas de dosvías basadas basadas en el diseño del estudio, conocimiento existente e hipótesisdel estudio (deben crearse previamente los cuadros y estar listos para escribir losdatos)6 Construya tablas de dos vías adicionales basadas en los hallazgos interesantes delos datos.7 Construya tablas de tres vías más refinadas (ejemplo: dosis-respuesta, análisis desensibilidad) y análisis de subgrupos basados en el diseño, conocimiento previo,hipótesis o hallazgos interesantes de los datos.El primer paso al desarrollar la estrategia de análisis es reconocer como se recolectaron los datos.Por ejemplo, si usted tiene datos de un estudio de cohortes, piense en términos de grupos deexposición y el plan para calcular las tasas. Si usted tiene datos de un estudio de casos ycontroles, piense en términos de casos y controles. Si los casos y los controles se equipararon,planee cómo hacer el análisis apareado. Si usted tiene datos de una encuesta revise el esquemade muestreo, usted puede necesitar un ajuste de los datos por el efecto de diseño en el análisis.El próximo paso es decidir qué variables son las más importantes. Incluye las exposiciones y efectode interés, otros factores de riesgo conocidos, factores del diseño del estudio, las variables que3


usted apareó, cualquier otra variable que usted piense puede tener una repercusión en el análisis ytambién otras variables en las que usted sencillamente está interesado. Si el cuestionario espequeño quizás todas las variables se consideran importantes. Planea revisar la frecuencia derespuestas y hacer estadísticas descriptivas para cada variable. Esta es la mejor manera defamiliarizarse con los datos. ¿Cuáles son los valores mínimos, máximos y promedios para cadavariable? ¿Hay variables que tienen muchas respuestas desconocidas? Si usted deberá hacer unanálisis estratificado o por subgrupos por ejemplo, con respecto a raza, ¿hay un número suficientede respuestas de cada categoría de raza?El próximo paso en la estrategia de análisis es bosquejar las tablas de salida. Una tabla de salidaes un cuadro, como una distribución de frecuencias o un cuadro de dos sentidos, que se titula yrotula completamente pero no contiene ningún dato. Los números se completarán según progresael análisis.Usted debe esbozar la serie de tabla de salida a manera de guía para el análisis. Los cuadrosdeberán proceder en un orden lógico, de lo simple (por ejemplo: epidemiología descriptiva) a locomplejo (por ejemplo: epidemiología analítica). Los cuadros también deben indicar que medidas(por ejemplo, razón de probabilidades) y estadísticas (por ejemplo, CHI cuadrado) usted calcularápara cada cuadro. Mediciones y estadísticas se describen posteriormente en este capítulo.Una manera de pensar sobre los tipos y secuencia de las tablas de salida es considerada quecuadros usted quiere mostrar en su informe. Una secuencia común es la siguiente:Tabla 1:Tabla 2:Manifestaciones clínicas. Ejemplo: signos y síntomas, confirmado por laboratorio,hospitalizados, defunciones, etc.Epidemiología descriptivatiempo: usualmente graficado con un gráfico lineal (para tendencias seculares) ocurva epidémica.Lugar: país de residencia u ocurrencia, mapa de puntos o graduado.Persona: "¿quién está en el estudio? (Edad, raza, sexo, etc.)Para estudios analíticos:Tabla 3:Tabla 4:Tabla 5:Tabla 6:Tablas primarias de asociación, (factores de riesgo por condición de resultados)estratificación de la tabla 3 para separar defectos y evaluar confusión ymodificación de efecto.refinamiento de la tabla 3. Ejemplo: dosis-respuesta, latencia, uso de definicionesde casos más sensibles o más específicos.análisis por subgrupos específicos.La siguiente secuencia de tablas de salida fue diseñada antes de conducir un estudio de casos ycontroles de síndrome de Kawasaki (una enfermedad pediátrica de causa desconocida queocasionalmente ocurre en conglomerados). Dado que no hay ninguna prueba de diagnósticodefinitiva para éste síndrome, la definición de caso requiere que el paciente tenga fiebre más almenos cuatro de las cinco manifestaciones clínicas enumeradas en la tabla de salida A. Treshipótesis a ser probadas por el estudio de casos y controles fueron la asociación supuesta delsíndrome con el antecedente de enfermedad vírica, la exposición reciente al champú de alfombrasy mayor ingreso económico en el hogar.4


TABLA DE SALIDA “A”Criterios Diagnósticos para casos de Síndrome de Kawasaki con inicio Octubre-DiciembreCriterio Número Porcentaje1. Fiebre ≥ 5 días2. Inyección conjuntival bilateral3. Cambios Oralesa. Labios inyectadosb. Faringe inyectadac. Labios secos figuradosd. Lengua en fresa4. Cambios en extremidades periféricasa. Edemab. Eritemac. Descamación periungueal5. Rash6. Linfadenopatía cervical > 1.5 cmTABLA DE SALIDA “B”Días de Hospitalización, Casos de Síndrome de Kawasaki con inicio Octubre-DiciembreDías de hospitalización0123456789Y así hasta el máximoDesconocidoRango:Promedio:Mediana:Frecuencia------------------------------TABLA DE SALIDA “C”Distribución de frecuencia de complicaciones serias en casos de Síndrome de Kawasaki con inicioen Octubre-DiciembreCriterio Número PorcentajeArtritisAneurisma de arteria coronariaOtras complicaciones (listar)Muerte5


TABLA DE SALIDA “D”Características Demográficas de casos de Síndrome de Kawasaki con inicio en Octubre-DiciembreCaracterística Demográfica Número PorcentajeEdadSexoRaza< 1 año1 año2 años3 años4 años5 años≥ 6 añosMujerHombreBlancaNegraAsiáticaOtraTABLA DE SALIDA “E”Distribución de frecuencias por cantón de residencia, casos de Síndrome de Kawasaki con inicioen Octubre-Diciembre.Cantón Número Porcentaje Población Tasa de ataqueCantón ACantón BCantón CCantón DCantón ECantón F6


TABLA DE SALIDA “F”Distribución de frecuencias por Ingreso Familiar,casos de Síndrome de Kawasaki con inicio enOctubre-Diciembre.Ingreso anual familiar * Número Porcentaje< $15,000$15,000 - $29,999$30,000 - $44,999≥ $45,000------------------------------------------------------------------------( %)( %)( %)( %)* Puede ser necesario revisar las categorías de ingreso familiar para establecer rangos.TABLA DE SALIDA “G”Síndrome de Kawasaki y antecedente de Enfermedad Estudio Caso-controlCASOS CONTROLES TOTALAntecedentede enfermedadSI------------- -----------------------NO------------- -----------------------TOTAL ------------- -------------Odds Ratio= _________95% IC = (………..)X 2 = ________Valor de p = (…………)7


TABLA DE SALIDA “H”Síndrome de Kawasaki y Champú de alfombra. Estudio Caso-controlCASOS CONTROLES TOTALChampú deAlfombraSI------------- -----------------------NO------------- -----------------------TOTAL ------------- -------------Odds Ratio= _________95% IC = (………..)X 2 = ________Valor de p = (…………)TABLE DE SALUDA “I”Síndrome de Kawasaki e Ingreso Familiar. Estudio Caso-Control.CASOS CONTROLES TOTALIngresoFamiliar( en miles de $)< 1515 – 2930 – 44≥ 45TOTALX 2 = ________Valor de p = (…………)Ya que la epidemiología descriptiva ha sido cubierta en el capítulo 5, el resto de este capítulodesarrollará las técnicas analíticas más comúnmente usadas en las investigaciones de campo.La figura 8-2 ilustra una pantalla del módulo de análisis del programa Epi-Info (ver capítulo 12).Muestra la salida del comando "tablas" para datos típicos de una investigación de campo. Observelos cuatro elementos de la salida: 1) la tabla de dos –por- dos 2) las medidas de asociación. 3) laspruebas de significancia estadística y 4) los intervalos de confianza. Cada uno de estos elementosse tratará a continuación.8


ILL?Vanilla Ice Cream Yes No TOTALYes% Fila% ColumnaNo% Fila% ColumnaTOTAL% Fila% Columna4379.693.5314.36.54661.3100.01120.437.91885.762.12938.7100.054100.072.021100.028.075100.0100.0Medidas deAsociaciónTabla 2 x 2Análisis de tabla simplePoint 95% Intervalo de ConfianzaEstimación L. Inferior L. SuperiorPARAMETROS: Basados en OROdds Ratio (producto cruzado) 23.4545 5.8410 94.1811 (T)Odds Ratio (EMV-MLE) 22.1490 5.9280 109.1473 (M)5.2153 138.3935 (F)PARAMETROS: Basados en el riesgoRazón de Riesgos (RR) 5.5741 1.9383 16.0296 (T)Diferencia de Riesgos (DR) 65.3439 46.9212 83.7666 (T)Intervalos deconfianza(T=Series Taylor;C=Cornfield;M=P-Media;F=Fisher)TEST ESTADÍSTICOS Chi cuadrado p de 1 cola p de 2 colasChi cuadrado: sin corregir 27.2225 0.0000013505Chi cuadrado: Mantel-Haenszel 26.8596 0.0000013880Chi cuadrado: Corrección de Yates 24.5370 0.0000018982P-media exacta 0.0000001349Test exacto de Fisher 0.0000002597Pruebas designificanciaestadística9


Figura 8-2 : Salida típica de Epi-Info del modulo de análisis utilizando el commando“tables”. (Fuente: Oswego, Epi-Info V. 3.0 Dean AG, et al.LA TABLA DOS – POR – DOS“Cada estudio epidemiológico puede resumirse en una tabla de dos por dos. (H. Ory)En muchos estudios epidemiológicos, la exposición y el evento de salud en estudio puedencaracterizarse como variables binarias, por ejemplo "si" o "ningún". La relación entre la exposicióny enfermedades luego puede ser tabulada en forma cruzada en un cuadro dos por dos, llamado asípor qué tanto la exposición, como la enfermedad tienen dos categorías ( tabla 8-2).Tabla 8-2: Salida y anotación de datos en una tabla típica de 2 por 2.ExposiciónSINOENFERMEDADSI NO Total Tasa deataqueA B H1 A/H1C D H0 C/H0Total V1 V2 TConvencionalmente se coloca la condición de enfermedad (por ejemplo, enfermo vs. sano) en laparte superior de la tabla y el estado de exposición al lado de la tabla (EPI-INFO, también sigueesta convención aunque en los libros de texto epidemiológicos no lo hacen). La intersección de unafila y una columna en la cual se registra un valor, se conoce como una celda. Las letras a, b, c y ddentro de las cuatro celdas de la tabla dos por dos se refieren al número de personas con lacondición de enfermedad indicado en la columna que encabeza la tabla y el estado de exposiciónindicado al lado izquierdo de la misma. Por ejemplo, c es el número de sujetos no expuestosenfermos o sea los casos en el estudio. Los totales horizontales de la fila se denominan H. 1 y H. 0(o H. 2), y los totales de las columnas verticales se rotulan v1 y v0 (o v2). El número total desujetos incluidos en el cuadro dos por dos se escribe en la esquina inferior derecha y esrepresentado por las letra t o n. Las tasas de ataque (la proporción de un grupo de personas quedesarrollan la enfermedad durante un intervalo específico) generalmente se anotan a la derecha delos totales de la fila.Los datos de una investigación de brote ocurrido en Carolina del Sur se presentan en la tabla 8-3.El cuadro muestra una tabulación cruzada del consumo de pavo (exposición con respecto a lapresencia o ausencia de gastroenteritis por salmonela (resultado). Las tasas de ataque (56% paralos que comieron el pavo y 12% para los que no comieron) se ubican a la derecha del cuadro.10


Tabla 8-3:Consumo de Pavo y Enfermedad gastrointestinal. Brote de Salmonella. Carolinadel Sur, 1990.Comió PavoSINOEnfermóSI NO Total Tasa deataque115 89 204 56%5 36 41 12%Total 120 125 245 49%RIESGO RELATIVO (115/204) / (5/41) = 56/12 = 4.6MEDIDAS DE ASOCIACIÓN.Una medida de asociación cuantifica la fuerza o magnitud de la asociación estadística entre laexposición y el problema de salud de interés. Las medidas de asociación son a vecesdenominadas medidas de efecto porque, si la exposición está relacionada "causalmente" con laenfermedad cuantifican el efecto de tener la exposición con respecto a la incidencia de laenfermedad. En los estudios de cohortes, la medida de asociación más comúnmente usada es elriesgo relativo. En estudios de caso-control, es el Odds Ratio (OR) o razón de probabilidades es lamedida de asociación comúnmente usada. En los estudios transversales, se puede calcular larazón de prevalencia o una razón de probabilidades de prevalencia.Riesgo relativo (razón de riesgos)El riesgo relativo es el riesgo del grupo expuesto dividido entre el riesgo del grupo no expuesto.Riesgo relativo (RR) = riesgo de los expuestos/riesgo de los no expuestos = (a/h1)/(c/h0)El riesgo relativo refleja el riesgo excesivo que muestra el grupo expuesto comparado con el riesgodel grupo no expuesto (basal, esperado) el exceso se expresa como una razón. En una situaciónde brote agudo, el riesgo se representa mediante la tasa de ataque. Los datos que se muestran enla tabla 8-3 indican que el riesgo relativo de la enfermedad, dado el consumo de pavo fue 0. 564/0.122 = 4. 6. O sea que las personas que comieron pavo tuvieron 4.6 veces más probabilidad deenfermar que las que no comieron pavo. Observé que el riesgo relativo será mayor que 1.0 cuandoel riesgo del grupo expuesto es mayor que el riesgo del grupo no expuesto. El riesgo relativo serámenor que 1.0 cuando el riesgo del grupo expuesto es menor que el riesgo del grupo no expuesto,como es generalmente el caso si la exposición en estudio es la vacunación.Razón de probabilidades (razón de productos cruzados, razón de momios).En la mayoría de los estudios de casos y controles, debido a que usted no sabe el tamaño de lapoblación del grupo expuesto y no expuesto, no tiene un denominador para calcular la tasa deataque o el riesgo. Sin embargo, usando los datos de casos y controles, el riesgo relativo puedeser aproximado por una razón de probabilidades. La razón de probabilidades se calcula así:11


La razón de probabilidades u Odds Ratio (OR) = ad/bcEn un brote de infección de herida quirúrgica por Estreptococo del Grupo A (GAS) en un hospitalde la comunidad ocurrieron 10 casos durante un período de 17 meses. Los investigadores usaronuna tabla de números aleatorios para seleccionar los controles de los 2600 procedimientosquirúrgicos que se realizaron durante el período epidémico. Ya que muchos conglomerados deinfecciones de heridas quirúrgicas por GAS pueden detectarse al identificar portadores de GASentre el personal de Salas de operaciones, los investigadores estudiaron a todo el personalhospitalario asociado con cada paciente. Ellos elaboraron una tabla dos por dos para la exposicióna cada funcionario y calcular las razones de posibilidades. La tabla dos por dos para la exposicióna la enfermera A se muestra en el cuadro 8-4. La razón de probabilidades fue 8 x 49/2 x 5 = 39.2En sentido estricto esto significa que las probabilidades de estar expuesto a la enfermera A fue 39veces mayor entre los casos que entre los controles. Es también razonable decir que laprobabilidad de desarrollar una infección de la herida quirúrgica de GAS fue 39 veces mayor entrelos pacientes expuestos a la enfermera A que entre los no expuestos..Para enfermedades raras (menos de cinco%) la razón de probabilidades se aproxima al riesgorelativo. En este ejemplo con sólo 10 casos de 2600 procedimientos, la razón de probabilidadespodría ser interpretada de la siguiente manera: el riesgo de contraer una infección de la heridaquirúrgica por GAS fue 39 veces mayor entre aquellos expuestos a la enfermera A que entreaquellos no expuestos..El OR es una medida de asociación muy útil por varias razones. Como se mencionó anteriormentecuando la enfermedad es rara, un estudio de casos y controles puede producir una razón deprobabilidades que estrechamente se aproxima al riesgo relativo de un estudio de cohortes. Desdeuna perspectiva estadística teórica (más allá del alcance de éste capítulo), la razón deprobabilidades también tiene unas propiedades estadísticas aconsejables y es fácilmente derivadade técnicas de modelos multivariados.Tabla 8-4:Infección de herida quirúrgica y exposición a la Enfermera A. Hospital M, Michigan1980.Exposición aEnfermera ASINOENFERMEDADCaso (Si) Control (No)8 5 132 49 51Total 10 54 64Momios: 8/2=4 5/49=0.1Razón de Momios: (4)/(0.1) = 4012


Razón de prevalencia y razón de probabilidades de prevalencia.Los estudios transversales o encuestas miden la prevalencia (casos existentes) de una condiciónde salud en una población, en lugar de la incidencia (nuevos casos). La prevalencia a depende deambos: incidencia (riesgo) y la duración de la enfermedad, de manera que las medidas deasociación basadas en los casos prevalentes reflejan ambos: el efecto de la exposición sobre laincidencia como su efecto sobre la duración o la supervivencia.Las medidas de prevalencia de asociación análogas al riesgo relativo y la razón de probabilidades(Odds Ratio) son: la razón de prevalencia y la razón de probabilidades de prevalencia (“prevalenceodds ratio”) respectivamente.Tabla 8-5:Datos de un estudio transversal hipotético de prevalencia.ExposiciónSINOTiene condiciónSI NO Total Prevalencia20 80 100 20%20 380 400 5%Total 40 460 500 8%Razón de Prevalencia: (20%) / (5%) = 4.0En el cuadro dos por dos que se muestra en la tabla 8-5, la razón de prevalencia es = 0. 20/0. 05 =4.0. O sea, los sujetos expuestos tienen cuatro veces la probabilidad de tener la condicióncomparados con los no expuestos. En el ejemplo anterior, la razón de probabilidades deprevalencia = (20) x (380)/(80)x(20) = 4.75. La probabilidad de tener la enfermedad es 4. 75 vecesmayor para el grupo expuesto que para el grupo no expuesto. Es importante observar que cuandola prevalencia es baja, los valores de la razón de prevalencia y la razón de probabilidades deprevalencia serán similares.Medidas de impacto en la salud públicaUna medida de impacto en la salud pública coloca la asociación de la exposición enfermedaddesde una perspectiva de salud pública. Refleja la contribución aparente de una exposición sobrela frecuencia de la enfermedad en una población particular, por ejemplo, para una exposiciónasociada como un mayor riesgo de la enfermedad (por ejemplo, tabaquismo y cáncer de pulmón)la proporción de riesgo atribuible representa la reducción esperada en la carga de la enfermedad sila exposición se elimina (o nunca existió).El riesgo atribuible poblacional representa la proporción de enfermedad en una población que esatribuible a una exposición. Para una exposición asociada con una reducción del riesgo de laenfermedad (por ejemplo, vacunación) una fracción prevenible podría ser calculada al representarla reducción real de la carga de la enfermedad atribuible al nivel actual de exposición en lapoblación.Proporción de riesgo atribuible (proporción de fracción atribuible) entreexpuestos, fracción etiológicaLa proporción de riesgo atribuible es el porcentaje de los casos en el grupo expuesto queprobablemente es atribuible a la exposición. Esta medida supone que el nivel de riesgo en el grupo13


no expuesto (se asume que es el punto de comparación o grupo con riesgo basal de laenfermedad) también aplica al grupo expuesto, así que sólo el riesgo en exceso debe atribuirse ala exposición. El porcentaje de riesgo atribuible puede ser calculado con cualquiera de lassiguientes fórmulas (que son algebraicamente equivalentes):Porcentaje de riesgo atribuible = (Riesgo expuestos – riesgo no expuestos) / Riesgo expuestos= (RR-1) / RREl porcentaje de riesgo atribuible se puede representar como una fracción puede ser multiplicadopor 100 y reportarse como una proporción. Utilizando los datos de consumo de Pavo de la tabla 8-3 la proporción de riesgo atribuible es (0.564 – 0.122) / 0.564 = 78.4%. Por consiguiente más detres cuartos de la gastroenteritis que se presentó entre las personas que comieron pavo, se puedeatribuir al consumo de pavo el otro 21.6% es atribuido a la ocurrencia basal de gastroenteritis en lapoblación.En un estudio de casos y controles, si se considera que la razón de probabilidades es unaaproximación razonable al riesgo relativo, usted puede calcular la proporción de riesgo atribuible dela siguiente manera:Porcentaje de riesgo atribuible es = (OR – 1) / ORProporción de riesgo atribuible a la población (fracción atribuible a lapoblación)La proporción de riesgo atribuible poblacional es la proporción de casos en toda la población(ambos grupos: expuestos y no expuestos) probablemente atribuible a la exposición. Fórmulasalgebraicamente equivalentes son:Porcentaje de riesgo atribuible a la población: (PRAP)PRAP = (Riesgo total – riesgo no expuestos) / Riesgo total= P(RR - 1) / [P(RR – 1) + 1]Donde P = proporción de la población expuesta = h1/tAplicando de la primera fórmula a los datos de consumo de pavo, la proporción de riesgo atribuiblepoblacional es (0. 490- 0. 122) /0. 490 = 75.1% . En situaciones en las cuales la mayoría de loscasos están expuestos, la proporción de riesgo atribuible y la proporción de riesgo atribuiblepoblacional serán similares. Para enfermedades con causas múltiples (por ejemplo, muchasenfermedades crónicas) y exposiciones poco comunes, la proporción de riesgo atribuiblepoblacional puede ser considerablemente menor que el porcentaje de riesgo atribuible.La proporción de riesgo atribuible poblacional puede estimarse en estudios de casos y controles debase poblacional al aproximar el riesgo relativo (RR) utilizando la proporción de los controlesexpuestos para aproximar P, por ejemplo, P=b/v0 (suponiendo que los controles sonrepresentativos de toda la población).Fracción prevenible en el grupo expuesto (eficacia vacunal)Si el riesgo relativo es menor de 1.0, usted puede calcular la fracción prevenible, que es laproporción potencial de nuevos casos que habrían ocurrido en ausencia de la exposición. En otraspalabras, la fracción prevenible es la proporción de los casos potencialmente prevenidos mediante14


alguna exposición beneficiosa, por ejemplo: la vacunación. La fracción prevenible en el grupoexpuesto se calcula así:Fracción prevenible entre los expuestos = (Riesgo no expuestos – riesgo expuestos)/Riesgo no exp= 1 – RRLa tabla 8-6 presenta los datos de un brote de sarampión ocurrido en 1970 a lo largo de la fronterade Texas-Arkansas. Dado que algunos casos habían ocurrido entre los niños vacunados contra elsarampión, la población cuestionaba la eficacia de la vacuna anti- sarampionosa. Según semuestra en la tabla 8-6 el riesgo de sarampión entre los niños vacunados fue cerca del 4% delriesgo de los niños no vacunados. La eficacia de la vacuna que se calculó fue 96% indicando quela vacunación previno un 96% de los casos de sarampión, los cuales hubieran ocurrido en losniños vacunados si no se les hubiera aplicado la vacuna.Observe que los términos "atribuible" y "prevenible" refleja mucho más que la simple asociaciónestadística. Implican una relación de causa y efecto entre la exposición y la enfermedad. Porconsiguiente, estas medidas no deben presentarse rutinariamente, hasta que se haya pensadoconcienzudamente la relación causal.Tabla 8-6:Estado vacunal y ocurrencia de sarampión.Texacarna, 1970.VACUNADOSINOSARAMPIONSI NO Total Tasa por Mil27 6,323 6,350 4.2512 4,323 4,835 106Riesgo Relativo = 4.2 / 106 = 0.04Total 539 10,646 11,185 48Fracción prevenible: (106 – 4.2) / 106 = 0.96 = 96%15


Pruebas de significancia estadísticaLas pruebas de significancia estadística se usan para determinar que probable es que losresultados observados podrían haber ocurrido sólo por el azar, si la exposición no estaba enrealidad relacionada con la enfermedad. En los párrafos siguientes, describimos las característicasclaves de las pruebas más comúnmente utilizadas con tablas 2 por 2. Para la discusión de lateoría, derivaciones, y otros temas más allá del alcance de este libro, sugerimos consultar algunosde los muchos textos de bioestadística que cubren estos tópicos.Las pruebas estadísticas asumen que la población en estudio es una muestra de alguna gran"población de referencia". Luego supone que, en la población de referencia, la incidencia de laenfermedad es la misma para los grupos expuestos y no expuestos. En otras palabras, suponeque, en la población general, la exposición no está relacionada con la enfermedad. Esta suposiciónse conoce como la hipótesis nula. (La hipótesis alternativa, que puede ser adoptada si la hipótesisnula prueba no ser plausible, es que la exposición se asocia con la enfermedad). Luego, calculeuna medida de asociación como el riesgo relativo o la razón de probabilidades. Seguidamente,calcule la prueba de significancia estadística como una Ji cuadrada esta prueba le indica laprobabilidad de encontrar una asociación tan fuerte como (o más fuerte que) la que usted hubieraobservado si la hipótesis nula fuera realmente verdadera. Esta probabilidad se llama el valor de p.Un valor-p muy pequeño significa que usted tendría muy poca probabilidad de observar talasociación si la hipótesis nula fuera verdadera, es decir que, dados los datos que usted tiene, lahipótesis nula no es plausible.Si este valor de p es más pequeño que un límite predeterminado (generalmente 0. 05 o 5%)usted puede descartar (rechazar) la hipótesis nula a favor de la hipótesis alternativa.Al llegar a una decisión acerca de la hipótesis nula, esté alerta contra dos tipos de error. En unerror tipo 1 (también denominado error alfa), la hipótesis nula se rechaza cuando es, en realidadverdadera. En un error tipo 2 (denominado error beta), la hipótesis nula no se rechaza cuando esen realidad falsa.Tanto la hipótesis nula al igual que la hipótesis alternativa, debe especificarse con antelación.Cuando se sabe poco acerca de la asociación que se está probando, usted debe especificarcomo hipótesis nula que la exposición no está relacionada con la enfermedad, (por ejemploRR = 1 u OR = 1) . La hipótesis alternativa correspondiente establece que la exposición y laenfermedad están asociados (RR ≠ 1 u OR ≠ 1). Note que esta hipótesis alternativa incluye lasposibilidades de que la exposición, podría, ya sea incrementar o disminuir el riesgo de laenfermedad.Cuando usted conoce más acerca de la asociación entre una exposición dada y la enfermedad, sepodría especificar una hipótesis más precisa (direccional). Por ejemplo, si es bien conocido queuna exposición aumenta el riesgo de desarrollar un problema de salud particular (ejemplo: fumadoy cáncer de pulmón), usted puede especificar la hipótesis nula de que la exposición noaumenta el riesgo de esa condición (ej: RR 1 o OR>l). De forma similar, si usted ha estadoestudiando una relación de protección bien establecida [sarampión, paperas, rubéola, vacuna(MMR) y sarampión]. Usted podría especificar la hipótesis nula de que RR > 1 y la hipótesisalternativa de que RR < 1.Una hipótesis no-direccional es sometida a prueba a través de una prueba de "2-colas". Unahipótesis direccional requerirá la prueba de una cola. En general, el corte para la prueba deuna cola es dos veces el corte para la prueba de dos colas (es decir, 0.10 en lugar de 0.05).Dado que la elevación del punto de corte para rechazar la hipótesis nula incrementa laprobabilidad de hacer un Error Tipo I, los epidemiólogos en esta situación (de campo)generalmente usan la prueba de 2 colas.16


Dos pruebas diferentes, cada una con variaciones, son utilizadas para hacer pruebas de datos enuna tabla dos por dos. Estos dos tests o pruebas, descritas más adelante son, la prueba exacta deFisher y el Chi cuadrado. Estas pruebas no son específicas para medidas de asociación. El mismotest puede ser usado independientemente si Ud. está interesado en Riesgo relativo, Odds ratio oRiesgo atribuible.Prueba exacta de FisherLa prueba exacta de Fisher se considera el "patrón de oro" para un cuadro 2 por 2 y es la pruebade elección cuando los números de una tabla de 2 por 2 son pequeños. Se asume que la hipótesisnula es verdadera en la población de referencia y que los valores de las cuatro celdas, pero no lostotales de las filas y columnas de las tablas 2 por 2, podrían cambiar. La prueba exacta de Fisherincluye el cálculo de la probabilidad de observar una asociación en una muestra igual a o mayorque la muestra observada. La técnica para la derivación de esta probabilidad se esboza en elapéndice 1.Como regla general la prueba exacta de Fisher es la prueba preferida cuando el valor esperadoen cualquier celda de la tabla dos por 2 es menor a cinco. El valor esperado se calculamultiplicando los totales de las filas por los totales de las columnas y dividiendo por los totales de latabla. Sin embargo, calcular la prueba exacta de Fisher, es tedioso con números pequeños, por loque se convierte en prácticamente imposible cuando los números son grandes. Afortunadamente,con números grandes, la prueba de Chi cuadrado proporciona una aproximación razonable a laprueba exacta de Fisher.Prueba del Chi cuadradoCuando usted tiene al menos 30 sujetos y el valor esperado en cada celda de la tabla 2 por 2 esal menos cinco, la prueba de chi cuadrado proporciona una aproximación razonable a la pruebaexacta de Fisher. Colocando los números apropiados en la fórmula de chi cuadrado, usted obtieneun valor para las chi cuadrada. Luego busqué su correspondiente valor-P. para 2 colas en unatabla de chi cuadrado (ver apéndice 2). Una tabla de 2 por 2 tiene un grado de libertad y una chicuadrada mayor a 3. 84 corresponde a una P. de dos colas menor de 0. 05.Al menos tres fórmulas diferentes de la si cuadrada para tablas de 2 por 2 se utilizan comúnmente.El programa EPI INFO presenta las tres.Para un conjunto dado de datos en una tabla de 2 por 2, la fórmula de chi cuadrado de Pearsonobtiene el valor de chi cuadrado más grande y en consecuencia el valor-P más pequeño. Estevalor-P es con frecuencia un poco más pequeño que el valor-P. del "patrón de oro" calculado por elmétodo exacto de Fisher. Así la chi cuadrada de Pearson puede conducir con más frecuencia aerrores de tipo 1 (confluye que hay una asociación cuando no la hay). La chi cuadrada de yatescorregida obtiene el valor-p más grande de las tres fórmulas, a veces aún más grande que elcorrespondiente al valor-p de la prueba de Fisher. La corrección de yates es la preferida por losepidemiólogos que desean reducir al mínimo la probabilidad de cometer un error de tipo 1, peroaumenta la probabilidad de un error de tipo 2. La fórmula de Mantel-Haenszel popular en el análisisestratificado, produce un valor-P. un poco más grande que el de la chi cuadrada de Pearson, peroa menudo más pequeño que el valor-P. de la chi cuadrada de yates corregido y el valor-P. deFisher.17


Muchos epidemiólogos de campo prefieren la fórmula corregida de yates dado qué es menosprobable cometer un error de tipo 1 (pero tiene mayor probabilidad de hacer un error de tipo 2). Losepidemiólogos que realizan con frecuencia análisis estratificados están habituados a utilizar lafórmula de Mantel-Haenszel por lo cual tienden a usarla más, aún para análisis simples de tablas 2por 2.Medidas de asociación vs. pruebas de significanciaLas medidas de asociación, como el riesgo relativo y la razón de probabilidades, reflejan la fuerzade la asociación entre una exposición y una enfermedad. Estas medidas son generalmenteindependientes del tamaño del estudio y puede pensarse que son la "mejor suposición" del gradode asociación en la población-fuente. Sin embargo, la medida no da ninguna indicación de sufiabilidad, es decir cuánta fe hay que poner en ella.Por contraste, una prueba de significancia proporciona una indicación de cuan probable laasociación observada es debida al azar. Aunque la estadística de la prueba de chi cuadrada estáinfluenciada tanto por la magnitud de la asociación y el tamaño de la muestra, no distingue lacontribución de cada uno. Por lo tanto las medidas de asociación y los prueba de significancia(intervalo de confianza, ver abajo) proporcionan información complementaria.18


Interpretación de los resultados de la prueba estadística"No significativo" no necesariamente significa "ninguna asociación". La medida de asociación(riesgo relativo, razón de probabilidades) indican la dirección y la fuerza de la asociación. Laprueba estadística indica cuan probable la asociación observada puede haber ocurrido por azar. Lano significancia puede no reflejar una asociación en la población de referencia, pero también puedereflejar un tamaño de muestra demasiado pequeño para detectar una determinada asociación en lapoblación de referencia.La significancia estadística por sí sola no indica una relación de causa-efecto. Una asociaciónpuede representar una verdadera relación causal, pero también puede ser debido al azar, sesgosde selección, sesgos de información, confusión y otras fuentes de error en el diseño, la ejecución yel análisis del estudio. Las pruebas estadística se relaciona sólo con el rol del azar comoexplicación de una asociación observada, y la significancia estadística indica sólo que es pocoprobable que el azar (aunque no imposible) sea la explicación de la asociación. Usted debedepender de su criterio epidemiológico al considerar estos factores, así como la consistencia de losresultados con los obtenidos en otros estudios, la relación temporal entre la exposición y laenfermedad, la plausibilidad biológica y otros criterios de inferencia causal. Estos temas se tratacon mayor profundidad en la última sección de este capítulo.Finalmente la significación estadística no necesariamente implica significancia para la saludpública. Un estudio grande como una asociación débil y poca relevancia en salud pública (o clínica)puede sin embargo tener "significancia estadística". Más comúnmente, las relaciones relevantespara la salud pública y/o importancia clínica no logran demostrar "significancia estadística" porquelos estudios son demasiado pequeños.Intervalos de confianza para medidas de asociaciónAcabamos de describir el uso de una prueba estadística para determinar cuan probable ladiferencia entre la asociación observada y el estado de nulidad es compatible con variaciones alazar. Otro índice de la variabilidad estadística de la asociación es el intervalo de confianza. Losestadísticos definen un intervalo de confianza como el intervalo que, dado el muestreo repetido dela población de referencia incluirá o "abarca" los valores verdaderos el 95% del tiempo. El intervalode confianza de un único estudio puede interpretarse como el rango de valores que, dados unosdatos y en ausencia de sesgo, tiene 95% de probabilidad de incluir el valor "verdadero". Entérminos generales, el intervalo de confianza puede interpretarse como el rango en el cual sepuede encontrar el "verdadero" valor de una asociación, o el rango de valores que son compatiblescon los datos del estudio.La prueba del chi cuadrado y el intervalo de confianza están relacionados estrechamente. El chicuadrado utilizan los datos observados para determinar la probabilidad (valor-P.) de la hipótesisnula. Usted rechaza la hipótesis nula si esa probabilidad es menor a un valor preseleccionado,denominado Alfa, como puede ser el 5%. El intervalo de confianza usa un valor probabilísticopreseleccionado, el Alfa, para determinar los límites del intervalo. Usted puede rechazar lahipótesis nula si el intervalo no incluye el valor de la asociación nula. Ambos indican la precisión dela asociación observada. Ambos están influidos por la magnitud de la asociación y el tamaño delgrupo de estudio. Mientras que ambas miden la precisión de los datos, ninguna de ellas aborda lavalidez (ausencia de sesgo).Usted debe seleccionar un nivel probable místico (Alfa) para determinar los valores límites delintervalo de confianza. Del mismo modo que la prueba del chi cuadrado, los epidemiólogos eligentradicionalmente un nivel Alfa de 0. 05 o 0.01. La "confianza" es por lo tanto 100 x (I - alfa)% (e.g.,95% o 99%).19


A diferencia del cálculo de una chi cuadrada, el cálculo de un intervalo de confianza depende de lamedida particular de asociación, o sea, cada medida de asociaciones tiene su propio fórmula paracalcular los intervalos de confianza. En realidad, cada medida tiene varias fórmulas, por ejemplo,existen intervalos de confianza "exactos" y una variedad de aproximaciones.Interpretación del intervalo de confianzaComo señaláramos anteriormente, un intervalo de confianza a veces se considera como lavariedad de valores compatibles con los datos de un estudio. Suponga que usted realizó un estudioen su área en la cual el riesgo relativo para fumar y las enfermedades X. fue 4.0 y el intervalo deconfianza de 95% fue de 3.0 a 5. 3 su mejor suposición de la asociación en la población dereferencia es 4.0 pero los datos son compatibles con valores que se ubican entre 3.0 y 5. 3.Observe que sus datos no son compatibles con un riesgo relativo de 1.0 es decir sus datos no soncompatibles con la hipótesis nula. Por lo anterior, tanto los valores que están incluidos en elintervalo de confianza como los valores que están fuera del intervalo proporcionan informaciónimportante.La amplitud de un intervalo de confianza, es decir, los valores incluidos reflejan la precisión con lacual el estudio puede especificar una asociación como un riesgo relativo. Un intervalo de confianzaamplio refleja una elevada variabilidad o imprecisión. Un intervalo de confianza estrecho reflejapoca variabilidad y alta precisión. Generalmente, cuanto más grande es el número de sujetos uobservaciones en un estudio, es mayor la precisión y es menor la amplitud del intervalo deconfianza.Se indicó anteriormente, la medida de asociación proporciona la "mejor suposición" de nuestrasestimaciones sobre la verdadera asociación. Si estuviéramos en un casino, esa "mejor suposición"sería el número que apostaríamos. El intervalo de confianza proporciona una medida de laconfianza que nosotros debemos tener en esa mejor suposición, es decir ¡nos dice cuánto apostar!Un gran intervalo de confianza indica falta de precisión en nuestra mejor suposición, de maneraque no debemos apostar demasiado en ese número. Un intervalo de confianza estrecho indica uncálculo más preciso, de manera que quizás deseemos apostar más en ese número.Dado que el intervalo de confianza refleja la variedad de valores compatibles con los datos en unestudio, uno puede usar el intervalo de confianza para determinar si los datos son compatibles conla hipótesis nula. Ya que la hipótesis nula especifica que el riesgo relativo (o razón deprobabilidades) equivale a 1.0. Un intervalo de confianza que incluye el número 1 es compatiblecon la hipótesis nula. Esto equivale a afirmar que no puede rechazarse la hipótesis nula. Por otrolado, un intervalo de confianza que no incluye al 1 indica que la hipótesis nula debe rechazarse, yaque es inconsistente con los resultados del estudio. Por lo tanto, el intervalo de confianza puedeusarse como una prueba de significancia estadística.Tablas resumen de la exposiciónSi la meta de la investigación del campo es identificar o más vehículos o factores de riesgo deenfermedades, puede ser útil resumir las exposiciones de interés en una única tabla como la tabla8-8.Para un brote transmitido por los alimentos, este tipo de tablas incluyen cada producto alimenticioservido, los números de enfermos y sanos según el antecedente de consumo de alimentos, lastasas de ataque específicas por alimento (si se hizo un estudio de cohortes), el riesgo relativo (uOdds ratio), chi cuadrada y/o valor-p y a veces, los intervalos de confianza.Para identificar a un culpable usted debe buscar un producto alimenticio con dos características:20


1. Un riesgo relativo elevado, razón de probabilidades o chi cuadrada (valor-p pequeño) quereflejen una diferencia en las tasas de ataque entre aquellos expuestos al elemento y aquellos noexpuestos y2. La mayoría de las personas enfermas han estado expuestas, por lo cual, la exposiciónpodría "explicar" la mayoría, si no la totalidad de casos.Tabla 8-8: tasas de ataque específicas de personas que comieron durante el almuerzo deldomingo. Brote de salmonella. Carolina del Sur, 1990.COMIDAPavoJamónAderezoCompotaPastaFrijolesElotePanMantequillaTeCaféFrambuesasNo.CASOS1156599857696807847102942COMIOTOTAL TA %204121186159139183153158882032874565453535552524953503257No.CASOS554213544234041731811178NO COMIOTOTAL TA % RR (95% CI)411225985106619284157422171711244364142384349464351464.61.21.51.31.31.41.21.01.21.20.61.2(2.0, 10.6)(0.9, 1.6)(1.0, 2.2)(1.0, 1.7)(1.0, 1.7)(1.0, 2.0)(0.9, 1.6)(0.8, 1.3)(0.9, 1.5)(0.8, 1.7)(0.4, 1.1)(1.0, 1.6)PVALOR


Tabla 8-9:Hepatitis A y consumo de leche y donasLECHE Casos Controles TotalEXPUESTOS 37 21 58 Odds ratio=3.9NO-EXP 13 29 42Yates-corregidax 2 =9.24TOTAL 50 50 100 Valor p=0.0002La estratificación es una manera de separar el efecto de los dos alimentos. Primero, decidida quecomida es la exposición de interés y cuál será la variable de estratificación. Ya que las donastienen el OR más elevado, usted quizá elija donas como la exposición y leche como la variable deestratificación. Los resultados se muestran en la tabla 8-10. La razón de probabilidades para donases 6. 0 independientemente si se consumió o no la leche.Table 8-10. Hepatitis A y consume de Donas estratificado por LECHETomó LecheNo tomó lecheCasos Controles Casos Controles¿Comió Si 36 18 ¿Comió Si 4 2Donas? No 1 3 Donas? No 9 27Odds ratio=6.0Odds ratio=6.0DONAS Casos Controles TotalEXPUESTOS 40 20 60 Odds ratio=6.0NO-EXP 10 30 40Yates-corregidox 2 =15.04TOTAL 50 50 100 Valor-p=0.0001¿Ahora, que sucede si usted hubiera decidido identificar la asociación de leche-enfermedadestratificando por donas? Los resultados se muestran en la tabla 8-11Claramente, de la tabla 8-10, el consumo de donas sigue estando altamente asociado con laenfermedad, independientemente del consumo lácteo. Por otro lado, como se muestran en la tabla 8-11 el consumo de leche no está asociado con la enfermedad pues muestra OR de 1.0 si se estratificapor la variable donas y se comparan los que comieron y no comieron donas. La leche sólo parecíaasociarse con enfermedad porque los que tomaron leche también comieron donas.Table 8-11. Hepatitis A y Consumo de Leche, estratificado por Donas.Odds ratio=1.0Odds ratio=1.0Comió DonasNo comió DonasCasos Controles Casos Controles¿Tomó Si 36 18 ¿Tomó Si 1 3Leche? No 4 2 Leche? No 9 2722


Un método alternativo para analizar las dos exposiciones se presenta en la tabla 2 por 4 que semuestra a continuación. En ese cuadro, la exposición 1 se denomina “EXP 1” como la exposición 2es “EXP 2”. Para calcular la razón de riesgo de cada fila, se divide la tasa de ataque ("riesgo") deesa fila entre la tasa de ataque para el grupo no expuesto a cualquiera de las exposiciones (filainferior de tabla 8-12). Para calcular la razón de probabilidades de cada fila, utiliza los valores de lafila para a y b en la manera usual (ad.bc).Tabla 8-12: Arreglo de datos en una tabla de 2 x 4, análisis de dos exposiciones al mismotiempo.Exp 1 Exp 2 Enf Sano Total Riesgo RR ORSi Si a ss b ss h ss a ss /h ss R ss /R nn a ss d/b ss cNo Si a ns b ns h ns a ns /h ns R ns /R nn a ns d/b ns cSi No a sn b sn h sn a sn /h sn R sn /R nn a sn d/b sn cNo No c d h nn c/h nn 1.0 (Ref) 1.0 (Ref)En la tabla 8-12 es fácil ver el efecto del exposición 1 por sí sola (fila 3) por comparación con elgrupo no expuesto (fila 4), la exposición 2 por sí sola (fila 2) comparada con el grupo no expuesto(fila 4) y la exposición 1 y 2 juntas (fila 1) comparada con el grupo no expuesto (fila 4). Por lo tantoes posible evaluar los efectos separados y conjuntos.En la tabla 8-13 usted puede ver que el consumo de donas por sí solo tenía una razón deprobabilidades de 6. 0 mientras que la leche sólo tuvo una razón de probabilidades de 1.0 juntasdonas y leche tenía una razón de probabilidades de 6. 0 o sea lo mismo que las donas por sí solas.En otras palabras, las donas pero no la leche, se asociaron con la enfermedad. La tabla de 2 por 4resume los cuadros estratificados en uno y elimina la necesidad de designar uno de los alimentoscomo la exposición primaria y el otro como la variable de estratificación.Tabla 8-13: Hepatitis A y consumo de leche y donas en un arreglo de tabla de 2 x 4Exposición EnfermedadDonas Leche Caso Control Odds ratioSi Si 36 18 (36)(27)/(18)(9) = 6.0Si No 1 3 (1)(27)/(3)(9) = 1.0No Si 4 2 (4)(27)/(2)(9) = 6.0No No 9 27 1.0 (ref)ConfusiónLa estratificación también ayuda en la identificación y manejo de la confusión. La confusión es ladistorsión de una asociación de exposición y enfermedad ocasionada por el efecto de un tercerfactor (un confusor). El tercer factor puede ser confusor y distorsionar la asociación de exposiciónenfermedadsi está asociado con el efecto en forma independiente del exposición, es decir, aún en elgrupo no expuesto. En otras palabras, debe ser un factor de riesgo independiente, asociado con la23


exposición pero no una consecuencia de ello. Para separar el efecto de la exposición del efecto delfactor de confusión se estratifica por la variable confusora.Considere las tasas de mortalidad de Alaska vs. Arizona. En 1988, la tasa cruda de mortalidad enArizona fue 7.9 defunciones por 1000 habitantes, más de dos veces mayor que la tasa cruda demortalidad en Alaska (3.9 las defunciones por 1000 habitantes) ¿es Arizona más peligrosa para lasalud? La respuesta es no. De hecho, para la mayoría de los grupos de edad, la tasa de mortalidad enArizona es cercana o algo inferior a la tasa de mortalidad en Alaska. La población de Arizona esmás vieja que la población de Alaska y las tasas de mortalidad suben con la edad. La edad es unconfusor de la aparentemente elevada tasa de mortalidad de Arizona. Las tasas de mortalidadajustadas por edad para Arizona y Alaska son 7.5 por 1000 y 8.4 por 1000 respectivamente.Observé que la edad satisface los dos criterios descritos anteriormente: la mayor edad está asociadacon el aumento de la mortalidad, independientemente de donde las personas vivan y la edad seasocia con lugar de la residencia (en la población de Arizona es más vieja que las de Alaska).Retornemos a la secuencia según la cual se debe realizar un análisis. Después que usted ha evaluadolas relaciones básicas de exposición-enfermedad usando las tablas 2 por 2, debe estratificar losdatos por terceras variables, variables que son cofactores, potenciales confusores o modificadoresde efecto (serán descritas posteriormente en este capítulo). Si por medio de su simple análisis detablas 2 por 2 ha identificado dos o más factores de riesgo posibles, cada uno debe estratificarse porel otro. Además, usted debe desarrollar una lista de otras variables que deben ser evaluadas. La listadebe incluir los factores de riesgo conocidos de la enfermedad (uno de los dos criterios para unconfusor) y las variables de equiparamiento. Luego estratifique o separe los datos por categorías deterceras variables pertinentes. Para cada estrato compute una medida de asociación específica parael estrato. La edad es con frecuencia un confusor real, por lo que es razonable considerarlo unpotencial confusor en cualquier conjunto de datos. Utilizando la edad como ejemplo usted podríaseparar los datos por grupos de edad de diez años (estrato) crear una tabla de 2 por 2 separando laexposición y efecto para cada estrato y calcular una medida de asociación para cada estrato.El resultado de este tipo de análisis es que, al interior de cada estrato "similares se comparan consimilares". Si la variable de estratificación es sexo, en un estrato la relación de exposiciónenfermedadse evalúa en las mujeres y en el otro estrato se evalúa la misma relación para loshombres. El sexto ya no puede ser un confusor en éstos estratos, pues las mujeres se comparan conlas mujeres y los hombres se comparan con los hombres.Para buscar la confusión, primero mire los valores más pequeños y más grandes de las medidas deasociación específicas de los estratos y compárelas con el valor crudo. Si el valor crudo no estáincluido dentro del rango comprendido entre el valor más pequeño y el más grande específico de losestratos, la confusión probablemente está presente.Con frecuencia, la confusión no es tan obvia. Así que, el próximo paso es calcular un resumen de lamedida ajustada de asociación como un promedio ponderado de los valores específicos de losestratos. El método más común de controlar la confusión es estratificar los datos y luego calcular lasmedidas que representan los promedios ponderados de los datos específicos de los estratos. Unatécnica muy utilizada fue desarrollada por Mantel y Haenszel. Éste y otros métodos se describen enla referencia 5.Después de calcular el valor resumido, compare el valor resumido con el valor crudo para ver si sonapreciablemente diferentes. Lamentablemente no hay ninguna regla rígida o pruebas estadísticaspara definir lo que representa ser "apreciablemente diferentes". En la práctica, suponemos que elvalor ajustado resumido es más exacto. La pregunta que surge es: "el valor crudo se aproxima24


adecuadamente al valor ajustado o el valor crudo podría estar desorientando al lector? Si el valorcrudo y el ajustado son similares, usted puede usar el crudo porqué no lo está desorientando y esmás fácil de explicar. Si los dos valores son apreciablemente diferentes (10 por ciento?, 20%?) usael valor ajustado.Después de decidir si el valor crudo, el valor ajustado por las medidas de asociación específicas delos estratos son las más apropiadas, usted puede probar la hipótesis y calcular los intervalos deconfianza para las medidas seleccionadas.Modificación de efectoEl tercer uso de la estratificación es la evaluación de la modificación de efectos. Modificación deefecto significa, sencillamente, que el grado de asociación entre una exposición y un efecto difiereen los diferentes subgrupos de la población. Por ejemplo, una vacuna antisarampiónosa (exposición)puede ser sumamente eficaz (asociación fuerte) al prevenir la enfermedad (efecto) si se aplicadespués de 15 meses de edad del niño (variable de estratificación igual a la edad de la vacunación,el estrato de edad uno es igual o mayor de 15 meses) pero es menos eficaz (más débil la asociación)si se administra antes de los 15 meses (estrato de edad dos igual o menor de 15 meses). Otroejemplo, la tetraciclina (exposición) puede causar (asociación fuerte) moteado de los dientes (deefecto) en los niños (variable de estratificación igual la edad, el estrato de edad uno es igual a losniños) pero la tetraciclina no causa moteado del diente entre los adultos (estrato de edad dos iguallos adultos). En ambos ejemplos la sesión o efecto depende de si es modificado por una terceravariable. La modificación de efecto es clarificadora porque plantea preguntas o investigacionesadicionales. Por qué varía el efecto? De qué manera es un grupo diferente del otro? El estudio deestas y otras preguntas relacionadas pueden conducir a profundizar en el conocimiento de lafisiopatología, la historia natural de las enfermedades y las características genéticas o adquiridas delhuésped que influyen en el riesgo de las enfermedades.Básicamente, la evaluación de la modificación del efecto incluir el determinar si las medidas deasociación específicas de cada estrato son diferentes entre sí. La identificación de la modificaciónde efecto es realmente un proceso de dos partes que incorpora las siguientes preguntas:A) ¿es del rango de asociaciones lo suficientemente amplio para tener importancia en saludpública o tener relevancia científica? Un credo de la epidemiología del campo es que "unadiferencia para hacer una diferencia tiene que hacer una diferencia"B) ¿el rango de asociaciones tiende a representar la variación normal el muestreo? Laevaluación se puede ser en forma cualitativa (mirando los resultados) o cuantitativamente(haciendo análisis multivariados como la regresión logística o con pruebas estadísticas de laheterogeneidad)Es importante señalar otro diferencia: la confusión es sumamente común, porque esprecisamente un artefacto de los datos. La verdadera modificación de efecto, por otro lado,representa generalmente un fenómeno biológico y en consecuencia, es mucho menos común.Análisis adicionalesVale la pena mencionar dos áreas adicionales, aunque las discusiones técnicas están más alládel alcance de este libro. Estas dos áreas son la evaluación de las relaciones dosis-respuesta y elmodelaje.25


REFERENCIAS BIBLIOGRAFICAS1. Shem, S. (1978). The House of God. Richard Marek Publishers, New York.2. Dean A.G., Dean J.A., Coulombier D., et al. (1994). Epi Info, Version 6: A wordprocessing, database, and statistics program for epidemiology or microcomputers. Centersfor Disease Control and Prevention, Atlanta, Georgia.3. Luby, S.P., Jones, J.L., Horan, J.M. (1993). A large salmonellosis outbreak catered by afrequently penalized restaurant. Epidemiol and Infect 110, 31-39.4. Berkelman, R.L., Martin, D., Graham, D.R., et al. (1982). Streptococcal wound infectionscaused by a vaginal carrier. J American Med Assoc 247, 2680-82.5. Landrigan, P.J. (1972). Epidemic measles in a divided city. J American Med Assoc221,567-70.1. Kleinbaum, D.G., Kupper, L.L., Morgenstern, H. (1982). Epidemiologic Research:Principles and Quantitative Methods. Lifetime Learning Publications, Belmont, California.2. Schlesselman, J.J. (1982). Case-control studies: Design, conduct, analysis. OxfordUniversity Press, New York.3. Shands, K.N., Schmid, G.P., Dan, B.B., et al. (1980). Toxic-shock syndrome in menstruatingwomen: Association with tampon use and Staphylococcus aureus and clinicalfeatures in 52 cases. N Eng Med, 303, 1436-42.4. Dicker, R.C. (1986). Kawasaki syndrome. Washington Morbid Rep,(Oct);1-4.5. Robins, J . Greenland, S., Breslow. N.E. (1986) A general estimator for the variance of theMantel-Haenszel odds ratio. Am J Epidemiol, 124, 719 23.6. Comstock, G.W. (1990). Vaccine evaluation by case-control or prospective studies, Am JEpidemiol, 131, 205-7.7. Hill, A.B. (1965). The environment and disease: association or causation? Proc R Soc Med58, 295-300.26

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!