12.07.2015 Views

FRAUDE A LA DEMOCRACIA CASO VENEZUELA - Info Venezuela

FRAUDE A LA DEMOCRACIA CASO VENEZUELA - Info Venezuela

FRAUDE A LA DEMOCRACIA CASO VENEZUELA - Info Venezuela

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>FRAUDE</strong> A <strong>LA</strong> <strong>DEMOCRACIA</strong><strong>CASO</strong> VENEZUE<strong>LA</strong>(Investigación sobre el fraude cualitativo ejecutado en elproceso electoral relacionado con la revocatoria delmandato de Hugo Chávez Frías)Caracas, 15 de octubre de 2004Comité Técnico de SustanciaciónI


<strong>LA</strong> PERVERSIÓN DEL ARBITRAJE ELECTORAL Y ELVENTAJISMO OFICIALSostenemos que el Consejo Nacional Electoral ha sido secuestrado como institución yque, en el mismo, no existe representación equilibrada sino una imposición unilateralde mecanismos violatorios de los principios axiomáticos que configuran el Estado deDerecho Constitucional y los procesos electorales en un Estado Democrático. Estaafirmación se compadece con una realidad institucional en la que la “falta deindependencia del Poder Judicial, las limitaciones a la libertad de expresión, el estadodeliberativo en que se encuentran las Fuerzas Armadas, el grado extremo depolarización de la sociedad, el accionar de grupos de exterminio, la poca credibilidadde las instituciones de control debido a la incertidumbre sobre la constitucionalidadde su designación y la parcialidad de sus actuaciones, la falta de coordinación entrelas fuerzas de seguridad, representan una clara debilidad de los pilaresfundamentales para la existencia del Estado de Derecho en un sistema democráticoen los términos de la Convención Americana”; en los términos expuestos por laComisión Interamericana de Derechos Humanos, en su Comunicado de Prensa N°23/02 del 10 de mayo del 2002, emitido al término de la visita a nuestro país de CesarGaviria, en cumplimiento de la Resolución CP/RES.811 (1315/02).La ilegitimidad del Consejo Nacional Electoral y la consecuencial falta decredibilidad viene de mucho tiempo atrás. Previamente a los procesos electorales delaño 2000, los factores que apoyaban a Hugo Chávez Frías, procedieron a designardiscrecionalmente a los miembros del organismo rector con la anuencia de laSentencia del 30 de junio de 2000 emanada de una provisoria Sala Constitucional delTribunal Supremo de Justicia en la que se declara que la Comisión LegislativaNacional (suerte de parlamento nombrado unilateralmente por el partido dominanteen la Constituyente) “no tendría porqué ceñirse a las disposiciones de la Constituciónde la República Bolivariana de <strong>Venezuela</strong>”, dado que, en el caso respectivo, habíahecho la designación de los miembros del Consejo Nacional Electoral con carácterprovisorio”. Esta decisión se inscribe en el esquema general de marginación de la


sociedad civil de los procesos de selección de los titulares de los órganos de losPoderes Ciudadano y Judicial, sustituyéndola por la discrecionalidad de la únicavoluntad valida del proceso, y la violación de los criterios objetivos que laConstitución de 1999 establece como condición para ocupar dichos cargos.Los actuales rectores del CNE representan los intereses de Hugo Chávez Frías o de laSala Constitucional del Tribunal Supremo de Justicia; en este último caso, por serdesignados mediante Sentencia del 4 de agosto de 2003 y no mediante el proceso deselección que la Constitución define como competencia de la Asamblea Nacional.Objetivamente, la responsabilidad de las ejecutorias de ese Directorio se eleva a unaSala Constitucional que les habría “prohibido equivocarse”, en el momento de sujuramentación. Fueron ellos los que los nombraron y no los partidos políticos a travésde su representación en la Asamblea Nacional. Son ellos entonces los responsablesde la designación de un cuerpo electoral que se ha dado a la tarea de obstaculizar elejercicio de los derechos ciudadanos y violentar las normas constitucionales sobreparticipación política.Este Directorio es el que tiene la responsabilidad directa por la siguientes situaciones:El fraude, cohecho y manipulación del Registro Electoral.La contratación de un sistema de automatización violando las normas decontrol que establece la legislación.Que los programas del sistema automatizado no hayan sido actualizados deacuerdo con normas de seguridad que hubieran garantizado la pureza de losmismos, la operación por las personas exclusivamente autorizadas y laejecución de procedimientos de prueba apropiados.Que el diseño y operación de la mesa de votación no cumpliera con criteriosde optimización y que, en consecuencia, se sometiera al elector a los atentadosque, contra su dignidad, sufrió en la jornada electoral.Que no se diera un apropiado resguardo de los equipos a fin de evitar lamanipulación y alteración de las que fueron objeto.Que hayan fracasado las pruebas de auditoria.


Que no se haya respetado el proceso de retorno del material, resguardo de lasurnas electorales y las actas para garantizar su protección durante los noventa(90) días posteriores a la jornada electoral, tal como establece la ley.El secuestro de las instalaciones en que se realizaban las actividadesfundamentales del proceso electoral prohibiendo el ingreso de los factores deoposición y facilitando la intervención de factores del oficialismo.Que se haya utilizado un sistema de identificación de huellas con el objetivode identificar a los votantes, en tiempo real, controlando el flujo oficialismooposicióncon las bases de datos de ambos bloques.Que la comunicación de la información y su procesamiento no haya sidoconfiable y haya sido intervenida desde distintos centros habilitados al efecto.Que no existieran mecanismos de seguridad sobre el acceso a la red.No conformes con la ventaja que daba la sumisión absoluta del árbitro electoral,desde el aparato dirigido por Hugo Chávez Frías, se utilizan los recursos públicos ylas instituciones que debían estar al servicio de la Nación para determinar elcomportamiento de una población que se hace más dependiente de los programasdel Estado en virtud de sufrir los embates del desempleo y la marginalidad. Esteventajismo grosero esta combinado con agresiones violatorias de los derechoshumanos y el desconocimiento de las legítimas autoridades que detentan diversasinstancias del Poder local y estadal sometidas al embargo de los recursos que, envirtud del proceso de descentralización y la Constitución, les corresponden .No es por azar que las primeras consecuencias de la manipulación del resultado en elproceso revocatorio del mandato de Hugo Chávez Frías sea la utilización delMinisterio Público como instrumento de persecución de la oposición política y laactivación en el seno de la Asamblea Nacional, valiéndose de las irregularidadescontenidas en un Reglamento Interior y de Debates aprobado en contra del principiode la representación de las minorías, de los proyectos de leyes gubernamentalesorientados a limitar la libertad de expresión y “criminalizar” la disidencia política.


La oposición política venezolana merece el mismo tratamiento que el CNE dispensóa Hugo Chávez Frías cuando este, desde la ciudad de Buenos Aires, RepúblicaArgentina, afirmó que las firmas consignadas “son falsas” y agregó que durante elaño no se realizaría ninguna referendo en el país, a raíz de la consignación de lasfirmas de 3.236.320 de venezolanos para activar la solicitud de referéndumrevocatorio del mandato, el 20 de agosto de 2003. Lo que exigimos es la verificaciónde los hechos denunciados y el cumplimiento de la Ley.En aquella oportunidad, el CNE no solo escuchó el canto de fraude sino que obró enconformidad convocando para el 28 de noviembre de 2003 un proceso de recolecciónde firmas para el referendo revocatorio presidencial, esta vez bajo su control.Insatisfecho aun con la actitud del CNE, Hugo Chávez Frías declaró públicamente laconsumación de un mega fraude en su contra, sin haber concluido el acto electoral ysin esperar la actuación del Poder Electoral. Y no se produjo el evento comicial eseaño, tal como fue predicho, porque presentada la solicitud el 19 de diciembre de2003, el CNE difirió el proceso de verificación de las firmas que sirvieron de respaldoa dicha solicitud en contravención de las normas que ellos mismos habían aprobado.Pero quizás el acto más artero de ventajismo y violación de los derechosfundamentales de los ciudadanos haya sido la libre utilización de la base de datos delCNE que contiene el listado de aquellos que activaron el referendo revocatorio delmandato de Hugo Chávez Frías y los resultados de la revisión de las firmas,publicada en la página Web del organismo, utilizándolos como instrumento objetivopara determinar los lugares en los que, en forma selectiva, se ejecutaría lamanipulación del sistema automatizado. Ratificamos que, con el simple dato de lacédula de identidad, al margen de los estudios e investigaciones de tendencias yopinión pública, se pudo determinar el mapa político de la oposición por centro devotación. La aberración más espeluznante fue una acción que se sigue ejecutando yaque, al identificarse los promotores del referendo revocatorio, quedaron sujetos alproceso de manipulación y chantaje individual; y aquí destacan las presiones a


determinados sectores de la población como los funcionarios públicos y cualquierpersona que se relacione o contrate con el Estado y pretenda acceder a los serviciospúblicos.Estos actos bochornosos para cualquier sociedad democrática tienen como emblemauna página en la Web, apoyada y promovida por un diputado en la AsambleaNacional del partido MVR, conocida como la página de Luis Tascón, de la que sesirven los organismos públicos y otros sectores para limitar los derechos políticos delos venezolanos y ejecutar el proceso de chantaje al que hemos hecho referencia. Estasituación se produce sin que la Fiscalía General de la República, la Defensoría delPueblo o el Tribunal Supremo de Justicia tomen decisión alguna en virtud de lasacciones que se les han presentado o de la notoriedad en la comisión de delitostipificados en el Código Penal y la Ley Especial Contra los Delitos <strong>Info</strong>rmáticos. Eneste último texto, se establece el tipo penal de violación de la privacidad de la data oinformación de carácter personal, previsto en su artículo 20 en los siguientestérminos: “Toda persona que intencionalmente se apodere, utilice, modifique oelimine por cualquier medio, sin el consentimiento de su dueño, la data oinformación personales de otro o sobre las cuales tenga interés legítimo, que esténincorporadas en un computador y sistema que utilice tecnologías de información,será penada con prisión de dos a seis años y multa de doscientos a seiscientasunidades tributarias. La pena se incrementará de un tercio a la mitad si comoconsecuencia de los hechos anteriores resultare un perjuicio para el titular de la datao información para un tercero”.Similar actitud tiene la Fiscalía General de la República, o más específicamente IsaíasRodríguez, quien se dice fiscal, en la investigación que se le sigue a Hugo ChávezFrías por el Convenio Petrolero con Cuba y el financiamiento ilegítimo de sucampaña electoral por el Banco Bilbao Vizcaya Argentaria. Este último caso esparadigmático por cuanto se comprobaron dos pagos, los días 1° de diciembre de1998 y 5 de julio de 1999, de 525.000 y 1.000.000 de dólares, respectivamente, comocontribución a campañas electorales en las que el propio Fiscal General de la


República fue candidato a senador y a la Asamblea Constituyente en representacióndel M.V.R. y, previamente a su designación en el Ministerio Público, había sidodesignado como Vicepresidente de la República por el mismo individuo a quiendebe investigar. Desde el 26 de abril de 2002, fecha en la cual se presentó el primerescrito, hasta el presente, el único resultado obtenido es el de la obstrucción,denegación de la Justicia y el enfriamiento del expediente en la caja fuerte de suDespacho. Esta conducta contrasta con la velocidad e interés en enjuiciar a la SeñoraMaría Corina Machado y el acoso judicial a que es sometida convenientemente buenaparte de la oposición venezolana.La actuación del C.N.E. ha estado signada por la parcialidad inocultable de un 3 a 2,ahora 4 a 0 y seguramente mañana 5 a 0, mediante la cual se confiscan la voluntad delos ciudadanos, su libre iniciativa y el principio de personalización y reserva de losactos electorales. En lo particular e inmediato, mientras una representación degobernadores y alcaldes de la oposición acudía a la sede del organismo electoral yanunciaba jubilosa la disposición del organismo, por boca de su rector JorgeRodríguez, de cumplir con la Ley mediante la depuración del Registro Electoral, esemismo día, en ese mismo instante, se imprimían los cuadernos de votación con baseal Registro viciado y se definían nuevos centros de votación, por cierto coincidentescon los intereses del oficialismo de que fueran lugares en que funcionanhabitualmente organizaciones y misiones a ellos afectos.IIEL P<strong>LA</strong>N REPÚBLICA Y EL ROL DE <strong>LA</strong> FUERZA ARMADAEs fundamental remachar que el artículo 328 de la Constitución estableceexpresamente que “la Fuerza Armada Nacional constituye una instituciónesencialmente profesional, sin militancia política, organizada por el Estado paragarantizar la independencia y soberanía de la Nación y asegurar la integridad delespacio geográfico, mediante la defensa militar, la cooperación en el mantenimientodel orden interno y la participación activa en el desarrollo nacional, de acuerdo con


esta Constitución y las leyes. En el cumplimiento de sus funciones, está al servicioexclusivo de la Nación y en ningún caso al de persona o parcialidad política alguna”.Constituye un hecho de ventajismo evidente la violación de estos principios porparte de Hugo Chávez Frías, valiéndose de la obligación de los efectivos militares deguardar disciplina, obediencia y subordinación, para amedrentar a la oposición y alsector civil de la sociedad.Quizás uno de los más lamentables ejemplos de esta situación ha sido la declaraciónque, en fecha 20 de junio de 2003, dio el General de División (Ejército) Jorge LuisGarcía Carneiro, para aquel entonces Comandante General del Ejército y Ministro dela Defensa en la actualidad. En esa oportunidad, en inadmisible interferencia eintento de arbitraje militar sobre el desempeño de los derechos democráticos de losvenezolanos, manifestó públicamente que el referéndum revocatorio del mandatopresidencial no se llevaría a cabo; además, le restó valor a los compromisoscontenidos en el Acuerdo suscrito al respecto y bajo los auspicios de laORGANIZACIÓN DE ESTADOS AMÉRICANOS, O.E.A. y la ORGANIZACIÓNDE <strong>LA</strong>S NACIONES UNIDAS, O.N.U.No es por azar que Hugo Chávez Frías, aprovechando una alocución desde FuerteGuaicaipuro en ocasión del 90° aniversario del 314 Grupo de Artillería de CampañaAyacucho, invitó a la Fuerza Armada a defender los privilegios de poder alcanzadosdurante su régimen y desconocer cualquier referéndum que intente expulsarlo delGobierno, al tiempo que les intima, de ser necesario, al uso de las armas contra lapoblación y al rechazo de cualquier forma de actuación internacional en contrario, enparticular la de la ORGANIZACIÓN DE ESTADOS AMERICANOS, O.E.A.Adicionalmente, el 2 de septiembre de 2003, manifestó desde Cuba que si el ConsejoNacional Electoral validaba las firmas para llevar a cabo un referéndum revocatoriode su mandato, quedaría inhabilitado moralmente para realizar cualquier procesoelectoral.


Esta utilización de la FAN como instrumento de quehacer partidista adquiere visosde extrema gravedad en virtud de la intervención directa de los militares en elresguardo de todos los elementos en el proceso revocatorio. El Plan Repúblicasuponía un esfuerzo dirigido al control de los centros electorales, traslado delmaterial electoral y máquinas a los mismos y el diagnóstico de las situaciones deamenaza y riesgos de seguridad durante el proceso. Ante esa responsabilidad, laFuerza Armada Nacional debe responder las interrogantes que se hacen losciudadanos:¿Qué violaciones en la seguridad del sistema electrónico, informático y detelecomunicaciones fueron detectadas durante el día del ReferendoRevocatorio?¿Mantuvo presencia el Plan República en la Sala de Máquinas del CNE, en laSala Alterna localizada en la Torre Banesco, en la Universidad Bolivariana oen cualquier otro centro de transmisiones?¿El personal militar operó equipos del sistema del CNE o existió un centro deintercepción en alguna instalación militar?¿Qué interacción se produjo entre la red del Sistema de Comunicaciones de laDefensa Nacional y el Sistema de Comunicaciones y Transmisión deEmisiones Radioeléctricas, dependientes de órganos adscritos al Ministerio dela Defensa, y la red integrada del CNE?¿Cuál es el estado actual del material electoral que custodia la Fuerza Armada,en especial de las urnas electorales, tomando en consideración que no hatranscurrido el lapso de noventa (90) días, después de la jornada electoral, enque es obligatorio el resguardo de los elementos del proceso?¿Quién autorizó y dirigió a las fuerzas de reserva que intervinieron activa ymilitantemente durante todo el proceso electoral?Una elección es un acto cívico por excelencia, una jornada ciudadana que no puedeestar sujeta a la interferencia o intervención de uno de los factores que compiten en el


proceso. En ningún país del mundo una jornada de esta naturaleza esta sometida alcontrol exhaustivo del sector militar y mucho menos depende en todas sus etapas detal presencia. En aquellos países en los que existe un partido militar que ejerce elpoder y que interviene en la toma de decisiones políticas fundamentales no hayelecciones en sentido material sino simulacros que esconden o enmascaran larealidad autoritaria. El próximo proceso de elección de Alcaldes y Gobernadores estasignado por la masiva participación de candidatos que tienen como origen la carreramilitar. Este es un acontecimiento inédito en la historia democrática de nuestro paíspor lo que la participación de la Fuerza Armada en todas las etapas del proceso, talcomo fue desarrollada en el referendo revocatorio del mandato, debe ser objeto deuna profunda reflexión y revisión.IIIEL IMPACTO DEL <strong>FRAUDE</strong> EN EL REGISTRO ELECTORALEn el <strong>Info</strong>rme Preliminar destacamos el problema de la identificación y lamanipulación del Registro Electoral como elemento fundamental del fraudecualitativo que se efectúo con ocasión del Referendo Revocatorio del mandato deHugo Chávez Frías. Señalamos que los patrones numéricos de producción de cédulasde identidad por año estaban dentro del rango e incremento normales conforme a lacapacidad productiva de las oficinas de expedición de cédulas y del Laboratorio de laDirección, sin que se pudieran observar saltos numéricos apreciables entre un año yotro, hasta que se decide la realización de dicho referendo.A partir de dicho informe se han producido múltiples elementos probatorios quepermiten confirmar que el Plan de Cedulación de venezolanos y extranjeros, sincumplir los requerimientos técnicos de seguridad necesarios para este tipo dedocumentos, distorsionó en forma absoluta el Registro Electoral y que, para laspróximas Elecciones de Gobernadores y Alcaldes y Elecciones Parlamentarias, estasituación se ha agravado por la incorporación de miles de nuevos inscritos en


condiciones similares. Nos remitimos al <strong>Info</strong>rme Preliminar para ratificar que éstafue una acción planificada y que comprendió, entre otros elementos: a) la eliminaciónde la función fiscalizadora y contralora de la Fiscalía General de Cedulación; b) elnombramiento de un militante del oficialismo como Fiscal General de Cedulación; c)la disminución de las atribuciones de la Oficina Nacional de Supervisión del RegistroCivil e Identificación (ONSRCI); d) la activación de la Misión Identidad, en fecha 9 deAbril del 2.004; y e) la promulgación del Reglamento para la Regularización yNaturalización de los Extranjeros que se Encuentran en el Territorio Nacional,publicado en la Gaceta Oficial N° 37.871, de fecha 3 de Febrero del 2.004, mediante elcual se ejecutó un proceso masivo de otorgamiento de la nacionalidad venezolana aextranjeros en situación de ilegalidad otorgándoseles, en forma discrecional, lacondición de residentes y de votantes, una vez que se inscribieron en el RegistroElectoral Permanente.En lo que respecta a la inscripción en el Registro Electoral, en esos centros decedulación no se cumplieron las estrictas y tradicionales normas de control yprocesamiento de información, privilegiando la cantidad sobre la calidad. Es así queen un lapso de cuatro (4) meses el registro se incrementó en más de un millónochocientos mil (1.800.000) electores y se realizaron más de un millón cien mil(1.100.000) reubicaciones, con una bajísima calidad de transcripción de los datos. Estotrajo como consecuencia el desorden, la improvisación, el retraso y la corrección deerrores hasta un día antes de las elecciones. Pero también permitió al oficialismoinscribir un número determinante de electores inexistentes o de personas sin derechoal voto y dirigir a ese universo a centros preseleccionados. Con la misma intención,se manipuló la data de fallecidos y se excluyó a un importante grupo de venezolanoshábiles para votar, la mayoría de los cuales habían firmado para solicitar elReferendo Revocatorio del mandato de Hugo Chávez Frías. Constituye un hechocomprobado por la verificación de las migraciones que hemos detectado con el apoyode candidatos, alcaldes, gobernadores y organizaciones vecinales y de la sociedadcivil que un porcentaje muy elevado de estos nuevos inscritos se orientó


convenientemente a áreas rurales y urbanas no consolidadas, coincidentes concentros manuales.En los casos de municipios pequeños (rurales e intermedios), se han reportadoreubicaciones de electores que alcanzaron porcentajes significativos de la poblaciónelectoral del Municipio. Este mecanismo perseguía controlar el voto y procurar unresultado favorable al gobierno que justificara lo que se hizo con el sistemaautomatizado de votación, 1[1] en el referendo revocatorio; pero ahora, con miras a laselecciones regionales, el objeto es asegurar el triunfo en los municipios pequeños ymedios controlados por la oposición. De esta forma, el solo impacto en el fraude delRegistro Electoral y las migraciones producirá en una elección, en la que no secorrijan estas taras, una derrota electoral en ciento seis (106) alcaldías, las cuales sedistribuyen de la forma siguiente: a) A.D. cincuenta y cuatro (54) alcaldías; b) COPEIveintiún (21) alcaldías; c) MAS cinco (5) alcaldías; d) Otros partidos menores ypartidos regionales veintiséis (26) alcaldías. Se anexa en el informe técnico relaciónde alcaldías por Estados y mapas de impacto del fraude en el Registro.La manera en que se manipulan, en forma fraudulenta, los sistemas de identificacióny los registros provocan fenómenos de localidades, ciudades y municipios en los queexisten una desproporcionada relación de votante por habitantes; inclusive, el rectorJorge Rodríguez reconoció que existen veintinueve (29) parroquias del país con másvotantes que habitantes. En definitiva, además del daño institucional y delegitimidad democrática, el fraude distorsionó y vició las estadísticas y registros deéste país. Mal puede entonces, un demócrata, convalidar esta aberraciónparticipando en elecciones ilegales y viciadas por la violación del Artículo 119 de laLey Orgánica del Sufragio y Participación Política que establece expresamente que,“para cada elección, el Registro Electoral vigente será cerrado noventa (90) días antesde la fecha de la realización de las elecciones o referendo”.1[1] El resultado electoral automatizado sólo podía ser creíble en la medida que el de las mesasmanuales fuera similar, y esto sólo era posible si se materializaba una movilización importante haciaestos centros de manera de alterar la conducta esperada de los mismos.


IVEL FRA<strong>CASO</strong> DE <strong>LA</strong>S AUDITORIAS ALSISTEMA AUTOMATIZADOEl alcance inicial de cualquier trabajo de auditoria sobre un sistema automatizado decómputos electorales necesariamente debía estar dirigido a la identificación de losriesgos existentes en el mecanismo de votación adquirido por el CNE a la empresaSmartmatic; además, comprendía el desarrollo y ejecución de un plan de auditoriaposterior para determinar la adecuación de los controles establecidos para registrar yreportar la voluntad del elector. El sistema automatizado no es un fin en si mismocomo tampoco es característico de los sistemas políticos de los países con madurez ensus instituciones políticas. El alto costo y su enorme fragilidad, máxime en tiemposde grandes adelantos tecnológicos, han diferido su adopción en la mayoría de lasdemocracias que no están dispuestos a sacrificar la voluntad popular por dudosaseficiencias.Esta documentada la relación de hechos que se presentan a continuación. 2[2] El 14 dejunio de 2004 un grupo de profesionales especialistas en seguridad y control deprocesos automatizados realizó una presentación a los representantes de la CD, endonde se exhiben los riesgos en cada una de las etapas del proceso automatizado devotación a efectuarse el 15 de agosto. En esta presentación se manifestaron losinconvenientes de ir al proceso revocatorio con una tecnología no probada, ademásde describirse las diversas modalidades para afectar el proceso electoral o el conteode la voluntad del elector. Este será el grupo génesis de la Comisión de Auditoria deSistemas que diseñó y desarrolló un plan de trabajo y la carta de requerimientosdirigida a las autoridades del CNE.En el simulacro de las votaciones del 18 de julio en diferentes centros electorales de laregión capital, específicamente la que se realizó en el Liceo Andrés Bello, se tomaron2[2] Verificar informes y minutas en el anexo técnico que se constituye en parte integrante del presente informe.


mediciones y se detectó la demora en el sistema capta huella (1 minuto 30 segundospor elector, sin considerar la transmisión de datos) y del proceso de votación (15minutos por persona). Al cierre del simulacro, en un evento realizado en el HotelHilton, se pudo evidenciar que el sistema permitía al usuario mantener activa susesión de votación por mas de un minuto, ya que el contador de tiempo se reiniciabacada vez que usuario presionaba cualquiera de los botones de la pantalla diferentesal de “VOTAR”. La conclusión de los especialistas fue el sistema caza huellas eraincompatible e innecesario en el proceso electoral que se avecinaba y que tendría ungran impacto sobre los tiempos de votación.El 19 de Julio, el equipo técnico de la CD realizó una primera reunión con CésarAlvarado, persona designada por el rector Jorge Rodríguez para coordinar lasreuniones con el grupo Maisanta y colaborar en los esfuerzos de auditoria delsistema. El 22 de julio se produjo la primera reunión con un grupo de asesores delCNE, a la cual no asistió el grupo Maisanta, en la que se definió la necesidad deefectuar una auditoria integral, es decir pre-votación y post-votación, a lo que losasesores del CNE (Luis Merchan, Héctor Arciniaga, Rafael Pastoriza y Eliécer Correa)respondieron que no se iba a permitir una revisión a las máquinas de votación ni alsoftware, ya que no se disponía del tiempo suficiente. Indicaron que ellos habíancertificado el software, en cuanto a la evaluación del proceso y de las máquinas devotación, lo que les había llevado dos meses de trabajo.Es importante acotar que no es adecuado que integrantes de los equipos de trabajodel CNE; a su vez, hubieran preparado, ajustado y certificado el software. Ante talsituación, los resultados no podían ser confiables por lo que se debía auditar elsistema, una vez concluida su configuración. La respuesta al planteamiento de la CDfue que el CNE no contempla la auditoria pre-votación. A partir de ese momento seconformó un equipo de auditoria del CNE, incluyendo miembros de la CD y delcomando Maisanta, los cuales fueron debidamente acreditados.


El 29 de julio se produce una reunión en la que los representantes de la CD y elcomando Maisanta acuerdan que se seleccionaría un actuario por cada parte paraque definieran el tipo de muestra de centros de votación (estratificada / general) aser auditada, tamaño de la misma y la metodología de selección. En diversas ysucesivas reuniones se trató el punto de las transmisiones ya que, el inicio de lasmismas sin previamente imprimir el acta por máquina de votación, violaba la LeyOrgánica del Sufragio y Participación Política. Al explicarse los motivos técnicos deesa vulnerabilidad del sistema, son los miembros del Comando Maisanta los queproponen un procedimiento consistente en imprimir, transmitir e imprimirnuevamente. En reunión posterior, informan que habían recibido instrucción de quese transmitía primero y se imprimía después sin una justificación técnica de suposición.El 2 de agosto del 2004 se produce una reunión entre los rectores Jorge Rodríguez,Ezequiel Zamora y el grupo de Negociadores de la CD. El primero de ellos informaque se ha organizado un equipo de auditoria y que se efectuaría un simulacro el día 8de agosto al cual la CD estaba invitada como observación mas no participando en laplanificación ni ejecución de las pruebas. Hubo resistencia por parte del equipotécnico de auditoria a asistir a este simulacro bajo esas condiciones.El sábado 7 de agosto la CD y el comando Maisanta fueron invitados a presenciar elcambio de fecha de las máquinas de votación que se iban auditar al día siguiente. Yapara esa fecha se habían distribuido entre las regiones la mayoría de las máquinas devotación, razón por la cual se inquirió a las autoridades del CNE sobre el mecanismode selección aleatoria de las máquinas de votación para el simulacro. La respuestafue que la selección la hizo el Plan República; los soldados al azar, a medida queembarcaban, apartaban algunas, en lo que también colaboraron los empleados deAEROCAV.El domingo 8 de agosto 2004 se reunieron en las instalaciones de Filas de Mariche losrepresentantes del CNE, el comando Maisanta, observadores de la OEA, Centro


Carter y la CD para iniciar el ”simulacro” del proceso de votación. Durante elproceso de simulación, se indicó que nunca se había recibido evidencia alguna de losprocesos de certificación del software realizados por el equipo asesor del CNE, y delas firmas generadas (HASH) avaladas por dicho grupo. En este sentido el personalde Smartmatic indicó que en el transcurso del día se haría entrega de estainformación. Al final de la mañana se permitió que un integrante del equipo deauditoria de la CD asistiera a una presentación del esquema utilizado paradeterminar la integridad del software de la máquina. De esta presentación, seevidenció que el esquema utilizado presentaba fallas y que, en función de omitirestos errores en el reporte que debía ser emitido en las pruebas de integridad, sehabía omitido la evaluación de veinticinco (25) archivos cuyos HASH no coincidían.Durante las pruebas a las máquinas de votación no se permitió, por órdenes emitidasdirectamente al personal militar que custodió el área, que los integrantes de la CD,OEA, Centro Carter se acercaran a las máquinas, ya que solo estaban allí en calidadde observadores. Es importante aclarar que nunca fueron presentados los resultadosde esa auditoria.Existe un informe del equipo de auditoria, entregado a la CD a una semana delproceso, en el que se destacan las debilidades observadas en el sistema y losincumplimientos por parte del CNE; entre otros aspectos, se señala la imposibilidadde realizar alguna auditoria previa y que tan solo se podía contar con el control de la“auditoria en caliente”, planificada para del día de votación. Resalta en el mismo, laalerta sobre la parte del Reglamento del RR en la que se define la colocación de unaurna por mesa y no por máquina de votación, ya que esta situación contravenía laLey y afectaría el conteo en caso de pasar a un proceso de votación manual por lafalla de cualquiera de las máquinas. Se dificultaba así el proceso de “auditoria encaliente”, al exigir el conteo de todas las máquinas de votación que emitieron boletaspara esa urna, situación no prevista en el reglamento.


El viernes 13 agosto, el equipo técnico de la CD efectuó una reunión conSMARTMATIC, representada por el Ing. José Antonio Madriz, confirmándose unaserie de cambios al software original requeridos por el CNE. En la víspera de lajornada refrendaria, se efectúo una reunión, en las oficinas de informática del CNE,con la presencia de representantes del Comando Maisanta, del equipo técnico de laCD y del organismo electoral con el objeto de precisar el plan para ejecutar laauditoria del mismo día de la elección. Uno de los temas relevantes de la reuniónestuvo relacionado con la definición de los municipios en donde se realizaría laauditoria, lo cual sugería que la selección de los centros de votación para los procesosde auditoria no se efectuaría sobre el universo. También se informó que la asistenciade la CD en las auditorias sólo se efectuaría en calidad de observadores y que el díade la elección a las 3 p.m. se produciría una reunión con el profesor Héctor Arciniagapara revisar el programa fuente, en conjunto con la OEA y el Centro CarterEl día del referendo le fue negado el acceso a la representación de la CD a la Sala deMaquinas del CNE y al Centro Alterno, a pesar de tener las credenciales y haber sidoacordado previamente. En el mismo orden de ideas, la reunión acordada para revisarel programa fuente para la selección aleatoria para la “auditoria en caliente” jamás seprodujo. A las 5 de la tarde el CNE citó al equipo de auditoria de la CD, el comandoMaisanta y los observadores internacionales, para presenciar la ejecución delprograma de selección de los centros de votación. Ante la inquietud manifestada porel equipo de auditoria de la CD, por no haber revisado el código fuente, se informóen pleno acto que se haría entrega en ese instante del programa fuente, el archivo deentrada y el listado de mesas seleccionadas. Ninguna de estas circunstancias seprodujo.El sorteo de las máquinas de votación a ser auditadas se efectuó con un programa ymáquina del CNE, solo sobre veinte (20) municipios de catorce (14) Estados definidosunilateralmente por el CNE. Las credenciales de los testigos para la auditoria de laCD fueron entregadas en el mismo acto y, ante la preocupación de que era imposiblehacerle llegar las credenciales a todos los auditores a esa hora, el señor Leonardo


Hernández, en representación del CNE, aseguró que en las oficinas regionales seentregarían copias de las credenciales. Llegó la media noche y en todas las regiones elreclamo de los observadores del proceso de auditoria era el mismo: Negativa a laentrega de las credenciales y al acceso a los centros.Cuando se analiza la forma en que fueron resguardados los elementosfundamentales del proceso revocatorio se concluye que las auditorias y controlesposteriores fueron insuficientes e irrelevantes y, adicionalmente, objeto demanipulación. En el informe preliminar, afirmamos que la forma de resguardo ycustodia de los elementos del proceso, en los cuales estuvo ausente en forma absolutala oposición, prácticamente garantizaban la alteración de la programación. Ante tangrave afirmación, no se puede hablar de una observación internacional que actuaraen forma efectiva e integral.En sus zigzagueantes posiciones y declaraciones, el Centro Carter ha dejadoevidenciado que no efectúo una observación cónsona con su carácter de garante delcumplimiento de los Acuerdos de Mayo y las expectativas que se creó la sociedadvenezolana en torno a la seriedad de sus actuaciones. Así como afirmaron que elPoder Electoral venezolano había limitado las tareas de la observación internacionalpero que, finalmente, autorizaron el ingreso de los observadores del Centro “amuchos de los componentes técnicos involucrados en los comicios”; de la mismaforma se apresuraron en el reconocimiento de la totalización ejecutada por el mismoorganismo electoral; y, en reciente “Resumen Ejecutivo”, lo único que han hecho esconfirmar la falta de credibilidad del CNE, el cerco institucional y ventajismo quesufrió la oposición en el proceso refrendario y, porque no, reconocer su falta deaptitud para intervenir en procesos electorales automatizados.La anterior conclusión por cuanto, tal como lo indicamos en el informe preliminar, laobservación internacional realizada por el Centro Carter estuvo caracterizada porseveras limitaciones, además de sujeta a una evaluación apresurada y expedita. Araíz de su último “Resumen Ejecutivo”, parecen percatarse del control ejercido por el


Gobierno sobre los Rectores Electorales de mayoría y la minusvalía de una oposicióna la que se le niegan los mínimos elementos para defender su derecho a participarpolíticamente cuando se afirma que el proceso estuvo “afectado por algunasirregularidades, demoras, politización e intimidación”; y una “marcada falta detransparencia” también acompañó a la toma de decisiones generales del PoderElectoral. Tanto que “las decisiones más controversiales, en particular aquellas quefavorecían al Gobierno, se tomaron por un voto de 3-2”, no encontrándose “evidenciani en una sola ocasión de una decisión favoreciendo a la oposición con votacióndividida de 3 contra 2”.Tampoco valoró el Centro Carter que el Rector progubernamental Jorge Rodríguezimpuso la previa selección de los Estados y de los Municipios en lo que tendríanlugar las selecciones aleatorias de máquinas y de cajas electorales y las auditoriascorrespondientes; o que de las ciento noventa y nueve (199) máquinas elegidasmediante la aplicación de un Programa fuente elaborado, unilateralmente, por losequipos del propio Rector oficialista, sólo se le facilitó y permitió a la oposición, aúltima hora y superando obstáculos de acreditación impuestos por el mismo PoderElectoral y la Fuerza Armada, estar presente en veintisiete (27) auditorias,representativas de las jurisdicciones electorales con mayor población en el país. Valela pena acotar, como se hizo en el informe preliminar, que los resultados de esarevisión, aunque parciales y manipulados por el Poder Electoral, produjeron unresultado favorable a la oposición con un sesenta y dos por ciento (63%) de los votosemitidos, tal como aparece en informe de auditoria anexo al informe técnico. Fue asícomo Carter, con base a la simple cuenta de las actas electrónicas, declaró en formainmediata la victoria de Hugo Chávez Frías.La “observación” ejecutada por el Centro Carter fue insuficiente, superficial eirresponsable, al pactar unilateralmente con el Rector Jorge Rodríguez los términosde la auditoria, efectuada en fecha 18 de agosto, asegurando que estaría bajo sucontrol el programa fuente para la selección aleatoria de las cajas que estaban en


poder de los militares. Esto no fue así por cuanto el programa de selección aleatoriadispuesto por el mismo Centro no fue utilizado con el alegato de que falló porrazones técnicas; razón por la cual utilizó el mismo programa objetado por laOposición y utilizado para la frustrada “auditoria en caliente” del 15 de agosto. Talsituación se puede constatar en el informe conjunto suscrito por el Centro Carter y laOEA, así como también que “la muestra fue generada por personal del CNE” y quelos miembros del equipo de observación del Centro Carter “durmieron” al lado delas cajas electorales para evitar que las cajas seleccionadas fueran violentadas. Nadadijeron sobre lo que pudo haber pasado entre el 16 al 19 de agosto, lapso en que lasurnas estuvieron bajo la custodia de los hombres de la milicia; ya que todos loselementos de un proceso eminentemente cívico fueron controlados, en todas susetapas, por los militares.V<strong>LA</strong>S MÁQUINAS OFERTADAS POR SMARMATICLa configuración del diseño del Terminal MAEL 205, realizado por la empresaOlivetti fue en función de la negociación y venta de boletos de lotería. Tal hecho, nocontrovertido y con verificación en las publicaciones oficiales de la empresa italiana,implica un sistema de seguridad distinto a los que deben ser utilizados en losprocesos electorales y, por tal razón, inadecuados. La diferencia sustancial es que, enla lotería, el equipo debe estar conectado en forma permanente a la red administradapor el servidor central mientras que en la maquina electoral, concebida comoterminal individualizado, existe independencia del resto de los terminales de la red.Constituye un riesgo inminente de manipulación la posibilidad de interconexión porlo que no se debe producir un enlace sino hasta la finalización del evento.Esta es la justificación de que la Ley Orgánica del Sufragio y Participación Políticaestablezca en su Artículo 157 que “en los casos en que se adopten sistemasmecanizados de votación, se deberá garantizar que sólo se transmitirán datos unavez concluido el Acto de Escrutinio”. Un terminal conectado en red es susceptible de


seguridad, la conclusión es que Smartmatic no puede garantizar la inviolabilidad delsistema o la posibilidad de que, en caso de ocurrencia de hechos fortuitos, lainformación electoral pueda ser extraída sin que sea modificada. Esto tiene especialrelevancia por cuanto esta maquina no posee una fuente de energía interna de largaduración que la haga autónoma a la conexión eléctrica por lo que, en caso de cortesen el local o centro electoral, quedarían inhabilitadas y eventualmente no podríaconcluirse la jornada electoral.Este tipo de máquinas debe ser activada por un operador o miembro de mesa que,por tal circunstancia, tiene control sobre el resultado final al tener acceso a laactivación múltiple. Las máquinas de votación, al final de la jornada, primerotransmitieron, lo que estaba supuestamente “almacenado” en una tarjeta inteligentedenominada Smartcard, para luego emitir un recibo de totalización. Posteriormente,existirían tres puntos de coincidencia y chequeo: las papeletas, la Smartcard, y elcentro de totalizacion del CNE.Las máquinas “gaming ware” (máquinas de juego) Olivetti no están diseñadas paraningún tipo de elección donde la confidencialidad y el anonimato son las principalescaracterísticas. El Hardware y el Software, tal como lo explica en su presentaciónOlivetti, están diseñados para trabajar “on line real time”, en línea y en tiempo real.En su presentación se utilizan para plataformas BIDIRECCIONALES, contecnología Leading’edge utilizada para ser intervenidos y utilizados en cualquierjuego de envite y azar con apuestas directas de cartas o eventos deportivos; a travésde la red telefónica, celulares e inclusive Internet. Es un sistema abierto de fácilintervención. Cuando hay conectividad obviamente se comparten los datos; así comohay códigos ejecutables honestos, existen también códigos delictivos utilizados poroperadores sin escrúpulos.Cada máquina además de su código de identificación tiene una IP (es decir unadirección exacta) que corresponde a un punto de máquina de votación especifico, yexisten tantas IP de llegada como máquinas de acuerdo a la trayectoria y los puntos


donde quiera viajar la información. Son vínculos de comunicación de red de altavelocidad. La capa de acceso a la red es la responsable de colocar los paquetes y debeser independiente del método de acceso, del formato y de la trama. Con los IP lospaquetes pudieron ser desfragmentados, enrutados y reemsablados, lo cual nospermitió llegar al origen de la data.Al enviar una señal por una ruta, al llegar al final por rebote produce un eco (ping),que no se pierde y a través del TRACERT se examina la ruta al destino, inclusiveconocer donde se detuvo la conectividad, conociendo de antemano los puntos dellegada. Las Direcciones IP de entes públicos y privados relacionados con el sistema(Capacidad de procesamiento) son los siguientes: a) CONSEJO NACIONALELECTORAL IP 200.70. XXXX; b) C.A.N.T.V. IP 200.44.32.XX; c) BIBLIOTECANACIONAL IP 200.90.17.67 y d) UNIVERSIDAD BOLIVARIANA IP 192.164.XX.XX(Antigua sede <strong>LA</strong>GOVEN Bello Monte). Esto da una idea de la fuerza que tiene elhecho de la conexión entre diferentes sistemas y la debilidad en cuanto al acceso,como para hacer confiable la transmisión.En el Referendo Revocatorio los que ejecutaron el fraude controlaron los dispositivosexternos e internos del Sistema en lazo cerrado, se manejaron con un monitoreo(TCP/IP: tomaron parte del mensaje mientras transmitían), y la privacidad de losdatos se esfumo. Ellos tenían reportes y estatus en tiempo real a medida que sedesarrollaba el proceso revocatorio y aquí se sirvieron también de las máquinas casahuellas. Estas máquinas fueron negociadas directamente por Jorge Rodríguez, talcomo consta de Memorando ORP-101/2004 dirigido a William Pacheco en sucarácter de secretario general del CNE, con las empresas Cogent Systems y de GilatSatellite Network “para el Sistema Automático de Identificación de HuellasDactilares para Autenticación de Votantes Vía Satélite”, dirigidas al uso de lo que enprincipio eran doce mil (12.000) lectoras de huellas dactilares y los mecanismos detransmisión por satélite en el referendo revocatorio.En cuanto al encriptamiento de la información, cuando se trabaja bajo MICROSOFT


en SQL (Structure Query Languaje), hay una autenticación en el origen de los datosque fue lo que permitió que la data en su forma original no fuese cambiada (la deida) rastreada a través del almacenamiento en el servidor granja. Debió producirseconfidencialidad en el flujo de tráfico limitado y la elección de un método deautentificación (clave precompartida) ¿Entre quienes? La respuesta es sencilla entreellos mismos, la empresa vendedora tenía las claves cifradas pero por los vicios queposeía el sistema cuando hace eco, fue posible rastrear la información autentica yverdadera.¿Cómo se constata que la data (Votos) era diferente a la impresión que emitió lamáquina de votación? El acceso y el rastreo externo a través de los IP del servidorde seguridad de la CANTV permite analizar, estudiar y desensamblar la secuencia ycontenido de la transmisión. Explicarlo desde el lenguaje de máquina es bastantecomplicado. En principio un Log de transmisión (registro) es donde se observa elpunto de salida del terminal (Máquina de votación) y la llegada al servidor deseguridad (no de totalización); es decir, los datos puros de cada máquina y losconserva por su propia naturaleza en los servidores HP, IBM. De allí el análisis de losdatos (votos) en tiempo y configuración.Las direcciones electrónicas de las máquina constan de los siguientes identificadores:a) Los dos primeros dígitos son el Estado. Por ejemplo el 14 es el Edo Bolívar y el 11es el Municipio Libertador. (Tiene un número por la cantidad de centros agrupados) ;b) El siguiente digito es la parroquia; c) El próximo el lugar físico; y d) El númerofinal la mesa. La escala de valores para el votante se discrimina de acuerdo al últimonúmero de la cédula, es decir un centro tenía un número de mesas determinado, ycada mesa tenía un número de máquinas de votación, la información que presenta elC.N.E. es de las mesas y se tiene la información de los votos codificados de cadamáquina.


Otro punto a destacar es que el Código Fuente 5[5] estaba en poder del C.N.E., talcomo lo establece el Convenio originario, y la empresa Smartrmatic. Por tal hecho sepodían cargar módulos externos (programas compilados no auto ejecutables) y desdeallí cargar instrucciones especificas que alteraran la función original del programa encurso. El Código fuente no podía tener módulos externos por la naturaleza delproceso. La oposición no tuvo acceso al código fuente (ver y no-tocar), lo que era unode los “actos de confianza” necesarios para garantizar la pureza del proceso. Elcódigo debía ser accesible, auditable y verificable, así si el sistema era de códigoabierto deberían estar a la vista, una especie de escrutinio virtual, y los votantestener la seguridad que el software “hiciese lo que se esperaba que hiciese. El sistematenía “ una puerta trasera”, con privilegios no autorizados, lo que permitíafácilmente incluir votos adicionales o excluir votos existentes.Se puede descifrar cada punto, cada trayectoria, cada lenguaje, y las huellas quesiempre deja la información cuando fluye. De acuerdo a lo antes expuesto, existenmecanismos claros para alterar el código fuente, la trayectoria y tiempo de lainformación, la data de los servidores, de lo que resulta la alteración de los resultadosdel referendo revocatorio.VI<strong>LA</strong> DETECCIÓN DE LOS CENTROS AFECTADOS Y ELMAPA POLÍTICO DEL <strong>FRAUDE</strong>Ante las evidencias de fraude masivo y cualitativo en el proceso refrendario,denunciado en el informe preliminar desde la perspectiva del fraude y cohecho en elRegistro Electoral y el fraude automatizado, nos correspondía ubicar cuales fueronlos centros afectados en forma indubitable de acuerdo a la metodología fijada. Elobjetivo era muy simple, determinar el ámbito y definición del estudio de ingenieríasocial, base de la manipulación de los perpetradores del fraude, en el cual se delinean5[5] Se define como el lenguaje original de programación ”instrucciones de alto nivel“ que su funciónen este caso era la totalización confidencial y transparente, el código fue compilado (pasado a lenguajede máquina) y paso a ser ejecutable (.exe)..


los sectores en que se podía manipular la voluntad popular con impunidad, paradefinir la tendencia y, al mismo tiempo, evitar futuras manipulaciones. Así como sepueden detectar los centros afectados, con la misma metodología se pueden detectaraquellos que no lo fueron con la intención de determinar, con cierto grado deaproximación, cuáles fueron los resultados reales de la jornada.Ambos objetivos son determinantes para definir el futuro político de la oposicióndemocrática. Así se constituyeron equipos interdisciplinarios cuya conclusiónunánime, desde distintas perspectivas de la investigación científica, fue que se habíaproducido una manipulación masiva de los resultados que resulta evidente de lamisma data oficialmente anunciada por el CNE. En pocas palabras, trabajamos conbase a los resultados oficiales y dejamos que los números hablaran por si mismos.La segunda acción fue la definición, aislada e independiente, de los universos decentros en los que, con certeza científica, se produjeron o no manipulaciones, dejandoapartados aquellos centros en los que no coincidían unánimemente todos losequipos. En el caso de los centros afectados, tomamos dos acciones; la primera trazarel mapa político del fraude, la otra cruzar esta data indubitable con los centros quetuvieron comportamientos anómalos en materia de telecomunicaciones, tal como sepuede constatar en el tomo anexos técnicos del presente informe.DATOS ANALIZADOS1. Oficiales suministrados por el CNEVotos Totales: 9.815.631NO: 5.800.629, SI: 3.989.008, NULOS: 25.9942. Municipios: 335 (Debe incluirse el voto extranjero-62)Promedio Parroquias x Municipio: 3,1Promedio Votos x Municipio: 24.7253. Parroquias: 1.228 (Deben incluirse 96 centros en extranjero)Promedio Centros x Parroquia: 6,8Promedio Votos x Parroquia: 7.9934. Centros de votación: 8.335Promedio Actas x Centro: 2,8Promedio votos x Centro: 1.178


5. Mesas: 12.274Promedio Actas x Mesa: 1,9Promedio Votos x Mesa: 8006. Actas: 23.6817. Promedio Votos x Acta: 414El CNE declaró que un 59% de los electores habían votado a favor de la permanenciadel presidente de la Republica en su cargo (Votos NO) y un 41% de los electoreshabían votado a favor de la revocatoria de su mandato (Votos SI). En los estudios seutilizan los datos oficiales publicados por el CNE de 23.681 actas, distribuidas en8.335 centros de votación, pertenecientes a 1.228 parroquias. El análisis se dividió enuna primera fase de Prueba de Hipótesis que se basa en la prueba de dos hipótesis:a) A nivel de Actas, no existen diferencias significativas en el % de SI entre losdistintos centros de votación de una parroquia; b) A nivel de Actas, no existendiferencias significativas en el % de SI entre las distintas mesas de votación de uncentro.METODOLOGÍA1. Se estimaron los % de votos SI/NO de acuerdo con distribuciones normales(aproximando binomiales) de la población electoral automatizada a nivel deParroquias (1.228) y Centros de votación (8.335).2. Se estimaron intervalos de confianza para distintos niveles de certeza3. Se rechazaron aquellas actas cuyo resultado no está contenido en los distintosintervalos de confianza.Dado que el porcentaje de Actas Rechazadas, asumiendo completa homogeneidad delas parroquias es 48% y asumiendo completa heterogeneidad de las mismas es 1%, sehace necesario analizar en profundidad la heterogeneidad de las parroquias porpreferencias políticas, para aumentar la precisión de los resultados obtenidos, lo cual


es el objetivo de la próxima fase. Para analizar la heterogeneidad de las parroquias,se utiliza la siguiente metodología:METODOLOGÍA1. Las parroquias se subdividen al máximo, en conglomerados Homogéneos yCuasi-Homogéneos, de acuerdo con la heterogeneidad mínima promedio del % delSI a nivel de actas de una parroquia (2.1%).2. Para cada conglomerado y utilizando la totalidad de sus actas, se calcula laprobabilidad de que el % de SI de las actas tengan distintos valores esperados.3. Se calcula el valor Esperado y la Desviación estándar del número de ActasRechazadas.Con la extrema severidad que implica la subdivisión utilizada, el número de ActasRechazadas está contenido en el intervalo (MIN: 5.450, MAX: 6.050). La probabilidadde estar fuera de este intervalo es (10 -6 ). Este resultado acota rigurosamente, elproceso de subdivisión de parroquias en conglomerados (Homogéneos y Cuasihomogéneos)de la próxima fase de Prueba de Hipótesis en conglomerados.METODOLOGÍA1. Se subdividen las parroquias en conglomerados de análisis hasta alcanzar queel promedio de la heterogeneidad de los mismo esté en el entorno de laheterogeneidad mínima promedio definida en la sección anterior (2.1%).2. Se prueba la hipótesis: Las Actas de un conglomerado tienen el mismo % de SIesperado.3. Se rechazan aquellos conglomerados (subconjuntos de centros de una mismaparroquia) para los cuales no se acepta la hipótesis planteada.CONCLUSIONES


1. Fase 1: Al comparar los patrones de votación de los distintos centros de unamisma parroquia, se observa un 48% de actas irregulares. Ahora bien, sólo un 1%presenta irregularidades a nivel de las actas de votación de un mismo centro.2. Fase 2: Se puede afirmar que el intervalo de Actas con patrón de votaciónirregular está en el rango de 5.450 y 6.050 con probabilidad (1 – 10 -6 ); es decir entre el23 % y el 25,5 % del total de centros de votación.3. Fase 3: Se puede afirmar que un 18% de los centros de votación presentan unpatrón de votación irregular en sus actas. (Detalles en Referéndum Revocatorio: AnálisisEstadístico, Anexo 1). Los votos relacionados con esta irregularidad están en el ordende 2.550.000 y son mayoritariamente (68%) relacionados con la opción NO delreferéndum revocatorio.4. Fase 4: Al estimar el % obtenido por la opción SI en el Referéndum, en funciónde la población representativa y de los resultados por tipo de acta, se concluye que elmismo está contenido en el rango 52,2% y 59,7%.Los resultados del análisis a nivel de entidad (parroquia, centros de votación) y lamagnitud de las irregularidades, implican que los resultados oficiales del CNE noreflejan con certeza estadística la intención de voto de los electores. Lasirregularidades detectadas se observan uniformemente en muchos centros devotación.Nivel de Certeza 85% 90% 95%Centros Rechazados 30% 26% 22%Actas Rechazadas 31% 28% 24%Votos Rechazados 31% 28% 24%Número de Centros Rechazados 1.357 1.200 1.014Número de Actas Rechazadas 5.982 5.419 4.627Votos Rechazados 2.656.813 2.406.873 2.051.102Votos NO Rechazados 67% 67% 67%Votos SI Rechazados 33% 33% 33%


Lo fundamental en el esquema de trabajo ejecutado es que este ensayo coincide conlos grupos de trabajo de origen universitario que, en forma autónoma, trabajaron deacuerdo a la metodología que se señala en el próximo segmento del presenteinforme. Se descubrieron los centros electorales y máquinas objeto de manipulaciónpara realizar el cruce en que coincidan unánimemente todos los equipos. A su vez,tal universo se cruzó con las máquinas que tuvieron un comportamientobidireccional e irregular y, como ya indicamos, resultan coincidentes. De esta formase determinó el impacto y ubicación del fraude automatizado.VICONVOCATORIA DE LOS EQUIPOS UNIVERSITARIOSY SUS APORTESLa siguiente es una sinopsis del <strong>Info</strong>rme sobre los Análisis Estadísticos del Resultadodel Referéndum Revocatorio 2004 realizado por profesores universitarios dereconocidas universidades nacionales e internacionales, así como por destacadosprofesionales independientes, convocados por el Comité Técnico de Sustanciaciónpara debatir ese Resultado y, con base a un esfuerzo de sociedad de conocimiento,determinar conclusiones sobre la veracidad de los mismos.La aplicación de la ley de Benford, técnica utilizada en la detección de posiblesfraudes financieros, censales y de otro tipo, arrojó que los resultados del CNEpresentan fuertes indicios de fraude. Por otro lado, se revisaron de nuevo lasllamadas repeticiones numéricas (llamados incorrectamente topes) para concluir quelas repeticiones del SI tienen una muy baja probabilidad de ocurrencia pero, lo másimportante, se consiguieron repeticiones del SI en centros de cuatro (4) máquinas quetienen probabilidad de ocurrencia prácticamente igual a cero. Conclusión similar selogró para las repeticiones en el número de votantes en centros de seis (6) máquinas.Este hallazgo, por sí solo, pone en tela juicio la honestidad de los datos del CNE.Los estudios anteriores se refieren a los datos oficiales nacionales del CNE; sinembargo, el Comité optó también por realizar estudios por Estado y por Parroquias.


A nivel de los Estados se consiguió que, en muchos de ellos -generalmente los demayores votantes- los patrones de votación no se correspondían con los patronesteóricos esperados para una votación por dos opciones. Además, se comparó laelección del 2004 con la elección presidencial del 2000. Se halló que entre ellas habíauna gran similitud en los porcentajes de votación. Debemos recordar que en el 2000,a pesar de la alta polarización, en varios Estados las opciones adicionales tuvieronalguna significación. Como se mantuvo el mismo patrón de votación de la eleccionespresidenciales del 2000, en el 2004 aparecieron características ajenas a una votaciónentre dos opciones, lo cual evidencia de nuevo la presencia de un fraude. De esaforma se identificaron patrones no esperados en los Estados de mayor votación, locual les llevó a concluir que las manipulaciones se llevaron a cabo de maneraselectiva. El estudio a nivel de las Parroquias, nos llevó a subdividirlas en sectoresmás homogéneos, a fin de determinar comportamientos irregulares en las actas de unsector dado. Esto se hizo para la votación automatizada y la manual. El resultadoarrojó que cerca de 2.500.000 votos, a nivel nacional, correspondían a actasirregulares.Este Comité ha sostenido que sólo la Auditoria que se hubiese realizadoinmediatamente, después del cierre de las votaciones, tendría sentido como elementode validación de los resultados electorales. Sin embargo, el equipo universitariodeterminó por distintas vías que la muestra utilizada el día 18 de agosto de 2004 noera representativa de los votos emitidos durante el proceso de votación. Variascaracterísticas de la muestra no coinciden con los valores correspondientes aluniverso, como por ejemplo: la distribución de máquinas auditadas por estratosocioeconómico, el cumplimiento de la ley de Benford para los votos NO o la relaciónentre las firmas del reafirmazo y los votos SI.Se hizo una estimación de los resultados de la votación automatizada. Con estafinalidad se determinó, en primer lugar, la proporción de los votos SI en el conjuntode las actas que muestran mayor regularidad con relación al centro que pertenecen.Este conjunto esta constituido por 795 centros distribuidos en todo el país, con un


total de 1.654.544 votos. De acuerdo con los resultados del CNE para estas actas, lasproporciones resultantes son:Votos SI ………….59,7%Votos No………….40,3%Los votos proyectados a nivel nacional arrojan los siguientes resultados para lavotación automatizada:Votos SI…………. 5.078.000Votos NO…...…….3.427.860En otro estudio, basado en la ley de Benford, se estima que un mínimo de 1.390.000votos deberían ser traslados de los votos del NO a los del SI, en los resultadosoficiales del CNE. Esto resulta en los siguientes porcentajes estimados tanto para lavotación manual como la automatizada:Votos SI…………. 5.379.008.....54,8%Votos NO………....4.436.623.....45,2%De los análisis estadísticos arriba mencionados se concluye que los resultadospublicados por el CNE no se corresponden con la intención de voto del elector. Conrespecto a la muestra de mesas auditadas el 18 de agosto de 2004 se prueba que lamisma no es representativa del universo de mesas de votación. La estimación devotos del Sí no manipulados apunta a que el resultado real de la consulta es opuestaa la anunciada por el CNE oficialmente.VIITELECOMUNICACIONESUn sistema de votación automatizado consta de los siguientes componentes: (a) laaplicación, responsable del tratamiento de los datos generados por las máquinas devotación; (b) la plataforma de informática consistente en el hardware y software delas máquinas y de los servidores de totalización; y (c) la plataforma o red de


telecomunicaciones que provee el medio de comunicación entre los diferentescomponentes del sistema.La plataforma de informática y de telecomunicaciones de un sistema electoral, debecumplir con un conjunto de propiedades y características que garanticen laintegridad de dicho sistema. Para el propósito de este <strong>Info</strong>rme, telecomunicaciones sedefine como la capacidad de transmitir y recibir data electrónicamente usandocomponentes de hardware y software entre el sitio de votación y el sitio detotalización.MAQUINADEVOTACIONINFORMACIONTRANSMISOR/ RECEPTORCANALTRANSMISOR/ RECEPTORINFORMACIONTOTALIZADORRed de TelecomunicacionesFigura 1En la Figura 1 se muestra el modelo simple de la red de telecomunicaciones genéricaque soporta el sistema de votación. Las características de la red incluyen:simplicidad, flexibilidad (especialmente en lo que a enrutamiento y buenos tiemposde respuesta se refiere), y mantenimiento (incluyendo disponibilidad, redundanciade recursos y conexiones, particularmente en conexiones a las redes públicas). Elintercambio de información entre la máquina de votación y el totalizador se realiza através de una aplicación. Una aplicación puede ser un programa simple o un grupode programas que trabajan en conjunto para proveer una función al usuario final, seael votante o el administrador electoral.Descripción de la red


En la Figura 2 se muestra la plataforma de telecomunicaciones instalada por CANTVpara el proceso electoral del pasado 15-A.FirewallFirewallFirewallEnlace dedicadoRouterCNERouterCNEFirewallServidoresServidoresCNE-1PCNube ATMCantvPCCNE-2MovilnetRed CelularFirewallsPCR1MódemscelularesCantvUniredMódemsPCR24RegionesPCJ.E.MMaq.Vot.PCJ.E.MMaq.Vot.Maq. Vot.Figura 2De acuerdo con CANTV, esta empresa 6[6] “…realizó un estudio de factibilidad paraidentificar los Centros de Votación con facilidades de transmisión automatizada, elcual arrojó … luego de la realización de pruebas…la factibilidad de 4.611 Centros deVotación, lo cual fue notificado formalmente al CNE.”“La configuración fue diseñada con esquemas de redundancia física y lógica, con loque se logró satisfacer la comunicación entre los dos (2) sitios centrales detotalización, uno PRINCIPAL y otro de CONTINGENCIA, veinticuatro sedesregionales, Centros de Votación, Juntas Municipales, por medio de las plataformasde Cantv y Movilnet con la finalidad de transmitir toda la información hacia los sitioscentrales.”“El esquema fue completamente redundante y con dicha configuración era posiblereenrutar la data si llegase a ocurrir fallo en cualquier circuito. La premisa de cambio6[6]Tomado del <strong>Info</strong>rme de Cierre Proyecto Cantv Proceso Referendum RevocatorioPresidencial 15 De Agosto. Autor: CANTV


al sitio de contingencia era, si y solo si, la conexión con el sitio principal se perdíacompletamente. En este momento, se realizaría automáticamente la transmisión aesta segunda sede de contingencia.”“Se utilizó la red de telefonía alámbrica Cantv, celular de Movilnet, así como tambiénlas plataformas de Unired, CDMA 1X, VSAT, Frame Relay, Red Inteligente y, comoapoyo, se diseñaron dos localidades de Call Center, uno ubicado en CET de SanMartín para un centro de control de operaciones CANTV y otro, en ATENTO”.Las propiedades y características descritas anteriormente por el proveedor, serviráncomo referencia para el análisis del comportamiento del sistema electoral. Este en suconjunto debe cumplir con las siguientes propiedades para considerarse confiable: (a)seguridad, (b) precisión, (c) integridad, (d) capacidad de ser auditado, (e) capacidadde tabulación de votos, (f) conteo de votantes, (g) retención de datos, (h) utilizaciónapropiada de las telecomunicaciones y (i) administrable.El análisis realizado se centró fundamentalmente en la revisión detallada de los logsde comunicación desde las máquinas de votación y las máquinas de las JuntasElectorales hacia los centros de totalización a través de la red de telefonía fija ycelular de CANTV. El gráfico de las sesiones establecidas originadas en la red fija conla data obtenida del log analizado y el diagrama de comportamiento del <strong>Info</strong>rme deCANTV, coincide. Los hallazgos de este análisis fueron los siguientes:1. HECHOS DESTACADOS DE <strong>LA</strong> REDa. Se observó la presencia de dos redes privadas: la red periférica de acceso,identificada con el rango de direcciones 172.X.X.X y la red troncal identificada con elrango de direcciones 10.X.X.X.b. Se observó el protocolo L2TP para el establecimiento de sesiones VPN (VirtualPrivate Network) entre las máquinas de votación y los centros de totalización.


c. Todas las máquinas discaron el número de acceso 9CNE (9263) que las conectabacon el Servidor de Acceso Remoto (RAS) asociado a la ubicación geográfica de lamáquina.d. Las máquinas de votación disponían de un mecanismo de autenticaciónconsistente en la forma userID@dominio, donde userID tenía la siguiente estructura:CCCCC_M_T_X@cne2004.gov.ve (Centro, Máquina, Tomo, X: verificación)e. Las máquinas de totalización disponían de un mecanismo de autenticaciónconsistente en la forma userID@dominio, donde userID tenía la siguiente estructura:ESTADO_XX@cne2004.gov.ve (Estado, X: consecutivo)f. Se establecieron 17.204 sesiones desde 14.428 máquinas de votación a través de lared fija. En dichas sesiones se observan tres distintas razones de terminación:solicitud del servidor, solicitud de la máquina y pérdida de portadora. El 94,56%(16.267) de las sesiones fueron establecidas por el 99,15% (14.306) de las máquinasconectadas a la red fija que realizaron entre uno y tres intentos de conexión. Losdatos correspondientes se encuentran detallados en los Tablas No. 1 y 2Tabla No. 1.Sesiones establecidas desde máquinas de votación y tipos de terminaciónTabla No. 2Total de máquinas con sesiones efectivas(basado en última llamada de cada máquina)


Llamadas Por host Pérdida portadora Por Usuario Total general1 3979 2771 5807 125572 278 549 710 1537 14.306 99,15%3 35 81 96 2124 6 22 10 385 ó más 11 59 14 84Total general 4309 3482 6637 14428h. Se observaron llamadas desde las 7 am desde las máquinas de las JuntasElectorales Municipales (figura No. 1) y a partir de las 4:20 pm, de las máquinas devotación (figura No. 2)Tabla No. 1Sesiones etablecidas por máquinas de juntas electorales.(Serie de tiempo)


Tabla No. 2Sesiones etablecidas por máquinas de votación.(Serie de tiempo)i. La duración promedio de las sesiones luce independiente de la cantidad de datostransmitida e independiente también de la hora del día de la transmisión.HAL<strong>LA</strong>ZGOS1. BIDIRECCIONALIDADPara asegurar el cumplimiento de las condiciones que caracterizan un sistemaelectoral automatizado íntegro, es requisito que dicho sistema actúe en formaunidireccional; es decir, la transmisión de datos de aplicación debe fluir única yexclusivamente en el sentido MAQUINATOTALIZADOR y no en sentidocontrario. Sólo es aceptable la existencia de tráfico aplicación hacia las máquinas conpropósito de reconocimiento (validación de seguridad) y para el establecimiento ymantenimiento de la sesión (control de la conexión).


Resultados cuantitativos. Analizando el registro de las llamadas y sesiones establecidasentre las máquinas de votación y el servidor de totalización, se observó que casi en latotalidad 7[7] existió tráfico bidireccional. Ver Figura No. 3Figura No. 3Tráfico entrante vs saliente por máquina de votación(ordenado por ascendente del tráfico saliente)2. HETEROGENEIDAD. VOLUMEN DE TRÁFICOSi se parte de la premisa de que todas las máquinas de votación emplean el mismosoftware es lógico inferir que todas ellas debían transmitir el mismo tipo deinformación (p. ej. contenido del acta), donde los únicos datos variables deben ser losasociados a la identificación única de cada centro-mesa-tomo. Sin embargo, como seexplica a continuación, el comportamiento observado no es homogéneo.Resultados cuantitativos. Partiendo de la observación del gráfico No. 1, la muestra sepuede caracterizar en tres grupos según el volumen de tráfico saliente (transmitidodesde el servidor), de la siguiente forma:7[7] En el reporte de transacciones de la red fija Cantv se identifican 2 máquinas que no presentantráfico saliente en ninguna de sus llamadas. Es razonable suponer que se usó una vía alterna para latransmisión de los resultados, bien sea a través de la red móvil celular ó mediante el procedimiento dedigitalización y transcripción en la respectiva Junta Electoral Municipal.


• Bajo: transmisión menor a 5.000 bytes.• Alto: transmisión entre 5.000 bytes y 8.000 bytes• Excesivo: tráfico superior a 8.000 bytesEl número de máquinas asociado a cada nivel, su tráfico entrante, saliente y larelación entrante/saliente se detalla en el tabla No. 3. Allí es posible apreciar que6.884 máquinas (47,72%) se ubican en el intervalo bajo, mientras que 7.164 (49,66%) y378 (2,63%) se ubican en los grupos alto y excesivo.Tabla No. 3Total de máquinas según volumen de bytes enviados por el servidorEn la tabla anterior se puede igualmente observar que la relación entre bytessalientes y entrantes no es homogénea, pues el segmento bajo es 15%~17% mayor alcompararlo con los segmentos de tráfico saliente alto y excesivo (qué sí lucenhomogéneos entre sí). También se evidencia que el tráfico promedio saliente de losintervalos alto y excesivo es, en términos absolutos, de 4 a 6 veces mayor que eltráfico del segmento bajo, respectivamente.3. HETEROGENEIDAD. CANTIDAD Y TAMAÑO DE LOS PAQUETESLa transmisión de datos utilizada en la red de telecomunicaciones del sistemaelectoral evaluado, responde al modelo de transmisión por paquetes; es decir, losdatos se agrupan en grupos de igual o diferente tamaño (cantidad de bytes) con el finde optimizar velocidad e incrementar la confiabilidad de la transmisión.


La cantidad y tamaño de los paquetes requeridos para la transmisión de un mensajequedan determinados por tres variables: protocolo empleado, características delmedio de transmisión y el tamaño mismo de los mensajes a intercambiar entre lasaplicaciones. Dependiendo de los requerimientos de la aplicación y configuración delprotocolo, un sistema receptor de un mensaje puede enviar al emisor paquetesadicionales con pocos bytes de longitud para confirmar la recepción de los datos ópara solicitar la retransmisión de paquetes faltantes. Nuevamente, considerando lapremisa de que se empleó el mismo software en todas las máquinas de votación, esapremisa es inconsistente con lo observado en cuanto a la cantidad y tamaño (enbytes) de los paquetes.Resultados cuantitativos. La Figura No. 4 muestra gráficamente el comportamiento deltráfico entrante al servidor de totalización y saliente hacia las máquinas, medidos enpaquetes, vs. la cantidad total de bytes salientes.Figura No. 4Total de paquetes entrantes y salientes(en referencia con la cantidad de bytes salientes)El resultado de la inspección sobre el gráfico anterior revela dos comportamientoscompletamente distintos: el nivel de tráfico bajo presenta una proporción 10:1 entrelos paquetes salientes vs entrantes con una varianza muy alta, mientras en los


segmentos alto y excesivo la proporción oscila entre es prácticamente 1:1, con unavarianza casi nula. Según se resume en la tabla No.5Tabla No. 4Paquetes entrantes vs. salientes(en referencia con cantidad de bytes salientes)El primer comportamiento es esperable bajo las siguientes condiciones: muchos másdatos entrantes y pocos mensajes de vuelta; estos últimos, bien para efectos deautenticación como para mantenimiento de sesión y retransmisión de paquetes. Elsegundo comportamiento puede observarse cuando existen altas tasas deretransmisión (calidad de línea / congestión) ó entre dos sistemas que intercambiantransacciones uno a uno.En lo relativo al tamaño (en bytes) de cada paquete, es necesario evaluar primero, deforma independiente, los paquetes entrantes y salientes (figuras No. 5 y No. 6,respectivamente), antes de hacer un análisis comparativo de ambos.


Figura No. 5Paquetes entrantes vs. bytes / paquete entrantes(en referencia con la cantidad de bytes salientes)En el gráfico de la figura anterior se puede observar tres aspectos importantes:• El número de paquetes en el segmento de bajo tráfico es muy estable y esaproximadamente la mitad que el mínimo de paquetes en los segmentos alto y deexceso.• El tamaño promedio (en bytes) de los paquetes del segmento bajo es al menostres veces menor que el mínimo tamaño de paquetes en los segmentos alto y deexceso.• En los segmentos bajo y excesivo el tamaño y cantidad de los paquetes es máshomogéneo, mientras que en el segmento alto el tamaño de los paquetes seincrementa al tiempo que se incrementa el número de paquetes, aun cuando no sepueda determinar la correlación entre ambos.


Figura No. 6Total de paquetes entrantes y salientes(en referencia con la cantidadEn el caso de los paquetes salientes, los aspectos relevantes de la gráfica son lossiguientes:• El número de paquetes del segmento bajo es muy estable y el tamañopromedio de los mismos presenta comportamientos escalonados muy biendefinidos, los cuales se corresponden con un número muy bajo de paquetes yun volumen de datos muy constante. El escalonamiento puede deberse a lanecesidad de adicionar un número pequeño (1 a 5) de paquetes adicionalespara efectos de retransmisión de paquetes defectuosos.Tabla No. 5Total de paquetes entrantes y salientes(en referencia con la cantidad de bytes salientes)Según se aprecia en la tabla No. 5 y a pesar de la simetría entre las curvas, en elsegmento alto y de exceso, el tamaño de los paquetes es siempre mayor o igual almáximo tamaño de los paquetes del segmento bajo (4,6 veces en promedio), aun


cuando el número de paquetes promedio es 13 veces mayor ,denotando una cantidadde bytes salientes mayor a lo esperable como tráfico de mantenimiento de sesión ysolicitud de retransmisiones4. OTROS HAL<strong>LA</strong>ZGOS NO RE<strong>LA</strong>CIONADOS CONTELECOMUNICACIONES.Como parte de la investigación realizada se efectuó un análisis del comportamientode las telecomunicaciones con variables no tecnológicas. Los resultados se detallan acontinuación:Volumen de datos vs. resultados del proceso: Una inspección preliminar de lasfiguras No. 7 al No. 12 así como los resultados numéricos de las tablas No. 6, 7 y 8parece indicar una correlación entre los volúmenes de bytes salientes y los resultadosdel proceso.Figura No. 7Resultados porcentuales nacionales Votos “NO”


Figura No. 8Resultados porcentuales nacionales Votos “SI”Tabla No. 6Comparación numérica de resultados nacionales vs. volúmen de bytes salientes


Figura No. 9Resultados porcentuales regionales Votos “NO” Aragua y CaraboboFigura No. 10Resultados porcentuales regionales Votos “SI” Aragua y Carabobo


Tabla No. 7Resultados porcentuales regionales Votos “SI” Aragua y CaraboboFigura No. 11Resultados porcentuales regionales Votos “NO” Miranda y Zulia


Figura No. 12Resultados porcentuales regionales Votos “SI” Miranda y ZuliaTabla No. 8Resultados porcentuales regionales Votos “SI” Miranda y ZuliaPor último se realizó una comparación entre el número de votantes y el número depaquetes salientes, cuyos resultados se presentan en la figura No. 13. Allí se observaheterogeneidad en cuanto al comportamiento de ambos, puesto que en el segmentode bajo tráfico saliente, la cantidad de bytes luce independiente del número devotantes asociados a cada máquina, mientras que en el segmento alto la curva se“fracciona” en dos segmentos y el volumen de paquetes salientes se incrementa enforma casi directamente proporcional al número de votantes. El segmento de tráficoexcesivo presenta un comportamiento mixto con respecto a los otros dos.


Figura No. 13Número de votantes por máquina vs. tráfico saliente(bytes y paquetes)El primer comportamiento es el esperado en un tipo de transmisión únicaindependiente del número de votantes, en el cual sólo se requiriese la transmisión delas actas. El caso del segmento alto es esperado sólo en el caso de una votación enlínea ó una transmisión de resultados voto-a-voto, en todo caso, el comportamientodel sistema no es homogéneo aun cuando se presume el uso de idéntico software entodas las máquinas.VIIICONCLUSIONES Y RECOMENDACIONES FINALESI. Se han constatado graves irregularidades y elementos de fraude quevician de nulidad absoluta el Referendo Revocatorio del Mandato de HugoChávez Frías y los futuros eventos electorales. Algunos de esos elementosson: La participación activa de la Fuerza Armada en el proceso electoral; lautilización, en contra de lo dispuesto por la ley, de un sistemaautomatizado de votaciones y la negativa a que se contasen manualmentelas boletas expedidas por las máquinas electorales y luego depositadas en


cajas especiales; la remoción, a última hora, de los miembros de las JuntasElectorales en todo el país, sustituyéndolos por militantes del partidooficialista; el traslado, sin mediar petición de los votantes afectados, demiles de éstos hacia centros de votación distantes de sus domicilios; laviolación de la norma de ley que ordena el cierre del Registro de Electoresnoventa (90) días antes del acto de votación, permitiendo la incorporacióna dicho registro de casi dos millones de nuevos electores en las semanasprevias a la votación del 15 de agosto; la reincidencia del cuadro anterioren los comicios regionales y municipales; otorgamiento masivo denacionalizaciones a extranjeros y de tarjetas de identidad a ciudadanos porlos militantes del partido gubernamental y en sitios fuera del control de laOficina Nacional de Identificación y del mismo Poder Electoral; lapublicación y entrega al Gobierno del registro con la identidad y lasdirecciones de quienes solicitaron la revocatoria del mandato al PresidenteChávez, haciéndolos objeto de presiones o negándoles el beneficio de losservicios públicos; la eliminación de miles de votantes de sus respectivosregistros electorales, bajo el falso alegato de que estaban muertos; en fin, eluso escandaloso de los dineros del Estado y de la misma industriapetrolera estatal por parte del Gobierno para financiar su publicidad.II. El fraude cualitativo, fraguado desde el órgano electoral en connivenciacon los funcionarios e instituciones dominadas por Hugo Chávez Frías,constituye una traición al espíritu y razón del dialogo que condujo a lasolución negociada de los Acuerdos de Mayo.III. Se ha constatado la bidireccionalidad de la comunicación, los distintostipos de finalización controlada, las diferencias en patrones de tráfico, lastransmisiones fuera del horario permitido y la utilización de unasmáquinas y un sistema capta-huellas no certificado. Ninguno de estos fueauditado previa ni posteriormente al acto de votación.


IV. Las comunicaciones fueron intervenidas desde diversos centros con elobjeto de modificar el resultado de la voluntad popular. Esos centrosestaban en la sede de varias instituciones de carácter público por lo que sedenota un terrible ventajismo.V. Bajo estas condiciones es imposible participar en cualquier eventoelectoral.VI. El Consejo Nacional Electoral carece de la capacidad, idoneidad eimparcialidad para adelantar cualquier elección. La Sala Constitucional delTribunal Supremo de Justicia es la responsable última de estasirregularidades por haber realizado las designaciones de los rectores y nohaber actuado en virtud de los múltiples señalamientos sobre lasirregularidades y el fraude. Inclusive, este Comité realizó un requerimientopúblico para obtener una audiencia con los integrantes de esa Sala, con elobjeto de llevarles los resultados del informe preliminar, sin haberobtenido oportuna respuesta.


DIRECCIÓN PROFESIONAL Y ACADÉMICA DE LOS EQUIPOS,Coordinador GeneralProfesor Tulio ÁlvarezU.C.V. Y U.C.A.B.Profesor Freddy MalpicaU.S.B.Profesor José Domingo MujicaU.C.V.Coordinador EjecutivoLic. Jorge Casado


En busca del cisne negro:Análisis de la evidencia estadística sobre fraude electoralen <strong>Venezuela</strong> *Ricardo HausmannHarvard UniversityRoberto RigobonMassachussets Institute of TechnologySeptiembre 3, 2004* Este estudio fue solicitado por Súmate quien además nos preparó las bases de datos queutilizamos. Agradecemos el muy importante esfuerzo de recolección de información queesto representó para dicha organización. Igualmente estamos muy en deuda con un asiduocolaborador quien por razones institucionales debe permanecer anónimo. Ademásagradecemos a Andrés Velasco por muy útiles comentarios. Las opiniones emitidas eneste reporte y los errores que hayamos podido cometer son nuestra responsabilidad y nocomprometen ni a Súmate ni a las instituciones universitarias a las que pertenecemos.


AbstractEste estudio analiza diversas hipótesis de fraude electrónico en el ReferéndumRevocatorio realizado en <strong>Venezuela</strong> el 15 de agosto de 2004. Definimos fraude como unadiferencia entre la intención del elector y el registro oficial de los votos. Partimos de lahipótesis de que no hubo fraude e intentamos buscar evidencia que nos permita rechazardicha hipótesis. Rechazamos la hipótesis de que se haya cometido un fraude mediante laaplicación de topes numéricos en las máquinas de algunos centros. Igualmente,rechazamos cualquier hipótesis que implique alterar unas máquinas y no otras a nivel decada centro electoral, pues los patrones de variación entre máquinas a nivel de cadacentro de votación son normales. Sin embargo, la evidencia estadística es compatible conla ocurrencia de un fraude que haya afectado proporcionalmente a todas las máquinas deun mismo centro pero diferencialmente más a unos centros que a otros. Encontramos queel patrón de desviaciones entre centros de votación en la relación entre las firmas delReafirmazo de Noviembre del 2003 y los votos por la opción del Sí el 15 de agosto votosestá positiva y significativamente correlacionado con el patrón de desviaciones en larelación entre exit polls y votos. En otras palabras, en aquellos centros en que, de acuerdoal número de firmantes hay un inusualmente bajo número de votos Sí, es también dondede acuerdo a los exit polls ocurre lo mismo. Utilizando técnicas estadísticas descartamosque esto se deba a errores espúreos en la data o a coeficientes aleatorios en dichasrelaciónes. Interpretamos que ello se debe a que tanto las firmas como los exit polls sonmedidas imperfectas de la intención del elector más no del posible fraude y por lo tanto loque causa su correlación es precisamente la presencia de fraude. Además, encontramosque la muestra utilizada para la auditoría realizada el 18 de agosto no fue aleatoria nirepresentativa del universo de centros. En dicha muestra las firmas del Reafirmazo estánasociadas a 10 por ciento más votos que en los centros no auditados. Construimos 1000muestras aleatorias de los centros no auditados y encontramos que este resultado ocurrecon una frecuencia inferior al 1 por ciento. Este resultado es compatible con la hipótesisde que la muestra para la auditoría fue escogida aleatoriamente pero solo entre aquelloscentros cuyos resultados no habrían sido alterados.2


IntroducciónEste informe presenta los resultados de una evaluación estadística de los resultados delreferendo revocatorio del mandato del Presidente Hugo Chávez Frías, convocado el 15 deagosto de 2004.Desde la madrugada del 16 de agosto, en que el Consejo Nacional Electoral (CNE)anunció los resultados, voceros de la oposición expresaron dudas sobre la validez delresultado y argumentaron que se trataba de un fraude electrónico. Con el pasar del tiempolas dudas no se han despejado y la oposición sigue sin reconocer la victoria de la opcióndel NO en el referendo.En este contexto, Súmate nos solicitó que realizáramos un análisis estadístico paraverificar si la información disponible es compatible con una hipótesis de fraude o si, encambio, rechaza dicha hipótesis. Súmate nos proporcionó los datos utilizados en esteestudio pero nos dio completa autonomía sobre la forma de realizar nuestro trabajo asícomo sobre las conclusiones a las que llegamos.Según fuimos informados, la presunción de fraude se basa en los siguientes elementos:1- Se utilizó un nuevo sistema de votación automatizado, a pesar de que la oposiciónhabía pedido un conteo manual.2- Las máquinas escogidas para el acto de votación emitían unas papeletas que lepermitía a cada elector verificar que la máquina había contabilizado su votoadecuadamente. Sin embargo, el CNE decidió no permitir el conteo de laspapeletas. En vez, decidió solamente hacer una “auditoria en caliente” sobre el 1por ciento de las máquinas. Además, el CNE decidió que los números de las cajasa ser abiertas fueran escogidos por un programa generador de números aleatoriosinstalado en su propio computador.3- Luego de una difícil negociación, el CNE permitió la participación de la OEA y elCentro Carter como observadores en todas las fases del proceso de votación salvoen la sala de totalización en la que el servidor central se comunicaba con loscentros de votación. Tampoco se permitió la participación de ningún testigo de laoposición en dicha sala, cuyo acceso hasta el momento de totalización estuvorestringido a dos personas.4- La tecnología adoptada permitía--de hecho requería--, la comunicación bidireccionalentre los servidores centrales y las máquinas de votación. Talcomunicación bi-direccional ocurrió.5- Contrariamente a lo que estaba estipulado inicialmente, las máquinas de votaciónse comunicaron con sus respectivos servidores antes de imprimir las actas detotalización. Esto abre la posibilidad de que las máquinas fueran instruidas a3


imprimir en las actas de votación un resultado distinto del expresado por loselectores.6- Durante el 15 de agosto, diversas organizaciones, incluyendo Súmate realizaron“exit polls” o encuestas a los votantes al salir estos de los CDVs. Para asegurar sucalidad, la encuesta de Súmate fue realizada con la asistencia de la empresa Penn,Shoen and Berland. La misma arrojó un resultado radicalmente distinto al oficial.Lo mismo ocurrió con el exit poll realizado por Primero Justicia. La base de datosde ambas encuestas fue entregada a nosotros para la realización del presenteestudio.7- La auditoria en caliente realizada en la madrugada del 16 de agosto de 2004 no secumplió a satisfacción de la oposición ni de los observadores internacionales,pues solamente llegaron a contarse 78 de las 192 cajas estipuladas. La oposiciónsolamente asistió a 28 de estos conteos, y los observadores internacionalessolamente estuvieron presentes en menos de 20 de estos conteos.8- A solicitud de los observadores internacionales se realizó una segunda auditoría el18 de agosto. Esta no gozó de la participación de la oposición pues no secumplieron las condiciones que habían exigido, tales como el transporte delmaterial electoral a un lugar central antes de ser escogidas las cajas a ser abiertasy la verificación de que éstas fueran las originales, constatando que en laspapeletas se encontraran las huellas digitales de los votantes. En cambio, las cajasse escogieron 24 horas antes de ser abiertas, lo que en teoría daría tiempo para quefueran alteradas. Además, el CNE insistió en que no se utilizara el programa degeneración de números aleatorios propuesto por el Centro Carter, sino que en vezse usara su propio programa. Esto plantea dudas sobre si la muestra seleccionadaes realmente aleatoria.Todos estos hechos abren la posibilidad de que haya habido un fraude electrónico en elcual las máquinas imprimieron actas con un resultado distinto al real. Esto pudo habersido realizado ya sea mediante alteraciones del software o mediante la comunicaciónelectrónica con el centro de cómputos.En este contexto, Súmate nos pidió que realizáramos un estudio estadístico paraestablecer en que medida los datos son compatibles con estas hipótesis de fraude. Elproblema consiste en encontrar una metodología capaz de identificar manipulaciones dela voluntad del elector que pudieran dejar huellas identificables en la estructura de losvotos y en su relación con otras bases de información.Análisis de los exit pollsLa primera evidencia de potenciales irregularidades en el cómputo proviene de los exitpolls realizados independientemente por Súmate y por Primero Justicia (PJ). Comomuestra el Cuadro 1, de acuerdo al CNE la votación obtenida por el Sí fue del 41.1 por4


ciento. En cambio, el las encuestas de Súmate y de PJ la proyección ponderada fue de62.0 y de 61.6 por ciento respectivamente, una diferencia de más de 20 puntos.En principio, esta diferencia puede deberse a que la muestra escogida por Súmate yPrimero Justicia no era representativa del universo electoral. Es decir, es posible que enlas muestras de centros escogidos haya una sobre-representación de centros a favor del Sicon respecto a los que están a favor del No. Sin embargo, ésta no una parte importante dela explicación de la diferencia. Como muestra el Cuadro 1, según el CNE el porcentajeobtenido por el Sí en los centros encuestados por Súmate fue del 45.0 por ciento,mientras que en la muestra del PJ el resultado fue de 42.7 por ciento. Es decir, en lamuestra escogida por ambas organizaciones, el resultado reportado por ellas difiere deloficial en mas de 17 puntos porcentuales. Por ello, la diferencia en los resultados no sedebió a la composición de la muestra sino más bien a una diferencia sistemática en elpromedio de los centros de votación auditados.Cuadro 1. Comparación entre los reultados electorales y los exit polls de Súmate yPrimero JusticiaUnweighted WeightedPorcentaje del Sí en votos a nivel de centro 37.0% 41.1%Porcentaje del Sí en el exit poll de Súmate 59.5% 62.0%Porcentaje del Sí en los votos de los centros donde Súmate 42.9% 45.0%realizó su exit pollPorcentaje del Sí en el exit poll de PJ 62.6% 61.6%Porcentaje del Sí en los votos de los centros donde PJ realizó 42.9% 42.7%su exit pollPorcentaje del Sí en los exit polls de Sumate+PJ 61.3% 62.2%Porcentaje del Sí en los votos de los centros dondeSúmate+PJ realizaron su exit poll43.10 44.2%Para ilustrar este problema más claramente, en el Gráfico 1 mostramos el porcentaje devotos y los resultados de las encuestas para los 340 centros encuestados por ambosgrupos. Si las encuestas fuera perfectas, los puntos se alinearían en una línea recta de 45grados que pasa por el origen (dibujada en el gráfico). Es decir, donde los votos por el Sison 10 por ciento las encuestas darían el mismo resultado. Esto mismo ocurriría con loscentros que arrojan el 20, el 50, el 80 o el 100 por ciento de votos. Si los puntos delgráfico están por encima de la curva de 45 grados quiere decir que en general la encuestasobre-estima el resultado, centro por centro. Si los puntos están por debajo, las encuestaslo subestiman.Como el grafico muestra claramente, de los 340 centros encuestados, la gran mayoría estápor encima de la recta de 45 grados. Además, el gráfico indica que las diferencias entrelos votos y las encuestas son muy variables entre centros. Las distancias con la recta de45 grados son mayores en los lugares donde el Si sacó entre 20 y 40 por ciento.5


Este análisis tiene las siguientes implicaciones. Primero, indica que la diferencia entre lasencuestas y los votos no se debe en forma importante a problemas de la representatividadde la muestra. Segundo, el análisis implica que la diferencia puede deberse a una de dosrazones o a una combinación de ambas. Puede deberse a una falla generalizada de ambasencuestas en cada uno de los centros de votación, o a una manipulación bastantegeneralizada y no lineal de los resultados. Será parte del reto del trabajo estadísticodistinguir estas dos hipótesis e investigar cuál es la correcta.Gráfico 1. Exit polls vs. Resultado electoral: porcentaje del Si porCentro de Votación0 .2 .4 .6 .8 17270 10101 39071422415096 192711943238511 38481 37901 3815139314 38022 38204100139403416170403731138482388503888419292388723848038682 3873038570921428652 277038091289502943 9113231170 6017130 4900 37360 388903857139204 39400 38790 190705450341153428739420 9550 960028120 37361 37 372 3882042250 5011 018750 3818 035550474902630397033200 50031 23340 5004247590 6903828028761 4076048440762 658111200 14720187513484033141 3351028370 28360443002102550 260 26130 32037821 45150491204560 9890 33190 139225005011160 19940 4849 0 410203358037030 22540 19709920 89408111016012 432 146703664039464 24270 2853040650405104742820550 42370 55160 19000428087101 13860 54301039014153 15630 15680 317236831 1401 7160 91401518091808610 112901955021630 18621 246802841 434610 38910196102408125630316814035043820 41270 496303335042340358404285084020040050028514963 7250170101873017300 67835100 509111895 1414513160174801600 1487316890 11790 17650 18081 27580 3088022270 2229028402831003737535080 29220 55700 29701 44690 38064 4071018560198413171155510 176703559120180 35680 38090 42040 21681 28490 238003786235040 3773039200256604511026062600 830275210961 110702572 17440393103490 259759909410 14147 1489016870 19970 17161 21311 38930 405261992019511 43600176002831142832 48464 5519054510 5250028431 1262 187812933044140 4752014 165 9830 4270 11860 25530 8760 9611 2152 2020 3062 171103322035690 4290855117232 18810 2008022351 3180036020 45130 53790 5550045 960 4056028644 22460 26400 23360 24781 40430 5225051433 335404034041580 5315045170186811700261111911 47470 178014380 3590 137002708011661 22401 1556015600 18420 2815129240 288103021 117701754028210 44147286463037023520 34570 42723 4034146730 5499020170 29700 40480 4038134880 42660 12616 4536043639601 14650 700044241 11230 25610 19600 31720 15960 93301991035293 4010 95001415114011 19842 38950 53410 9850 183104701024304423 0155045190 20041 799026300 116329110344 240 27740 1860213 6520 .2 .4 .6 .8 1SHSI_Vshsi_exlineLa hipótesis de los topesLa hipótesis de fraude más discutida en <strong>Venezuela</strong> ha estado basada en la idea de que sele impuso topes numéricos a la cantidad de votos Si que podían sacarse en un centro yque la diferencia se habría asignado al No. En esta sección evaluamos esta hipótesis.Para analizar la factibilidad de esta hipótesis miramos en la base de datos del CNE quecontiene 19062 cuadernos automatizados cuántas veces el número de votos Sí y de votosNo se repite a nivel de Centro de Votación (CDV).6


Cuadro 2. Número de votos Si y No que se repiten en los cuadernos de unmismo centroVariable | Num. Cuadernos Num Repetidos Frecuencia-------------+--------------------------------------------------------Si | 19062 1875 9.8No | 19062 1472 7.7La repetición del Si ocurre con una frecuencia de 9.8 por ciento mientras que las del Noocurre con una frecuencia del 7.7 por ciento. La frecuencia relativamente alta esexplicable por el hecho de que tanto el número de electores como el porcentaje devotación tienden a parecerse mucho entre los cuadernos de un mismo centro. El primero,porque así se diseñan los cuadernos y el segundo porque en cada centro, los votantes sedistribuyen aleatoriamente por cuaderno. El hecho de que el Si ocurra con una frecuencialigeramente más alta que el No es explicable porque el Si tiene un porcentaje de votosmás bajo. Ilustremos este punto con un ejemplo. Supongamos que la preferencia por el Sien un centro es aproximadamente del 40 por ciento y que el número de votantes en cadacuaderno es 100. Una variación porcentual del 5 por ciento implicaría 2 votos, por lo queel resultado esperado en cada máquina estaría entre 38 y 42. El resultado pudiera estar enalgunos de los 5 números incluídos en ese intervalo. En cambio, la misma variaciónporcentual para el No daría una variación entre 57 y 63 votos, lo cual da 7 númerosposibles. Como la cantidad de números posibles es más alta para el No que para el Si, eslógico que éste se repita con menos frecuencia.Además, la hipótesis de los topes implica que el número que se repite es también elmáximo del centro y que la diferencia se le asigna al No. Para ello, es necesario que elnúmero repetido sea también el máximo del centro de votación. Estudiamos esta hipótesisen el Cuadro 3.Si el número repetido estuviese aleatoriamente distribuído, ocurriría con una frecuenciaigual a 1/(Número de cuadernos – 1). Por ejemplo, en el caso de 2 cuadernos ambosnúmeros repetidos son simultáneamente el máximo y el mínimo, pues hay un solonúmero. En el caso de tres cuadernos, la probabilidad de que el que se repita sea elmáximo es del 50 por ciento. Como vemos en el Cuadro 3, 66 no está muy lejos de ser lamitad de 124. En el caso de 5 cuadernos, 54 no está lejos de ser la cuarta parte de 198.Concluimos que si hubo fraude, éste no se realizó por vía de la imposición de topesnuméricos a los votos Si en las máquinas de un centro de votación.7


Cuadro 3. Números repetidos máximos y no máximos por número de cuadernos en loscentro de votaciónCuadernos No Máximos Máximos TotalPor centro-----------+----------------------+----------2 | 0 64 | 643 | 58 66 | 1244 | 161 80 | 2415 | 144 54 | 1986 | 230 46 | 2767 | 221 46 | 2678 | 197 14 | 2119 | 151 4 | 15510 | 97 8 | 10511 | 85 2 | 8712 | 52 2 | 5413 | 36 0 | 3614 | 18 0 | 1815 | 20 0 | 2016 | 7 0 | 717 | 6 0 | 618 | 6 0 | 6-----------+----------------------+----------Total | 1,489 386 | 1,875Análisis de la varianza de las máquinas de un mismo centroLa hipótesis de los topes, de ser cierta, también afectaría la diferencia en el porcentaje devotos que dan las máquinas de un mismo centro. Esto se debe a que la cantidad devotantes por mesa varía debido a diferencias en la tasa de abstención o en el número deelectores en cada cuaderno electoral. Dicha variación se vería reflejada en el número devotos No y por tanto causaría una variación en el porcentaje que cada opción obtendría enlas distintas máquinas. Esta hipótesis y cualquier hipótesis que se base en la idea dealterar unas máquinas más que otras a nivel del centro de votación (CDV) puede serevaluada analizando la varianza de los resultados entre máquinas de un mismo centro.A nivel de cada CDV, los votantes son distribuidos entre mesas y cuadernos de acuerdo alos dos últimos dígitos del número de su cédula de identidad. Ello hace que cadacuaderno sea una muestra aleatoria de los votantes del centro, pues los últimos dígitos dela cédula de identidad no están correlacionados con ninguna variable relevante a ladecisión de votación. Esto limita quétan distintos pueden ser los resultados de dosmáquinas del mismo centro. Para ilustrar esto, pensemos primero en cómo se hacen lasencuestas de opinión en cualquier país. Se hace una muestra aleatoria –usualmente de1000 o 2000 personas-- y con eso se intenta estimar el resultado para un país de 14millones de electores. Es decir, la estimación se hace con algo así como 2 diezmilécimosde la población total. En el caso de un centro de votación, estamos tomando un universomucho más pequeño y homogéneo que un país y estamos dividiendo la poblaciónaleatoriamente de acuerdo al número de cuadernos en el centro. Por ejemplo, en el casode un centro de 5 cuadernos, cada máquina representa aproximadamente el 20 por ciento8


de la población total del centro. Además, en el caso de esta votación, las opciones selimitaban a dos: Sí o No. Esta estructura impone una condición para el la desviacióntípica del número de votos por máquina. Supongamos que en una máquina voten Npersonas y que la probabilidad de que cada una de ellas vote por el Si sea p. La teoría deprobabilidades exige que la desviación típica sea igual a:Desv.Tipica = p( 1−p)NPara ilustrar esto, tomemos el caso en el que p, la probabilidad de que un elector vote porel Sí en un centro dado, es igual a 50 por ciento y que N sea 400. En este caso, ladesviación típica será de 10 votos. La desviación típica será de 10 dividido por 400, esdecir, del 2.5 por ciento. Dado esto, la desviación típica entre máquinas de un mismocentro debe ser compatible con esta regla.Si por ejemplo, dentro de un mismo centro se cambiaran los resultados de unas máquinasen 10 por ciento mientras que las otras se dejaran inalteradas, entonces veríamos unaumento en la desviación entre máquinas que sería incompatible con la ley de ladistribución binomial. Y, como dijimos anteriormente, si se le fijaran topes numéricos atodas las máquinas de un centro, las variaciones del número de votantes por cuadernoafectaría el número de votos del No y por tanto alteraría el porcentaje de votos SI demanera distinta en cada máquina, por lo que veríamos una desviación excesiva a nivel decentro.Para verificar si la data de votos del CNE cumple con la desviación típica que predice lateoría de las probabilidades, calculamos la desviación de cada máquina con respecto alpromedio porcentual de su centro de votación. Además, dividimos este número por ladesviación típica que le correspondería a un centro de con ese número de votantes y demáquinas. El gráfico 2 sintetiza nuestros resultados. Muestra un histograma defrecuencias de la diferencia porcentual del SI entre máquinas de un mismo centro conrespecto a la desviación típica que deberíamos observar. La curva refleja la distribuciónteórica. Las barras son las frecuencias calculadas en la data del CNE. Como se verá, hayuna coincidencia muy grande entre la curva y las barras. El gráfico indica que sóloalrededor del 1 por ciento de los cuadernos tienen una desviación mayor que 2 veces ladesviación típica que les corresponde, tal como predice la teoría. De hecho, si algosorprende del gráfico es la gran concentración de resultados alrededor de variacionesporcentuales cercanas al cero.Este resultado tiene dos interpretaciones posibles. Una es que no hubo fraude. La otra esque si el fraude se cometió, éste debió haberse hecho cambiando todas las máquinas deun mismo centro en un porcentaje similar. De hecho, un fraude de este tipo no seríadetectado con el análisis hecho hasta el momento pues no alteraría la varianza de losresultados entre máquinas. Cualquier hipótesis de fraude que no cumpla con estacondición violaría la regla de la varianza de la distribución binomial.9


Gráfico 2. Distribución de las desviaciones típicas porcentuales por cuadernos de cadacentro de votación con respecto a su desviación teórica.Density0 .2 .4 .6 .8-10 -5 0 5 10ttestUna estrategia para detectar estadísticamente la presencia de fraudePara detectar si los datos existentes son compatibles con la existencia de fraudenecesitamos desarrollar un método estadístico adecuado. Definimos fraude como ladiferencia entre la intención del votante y lo que registra el sistema electoral comoresultado de su decisión.(1) Votos = Intención – Fraude = I - FEl problema es que no podemos observar directamente la intención del elector. Laestrategia estadística que adoptamos parte por encontrar dos conjuntos de variablesindependientes que estén correlacionadas con la intención de voto, más no así con elfraude. Para nuestros efectos, no es demasiado importante que nuestras variables nopredigan la intención de voto perfectamente. Aunque lo hagan imperfectamente y conaleatoriedad, nos permiten en principio rechazar o no la hipótesis de que hubo fraude.Para ilustrar lo que hacemos, conviene realizar una primera explicación simplificada delmétodo adoptado. En la práctica, hacemos las cosas con un nivel más grande de10


complejidad, pero este será más fácil de comprender si lo ilustramos primero con un casosimplificado.Tomemos dos variables que están correlacionadas con la intención del elector: las firmasdel reafirmazo realizado en Noviembre-Diciembre del 2003 y los exit polls. Cada una deestas variables es una medida imperfecta de lo que pudo haber sido la intención delelector el 15 de agosto del 2003. Alguna gente que firmó pudo haber cambiado deopinión. Otros decidieron no firmar pues se trataba de un acto público, pero si estabandispuestos a votar Sí en agosto pues el voto es secreto. Otros no estaban inscritos en elRegistro Electoral Permanente (REP) para noviembre, pero si lo estuvieron para agosto.Las colas en la elección de agosto fueron particularmente largas y lentas y eso pudo haberlimitado la capacidad de algunas personas de expresarse electoralmente, etc.Igualmente, los exit polls son una medida imperfecta de la intención de voto. Losencuestadores pudieron haber consciente o inconscientemente escogido una muestrasesgada. La gente pudo haber tenido más o menos intención de cooperar con la entrevista,etc. Lo importante es que ambas medidas deben estar correlacionadas con la intención delvotante más no así con el fraude.Supongamos por un instante que tuviésemos una medida perfecta de la intención de votosdel elector en cada centro de votación y construyésemos un gráfico de nuestra variable,por ejemplo las firmas, y de dicha intención. Como las firmas son una medida imperfectade la intención de votos, el gráfico se verá como una nube de puntos (gráfico 3a). Estegráfico fue construido con datos simulados usando un generador de números aleatorios.Los datos fueron creados suponiendo que cada firma genera 0.7 votos con un errornormalmente distribuído entre + 0.1 y -0.1. Con una técnica denominada análisis deregresión podemos derivar la línea que relaciona las firmas con la intención de votos. Larelación real es 1, pues así construimos los datos. Con el análisis de regresión lo quepodemos calcular es que la relación estimada es 0.71 más o menos un intervalo deconfianza de 0.014, como lo indica el gráfico.11


Gráfico 3a Relación simulada entre firmas e intención de voto.e( int_vote | X )-.4 -.2 0 .2 .4 .6-.5 0 .5e( firma | X )coef = .71490196, se = .01417772, t = 50.42Ahora bien, nosotros no observamos la verdadera intención del elector sino los votosregistrados y estos, en teoría, pueden estar influidos por el fraude. Supongamos que serealiza un fraude que es directamente proporcional al número de votos en ese centro. Porejemplo, supongamos que el fraude implica multiplicar el total de votos Si en unamáquina por un número menor que 1, digamos 0.7. Esto es equivalente a quitarle 30 porciento de votos Sí. El gráfico 3b muestra las consecuencias de esto.Ahora la pendiente estimada ya no es 0.7 sino 0.5, pero el patrón de errores --es decir, ladistancia con respecto a la línea marcada--, no muestra ninguna anomalía. Si así fuesecomo se cometió el fraude, no podríamos detectarlo con nuestro método. De hecho, unfraude que rebaje un porcentaje fijo a todas las máquinas por igual sería prácticamenteimposible de detectar por métodos puramente estadísticos. Se requeriría de una auditoríade las papeletas u otra fuente información.12


Gráfico 3b Relación simulada entre firmas y votos con fraude proporcional del 30 porciento de los votos Sí.e( vote0 | X )-.4 -.2 0 .2 .4-.5 0 .5e( firma | X )coef = .50043138, se = .0099244, t = 50.42Supóngase entonces que el fraude no fue realizado de manera directamente proporcionala los votos sino que se hizo en algunos centros y no en otros, o que se hizo más en unosque en otros. En particular, suponemos para ilustrar el caso, que el fraude consiste eneliminar el 30 por ciento de los votos Sí en centros en los que las firmas fueron inferioresal 30 por ciento de los electores o superiores al 70 por ciento. En ese caso, al observar lasdesviaciones entre la línea de regresión y los puntos en el gráfico se ve una anomalía. Ala hora de predecir los votos los errores que cometen las firmas se debe no sólo a suimperfección sino también al fraude. (gráfico 3c).13


Gráfico 3c. Regresión con fraude no proporcional: resta 30 por ciento cuando las firmasson inferiores a 0.3 o superiores a 0.7.e( vote1 | X )-.4 -.2 0 .2 .4 .6-.5 0 .5e( firma | X )coef = .57435291, se = .01600038, t = 35.9¿Que pasa si utilizamos ahora una segunda medida de la intención del elector, porejemplo los exit polls? Esta también es una medida imperfecta de la intención de voto ypor lo tanto al hacer un análisis de regresión, este va a generar algunos errores. Sinembargo, si hay un fraude no proporcional, este también va a generar una anomalía en eltérmino de error, es decir en la desviación entre el dato real y la línea de regresión.Nótese que cada medida – firmas y exit polls – son imperfectas. Sin embargo, lo que haceque cada una de ellas sea imperfecta son factores distintos e independientes entre si. Elexit poll no es afectado por la tasa de abstención, pues se entrevista a la gente después devotar. Las firmas no dependen de la pericia o sesgos del entrevistador. La gente pudohaber cambiado de opinión entre noviembre y agosto, pero no hay la misma razón paraque la gente cambie de opinión entre el acto de votación y la entrevista a la salida. Lafirma es un acto público y el voto es secreto, etc. Por lo tanto, los errores que cometecada medida pueden ser más o menos grandes pero no deben estar correlacionados. Sinembargo, si hay un fraude no proporcional, este afectará de la misma manera a cada unade las medidas. Por ello, los errores que éstas cometen debieran estar positivamentecorrelacionados.Esta es la esencia del procedimiento que utilizamos. Corremos una regresión entre votosy firmas (más otras variables que entraremos a describir próximamente. Es decir,calculamos la mejor línea que pasa por la nube de puntos ente votos y las variablesexplicativas que usamos en semejanza al gráfico 3. Luego recuperamos los errores que14


comete dicha regresión o línea. Hacemos lo propio con la relación entre votos y exit pollsy recuperamos esos errores. Luego, estudiamos si estos dos conjuntos de errores estánpositivamente relacionados 1 .En la práctica hacemos las cosas de manera un poco más compleja. Incluimos en elanálisis otras variables que también afectan el número de votos. Estas son el número denuevos votantes y la tasa de abstención electoral en cada centro de votación. Los nuevosvotantes no pudieron participar en el Reafirmazo pues no estaban inscritos en el REP.Mientras más nuevos votantes haya, mayor número de votos debieran haber. Ahora bien,el porcentaje de votos Si pudiese aumentar o disminuir dependiendo de la diferencia enpreferencias políticas de los nuevos votantes con respecto a los inscritos con anterioridad.La tasa de abstención obviamente disminuye el número de votos y, al igual que en el casoanterior, lo puede hacer de manera diferenciada entre la opción del Si o del No.Además, debemos decidir qué tipo de línea usar en la regresión. Tenemos variasopciones. Podemos usar una línea recta, una relación geométrica o una relación entreporcentajes. Es decir podemos relacionar votos con firmas (lineal), el logaritmo de losvotos con el logaritmo de las firmas (geométrica) o el porcentaje de votos Si con elporcentaje de firmas sobre electores. Por razones técnicas, preferimos la formalogarítmica 2 , sin embargo realizamos el análisis de las tres maneras para ver si nuestrosresultados dependen de la forma funcional que adoptamos.Un ejemplo de las estimaciones realizadas utilizando la forma logarítmica se presenta enel Cuadro 4. La ecuación estimada es:LSI = a + b * LFIRMA + c * elc_now + d VEL + errordonde LSI es el logaritmo del número de votos SI, LFIRMA es el logaritmo del númerode firmas en cada centro, elc_now es el porcentaje de nuevos votantes VEL es elporcentaje de participación electoral, y donde a, b, c y d son parámetros a ser estimados.El cuadro 4 muestra los resultados de nuestra estimación para los 342 centros para losque también tenemos exit polls, utilizando como método el más convencional : losmínimos cuadrados.1 Se define como error o desviación la diferencia entre el valor de la línea de regresión en un cierto punto yel valor de la observación que le corresponde. Gráficamente, es la distancia vertical entre los puntos en losgraficos 3a, 3b y 3c y la línea de regresión dibujada.2 Dado que los centros de votación son de tamaños muy distintos la forma lineal genera problemas deheterosqueedasticidad (es decir los errores absolutos tienden a ser mas grandes en los centros más grandeslo que implica que no están normalmente distribuidos).15


Cuadro 4. Estimación de la ecuación entre votos y firmas, electores nuevos yparticipación electoralSource | SS df MS Number of obs = 342-------------+------------------------------ F( 3, 338) = 3582.70Model | 185.800888 3 61.9336295 Prob > F = 0.0000Residual | 5.84296339 338 .017286874 R-squared = 0.9695-------------+------------------------------ Adj R-squared = 0.9692Total | 191.643852 341 .56200543 Root MSE = .13148------------------------------------------------------------------------------LSI | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------LFIRMA | .9942821 .0099034 100.40 0.000 .974802 1.013762elc_now | .4604462 .0375 12.28 0.000 .3866834 .5342089VEL | .3311808 .0813913 4.07 0.000 .1710835 .4912781_cons | .3059669 .0782436 3.91 0.000 .1520611 .4598727------------------------------------------------------------------------------La estimación permite explicar el 97 por ciento de la varianza de los votos entre centros.Estima los parámetros a, b, c y d con gran precisión. En particular, a es la constante,estimada en 0.306. El parámetro b es la elasticidad entre firmas y votos y está estimadoen casi 1 (en realidad es 0.994). Ello implica que si un centro tiene el doble de firmas queotro centro, obtiene en promedio el doble de votos. El parámetro c es la elasticidad de losvotos Si ante variaciones del porcentaje de nuevos electores. Está estimado en 0.46, loque significa que si en un centro aumentase el número de electores en 100 por ciento, losvotos por el Si aumentarían en 46 por ciento. El parámetro d es la elasticidad del númerode votos Si frente a cambios en la tasa de participación y está estimado en 0.306, lo queindica que un aumento de la tasa de participación electoral en 10 por ciento causaría unaumento del número de votos Si en 3.06 por ciento.Esta ecuación no indica la relación real entre intención de votos y sus variablesexplicativas, sino entre estas últimas y los votos reconocidos por el CNE. Al igual que enel Gráfico 3b, la posible presencia de fraude afecta los coeficientes estimados, sesgandolas pendientes hacia la baja, y en parte se encuentra en el término de error.La segunda ecuación que estimamos es la relación entre votos y exit polls también paralos 342 centros para los que tenemos datos de éstos. La ecuación que estimamos es:LSI = f + g*lex_si + h*VEL + j + errorDonde lex_si es el número de votos Si que predice la encuesta para ese centro. Las letrasf, g, h y j son parámetros mientras que LSI y VEL ya han sido definidos. Los resultadosaparecen en el Cuadro 5.16


Cuadro 5. Estimación de la relación entre votos y las encuestas de salida (exit polls)Source | SS df MS Number of obs = 342-------------+------------------------------ F( 3, 338) = 526.51Model | 157.862978 3 52.6209927 Prob > F = 0.0000Residual | 33.7808737 338 .099943413 R-squared = 0.8237-------------+------------------------------ Adj R-squared = 0.8222Total | 191.643852 341 .56200543 Root MSE = .31614------------------------------------------------------------------------------LSI | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------lex_si | .9701892 .025357 38.26 0.000 .9203118 1.020067elc_now | -.6612884 .0868377 -7.62 0.000 -.8320987 -.490478VEL | .4244489 .1957766 2.17 0.031 .0393549 .8095429_cons | .0722736 .2086177 0.35 0.729 -.3380789 .4826261------------------------------------------------------------------------------De nuevo, la ecuación explica gran parte de la varianza del logaritmo de los votos (82por ciento). La elasticidad estimada de las intenciones de acuerdo a las encuestas con losvotos es de 0.97.Estas estimaciones también estarían sesgados a la baja por la presencia de fraude. Sinembargo, el término de error reflejaría en parte no sólo la imperfección de losinstrumentos utilizados sino también la posible presencia de fraude.La estrategia entonces es analizar la correlación entre los errores de ambas ecuaciones.Dicha correlación es de 24 por ciento, la cual es sorprendentemente alta. Esto nos impiderechazar la hipótesis de fraude. Dicho de otro modo, en aquellos sitios en los que lasfirmas se equivocan proporcionalmente más en el sentido de predecir más votos Si quelos obtenidos, las encuestas de salida también sobre-estiman relativamente más los votosalcanzados. Dado que ambas medidas son independientes, la implicación es que lo quetienen en común es el fraude.Cuadro 6 Análisis de la relación entre los errores de las ecuaciones usando mínimoscuadradosCovarianza 9.3 * 10 -3Desvío típico de la covarianza 2.8 * 10 -3T-Student sobre la covarianza 4.1Probabilidad distinto de cero 0.999Correlación 0.24Este es nuestro primer resultado consistente con la hipótesis de fraude. Formalmente,podemos decir que no podemos rechazar la hipótesis de que se realizó fraude. Lapresencia de esta correlación indica que hay algo en común entre los errores cometidospor el exit poll y los errores cometidos por las firmas y esto es consistente con unadiferencia entre la intención de voto del elector y los votos registrados.17


Sin embargo, es posible argumentar que la correlación que observamos pudiera estargenerada por dos fuentes. Una es el hecho de que nuestras medidas de la intención delelector son muy ruidosas o imperfectas y los errores en dichas variables pudieran generarproblemas. El segundo es que estamos suponiendo coeficientes fijos entre firmas y votoso entre exit polls y votos y estos coeficientes pudiesen ser aleatorios. Esto abre laposibilidad de que la correlación que estamos encontrando haya sido generada por otrosfactores y no por el fraude.Para descartar esta posibilidad, aplicamos una técnica estadística denominada “Variablesinstrumentales”. La idea es que tanto las firmas como el exit poll tienen errores o ruido.Sin embargo, este ruido es independiente el uno del otro. Lo que tienen en común lasvariables es que ambas están relacionadas con la intención del elector. La técnica partepor usar en la regresión no las firmas directamente sino aquel componente de éstas queestá relacionado o en línea con los exit polls. En la jerga estadística diríamos que usamosa los exit polls como instrumento para corregir o limpiar los errores en las firmas antes deestudiar su correlación con los votos. Simétricamente, usamos las firmas para limpiar losexit polls antes de relacionarlos con los votos. Después de haber hecho estas dosregresiones con variables instrumentales, tomamos los errores de cada una de ellas yestudiamos su correlación. Si los errores están correlacionados positivamente nopodemos rechazar la hipótesis de que hubo fraude. La justificación teórica de estametodología para el análisis de fraude que estamos realizando es discutida en detalle en laversión técnica de este documento.El Cuadro 7 presenta la misma ecuación que el Cuadro 4 pero esta vez utiliza el métodode variables instrumentales, usando exit polls como instrumento.Cuadro 7. Regresión entre votos y firmas con exit polls como variable instrumentalInstrumental variables (2SLS) regressionSource | SS df MS Number of obs = 342-------------+------------------------------ F( 3, 338) = 3013.34Model | 185.741458 3 61.9138192 Prob > F = 0.0000Residual | 5.90239422 338 .017462705 R-squared = 0.9692-------------+------------------------------ Adj R-squared = 0.9689Total | 191.643852 341 .56200543 Root MSE = .13215------------------------------------------------------------------------------LSI | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------LFIRMA | 1.012645 .0110631 91.53 0.000 .9908834 1.034406elc_now | .4792798 .0380142 12.61 0.000 .4045055 .5540541VEL | .3067645 .0820558 3.74 0.000 .1453602 .4681688_cons | .1718993 .0861817 1.99 0.047 .0023791 .3414194------------------------------------------------------------------------------Instrumented:LFIRMAInstruments: elc_now VEL lex_si------------------------------------------------------------------------------18


Nótese que ahora el coeficiente de firmas aumenta ligeramente: de 0.994 en la estimacióndel Cuadro 4 a 1.013 en el Cuadro 7. Esto es usual, pues la existencia de errores o ruidoen los datos tiende a reducir los coeficientes estimados con el método del Cuadro 4. Allimpiar o reducir el problema de errores en los datos se obtienen usualmente coeficientesmás elevados.El Cuadro 8 re-estima la misma ecuación que el Cuadro 5 pero usando variablesinstrumentales. En esta oportunidad, el coeficiente del exit poll (lex_si) aumenta de 0.97a 1.17. Esto es de esperarse pues los datos de los exit polls, dada su naturaleza, tienenmás ruido que la data de firmas y por tanto el método del Cuadro 5 sesga el coeficientemás hacia la baja que en el caso de las firmas.Cuadro 8. Regresión entre votos y exit polls usando firmas como variable instrumentalInstrumental variables (2SLS) regressionSource | SS df MS Number of obs = 342-------------+------------------------------ F( 3, 338) = 517.96Model | 151.228444 3 50.4094815 Prob > F = 0.0000Residual | 40.4154074 338 .119572211 R-squared = 0.7891-------------+------------------------------ Adj R-squared = 0.7872Total | 191.643852 341 .56200543 Root MSE = .34579------------------------------------------------------------------------------LSI | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------lex_si | 1.176787 .030827 38.17 0.000 1.11615 1.237424elc_now | -.6829967 .0949936 -7.19 0.000 -.8698498 -.4961437VEL | .1627794 .2148175 0.76 0.449 -.2597683 .5853271_cons | -1.523351 .250735 -6.08 0.000 -2.016549 -1.030153------------------------------------------------------------------------------Instrumented:lex_siInstruments: elc_now VEL LFIRMA------------------------------------------------------------------------------Al estudiar la relación entre los errores de las variables generados por estas dosecuaciones obtenemos los datos presentados en el Cuadro 9. El análisis indica que aúndespués de usar el método de variables instrumentales para corregir problemas de erroresen las variables y de coeficientes aleatorios, la correlación entre los errores generadosusando firmas y aquellos generados usando los exit polls disminuye sólo de 0.24 a 0.17 yse mantiene muy significativamente distinto de cero.Cuadro 9 Análisis de la relación entre los errores de las 2 ecuaciones usadas para estimarel número de votos: Mínimos cuadrados vs. Variable InstrumentalesConcepto Método mínimos cuadrados Método Variables Instr.Covarianza 9.3 * 10 -3 7.7 * 10 -3Desvío típico 2.8 * 10 -3 2.5 * 10 -3Probabilidad distinto de cero 0.999 0.991Correlación 0.24 0.17T-Student sobre la covarianza 4.1 3.119


Nuestra hipótesis inicial era que si hubiese un fraude no perfectamente proporcional, estegeneraría un patrón de errores que causaría una correlación positiva entre ambasvariables. Encontramos dicha correlación positiva, lo que nos permite rechazar lahipótesis de que no hubo fraude. Los exit polls, a pesar de sus imperfecciones, tienden aequivocarse más en aquellos mismos sitios donde las firmas también se equivocan. Alutilizar el método de variables instrumentales hemos descartado de que la correlación sedeba a problemas de errores en las variables o a coeficientes aleatorios. Este es el tipo dehuella que dejaría un fraude no perfectamente proporcional.Nuestra estrategia ha consistido en utilizar dos fuentes de información relacionadas a laintención de voto del elector pero no al posible fraude. Si usamos estas fuentes ovariables para estimar imperfectamente los votos, el residuo o término de error contendráno sólo las imperfecciones de nuestras fuentes de información sino también uncomponente asociado al fraude. Nuestra interpretación es que como las imperfeccionesson independientes unas de otras y los residuos están correlacionados, ello se debe a lapresencia del factor que tienen en común, es decir, el fraude.La auditoríaCualquier hipótesis de fraude necesita explicar cómo ocurrieron las auditorías y qué tancompatibles son los resultados de las auditorías con la existencia de fraude. En particular,debe tomar en cuenta los resultados de la segunda auditoría, realizada a solicitud y con laparticipación plena de los principales observadores internacionales, es decir, el CentroCarter y la OEA. La auditoría se basó en abrir 150 cajas, escogidas en principioaleatoriamente, las cuales supuestamente contienen las papeletas originales chequeadaspor los votantes y por lo tanto reflejan su verdadera intención de voto. Si estas cajas nofueron violadas y si son realmente una muestra aleatoria del universo al quecorresponden, la auditoría sería una prueba muy significativa en contra de la hipótesis defraude. Por ello, es importante preguntarse como se pudo hacer un fraude, dado que serealizó esta auditoría. Es bueno destacar que cualquier hipótesis de fraude que involucrecambiar cientos de cajas implica una conspiración mucho más grande en términos delnúmero de personas involucradas, lo que la haría más vulnerable a la delación.Una hipótesis es que el fraude no se realizó en todos los centros sino sólo en un subconjuntode ellos. Para ejemplificar, supongamos que de los 4580 centros automatizadosen nuestra base de datos, se alteraron los resultados en 3000 centros y no en los demás.Supongamos además que los 1580 centros no alterados fueron escogidos aleatoriamente.Ello implica que representarían una muestra balanceada del país desde el punto de vistaregional y social. Lo mismo sería cierto de los 3000 centros cuyos resultados habrían sidoalterados. Una motivación para hacer esto sería que se sabía que se realizarían auditoríasex post y que debían dejar un número de centros sin alterar para poder realizar lasauditorías.20


Nótese que si se alteran unos centros y no otros, el fraude no es perfectamenteproporcional, por lo que al realizar un análisis como el de la sección anterior se hubieseencontrado la correlación positiva de los errores, la cual obtuvimos.Si la elección de los centros a no ser alterados se hizo de esta manera, esto crea unacomplicación importante pero también abre una gran oportunidad. La complicación esque la elección de las cajas a ser auditadas no podría ser realmente aleatoria. Es críticoque la elección se hiciese entre los 1580 centros sin modificaciones y no entre los 3000centros alterados. Ello solo es posible si se tiene control sobre el programa de selecciónaleatoria de las cajas a ser auditadas. En este sentido cabe destacar que el CNE se negó autilizar el programa de generación de números aleatorios propuesto por el Centro Carter einsistió que se utilizara el programa propuesto por ellos e instalado en su computador.La oportunidad que genera esta forma de resolver el problema de la auditoría es quecualquier muestra que se tome sobre los 1580 centros no alterados será una muestrarepresentativa del país en el sentido social o regional. Esto hace más difícil saber si lamuestra escogida fue realmente aleatoria, pues se asemejará al país en todas lasdimensiones usualmente asociadas con representatividad, tales como la regional o lasocial.Para resolver este problema debemos desarrollar una metodología que nos permitaexaminar si efectivamente la muestra escogida para la auditoría del 18 de agosto es unamuestra aleatoria. Para entender el problema más claramente, llamemos a los centros noalterados gordos y a los alterados, flacos. La muestra escogida para la auditoría debe seruna muestra de puros centros flacos, mientras que el resto de los centros son una mezclade gordos y flacos. Si pudiésemos “pesar” los centros auditados, podríamos ver que enpromedio son más gordos que los centros no auditados.El problema es que necesitamos desarrollar una metodología que pueda examinar siefectivamente los centros de la autoría pesan como los otros o si por el contrario tienenuna contextura estadísticamente distinta.La forma que proponemos es la siguiente. Existe un teorema en estadística que dice quesi una relación se aplica al conjunto completo, cualquier muestra aleatoria de éste debetener las mismas propiedades. Si estimamos una relación para el universo de centros noauditados y estimamos otra para los centros auditados, la segunda no puede serestadísticamente diferente de la primera. De otra forma, no sería una muestra aleatoria yrepresentativa.Para implementar esta estrategia utilizamos nuevamente nuestro modelo que relacionafirmas, tasa de participación electoral y nuevos votantes con el número de votos.Estimamos esta relación sobre el universo de 4580 centros y miramos los coeficientesobtenidos. Luego los estimamos separadamente entre los centros auditados y los noauditados y miramos si los coeficientes son estadísticamente distintos.21


Para ver si los resultados son distintos y calcular la significación estadística de ladiferencia, es útil estimar las ecuaciones de la siguiente forma:Votos = a + b * (vector de variables explicativas) +c * d * (vector de variables explicativas)donde a, b y c son parámetros a ser estimados y d es una variable “dummy” que vale 1 sise trata de centros que fueron auditadas y 0 si se trata de centros que no fueron auditados.Las cajas pertenecen a la misma distribución aleatoria si los parámetros c no son distintosde cero. Las variables explicativas que usamos son el número de firmas, el número deelectores inscritos en el REP para el momento del Reafirmazo, el número de nuevoselectores (inscritos con posterioridad al Reafirmazo) y el número de electores que novotaron. Estimamos la ecuación en logaritmos.Los resultados son muy claros, tal como lo indica el Cuadro 10. El término de interacciónD * Firmas indica que la elasticidad de las firmas en votos es 10.5 por ciento más alta enlos centros auditados que en los no auditados. Es decir, las firmas recolectadas en loscentros auditados el 18 de agosto generan 10 por ciento más votos Sí que en el resto delos centros. El valor del estadístico de la t de Student es de 2.73. La probabilidad queesto sea por casualidad es menor al 1 por ciento (indicado por los 3 asteriscos en elCuadro). El coeficiente sobre nuevos electores también es distinto con un nivel deconfianza del 1 por ciento mientras que el coeficiente respecto de los electores novotantes es distinto con un nivel de confianza del 10 por ciento.Para ilustrar lo inusual de este resultado construimos 1000 muestras aleatorias de 200centros a partir del universo de centros no auditados. Estimamos la misma ecuación ycalculamos el estadístico de t de Student para el término D * Firmas. El resultado seencuentra en el Cuadro 11. Como el Cuadro indica, un valor de dicho estadístico superiora 2.48 ocurre menos del 1 por ciento de las veces. En la muestra de la auditoría del 18 deagosto dicho valor es 2.73.22


Cuadro 10. ¿Son los centros auditados representativos del universo de centros?Log SILog FIRMA 0.958(129.46)***D * LFIRMA 0.105(2.73)***Log Electores Reafirmazo 0.043(4.89)***D * Log Electores Reafirmazo -0.126(3.06)***Log Electores Nuevos 0.595(23.64)***D * Log Electores Nuevos 0.118(1.30)Log Electores no votantes -0.459(11.47)***D * Log Electores no votantes 0.312(1.89)*AUDIT 0.171(1.51)Constant 0.254(9.14)***Observations 4580R-squared 0.97Robust t statistics in parentheses* significativo al 10%; ** significativo al 5%; *** significativo al 1%Cuadro 11. Distribución de frecuencias del valor del estadístico de t de Student sobre elparámetro de firmas en 1000 regresiones estimadas en base a 1000 muestras extraídasaleatoriamente del universo de centros no auditados.-------------------------------------------------------------Percentiles Smallest1% -2.60853 -3.3427945% -1.832646 -3.23344110% -1.425525 -3.053542 Obs 100025% -.8046502 -3.053519 Sum of Wgt. 100050% -.0189599 Mean -.0191664Largest Std. Dev. 1.10431475% .7440667 3.23263990% 1.360018 3.658616 Variance 1.21950995% 1.770322 3.975739 Skewness .074719999% 2.48632 4.010863 Kurtosis 3.04989223


Concluimos que los datos indican que los centros auditados son estadísticamente distintosde los centros no auditados. Ello implica que no constituyen una muestra aleatoria delconjunto de centros. En dichos centros, las firmas se transforman en un número mayor devotos que en la totalidad de los centros. La probabilidad que esto sea una coincidencia esmenor al 1 por ciento. Este resultado tiende a confirmar las dudas planteadas respecto a laconfiabilidad de la auditoría.ConclusionesEste informe rechaza ciertas hipótesis de fraude pero no otras. No encontramos validezempírica para la muy discutida hipótesis de los topes numéricos. Tampoco encontramossustento a cualquier hipótesis que implique alterar de manera diferencial las máquinas deun mismo centro. Una manipulación de este tipo alteraría las diferencias porcentuales enforma tal que hubiese violado la varianza esperada a nivel de centro y hubiese sidodetectado por este análisis.Toda hipótesis de fraude debe suponer una alteración similar en todas las máquinas de unmismo centro. Si esto hubiese sido realizado de manera homogénea en todos los centrosde votación del país, los métodos utilizados en este estudio --y de hecho, probablementeninguno de los métodos estadísticos--, podrían identificarlo. Lo que permite encontraruna prueba para examinar la posible existencia de fraude es precisamente el tratamientoheterogéneo de los distintos centros de votación.Para realizar esta prueba utilizamos dos indicadores imperfectos, aleatorios eindependientes de la intención de voto. Nuestra definición de fraude consiste en laexistencia de una diferencia entre la intención de voto del elector y los votos registradospor el CNE. Nuestros dos indicadores, por más imperfectos que sean, estáncorrelacionados con la intención del elector, pero no con el fraude. Si estos se utilizanindependientemente en sendas regresiones para estimar la relación entre estos y losvotos, el término de error o desviación reflejará no solo la imperfección del instrumentosino también el fraude. Si las dos desviaciones están correlacionadas, esto indica que hayun elemento común de desviación en ambas. Este elemento sería el fraude. Además, paraser consistente con la hipótesis de fraude, esta correlación debe ser positiva. En loscentros donde un indicador proyecta equivocadamente más votos el otro también lo hace:ello indicaría que allí la incidencia de fraude es más alta.Esto es precisamente lo que encontramos. Nuestros dos indicadores son el número depersonas registradas en cada centro de votación que firmaron en el Reafirmazo denoviembre de 2003 y los exit polls realizados el 15 de agosto de 2004, día delReferéndum Revocatorio por Súmate y Primero Justicia. El resultado se mantiene sicontrolamos por los cambios en el registro electoral y en la tasa de participación.Además, el resultado es robusto a cambios en la forma funcional de la relación (lineal,logarítmica, porcentual). El resultado no se debe a efectos estadísticos espúreos (erroresen las variables o la posible presencia de coeficientes aleatorios), pues se mantienencuando corregimos por estos usando estimadores basados en variables instrumentales.24


Como dijéramos anteriormente, cualquier hipótesis de fraude debe suponer que sealteraron en forma proporcional los resultados de todas las máquinas de un mismo centro.Esto supone necesariamente algún mecanismo de coordinación. En teoría este pudieraestar en el software o en la comunicación con el Centro de Totalización. Por estas razoneses útil destacar los siguientes antecedentes:• Las máquinas tenían la capacidad de comunicarse bi-direccionalmente con elCentro de Totalización y esta comunicación ocurrió.• Las máquinas se comunicaron con el Centro de Totalización antes de imprimir lasactas con los resultados, lo que abre la posibilidad de que hayan sido instruidas aimprimir resultados distintos de los reales• No se permitió la entrada a testigos de la oposición o de los observadoresinternacionales en el Centro de Totalización durante la jornada electoralEl sistema de votación adoptado en <strong>Venezuela</strong> genera unas papeletas que son chequeadaspor el votante y colocadas en cajas, las cuales están sujetas a ser auditadas de maneraaleatoria. Un esquema de fraude debe contemplar como evitar la detección por la vía dela auditoría.Una posibilidad es que los centros a ser alterados se escojan aleatoriamente. Ello generados tipos de centros de votación: aquellos que fueron alterados y los que no lo fueron.Salvo por este aspecto, cada grupo constituye una muestra representativa del país entérminos regionales y sociales y por lo tanto, cada sub-muestra de estos también será unamuestra representativa, salvo por el hecho de que unas fueron alteradas y otras no. Ahorabien, si se tiene control del programa que selecciona las cajas a ser abiertas en un procesode auditoría, este puede escoger de manera aleatoria las cajas de aquellos centros que nofueron alterados y dicha muestra parecerá aleatoria en todos los aspectos salvo en lo quese refiere al fraude. En este sentido, cabe destacar como antecedente que el CNE se negóa utilizar el programa generador de números aleatorios ofrecido por el Centro Carter parala auditoría del 18 de agosto y en vez se utilizó el programa del CNE instalado en supropio computador.Nuestro análisis indica que la muestra seleccionada para realizar la auditoría del 18 deagosto de 2004 no es aleatoria y representativa del conjunto de centros de votación. Endicha muestra, la elasticidad de las firmas frente a los votos es 10 por ciento más alta y laposibilidad de que esto sea aleatorio es significativamente menor al 1 por ciento.Repetimos nuestro análisis escogiendo aleatoriamente 1000 muestras de centros noauditados y este resultado ocurre en menos del 1 por ciento ellas.En conclusión, este estudio rechaza ciertas hipótesis de fraude, pero indica otras que soncompatibles con los datos estadísticos.En estadística es imposible confirmar una hipótesis, pero si es posible rechazarla. Comodijera Karl Popper, el observar 1000 cisnes blancos no demuestra la veracidad de la tesisde que todos los cisnes son blancos. Sin embargo, observar un cisne negro si permite25


echazarla. Parafraseando a Popper, nuestro cisne blanco es que no hubo fraude. Losresultados que obtenemos constituyen un cisne negro. La hipótesis alternativa de que síhubo fraude es consistente con nuestros resultados y por tanto no podemos rechazarla.26


Appendix 1. Identifying fraud using imperfect correlatesof the intention to voteAssume that the fraud is defined as the difference between the votes for SI actuallycollected and an unobservable variable that is the intention of voting of the voters thatshowed up. We define the first one as Vi, the intention of voters as Xi, and the fraud asFi.Vi = Xi + FiThere are also two additional measures of the intention of voters: the exit polls (Ei) andthe signatures (Si) in each of the centers. These measures, however, are imperfect. Weassume a very general form of that imperfection – a random coefficient model. However,to make the point clear we start with a simpler form of errors and then generalize them.Assume thatEi = a*Xi + epsiSi = b*Xi + etaiWhere we are assuming that the exit polls are possibly a biased estimate of the intentionto vote: a can be smaller than one. The signatures (Si’s), as well, could be a biasedmeasure. Both equations have an error (epsi and etai) that take into account the fact thatboth the exit polls and the signatures are very imperfect measures of the voter’s intentions– even the biased measured intentions. We assume that these errors are uncorrelatedamong themselves and with the fraud. 3How can we detect the fraud? The fraud can only affect the actual votes, not the exitpolls, nor the signatures. In other words, the fraud is a displacement of the distribution ofvotes that is not present in the other two measures. Statistically, this means that the fraudcould be detected by using the exit polls and the signatures as predictors of the votingprocess and analyzing the correlation structure of the residuals. Under the assumptionthat all residuals are uncorrelated – which makes sense given the definitions we haveadopted – then the correlation of residuals is an indication of the magnitude of the fraud.The particular procedure used to detect the fraud is the following:1. Estimate the regression of Vi on Ei plus controls and recover the residual. Thisresidual has two components: the fraud and the errors in variables residual due tothe fact that the exit polls are noisy.2. Estimate the regression of Vi on Si plus controls and recover the residual. Thisresidual has two components: the fraud and the errors in variables residual due tothe fact that the signatures are an imperfect measure of the intention of voters.3This is a reasonable assumption considering that the signatures were collected at different timesand conditions than the exit polls.27


Notice that these two residuals are correlated. First, because both have the fraudas an unobservable component, and second, because the right hand side variablesare correlated and there is errors in variables in the regression.3. Estimate the regression of Vi on Ei plus controls using Si as an instrument.Recover the residual. Notice that in our model, because etai is uncorrelated withepsi and Fi, we can use Si as an instrument to correct for the error in variables.4. Using the same logic estimate Vi on Si plus controls, and using Ei as theinstrument. Recover the residual.In this case, because the two coefficients are supposed to have solved theproblem of error in variables the residuals can only be correlated if there is acommon component – which in our case is the definition of the fraud.This procedure actually detects how important the fraud is. The section that follows firstexplains why this procedure indeed is able to identify the fraud. After that we alsoanalyze the possibility that the fraud is correlated with the signatures – which is likelygiven what we have argued about the stochastic properties of the votes per machine andcenter. Finally, we present evidence.ProcedureThis section describes the procedure in a simple modelOLS estimation with no correlation between fraud and intention tovoteRunning the OLS regression of Votes on Exit Poll is:Vi = Xi + FiEi = a*Xi + epsiWhereXi = (1/a)*Ei - (1/a)*epsiSubtituting in the voting equationVi = c1*Ei + psi1Where28


psi1 = Fi – (1/a)*epsiIn this model, the OLS coefficient isc1ols = a*var(Xi) / (a^2 * var(Xi) + var(eps))which is always smaller than 1/a which is the true coefficient. This means that theresidual from the regression (psi1) ispsi1 = Fi +(1/a-c1ols)*Ei – (1/a)*epsiWe can do the same thing for the signatures. Notice that everything is symmetric so theequations are almost identical.Vi = Xi + FiSi = b*Xi + etaiWhich means thatXi = (1/b)*Si - (1/b)*etaiSubstituting Xi in the Vi equationVi = c2*Si + psi2Wherepsi2 = Fi - (1/b)*etaiIn this model, the OLS coefficient isc2ols = b*var(Xi) / (b^2 * var(Xi) + var(eta))which is always smaller than 1/b – it is only equal to 1/b when the variance of eta is zero.The outcome is that the residual will bepsi2 = Fi +(1/b-c2ols)*Si – (1/b)*etaiNotice that the two residuals are correlated. Under the assumption that epsi and etai areuncorrelated, and also uncorrelated with the fraud there are two components that createthe correlation among these residuals: the fraud, and the errors-in-variable bias.cov(psi1,psi2) = var(Fi) + (1/a-c1ols)*(1/b-c2ols)*cov(Ei,Si)29


The first term is the variance coming from the fraud, while the second term comes fromthe variance due to the error-in-variables that is present in both Ei and Si. Notice that weare assuming that the errors in variables are independent. The covariance arises becausethe error-in-variables downward biases both coefficients (c1ols


So, a simple test is to compare these two covariances, and determine if they arestatistically different. Furthermore, if the covariance of the IV residuals is different fromzero, then we have an estimate of the importance of the fraud.Correlated FraudOLS estimation with correlation between fraud and intention to voteThe previous exercise has assumed that the fraud is uncorrelated with the signatures, butas we have argued in the previous section, this is unlikely. In fact, most probably, thefraud is correlated with the signatures. Let us repeat the previous exercise allowing forany covariance structure between the fraud and the signatures. Running the OLSregression of Votes on Exit Poll we obtain the same result as before:Vi = Xi + Fi + f*SiEi = a*Xi + epsiWhere the residual of the voting equation has the independent term Fi and the part of thefraud that is correlated with the signatures (f*Si). In this model, the OLS coefficient is thesame as beforec1ols = cov(Vi,Ei)/Var(Ei)= (a*var(Xi) + a*f*cov(Xi,Si))/ (a^2 * var(Xi) + var(eps))= (a*var(Xi) + a*f*b*var(Xi))/ (a^2 * var(Xi) + var(eps))which now we can’t be sure is smaller than 1/a as before. This depends entirely on thesign of f. however, if f is negative (as we will mostly argue in this paper), then the biasdownward is stronger than in the pure case. This means that the residual from theregression (psi1) ispsi1 = Fi +(1/a-c1ols)*Ei – (1/a)*epsi+f*SiFor the signatures modelVi = c2*Si + Fi - (1/b)*etai + f*SiWhere all the three terms in the right hand side are part of the residual. The OLScoefficient isc2ols = cov(Vi,Si)/Var(Si)= (b*var(Xi) + f*var(Si))/ (b^2 * var(Xi) + var(eta))where the additional term in the numerator is coming from the correlation structurebetween the signature and the fraud. A plausible assumption is that the fraud is usually anegative variable (in our specification) which we could expect to be larger the larger the31


signature is. This means that the coefficient, f, is likely to be negative. This means thatthe bias in c2ols is downward and stronger than just with errors in variables.The residual ispsi2 = Fi +(1/b-c2ols+f)*Si – (1/b)*etaiNotice that the two residuals are correlated as before, but now there are two additionalterms.cov(psi1,psi2) = var(Fi) + (1/a-c1ols)*(1/b-c2ols)*cov(Ei,Si)+ (1/a-c1ols)*f*cov(Ei,Si) + f^2*var(Si)Instrumental variables estimation with correlation between fraud andintention to voteLets see what is the implication for this correlation when we do the instrumental variablesapproach. For the first equation we have:Vi = c1*Ei + Fi – (1/a)*epsi+f*SiThe IV estimate isc1iv = cov(Si’Vi) / cov(Si’Ei)c1iv = (b*var(Xi) +f*var(Si))/ b*a*var(Xi)c1iv = 1/a+(f/ba)*var(Si)/var(Xi)which means that the residual of the IV regression ispsi1 = Fi – (1/a)*epsi + f*Si + (1/a-c1iv)*EiIt is easy to show that c1iv is closer to 1/a than c1ols, which means that the residual, psi1,has a component coming from the error in variables that is smaller than from the OLSregression.The IV regression of the Si specification is as follows:Vi = c2*Si + Fi - (1/b)*etai + f*SiThe IV estimate isc2iv = cov(Ei’Vi) / cov(Ei’Si)c2iv = a*var(Xi) / a*b*var(Xi)c2iv = 1/b32


Notice that in this case the estimate of the IV in the voting on signatures is exactly thetrue coefficient. Exactly what we obtained in the previous section. Why? Simply becausethe exit polls do not have the error component coming from the fraud. The fraud – whichis the residual in the voting equation – cannot be correlated with the exit polls or itsinnovations. Signatures, on the other hand, are correlated with the fraud. This is indeedthe assumption how the fraud was performed.This makes exit polls a good instrument for signatures, but signatures is not a goodinstrument for exit poll. The residual in the second IV regression is:psi2 = Fi - (1/b)*etai + f*SiComparison of the covarianceLets compare the two covariances: the covariance for the OLS residuals with thecovariance with the IV residuals. The OLS residual havecov(psi1,psi2)_OLS = var(Fi) + (1/a-c1ols)*(1/b-c2ols)*cov(Ei,Si)+ (1/a-c1ols)*f*cov(Ei,Si) + f^2*var(Si)while the covariance for the IV estimates ispsi1 = Fi – (1/a)*epsi + f*Si + (1/a-c1iv)*Eipsi2 = Fi - (1/b)*etai + f*Sicov(psi1,psi2)_IV = var(Fi) + f*(1/a-c1iv)cov(Ei,Si) + f^2*var(Si)First, notice that as before, if there is no fraud the covariance of the IV residuals shouldbe zero. Furthermore, this last covariance reflects different forms of fraud. If the fraud isa random variable shifting the distribution (or equivalently that f=0 and Fi


cov_OLS – cov_IV = (1/a-c1ols)*(1/b-c2ols)*cov(Ei,Si) + (c1iv-c1ols)*f*cov(Ei,Si)where the two terms are easily signed. Lets start with the first term. We know that theerror in variables together with a negative f implies that both OLS estimates aredownward biased. We also know that a reasonable set of assumptions imply thatsignatures and exit polls are positively correlated. Hence, the first terms is amultiplication of three positive elements. Let us turn our attention now to the secondterm. We know that c1iv is closer to 1/a than c1ols. This means that the term in bracketsis negative, and we have been analyzing only the case in which f is negative. Hence, thecovariance of the OLS residuals has to be larger than the covariance of the IV residuals.Notice that if f were positive we could not have made this claim. And there would becircumstances in which the covariance actually goes up after instrumenting.In the empirical section we implement this strategy by calculating the covariance bothusing OLS and instrumental variables and observe a reduction in the covariance, aswould be consistent with the presence of f being negative (i.e. against the Yes vote). Inaddition, we find that cov_IV is positive and statistically significant which is informativeof the fact that f is significantly different from zero.34


Appendix 2. Identifying whether the audited center werechosen randomlySophisticated frauds are hard to detect. According to Rubin if all the machines areaffected using the same procedure then the fraud is statistically undetectable. Theadvantage of the <strong>Venezuela</strong>n case is that there was the possibility of audits and therefore,some of the CDV’s were required to be untouched. Because the government was the onethat would choose which centers would be audited, it is imaginable that they knew whichcenters were not touched and lead the auditors toward those centers.First, lets discuss the form of the fraud (the theory). Then, we provide the evidence.The theoretical idea of a voting process is that it is an imperfect but unbiased measure ofthe popular intentionVi = Xi + FiWhere Xi is the voting intention in each CDV, Vi are the total votes, “i” indicates theCDV, and Fi is the fraud. It is important to indicate that if Fi is a shift with the samedistribution as Xi (meaning both are normally distributed) then Vi is the sum of twonormal distributions, which is also a normal distribution and it would be hard to identifyany anomalies in the data. The fraud would be undetectable.Under this assumption, in the case of <strong>Venezuela</strong>, the fraud could not be normallydistributes because the system had to allow some centers to be untouched so that theycould be audited. Interestingly, the government did not allow the Carter Center to choosethe voting centers randomly. It was the government the one that assigned the votingcenters. So, if there is a fraud, it is imaginable that we could detect the shift in thepopulation by comparing the audited population with the non-audited population.We have a variable that is correlated with the intention of voters – the signatures. Weassume that the signatures followSi = b(i)*Xi + etai.where Si are the number of signatures, b(i) is a random coefficient mapping the intentionof voters to the total number of signatures, and etai is a random disturbance indicating thenoise involved in the measurement of the intentions.This specification allows the signatures to be a biased estimator of the voters intentions(b(i) on average could be less or larger than one).Additionally, Fi could be correlated or not with the number of signatures. We will adopt,then the following specification: Fi + f(i)*Si to encompass both possibilities.What is the OLS estimate of Vi on Si?35


Vi = c*Si + psiNotice that the reduced form model is the following:Vi = Xi + Fi + f(i)*b(i)*Xi + f(i)*etaiSi = b(i)*Xi + etai.The OLS coefficient is the covariance between these two variables divided by thevariance of the signatures. These variances include not only the variances of the shocksbut also the variances of the coefficients. For notational convenience assumeb(i) = b + bif(i) = f + fiwhere bi and fi conditional on Xi have mean zero and finite variance. Under theseassumptions the OLS coefficient iscols = ( b(1+fb)*var(Xi) + f*var(eta)) / (b^2*var(Xi)+var(eta))which obviously is different from 1/b – which is the limit if f=0 and var(eta)=0. There areseveral biases in this coefficient worth highlighting: first the error-in-variables which isthe result of var(eta) being different from zero. This bias is the attenuation bias andreduces the coefficient. So cols


cols= ( b*var(Xi)) / (b^2*var(Xi)+var(eta))notice that unambiguously cols is smaller than 1/b which means that the expected valueof cols*b(i) is smaller than E( b(i)/b )=1. Therefore the term in the first bracket of theresiduals has a posi tive expected value and the variance of psi will depend on Xi. Thissource of correlation is not interesting (in terms of fraud) and therefore, we require abetter test to differentiate between a random coefficient model and one with fraud.The idea is to compare a “supposedly random” sample with the total sample. If thesample is truly a random coefficient model, and the innovations to the coefficients (bi andfi) are truly orthogonal to the other shocks, then any sub-sample – any sub-sample –should have the same properties as the full sample.This is exactly what is done when agencies collect surveys on consumption, industryproduction, etc. If the sub-sample is a random draw it is representative of the population,or full-sample. For instance, assume that we are interested in studying consumptionpatterns. We know that consumption depends on the level of income, education, race,gender, age, religion, etc. Furthermore, there is no particular reason why we have toassume that a one percent increase in income will imply the same increase ofconsumption to all the individuals in the sample. In other words, it is reasonable toassume that the coefficients from income to consumption are random. However, if themodel is well specified (meaning that all the controls that have to be in the right handside are there), then the coefficients are truly random and independent of everything else.If we pick a random sub-sample of the population – a representative sample – thebehavior of those individuals is a good proxy of the behavior of the population. This isstandard in all micro data models where always we make inference about the populationby looking at a smaller sample. This is exactly what we do here.Any sub-sample of centers should have the same behavior as the whole. This does notmean that the coefficients estimated are going to be the same. What it does mean is thatthe differences cannot be statistically significant. We can, for example, choose as therandom sub-sample, the centers that the government allowed the Carter Center to audit.Why is this a good sample? Well, because we know that a shift of the full distribution isstatistically undetectable, the fraud cannot only be found if we concentrate in the subsamplethat, ex-ante, has a lower likelihood of being tainted.Therefore, we split the sample between those that were audited and those that were notaudited. As is discussed in the paper, we find them to be statistically different.Differences in the samples in terms of their OLS estimatesAs was mentioned above, the fraud introduces a bias in the regression coefficient if it iscorrelated with the signatures in the centers. To clarify the exposition we show the OLScoefficient of the bivariate model with and without fraud:37


cols_fraud = ( b(1+fb)*var(Xi) + f*var(eta)) / (b^2*var(Xi)+var(eta))cols_Nofraud = ( b*var(Xi)) / (b^2*var(Xi)+var(eta))which implies thatcols_fraud = cols_Nofraud + f*( b*var(Xi) + var(eta)) / (b^2*var(Xi)+var(eta))which under our assumptions that f

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!