01.06.2016 Views

EAGLEs

BBVA-EAGLEs-2016-esp

BBVA-EAGLEs-2016-esp

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Economías Emergentes y Líderes del Crecimiento<br />

Cuestiones metodológicas: sistema de<br />

codificación e indicador emocional en GDELT<br />

La base de datos GDELT ofrece varios mecanismos para evaluar la "importancia" o "impacto" de un evento específico. Las medidas<br />

más comunes son las siguientes:<br />

Escala de Goldstein. Se trata de una escala muy utilizada en geopolítica que otorga códigos de evento WEIS en forma de números<br />

que representan el grado del conflicto o cooperación. A cada código de evento CAMEO se le asigna una puntuación numérica de -<br />

10 a +10, reflejando el impacto potencial teórico que esa clase de evento tendrá sobre la estabilidad de un país. Este sistema se<br />

conoce como la Escala de Goldstein. Este campo especifica la Escala de Goldstein para cada clase de evento. ADVERTENCIA: esta<br />

puntuación se basa en el tipo de evento de que se trate, y no en registro específico del evento incorporado. Así, dos disturbios<br />

distintos, p. ej., uno en el que participen 10 personas y otro en el que lo hagan 10.000, recibirá la misma puntuación de Goldstein. Esta<br />

puntuación puede agregarse a distintos niveles de resolución temporal para obtener una aproximación sobre la estabilidad de un lugar<br />

a lo largo del tiempo.<br />

Tono medio. Se trata del "tono" medio de todos los documentos que incluyen una o más menciones a un evento específico. La<br />

puntuación va de -100 (extremadamente negativo) a +100 (extremadamente positivo). Los valores habituales oscilan entre -10 y<br />

+10, siendo 0 un sesgo neutral. Esta puntuación puede utilizarse como método para filtrar el “contexto” de los eventos a fin de<br />

obtener una medida sutil de la importancia de un evento como aproximación al “impacto” del mismo. A modo de ejemplo, un evento de<br />

disturbio con un tono medio ligeramente negativo tendrá probablemente una incidencia menor, mientras que si presentara un tono<br />

medio extremadamente negativo podría tener una incidencia mucho mayor. Un disturbio con una puntuación positiva apunta<br />

probablemente a una incidencia muy reducida acaecida en el contexto de una narrativa más positiva (como un reportaje sobre un<br />

ataque ocurrido en el marco de protestas para mejorar las condiciones en el terreno en un país y sobre la forma en que se han<br />

reducido en gran medida los ataques diarios). Para medir el sesgo emocional en el que se enmarca el evento, GDELT utiliza el<br />

diccionario tonal de Shook et al (2012). Esta escala, que va más allá de los códigos de evento CAMEO, es la medida que utilizamos en<br />

el este informe.<br />

A fin de extraer toda esta información del texto, los datos se codifican mediante el sistema Petrarca de fuente abierta en el caso de<br />

los eventos, utilizándose un software adicional para el emplazamiento y el tono. Este motor de codificación identifica todas las<br />

entidades especificadas mediante frases sustantivas: todos los nombres, verbos, adjetivos, adverbios y demás presentes en el texto.<br />

Los casos sin identificar pueden procesarse por separado mediante un software de resolución de entidades especificadas. La<br />

velocidad que desarrolla el algoritmo se consigue utilizando algoritmos de análisis sintáctico superficial y procesamiento en paralelo.<br />

60

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!