EAGLEs
BBVA-EAGLEs-2016-esp
BBVA-EAGLEs-2016-esp
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Economías Emergentes y Líderes del Crecimiento<br />
Cuestiones metodológicas: sistema de<br />
codificación e indicador emocional en GDELT<br />
La base de datos GDELT ofrece varios mecanismos para evaluar la "importancia" o "impacto" de un evento específico. Las medidas<br />
más comunes son las siguientes:<br />
Escala de Goldstein. Se trata de una escala muy utilizada en geopolítica que otorga códigos de evento WEIS en forma de números<br />
que representan el grado del conflicto o cooperación. A cada código de evento CAMEO se le asigna una puntuación numérica de -<br />
10 a +10, reflejando el impacto potencial teórico que esa clase de evento tendrá sobre la estabilidad de un país. Este sistema se<br />
conoce como la Escala de Goldstein. Este campo especifica la Escala de Goldstein para cada clase de evento. ADVERTENCIA: esta<br />
puntuación se basa en el tipo de evento de que se trate, y no en registro específico del evento incorporado. Así, dos disturbios<br />
distintos, p. ej., uno en el que participen 10 personas y otro en el que lo hagan 10.000, recibirá la misma puntuación de Goldstein. Esta<br />
puntuación puede agregarse a distintos niveles de resolución temporal para obtener una aproximación sobre la estabilidad de un lugar<br />
a lo largo del tiempo.<br />
Tono medio. Se trata del "tono" medio de todos los documentos que incluyen una o más menciones a un evento específico. La<br />
puntuación va de -100 (extremadamente negativo) a +100 (extremadamente positivo). Los valores habituales oscilan entre -10 y<br />
+10, siendo 0 un sesgo neutral. Esta puntuación puede utilizarse como método para filtrar el “contexto” de los eventos a fin de<br />
obtener una medida sutil de la importancia de un evento como aproximación al “impacto” del mismo. A modo de ejemplo, un evento de<br />
disturbio con un tono medio ligeramente negativo tendrá probablemente una incidencia menor, mientras que si presentara un tono<br />
medio extremadamente negativo podría tener una incidencia mucho mayor. Un disturbio con una puntuación positiva apunta<br />
probablemente a una incidencia muy reducida acaecida en el contexto de una narrativa más positiva (como un reportaje sobre un<br />
ataque ocurrido en el marco de protestas para mejorar las condiciones en el terreno en un país y sobre la forma en que se han<br />
reducido en gran medida los ataques diarios). Para medir el sesgo emocional en el que se enmarca el evento, GDELT utiliza el<br />
diccionario tonal de Shook et al (2012). Esta escala, que va más allá de los códigos de evento CAMEO, es la medida que utilizamos en<br />
el este informe.<br />
A fin de extraer toda esta información del texto, los datos se codifican mediante el sistema Petrarca de fuente abierta en el caso de<br />
los eventos, utilizándose un software adicional para el emplazamiento y el tono. Este motor de codificación identifica todas las<br />
entidades especificadas mediante frases sustantivas: todos los nombres, verbos, adjetivos, adverbios y demás presentes en el texto.<br />
Los casos sin identificar pueden procesarse por separado mediante un software de resolución de entidades especificadas. La<br />
velocidad que desarrolla el algoritmo se consigue utilizando algoritmos de análisis sintáctico superficial y procesamiento en paralelo.<br />
60