05.11.2014 Views

Técnicas Estad´ısticas y Neuronales de Agrupamiento Adaptativo ...

Técnicas Estad´ısticas y Neuronales de Agrupamiento Adaptativo ...

Técnicas Estad´ısticas y Neuronales de Agrupamiento Adaptativo ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Técnicas Estadísticas y <strong>Neuronales</strong> <strong>de</strong><br />

<strong>Agrupamiento</strong> <strong>Adaptativo</strong> para la Predicción<br />

Probabilística <strong>de</strong> Fenómenos Meteorológicos<br />

Locales. Aplicación en el Corto Plazo y en la<br />

Predicción Estacional.<br />

Tesis Doctoral<br />

Presentada por<br />

D. Antonio S. Cofiño González<br />

bajo la dirección <strong>de</strong><br />

Dr. José M. Gutiérrez<br />

en el<br />

Dpto. <strong>de</strong> Matemática Aplicada y Ciencias <strong>de</strong> la Computación.<br />

E.T.S.I. Caminos, Canales y Puertos<br />

<strong>de</strong> la<br />

Universidad <strong>de</strong> Cantabria.<br />

Santan<strong>de</strong>r, Octubre <strong>de</strong> 2003


Statistical and Neural Adaptive Clustering<br />

Downscaling Techniques in Meteorology.<br />

Application to Short-Range and Seasonal Forecast.<br />

Antonio S. Cofiño<br />

antonio.cofino@unican.es<br />

Dept. of Applied Mathematics and Computer Science<br />

University of Cantabria<br />

2003 Santan<strong>de</strong>r, Spain


Prefacio<br />

Des<strong>de</strong> comienzos <strong>de</strong>l siglo XX, el problema <strong>de</strong> la predicción meteorológica<br />

se ha abordado <strong>de</strong> forma numérica, utilizando mo<strong>de</strong>los <strong>de</strong> circulación<br />

atmosférica (sistemas <strong>de</strong> ecuaciones en <strong>de</strong>rivadas parciales, o aproximaciones<br />

<strong>de</strong> estos) integrados sobre rejillas espaciales apropiadas, y a partir <strong>de</strong><br />

unas condiciones iniciales conocidas. La predicción numérica se vió favorecida<br />

con el comienzo <strong>de</strong> la era <strong>de</strong> los or<strong>de</strong>nadores en la década <strong>de</strong> los 50, y<br />

por los sucesivos avances computacionales, que han producido una evolución<br />

vertiginosa en la predicción numérica <strong>de</strong>l tiempo. A partir <strong>de</strong>l estado futuro<br />

<strong>de</strong> la atmósfera predicho por el mo<strong>de</strong>lo, los predictores humanos ofrecen<br />

diariamente pronósticos regionales y locales, en los núcleos <strong>de</strong> población,<br />

y <strong>de</strong> fenómenos meteorológicos <strong>de</strong> interés, principalmente fenómenos producidos<br />

en superficie (meteoros como precipitación, temperatura, etc.). Por<br />

otra parte, se han realizado intentos <strong>de</strong> pre<strong>de</strong>cir meteoros locales aplicando<br />

directamente técnicas estadísticas a los registros históricos <strong>de</strong> observaciones<br />

disponibles <strong>de</strong> estos fenómenos (mo<strong>de</strong>los auto-regresivos, etc.). Sin embargo,<br />

para <strong>de</strong>terminados elementos meteorológicos (especialmente los relacionados<br />

con la humedad y precipitación) estas técnicas tienen gran<strong>de</strong>s limitaciones.<br />

Por una parte <strong>de</strong>bido a la resolución <strong>de</strong> los mo<strong>de</strong>los numéricos que no permiten<br />

obtener predicciones locales precisas en puntos geográficos <strong>de</strong> interés.<br />

Y por otra parte, los mo<strong>de</strong>los estadísticos no incluyen suficiente información<br />

sobre los fenómenos físicos que intervienen en estos procesos, por ello, se<br />

han mostrado ineficientes <strong>de</strong>s<strong>de</strong> un punto <strong>de</strong> vista operativo.<br />

Por tanto, la predicción local <strong>de</strong> fenómenos meteorológicos y la mejora<br />

<strong>de</strong> la resolución <strong>de</strong> las salidas <strong>de</strong> los mo<strong>de</strong>los numéricos (pue<strong>de</strong> interpretarse<br />

como una interpolación) son problemas <strong>de</strong> gran interés tanto teórico como<br />

práctico. A<strong>de</strong>más los distintos sectores económicos pue<strong>de</strong>n verse favorecidos<br />

por los avances en este área (a la aplicación <strong>de</strong> predicción <strong>de</strong> cosechas,<br />

<strong>de</strong>sastres naturales, etc.). En la literatura científica los problemas anteriores<br />

se enmarcan en término inglés “downscaling” (disminución <strong>de</strong> escala, o<br />

aumento <strong>de</strong> resolución) que, en realidad, son problemas <strong>de</strong> interpolación, en<br />

los que se trata <strong>de</strong> obtener valores en puntos locales a partir <strong>de</strong> las salidas<br />

<strong>de</strong> baja resolución <strong>de</strong> los mo<strong>de</strong>los numéricos.<br />

Cada vez es mayor la disponibilidad <strong>de</strong> datos proce<strong>de</strong>ntes <strong>de</strong> observaciones<br />

(por ejemplo, la red <strong>de</strong> estaciones <strong>de</strong>l Instituto Nacional <strong>de</strong> Meteorología<br />

dispone <strong>de</strong> observaciones diarias en más <strong>de</strong> 6000 estaciones distribuidas<br />

iii


IV<br />

por la geografía española); estos datos proporcionan valiosa información estadística<br />

<strong>de</strong> la climatología local. También existen diferentes re-análisis <strong>de</strong><br />

mo<strong>de</strong>los numéricos que contienen las situaciones atmosféricas dadas por un<br />

mismo mo<strong>de</strong>lo numérico para un período suficientemente amplio <strong>de</strong> tiempo.<br />

(por ejemplo el re-análisis ERA-40 realizado por el ECMWF cubre <strong>de</strong>s<strong>de</strong> el<br />

año 1958, comienzo <strong>de</strong> la predicción numérica con or<strong>de</strong>nadores, hasta la actualidad).<br />

Y por último, también están disponibles diariamente numerosas<br />

predicciones numéricas, <strong>de</strong> la circulación atmosférica, realizadas por distintos<br />

centros meteorológicos. Con toda esta información se pue<strong>de</strong>n <strong>de</strong>sarrollar<br />

sofisticados mo<strong>de</strong>los <strong>de</strong> predicción local.<br />

En esta Tesis se presentan nuevos métodos híbridos <strong>de</strong> predicción local<br />

(downscaling) que combinan las salidas <strong>de</strong> los mo<strong>de</strong>los numéricos con la información<br />

estadística contenida en las observaciones locales. Para ello se han<br />

aplicado distintas técnicas estadísticas, tanto clásicas como mo<strong>de</strong>rnas, a este<br />

problema, estudiando la forma óptima <strong>de</strong> combinar esta información <strong>de</strong>s<strong>de</strong><br />

el punto <strong>de</strong> vista <strong>de</strong> la pericia y valor económico <strong>de</strong> los mo<strong>de</strong>los propuestos.<br />

También se han tratado <strong>de</strong> cubrir los tres aspectos necesarios para que el<br />

trabajo <strong>de</strong>sarrollado pueda ser accesible y útil al público general. En primer<br />

lugar, se ha llevado a cabo un estudio teórico que ha permitido <strong>de</strong>sarrollar<br />

métodos y algoritmos <strong>de</strong> predicción meteorológica local; <strong>de</strong>spués se ha trabajado<br />

en la implementación eficiente <strong>de</strong> los métodos resultantes utilizando<br />

software científico en el marco <strong>de</strong> las tecnologías actuales <strong>de</strong> la información;<br />

y finalmente, se ha llevado a cabo una puesta a punto operativa <strong>de</strong>l producto<br />

(contando con el apoyo <strong>de</strong>l Instituto Nacional <strong>de</strong> Meteorología) produciendo<br />

predicciones operativas <strong>de</strong>s<strong>de</strong> enero <strong>de</strong>l 2002, y realizando una validación<br />

exhaustiva <strong>de</strong> los resultados obtenidos.<br />

El trabajo presentado en esta Tesis ha sido <strong>de</strong>sarrollado <strong>de</strong>ntro <strong>de</strong>l grupo<br />

<strong>de</strong> investigación AIMet (Inteligencia Artificial en Meteorología) <strong>de</strong> la<br />

Universidad <strong>de</strong> Cantabria (http://grupos.unican.es/ai/meteo). El autor<br />

agra<strong>de</strong>ce la ayuda económica <strong>de</strong> la Universidad <strong>de</strong> Cantabria, <strong>de</strong>l Instituto<br />

Nacional <strong>de</strong> Meteorología (Ministerio <strong>de</strong> Medio Ambiente) y <strong>de</strong> la Dirección<br />

General <strong>de</strong> Ciencia y Tecnología en forma <strong>de</strong> becas y proyectos <strong>de</strong> investigación<br />

(MCYT REN2000-1572, REN2003-09853-C02-01). A<strong>de</strong>más agra<strong>de</strong>ce al<br />

Instituto Geofísico <strong>de</strong> Perú, al European Center for Medium-Range Weather<br />

Forecast (ECMWF) y al INM por la disponibilidad <strong>de</strong> datos, que ha<br />

permitido llevar a cabo este trabajo.<br />

Por último agra<strong>de</strong>cer a Blanca por estar siempre a mi lado apoyándome<br />

durante todos estos años, a Jose, Rafa, Miguel, Carmen y Cristina tanto<br />

por su amistad, como por su colaboración en el trabajo <strong>de</strong> esta Tesis, y a<br />

Enrique por su confianza. Por supuesto, reconocer el apoyo por parte <strong>de</strong><br />

mi familia, sin olvidar el <strong>de</strong> todos aquellos profesores, y no-profesores, que<br />

supieron <strong>de</strong>spertar en mi esa curiosidad por la Ciencia.<br />

Antonio S. Cofiño<br />

Santan<strong>de</strong>r, 20 <strong>de</strong> Septiembre <strong>de</strong> 2003


Índice general<br />

Prefacio<br />

III<br />

Índice general<br />

V<br />

1. Organización y Aportaciones <strong>de</strong> la Tesis 1<br />

1.1. Estructura <strong>de</strong> la Tesis . . . . . . . . . . . . . . . . . . . . . . 1<br />

1.2. Oportunidad <strong>de</strong> la Tesis . . . . . . . . . . . . . . . . . . . . . 2<br />

1.3. Principales Aportaciones . . . . . . . . . . . . . . . . . . . . . 3<br />

1.4. Trabajo Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

1.5. Algunos Acrónimos y Terminología Utilizados . . . . . . . . . 7<br />

I Estado <strong>de</strong>l Conocimiento 9<br />

2. Mo<strong>de</strong>los y Datos Atmosféricos 11<br />

2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.2. Las Ecuaciones <strong>de</strong> la Atmósfera . . . . . . . . . . . . . . . . . 12<br />

2.2.1. Filtrado <strong>de</strong> Soluciones Triviales . . . . . . . . . . . . . 15<br />

2.3. Resolución Numérica <strong>de</strong> las Ecuaciones . . . . . . . . . . . . . 15<br />

2.3.1. Asimilación <strong>de</strong> Datos . . . . . . . . . . . . . . . . . . . 16<br />

2.3.2. Parametrización: Procesos Físicos <strong>de</strong> Escala Menor . . 17<br />

2.4. Tipos <strong>de</strong> Mo<strong>de</strong>los . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

2.4.1. Mo<strong>de</strong>los Globales <strong>de</strong> Circulación General . . . . . . . 19<br />

2.4.2. Mo<strong>de</strong>los Regionales . . . . . . . . . . . . . . . . . . . 20<br />

2.4.3. Mo<strong>de</strong>los Mesoscalares . . . . . . . . . . . . . . . . . . 21<br />

2.5. Estado Actual <strong>de</strong> la Predicción Operativa . . . . . . . . . . . 22<br />

2.6. Futuro <strong>de</strong> la Predicción Numérica . . . . . . . . . . . . . . . . 26<br />

2.7. Datos Climatológicos y Meteorológicos . . . . . . . . . . . . . 27<br />

2.7.1. Re<strong>de</strong>s <strong>de</strong> Observación . . . . . . . . . . . . . . . . . . 27<br />

v


VI<br />

ÍNDICE GENERAL<br />

2.7.2. Datos Paleoclimáticos . . . . . . . . . . . . . . . . . . 29<br />

2.7.3. Simulaciones <strong>de</strong> Mo<strong>de</strong>los Numéricos . . . . . . . . . . 30<br />

3. Minería <strong>de</strong> Datos y Aprendizaje Automático 33<br />

3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33<br />

3.2. Componentes Principales . . . . . . . . . . . . . . . . . . . . 34<br />

3.2.1. Elección <strong>de</strong>l Número <strong>de</strong> Componentes . . . . . . . . . 40<br />

3.2.2. Efectos <strong>de</strong> la Escala Temporal . . . . . . . . . . . . . 42<br />

3.3. Técnicas <strong>de</strong> <strong>Agrupamiento</strong> . . . . . . . . . . . . . . . . . . . . 43<br />

3.3.1. Técnicas Jerárquicas . . . . . . . . . . . . . . . . . . . 43<br />

3.3.2. Técnicas Particionales . . . . . . . . . . . . . . . . . . 47<br />

3.4. Re<strong>de</strong>s Auto-Organizativas (SOM) . . . . . . . . . . . . . . . . 48<br />

3.5. Re<strong>de</strong>s <strong>Neuronales</strong> Multicapa . . . . . . . . . . . . . . . . . . . 55<br />

3.5.1. Estructura y Funcionamiento <strong>de</strong> las Re<strong>de</strong>s <strong>Neuronales</strong> 55<br />

3.5.2. Aprendizaje y Validación . . . . . . . . . . . . . . . . 57<br />

3.5.3. Perceptrones (Re<strong>de</strong>s <strong>de</strong> una Capa) . . . . . . . . . . . 58<br />

3.5.4. Perceptrones Multi-Capa . . . . . . . . . . . . . . . . 63<br />

4. Validación <strong>de</strong> Predicciones Probabilísticas 69<br />

4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69<br />

4.2. Aspectos <strong>de</strong> la Calidad <strong>de</strong> una Predicción . . . . . . . . . . . 71<br />

4.3. Medidas <strong>de</strong> Validación <strong>de</strong> Predicciones Probabilísticas . . . . 74<br />

4.3.1. Brier Score . . . . . . . . . . . . . . . . . . . . . . . . 74<br />

4.3.2. Brier Skill Score . . . . . . . . . . . . . . . . . . . . . 75<br />

4.4. Validación <strong>de</strong> Predicciones Categóricas . . . . . . . . . . . . . 76<br />

II Aportaciones <strong>de</strong> la Tesis 85<br />

5. Predicción Local a Corto Plazo. Técnicas <strong>de</strong> <strong>Agrupamiento</strong> 87<br />

5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87<br />

5.2. Técnicas Estadísticas para Series Temporales . . . . . . . . . 89<br />

5.2.1. Series Caóticas. Técnicas <strong>de</strong> Inmersión (Embedding). . 91<br />

5.3. Técnicas Híbridas (Downscaling Estadístico) . . . . . . . . . . 95<br />

5.3.1. Técnicas Globales Lineales y <strong>Neuronales</strong> . . . . . . . . 97<br />

5.3.2. Técnicas Locales basadas en Análogos . . . . . . . . . 98<br />

5.3.3. Comparación <strong>de</strong> Técnicas Estándar en el Corto Plazo 99<br />

5.4. Técnicas basadas en <strong>Agrupamiento</strong> y Clasificación . . . . . . 101<br />

5.4.1. Nuevo Método <strong>de</strong> Downscaling para el Corto Plazo . . 102<br />

5.4.2. Validación y Comparación con Otros Métodos . . . . . 104<br />

6. Predicción por Conjuntos. Re<strong>de</strong>s Auto-Organizativas 113<br />

6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113<br />

6.2. Predictibilidad y Predicción por Conjuntos . . . . . . . . . . 114<br />

6.3. Aplicación <strong>de</strong> las Re<strong>de</strong>s Auto-Organizativas . . . . . . . . . . 117<br />

6.3.1. Medidas <strong>de</strong> Dispersión y Predictibilidad . . . . . . . . 120


ÍNDICE GENERAL<br />

VII<br />

6.4. Aplicación en la Predicción a Medio Plazo . . . . . . . . . . . 121<br />

6.5. Predicción Mensual y Estacional . . . . . . . . . . . . . . . . 126<br />

6.5.1. Predicción Local <strong>de</strong> Precipitación durante El Niño . . 130<br />

7. Implementación Operativa. PROMETEO 137<br />

7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137<br />

7.2. Estructura <strong>de</strong> la Aplicación. Sistema Operativo en el INM . . 139<br />

7.2.1. Configuración e Inicialización <strong>de</strong>l Sistema . . . . . . . 139<br />

7.2.2. Explotación Operativa . . . . . . . . . . . . . . . . . . 142<br />

7.2.3. Acceso Web a las Predicciones . . . . . . . . . . . . . 144<br />

7.2.4. Proceso <strong>de</strong> validación. Retro-alimentación <strong>de</strong>l Sistema 149<br />

7.3. MeteoLab: Toolbox Meteorológica para Matlab . . . . . . . . 150<br />

7.4. Validación Operativa <strong>de</strong> Prometeo. . . . . . . . . . . . . . . . 154<br />

7.5. Computación Distribuida en la Web. Tecnología GRID . . . . 160<br />

7.5.1. Estructura <strong>de</strong> la tecnología GRID . . . . . . . . . . . 161<br />

7.5.2. Tecnologías GRID en Meteorología . . . . . . . . . . . 163<br />

7.5.3. Prometeo en un Entorno GRID . . . . . . . . . . . . . 164<br />

7.5.4. Paralelización GRID <strong>de</strong>l <strong>Agrupamiento</strong> . . . . . . . . 166<br />

Bibliografía 171


CAPÍTULO 1<br />

Organización y Aportaciones <strong>de</strong> la Tesis<br />

En este capítulo se <strong>de</strong>scribe la organización <strong>de</strong> la Tesis y se presentan<br />

las principales aportaciones <strong>de</strong> la misma, así como las futuras líneas <strong>de</strong><br />

investigación. También se analiza la oportunidad e interés <strong>de</strong> la investigación<br />

realizada en el marco actual <strong>de</strong> la predicción meteorológica.<br />

1.1. Estructura <strong>de</strong> la Tesis<br />

Esta Tesis está organizada en dos partes. La primera <strong>de</strong> ellas <strong>de</strong>scribe el<br />

estado <strong>de</strong>l conocimiento relativo a los temas tratados y está organizada en<br />

tres capítulos. El Capítulo 2 <strong>de</strong>scribe brevemente la mo<strong>de</strong>lización numérica<br />

<strong>de</strong> la atmósfera, prestando especial atención a las características <strong>de</strong> los<br />

mo<strong>de</strong>los operativos utilizados por los distintos servicios meteorológicos. En<br />

este capítulo también se <strong>de</strong>scriben los datos meteorológicos, tanto <strong>de</strong> salidas<br />

<strong>de</strong> mo<strong>de</strong>los como <strong>de</strong> observaciones, que serán utilizados en esta Tesis. El<br />

Capítulo 3 introduce algunas técnicas <strong>de</strong> análisis y manipulación estadística<br />

<strong>de</strong> estos datos (técnicas <strong>de</strong> minería <strong>de</strong> datos) que serán utilizadas para<br />

el <strong>de</strong>sarrollo <strong>de</strong> los mo<strong>de</strong>los locales <strong>de</strong> predicción; en este capítulo se hace<br />

énfasis en los métodos estadísticos y neuronales <strong>de</strong> agrupamiento que son<br />

utilizados posteriormente en el problema <strong>de</strong> la predicción local <strong>de</strong> fenómenos<br />

meteorológicos. Por último, el Capítulo 4 <strong>de</strong>scribe las principales medidas<br />

<strong>de</strong> validación utilizadas por la comunidad científica para pronósticos meteorológicos<br />

probabilísticos, sobre los que versa esta Tesis.<br />

En la segunda parte <strong>de</strong> la Tesis se <strong>de</strong>scriben las aportaciones realizadas<br />

en el campo <strong>de</strong> la predicción local <strong>de</strong> fenómenos meteorológicos. Esta<br />

parte está organizada en tres capítulos; el primero <strong>de</strong> ellos (Cap. 5) aborda<br />

el problema <strong>de</strong>s<strong>de</strong> la perspectiva <strong>de</strong> la predicción estadística local (downscaling<br />

estadístico) a corto plazo, mostrando un análisis comparativo <strong>de</strong> las<br />

distintas técnicas empleadas hasta la fecha y presentando un nuevo método<br />

1


2 1. ORGANIZACIÓN Y APORTACIONES DE LA TESIS<br />

basado en técnicas <strong>de</strong> agrupamiento adaptativo. En el Capítulo 6 se generaliza<br />

el método <strong>de</strong> downscaling estadístico anterior, utilizando re<strong>de</strong>s autoorganizativas<br />

para el problema <strong>de</strong> la predicción por conjuntos, trabajando<br />

en el marco <strong>de</strong> la predicción a medio plazo y estacional. Se muestra cómo las<br />

re<strong>de</strong>s auto-organizativas permiten interpretar <strong>de</strong> forma natural la dispersión<br />

<strong>de</strong> los miembros <strong>de</strong>l conjunto <strong>de</strong> predicciones, permitiendo introducir una<br />

medida <strong>de</strong> predictibilidad asociada a la predicción.<br />

Por último, el Capítulo 7 <strong>de</strong>scribe los <strong>de</strong>talles sobre la implementación<br />

<strong>de</strong> los métodos presentados en esta Tesis y las tecnologías utilizadas para<br />

su <strong>de</strong>sarrollo. El producto final es una herramienta genérica, fácilmente<br />

adaptable a distintos problemas <strong>de</strong>nominada PROMETEO. En particular se<br />

ilustra la adaptación <strong>de</strong> esta herramienta en el Instituto Nacional <strong>de</strong> Meteorología<br />

para la predicción local a corto plazo en una red <strong>de</strong> 2500 estaciones<br />

meteorológicas. También se estudia la adaptación <strong>de</strong> esta herramienta a un<br />

entorno GRID con el objetivo <strong>de</strong> hacer completamente interactivo su uso,<br />

paralelizando sobre la Web aquellas partes con mayor carga computacional.<br />

1.2. Oportunidad <strong>de</strong> la Tesis<br />

La predicción local con técnicas <strong>de</strong> aumento <strong>de</strong> resolución dinámica y<br />

estadística (downscaling) es actualmente una <strong>de</strong> las principales inquietu<strong>de</strong>s<br />

<strong>de</strong> la comunidad meteorológica internacional. Esta inquietud ha surgido, en<br />

parte, por la necesidad <strong>de</strong> trasladar a una escala regional los resultados obtenidos<br />

en numerosos proyectos que integran mo<strong>de</strong>los globales <strong>de</strong> circulación<br />

tanto en la predicción estacional como en la creación <strong>de</strong> posibles escenarios<br />

<strong>de</strong> cambio climático. Por otra parte, la aplicación <strong>de</strong> estos proyectos a distintos<br />

sectores <strong>de</strong> producción <strong>de</strong> la sociedad (agrario, industrial, energético,<br />

turismo, etc.) requiere trabajar con variables en superficie que involucran<br />

procesos físicos parametrizados en los mo<strong>de</strong>los numéricos, dificultando su<br />

predicción. A<strong>de</strong>más, la resolución necesaria para estas aplicaciones suele ser<br />

mucho mayor que la ofrecida por lo propios mo<strong>de</strong>los numéricos. Y por ello,<br />

las técnicas <strong>de</strong> downscaling son una pieza clave para po<strong>de</strong>r trasladar a los<br />

sectores <strong>de</strong> producción los resultados meteorológicos obtenidos por estos<br />

proyectos.<br />

Por ejemplo, proyectos llevados a cabo en el V Programa Marco <strong>de</strong> la UE<br />

han contemplado paquetes especiales para el <strong>de</strong>sarrollo y la implementación<br />

<strong>de</strong> técnicas <strong>de</strong> downscaling:<br />

DEMETER (Development of a European Multimo<strong>de</strong>l Ensemble system<br />

for seasonal to inTERannual prediction) que ha <strong>de</strong>sarrollado un<br />

sistema <strong>de</strong> predicción estacional multi-mo<strong>de</strong>lo:<br />

www.ecmwf.int/research/<strong>de</strong>meter/<br />

STARDEX (Statistical and Regional dynamical Downscaling of Extremes<br />

for European regions):<br />

www.cru.uea.ac.uk/cru/projects/star<strong>de</strong>x/


1.3. PRINCIPALES APORTACIONES 3<br />

A<strong>de</strong>más <strong>de</strong> haber jugado un papel importante hasta la fecha, las técnicas <strong>de</strong><br />

downscaling también seguirán <strong>de</strong>sempeñando un papel activo en el futuro<br />

cercano. Por ejemplo el proyecto integrado ENSEMBLES (ENSEMBLEbased<br />

Predictions of Climate Changes and their Impacts) <strong>de</strong>l VI Programa<br />

Marco <strong>de</strong> la UE (2004-2008) cuenta con paquetes <strong>de</strong> downscaling estadístico<br />

y dinámico. Es, por tanto, un momento idóneo para <strong>de</strong>sarrollar nuevas<br />

técnicas <strong>de</strong> downscaling que puedan ser capaces <strong>de</strong> adaptarse a distintas<br />

aplicaciones y rangos temporales. Todo esto lleva a afirmar que el trabajo<br />

<strong>de</strong>sarrollado en esta Tesis es oportuno en el contexto actual.<br />

Por otra parte, el trabajo llevado a cabo para la implementación operativa<br />

<strong>de</strong> los métodos <strong>de</strong>sarrollados se encuadra en el contexto actual <strong>de</strong> las tecnologías<br />

<strong>de</strong> la información. En el VI Programa Marco (www.mcyt.es/vipm/)<br />

se promueve la integración <strong>de</strong> la I+D europea para alcanzar masas críticas,<br />

lograr economías <strong>de</strong> escala y distribuir mejor los recursos disponibles. Se<br />

plantea la necesidad <strong>de</strong> interconectar centros <strong>de</strong> excelencia europeos y <strong>de</strong>sarrollar<br />

centros virtuales, así como <strong>de</strong> apoyar la creación, funcionamiento y<br />

acceso a gran<strong>de</strong>s infraestructuras. Existe por tanto una clara sintonía entre<br />

estos objetivos y el paradigma que plantea el GRID Computing analizado en<br />

esta Tesis (acceso a recursos computacionales distribuidos geográficamente<br />

a través <strong>de</strong> la red <strong>de</strong> alta velocidad). Esta ha sido una <strong>de</strong> las líneas temáticas<br />

priorizada en las primeras llamadas a proyectos <strong>de</strong>l VI programa marco, en<br />

concreto <strong>de</strong>ntro <strong>de</strong> la <strong>de</strong>nominación “Complex Problem Solving” don<strong>de</strong> la<br />

meteorología y biología tienen un papel predominante.<br />

1.3. Principales Aportaciones<br />

En esta Tesis se han <strong>de</strong>sarrollado, implementado, y validado nuevos<br />

métodos <strong>de</strong> predicción meteorológica local en distintas escalas temporales.<br />

Para ello se han combinando las salidas <strong>de</strong> los mo<strong>de</strong>los numéricos <strong>de</strong> la<br />

atmósfera, con la información estadística contenida en registros históricos<br />

locales (downscaling estadístico). En concreto, en este trabajo se ha <strong>de</strong>sarrollado<br />

un nuevo método aplicando las técnicas estadísticas y neuronales,<br />

<strong>de</strong> agrupamiento y clasificación, más apropiada para los distintos alcances<br />

temporales <strong>de</strong> la predicción: predicción a corto plazo (<strong>de</strong> uno a tres días),<br />

predicción a plazo medio (hasta 10 días) y predicción estacional (con meses<br />

<strong>de</strong> antelación). En los dos últimos casos los mo<strong>de</strong>los atmosféricos son sistemas<br />

<strong>de</strong> predicción por conjuntos, que caracterizan la incertidumbre asociada<br />

a las condiciones iniciales y a la imprecisión <strong>de</strong>l mo<strong>de</strong>lo, integrando el mismo<br />

para un conjunto <strong>de</strong> condiciones iniciales obtenidas perturbando la condición<br />

inicial. El método <strong>de</strong>sarrollado en este trabajo ha permitido caracterizar la<br />

predictibilidad (confianza) <strong>de</strong> cada situación a partir <strong>de</strong> la dispersión <strong>de</strong>l<br />

conjunto <strong>de</strong> predicciones sobre una red auto-organizativa. De esta forma,<br />

en el medio plazo y en la predicción estacional, el método resultante proporciona<br />

no sólo una predicción, sino una estimación <strong>de</strong> la confianza en<br />

la misma. Se muestran validaciones exhaustivas realizadas en la Península


4 1. ORGANIZACIÓN Y APORTACIONES DE LA TESIS<br />

Ibérica (latitu<strong>de</strong>s medias) y en Perú (latitu<strong>de</strong>s tropicales).<br />

En todo el <strong>de</strong>sarrollo <strong>de</strong> la Tesis se han tratado <strong>de</strong> cubrir los tres aspectos<br />

necesarios para que el trabajo final pueda ser operativo y accesible al público<br />

en general. En primer lugar, se ha llevado a cabo un estudio teórico que<br />

ha permitido <strong>de</strong>sarrollar métodos y algoritmos; a continuación, se ha trabajado<br />

en la implementación eficiente <strong>de</strong> los métodos resultantes utilizando<br />

software científico en el marco <strong>de</strong> las tecnologías actuales <strong>de</strong> la información;<br />

finalmente, se ha llevado a cabo una puesta a punto operativa <strong>de</strong>l producto,<br />

contando con el apoyo <strong>de</strong>l Instituto Nacional <strong>de</strong> Meteorología.<br />

A continuación se <strong>de</strong>scriben más en <strong>de</strong>talle las principales aportaciones<br />

realizadas:<br />

1. Se ha <strong>de</strong>sarrollado un nuevo método <strong>de</strong> predicción local (downscaling)<br />

para la predicción a corto plazo empleando una técnica <strong>de</strong> agrupamiento<br />

pon<strong>de</strong>rado basada en el algoritmo <strong>de</strong> k-medias. Este método<br />

es, computacionalmente, menos costoso y más eficiente, que el método<br />

estándar <strong>de</strong> análogos (vecinos cercanos) utilizado frecuentemente en la<br />

literatura. Se han llevado a cabo diversos experimentos <strong>de</strong> comparación<br />

con otras técnicas, consi<strong>de</strong>rando la precipitación y la racha máxima <strong>de</strong><br />

viento diarias sobre una red <strong>de</strong> 98 estaciones en la Península Ibérica, y<br />

un período <strong>de</strong> tiempo apropiado para que los resultados sean significativos<br />

(1998-99). Esta comparaciones han mostrado la superioridad <strong>de</strong>l<br />

nuevo método para la predicción <strong>de</strong> eventos <strong>de</strong> baja frecuencia (eventos<br />

raros o extremos) y un comportamiento similar para eventos más<br />

frecuentes (ver Cofiño et al., 2001a; Gutiérrez et al., 2004a).<br />

2. Se ha generalizado el método anterior, utilizando re<strong>de</strong>s auto-organizativas<br />

para trabajar con sistemas <strong>de</strong> predicción por conjuntos, <strong>de</strong> forma<br />

que, éstos <strong>de</strong>finen un histograma en la retícula <strong>de</strong> la red que permite<br />

caracterizar la dispersión <strong>de</strong> los miembros y llevar a cabo la predicción<br />

local <strong>de</strong> forma consistente. Con este esquema se ha <strong>de</strong>mostrado que<br />

existe una relación entre la dispersión <strong>de</strong> la red auto-organizativa (medida<br />

como suma <strong>de</strong> <strong>de</strong>sviación típica mas entropía <strong>de</strong> la probabilidad<br />

resultante) y el error <strong>de</strong> las predicciones, <strong>de</strong> forma que dispersiones<br />

gran<strong>de</strong>s tienen asociados errores mayores. Esta técnica se ha aplicado<br />

en:<br />

La predicción por conjuntos a medio plazo en la península Ibérica.<br />

En este caso se ha mostrado que las predicciones locales obtenidas<br />

son mejores para el caso <strong>de</strong> la predicción por conjuntos que las<br />

obtenidas por un mo<strong>de</strong>lo tradicional con un sólo miembro (ver<br />

Cofiño et al., 2003a).<br />

La predicción estacional latitu<strong>de</strong>s tropicales (más concretamente<br />

en Perú). En este caso se ha <strong>de</strong>mostrado que es posible pre<strong>de</strong>cir<br />

anomalías positivas <strong>de</strong> precipitación en eventos fuertes <strong>de</strong> El<br />

Niño. Este trabajo se ha llevando a cabo en el marco <strong>de</strong>l Proyecto


1.3. PRINCIPALES APORTACIONES 5<br />

DEMETERwww.ecmwf.int/research/<strong>de</strong>meter <strong>de</strong>l V Programa<br />

Marco (ver Cofiño et al., 2003d; Gutiérrez et al., 2004).<br />

3. Los algoritmos y métodos propuestos en esta Tesis, así como algunos<br />

algoritmos estándar, han sido implementados en un paquete (toolbox)<br />

<strong>de</strong> Matlab <strong>de</strong>nominado MeteoLab que permite diseñar fácilmente, en<br />

un entorno gráfico, diferentes tipos <strong>de</strong> experimentos <strong>de</strong> predicción local,<br />

y validar los resultados obtenidos. Este sistema pue<strong>de</strong> ser integrado<br />

fácilmente en el ciclo operativo <strong>de</strong> producción aplicado a un problema<br />

<strong>de</strong> predicción local particular. En concreto, trabajando en colaboración<br />

con el INM se ha <strong>de</strong>sarrollado un prototipo operativo (PROME-<br />

TEO) para la predicción local <strong>de</strong> distintos meteoros (precipitación,<br />

racha máxima <strong>de</strong> viento, nieve, tormenta, etc.) en 2500 estaciones distribuidas<br />

en las distintas cuencas hidrográficas Españolas. El sistema<br />

<strong>de</strong>sarrollado se encuentra operativo y produce un total <strong>de</strong> 160000 predicciones<br />

diarias (consultar meteo.macc.unican.es/prometeo).<br />

Para hacer accesibles estas predicciones al público en general, se ha<br />

<strong>de</strong>sarrollado una aplicación Web <strong>de</strong> forma que se puedan consultar las<br />

predicciones en tiempo real, y que incluso éstas puedan ser verificadas<br />

obteniendo distintos índices <strong>de</strong> calidad. Para ello, se ha hecho uso <strong>de</strong><br />

las tecnologías <strong>de</strong> la información vigentes que, por una parte, permiten<br />

acce<strong>de</strong>r a bases <strong>de</strong> datos (para almacenar las predicciones) y, por<br />

otra, permiten ejecutar la aplicación con unos parámetros concretos<br />

<strong>de</strong> interés (región geográfica, patrón atmosférico, etc...).<br />

Figura 1.1: Web <strong>de</strong> PROMETEO http://meteo.macc.unican.es/prometeo/<br />

4. También se han llevado a cabo los primeros experimentos utilizando la<br />

tecnología emergente GRID que permite acce<strong>de</strong>r <strong>de</strong> forma uniforme a


6 1. ORGANIZACIÓN Y APORTACIONES DE LA TESIS<br />

recursos <strong>de</strong> almacenamiento y computacionales distribuidos geográficamente<br />

por toda la Web (ver, como referencia, www.gridforum.org).<br />

Este entorno permite dotar <strong>de</strong> interactividad al sistema Prometeo <strong>de</strong>sarrollado,<br />

permitiendo que distintos usuarios puedan configurar en<br />

tiempo real la aplicación según sus necesida<strong>de</strong>s. Para ello, se ha paralelizado<br />

alguna <strong>de</strong> las partes más costosas <strong>de</strong>l sistema (en concreto<br />

las técnicas <strong>de</strong> agrupamiento) para analizar el comportamiento y las<br />

necesida<strong>de</strong>s en este nuevo entorno. Estos experimentos, <strong>de</strong>scritos en<br />

la Sección 7.5, han mostrado que ninguno <strong>de</strong> los esquemas <strong>de</strong> paralelización<br />

empleados es óptimo en todos los casos, sino que según las<br />

características <strong>de</strong> los recursos disponibles en el entorno <strong>de</strong> cada ejecución<br />

unos resultan más eficientes que otros (potencia <strong>de</strong> cálculo,<br />

memoria, latencias y anchos <strong>de</strong> banda <strong>de</strong> la red, etc.); esto plantea<br />

la necesidad <strong>de</strong> <strong>de</strong>sarrollar una nueva generación <strong>de</strong> técnicas <strong>de</strong> paralelización<br />

que se adapten a los recursos disponibles durante su ejecución.<br />

Este trabajo se está llevando a cabo en el marco <strong>de</strong>l Proyecto<br />

CrossGrid www.crossgrid.org <strong>de</strong>l V Programa Marco <strong>de</strong> la UE (ver<br />

Cofiño et al., 2003b; Gutiérrez et al., 2003).<br />

1.4. Trabajo Futuro<br />

El trabajo <strong>de</strong> esta Tesis tiene su continuidad en el proyecto integrado<br />

ENSEMBLES <strong>de</strong>l VI Programa Marco (2004-2008). Este proyecto reúne a<br />

los principales centros y grupos europeos <strong>de</strong> investigación meteorológica para<br />

abordar el problema <strong>de</strong> cambio climático y sus impactos, <strong>de</strong>sarrollando<br />

un sistema multi-mo<strong>de</strong>lo <strong>de</strong> predicción por conjuntos. El grupo <strong>de</strong> investigación<br />

<strong>de</strong> Inteligencia Artificial en Meteorología (AIMet) <strong>de</strong> la Universidad <strong>de</strong><br />

Cantabria participa en este proyecto, en el que, entre otras, se aplicarán las<br />

técnicas <strong>de</strong>sarrolladas en esta Tesis para la caracterización probabilística <strong>de</strong><br />

posibles escenarios <strong>de</strong> cambio climático. Por tanto, la principal línea futura<br />

<strong>de</strong> investigación será la adaptación <strong>de</strong> los métodos y herramientas <strong>de</strong>sarrollados<br />

a este marco <strong>de</strong> trabajo con nuevos alcances temporales, variables y<br />

características.<br />

Otra línea futura <strong>de</strong> investigación es analizar <strong>de</strong> forma más exhaustiva<br />

la conveniencia <strong>de</strong> distintas representaciones <strong>de</strong> los patrones atmosféricos<br />

utilizados en el trabajo (por ejemplo usando EOFs obtenidas <strong>de</strong> un análisis<br />

<strong>de</strong> correlación canónica y que, por tanto, no sean genéricas sino que estén<br />

asociadas con las observaciones). También el uso <strong>de</strong> ERA-40 como re-análisis<br />

<strong>de</strong> referencia y un estudio comparativo con el re-análisis ERA-15 usado en<br />

esta Tesis.<br />

También se planea seguir avanzando en el portal <strong>de</strong> la aplicación PRO-<br />

METEO, introduciendo las predicciones a medio plazo obtenidas con la red<br />

auto-organizativa. En esta dirección se seguirá <strong>de</strong>sarrollando y probando la<br />

aplicación GRID que permitirá evaluar la conveniencia actual <strong>de</strong> esta nueva<br />

tecnología en distintos problemas <strong>de</strong> meteorología .


1.5. ALGUNOS ACRÓNIMOS Y TERMINOLOGÍA UTILIZADOS 7<br />

1.5. Algunos Acrónimos y Terminología Utilizados<br />

ARPS. Advanced Regional Prediction System,www.caps.ou.edu/ARPS.<br />

BS. Brier Score; error cuadrático medio <strong>de</strong> la probabilidad predicha<br />

menos la probabilidad observada (ver Cap. 4).<br />

BSS. Brier Skill Score; índice <strong>de</strong> pericia que se obtiene como 1 −<br />

BSP/BSR, don<strong>de</strong> BSP es el BS <strong>de</strong> la predicción y BSR es el BS <strong>de</strong><br />

un sistema <strong>de</strong> referencia, normalmente la climatología (ver Cap. 4).<br />

COAMPS. US Navy‘s Coupled Ocean/Atmosphere Mesoscale Prediction<br />

System, www.nrlmry.navy.mil/projects/coamps.<br />

CP. Componente principal (ver Sec. 3.2).<br />

Downscaling. Mejora <strong>de</strong> resolución (o interpolación) <strong>de</strong> una predicción<br />

<strong>de</strong> un mo<strong>de</strong>lo numérico efectuada en una rejilla.<br />

ECMWF. Centro europeo para predicción a plazo medio (European<br />

Center for Medium-Range Weather Forecast), www.ecmwf.org.<br />

ENSO. Patrón <strong>de</strong> oscilación <strong>de</strong> El Niño-Pacífico Sur (El Niño-Southern<br />

Oscillation) (ver Sec. 3.2 y 6.5).<br />

EOF. Función empírica ortogonal (Empirical Ortogonal Function) (ver<br />

Sec. 3.2).<br />

EPS. Sistema <strong>de</strong> predicción por conjuntos (Ensemble Prediction System).<br />

HIRLAM. Mo<strong>de</strong>lo <strong>de</strong> área limitada <strong>de</strong> alta resolución (High Resolution<br />

Limited Area Mo<strong>de</strong>l) hirlam.knmi.nl.<br />

INM. Instituto Nacional <strong>de</strong> Meteorología, www.inm.es.<br />

LAN. Red <strong>de</strong> área local (Local Area Network).<br />

MM5. Penn State/NCAR Mesoscale Mo<strong>de</strong>l, box.mmm.ucar.edu/mm5.<br />

NAO. Oscilación <strong>de</strong>l Atlántico Norte (North Atlantic Oscillation) (ver<br />

Sec. 3.2 y 6.5).<br />

NCEP. National Centers for Environmental Prediction:<br />

www.ncep.noaa.gov.<br />

NHC. National Hurricane Center, www.nhc.noaa.gov.<br />

Patrón. Estructura numérica con una cierta organización <strong>de</strong> sus elementos<br />

(por ejemplo, una estructura matricial o tensorial relativa a<br />

una rejilla sobre una region geográfica concreta). Para su tratamiento<br />

matemático los patrones serán consi<strong>de</strong>rados vectores, <strong>de</strong>scomponiendo


8 1. ORGANIZACIÓN Y APORTACIONES DE LA TESIS<br />

su estructura <strong>de</strong> forma apropiada, y componiéndola <strong>de</strong> nuevo cuando<br />

sea necesario.<br />

Re-análisis. Experimento <strong>de</strong> simulación numérica <strong>de</strong> la circulación<br />

atmosférica para un largo período <strong>de</strong> tiempo con un mismo mo<strong>de</strong>lo<br />

numérico, asimilando toda la información disponible (ver Sec. 2.7.3).<br />

RMSE. Error cuadrático medio (Root Mean Square Error).<br />

ROC, curva. Relative Operating Characteristic. Curva obtenida a partir<br />

<strong>de</strong> los aciertos y las falsas alarmas <strong>de</strong> un sistema <strong>de</strong> predicción<br />

binario (ver Cap. 4).<br />

RSM. Mo<strong>de</strong>lo regional espectral <strong>de</strong>l NCEP (Regional Spectral Mo<strong>de</strong>l).<br />

SLP. Presión a nivel <strong>de</strong>l mar (Sea Level Pressure).<br />

SOM. Re<strong>de</strong>s auto-organizativas (Self-Organizing Maps) para agrupamiento<br />

y visualización <strong>de</strong> datos (ver sec. 3.4).<br />

SST. Temperatura <strong>de</strong> la superficie <strong>de</strong>l agua <strong>de</strong>l mar (Sea Surface Temperature).<br />

UTC. Coor<strong>de</strong>nadas universales <strong>de</strong> tiempo (Universal Time Coordinates).<br />

WAN. Red <strong>de</strong> área extendida (Wi<strong>de</strong> Area Network), en contraposición<br />

a las LAN.


Parte I<br />

Estado <strong>de</strong>l Conocimiento<br />

9


CAPÍTULO 2<br />

Mo<strong>de</strong>los y Datos Atmosféricos<br />

2.1. Introducción<br />

El esfuerzo investigador llevado a cabo en las tres últimas décadas ha permitido<br />

un gran avance en el <strong>de</strong>sarrollo <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> circulación atmosférica<br />

que incorporan las parametrizaciones <strong>de</strong> los fenómenos físicos relevantes,<br />

a<strong>de</strong>cuados a las escalas espaciales a que dichos mo<strong>de</strong>los se aplican. Por otra<br />

parte, la aplicación operativa <strong>de</strong> estos mo<strong>de</strong>los ha sido posible gracias a la<br />

disponibilidad <strong>de</strong> mejores y más complejos sistemas <strong>de</strong> observación (subsistema<br />

<strong>de</strong> observación terrestre: SYNOP, SHIP, TEMP, AIREP, DRIBU,<br />

etc. y subsistema espacial: SATEM, SATOB, etc., disponibles varias veces<br />

al día). Estos datos observacionales pue<strong>de</strong>n ser asimilados en los mo<strong>de</strong>los<br />

gracias al <strong>de</strong>sarrollo y uso sucesivo <strong>de</strong> métodos <strong>de</strong> interpolación óptima y<br />

métodos <strong>de</strong> asimilación variacionales 3D y 4D, puestos a punto con el fin<br />

<strong>de</strong> establecer con la menor incertidumbre posible las condiciones iniciales a<br />

partir <strong>de</strong> las cuales se integran los mo<strong>de</strong>los <strong>de</strong> predicción.<br />

Como resultado <strong>de</strong> este esfuerzo, se dispone en la actualidad <strong>de</strong> eficientes<br />

mo<strong>de</strong>los atmosféricos que se utilizan para la elaboración <strong>de</strong> un amplio abanico<br />

<strong>de</strong> predicciones con distintos alcances temporales. Por una parte, para<br />

la predicción a corto y medio plazo se utilizan mo<strong>de</strong>los numéricos <strong>de</strong> área<br />

limitada y alta resolución; por otra, los mo<strong>de</strong>los acoplados océano-atmósfera<br />

<strong>de</strong> circulación general se aplican para la predicción <strong>de</strong> anomalías en la<br />

predicción estacional y para la preparación <strong>de</strong> escenarios climatológicos en<br />

función <strong>de</strong> diversos supuestos <strong>de</strong> forzamiento radiativo (duplicación <strong>de</strong>l nivel<br />

<strong>de</strong> CO 2 , etc.).<br />

En este capítulo se <strong>de</strong>scriben brevemente las características más importantes<br />

<strong>de</strong> los mo<strong>de</strong>los y procesos numéricos involucrados en la predicción<br />

numérica <strong>de</strong>l tiempo. Las salidas <strong>de</strong> estos mo<strong>de</strong>los se utilizan en el resto <strong>de</strong><br />

11


12 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

la Tesis como datos <strong>de</strong> entrada, o predictores, en los distintos métodos propuestos.<br />

En la Sección 2.2 se <strong>de</strong>scriben brevemente los principales procesos<br />

físicos que intervienen en la dinámica atmosférica. En la Sec. 2.3 se analizan<br />

algunos aspectos y limitaciones <strong>de</strong> la resolución numérica <strong>de</strong> estas ecuaciones.<br />

Por ejemplo, la Sec. 2.3.1 analiza el problema <strong>de</strong> la asimilación <strong>de</strong> datos,<br />

y la Sec. 2.3.2 <strong>de</strong>scribe las parametrizaciones introducidas en el mo<strong>de</strong>lo (y<br />

en la discretización <strong>de</strong>l esquema numérico) para incluir los procesos físicos<br />

<strong>de</strong> menor escala que escapan a la resolución <strong>de</strong> la discretización (turbulencia,<br />

etc.). En la Sec. 2.4 se <strong>de</strong>scriben las características (resolución, alcance,<br />

etc.) <strong>de</strong> los principales tipos <strong>de</strong> mo<strong>de</strong>los utilizados en predicción operativa,<br />

y en la Sec. 2.5 se <strong>de</strong>scribe el estado actual <strong>de</strong> las predicciones operativas<br />

que se obtienen diariamente con estos mo<strong>de</strong>los; por otra parte, la Sec. 2.6<br />

se comentan brevemente las líneas <strong>de</strong> mayor interés en este campo <strong>de</strong> cara<br />

al futuro. Finalmente, la Sección 2.7 <strong>de</strong>scribe los datos climatológicos (observaciones)<br />

y meteorológicos (simulaciones <strong>de</strong> mo<strong>de</strong>los) que se utilizan en<br />

esta Tesis.<br />

2.2. Las Ecuaciones <strong>de</strong> la Atmósfera<br />

El objetivo <strong>de</strong> esta sección es dar una breve <strong>de</strong>scripción <strong>de</strong> las ecuaciones<br />

que <strong>de</strong>scriben la dinámica <strong>de</strong> la atmósfera, con el único objetivo <strong>de</strong><br />

que proporcione al lector una visión general sobre la complejidad <strong>de</strong> los mo<strong>de</strong>los<br />

involucrados en la predicción numérica <strong>de</strong>l tiempo. Para un estudio<br />

<strong>de</strong>tallado, existen numerosos libros <strong>de</strong> meteorología dinámica con excelentes<br />

explicaciones y ejemplos <strong>de</strong> las <strong>de</strong>ducciones y <strong>de</strong>scripciones físicas <strong>de</strong><br />

las ecuaciones (ver, por ejemplo, Holton, 1992; Barry and Chorley, 1998;<br />

Kalnay, 2003).<br />

Des<strong>de</strong> un punto <strong>de</strong> vista físico, la atmósfera pue<strong>de</strong> ser consi<strong>de</strong>rada como<br />

una mezcla <strong>de</strong> gases y agua en sus distintos estados. Esta mezcla está en<br />

movimiento <strong>de</strong>ntro <strong>de</strong> un campo gravitatorio sobre una esfera en rotación y<br />

calentada por el Sol. En este sistema se <strong>de</strong>ben cumplir la ecuación <strong>de</strong> estado<br />

<strong>de</strong> los gases y las leyes <strong>de</strong> conservación <strong>de</strong> energía, masa y momento. Algunas<br />

<strong>de</strong> estas leyes se traducen en ecuaciones que relacionan las <strong>de</strong>rivadas<br />

totales <strong>de</strong> ciertas magnitu<strong>de</strong>s físicas en el tiempo. Estas <strong>de</strong>rivadas son normalmente<br />

<strong>de</strong>scompuestas en sus términos locales y advectivo. Por ejemplo,<br />

consi<strong>de</strong>rando el campo <strong>de</strong> velocida<strong>de</strong>s v = (u, v, w) asociado al sistema <strong>de</strong><br />

referencia (x, y, z) se tendrá:<br />

df<br />

dt = ∂f<br />

∂t + ∂f dx<br />

∂x dt + ∂f dy<br />

∂y dt + ∂f dz<br />

∂z dt = ∂f<br />

∂t<br />

+ v · ∇f (2.1)<br />

don<strong>de</strong> f(x, y, z, t). Esta ecuación indica que la <strong>de</strong>rivada total en el tiempo<br />

(Lagrangiana o individual) <strong>de</strong> una función, viene dada por la <strong>de</strong>rivada local<br />

en el tiempo (parcial, o Euleriana) mas los cambios <strong>de</strong>bidos al término <strong>de</strong><br />

advección.


2.2. LAS ECUACIONES DE LA ATMÓSFERA 13<br />

Según la ecuación <strong>de</strong> conservación <strong>de</strong> masa, la variación total en el<br />

tiempo <strong>de</strong> la masa en una parcela <strong>de</strong> aire es nula (dM/dt = 0). La<br />

masa <strong>de</strong> aire contenida en un volumen ∆x∆y∆z es:<br />

M = ρ∆x∆y∆z (2.2)<br />

don<strong>de</strong> ρ es la <strong>de</strong>nsidad <strong>de</strong>l aire. Consi<strong>de</strong>rando la ecuación<br />

1 dM<br />

M dt<br />

= 0, (2.3)<br />

sustituyendo (2.2) y aplicando (2.1) se tiene la ecuación <strong>de</strong> conservación<br />

<strong>de</strong> masa<br />

ya que ∂u/∂x = ∆x −1 d∆x/dt.<br />

1 dρ<br />

ρ dt + ∇ · v = 0 ⇔ ∂ρ = −∇ · (ρ v), (2.4)<br />

∂t<br />

La ecuación <strong>de</strong> conservación <strong>de</strong> vapor <strong>de</strong> agua indica que la cantidad<br />

total <strong>de</strong> vapor <strong>de</strong> agua en una parcela <strong>de</strong> aire se conserva, excepto<br />

cuando esta se mueve sobre fuentes (evaporación E) o sumi<strong>de</strong>ros (con<strong>de</strong>nsación<br />

C):<br />

dq<br />

dt = E − C (2.5)<br />

don<strong>de</strong> q es la proporción en masa <strong>de</strong> vapor <strong>de</strong> agua en la parcela <strong>de</strong><br />

aire (g/kg). Si a esta ecuación la multiplicamos por ρ, la expandimos<br />

según (2.1) y la sumamos la ecuación <strong>de</strong> conservación <strong>de</strong> masa (2.4)<br />

multiplicada por q, queda<br />

∂ρ q<br />

∂t<br />

= −∇ · (ρ v q) + ρ (E − C). (2.6)<br />

De la misma forma que se ha incluido una ecuación <strong>de</strong> conservación<br />

para el vapor <strong>de</strong> agua, se podría incluir cualquier otra ecuación <strong>de</strong> conservación<br />

para otros elementos como agua líquida, ozono, etc., mientras<br />

también se incluyan sus correspondientes fuentes y sumi<strong>de</strong>ros.<br />

La ecuación <strong>de</strong> estado <strong>de</strong> los gases i<strong>de</strong>ales aplicada a la atmósfera impone<br />

la siguiente relación entre las variables <strong>de</strong> estado termodinámicas:<br />

p α = R T, (2.7)<br />

don<strong>de</strong> p es la presión (mb ó Hpa), T la temperatura ( o C ó K), R es la<br />

constante <strong>de</strong> los gases i<strong>de</strong>ales, y α es el volumen específico (m 3 /kg),<br />

inverso <strong>de</strong> la <strong>de</strong>nsidad ρ (kg/m 3 ).<br />

Conservación <strong>de</strong> energía: El foco principal <strong>de</strong> calor para la atmósfera<br />

es la superficie terrestre (calentada por el Sol), entendiendo como tal<br />

tierra y océano. El calor recibido por la atmósfera se emplea en variar


14 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

su temperatura, su <strong>de</strong>nsidad o ambas cosas a la vez. Si se aplica una<br />

tasa <strong>de</strong> calor Q por unidad <strong>de</strong> masa a una parcela <strong>de</strong> aire (cal/sg), esta<br />

energía es empleada en aumentar la energía interna C v T y producir<br />

un trabajo <strong>de</strong> expansión<br />

dT<br />

Q = C v<br />

dt + pdα dt , (2.8)<br />

don<strong>de</strong> los coeficientes <strong>de</strong> calor específico a volumen constante (C v ) y a<br />

presión constante (C p ) se relacionan mediante C p = C v +R. Haciendo<br />

uso <strong>de</strong> la ecuación <strong>de</strong> estado se pue<strong>de</strong> obtener un forma alternativa <strong>de</strong><br />

la ecuación <strong>de</strong> conservación <strong>de</strong> energía:<br />

Conservación <strong>de</strong>l Momento:<br />

dv<br />

dt<br />

Q = C p<br />

dT<br />

dt − αdp dt . (2.9)<br />

= −α∇p − ∇φ + F − 2Ω × v; (2.10)<br />

La aceleración sobre la unidad <strong>de</strong> masa es <strong>de</strong>bida a cuatro fuerzas:<br />

gradiente <strong>de</strong> presión (−α∇p), gravedad aparente (−∇φ), rozamiento<br />

(F) y Coriolis (−2Ω × v).<br />

Por tanto, resumiendo lo anterior se tienen siete ecuaciones y siete incógnitas:<br />

v = (u, v, w), T, p, ρ = 1/α y q:<br />

dv<br />

dt<br />

= −α∇p − ∇φ + F − 2Ω × v (2.11)<br />

∂ρ<br />

∂t<br />

= −∇ · (ρ v) (2.12)<br />

p α = R T (2.13)<br />

dT<br />

Q = C p<br />

dt − αdp dt<br />

(2.14)<br />

∂ρ q<br />

∂t<br />

= −∇ · (ρ v q) + ρ (E − C) (2.15)<br />

A las ecuaciones anteriores se las suele <strong>de</strong>nominar ecuaciones primitivas,<br />

y representan el sistema que gobierna la dinámica <strong>de</strong> la atmósfera. El<br />

objetivo <strong>de</strong> la predicción numérica <strong>de</strong>l tiempo es obtener el estado <strong>de</strong> la<br />

circulación atmosférica en un tiempo futuro. Para ello es necesario disponer<br />

<strong>de</strong> un mo<strong>de</strong>lo numérico capaz <strong>de</strong> integrar las ecuaciones y que incluya<br />

los intercambios energéticos (en la capa límite) más importantes (radiación,<br />

turbulencia, calor latente, etc.). Dada la no linealidad y complejidad <strong>de</strong> las<br />

ecuaciones primitivas, en la práctica se suele recurrir a distintas aproximaciones<br />

que simplifican la resolución numérica y eliminan inestabilida<strong>de</strong>s<br />

numéricas.


2.3. RESOLUCIÓN NUMÉRICA DE LAS ECUACIONES 15<br />

2.2.1. Filtrado <strong>de</strong> Soluciones Triviales<br />

Las simplificaciones más básicas <strong>de</strong> las ecuaciones anteriores ayudan a<br />

enten<strong>de</strong>r las características <strong>de</strong> los tipos <strong>de</strong> ondas básicos presentes en la<br />

atmósfera, que también aparecen en las soluciones más generales. Por ejemplo,<br />

suponiendo que el movimiento es adiabático, rectilíneo, y sin gravedad, se<br />

obtienen como soluciones las ondas sonoras puras que se propagan a través<br />

<strong>de</strong> la compresión <strong>de</strong>l aire. Si se consi<strong>de</strong>ra la aproximación hidrostática (sin<br />

velocidad vertical, w=0), las ondas sonoras sólo se propagan horizontalmente<br />

(ondas <strong>de</strong> Lamb). Por otra parte, si se supone que no hay movimiento<br />

horizontal, pero sí <strong>de</strong>splazamientos verticales (el movimiento se consi<strong>de</strong>ra<br />

adiabático y rectilíneo), entonces el resultado son las ondas gravitatorias<br />

externas: ‘oleaje’ en la superficie libre; y las ondas gravitatorias internas:<br />

cualquier partícula <strong>de</strong> fluido <strong>de</strong>splazada <strong>de</strong> su nivel <strong>de</strong> equilibrio oscila verticalmente<br />

con un periodo típico <strong>de</strong> 100s (frecuencia <strong>de</strong> Brunt-Vaisala). Por<br />

otra parte, consi<strong>de</strong>rando un flujo zonal (v = w = 0) y un campo uniforme <strong>de</strong><br />

<strong>de</strong>nsidad, cualquier perturbación al flujo zonal supone un cambio <strong>de</strong> latitud<br />

y por tanto un cambio en la fuerza <strong>de</strong> Coriolis, que siempre actúa tratando<br />

<strong>de</strong> restaurar el flujo zonal produciendo las llamadas ondas <strong>de</strong> Rossby que se<br />

propagan alre<strong>de</strong>dor <strong>de</strong>l globo con un periodo <strong>de</strong> <strong>de</strong>sarrollo <strong>de</strong> varios días a<br />

una semana y con una longitud <strong>de</strong> onda <strong>de</strong>l or<strong>de</strong>n <strong>de</strong> 3000 km para latitu<strong>de</strong>s<br />

medias (ϕ = 45 o ).<br />

Como interesa que las soluciones obtenidas para la circulación <strong>de</strong> la atmósfera<br />

en un problema operativo muestren el comportamiento <strong>de</strong> interés meteorológico,<br />

es <strong>de</strong>seable eliminar algunas <strong>de</strong> las ondas básicas que no interfieren<br />

con esta dinámica, pero que pue<strong>de</strong>n producir inestabilida<strong>de</strong>s en el mo<strong>de</strong>lo<br />

numérico al ser propagadas (esto ocurre, por ejemplo con las ondas sonoras<br />

y gravitatorias). Este procedimiento <strong>de</strong> selección <strong>de</strong> tipos <strong>de</strong> ondas se<br />

<strong>de</strong>nomina filtrado y consiste en eliminar parcialmente las fuerzas restauradoras<br />

que originan la onda que se <strong>de</strong>sea filtrar. Por ejemplo, la aproximación<br />

hidrostática impi<strong>de</strong> la propagación vertical <strong>de</strong> las ondas sonoras.<br />

Por tanto, los mo<strong>de</strong>los operativos utilizados en la predicción numérica<br />

<strong>de</strong>l tiempo son aproximaciones más o menos completas <strong>de</strong> las ecuaciones<br />

primitivas <strong>de</strong> la atmósfera.<br />

2.3. Resolución Numérica <strong>de</strong> las Ecuaciones<br />

Los mo<strong>de</strong>los atmosféricos <strong>de</strong> circulación se resuelven utilizando técnicas<br />

numéricas que discretizan el espacio y el tiempo. En coor<strong>de</strong>nadas cartesianas<br />

se consi<strong>de</strong>ra una rejilla 4D sobre la que se aplican técnicas <strong>de</strong> elementos<br />

finitos, mientras que en coor<strong>de</strong>nadas esféricas se aplican técnicas espectrales<br />

que consi<strong>de</strong>ran un número finito <strong>de</strong> armónicos esféricos en la predicción<br />

(para introducción a estos métodos ver Kalnay, 2003). En ambos casos, la<br />

precisión <strong>de</strong>l mo<strong>de</strong>lo está fuertemente influenciada por la resolución espacial<br />

(dada directamente por el tamaño <strong>de</strong> rejilla o por el período <strong>de</strong>l modo


16 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

<strong>de</strong> mayor frecuencia). Sin embargo, aumentar la resolución <strong>de</strong>l mo<strong>de</strong>lo es<br />

extremadamente costoso ya que, por ejemplo, duplicar la resolución en el<br />

espacio tridimensional también requiere reducir a la mitad el paso <strong>de</strong> tiempo<br />

para satisfacer las condiciones <strong>de</strong> estabilidad computacional. Por tanto,<br />

el coste computacional total <strong>de</strong> duplicar la resolución crece con un factor<br />

<strong>de</strong> 2 4 = 16. Las técnicas mo<strong>de</strong>rnas <strong>de</strong> discretización intentan obtener un<br />

incremento en la precisión sin tanto coste computacional; estas técnicas son<br />

los esquemas semi-implícitos y semi-lagrangiano en el tiempo. A<strong>de</strong>más, estos<br />

esquemas poseen condiciones <strong>de</strong> estabilidad menos estrictas. Aún así,<br />

existe una constante necesidad <strong>de</strong> aumentar la resolución para obtener una<br />

predicción mejor y más <strong>de</strong>tallada. Esta tarea es la mayor aplicación <strong>de</strong> los<br />

super-or<strong>de</strong>nadores disponibles (www.top500.org).<br />

A pesar <strong>de</strong> los avances logrados en cuanto a la mo<strong>de</strong>lización física <strong>de</strong><br />

la atmósfera y a la resolución numérica <strong>de</strong> los mo<strong>de</strong>los, la notable mejora<br />

en la capacidad <strong>de</strong> predicción se <strong>de</strong>be principalmente a otros factores. Por<br />

ejemplo, Kalnay (2003) <strong>de</strong>scribe los siguientes factores:<br />

Por un lado, el aumento <strong>de</strong> la potencia <strong>de</strong> los super-or<strong>de</strong>nadores permitiendo<br />

resoluciones mucho más finas y menos aproximaciones en los<br />

mo<strong>de</strong>los atmosféricos operacionales.<br />

El aumento <strong>de</strong> la disponibilidad <strong>de</strong> datos, especialmente <strong>de</strong> proce<strong>de</strong>ntes<br />

<strong>de</strong> satélites y aviones sobre los océanos y el hemisferio Sur.<br />

El uso <strong>de</strong> métodos más exactos <strong>de</strong> asimilación <strong>de</strong> datos, lo que resulta<br />

en una mejor condición inicial para los mo<strong>de</strong>los.<br />

La mejora en la representación <strong>de</strong> procesos físicos <strong>de</strong> escala pequeña<br />

en los mo<strong>de</strong>los (nubes, precipitación, transferencia <strong>de</strong> calor en régimen<br />

turbulento, humedad, radiación, etc.).<br />

En las siguientes secciones se analizan estos temas en más <strong>de</strong>talle.<br />

2.3.1. Asimilación <strong>de</strong> Datos<br />

La predicción numérica es un problema <strong>de</strong> condicionas iniciales: dada una<br />

estimación actual <strong>de</strong>l estado <strong>de</strong> la atmósfera, un mo<strong>de</strong>lo numérico simula su<br />

evolución, para obtener una predicción. Esta condición inicial se establece<br />

a partir <strong>de</strong> la interpolación <strong>de</strong> las observaciones disponibles a los puntos <strong>de</strong><br />

rejilla <strong>de</strong>l mo<strong>de</strong>lo, y el proceso <strong>de</strong> obtención es <strong>de</strong>nominado asimilación. Sin<br />

embargo, el principal problema es que la cantidad <strong>de</strong> datos disponibles no<br />

es suficiente para inicializar el mo<strong>de</strong>lo en todos sus grados <strong>de</strong> libertad (por<br />

ejemplo, un mo<strong>de</strong>lo con una resolución típica <strong>de</strong> 1 o <strong>de</strong> resolución horizontal<br />

y 20 niveles verticales podría tener 180 × 360 × 20 = 1.3 × 10 6 puntos <strong>de</strong><br />

rejilla, en cada uno <strong>de</strong> los cuales están <strong>de</strong>finidas 7 variables, con lo que<br />

tendríamos aproximadamente 10 7 grados <strong>de</strong> libertad). Para una ventana<br />

temporal <strong>de</strong> ±3 horas, existen normalmente entre 10 4 y 10 5 observaciones


2.3. RESOLUCIÓN NUMÉRICA DE LAS ECUACIONES 17<br />

<strong>de</strong> la atmósfera, dos ór<strong>de</strong>nes <strong>de</strong> magnitud menor que el número <strong>de</strong> grados<br />

<strong>de</strong> libertad <strong>de</strong>l mo<strong>de</strong>lo. Mas aún, la distribución espacial y temporal <strong>de</strong> las<br />

observaciones no es uniforme, existiendo regiones en Eurasia y Norteamérica<br />

con muchos datos, y regiones en el Hemisferio Sur con pocos datos. Entonces<br />

se hace necesario usar información adicional (llamado fondo, first-guess o<br />

información a priori) para preparar las condiciones iniciales <strong>de</strong> la predicción.<br />

Inicialmente se usaba la climatología como first-guess, pero al mejorar la<br />

pericia <strong>de</strong> las predicciones, se utiliza una predicción a corto plazo como<br />

first-guess en los sistemas <strong>de</strong> asimilación <strong>de</strong> datos operacionales (ciclos <strong>de</strong><br />

análisis).<br />

Para los mo<strong>de</strong>los globales, el first-guess es la predicción <strong>de</strong>l mo<strong>de</strong>lo a<br />

las 6 horas, x b (un array 4-dimensional) que es interpolada a los puntos <strong>de</strong><br />

observación mediante un operador H(x b ) y convertida al mismo tipo que<br />

las variables observadas y o . Las diferencias entre las observaciones y el firstguess<br />

y o −H(x b ) son los incrementos observacionales o mejoras, y el análisis<br />

x a se obtiene añadiendo las mejoras al first-guess <strong>de</strong>l mo<strong>de</strong>lo con unos pesos<br />

W que son <strong>de</strong>terminados en base a las covarianzas <strong>de</strong> los errores estadísticos<br />

<strong>de</strong> la predicción y observación:<br />

x a = x b + W[y o − H(x b )] (2.16)<br />

Los diferentes esquemas <strong>de</strong> análisis están basados en este método: interpolación<br />

óptima, don<strong>de</strong> la matriz <strong>de</strong> pesos se <strong>de</strong>termina minimizando los<br />

errores en cada punto <strong>de</strong> rejilla; los métodos variacionales 3D y 4D, con<br />

funciones <strong>de</strong> coste proporcionales al cuadrado <strong>de</strong> la distancia entre el análisis,<br />

el first-guess y las observaciones (sobre un intervalo temporal o ventana<br />

<strong>de</strong> asimilación para el caso 4D); y más recientemente los filtros <strong>de</strong> Kalman<br />

extendidos (Judd, 2003).<br />

A la vista <strong>de</strong> lo anterior po<strong>de</strong>mos interpretar que el ciclo <strong>de</strong> asimilación <strong>de</strong><br />

datos es una continua integración <strong>de</strong>l mo<strong>de</strong>lo que se va perturbando con las<br />

observaciones <strong>de</strong> tal forma que permanezca los más cerca posible <strong>de</strong>l estado<br />

real <strong>de</strong> la atmósfera. La función <strong>de</strong>l mo<strong>de</strong>lo es transportar información <strong>de</strong><br />

zonas con muchos datos, a zonas con pocos datos y ofrecer una estimación<br />

<strong>de</strong>l estado <strong>de</strong> la atmósfera.<br />

Estos errores imponen una incertidumbre en la predicción que es necesario<br />

cuantificar e i<strong>de</strong>ntificar su origen para po<strong>de</strong>r minimizarla y obtener<br />

una mejor predictibilidad. Esto se vuelve importante en el plazo medio y en<br />

la predicción estacional; para ello se recurre a la predicción por conjuntos<br />

(ensemble forecast), que se analiza en una sección posterior.<br />

2.3.2. Parametrización: Procesos Físicos <strong>de</strong> Escala Menor<br />

A pesar <strong>de</strong> que los mo<strong>de</strong>los numéricos tienen cada vez más resolución,<br />

existen muchos procesos atmosféricos que no pue<strong>de</strong>n ser resueltos <strong>de</strong> manera<br />

explícita a la escala que se utiliza en los mo<strong>de</strong>los (algunos ocurren a escala<br />

molecular, como la radiación, evaporación, rozamiento y turbulencia); por


18 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

tanto, estos procesos no están contemplados en las ecuaciones <strong>de</strong> los mo<strong>de</strong>los<br />

que se usan. Estos procesos juegan un papel crucial en el balance energético<br />

global afectando, por supuesto, a los procesos a gran escala. Por esa razón, la<br />

interacción entre escalas no pue<strong>de</strong> ser ignorada por los mo<strong>de</strong>los, y se recurre<br />

a la parametrización. Así, cuando las ecuaciones son discretizadas sobre<br />

un tamaño <strong>de</strong> rejilla dado (<strong>de</strong> unos pocos a varios cientos <strong>de</strong> kilómetros), se<br />

hace necesario añadir términos “fuentes” y “sumi<strong>de</strong>ros” para tener en cuenta<br />

el balance energético asociado a los fenómenos que escapan a la dinámica<br />

formulada en el mo<strong>de</strong>lo numérico.<br />

La parametrización consiste en reformular a gran escala los efectos <strong>de</strong><br />

pequeña escala (ver, por ejemplo, Beniston, 1998). Una dificultad añadida es<br />

que no siempre está claro a qué escala se asigna un fenómeno <strong>de</strong>terminado;<br />

por ejemplo, un mo<strong>de</strong>lo <strong>de</strong> 50 km no resuelve la circulación <strong>de</strong> brisa, pero<br />

tampoco la ignora completamente, <strong>de</strong> manera que el proceso es doblemente<br />

difícil en estos casos. Como ejemplo, se podría consi<strong>de</strong>rar la ecuación <strong>de</strong><br />

conservación <strong>de</strong> vapor <strong>de</strong> agua en coor<strong>de</strong>nadas <strong>de</strong> presión dada por<br />

∂q<br />

∂t + u∂q ∂x + v ∂q<br />

∂y + w∂q ∂p = E − C + ∂w′ q ′<br />

∂p<br />

(2.17)<br />

don<strong>de</strong> q es la proporción <strong>de</strong> vapor <strong>de</strong> agua y masa <strong>de</strong> aire seco, x e y coor<strong>de</strong>nadas<br />

horizontales, p es la presión, t el tiempo, u y v son las componentes<br />

<strong>de</strong> la velocidad horizontal <strong>de</strong>l aire (viento), w = dp<br />

dt<br />

es la velocidad vertical<br />

en coor<strong>de</strong>nadas <strong>de</strong> presión, y el producto <strong>de</strong> las variables prima representa<br />

el transporte turbulento <strong>de</strong> humedad <strong>de</strong>s<strong>de</strong> las escalas no resueltas por la<br />

rejilla usada en la discretización, con la barra horizontal (q) se representan<br />

promedios espaciales sobre la rejilla <strong>de</strong>l mo<strong>de</strong>lo. A la parte izquierda <strong>de</strong><br />

(2.17) se la <strong>de</strong>nomina “dinámica” <strong>de</strong>l mo<strong>de</strong>lo, y se calcula explícitamente.<br />

La parte <strong>de</strong>recha <strong>de</strong> (2.17) se <strong>de</strong>nomina “física” <strong>de</strong>l mo<strong>de</strong>lo. Para la ecuación<br />

<strong>de</strong> la humedad, incluye los efectos <strong>de</strong> los procesos físicos tales como evaporación<br />

(E) y con<strong>de</strong>nsación (C), y transferencias turbulentas <strong>de</strong> humedad que<br />

tienen lugar a escalas pequeñas que no pue<strong>de</strong>n ser resueltas explícitamente<br />

por la “dinámica”.<br />

2.4. Tipos <strong>de</strong> Mo<strong>de</strong>los<br />

Como ya se ha comentado, la estabilidad numérica <strong>de</strong> los métodos <strong>de</strong><br />

integración impone una restricción entre la resolución temporal y la espacial.<br />

Por tanto, las integraciones con gran resolución espacial requerirán un<br />

paso <strong>de</strong> integración pequeño limitando el alcance operativo <strong>de</strong> las mismas,<br />

mientras que las integraciones <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> baja resolución podrán prolongarse<br />

más en el tiempo. Este hecho ha motivado que operativamente se<br />

consi<strong>de</strong>ren distintos tipos o configuraciones <strong>de</strong> mo<strong>de</strong>los numéricos según el<br />

alcance y resolución <strong>de</strong> la predicción <strong>de</strong>seada. A continuación se <strong>de</strong>scriben<br />

las características <strong>de</strong> algunos <strong>de</strong> estos mo<strong>de</strong>los.


2.4. TIPOS DE MODELOS 19<br />

0.1<br />

1<br />

0.3<br />

0.5<br />

1<br />

5<br />

Presion (mb)<br />

3<br />

5<br />

10<br />

50<br />

10<br />

15<br />

20<br />

Nivel<br />

100<br />

200<br />

300<br />

500<br />

1000<br />

25<br />

30<br />

35<br />

40<br />

45<br />

50<br />

60<br />

Figura 2.1: Rejilla global <strong>de</strong> 2.5 o <strong>de</strong> resolución en longitud y latitud utilizada<br />

por mo<strong>de</strong>los <strong>de</strong> circulación general sobre todo el globo; el tamaño <strong>de</strong> la rejilla es<br />

144 × 73 = 10512 puntos. (<strong>de</strong>recha) Dos perfiles verticales con 31 y 60 niveles <strong>de</strong><br />

altura geopotencial (expresados en milibares mb, y en números <strong>de</strong> nivel <strong>de</strong>l mo<strong>de</strong>lo,<br />

respectivamente). La altura máxima mostrada (0.1mb) es <strong>de</strong> aproximadamente 64<br />

km.<br />

2.4.1. Mo<strong>de</strong>los Globales <strong>de</strong> Circulación General<br />

Los mo<strong>de</strong>los globales se integran sobre todo el globo por lo que su tratamiento<br />

numérico se realiza en coor<strong>de</strong>nadas esféricas. Por tanto, la resolución<br />

horizontal <strong>de</strong> estos mo<strong>de</strong>los viene caracterizada por el número <strong>de</strong> modos<br />

esféricos que se consi<strong>de</strong>ren en el <strong>de</strong>sarrollo <strong>de</strong> las soluciones; así, un mo<strong>de</strong>lo<br />

truncado a 144 modos se <strong>de</strong>nomina TL144 y tiene una resolución horizontal<br />

<strong>de</strong> 2.5 grados (aprox. 250 km en nuestra latitud). Este truncamiento también<br />

influye en la resolución vertical (número <strong>de</strong> niveles <strong>de</strong> presión) que habrá <strong>de</strong><br />

ser consistente con la resolución espacial y temporal. Así, el mo<strong>de</strong>lo global<br />

operativo en la predicción a corto plazo <strong>de</strong>l ECMWF (European Center for<br />

Medium-Range Weather Forecast, www.ecmwf.int) es un TL511L60 con 60<br />

niveles <strong>de</strong> presión, mientras que el mo<strong>de</strong>lo utilizado para la predicción estacional<br />

es un T63L31 (la resolución horizontal y vertical <strong>de</strong> este mo<strong>de</strong>lo se<br />

muestra en la Fig. 2.1).<br />

Dada su escasa resolución, estos mo<strong>de</strong>los capturan la dinámica sinóptica<br />

<strong>de</strong> la atmósfera y normalmente son utilizados en la predicción mensual y<br />

estacional, y también en las simulaciones <strong>de</strong> escenarios <strong>de</strong> cambio climático.<br />

En algunos casos, lo mo<strong>de</strong>los <strong>de</strong> circulación general son acoplados con mo<strong>de</strong>los<br />

oceánicos para tener caracterizado este término forzante <strong>de</strong> la atmósfera;<br />

en otros casos, dado que la evolución <strong>de</strong> la atmósfera es la componente rápida<br />

<strong>de</strong>l sistema, la temperatura <strong>de</strong>l agua se supone constante (por ejemplo<br />

en la predicción mensual).<br />

Otros términos como la orografía, el uso <strong>de</strong>l suelo, la cubierta <strong>de</strong> hielo,


20 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

etc. se introducen en el mo<strong>de</strong>lo en la misma rejilla utilizada para la predicción.<br />

Por tanto, la orografía <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> circulación general está muy<br />

suavizada y sólo refleja <strong>de</strong> forma grosera los principales sistemas montañosos<br />

<strong>de</strong>l planeta.<br />

2.4.2. Mo<strong>de</strong>los Regionales<br />

Una solución para aumentar la resolución <strong>de</strong>l mo<strong>de</strong>lo sin incrementar<br />

el coste computacional es consi<strong>de</strong>rar rejillas limitadas a zonas geográficas<br />

<strong>de</strong> especial interés. Por ejemplo, la Fig. 2.2(a) muestra una rejilla <strong>de</strong> 1 o <strong>de</strong><br />

resolución en longitud y latitud centrada en Europa. Debido a su mayor resolución,<br />

los mo<strong>de</strong>los regionales tienen una mayor exactitud para reproducir<br />

fenómenos <strong>de</strong> pequeña escala tales como frentes, y también tienen mejores<br />

forzamientos orográficos que los mo<strong>de</strong>los globales (ver Fig. 2.2(b)). Por otro<br />

lado, al no ser globales, estos mo<strong>de</strong>los tienen la <strong>de</strong>sventaja <strong>de</strong> no ser “autocontenidos”<br />

y, aparte <strong>de</strong> las condiciones iniciales, requieren condiciones <strong>de</strong><br />

contorno en las fronteras <strong>de</strong>l dominio. Estas condiciones <strong>de</strong> contorno necesitan<br />

ser lo más precisas posibles y por ello se toman interpolando la salida <strong>de</strong><br />

un mo<strong>de</strong>lo global. Normalmente las condiciones <strong>de</strong> contorno se actualizan<br />

durante el transcurso <strong>de</strong> la predicción para imponer sobre el mo<strong>de</strong>lo regional<br />

la dinámica sinóptica simulada por el mo<strong>de</strong>lo global.<br />

70<br />

70<br />

60<br />

60<br />

50<br />

50<br />

40<br />

40<br />

30<br />

30 20 10 0 10 20 30<br />

30<br />

30 20 10 0 10 20 30<br />

0 1000 2000 3000 4000 5000<br />

Figura 2.2: Rejilla horizontal <strong>de</strong> resolución 1 o <strong>de</strong> longitud y latitud sobre Europa<br />

(izquierda). Orografía <strong>de</strong>l mo<strong>de</strong>lo para la resolución dada (<strong>de</strong>recha).<br />

m<br />

En algunos casos, se <strong>de</strong>fine una cascada <strong>de</strong> rejillas <strong>de</strong> tamaño <strong>de</strong>creciente<br />

y resolución creciente y las integraciones se realizan <strong>de</strong> forma anidada<br />

aprovechando las salidas <strong>de</strong> una rejilla como condiciones <strong>de</strong> contorno <strong>de</strong> la<br />

siguiente rejilla. Por ejemplo, el NCEP anida un mo<strong>de</strong>lo <strong>de</strong> baja resolución<br />

(eta − 12) con distintas rejillas <strong>de</strong> alta resolución (8 km) sobre zonas <strong>de</strong><br />

interés (ver Fig. 2.3).<br />

Este tipo <strong>de</strong> mo<strong>de</strong>los son los utilizados en la predicción operativa a corto<br />

y medio plazo, don<strong>de</strong> cada servicio meteorológico se centra en su región<br />

<strong>de</strong> influencia, integrando un mo<strong>de</strong>lo regional con una resolución limitada<br />

principalmente por la capacidad <strong>de</strong> cómputo.


2.4. TIPOS DE MODELOS 21<br />

Figura 2.3: Rejillas <strong>de</strong> alta resolución anidadas con el mo<strong>de</strong>lo eta-12 (línea<br />

sólida): Western U.S., Central U.S., Alaska, Hawaii, Puerto Rico. (FUENTE:<br />

NCEP/NOAA).<br />

2.4.3. Mo<strong>de</strong>los Mesoscalares<br />

Más recientemente, la resolución <strong>de</strong> algunos mo<strong>de</strong>los regionales ha aumentado<br />

hasta llegar a unos pocos kilómetros, con objeto <strong>de</strong> mejorar la resolución<br />

<strong>de</strong> fenómenos convectivos locales (tormentas) y otros procesos físicos<br />

<strong>de</strong> pequeña escala. En este caso, las parametrizaciones juegan un papel fundamental<br />

y su calibración para la zona geográfica <strong>de</strong> interés es <strong>de</strong>terminante<br />

para el buen funcionamiento <strong>de</strong>l mo<strong>de</strong>lo. Dada su escasa resolución horizontal,<br />

la formulación <strong>de</strong> estos mo<strong>de</strong>los suele darse en coor<strong>de</strong>nadas cartesianas<br />

y no usan la aproximación hidrostática, la cual <strong>de</strong>ja <strong>de</strong> tener vali<strong>de</strong>z para<br />

escalas horizontales menores <strong>de</strong> 10 km. Así se han <strong>de</strong>sarrollado varios<br />

mo<strong>de</strong>los no-hidrostáticos que se utilizan rutinariamente para la predicción<br />

<strong>de</strong> fenómenos <strong>de</strong> mesoscala. Los más usados son ARPS (Advanced Regional<br />

Prediction System), MM5 (Penn State/NCAR Mesoscale Mo<strong>de</strong>l, Version<br />

5), RSM (NCEP Regional Spectral Mo<strong>de</strong>l) y COAMPS (US Navy‘s Coupled<br />

Ocean/Atmosphere Mesoscale Prediction System). Actualmente, existe una<br />

ten<strong>de</strong>ncia hacia el uso <strong>de</strong> mo<strong>de</strong>los no-hidrostáticos que también pue<strong>de</strong>n ser<br />

usados globalmente.<br />

En la Fig. 2.4 se muestra la orografía <strong>de</strong> la Península Ibérica con una<br />

resolución <strong>de</strong> 0.2 o (aprox. 20 km) y la orografía <strong>de</strong> la Cornisa Cantábrica<br />

con una resolución <strong>de</strong> 0.0083 o (aprox. 1 km). Esta última resolución es la<br />

que permite caracterizar <strong>de</strong> forma apropiada la orografía <strong>de</strong> esta zona.


22 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

Figura 2.4: Orografía <strong>de</strong> la Península Ibérica correspondiente a un mo<strong>de</strong>lo <strong>de</strong> 0.2 o<br />

(superior). Ampliación <strong>de</strong> la zona correspondiente a las Autonomías <strong>de</strong> Cantabria<br />

y Asturias (42.5-43.75N, 3-7 O), con una resolución <strong>de</strong> 0.0083 o .<br />

2.5. Estado Actual <strong>de</strong> la Predicción Operativa<br />

Las distintas predicciones que se preparan diariamente para el público y<br />

otros usuarios especializados en el Instituto Nacional <strong>de</strong> Meteorología (INM,<br />

www.inm.es) y en otros centros meteorológicos europeos (MeteoFrance, UK<br />

MetOffice, etc.) utilizan las salidas <strong>de</strong> los mo<strong>de</strong>los numéricos anteriormente<br />

<strong>de</strong>scritos; a estas se las <strong>de</strong>nomina predicciones operativas y pue<strong>de</strong>n ser <strong>de</strong><br />

distintos tipos <strong>de</strong>pendiendo <strong>de</strong> la escala espacial y temporal <strong>de</strong> su aplicación.<br />

Tradicionalmente las predicciones se han obtenido aplicando un único mo<strong>de</strong>lo,<br />

a partir <strong>de</strong> una condición inicial dada. Sin embargo en las dos últimas<br />

décadas los estudios no-lineales realizados en este campo han mostrado que<br />

es necesario hablar en términos probabilísticos y consi<strong>de</strong>rar los efectos causados<br />

por las distintas fuentes <strong>de</strong> incertidumbre en la evolución <strong>de</strong>l mo<strong>de</strong>lo.<br />

Para ello, hoy día se utilizan distintos esquemas <strong>de</strong> predicción por conjuntos<br />

que perturban las condiciones iniciales, o combinan las salidas <strong>de</strong> distintos<br />

mo<strong>de</strong>los (multi-mo<strong>de</strong>lo), para obtener un conjunto <strong>de</strong> predicciones con el<br />

que anticipar la evolución <strong>de</strong> la atmósfera. A continuación se muestra una<br />

<strong>de</strong>scripción <strong>de</strong>l abanico <strong>de</strong> predicciones que se realizan en distintos centros<br />

meteorológicos <strong>de</strong> forma operativa:


2.5. ESTADO ACTUAL DE LA PREDICCIÓN OPERATIVA 23<br />

El nowcasting (predicción inmediata) marca el primer umbral <strong>de</strong> predicción<br />

y se refiere a la predicción a muy corto plazo (minutos/horas).<br />

En este período <strong>de</strong> alcance, los análisis <strong>de</strong> radar, las imágenes <strong>de</strong> satélite<br />

y las labores <strong>de</strong> vigilancia llevadas a cabo por observadores y predictores<br />

humanos juegan el papel principal, relegando a los mo<strong>de</strong>los<br />

numéricos a un segundo plano. En este umbral <strong>de</strong> predicción se trata <strong>de</strong><br />

pre<strong>de</strong>cir con suficiente <strong>de</strong>talle la intensidad <strong>de</strong> eventos extremos (fuertes<br />

tormentas, etc.), así como la localización geográfica <strong>de</strong> los mismos.<br />

En esta Tesis no se abarca este alcance <strong>de</strong> predicción, pues supone el<br />

estudio <strong>de</strong> técnicas especiales para este tipo <strong>de</strong> fenómenos.<br />

En un segundo nivel, la predicción a corto plazo se entien<strong>de</strong> en un rango<br />

<strong>de</strong> entre 1 y 3 días <strong>de</strong> alcance. En un principio se realiza a nivel<br />

global con una resolución horizontal que oscila entre 0.5 y 1 o . Por ejemplo,<br />

el ECMWF proporciona salidas cada 6 horas sobre todo el globo<br />

con 0.6 o (aprox. 60 km) a partir <strong>de</strong> un mo<strong>de</strong>lo <strong>de</strong> circulación general<br />

T511. Este centro es una organización multinacional que aglutina<br />

esfuerzos <strong>de</strong> los distintos países <strong>de</strong> la comunidad europea para realizar<br />

una predicción base que sirva <strong>de</strong> soporte para el resto <strong>de</strong> servicios<br />

meteorológicos. Las salidas <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong>l ECMWF se utilizan<br />

en los distintos servicios meteorológicos europeos como condiciones <strong>de</strong><br />

contorno para mo<strong>de</strong>los regionales <strong>de</strong> mayor resolución. Por ejemplo,<br />

el producto final <strong>de</strong> predicción operativa en España el INM se obtiene<br />

aplicando el mo<strong>de</strong>lo regional HIRLAM, con una resolución espacial <strong>de</strong><br />

0.2 o , a las salidas <strong>de</strong>l ECMWF (ver Fig. 2.5).<br />

De forma análoga en EEUU el NCEP (National Centers for Environmental<br />

Prediction, www.ncep.noaa.gov) realiza una predicción global<br />

que distribuye libremente a través <strong>de</strong> Internet, y que es luego utilizada<br />

por distintos centros regionales en diversas aplicaciones. Por ejemplo la<br />

Fig. 2.6 muestra el campo <strong>de</strong> precipitación estimado por el mo<strong>de</strong>lo <strong>de</strong>l<br />

NCEP y los campos estimados por el mo<strong>de</strong>lo regional MM5 utilizado<br />

en Meteo Galicia meteo.usc.es con 30 y 10 km <strong>de</strong> resolución.<br />

La predicción por conjuntos a medio plazo abarca el período comprendido<br />

entre los 4 y 15 días <strong>de</strong> alcance. En este período el sistema tradicional<br />

<strong>de</strong> predicción <strong>de</strong>terminista comienza a per<strong>de</strong>r predictibilidad<br />

fruto <strong>de</strong> la no linealidad <strong>de</strong>l mo<strong>de</strong>lo y los efectos <strong>de</strong> la incertidumbre.<br />

Por tanto, en este período la predicción se entien<strong>de</strong> en sentido probabilístico<br />

y se utilizan técnicas como la predicción por conjuntos para<br />

tener en cuenta estos efectos. La predicción por conjuntos se lleva a la<br />

práctica integrando el sistema varias veces utilizando un número arbitrario<br />

<strong>de</strong> condiciones iniciales distintas que se obtienen perturbando<br />

<strong>de</strong> forma apropiada la condición inicial obtenida a partir <strong>de</strong> las observaciones<br />

(ver Sec. 6.2 para más <strong>de</strong>talles). Como resultado, se obtiene<br />

un conjunto <strong>de</strong> predicciones que han <strong>de</strong> procesarse <strong>de</strong> forma apropiada<br />

para obtener una predicción <strong>de</strong> consenso (numérica o probabilística).


24 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

Figura 2.5: (superior) Orografía <strong>de</strong> los mo<strong>de</strong>los HIRLAM <strong>de</strong> 0.5 o y 0.2 o utilizados<br />

por el INM en la predicción operativa. (inferior) Salida <strong>de</strong> precipitación <strong>de</strong>l mo<strong>de</strong>lo<br />

con una resolución <strong>de</strong> 0.5 o (FUENTE: Instituto Nacional <strong>de</strong> Meteorología).<br />

(a)<br />

(b)<br />

(c)<br />

Figura 2.6: Campos <strong>de</strong> precipitación a D + 1 obtenidos con (a) el mo<strong>de</strong>lo AVN<br />

<strong>de</strong>l NCEP; y el mo<strong>de</strong>lo MM5 utilizado por Meteo Galicia con (b) 30 y (c) 10 km<br />

<strong>de</strong> resulución. (FUENTE: Página web <strong>de</strong> Meteo Galicia).


2.5. ESTADO ACTUAL DE LA PREDICCIÓN OPERATIVA 25<br />

En cuanto a los sistemas globales <strong>de</strong> predicción por conjuntos operativos,<br />

<strong>de</strong>s<strong>de</strong> Noviembre <strong>de</strong> 2000 el ECMWF ha puesto en marcha un mo<strong>de</strong>lo<br />

<strong>de</strong> predicción por conjuntos a plazo medio (con alcance <strong>de</strong> 10 días)<br />

basado en 50 integraciones con condiciones iniciales perturbadas y una<br />

integración con condiciones sin perturbar <strong>de</strong> un mo<strong>de</strong>lo TL255L40<br />

(aprox. 80 km <strong>de</strong> resolución en latitu<strong>de</strong>s medias). La resolución <strong>de</strong> este<br />

mo<strong>de</strong>lo es cuatro veces superior a la <strong>de</strong>l mo<strong>de</strong>lo anterior puesto en<br />

marcha en Diciembre <strong>de</strong> 1992 y se ha constatado que este aumento <strong>de</strong><br />

resolución ha mejorado sustancialmente la predicción probabilística <strong>de</strong><br />

la precipitación (ver Buizza et al., 2001, para más <strong>de</strong>talles). Por otra<br />

parte, el NCEP también produce <strong>de</strong> forma operativa predicciones por<br />

conjuntos a medio plazo (hasta 15 días) utilizando el Global Forecast<br />

System mo<strong>de</strong>l (GFS) (ver www.nco.ncep.noaa.gov/pmb/products/).<br />

Paralelamente al crecimiento <strong>de</strong> los recursos computacionales, especialmente<br />

la capacidad <strong>de</strong> cómputo, la resolución <strong>de</strong> los mo<strong>de</strong>los se<br />

va incrementando, permitiendo mejorar la resolución <strong>de</strong> las costosas<br />

simulaciones por conjuntos <strong>de</strong> alcance medio. Por tanto, es previsible<br />

que en el futuro cercano la predicción a corto plazo y la predicción por<br />

conjuntos a plazo medio se fundan en una sola predicción, extendiendo<br />

la aplicabilidad <strong>de</strong> la predicción por conjuntos (<strong>de</strong> hecho, se están dando<br />

ya las primeras experiencias <strong>de</strong> exten<strong>de</strong>r la predicción por conjuntos<br />

al corto plazo, buscando técnicas perturbativas apropiadas).<br />

En la predicción por conjuntos mensual y estacional no se trata <strong>de</strong><br />

pre<strong>de</strong>cir el estado real <strong>de</strong> la atmósfera, sino las anomalías en la circulación<br />

(<strong>de</strong>sviaciones respecto <strong>de</strong>l comportamiento promedio) transcurridas<br />

tras un mes, un trimestre. En este supuesto, la condición<br />

inicial (el estado inicial <strong>de</strong> la atmósfera) no es el factor más importante<br />

para la i<strong>de</strong>ntificación <strong>de</strong> anomalías en la evolución <strong>de</strong> la circulación<br />

atmosférica, sino que existen otros factores más <strong>de</strong>terminantes, como<br />

la temperatura <strong>de</strong>l agua <strong>de</strong>l océano. Por tanto, estos mo<strong>de</strong>los están<br />

acoplados con mo<strong>de</strong>los oceánicos, o tienen forzadas las temperaturas<br />

<strong>de</strong>l agua <strong>de</strong>l mar. Por ejemplo, el ECMWF integra quincenalmente<br />

y hasta 180 días un mo<strong>de</strong>lo <strong>de</strong> predicción por conjuntos <strong>de</strong>nominado<br />

System-II para la elaboración <strong>de</strong> predicciones <strong>de</strong> anomalías climáticas<br />

mensuales y estacionales (en este caso, las distintas condiciones iniciales<br />

se obtienen perturbando positiva y negativamente las temperaturas<br />

<strong>de</strong>l agua <strong>de</strong>l mar). Este mo<strong>de</strong>lo surgió <strong>de</strong> la experiencia llevada a cabo<br />

en el proyecto DEMETER (Development of a European Multimo<strong>de</strong>l<br />

Ensemble system for seasonal to inTERannual prediction) en el que<br />

se construyó un sistema <strong>de</strong> predicción estacional multi-mo<strong>de</strong>lo que integra<br />

seis mo<strong>de</strong>los globales <strong>de</strong> predicción por conjuntos con distintos<br />

esquemas <strong>de</strong> perturbación (www.ecmwf.int/research/<strong>de</strong>meter/). De<br />

hecho, se dispone <strong>de</strong> un re-análisis <strong>de</strong> este sistema multi-mo<strong>de</strong>lo que<br />

abarca el mismo período <strong>de</strong> ERA-40.


26 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

Finalmente, <strong>de</strong>ntro <strong>de</strong>l ámbito <strong>de</strong> la predicción climática, varios centros<br />

climáticos europeos (Centro Hadley en el Reino Unido, Instituto<br />

Max Plank en Alemania, Centro Nacional <strong>de</strong> Investigación <strong>de</strong> Méteo-<br />

France) llevan a cabo integraciones durante 100 o más años bajo diversas<br />

hipótesis <strong>de</strong> forzamiento radiativo para la realización <strong>de</strong> estudios<br />

<strong>de</strong> escenarios climáticos (por ejemplo, los efectos <strong>de</strong> la duplicación <strong>de</strong><br />

las emisiones <strong>de</strong> CO 2 en la atmósfera). En estos casos, los mo<strong>de</strong>los<br />

son globales y están acoplados con mo<strong>de</strong>los oceánicos, por lo que su<br />

resolución es pequeña (entre 2.5 o y 5 o , es <strong>de</strong>cir 250 − 500 km aproximadamente).<br />

2.6. Futuro <strong>de</strong> la Predicción Numérica<br />

Des<strong>de</strong> la perspectiva actual, el futuro <strong>de</strong> la predicción numérica se ve<br />

centrado en los <strong>de</strong>sarrollos teóricos y prácticos para compren<strong>de</strong>r los efectos<br />

<strong>de</strong> la incertidumbre y su propagación en los mo<strong>de</strong>los numéricos; ésto incluye<br />

al proceso <strong>de</strong> asimilación y a los métodos <strong>de</strong> perturbación para predicción<br />

por conjuntos. Según Kalnay (2003), los siguientes problemas marcarán el<br />

futuro próximo <strong>de</strong> la predicción numérica:<br />

Predicciones a corto alcance <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> fenómenos convectivos locales<br />

(tormentas) con capacidad predictiva <strong>de</strong> fenómenos adversos.<br />

Métodos <strong>de</strong> asimilación <strong>de</strong> datos capaces <strong>de</strong> extraer la máxima información<br />

<strong>de</strong> los sistemas <strong>de</strong> observación, especialmente <strong>de</strong> satélites y<br />

radares.<br />

Mejora <strong>de</strong> la utilidad <strong>de</strong> las predicciones a plazo medio, especialmente<br />

a través <strong>de</strong>l uso <strong>de</strong> la predicción por conjuntos.<br />

Sistemas totalmente acoplados <strong>de</strong> atmósfera e hidrología, con el objetivo<br />

<strong>de</strong> realizar mejores predicciones locales <strong>de</strong> la precipitación <strong>de</strong>l<br />

mo<strong>de</strong>lo, y extendido a la predicción <strong>de</strong> caudales <strong>de</strong> ríos.<br />

Un mayor uso <strong>de</strong> mo<strong>de</strong>los atmósfera-océano-tierra en los cuales anomalías<br />

<strong>de</strong> larga duración tales como temperatura <strong>de</strong> la superficie <strong>de</strong>l<br />

mar (SST, Sea Surface Temperature) y humedad <strong>de</strong> suelo, lleven a<br />

mejores predicciones estacionales y climáticas.<br />

Aplicaciones <strong>de</strong> los mo<strong>de</strong>los numéricos en sectores productivos relacionados<br />

con la actividad humana: agricultura, energía, prevención <strong>de</strong><br />

riesgos naturales, etc., y en problemas que afectan a la salud tales como<br />

contaminación atmosférica, transporte <strong>de</strong> contaminantes y radiación<br />

ultravioleta.<br />

Esta Tesis doctoral se centra en alguno <strong>de</strong> estos problemas; en concreto<br />

se analiza la predicción local mediante técnicas híbridas y se aplican los<br />

métodos <strong>de</strong>sarrollados para los sistemas <strong>de</strong> predicción por conjuntos.


2.7. DATOS CLIMATOLÓGICOS Y METEOROLÓGICOS 27<br />

2.7. Datos Climatológicos y Meteorológicos<br />

Los mo<strong>de</strong>los numéricos y las distintas técnicas estadísticas <strong>de</strong> postproceso<br />

se valen <strong>de</strong> las observaciones <strong>de</strong> variables meteorológicas <strong>de</strong> la red<br />

mundial <strong>de</strong> observatorios, e incluso <strong>de</strong> datos paleoclimáticos obtenidos indirectamente<br />

a partir <strong>de</strong> mediciones <strong>de</strong> hielo, anillos <strong>de</strong> árboles, etc. En esta<br />

sección se <strong>de</strong>scriben las fuentes <strong>de</strong> esta cantidad ingente <strong>de</strong> información, que<br />

serán la base para las herramientas <strong>de</strong>sarrolladas en esta Tesis.<br />

2.7.1. Re<strong>de</strong>s <strong>de</strong> Observación<br />

Las observaciones rutinarias <strong>de</strong> la atmósfera (en especial en superficie)<br />

han ido extendiéndose <strong>de</strong> forma contínua <strong>de</strong>s<strong>de</strong> la creación <strong>de</strong> la OMM en<br />

1950, propiciando el marco intergubernamental para el establecimiento <strong>de</strong><br />

re<strong>de</strong>s internacionales <strong>de</strong> observación. El GOS (Global Observing System) es<br />

el sistema coordinado que recopila y comprueba las observaciones <strong>de</strong> variables<br />

atmosféricas y oceánicas (en superficie) a nivel global. El núcleo <strong>de</strong> las<br />

observaciones superficiales consta <strong>de</strong> aproximadamente 10.000 observatorios<br />

que realizan observaciones al menos cada tres horas, y a menudo horariamente.<br />

Las variables observadas son: presión atmosférica, viento, temperatura<br />

<strong>de</strong>l aire y humedad relativa. A<strong>de</strong>más existen unas 1.000 estaciones <strong>de</strong> radiosonda<br />

y más <strong>de</strong> 3.000 aviones que realizan observaciones en varios niveles<br />

<strong>de</strong> la atmósfera. Unos 7.300 barcos, 600 boyas a la <strong>de</strong>riva, 300 boyas fijas y<br />

600 plataformas proporcionan observaciones en los océanos. Estos datos son<br />

utilizados diariamente por los mo<strong>de</strong>los numéricos <strong>de</strong> circulación atmosférica,<br />

asimilando el estado <strong>de</strong> la atmósfera inicial en base a un conjunto <strong>de</strong> estas<br />

observaciones. Por ejemplo, la Figura 2.7 muestra las observaciones utilizadas<br />

un día en el ECMWF para el proceso <strong>de</strong> asimilación (inicialización) <strong>de</strong><br />

su mo<strong>de</strong>lo operativo.<br />

Figura 2.7: Observaciones utilizadas en la asimilación <strong>de</strong> datos <strong>de</strong>l mo<strong>de</strong>lo numérico<br />

<strong>de</strong>l ECMWF. (FUENTE. Página Web <strong>de</strong>l ECMWF).


28 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

El GOS también dispone <strong>de</strong> un subsistema espacial <strong>de</strong> observación, integrado<br />

por cuatro satélites en órbita polar y cinco geoestacionarios, con el<br />

objetivo principal <strong>de</strong> completar la cobertura <strong>de</strong> las observaciones <strong>de</strong> la red<br />

en superficie. El papel <strong>de</strong> las observaciones proce<strong>de</strong>ntes <strong>de</strong> satélites es cada<br />

vez más importante y la asimilación <strong>de</strong> estos datos en los mo<strong>de</strong>los numéricos<br />

es un área <strong>de</strong> intensa investigación. La longitud <strong>de</strong> las series <strong>de</strong> datos<br />

almacenadas es muy variable y oscila entre un par <strong>de</strong> cientos <strong>de</strong> años (para<br />

estaciones históricas), hasta unos pocos años, o meses.<br />

Por otra parte, los distintos servicios meteorológicos nacionales disponen<br />

<strong>de</strong> su propia red <strong>de</strong> observación (algunos <strong>de</strong> cuyas estaciones se integran en<br />

el GOS). Estas re<strong>de</strong>s mucho más <strong>de</strong>nsas abarcan gran variedad <strong>de</strong> variables<br />

climatológicas. Por ejemplo, el Instituto Nacional <strong>de</strong> Meteorología (INM)<br />

dispone <strong>de</strong> una red <strong>de</strong> observatorios que abarca 6735 puntos geográficos en<br />

las distintas cuencas hidrográficas Españolas (ver Fig. 2.8(b)) con mediciones<br />

diarias <strong>de</strong> precipitación y meteoros (tormenta, nieve, granizo, niebla,<br />

lluvia, calima, rocío y escarcha) en el período 1975-2000. Las temperaturas<br />

máxima y mínima se observan en 2281 puntos. A<strong>de</strong>más <strong>de</strong> la red secundaria,<br />

existen algunas estaciones en las que se realizan observaciones por<br />

parte <strong>de</strong> personal cualificado. Estas estaciones correspon<strong>de</strong>n a la red principal<br />

y en la actualidad consta <strong>de</strong> 225 puntos <strong>de</strong> observación en los que se<br />

mi<strong>de</strong> insolación, evaporación, recorrido, dirección y racha máxima <strong>de</strong> viento,<br />

temperaturas medias, y otras variables. Las observaciones se realizan<br />

diariamente, aunque en la red principal se realizan observaciones con mayor<br />

frecuencia (cada 10 min, cuatro veces al día, etc.). En total se tienen<br />

8766 ×(6735 ×9+2281 ×2+225 ×3) ≃ 6 ×10 8 datos incluyendo lagunas en<br />

las observaciones. Si se consi<strong>de</strong>ran 2 bytes por dato habrá en total 1.2 Gb<br />

<strong>de</strong> información.<br />

A continuación se <strong>de</strong>tallan las observaciones disponibles (salvo indicación<br />

expresa, las observaciones son diarias y hacen referencia a un periodo <strong>de</strong> 24<br />

horas comprendidas <strong>de</strong> 7 a 7 h):<br />

Observaciones en la red secundaria o termopluviométrica (Fig. 2.8(d)):<br />

1. Temperaturas extremas máxima y mínima a 1m <strong>de</strong>l suelo (en o C).<br />

2. Precipitación diaria acumulada (en mm ≡ l/m 2 ).<br />

3. Ocurrencia <strong>de</strong> meteoros: nieblas, tormentas, granizo, nieve, escarcha<br />

y rocío.<br />

Observaciones en la red principal (Fig. 2.8(c)). A<strong>de</strong>más <strong>de</strong> incluir las<br />

observaciones anteriores, la red principal posee una serie adicional <strong>de</strong><br />

mediciones.<br />

1. Racha máxima <strong>de</strong> viento, medida <strong>de</strong> 0 a 24 horas a 10m <strong>de</strong>l suelo<br />

(en km/h). La dirección <strong>de</strong> la racha máxima se mi<strong>de</strong> en grados<br />

(tomando como origen el Norte).


2.7. DATOS CLIMATOLÓGICOS Y METEOROLÓGICOS 29<br />

2. Insolación medida <strong>de</strong> 0 a 24 horas (en horas diarias <strong>de</strong> sol). Si es<br />

relativa se mi<strong>de</strong> en% respecto a la insolación máxima teórica <strong>de</strong>l<br />

día.<br />

3. Evaporación Potencial, consi<strong>de</strong>rada como la máxima evaporación<br />

posible, medida <strong>de</strong> 0 a 24 horas (en mm) (existen algunas medidas<br />

en la red secundaria).<br />

4. En la red principal existen otras muchas variables que se podrían<br />

incluir entre las observaciones. Algunas <strong>de</strong> ellas son: Intensidad<br />

máxima y duración <strong>de</strong> precipitación, recorrido <strong>de</strong>l viento, cantidad<br />

y tipo <strong>de</strong> nubosidad, humedad media, y visibilidad.<br />

Las series <strong>de</strong> datos disponibles tienen longitu<strong>de</strong>s variables y contienen lagunas,<br />

pero en términos generales se pue<strong>de</strong> <strong>de</strong>cir que se dispone <strong>de</strong> 50 años <strong>de</strong><br />

información.<br />

(a)<br />

45º N<br />

(b)<br />

NORTE<br />

DUERO<br />

EBRO<br />

CATALUÑA<br />

40º N<br />

TAJO<br />

JÚ CAR<br />

GUADIANA<br />

GUADALQUIVIR<br />

SEGURA<br />

35º N<br />

SUR<br />

10º W 5º W<br />

0º<br />

5º E<br />

(c)<br />

(d)<br />

Figura 2.8: (a) Orografía <strong>de</strong> España y sus (b) cuencas hidrográficas principales.<br />

(c) Red principal <strong>de</strong> estaciones <strong>de</strong>l INM, (d) red termopluviométrica.<br />

2.7.2. Datos Paleoclimáticos<br />

Los datos instrumentales son medidas directas representativas <strong>de</strong> las variables<br />

meteorológicas; sin embargo, las series más largas no pasan <strong>de</strong> unos<br />

pocos cientos <strong>de</strong> años. Para llevar a cabo estudios climáticos a tiempos muy<br />

largos (<strong>de</strong>l or<strong>de</strong>n <strong>de</strong> miles <strong>de</strong> años) es necesario disponer <strong>de</strong> series <strong>de</strong> datos<br />

más largas. Por ello, se han <strong>de</strong>sarrollado distintas técnicas indirectas


30 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

<strong>de</strong> medición a partir <strong>de</strong> indicadores <strong>de</strong> la naturaleza (datos “proxy”). Los<br />

más utilizados se obtienen <strong>de</strong> los árboles (fisiología <strong>de</strong> los anillos, análisis<br />

<strong>de</strong> isótopos, etc.), las catas <strong>de</strong> hielo (composición <strong>de</strong> isótopos, acumulación<br />

y estratificación, etc.), los corales (crecimiento, etc.), sedimentos oceánicos,<br />

fósiles, etc. Por ejemplo las extracciones <strong>de</strong>l hielo profundo <strong>de</strong> glaciares contienen<br />

muestras <strong>de</strong> burbujas <strong>de</strong> aire, polvo, polen, o isótopos <strong>de</strong> oxígeno,<br />

que sirven para reconstruir el clima pasado, <strong>de</strong>l área don<strong>de</strong> fue recogida la<br />

muestra.<br />

2.7.3. Simulaciones <strong>de</strong> Mo<strong>de</strong>los Numéricos<br />

Los campos resultantes <strong>de</strong> las integraciones <strong>de</strong> los mo<strong>de</strong>los numéricos <strong>de</strong>l<br />

tiempo <strong>de</strong>scritos en secciones anteriores caracterizan el estado <strong>de</strong> la atmósfera,<br />

tanto los análisis (estado inicial asimilado <strong>de</strong> la atmósfera), como las predicciones,<br />

y en muchos casos están disponibles para la comunidad investigadora.<br />

Por otra parte, también están disponibles los campos producidos por<br />

diversos proyectos <strong>de</strong> re-análisis que integran un mismo mo<strong>de</strong>lo <strong>de</strong> forma sucesiva<br />

para un período representativo <strong>de</strong> tiempo. Por ejemplo, el primer proyecto<br />

<strong>de</strong> re-análisis global llevado a cabo en el ECMWF se <strong>de</strong>nominó ERA-15<br />

y proporciona los campos <strong>de</strong> análisis y predicciones a corto plazo obtenidos<br />

con un mo<strong>de</strong>lo T106L31 (1.125 grados <strong>de</strong> resolución) para el período comprendido<br />

entre Diciembre-1978 y Febrero-1994. Recientemente, este proyecto<br />

ha sido extendido y ya se dispone <strong>de</strong> información para el período Septiembre<br />

1957 - Agosto 2002 (ERA-40) obtenida con un mo<strong>de</strong>lo <strong>de</strong> mayor resolución<br />

(T159L60, aprox. 0.675 grados). El NCEP también dispone <strong>de</strong> un re-análisis<br />

llevado a cabo con un mo<strong>de</strong>lo T62L28 (1.875 grados <strong>de</strong> resolución) para el<br />

período 1958 hasta la actualidad (para más información sobre actualizaciones<br />

<strong>de</strong>l re-análisis consultar wesley.wwb.noaa.gov/reanalysis2). La lista<br />

completa <strong>de</strong> variables disponibles para el proyecto ERA pue<strong>de</strong> consultarse<br />

en www.ecmwf.org/research/era, mientras que en el caso <strong>de</strong>l NCEP pue<strong>de</strong><br />

consultarse wesley.wwb.noaa.gov/reanalysis.html.<br />

En esta Tesis, se utiliza información <strong>de</strong> cada uno <strong>de</strong> los 4 análisis diarios<br />

<strong>de</strong> ERA-15, a las 00, 06, 12, y 18 horas UTC (Coor<strong>de</strong>nadas Universales <strong>de</strong><br />

Tiempo). El mo<strong>de</strong>lo <strong>de</strong> re-análisis posee información <strong>de</strong> variables en superficie<br />

y en niveles <strong>de</strong> presión, y <strong>de</strong> variables <strong>de</strong>rivadas que no son integradas<br />

directamente en el mo<strong>de</strong>lo. Básicamente las variables utilizadas en altura<br />

son el geopotencial (Z), temperatura (T), velocidad <strong>de</strong>l viento (U y V) y<br />

humedad relativa (H) en los niveles <strong>de</strong> presión <strong>de</strong> 1000, 925, 850, 700, 500,<br />

300 y 200 milibares (mb). A<strong>de</strong>más existen las variables <strong>de</strong> superficie, asociadas<br />

a cada una <strong>de</strong> las variables anteriores, que son: presión media a nivel<br />

<strong>de</strong>l mar (mslp), temperatura a 2 metros (T2), velocidad <strong>de</strong>l viento a 10<br />

metros (U10 y V10) y temperatura <strong>de</strong>l punto <strong>de</strong> rocío (Td). En total son<br />

5569 × 4 × 181 × 360 × 7 × 5 ≃ 5 × 10 10 datos. Estos datos se encuentran<br />

codificados en formato GRIB (WMO) y en total ocupa 100 GBytes <strong>de</strong> información<br />

<strong>de</strong>l re-análisis. En los distintos ejemplos presentados en esta Tesis


2.7. DATOS CLIMATOLÓGICOS Y METEOROLÓGICOS 31<br />

se consi<strong>de</strong>ran distintas regiones y combinaciones horarias <strong>de</strong> campos para<br />

<strong>de</strong>finir el “estado <strong>de</strong> la atmósfera”.<br />

Ejemplo 2.1 (Patrones Atmosféricos). Se <strong>de</strong>sea estudiar la configuración<br />

atmosférica diaria en la península Ibérica. Para po<strong>de</strong>r realizar un estudio<br />

estadístico se pue<strong>de</strong>n utilizar los campos <strong>de</strong> análisis proporcionados<br />

por un re-análisis (por ejemplo ERA-15), en una rejilla apropiada sobre la<br />

región <strong>de</strong> interés, en los distintos niveles <strong>de</strong> altura. Por ejemplo, para caracterizar<br />

el patrón <strong>de</strong> circulación que afecta a la península Ibérica se pue<strong>de</strong>n<br />

utilizar distintas rejillas y escalas temporales:<br />

70ºN<br />

(a)<br />

60ºN<br />

50ºN<br />

40ºN<br />

30ºN<br />

20ºN<br />

40ºW<br />

30º W<br />

20º W<br />

10 º W<br />

0<br />

º<br />

10 º E<br />

º<br />

20 E<br />

30 º E<br />

60º N<br />

(b)<br />

60º N<br />

(c)<br />

50º N<br />

50º N<br />

40º N<br />

40ºN<br />

30ºN<br />

30ºN<br />

20 W<br />

º 10º W<br />

0º<br />

10ºE<br />

20º E<br />

20 W<br />

º 10º W<br />

0º<br />

10ºE<br />

20º E<br />

Figura 2.9: Distintas áreas que cubren la península Ibérica: (a) Rejilla <strong>de</strong> larga<br />

escala (macro-β) <strong>de</strong> 2.5 ◦ × 2.5 ◦ <strong>de</strong> latitud y longitud; (b) rejilla peninsular (mesoα)<br />

1 ◦ × 1 ◦ <strong>de</strong> latitud y longitud; (c) rejilla meso-β 1 ◦ × 1 ◦ para la cuenca Norte <strong>de</strong><br />

la Pensínsula Ibérica (cada una <strong>de</strong> las doce cuencas tiene su propia rejilla).<br />

Mo<strong>de</strong>lo 1: Rejilla <strong>de</strong> 2.5 ◦ × 2.5 ◦ <strong>de</strong> longitud y latitud mostrada en<br />

la Figura 2.9(a). En este caso, los patrones se obtienen combinado los<br />

campos T, H, Z, U y V a las 12h en los niveles 1000mb, 925mb, 850mb,<br />

700mb, 500mb y 300mb:<br />

x 12 = (T 1000<br />

12 , . . .,T 300<br />

12 , H 1000<br />

12 , . . .,H 300<br />

12 , . . .,V 1000<br />

12 , . . .,V 300<br />

12 ), (2.18)<br />

don<strong>de</strong> X j i <strong>de</strong>nota el campo <strong>de</strong> la variable X a la hora i en el nivel j.<br />

Mo<strong>de</strong>lo 2: Rejilla <strong>de</strong> 1.0 ◦ ×1.0 ◦ mostrada en la Figura 2.9(b), cubriendo<br />

la zona <strong>de</strong> estudio. En este caso, se consi<strong>de</strong>ran las mismas variables


32 2. MODELOS Y DATOS ATMOSFÉRICOS<br />

y niveles <strong>de</strong> presión (altura), pero incluyendo una componente temporal<br />

(se toman los campos a las 06h y 30h). Esta componente temporal<br />

compensa la reducción <strong>de</strong> escala <strong>de</strong> la rejilla teniendo en cuenta efectos<br />

<strong>de</strong> bor<strong>de</strong> y <strong>de</strong> contorno que podrían alcanzar la zona <strong>de</strong> la rejilla<br />

durante el período <strong>de</strong> interés.<br />

x = (x 00 ,x 30 ). (2.19)<br />

Mo<strong>de</strong>lo 3: Rejilla <strong>de</strong> 1.0 ◦ × 1.0 ◦ mostrada en la Figura 2.9(c). En este<br />

caso se consi<strong>de</strong>ra un patrón atmosférico concreto para cada una <strong>de</strong><br />

las doce cuencas hidrográficas Españolas. Para ello se combinan los<br />

campos anteriores en un dominio temporal <strong>de</strong> mayor resolución: 06,<br />

12, 18, 24, y 30 UTC. En este caso se cubre el período <strong>de</strong> predicción<br />

con toda la información disponible:<br />

x = (x 06 ,x 12 ,x 18 ,x 24 ,x 30 ). (2.20)<br />

En ambos casos, los patrones obtenidos son <strong>de</strong> una enorme dimensión.<br />

Por ejemplo, en el caso <strong>de</strong> la Fig. 2.9(a) se tienen 17 × 21 (rejilla) ×3 (niveles<br />

<strong>de</strong> presión) ×5 (variables) = 5335 dimensiones para caracterizar un<br />

patrón atmosférico. Sin embargo, como se ilustra en el siguiente capítulo,<br />

estas variables están altamente correlacionadas y, en realidad, la información<br />

que contienen se pue<strong>de</strong> expresar utilizando un número menor <strong>de</strong> grados<br />

<strong>de</strong> libertad (variables).<br />

Junto con los re-análisis <strong>de</strong> mo<strong>de</strong>los numéricos que cubren períodos continuos,<br />

también se han elaborado bases <strong>de</strong> datos <strong>de</strong> observaciones homogeneizadas<br />

sobre rejillas y sin lagunas. Por ejemplo Chen et al. (2002) <strong>de</strong>scribe<br />

la elaboración <strong>de</strong> una base <strong>de</strong> datos con medias mensuales <strong>de</strong> precipitación<br />

en superficie para una rejilla <strong>de</strong> 2.5 o <strong>de</strong> resolución sobre todo el globo. La<br />

resolución <strong>de</strong> esta rejilla hace que sea poco útil para estudios regionales. Sin<br />

embargo, el INM también dispone <strong>de</strong> una rejilla <strong>de</strong> observaciones diarias <strong>de</strong><br />

mayor resolución que abarca el período ERA-15, interpoladas a partir <strong>de</strong> las<br />

observaciones <strong>de</strong> la red secundaria (ver Fig. 2.10).<br />

45.0 ° N<br />

42.5 ° N<br />

40.0 ° N<br />

37.5 ° N<br />

35.0 ° N<br />

10.0 ° W<br />

7.5 ° W<br />

5.0 ° W<br />

2.5 ° W<br />

0.0 °<br />

2.5 ° E<br />

5.0 ° E<br />

Figura 2.10: Rejilla <strong>de</strong> datos <strong>de</strong> precipitación en superficie interpolados <strong>de</strong> la red<br />

secundaria <strong>de</strong> observatorios <strong>de</strong>l INM.


CAPÍTULO 3<br />

Minería <strong>de</strong> Datos y Aprendizaje Automático<br />

3.1. Introducción<br />

El vertiginoso crecimiento <strong>de</strong> la capacidad <strong>de</strong> cálculo y almacenamiento<br />

<strong>de</strong> las computadoras ha producido un incremento exponencial <strong>de</strong> la información<br />

disponible proce<strong>de</strong>nte <strong>de</strong> simulaciones y observaciones atmosféricas,<br />

y ha hecho más fácil y rápido el acceso masivo a la misma (en tiempo real a<br />

través <strong>de</strong> Internet). Distintas bases <strong>de</strong> datos contienen información útil para<br />

diversos problemas, y requieren ser procesadas para sintetizar el conocimiento<br />

relevante para un problema dado. En el ámbito <strong>de</strong> la Meteorología se han<br />

utilizado <strong>de</strong> forma sistemática diversas técnicas Estadísticas para abordar<br />

distintos problemas <strong>de</strong> mo<strong>de</strong>lización y predicción a partir <strong>de</strong> observaciones<br />

y/o <strong>de</strong> salidas <strong>de</strong> mo<strong>de</strong>los numéricos (Ayuso, 1994). Sin embargo, el gran<br />

volumen <strong>de</strong> datos <strong>de</strong>l que se dispone hoy día hace necesario el uso <strong>de</strong> técnicas<br />

más eficientes, optimizadas para trabajar con gran<strong>de</strong>s muestras.<br />

En las dos últimas décadas se ha producido un gran avance en distintas<br />

áreas <strong>de</strong> la Inteligencia Artificial y Bases <strong>de</strong> Datos para <strong>de</strong>sarrollar<br />

técnicas automáticas <strong>de</strong> aprendizaje y extracción <strong>de</strong> conocimiento (ver<br />

Gutiérrez et al., 2004b). El objetivo <strong>de</strong> estas técnicas es preprocesar <strong>de</strong> forma<br />

rápida y fiable la información, capturando distintos patrones <strong>de</strong> conocimiento<br />

(reglas, grupos, grafos <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia, etc.) que sean apropiados<br />

para resolver un problema dado, y que resuman la información disponible<br />

haciéndola manejable. Se trata también <strong>de</strong> que estas técnicas operen <strong>de</strong> forma<br />

automática, precisando <strong>de</strong> la mínima intervención humana. En la última<br />

década se ha acuñado el término Minería <strong>de</strong> Datos (Data Mining) para referirse<br />

a este área interdisciplinar que engloba una gran diversidad <strong>de</strong> técnicas.<br />

Para una visión general <strong>de</strong> este campo se refiere al lector a Fayyad et al.<br />

(1996); Witten and Frank (1999). Algunas aplicaciones en Meteorología se<br />

<strong>de</strong>scriben en Cofiño et al. (2003b).<br />

33


34 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

En este capítulo se <strong>de</strong>scriben algunas <strong>de</strong> estas técnicas, que serán utilizadas<br />

posteriormente en la Tesis. Se hará especial énfasis en algunas aplicaciones<br />

en los ámbitos <strong>de</strong> la Meteorología y Climatología relacionadas con<br />

los contenidos <strong>de</strong> esta Tesis:<br />

La regionalización consiste en la i<strong>de</strong>ntificación <strong>de</strong> regiones geográficas<br />

homogéneas con parámetros climatológicos similares (temperaturas,<br />

precipitación, etc.). Tradicionalmente este problema se ha abordado<br />

utilizando distintos criterios geográficos subjetivos, como la división<br />

impuesta por las cuencas hidrográficas, etc. Sin embargo la creciente<br />

disponibilidad <strong>de</strong> datos climatológicos en las últimas décadas (por<br />

ejemplo, las observaciones históricas <strong>de</strong> una red <strong>de</strong> estaciones) ha dado<br />

lugar al <strong>de</strong>sarrollo <strong>de</strong> técnicas <strong>de</strong> regionalización automáticas basadas<br />

en criterios estadísticos (ver Oliver, 1991). En este caso la regionalización<br />

automática se basa en la obtención <strong>de</strong> conjuntos homogéneos <strong>de</strong><br />

estaciones aplicando algún criterio <strong>de</strong> similitud a los datos disponibles.<br />

Por otra parte, la clasificación <strong>de</strong> patrones <strong>de</strong> circulación atmosférica<br />

consiste en obtener los estados característicos (los más frecuentes,<br />

persistentes, etc.) <strong>de</strong> la configuración <strong>de</strong> la atmósfera y clasificar cada<br />

nuevo patrón en base a la división realizada. Para ello se utilizan<br />

los campos numéricos asimilados por los mo<strong>de</strong>los <strong>de</strong> circulación atmosférica<br />

en un cierta rejilla 3D para caracterizar numéricamente la<br />

configuración atmosférica en un instante dado. En particular, los distintos<br />

reanálisis disponibles para un período representativo <strong>de</strong> tiempo<br />

(ver Sec. 2.7.3 para una <strong>de</strong>scripción <strong>de</strong> estos datos) ofrecen una muestra<br />

representativa para realizar este tipo <strong>de</strong> estudio.<br />

En la Sec. 3.2 se introduce la técnica <strong>de</strong> componentes principales y se<br />

ilustra su aplicación para reducir la elevada dimensionalidad <strong>de</strong> los datos,<br />

eliminando información redundante. A continuación, en la Sec. 3.3 se analizan<br />

distintas técnicas <strong>de</strong> agrupamiento; uno <strong>de</strong> estos métodos, las re<strong>de</strong>s<br />

auto-organizativas, se <strong>de</strong>scriben en la Sec. 3.4. Finalmente, la Sec. 3.5 <strong>de</strong>scribe<br />

las re<strong>de</strong>s neuronales <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> los métodos estadísticos<br />

no paramétricos.<br />

3.2. Componentes Principales<br />

El análisis <strong>de</strong> Componentes Principales (CPs) es una técnica estándar<br />

para representar una muestra <strong>de</strong> datos en un espacio <strong>de</strong> menor dimensión<br />

que el original, eliminando la información redundante con la mínima pérdida<br />

<strong>de</strong> variabilidad; en otras palabras, es una técnica eficiente para comprimir información<br />

(Preisendorfer and Mobley, 1988). Este método es especialmente<br />

útil en espacios <strong>de</strong> alta dimensionalidad, don<strong>de</strong> los datos pue<strong>de</strong>n estar correlacionados<br />

en sus distintas componentes (dimensiones) y, por tanto, pue<strong>de</strong>n<br />

contener mucha información redundante en su <strong>de</strong>scripción. Un ejemplo típico


3.2. COMPONENTES PRINCIPALES 35<br />

en Meteorología lo constituye la caracterización <strong>de</strong> los patrones <strong>de</strong> circulación<br />

atmosférica, que vienen dados por los valores <strong>de</strong> una o varias magnitu<strong>de</strong>s<br />

(la presión a nivel <strong>de</strong>l mar, etc.) en una rejilla sobre una cierta zona<br />

<strong>de</strong> interés. Dado que estas magnitu<strong>de</strong>s están correlacionadas espacialmente,<br />

existirá una gran redundancia en esta forma <strong>de</strong> expresar los datos. Por<br />

tanto es necesario disponer <strong>de</strong> técnicas eficientes que permitan “comprimir”<br />

la información, hallando un espacio <strong>de</strong> menor dimensión don<strong>de</strong> los patrones<br />

proyectados conserven ciertos estadísticos <strong>de</strong> la muestra. La técnica <strong>de</strong> componentes<br />

principales reduce la dimensión <strong>de</strong>l espacio preservando el máximo<br />

<strong>de</strong> varianza <strong>de</strong> la muestra. Para ello, la base <strong>de</strong>l nuevo espacio se forma<br />

con aquellos vectores don<strong>de</strong> la muestra proyectada presenta mayor varianza.<br />

Los vectores <strong>de</strong> esta base (o Funciones Empíricas Ortogonales, EOF) son <strong>de</strong><br />

enorme utilidad en Meteorología, pues son los patrones dominantes (en el<br />

sentido <strong>de</strong> la variabilidad que representan <strong>de</strong> la muestra).<br />

Se parte <strong>de</strong> una muestra <strong>de</strong> m realizaciones <strong>de</strong> un vector<br />

x k = (x k1 , ..., x kn ) T , k = 1, . . .,m, (3.1)<br />

<strong>de</strong>finido en un espacio n-dimensional con base canónica {e 1 , . . .,e n }. Se<br />

<strong>de</strong>sea obtener un subespacio <strong>de</strong> dimensión d < n, dado por una nueva base<br />

{f 1 , . . .,f d } (siendo cada f j una combinación lineal <strong>de</strong> los vectores e i <strong>de</strong> la<br />

base canónica). El criterio para obtener este subespacio es que la muestra<br />

proyectada<br />

d∑<br />

¯x k = f i c ki , (3.2)<br />

i=1<br />

tenga una varianza máxima. El cálculo matemático para obtener los vectores<br />

óptimos f i es sencillo y consiste en estimar la matriz <strong>de</strong> varianzas y<br />

covarianzas a partir <strong>de</strong> la muestra <strong>de</strong> datos. Los autovectores (o Funciones<br />

Ortogonales Empíricas , EOFs) <strong>de</strong> esta matriz son los nuevos vectores f i y<br />

los correspondientes autovalores indican la varianza explicada (la varianza<br />

<strong>de</strong> la muestra proyectada sobre el vector). Los coeficientes <strong>de</strong> cada elemento<br />

<strong>de</strong> la muestra en la nueva base se <strong>de</strong>nominan Componentes Principales<br />

(CPs).<br />

Dada la muestra (3.1), se pue<strong>de</strong> estimar la matriz <strong>de</strong> varianzas y covarianzas<br />

C x , don<strong>de</strong> cada elemento σ ij representa la covarianza <strong>de</strong> los datos<br />

entre la variable i y la j <strong>de</strong>l espacio original:<br />

σ ij =< (x ki − µ i )(x kj − µ j ) > k ; µ i =< x ki > k , µ j =< x kj > k . (3.3)<br />

Esta matriz <strong>de</strong> varianzas y covarianzas es cuadrada y simétrica por lo que<br />

se pue<strong>de</strong> calcular una nueva base ortogonal encontrando sus autovalores λ i<br />

(que serán reales y distintos) y los correspondientes autovectores f i :<br />

C x f i = λ i f i . (3.4)<br />

Es fácil resolver este problema cuando n es pequeño pero, a medida que<br />

aumenta la dimensión, el problema se complica <strong>de</strong>bido al posible mal condicionamiento<br />

<strong>de</strong> la matriz. En estos casos es necesario aplicar métodos


36 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

numéricos eficientes como la Descomposición en Valores Sigulares (SVD),<br />

que proporciona una factorización <strong>de</strong> la matriz C x <strong>de</strong> la forma (ver Press et al.<br />

(1992) para más <strong>de</strong>talles):<br />

Σ x = P Λ P T , (3.5)<br />

don<strong>de</strong> Λ es una matriz diagonal que contiene los autovalores λ i (or<strong>de</strong>nados<br />

<strong>de</strong> forma <strong>de</strong>creciente) <strong>de</strong> C x , y las columnas <strong>de</strong> P son los correspondientes<br />

autovectores f i . A<strong>de</strong>más P es una matriz ortogonal y P T es su inversa. De<br />

esta manera, si hacemos la proyección:<br />

¯x k = P T x k =<br />

⎛<br />

⎜<br />

⎝<br />

f 11<br />

.<br />

f n1<br />

⎞ ⎛<br />

. . . f 1n<br />

⎟ ⎜<br />

. ⎠ ⎝<br />

. . . f nn<br />

⎞<br />

x 1k<br />

⎟<br />

. ⎠ (3.6)<br />

x nk<br />

se tendrá el elemento <strong>de</strong> la muestra proyectado sobre la base <strong>de</strong> autovectores<br />

<strong>de</strong> C x , mientras que la proyección inversa se obtendrá mediante x k = P¯x k .<br />

Esta proyección tiene las siguientes propieda<strong>de</strong>s:<br />

Componentes incorrelacionadas: < ¯x ki ¯x kj > k = 0, i ≠ j.<br />

V ar(¯x i ) = λ i , i = 1, . . .,n.<br />

∑ ni=1<br />

V ar(x i ) = ∑ n<br />

i=1 V ar(¯x i ) = ∑ n<br />

i=1 λ i .<br />

Dado que los vectores se eligen en or<strong>de</strong>n <strong>de</strong>creciente <strong>de</strong> varianza, es posible<br />

hacer un recorte <strong>de</strong> dimensiones reteniendo la máxima cantidad posible <strong>de</strong><br />

varianza (obviamente, si se quiere conservar toda la varianza habrá que<br />

tomar d = n). Si se toman sólo las d primeras EOFs, cada elemento <strong>de</strong> la<br />

muestra se podrá expresar aproximadamente como:<br />

⎛<br />

x k ≈ QQ T x k =<br />

⎜<br />

⎝<br />

f 11<br />

.<br />

.<br />

f 1n<br />

⎞<br />

. . . f d1 ⎛<br />

.<br />

⎜<br />

⎝<br />

⎟<br />

. ⎠<br />

. . . f dn<br />

⎞<br />

f 11 . . .... f 1n<br />

⎟<br />

. . ⎠x k , (3.7)<br />

f d1 . . .... f dn<br />

don<strong>de</strong> Q representa a la matriz P truncada a los d primeros autovectores.<br />

El vector ¯x k = Q T x k <strong>de</strong> dimensión d×1 contendrá las CPs <strong>de</strong>l patrón x k , es<br />

<strong>de</strong>cir, las componentes <strong>de</strong>l vector en el nuevo espacio <strong>de</strong> dimensión d. Para<br />

recuperar la dimensión original, el vector <strong>de</strong> CPs se proyectará mediante<br />

Q¯x k , obteniendo una aproximación <strong>de</strong>l vector original (mejor cuanto mayor<br />

sea la dimensión d <strong>de</strong>l espacio proyector).<br />

Maximizar la varianza es equivalente a minimizar la norma cuadrática<br />

<strong>de</strong> los residuos ¯x k − x k .<br />

V ar(x k ) = V ar(x k + Q¯x k − Q¯x k ) = V ar(x k − Q¯x k ) + V ar(Q¯x k ) (3.8)


3.2. COMPONENTES PRINCIPALES 37<br />

Por tanto, la técnica <strong>de</strong> componentes principales obtiene la proyección lineal<br />

óptima en sentido <strong>de</strong> máxima varianza explicada y <strong>de</strong> mínimo error <strong>de</strong><br />

reconstrucción.<br />

Para eliminar los problemas <strong>de</strong>bidos a las distintas escalas <strong>de</strong> cada una <strong>de</strong><br />

las componentes <strong>de</strong>l vector, es conveniente estandarizar los datos como paso<br />

previo a realizar el análisis. De esta forma se evita que las variables <strong>de</strong> mayor<br />

varianza se hagan dominantes en el análisis. En el caso <strong>de</strong> datos atmosféricos<br />

se han <strong>de</strong> estandarizar por separado los valores correspondientes a cada<br />

punto <strong>de</strong> rejilla, <strong>de</strong> forma que la variabilidad <strong>de</strong>l patrón en toda la extensión<br />

espacial sea homogénea. Otro procedimiento consiste en utilizar la matriz <strong>de</strong><br />

correlaciones en lugar <strong>de</strong> la <strong>de</strong> varianza-covarianza para realizar el análisis<br />

(Noguer, 1994).<br />

Recientemente se han <strong>de</strong>scrito en la literatura extensiones no lineales <strong>de</strong><br />

esta técnica que proyectan los datos a través <strong>de</strong> combinaciones no lineales <strong>de</strong><br />

las variables originales maximizando la varianza explicada o minimizando el<br />

error cuadrático (re<strong>de</strong>s neuronales <strong>de</strong> cuello <strong>de</strong> botella, Kramer (1991), etc.).<br />

Los métodos resultantes tienen mayor flexibilidad que las técnicas lineales,<br />

pero la mejora que ofrecen no justifica algunas <strong>de</strong>ficiencias, como la carencia<br />

<strong>de</strong> propieda<strong>de</strong>s como la ortogonalidad <strong>de</strong> la base.<br />

Ejemplo 3.1 (EOFs y CPs <strong>de</strong> Patrones Atmosféricos). En este ejemplo<br />

se aplica la técnica <strong>de</strong> componentes principales para hallar los patrones<br />

<strong>de</strong> presión a nivel <strong>de</strong>l mar (Sea Level Pressure, SLP) dominantes en tres<br />

zonas <strong>de</strong>l globo (ver Fig. 3.1), con características diferentes <strong>de</strong> circulación<br />

atmosférica y oceánica. Para ello, se han consi<strong>de</strong>rado medias <strong>de</strong>cenales <strong>de</strong><br />

patrones diarios <strong>de</strong> SLP en tres rejillas distintas que <strong>de</strong>finen la región <strong>de</strong>l<br />

Atlántico Norte (AN), la región <strong>de</strong>l Pacífico Sur (PS), y la zona <strong>de</strong> América<br />

Austral (Austral), respectivamente. Los datos disponibles cubren el período<br />

1979-1993 correspondiente al re-análisis ERA-15. La siguiente tabla muestra<br />

la varianza explicada por las cuatro primeras EOF en cada caso, ilustrando<br />

las diferencias entre las distintas zonas:<br />

AN PS Austral<br />

EOF 1 32.91 59.90 25.90<br />

EOF 2 19.14 12.71 22.62<br />

EOF 3 14.40 7.69 20.52<br />

EOF 4 8.86 5.26 9.86<br />

Acumulado 75.31 85.66 78.90<br />

En los tres casos existe una enorme redundancia en los datos, y una<br />

proporción muy pequeña <strong>de</strong> las variables permite explicar una alto porcentaje<br />

<strong>de</strong> la varianza. La zona <strong>de</strong>l PS es la que mayor redundancia muestra (la<br />

primera EOF explica cerca <strong>de</strong>l 60% <strong>de</strong> la varianza), mientras que las zonas<br />

AN y Austral presentan una varianza acumulada similar; sin embargo, esta<br />

varianza está igualmente distribuida entre las tres primeras EOFs en el caso<br />

Austral, mientras que <strong>de</strong>cae uniformemente en el AN. Esto nos muestra


38 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

que la presión en los trópicos tiene mucha más correlación espacial que en<br />

latitu<strong>de</strong>s medias y, a su vez, la correlación en latitu<strong>de</strong>s medias se expresa <strong>de</strong><br />

forma distinta en distintas regiones <strong>de</strong>l globo.<br />

45 ° N<br />

0 °<br />

45 ° S<br />

135 ° W<br />

90 ° W<br />

45 ° W<br />

0 °<br />

Figura 3.1: Zonas geográficas correspondientes al Atlántico Norte, Pacífico Sur, y<br />

América Austral. Las rejillas (2.5 o × 2.5 o ) muestran los puntos <strong>de</strong> grid utilizados<br />

para caracterizar los patrones <strong>de</strong> presión a nivel <strong>de</strong>l mar.<br />

La Fig. 3.2 muestra las cuatro primeras EOFs para la zona NAO y la zona<br />

Austral. Estos patrones maximizan la varianza proyectada <strong>de</strong> la muestra<br />

y, por tanto, <strong>de</strong>finen los fenómenos sinópticos más relevantes que explican la<br />

variabilidad climática. Por ejemplo, la primera EOF <strong>de</strong> la zona AN correspon<strong>de</strong><br />

al patrón <strong>de</strong> variabilidad anual <strong>de</strong> la presión, mientras que la segunda<br />

EOF correspon<strong>de</strong> al patrón <strong>de</strong> la NAO (North Atlantic Oscillation), y las<br />

siguientes están relacionadas con patrones como la EA (East Atlantic In<strong>de</strong>x),<br />

AO (Artic Oscillation), etc. (ver, por ejemplo, Corte-Real et al., 1999;<br />

Rodríguez-Fonseca and Serrano, 1991, para una <strong>de</strong>tallada <strong>de</strong>scripción <strong>de</strong> estos<br />

patrones <strong>de</strong> teleconexión).<br />

La evolución temporal <strong>de</strong> las CPs nos da un i<strong>de</strong>a <strong>de</strong> la frecuencia <strong>de</strong><br />

variación temporal <strong>de</strong> los fenómenos caracterizados por la correspondiente<br />

EOF. Por ejemplo la Figura 3.3 muestra la evolución <strong>de</strong> la CPs para la<br />

región <strong>de</strong>l AN. Pue<strong>de</strong> observarse la frecuencia anual <strong>de</strong> la primera EOF,<br />

mientras que las restantes presentan variabilida<strong>de</strong>s temporales más complejas,<br />

relacionadas con las oscilaciones <strong>de</strong> los correspondientes patrones.


1032<br />

3.2. COMPONENTES PRINCIPALES 39<br />

1029<br />

1084<br />

1066<br />

1047<br />

1121<br />

1102<br />

1049<br />

995<br />

1006<br />

1027<br />

1070<br />

1060<br />

1016<br />

1010<br />

973<br />

1081<br />

992<br />

1038<br />

1016<br />

1006<br />

995<br />

1021<br />

1001<br />

1031<br />

982<br />

1011<br />

1021<br />

992<br />

972<br />

962<br />

953<br />

993 1000<br />

981<br />

1025<br />

1013<br />

1013<br />

1019<br />

1006<br />

1038<br />

1025<br />

1032<br />

1019<br />

1006<br />

1040<br />

1025<br />

946<br />

931<br />

915<br />

1009<br />

993<br />

978<br />

962<br />

899<br />

884<br />

1009<br />

1032<br />

1024<br />

979<br />

994<br />

1009<br />

1017<br />

964<br />

986<br />

971<br />

1002<br />

986<br />

1034<br />

1047<br />

1022<br />

1021<br />

1034<br />

1060<br />

1022<br />

996<br />

1009<br />

984<br />

971<br />

958<br />

1021<br />

1013<br />

1005<br />

998<br />

990<br />

1005<br />

1013<br />

966<br />

1021<br />

958<br />

982<br />

974<br />

Figura 3.2: Cuatro primeras EOF correspondientes al área geográfica <strong>de</strong>l Atlántico<br />

Norte (AN) y <strong>de</strong> América Austral (Austral).


40 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

40<br />

20<br />

0<br />

-20<br />

-40<br />

40<br />

20<br />

0<br />

-20<br />

-40<br />

CP1<br />

CP2<br />

40<br />

20<br />

0<br />

-20<br />

-40<br />

20<br />

CP3<br />

CP4<br />

0<br />

-20<br />

0 750 1500 2250 3000 3750 4500 5250<br />

day number<br />

Figura 3.3: Evolución temporal <strong>de</strong> las cuatro primeras CPs en la zona <strong>de</strong>l AN.<br />

3.2.1. Elección <strong>de</strong>l Número <strong>de</strong> Componentes<br />

Una cuestión importante en la práctica es <strong>de</strong>terminar el número <strong>de</strong> CPs<br />

que <strong>de</strong>ben tomarse para un <strong>de</strong>terminado problema, <strong>de</strong> forma que haya un<br />

equilibrio entre la reducción <strong>de</strong> información <strong>de</strong>seada y la calidad <strong>de</strong> la aproximación<br />

resultante. Una forma objetiva <strong>de</strong> seleccionar el número necesario<br />

<strong>de</strong> CPs es imponer un umbral para el error <strong>de</strong> reconstrucción obtenido (el<br />

error residual). Por ejemplo, la Figura 3.4 muestra el error <strong>de</strong> reconstrucción<br />

(Root Mean Square Error, RMSE) frente al porcentaje <strong>de</strong> CPs utilizadas<br />

para el patrón atmosférico Mo<strong>de</strong>lo 2 <strong>de</strong>l Ejemplo 2.1 (estandarizando las<br />

variables antes <strong>de</strong> aplicar el algoritmo). En la figura se muestran los errores<br />

separadamente para cada variable. A pesar <strong>de</strong> que las CPs se han obtenido<br />

globalmente combinando todas las variables, los errores <strong>de</strong> reconstrucción<br />

son similares para todas ellas. Sólo en el caso <strong>de</strong> consi<strong>de</strong>rar un número pequeño<br />

<strong>de</strong> CPs se pue<strong>de</strong>n apreciar diferencias en los errores <strong>de</strong> reconstrucción,<br />

siendo éstos inferiores en patrones más suaves (por ejemplo Z o T).<br />

Por ejemplo, se pu<strong>de</strong> adoptar como criterio que los errores <strong>de</strong> reconstrucción<br />

sean inferiores a los errores <strong>de</strong> asimilación habituales en los mo<strong>de</strong>los<br />

numéricos. En la Fig. 3.4 se observa que utilizando tan sólo un 10 % <strong>de</strong> las<br />

variables originales se tiene un error <strong>de</strong> reconstrucción menor <strong>de</strong>l 2 % <strong>de</strong> la<br />

<strong>de</strong>sviación estándar <strong>de</strong> los campos 3D, cifra inferior a los errores promedio<br />

<strong>de</strong> asimilación. Un criterio alternativo para seleccionar el número apropiado<br />

<strong>de</strong> componentes principales sería utilizar la distancia promedio entre los<br />

patrones vecinos en una base <strong>de</strong> datos <strong>de</strong> re-análisis.<br />

Otro criterio más práctico para seleccionar el número óptimo <strong>de</strong> CPs<br />

sería elegir el que proporcione mejores resultados <strong>de</strong> validación cuando se<br />

aplique un método concreto. En esta Tesis se aborda el problema <strong>de</strong> la


3.2. COMPONENTES PRINCIPALES 41<br />

RMSE of standarized fields<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0.02<br />

0.01<br />

Z<br />

T<br />

U<br />

V<br />

RH<br />

0<br />

10 15 20 25<br />

0<br />

0 5 10 15 20 25<br />

% of Principal Components<br />

Figura 3.4: Error RMSE <strong>de</strong> reconstrucción para cada una <strong>de</strong> las cinco variables<br />

en el Mo<strong>de</strong>lo 1 (el error es calculado para los campos 3D normalizados) frente al<br />

número <strong>de</strong> CPs (variando <strong>de</strong>s<strong>de</strong> 1 % <strong>de</strong> la dimensión <strong>de</strong>l vector original, al 25 %).<br />

predicción meteorológica probabilística local utilizando distintas técnicas <strong>de</strong><br />

agrupamiento. Por tanto, un criterio a seguir para elegir el número óptimo<br />

<strong>de</strong> CPs sería en base al menor error <strong>de</strong> validación. Por ejemplo, la Fig.<br />

3.5 muestra la evolución <strong>de</strong>l índice <strong>de</strong> pericia <strong>de</strong> Brier (Brier Skill Score,<br />

BSS; ver Cap. 4) en función <strong>de</strong>l número <strong>de</strong> CPs consi<strong>de</strong>radas al aplicar un<br />

método estándar <strong>de</strong> predicción local <strong>de</strong>nominado k-NN (ver Cap. 5). Esta<br />

figura indica que el número <strong>de</strong> componentes relevantes para el método es<br />

sustancialmente bajo (menor <strong>de</strong> 25 para umbrales bajos <strong>de</strong> precipitación).<br />

Así mismo, se observa que a medida que el evento es más raro (por ejemplo<br />

Precip > 20mm), el número <strong>de</strong> componentes óptimo se incrementa sustancialmente.<br />

Este ejemplo ilustra que el número <strong>de</strong> componentes principales<br />

relevantes <strong>de</strong>pen<strong>de</strong> sustancialmente <strong>de</strong>l problema que se <strong>de</strong>sea resolver y <strong>de</strong>l<br />

método utilizado para su resolución.<br />

0.5<br />

0.4<br />

0.3<br />

BSS<br />

0.2<br />

0.1<br />

> 0.1mm<br />

> 2mm<br />

> 10mm<br />

> 20mm<br />

0<br />

0 25 50 75 100 125 150<br />

Número <strong>de</strong> CPs<br />

Figura 3.5: Evolución <strong>de</strong>l Brier Skill Score (BSS) para la predicción <strong>de</strong> los eventos<br />

Precip > 0.1mm, 2, 10, y 20mm.


42 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

3.2.2. Efectos <strong>de</strong> la Escala Temporal<br />

La escala temporal <strong>de</strong> los datos viene dada por el tipo <strong>de</strong> estudio que<br />

se <strong>de</strong>see realizar. En estudios <strong>de</strong> tipo climático, que sólo analizan patrones<br />

sinópticos promedio semanales o mensuales <strong>de</strong> gran escala, el número <strong>de</strong><br />

componentes tomadas suele ser reducido, y cada una <strong>de</strong> las EOFs resultantes<br />

se analiza en el contexto <strong>de</strong> los distintos patrones <strong>de</strong> teleconexión, buscando<br />

una interpretación <strong>de</strong>l patrón resultante, como se mostró en el Ejemplo 3.1.<br />

En cambio, cuando se llevan a cabo estudios sobre regiones más reducidas<br />

y con patrones <strong>de</strong> mayor variabilidad temporal (diarios, horarios, etc.) el<br />

número <strong>de</strong> CPs crece <strong>de</strong> forma consi<strong>de</strong>rable, ya que la correlación espacial<br />

<strong>de</strong> los patrones disminuye. En el siguiente ejemplo, se ilustra este hecho.<br />

Ejemplo 3.2 (Componentes Principales y Escala Temporal). Un<br />

ejemplo más notorio lo constituyen los datos <strong>de</strong> observaciones en un red<br />

<strong>de</strong> estaciones sobre una zona <strong>de</strong> interés. Se consi<strong>de</strong>ran las 100 estaciones<br />

climáticas <strong>de</strong> la red principal <strong>de</strong>l INM mostradas en la Fig. 2.8, tomando<br />

patrones diarios formados por los correspondientes 100 valores diarios <strong>de</strong><br />

temperatura, precipitación, o <strong>de</strong> racha máxima <strong>de</strong> viento. En la Figura 3.6<br />

se muestra el porcentaje <strong>de</strong> varianza explicada en función <strong>de</strong>l número <strong>de</strong> CPs<br />

tomadas para el patrón atmosférico <strong>de</strong>l Ejemplo 2.1 (Mo<strong>de</strong>lo 2) consi<strong>de</strong>rado<br />

en la sección anterior, y los patrones <strong>de</strong> observaciones <strong>de</strong> temperatura,<br />

precipitación y racha máxima.<br />

% Varianza explicada<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

0 20 40 60 80 100<br />

%CPs<br />

(c) Temperatura máxima<br />

100<br />

(a) Patrones diarios<br />

(a)<br />

Estado <strong>de</strong> la Atmósfera<br />

Temperatura máxima<br />

Racha máxima<br />

Precipitación<br />

% Varianza explicada<br />

100<br />

80<br />

60<br />

40<br />

20<br />

Precipitación/24h<br />

Precipitación/10días<br />

Precipitación/30días<br />

Precipitación/90días<br />

0<br />

0 20 40 60 80 100<br />

%CPs<br />

(d) Racha máxima<br />

100<br />

(b) Precipitación<br />

% Varianza explicada<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

Temperatura máxima/24h<br />

Temperatura máxima/10días<br />

Temperatura máxima/30días<br />

30<br />

0 20 40 60 80 100<br />

%CPs<br />

% Varianza explicada<br />

80<br />

60<br />

40<br />

Racha máxima/24h<br />

Racha máxima/10días<br />

20<br />

Racha máxima/30días<br />

Racha máxima/90días<br />

0<br />

0 20 40 60 80 100<br />

%CPs<br />

Figura 3.6: Porcentaje <strong>de</strong> varianza explicada en función <strong>de</strong>l número <strong>de</strong> EOFs<br />

consi<strong>de</strong>ras para patrones atmosféricos, temperatura, precipitación y racha máxima.


3.3. TÉCNICAS DE AGRUPAMIENTO 43<br />

En esta figura pue<strong>de</strong> verse que el patrón atmosférico está altamente correlacionado<br />

y, por tanto, el porcentaje <strong>de</strong> varianza explicado con unas pocas<br />

CPs es muy elevado; por el contrario, la precipitación y la racha máxima<br />

presentan una menor correlación espacial y requieren <strong>de</strong> un número mayor<br />

<strong>de</strong> EOFs para ser representados a<strong>de</strong>cuadamente. La temperatura muestra un<br />

comportamiento intermedio.<br />

Por otra parte, las Figuras 3.6(b)-(d) muestran el aumento <strong>de</strong> la correlación<br />

espacial al consi<strong>de</strong>rar promedios temporales (medias diarias, <strong>de</strong>cenal,<br />

mensual y estacional) <strong>de</strong> esas mismas variables. Por tanto, a medida que<br />

crece la escala temporal don<strong>de</strong> el patrón está promediado, <strong>de</strong>crece el número<br />

<strong>de</strong> CPs necesario para alcanzar un umbral requerido. Por tanto, estudios <strong>de</strong><br />

escala estacional, o <strong>de</strong> cambio climático, que trabajan con promedios mensuales<br />

<strong>de</strong> las variables requerirán un número menor <strong>de</strong> CPs que estudios que<br />

requieran el uso <strong>de</strong> patrones diarios.<br />

3.3. Técnicas <strong>de</strong> <strong>Agrupamiento</strong><br />

En esta sección se <strong>de</strong>scriben brevemente las técnicas clásicas y mo<strong>de</strong>rnas<br />

<strong>de</strong> agrupamiento que son utilizadas en numerosas disciplinas para dividir<br />

un conjunto <strong>de</strong> datos en subconjuntos homogéneos siguiendo algún criterio<br />

<strong>de</strong> similitud (ver An<strong>de</strong>rberg, 1973, para una <strong>de</strong>scripción <strong>de</strong>tallada <strong>de</strong> estos<br />

métodos). Una primera división <strong>de</strong> estas técnicas se pue<strong>de</strong> establecer en base<br />

a su carácter jerárquico o particional, según las características <strong>de</strong>l proceso<br />

seguido para construir los grupos.<br />

3.3.1. Técnicas Jerárquicas<br />

Las técnicas <strong>de</strong> agrupamiento jerárquico son iterativas y proce<strong>de</strong>n uniendo<br />

grupos pequeños (técnicas aglomerativas), o dividiendo grupos gran<strong>de</strong>s<br />

(técnicas divisivas), don<strong>de</strong> el concepto <strong>de</strong> tamaño viene dado por la medida<br />

<strong>de</strong> similitud utilizada (correlación, distancia, información mutua, etc.).<br />

Dentro <strong>de</strong> estos métodos <strong>de</strong>stacan los llamados SHAN, que comparten las<br />

siguientes características:<br />

Secuencial (Sequential): el mismo algoritmo es aplicado iterativamente<br />

a los grupos disponibles.<br />

Jerárquico (Hierarchical): la secuencia <strong>de</strong> uniones <strong>de</strong> grupos se representa<br />

mediante una estructura <strong>de</strong> árbol.<br />

Aglomerativa (Agglomerative): inicialmente cada punto <strong>de</strong>l conjunto<br />

<strong>de</strong> datos es asignado a un grupo distinto; y el algoritmo proce<strong>de</strong><br />

uniendo los grupos mas similares hasta que el criterio <strong>de</strong> parada es<br />

alcanzado.<br />

Sin-solapamiento (Non-overalpping): ningún elemento pue<strong>de</strong> pertenecer<br />

simultáneamente a dos grupos diferentes.


44 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

Varias alternativas son posibles, <strong>de</strong>pendiendo <strong>de</strong> la métrica utilizada para<br />

<strong>de</strong>finir la similitud entre grupos. Por un lado, el método conocido como “enlace<br />

promedio” <strong>de</strong>fine una distancia inter-grupo como la distancia promedio<br />

entre todos los posibles pares <strong>de</strong> elementos en los dos grupos comparados.<br />

Este método tien<strong>de</strong> a formar grupos con varianzas similares. Por otro lado, el<br />

“enlace <strong>de</strong> Ward” mezcla aquellos pares <strong>de</strong> grupos que minimizan la dispersión<br />

<strong>de</strong>l grupo resultante. En este caso, el cuadrado <strong>de</strong> la distancia Euclí<strong>de</strong>a<br />

es tomada como medida <strong>de</strong> diferencia (para más <strong>de</strong>talles sobre la aplicación<br />

<strong>de</strong> estos métodos en Meteorología consultar Kalkstein et al. (1987)). A<br />

continuación, se <strong>de</strong>scribe el método <strong>de</strong> Ward como ejemplo <strong>de</strong> estas técnicas.<br />

Dado un conjunto <strong>de</strong> datos {v 1 , v 2 , . . .,v n }, este método <strong>de</strong>scompone la<br />

varianza total V en varianzas intragrupo, para los grupos actuales C i con<br />

centroi<strong>de</strong>s c i y peso, o masa, m i (en un paso <strong>de</strong> iteración dado) y la varianza<br />

entre grupos:<br />

V = ∑ m q ||c q − c|| 2 + ∑ ∑<br />

m i ||v i − c q || 2 , (3.9)<br />

q<br />

q i∈C q<br />

don<strong>de</strong> c es el centroi<strong>de</strong> global (media <strong>de</strong> los datos).<br />

Si dos grupos C i y C j , con masas m i y m j respectivamente, son unidos<br />

en un solo grupo, D, con masa m i + m j y centroi<strong>de</strong><br />

d = m ic i + m j c j<br />

m i + m j<br />

, (3.10)<br />

entonces la varianza V ij <strong>de</strong> C i y C j respecto a D pue<strong>de</strong>n ser <strong>de</strong>scompuestas<br />

por la ecuación<br />

V ij = m i ||c i − d|| 2 + m j ||c j − d|| 2 + m||d − c|| 2 . (3.11)<br />

El último término es el único que permanece constante si cambiamos C i y<br />

C j por el centro <strong>de</strong> gravedad D. Entonces, la reducción <strong>de</strong> la varianza será:<br />

Usando (3.10), se tiene:<br />

∆V ij = m i ||c i − d|| 2 + m j ||c j − d|| 2 . (3.12)<br />

∆V ij<br />

= m i ||c i − m ic i + m j c j<br />

|| 2 + m j ||c j − m ic i + m j c j<br />

|| 2<br />

m i + m j<br />

m i + m j<br />

m i m j<br />

= ||c i − c j || 2 . (3.13)<br />

m i + m j<br />

Luego la estrategia seguida por este método es la unión, en cada paso, <strong>de</strong><br />

grupos C i y C j que minimiza ∆V ij (inicialmente cada punto es consi<strong>de</strong>rado<br />

como un solo grupo). Así que se pue<strong>de</strong> consi<strong>de</strong>rar ∆V ij como la medida <strong>de</strong><br />

disimilitud. Notar que los elementos con menos peso son los primeros en<br />

unirse entre sí.<br />

El algoritmo <strong>de</strong> agrupamiento pue<strong>de</strong> ser representado gráficamente mediante<br />

un “<strong>de</strong>ndrograma” (un árbol representando en diferentes niveles la<br />

jerarquía <strong>de</strong> uniones <strong>de</strong> los grupos individuales o grupos en diferentes pasos).


3.3. TÉCNICAS DE AGRUPAMIENTO 45<br />

Ejemplo 3.3 (Regionalización Automática). Una <strong>de</strong> las primeras clasificaciones<br />

climatológicas basadas en criterios estadísticos es la <strong>de</strong>bida a<br />

Köppen (1918), que <strong>de</strong>finió un conjunto <strong>de</strong> climas basado en combinaciones<br />

<strong>de</strong> umbrales para la precipitación y temperatura en las distintas estaciones<br />

<strong>de</strong>l año (ver Oliver, 1991, para una <strong>de</strong>scripción histórica <strong>de</strong> las técnicas <strong>de</strong><br />

clasificación climática). Esta clasificación aún continúa vigente y es el punto<br />

<strong>de</strong> partida <strong>de</strong> estudios más sistemáticos <strong>de</strong> regionalización. En fechas más<br />

recientes, las técnicas basadas en métodos <strong>de</strong> agrupamiento han mostrado<br />

ser simples y eficientes para este problema (ver Fovell and Fovell, 1993).<br />

A la hora <strong>de</strong> aplicar técnicas <strong>de</strong> agrupamiento para el problema <strong>de</strong> la regionalización,<br />

primero hay que <strong>de</strong>cidir qué variables van a consi<strong>de</strong>rarse para<br />

<strong>de</strong>finir la climatología local <strong>de</strong> las distintas estaciones. Existen numerosas<br />

fuentes <strong>de</strong> información que permiten y discriminar a<strong>de</strong>cuadamente distintas<br />

regiones con climatologías homogéneas: geográficas (como longitud, latitud,<br />

elevación, pertenencia a cuencas hidrográficas), estadísticas (temperaturas<br />

extremas, medias mensuales, precipitación acumulada, humedad relativa,<br />

etc.). Las técnicas <strong>de</strong> agrupamiento permiten realizar <strong>de</strong> forma automática<br />

distintos experimentos combinando estas variables. En el siguiente ejemplo<br />

se muestra una sencilla aplicación consi<strong>de</strong>rando sólamente información relativa<br />

a la precipitación (ésta es la variable esencial en problemas hidrológicos,<br />

agrícolas y ecológicos). Cada estación es representada por un vector<br />

que caracteriza su climatología local. En este ejemplo, cada estación está caracterizada<br />

por un vector v = (mp v , mp i ), don<strong>de</strong> mp v y mp i son las medias<br />

estacionales <strong>de</strong> precipitación para verano e invierno, respectivamente.<br />

Se consi<strong>de</strong>ran datos <strong>de</strong> 30 años para un conjunto <strong>de</strong> 54 estaciones <strong>de</strong> la<br />

península Ibérica (ver Fig. 3.7(a)).<br />

44<br />

(a)<br />

(b)<br />

40<br />

36<br />

Norte<br />

Duero<br />

Tajo<br />

Guadiana<br />

Guadalquivir<br />

Mediterraneo<br />

Ebro<br />

-10 -5 0 5 -10 -5 0 5<br />

Figura 3.7: (a) Red <strong>de</strong> 54 estaciones automáticas en España; (b) Estaciones correspondientes<br />

a cada una <strong>de</strong> las siete cuencas hidrográficas principales: Norte, Duero,<br />

Tajo, Guadiana, Guadalquivir-Sur, Mediterraneo, y Ebro.<br />

En todos los casos, las observaciones <strong>de</strong> precipitación diaria están disponibles<br />

<strong>de</strong> 1970 a 2000, sin falta <strong>de</strong> datos ni lagunas. La Fig. 3.8 muestra los<br />

grupos obtenidos aplicando el algoritmo <strong>de</strong> Ward consi<strong>de</strong>rando un máximo<br />

<strong>de</strong> 7 grupos. La razón para este criterio <strong>de</strong> parada es la coinci<strong>de</strong>ncia con las<br />

siete cuencas hidrográficas principales <strong>de</strong> la Península (ver Fig. 3.7(b)).<br />

La Figura 3.8 ilustra la capacidad <strong>de</strong> discriminación <strong>de</strong> la variable <strong>de</strong>


46 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

44<br />

42<br />

40<br />

38<br />

36<br />

10 5 0 5<br />

1 LA CORUÑA<br />

1 ROZAS<br />

1 PARAYAS<br />

1 SANTANDER<br />

1 SONDICA<br />

1 GIJON<br />

1 OVIEDO<br />

1 ORENSE<br />

1 SAN SEBASTIÁN<br />

1 FUENTERRABÍA<br />

2 NAVACERRADA<br />

1 SANTIAGO<br />

1 VIGO<br />

5 SEVILLA_A<br />

5 SEVILLA_B<br />

5 JEREZ<br />

5 TARIFA<br />

5 MÁLAGA<br />

7 VITORIA<br />

7 PAMPLONA<br />

1 PONFERRADA<br />

2 LEÓN<br />

2 BURGOS<br />

2 SORIA<br />

2 SEGOVIA<br />

2 VALLADOLID_A<br />

2 VALLADOLID_B<br />

4 BADAJOZ<br />

4 HINOJOSA<br />

4 CIUDAD REAL<br />

6 MURCIA_A<br />

6 MURCIA_B<br />

6 CARTAGENA<br />

6 MURCIA_C<br />

6 ALICANTE_A<br />

6 ALICANTE_B<br />

7 LOGROÑO<br />

7 DAROCA<br />

7 ZARAGOZA<br />

3 CÁCERES<br />

4 HUELVA<br />

6 VALENCIA_A<br />

6 VALENCIA_B<br />

6 CASTELLÓN<br />

7 TORTOSA<br />

7 HUESCA<br />

3 MADRID<br />

5 GRANADA<br />

2 SALAMANCA<br />

2 ÁVILA<br />

2 ZAMORA<br />

3 MADRID<br />

3 TOLEDO<br />

5 ALMERÍA<br />

Figura 3.8: Análisis <strong>de</strong> agrupamiento mediante el enlace <strong>de</strong> Ward <strong>de</strong> 54 estaciones<br />

en la Península Ibérica caracterizado por el promedio <strong>de</strong> precipitación en Invierno<br />

y Verano. El <strong>de</strong>ndrograma representa los diferentes grupos a un cierto nivel <strong>de</strong><br />

profundidad, en el eje horizontal, y las distancias don<strong>de</strong> los elementos son unidos<br />

en diferentes niveles jerárquicos, en el eje vertical.


3.3. TÉCNICAS DE AGRUPAMIENTO 47<br />

precipitación promediada. Los símbolos en las figuras correspon<strong>de</strong>n a los diferentes<br />

grupos obtenidos, y el <strong>de</strong>ndrograma muestra el proceso aglomerativo.<br />

La lista <strong>de</strong> estaciones correspondientes a un grupo es dada bajo el correspondiente<br />

símbolo en el <strong>de</strong>ndrograma; el número prece<strong>de</strong>nte a los nombres<br />

<strong>de</strong> las estaciones correspon<strong>de</strong> a la cuenca hidrográfica a la que pertenece la<br />

estación (Norte, Duero, Tajo, Guadiana, Guadalquivir-Sur, Mediterraneo,<br />

Ebro). En esta figura se pue<strong>de</strong> ver como la cuenca Norte es claramente separada<br />

<strong>de</strong>l resto <strong>de</strong> cuencas (esta es la principal separación climatológica en<br />

la Península Iberica, que correspon<strong>de</strong> con un clima “oceánico-húmedo” <strong>de</strong><br />

acurdo con la clasificación <strong>de</strong> Köppen). La única excepción correspon<strong>de</strong> a<br />

“Navacerrada” la cual se encuentra en una zona montañosa que presenta<br />

condiciones climatológicas parecidas a las estaciones <strong>de</strong> la cuenca Norte (al<br />

menos en promedio).<br />

Por otra parte, el grupo etiquetado con una estrella correspon<strong>de</strong> a una<br />

región con un clima “semiárido”. Finalmente los dos grupos restantes correspon<strong>de</strong>n<br />

a regiones con clima “verano seco subtropical”. En este caso el grupo<br />

etiquetado por “+” se encuentra básicamente en la cuenca <strong>de</strong>l Guadalquivir<br />

y Sur (con alguna excepción), y el grupo etiquetado con un cuadrado esta<br />

disperso sobre toda la Península Ibérica.<br />

Este ilustrativo ejemplo <strong>de</strong>l procedimiento <strong>de</strong> clasificación por agrupamiento<br />

automático correspon<strong>de</strong> bastante bien con la regionalización estándar<br />

<strong>de</strong> Köppen para la Península Ibérica.<br />

3.3.2. Técnicas Particionales<br />

Los métodos <strong>de</strong> agrupamiento más convenientes para un gran número<br />

<strong>de</strong> patrones en un espacio alto-dimensional son los métodos <strong>de</strong> ajuste <strong>de</strong><br />

centroi<strong>de</strong>s iterativos. El método más común es el algoritmo <strong>de</strong> las k-medias<br />

(ver Hastie et al., 2001). Dado un grupo <strong>de</strong> vectores reales d-dimensionales<br />

X = {x 1 , . . .,x n }, y un número prescrito <strong>de</strong> grupos m, el algoritmo <strong>de</strong> las<br />

m-medias calcula un conjunto <strong>de</strong> prototipos d-dimensionales, o centroi<strong>de</strong>s,<br />

{v 1 , . . .,v m } cada uno <strong>de</strong> ellos caracterizando a un grupo <strong>de</strong> datos C i ⊂ X<br />

formado por los vectores para los cuales v i es el prototipo más cercano. Esta<br />

tarea es realizada siguiendo un procedimiento iterativo, el cual comienza<br />

con un conjunto inicial <strong>de</strong> centroi<strong>de</strong>s v 0 1 , . . .,v0 m, elegidos aleatoriamente<br />

(ver Peña et al., 1999, para una <strong>de</strong>scripción y comparación <strong>de</strong> diferentes<br />

procedimientos <strong>de</strong> inicialización). El objetivo <strong>de</strong>l algoritmo es minimizar<br />

globalmente la distancia intra-grupos:<br />

∑<br />

i=1,...,m<br />

∑<br />

x j ∈C i<br />

‖x j − v i ‖ 2 (3.14)<br />

Ya que una búsqueda exhaustiva <strong>de</strong>l mínimo es prohibitiva, se calcula un<br />

mínimo local mediante un ajuste iterativo <strong>de</strong> los centroi<strong>de</strong>s <strong>de</strong> los grupos, y<br />

re-asignando cada patrón al centroi<strong>de</strong> más cercano. En la iteración (r + 1)-<br />

ésima, cada uno <strong>de</strong> los vectores x j es asignado al grupo i-ésimo, don<strong>de</strong>


48 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

i = argmin c ‖ x j − vi c ‖, y los prototipos son actualizados por medio <strong>de</strong> los<br />

correspondientes patrones:<br />

vi<br />

r+1 = ∑<br />

x j /#C i ,<br />

x j ∈C i<br />

don<strong>de</strong> #C i <strong>de</strong>nota el número <strong>de</strong> elementos en C i . Bajo ciertas condiciones,<br />

el proceso iterativo anterior converge <strong>de</strong>spués <strong>de</strong> R iteraciones, y los centros<br />

finales vi<br />

R son los prototipos (centroi<strong>de</strong>s). Cada uno <strong>de</strong> los centroi<strong>de</strong>s v i<br />

representa un grupo C i formado por los patrones más cercanos a vi<br />

R que a<br />

cualquier otro centroi<strong>de</strong>. El algoritmo <strong>de</strong> m-medias consiste en los siguientes<br />

pasos:<br />

1. Seleccionar el número <strong>de</strong> grupos <strong>de</strong>seados m.<br />

2. Inicializar los centros <strong>de</strong> los grupos (p.e. aleatoriamente).<br />

3. Repetir:<br />

a) Asignar cada vector (patrón atmosférico) al grupo más cercano.<br />

b) Re-calcular los centros <strong>de</strong> cada grupo, para que sean la media <strong>de</strong><br />

los patrones <strong>de</strong> los patrones asignados a ese grupo.<br />

Ejemplo 3.4 (Clasificación <strong>de</strong> Patrones Atmosféricos). Se consi<strong>de</strong>ran<br />

los 5500 patrones atmosféricos <strong>de</strong>l re-análisis ERA-15 <strong>de</strong>finidos en el<br />

Ejemplo 2.1 en distintas rejillas (Mo<strong>de</strong>los 1 y 2); para reducir la dimensionalidad<br />

<strong>de</strong>l espacio, se toman las primeras 100 componentes principales (ver<br />

Ejemplo 3.1) y se consi<strong>de</strong>ran distintos números <strong>de</strong> grupos m = 100, 200, y<br />

400, que correspon<strong>de</strong>n a distintos tamaños promedio <strong>de</strong> grupo: aproximadamente<br />

50, 25, y 15, respectivamente. Por ejemplo, las Figs. 3.9 (a) y (b)<br />

muestran los prototipos obtenidos al aplicar el algoritmo con m = 100 para<br />

los Mo<strong>de</strong>los 1 y 3, respectivamente.<br />

3.4. Re<strong>de</strong>s Auto-Organizativas (SOM)<br />

Las re<strong>de</strong>s auto-organizativas (Self-Organizing Maps, SOM) son técnicas<br />

<strong>de</strong> agrupamiento especialmente indicadas para trabajar en espacios <strong>de</strong> alta<br />

dimensionalidad, ya que permiten organizar y visualizar los datos <strong>de</strong> forma<br />

intuitiva y eficiente proyectándolos en un espacio arbitrario (normalmente<br />

una red 2-dimensional). Existen distintos métodos empíricos y/o subjetivos<br />

para visualizar datos meteorológicos (ver Macedo et al. (2000)), pero las<br />

SOM tienen una serie <strong>de</strong> ventajas que serán utilizadas en esta Tesis (ver<br />

Cap. 6).<br />

A pesar <strong>de</strong> que esta técnica surgió en el contexto <strong>de</strong> la computación<br />

neuronal (Kohonen, 2000), las SOM son una generalización <strong>de</strong> la técnica<br />

<strong>de</strong> m-medias <strong>de</strong>scrita en la sección anterior. En este caso, cada uno <strong>de</strong> los<br />

centroi<strong>de</strong>s (o prototipos) <strong>de</strong> la SOM tiene asociados dos vectores: uno en el


3.4. REDES AUTO-ORGANIZATIVAS (SOM) 49<br />

(a)<br />

PC2<br />

PC1<br />

(b)<br />

PC2<br />

PC1<br />

Figura 3.9: <strong>Agrupamiento</strong> <strong>de</strong>l re-análisis ERA-15 con el algoritmo <strong>de</strong> k-<br />

medias consi<strong>de</strong>rando 100 grupos para (a) Mo<strong>de</strong>lo 1, (b) Mo<strong>de</strong>lo 3. El grafo<br />

muestra los patrones diarios y los centroi<strong>de</strong>s proyectados en el espacio <strong>de</strong> las<br />

dos primeras componentes principales. Las líneas <strong>de</strong> separación entre diferentes<br />

grupos también se muestran (estas líneas correspon<strong>de</strong>n al diagrama<br />

<strong>de</strong> Voronoi asociado a los centroi<strong>de</strong>s).


50 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

espacio <strong>de</strong> los datos y otro en el espacio base bidimensional <strong>de</strong> proyección.<br />

La característica <strong>de</strong> esta técnica es la inclusión <strong>de</strong> un núcleo espacial <strong>de</strong><br />

vecindad cuyo efecto es mantener unidos en el espacio <strong>de</strong> los datos aquellos<br />

centroi<strong>de</strong>s vecinos en el espacio 2D. La amplitud <strong>de</strong>l núcleo <strong>de</strong>crece durante<br />

el entrenamiento alternando la noción <strong>de</strong> vecindad <strong>de</strong> global a local,<br />

<strong>de</strong> forma que cuando finaliza el entrenamiento los centroi<strong>de</strong>s vecinos están<br />

también cercanos en el espacio 2D. De esta forma, el proceso <strong>de</strong> aprendizaje<br />

proyecta la estructura topológica <strong>de</strong>l espacio original en un espacio prefijado<br />

(una red 2D). En los últimos años, han sido numerosas las aplicaciones que<br />

han utilizado las ventajas <strong>de</strong> esta técnica (ver Oja and Kaski, 1999, y las<br />

referencias incluidas). En Meteorología la aplicación ha sido más reciente<br />

(ver Hewitson and Crane, 2002).<br />

Como se muestra en la Figura 3.10, una SOM esta formada por un número<br />

arbitrario <strong>de</strong> grupos C 1 , . . .,C m , localizados sobre una red regular en un<br />

espacio <strong>de</strong> baja dimensión, usualmente una red 2D para propósitos <strong>de</strong> visualización<br />

(en este caso m = s × s). El vector p k = (i, j) representa la<br />

posición <strong>de</strong>l grupo C k sobre la red, don<strong>de</strong> 1 ≤ i, j ≤ s. Mas aún, cada uno<br />

<strong>de</strong> los grupos C k tiene asociado un vector prototipo c k = (c k1 , . . .,c kd ), el<br />

cual <strong>de</strong>scribe la posición <strong>de</strong>l centro <strong>de</strong>l grupo sobre espacio d-dimensional <strong>de</strong><br />

los datos (miles <strong>de</strong> dimensiones o, cientos <strong>de</strong> componentes principales para<br />

patrones atmosféricos). Por ejemplo, si se consi<strong>de</strong>ran los dos patrones atmosféricos<br />

analizados en el Ejemplo 3.1, se tendrán espacios <strong>de</strong> dimensiones<br />

10710 (Mo<strong>de</strong>lo 1) y 8100 (Mo<strong>de</strong>lo 2).<br />

1000<br />

T 12<br />

.<br />

.<br />

.<br />

300<br />

T 12<br />

.<br />

.<br />

.<br />

1000<br />

V 12<br />

.<br />

.<br />

.<br />

300<br />

V 12<br />

ORIGINAL DATA<br />

u 1<br />

1<br />

u 2<br />

1<br />

.<br />

.<br />

.<br />

1<br />

u 4050<br />

...<br />

u 1<br />

5445<br />

u 2<br />

5445 v 1<br />

1<br />

.<br />

.<br />

.<br />

5445<br />

u 4050<br />

PCA<br />

COMPRESSED DATA<br />

v 2<br />

1<br />

.<br />

.<br />

.<br />

1<br />

v 600<br />

...<br />

v 1<br />

5445<br />

v 2<br />

5445<br />

.<br />

.<br />

.<br />

5445<br />

v 600<br />

w 1,1<br />

w 1,2<br />

w 1,600<br />

w 22,1<br />

w 22,2<br />

w 22,600<br />

5 x 5 SOM<br />

C 2 C 3 C 4 C 5<br />

C 1<br />

C 25<br />

C 6 C 7 C 8 C 9 C 10<br />

C 11 C 12 C 13 C 14 C 15<br />

C 16 C 17 C 18 C 19 C 20<br />

C 21 C 22 C 23 C 24<br />

Figura 3.10: Esquema <strong>de</strong> una SOM operando sobre las componentes principales<br />

asociados a los patrones <strong>de</strong> datos <strong>de</strong>l re-análisis. En este caso, consi<strong>de</strong>ramos<br />

25 neuronas organizadas en una red 2D, las cuales llevan a 25 grupos<br />

diferentes con datos similares a las correspondientes neuronas vecinas.<br />

Siguiendo un procedimiento similar al algoritmo <strong>de</strong> m-medias los vectores<br />

<strong>de</strong> la SOM son inicializados a valores aleatorios. El objetivo <strong>de</strong>l algoritmo<br />

<strong>de</strong> entrenamiento es adaptar iterativamente los vectores prototipo, <strong>de</strong> forma<br />

que el prototipo final represente a un grupo <strong>de</strong> datos (aquellos que están<br />

más cerca al prototipo). Lo que hace a la SOM diferente <strong>de</strong> otros algoritmos<br />

<strong>de</strong> agrupamiento es que el proceso <strong>de</strong> entrenamiento incluye un mecanismo


3.4. REDES AUTO-ORGANIZATIVAS (SOM) 51<br />

<strong>de</strong> adaptación tal que los grupos vecinos en la red 2D son también similares<br />

en el espacio real, mientras que grupos más distantes en la red son más<br />

distintos.<br />

Un <strong>de</strong> las implementación <strong>de</strong>l algoritmo <strong>de</strong> entrenamiento se realiza en<br />

ciclos sucesivos; en cada ciclo se analiza cada uno <strong>de</strong> los vectores v i calculando<br />

el prototipo más cercano (o “ganador”) c ki , como aquel que minimiza<br />

la distancia al vector <strong>de</strong> datos:<br />

||v i − c ki || = min k ||v i − c k ||, k = 1, . . .,m. (3.15)<br />

Después <strong>de</strong> cada ciclo, los prototipos se recalculan en base al centroi<strong>de</strong> <strong>de</strong>l<br />

grupo correspondiente y <strong>de</strong> los grupos vecinos:<br />

c j =<br />

∑ ni=1<br />

v i h(||p j − p ki ||)<br />

∑ ni=1 , j = 1, . . .,m. (3.16)<br />

h(||p j − p ki ||)<br />

don<strong>de</strong> la función h(||p 1 −p 2 ||) es un núcleo <strong>de</strong> vecindad que mi<strong>de</strong> las distancias<br />

<strong>de</strong> los grupos en la red 2D y <strong>de</strong>termina la tasa <strong>de</strong> cambio <strong>de</strong> un prototipo<br />

en base a los grupos vecinos (normalmente se usa una función Gaussiana:<br />

h(x) = exp(−x/s(t)))). El radio <strong>de</strong> vecindad s(t) <strong>de</strong>crece monótonamente<br />

en el tiempo, suavizando las restricciones topológicas (se suele elegir un<br />

<strong>de</strong>caimiento lineal a cero para estas funciones). Para una <strong>de</strong>scripción <strong>de</strong>tallada<br />

<strong>de</strong> diferentes implementaciones <strong>de</strong>l método, el lector pue<strong>de</strong> consultar<br />

Oja and Kaski (1999).<br />

Hay que tener en cuenta que la ventaja <strong>de</strong> tener los grupos organizados<br />

en la red tiene un coste, ya que comparada con la técnica estándar <strong>de</strong><br />

m-medias, la SOM pier<strong>de</strong> parte <strong>de</strong> la variabilidad <strong>de</strong> los grupos, en favor<br />

<strong>de</strong> la restricción topológica impuesta. Esto se <strong>de</strong>be a que en los métodos<br />

clásicos los centroi<strong>de</strong>s se mueven libremente en el espacio y sólo tienen que<br />

minimizar la varianza intra-grupos, mientras que en una SOM la relación<br />

<strong>de</strong> vecindad entre centroi<strong>de</strong>s supone un recorte <strong>de</strong> libertad <strong>de</strong> movimiento.<br />

Es <strong>de</strong>cir, si no es necesario disponer <strong>de</strong> una topología para los prototipos es<br />

más conveniente y sencillo utilizar un algoritmo estándar, pero si se quieren<br />

estudiar transiciones o posiciones relativas entre diferentes prototipos,<br />

entonces la SOM resulta <strong>de</strong> gran utilidad.<br />

Ejemplo 3.5 (Clasificación <strong>de</strong> Patrones Atmosféricos). Los problemas<br />

<strong>de</strong> regionalización y clasificación ya han sido abordados con técnicas<br />

<strong>de</strong> agrupamiento en ejemplos anteriores. La ventaja <strong>de</strong> utilizar una SOM es<br />

que, a<strong>de</strong>más <strong>de</strong> obtener los grupos, se obtendrá también una organización<br />

<strong>de</strong> vecindad <strong>de</strong> los mismos. Ésto proporciona una útil visualización <strong>de</strong> las<br />

posibles transiciones e interrelaciones entre clases. En la Fig. 3.11 se muestra<br />

el resultado <strong>de</strong> aplicar este algoritmo a los dos mo<strong>de</strong>los atmosféricos <strong>de</strong>l<br />

Ejemplo 3.4 consi<strong>de</strong>rando re<strong>de</strong>s <strong>de</strong> 100 = 10 × 10 prototipos. En esta figura<br />

se pue<strong>de</strong>n observar los centroi<strong>de</strong>s finales, así como la red proyectada en el<br />

espacio <strong>de</strong> los datos (sólo se muestran las dos primeras CPs).


52 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

(a)<br />

PC1<br />

(b)<br />

PC2<br />

PC2<br />

PC1<br />

Figura 3.11: Proyección sobre las dos primeras CPs <strong>de</strong> los patrones atmosféricos<br />

<strong>de</strong> ERA-15 <strong>de</strong>finidos con los (a) Mo<strong>de</strong>lo 1 y (b) Mo<strong>de</strong>lo 3, junto con la rejilla <strong>de</strong> la<br />

SOM resultante <strong>de</strong>spués <strong>de</strong>l entrenamiento.


3.4. REDES AUTO-ORGANIZATIVAS (SOM) 53<br />

La Figura 3.12 muestra los patrones atmosféricos <strong>de</strong> los prototipos resultantes<br />

(temperatura en 500mb) para el primer cuadrante <strong>de</strong> la cuadrícula.<br />

Esta figura muestra que los patrones cercanos en la cuadrícula son parecidos<br />

entre sí, mientras que los lejanos correspon<strong>de</strong>n a situaciones diferentes.<br />

Cada prototipo representa un grupo <strong>de</strong> días cuyo patrón atmosférico (según<br />

el mo<strong>de</strong>lo utilizado) es cercano al prototipo.<br />

Figura 3.12: Campos <strong>de</strong> temperatura en 500mb correspondientes a los prototipos<br />

<strong>de</strong> una subrejilla 5 × 5 <strong>de</strong> la SOM mostrada en la Figura 3.11.<br />

Ejemplo 3.6 (Clasificación <strong>de</strong> Fenómenos Adversos). En este ejemplo,<br />

se analiza el problema <strong>de</strong> la clasificación <strong>de</strong> situaciones atmosféricas relacionadas<br />

con fenómenos adversos <strong>de</strong> precipitación: Precip > 40mm/24h<br />

en alguno <strong>de</strong> los observatorios <strong>de</strong> la red <strong>de</strong> estaciones completas <strong>de</strong>l INM en<br />

la Península y Baleares. La clasificación se ha restringido a aquellas fechas<br />

en las que se ha observado un fenómeno adverso según la <strong>de</strong>finición anterior.<br />

Se ha realizado una clasificación en 16 clases con una SOM para el período<br />

1979-1993, consi<strong>de</strong>rando la configuración <strong>de</strong> los patrones atmosféricos dada<br />

por el Mo<strong>de</strong>lo 1 <strong>de</strong>l Ejemplo 2.1. La Figuras 3.13 muestra los campos<br />

<strong>de</strong> geopotencial en 1000mb para los prototipos <strong>de</strong> los grupos obtenidos; por<br />

otra parte, la Fig. 3.14 muestra los patrones <strong>de</strong> precipitación asociados a<br />

cada grupo; estos patrones se han obtenido interpolando los valores <strong>de</strong> las<br />

estaciones <strong>de</strong> la red <strong>de</strong> estaciones completas <strong>de</strong>l INM. En esta figura pue<strong>de</strong>n<br />

observarse modos claros <strong>de</strong> precipitación en Galicia, Levante, etc., mostrando<br />

la conexión entre los patrones atmosféricos y la fenomenológica.


54 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

Figura 3.13: Campos <strong>de</strong> geopotencial en 1000mb correspondientes a los prototipos<br />

<strong>de</strong> una SOM 4 × 4 entrenada con los días <strong>de</strong>l período ERA-15 asociados a<br />

precipitaciones fuertes en superficie.<br />

(19) [16 95]mm/24h (9) [19 54]mm/24h (10) [20 80]mm/24h (15) [12 110]mm/24h<br />

(11) [17 71]mm/24h (13) [16 88]mm/24h (16) [22 87]mm/24h (9) [17 90]mm/24h<br />

(7) [17 87]mm/24h (8) [21 80]mm/24h (43) [15 105]mm/24h (20) [14 59]mm/24h<br />

(6) [15 47]mm/24h (7) [22 93]mm/24h (17) [14 139]mm/24h (17) [13 82]mm/24h<br />

Figura 3.14: Patrones fenomenológicos <strong>de</strong> precipitaciones fuertes asociados a los<br />

grupos <strong>de</strong> la SOM. Entre paréntesis se muestra el número <strong>de</strong> elementos <strong>de</strong> cada<br />

grupo y entre corchetes el rango <strong>de</strong> precipitación observada.


3.5. REDES NEURONALES MULTICAPA 55<br />

3.5. Re<strong>de</strong>s <strong>Neuronales</strong> Multicapa<br />

La computación paralela y las re<strong>de</strong>s neuronales son dos nuevos paradigmas<br />

que han <strong>de</strong>spertado en los últimos años un gran interés. El elemento<br />

clave <strong>de</strong> estos paradigmas es una nueva estructura computacional compuesta<br />

<strong>de</strong> un gran número <strong>de</strong> pequeños elementos procesadores interconectados<br />

(neuronas) trabajando en paralelo, en contraposición al proceso en serie<br />

tradicional. Actualmente, las re<strong>de</strong>s neuronales han probado su valía para<br />

resolver problemas complejos en diversos campos, incluyendo la predicción<br />

meteorológica y oceánica (Schizas et al., 1994; Hsieh and Tang, 1998) y se<br />

han <strong>de</strong>sarrollado diversas extensiones <strong>de</strong> estos mo<strong>de</strong>los para cubrir <strong>de</strong>ficiencias<br />

en los mismos y especializarlos en problemas concretos; por ejemplo,<br />

las re<strong>de</strong>s funcionales han surgido como una generalización <strong>de</strong> estos mo<strong>de</strong>los<br />

para po<strong>de</strong>r incluir conocimiento cualitativo <strong>de</strong>l problema en la estructura<br />

<strong>de</strong> la red (ver Castillo et al., 1999, para más <strong>de</strong>talles); por otra parte, los<br />

algoritmos genéticos han sido aplicados para optimizar la estructura <strong>de</strong> la<br />

red (Cofiño et al., 2003c), etc.<br />

En esta sección se <strong>de</strong>scribe un tipo particular <strong>de</strong> re<strong>de</strong>s (las re<strong>de</strong>s multicapa),<br />

que tienen especial interés en esta tesis por su interpretación como<br />

técnicas no paramétricas <strong>de</strong> regresión no lineal (para una <strong>de</strong>scripción más<br />

general, incluyendo otros tipos <strong>de</strong> re<strong>de</strong>s, ver Hastie et al., 2001).<br />

3.5.1. Estructura y Funcionamiento <strong>de</strong> las Re<strong>de</strong>s <strong>Neuronales</strong><br />

En analogía a los mo<strong>de</strong>los biológicos, los mo<strong>de</strong>los computacionales <strong>de</strong><br />

re<strong>de</strong>s neuronales están compuestos por un número <strong>de</strong> unida<strong>de</strong>s simples <strong>de</strong><br />

proceso (neuronas) conectadas entre sí en base a una topología <strong>de</strong>finida. La<br />

funcionalidad <strong>de</strong> la red neuronal viene dada por la topología <strong>de</strong> conexión <strong>de</strong><br />

las neuronas, por la función concreta que realice cada neurona (actividad<br />

neuronal), y por los pesos <strong>de</strong> conexión <strong>de</strong> unas neuronas con otras. La topología<br />

<strong>de</strong> conexión y la actividad neuronal <strong>de</strong>finen el tipo <strong>de</strong> red neuronal<br />

concreta (multicapa, competitiva, etc.), y los pesos <strong>de</strong> las conexiones son<br />

los parámetros que, ajustados a un problema concreto, permiten a la red<br />

“apren<strong>de</strong>r” y generalizar el conocimiento aprendido. En este sentido, las re<strong>de</strong>s<br />

neuronales pue<strong>de</strong>n ser consi<strong>de</strong>rados mo<strong>de</strong>los estadísticos no paramétricos<br />

<strong>de</strong> regresión local.<br />

La Figura 3.5.1(a) muestra la topología concreta <strong>de</strong> conexión <strong>de</strong> una red<br />

neuronal multicapa y la Figura 3.5.1(b) muestra una <strong>de</strong>scripción <strong>de</strong>tallada<br />

<strong>de</strong> la actividad neuronal (analizada en más <strong>de</strong>talle en la siguiente sección).<br />

En este caso, el aprendizaje <strong>de</strong> los pesos <strong>de</strong> las conexiones se realiza en base<br />

a un conjunto <strong>de</strong> datos entrada-salida dado (aprendizaje supervisado).<br />

Las neuronas son los elementos procesadores <strong>de</strong> la red neuronal y realizan<br />

un sencillo cálculo con las entradas para obtener un valor <strong>de</strong> salida:<br />

n∑<br />

n∑<br />

y i = f( w ij x j − θ i ) = f( w ij x j ), (3.17)<br />

j=1<br />

j=0


56 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

(a)<br />

Inputs<br />

Outputs<br />

x 1<br />

w i1<br />

-1<br />

θ i<br />

(b)<br />

w<br />

x i2 2<br />

w i=0<br />

Σ<br />

in<br />

x n<br />

n<br />

wij x j f( )<br />

n<br />

Σ wij x j<br />

i=0<br />

Figura 3.15: (a)Red neuronal multicapa y (b) la función procesadora <strong>de</strong> una<br />

única neurona.<br />

don<strong>de</strong> f(x) es la función activación y θ i es el umbral <strong>de</strong> activación <strong>de</strong> la neurona.<br />

Obsérvese que el umbral <strong>de</strong> activación se pue<strong>de</strong> incluir en el sumatorio<br />

consi<strong>de</strong>rando una nueva neurona auxiliar x 0 = −1 conectada a y i con un<br />

peso w i0 = θ i . Por tanto, la salida <strong>de</strong> una neurona y i se obtiene simplemente<br />

transformando la suma pon<strong>de</strong>rada <strong>de</strong> las entradas que recibe usando la función<br />

<strong>de</strong> activación (ver Fig. 3.5.1(b)). Las funciones <strong>de</strong> activación continuas<br />

más populares son:<br />

Funciones lineales: Son funciones que dan una salida lineal:<br />

f(x) = x; x ∈ R.<br />

Funciones sigmoidales: Son funciones monótonas acotadas que dan una<br />

salida gradual no lineal para las entradas. Las funciones sigmoidales<br />

más populares son:<br />

1. La función logística <strong>de</strong> 0 a 1 (ver Figura 3.16):<br />

f c (x) =<br />

1<br />

1 + e−c x.<br />

2. La función tangente hiperbólica <strong>de</strong> −1 a 1 (similar a la función<br />

logística, pero con el nuevo rango):<br />

f c (x) = tanh(c x).<br />

Funciones núcleo: Localizadas alre<strong>de</strong>dor <strong>de</strong> un punto, como la distribución<br />

Gaussiana.


3.5. REDES NEURONALES MULTICAPA 57<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

c=0.5<br />

c=1<br />

c=2<br />

0.2<br />

0<br />

-10 -5 0 5 10<br />

Figura 3.16: Función <strong>de</strong> activación sigmoidal logística f c (x) = (1 + e −c x ) −1 .<br />

3.5.2. Aprendizaje y Validación<br />

Una <strong>de</strong> las principales propieda<strong>de</strong>s <strong>de</strong> las re<strong>de</strong>s neuronales es su capacidad<br />

<strong>de</strong> apren<strong>de</strong>r a partir <strong>de</strong> unos datos. Una vez que ha sido elegida la<br />

arquitectura <strong>de</strong> red para un problema particular, los pesos <strong>de</strong> las conexiones<br />

se ajustan para codificar la información contenida en un conjunto <strong>de</strong> datos<br />

<strong>de</strong> entrenamiento. Las re<strong>de</strong>s multicapa son apropiadas para problemas <strong>de</strong><br />

aprendizaje supervisado, don<strong>de</strong> se dispone <strong>de</strong> un conjunto <strong>de</strong> patrones <strong>de</strong> entrenamiento<br />

<strong>de</strong> la forma (x p ,y p ) = (x 1p , . . .,x mp ; y 1p , . . .,y np ), p = 1, . . .,a,<br />

don<strong>de</strong> se conocen los patrones <strong>de</strong> salida y p correspondientes a cada conjunto<br />

<strong>de</strong> patrones <strong>de</strong> entrada x p y se <strong>de</strong>sea que la red sea capaz <strong>de</strong> reproducir estos<br />

patrones con el menor error posible. Este problema se reduce a obtener los<br />

pesos apropiados utilizando algún algoritmo <strong>de</strong> aprendizaje apropiado.<br />

Una vez terminado el proceso <strong>de</strong> aprendizaje y calculados los pesos <strong>de</strong> la<br />

red neuronal, es importante comprobar la calidad <strong>de</strong>l mo<strong>de</strong>lo resultante. Por<br />

ejemplo, en el caso <strong>de</strong> aprendizaje supervisado, una medida <strong>de</strong> la calidad<br />

pue<strong>de</strong> darse en términos <strong>de</strong> los errores entre los valores <strong>de</strong> salida <strong>de</strong>seados y<br />

los obtenidos por la red neuronal. Algunas medidas estándar <strong>de</strong>l error son:<br />

1. La suma <strong>de</strong> los cuadrados <strong>de</strong> los errores (Sum of Square Errors, SSE),<br />

<strong>de</strong>finida como<br />

n∑<br />

‖ y p − ŷ p ‖ 2 . (3.18)<br />

p=1<br />

2. La raíz cuadrada <strong>de</strong>l error cuadrático medio (Root Mean Square Error,<br />

RMSE) <strong>de</strong>finida como<br />

n∑<br />

√ ‖ y p − ŷ p ‖ 2 /n. (3.19)<br />

p=1<br />

3. El error máximo,<br />

máx ‖ y p − ŷ p ‖ . (3.20)<br />

p=1,...,n


58 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

También es <strong>de</strong>seable realizar una validación cruzada para obtener una<br />

medida <strong>de</strong> la calidad <strong>de</strong> predicción <strong>de</strong>l mo<strong>de</strong>lo. Con este propósito, los datos<br />

disponibles se pue<strong>de</strong>n dividir en dos partes: una parte <strong>de</strong>stinada al entrenamiento<br />

<strong>de</strong> la red y otra parte a la validación. Cuando el error <strong>de</strong> validación es<br />

significativamente mayor que el error <strong>de</strong> entrenamiento, entonces se produce<br />

un problema <strong>de</strong> sobreajuste durante el proceso <strong>de</strong> entrenamiento que pue<strong>de</strong><br />

ser <strong>de</strong>bido a un excesivo número <strong>de</strong> parámetros.<br />

3.5.3. Perceptrones (Re<strong>de</strong>s <strong>de</strong> una Capa)<br />

Los perceptrones son las arquitecturas más simples y consisten en una<br />

capa <strong>de</strong> entrada, {x 1 , . . .,x m }, y una <strong>de</strong> salida, {y 1 , . . .,y n }, <strong>de</strong> forma que las<br />

neuronas <strong>de</strong> la capa <strong>de</strong> salida están conectadas con las <strong>de</strong> entrada y no hay<br />

conexiones entre las neuronas <strong>de</strong> una misma capa (ver Rosenblat, 1962). Para<br />

indicar el número <strong>de</strong> entradas y <strong>de</strong> salidas, este tipo <strong>de</strong> re<strong>de</strong>s suelen <strong>de</strong>notarse<br />

<strong>de</strong> forma abreviada mediante m : n. Los perceptrones suelen <strong>de</strong>nominarse<br />

también re<strong>de</strong>s <strong>de</strong> retro-propagación <strong>de</strong> una única capa.<br />

En un perceptrón, una unidad <strong>de</strong> salida típica, ŷ j , realiza el cálculo:<br />

m∑<br />

ŷ j = f( β ji x i ) = f(β T j x), j = 1, . . .,n. (3.21)<br />

i=0<br />

don<strong>de</strong> f(·) es la función <strong>de</strong> activación y β j el correspondiente vector <strong>de</strong> peso.<br />

Se <strong>de</strong>nota mediante ŷ p = f(β j T x p ) al valor <strong>de</strong> salida obtenido insertando<br />

el correspondiente patrón <strong>de</strong> entrada en la red (3.21).<br />

Algoritmos <strong>de</strong> Aprendizaje<br />

En los algoritmos <strong>de</strong> aprendizaje para este tipo <strong>de</strong> re<strong>de</strong>s se usan método<br />

<strong>de</strong> optimización matemática para obtener los pesos β j que minimizan una<br />

cierta función <strong>de</strong> error. Obsérvese que los pesos son los únicos parámetros<br />

<strong>de</strong>sconocidos <strong>de</strong> la red y son los que proporcionan flexibilidad a la misma<br />

para ajustarse a distintas situaciones caracterizadas por un conjunto <strong>de</strong> patrones<br />

entrada-salida.<br />

Los algoritmos <strong>de</strong> aprendizaje se basan en minimizar la suma <strong>de</strong> los<br />

cuadrados <strong>de</strong> los errores (otras medidas distintas <strong>de</strong> error han dado lugar a<br />

algoritmos <strong>de</strong> aprendizaje diferentes que se comentan más a<strong>de</strong>lante):<br />

E(β) = 1 ∑<br />

(y jp − ŷ jp ) 2 = 1 ∑<br />

||y p − ŷ p || (3.22)<br />

2<br />

2<br />

j,p<br />

p<br />

= 1 ∑<br />

(y jp − f( ∑ β jiˆx ip )) 2 = 1 ∑<br />

||y p − f(β T ˆx p )|| (3.23)<br />

2<br />

2<br />

j,p i<br />

p<br />

Dado que esta función es no lineal, no existe ningún método exacto para<br />

obtener su solución (los pesos óptimos), aunque recientemente Castillo et al.<br />

(2002) han presentado un nuevo método <strong>de</strong> aprendizaje para este tipo <strong>de</strong>


3.5. REDES NEURONALES MULTICAPA 59<br />

re<strong>de</strong>s que transform al función <strong>de</strong> error haciéndola lineal en los parámetros<br />

<strong>de</strong>l mo<strong>de</strong>lo (los pesos).<br />

Uno <strong>de</strong> los algoritmos <strong>de</strong> optimización más simples para este problema<br />

es el método <strong>de</strong>l <strong>de</strong>scenso <strong>de</strong> gradiente (también llamado “regla <strong>de</strong>lta” en<br />

este caso). Se trata <strong>de</strong> un algoritmo iterativo que en cada etapa trata <strong>de</strong><br />

modificar incrementalmente los pesos <strong>de</strong> forma que se obtenga un error<br />

menor (inicialmente se toma un valor aleatorio <strong>de</strong> los pesos). En este caso<br />

concreto el incremento <strong>de</strong> los pesos se obtiene en base a los vectores en los<br />

que la función <strong>de</strong> error disminuye más rápidamente, que correspon<strong>de</strong> con<br />

el opuesto <strong>de</strong>l gradiente <strong>de</strong> la función <strong>de</strong> error respecto <strong>de</strong> los pesos, − ∇E<br />

(método <strong>de</strong>l <strong>de</strong>scenso <strong>de</strong> gradiente). Por tanto, en cada paso <strong>de</strong> iteración cada<br />

uno <strong>de</strong> los pesos β ji se modifica mediante un incremento ∆β ji proporcional<br />

al gradiente <strong>de</strong>l error:<br />

∆β ji<br />

= −η ∂E(β)<br />

∂β ji<br />

= −η ∑ p<br />

(y jp − ŷ jp ) ∂ŷ jp<br />

∂β ji<br />

= −η ∑ p<br />

(y jp − ŷ jp )f ′ ( ∑ i<br />

β ji x ip )x jp , (3.24)<br />

∆β j = −η∇E(β) = −η ∑ p<br />

(y jp − ŷ jp )f ′ (β T j x p )x jp , (3.25)<br />

don<strong>de</strong> el parámetro η es la tasa <strong>de</strong> aprendizaje, es <strong>de</strong>cir, la constante que<br />

regula la intensidad <strong>de</strong> la variación incremental <strong>de</strong> los pesos (obsérvese que la<br />

aproximación <strong>de</strong> la superficie <strong>de</strong> error mediante el gradiente es sólo válida en<br />

un sentido local y, por tanto, el rango <strong>de</strong> la tasa <strong>de</strong> aprendizaje está limitado<br />

por este hecho).<br />

Algunas funciones <strong>de</strong> activación permiten <strong>de</strong>finir su <strong>de</strong>rivada en función<br />

<strong>de</strong> sí mismas, simplificando la fórmula (3.24) al no involucrar <strong>de</strong>rivadas<br />

formales:<br />

1<br />

f(s) =<br />

1 + e −c s ⇒ f ′ (s) = c f(s)(1 − f(s)),<br />

o<br />

f(s) = tanh(c s) ⇒ f ′ (s) = c (1 − f(s) 2 ).<br />

Si la función <strong>de</strong> activación fuese lineal (f(s) = s), las salidas <strong>de</strong> la red<br />

dadas en (3.21) se reducirían a una combinación lineal <strong>de</strong> las entradas, resultando<br />

los siguientes incrementos <strong>de</strong> los pesos:<br />

∆β ji = −η ∂E<br />

∂β ji<br />

= η ∑ p<br />

(y jp − ŷ jp )x ip , (3.26)<br />

que proporcionan la solución global <strong>de</strong>l problema lineal (obsérvese que este<br />

problema pue<strong>de</strong> resolverse en un sólo paso con técnicas <strong>de</strong> optimización<br />

lineal, no siendo necesario el uso <strong>de</strong> una técnica iterativa).


60 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

Mejoras y Modificaciones<br />

Han sido varias las modificaciones propuestas en la literatura con el propósito<br />

<strong>de</strong> mejorar la eficiencia <strong>de</strong> los métodos <strong>de</strong> aprendizaje anteriores. A<br />

continuación se <strong>de</strong>scriben las más populares:<br />

Término <strong>de</strong> inercia. Este término extra se introduce en la expresión<br />

<strong>de</strong> ∆β ji para acelerar la convergencia teniendo en cuenta no sólo el<br />

gradiente local, sino las distintas ten<strong>de</strong>ncias en la “superficie” <strong>de</strong> error.<br />

Con ello se evita que la red caiga en pequeños mínimos locales. La<br />

nueva regla <strong>de</strong> actualización viene dada por<br />

∆β ji = −η ∂E<br />

∂w ji<br />

+ µ∆ ′ β ji ,<br />

don<strong>de</strong> ∆ ′ β ji hace referencia a los valores previos <strong>de</strong> ∆β ji (en el paso<br />

<strong>de</strong> iteración previo) y µ es el parámetro <strong>de</strong> inercia.<br />

Tasa <strong>de</strong> aprendizaje variable. En el método <strong>de</strong> <strong>de</strong>scenso <strong>de</strong> gradiente,<br />

la tasa <strong>de</strong> aprendizaje es constante en todo el proceso <strong>de</strong> entrenamiento.<br />

Pero la eficiencia <strong>de</strong>l algoritmo es muy sensible a la elección <strong>de</strong> la<br />

tasa <strong>de</strong> aprendizaje; si la tasa es muy gran<strong>de</strong> el algorimo oscila y se<br />

vuelve inestable, y si es <strong>de</strong>masiado pequeño la convergencia es muy<br />

lenta. Tampoco es posible saber cual es el valor más conveniente <strong>de</strong><br />

la tasa antes <strong>de</strong> comenzar el entrenamiento, e incluso pue<strong>de</strong> cambiar<br />

durante el proceso <strong>de</strong> aprendizaje. Una tasa <strong>de</strong> aprendizaje adaptativa<br />

consiste en variar ésta según la complejidad local <strong>de</strong> la superficie <strong>de</strong><br />

error.<br />

Métodos <strong>de</strong> regularización. Estos métodos incluyen términos <strong>de</strong> la función<br />

<strong>de</strong> error que penalizan pesos gran<strong>de</strong>s:<br />

r∑<br />

E(β) = p − ŷ p )<br />

p=1(y 2 + λ ∑ i,j<br />

β 2 ji, (3.27)<br />

don<strong>de</strong> λ es un parámetro <strong>de</strong> regularización, que controla el equilibrio<br />

entre el mo<strong>de</strong>lo ajustado y la penalización. El efecto <strong>de</strong> esta regularización<br />

<strong>de</strong> los pesos es suavizar la función <strong>de</strong> error, ya que los pesos<br />

gran<strong>de</strong>s están usualmente asociados a valores <strong>de</strong> salida altos (para<br />

una <strong>de</strong>scripción más <strong>de</strong>tallada <strong>de</strong>s<strong>de</strong> un punto <strong>de</strong> vista estadístico ver<br />

Hoerl and Kennard, 1970). Esta técnica también está relacionada con<br />

el método <strong>de</strong> <strong>de</strong>scomposición <strong>de</strong> los pesos que consiste en recortar las<br />

conexiones <strong>de</strong> la red que tengan poca importancia (pesos muy bajos).<br />

Ejemplo 3.7 (Clasificación con Perceptrones). En este ejemplo se ilustra<br />

la aplicación <strong>de</strong>l perceptrón al problema <strong>de</strong> la clasificación. Concretamente<br />

el problema consistirá en la clasificación <strong>de</strong> la mezcla <strong>de</strong> dos nubes<br />

gaussianas con <strong>de</strong>sviación 0.5 y medias 0.5 y -0.5, respectivamente (ver Fig.


3.5. REDES NEURONALES MULTICAPA 61<br />

3.17). Una primera aproximación al problema <strong>de</strong> clasificación es realizar una<br />

clasificación lineal, consi<strong>de</strong>rando una función <strong>de</strong> activación lineal f(x) = x.<br />

En este caso, el óptimo <strong>de</strong> la red neuronal es óptimo en el sentido <strong>de</strong> mínimos<br />

cuadrados y se muestra en la Fig. 3.18.<br />

2<br />

1.5<br />

1<br />

0.5<br />

0<br />

−0.5<br />

−1<br />

−1.5<br />

−2<br />

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2<br />

Figura 3.17: Muestra <strong>de</strong> 100 puntos obtenida <strong>de</strong> la mezcla <strong>de</strong> dos distribuciones<br />

gaussianas <strong>de</strong> <strong>de</strong>sviación 0.5 y media 0.5 y -0.5<br />

2<br />

0.4<br />

0.3<br />

1.5<br />

1<br />

0.5<br />

0<br />

0.1<br />

0.2<br />

−0.7<br />

−0.6<br />

−0.5<br />

−0.4<br />

−0.3<br />

2<br />

1.5<br />

1<br />

0.5<br />

0.6<br />

0.7<br />

0.8<br />

−0.2<br />

−0.1<br />

0.5<br />

0<br />

0.9<br />

1<br />

0.4<br />

0.3<br />

0<br />

−0.5<br />

−1<br />

0.5<br />

0<br />

0.1<br />

0.2<br />

−0.5<br />

−1<br />

−2<br />

−1<br />

2<br />

−1.5<br />

1.6<br />

1.7<br />

1.1<br />

1.5<br />

1.4<br />

1.3<br />

1.2<br />

0.6<br />

0.7<br />

0.8<br />

0.9<br />

1<br />

−2<br />

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2<br />

0<br />

1<br />

2 −2<br />

0<br />

Figura 3.18: Superficie generada por el perceptrón lineal<br />

Para obtener un criterio <strong>de</strong> separación no lineal se pue<strong>de</strong> consi<strong>de</strong>rar<br />

un perceptrón con una función <strong>de</strong> activación sigmoidal; en este ejemplo se<br />

utiliza la función sigmoidal. El óptimo obtenido se muestar en la Fig. 3.19.<br />

Obsérvese que en este último ejemplo la red es equivalente a un mo<strong>de</strong>lo <strong>de</strong><br />

regresión o clasificación logística.


62 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

2<br />

1.5<br />

1<br />

0.5<br />

0.2<br />

0.1<br />

0.3<br />

0.4<br />

0.5<br />

0.7<br />

0.6<br />

0.8<br />

2<br />

1.5<br />

1<br />

0.5<br />

0<br />

−0.5<br />

−1<br />

−1.5<br />

0.9<br />

0.1<br />

0.2<br />

−2<br />

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2<br />

0.3<br />

0.4<br />

0.5<br />

0.7<br />

0.6<br />

0.8<br />

0.9<br />

0<br />

−0.5<br />

−1<br />

−2<br />

−1<br />

0<br />

1<br />

2 −2<br />

0<br />

2<br />

2<br />

1<br />

0<br />

−1<br />

−2<br />

2<br />

−1<br />

1<br />

0<br />

0<br />

1<br />

−1<br />

2 −2<br />

Figura 3.19: Superficie generada por el perceptrón sigmoidal no lineal.<br />

Ejemplo 3.8 (Clasificación <strong>de</strong> Patrones <strong>de</strong> Precipitación). En este<br />

ejemplo se aplican las mismas técnicas que en el ejemplo anterior para<br />

clasificar patrones atmosféricos en base a la precipitación local asociada en<br />

un cierta estación (la ciudad <strong>de</strong> Santan<strong>de</strong>r). Para ello se ha consi<strong>de</strong>rado<br />

el patrón atmosférico <strong>de</strong>finido en el Ejemplo 2.1 (ver Fig. 2.9(a)). En la<br />

Fig. 3.20 se muestran dos gráficas 2D correspondientes a distintas combinaciones<br />

<strong>de</strong> componentes principales <strong>de</strong> estos patrones. Se han dibujado con<br />

símbolos distintos aquellos patrones que correspon<strong>de</strong>n a eventos <strong>de</strong> precipitación<br />

(Precip > 0.5mm) en la localidad <strong>de</strong> Santan<strong>de</strong>r. En la primera figura<br />

pue<strong>de</strong> observarse que el po<strong>de</strong>r <strong>de</strong> discriminación <strong>de</strong> las dos primeras CPs es<br />

muy bajo, mientras que la segunda figura muestra cómo la tercera CP aporta<br />

información que permite discriminar parcialmente ambas categorías. Dado<br />

que las CPs siguen distribuciones aproximadamente normales, el parecido<br />

<strong>de</strong> este problema con el anteriormente expuesto es notable. En secciones<br />

posteriores se analiza este problema en <strong>de</strong>talle.


3.5. REDES NEURONALES MULTICAPA 63<br />

CP2<br />

10<br />

20<br />

30<br />

40<br />

30<br />

20<br />

10<br />

0<br />

40<br />

40 20 0 20 40<br />

CP1<br />

CP3<br />

10<br />

20<br />

30<br />

40<br />

30<br />

20<br />

10<br />

0<br />

40<br />

40 20 0 20 40<br />

CP2<br />

Figura 3.20: Gráficos <strong>de</strong> (a) CP1 vs CP2 y (b) CP2 vs CP3 mostrando en distintas<br />

clases los eventos lluvia (Precip > 0.5mm) y no lluvia en Santan<strong>de</strong>r.<br />

3.5.4. Perceptrones Multi-Capa<br />

A<strong>de</strong>más <strong>de</strong> una capa <strong>de</strong> entrada y una <strong>de</strong> salida, un perceptrón multicapa<br />

tiene capas internas ocultas. Los nodos <strong>de</strong> la capa <strong>de</strong> entrada alimentan<br />

la red distribuyendo hacia <strong>de</strong>lante las señales <strong>de</strong> entrada. Cada nodo en<br />

las capas ocultas y <strong>de</strong> salida recibe una entrada <strong>de</strong> los nodos <strong>de</strong> las capas<br />

previas y calcula un valor <strong>de</strong> salida para la siguiente capa. La adición <strong>de</strong><br />

capas ocultas proporciona a este tipo <strong>de</strong> arquitectura suficiente flexibilidad<br />

para resolver muchos problemas en los que los perceptrones simples fallan.<br />

Para cada una <strong>de</strong> las salidas, y i , un perceptrón multi-capa calcula una<br />

función y i = F i (x 1 , . . .,x m ) <strong>de</strong> las entradas <strong>de</strong> la forma:<br />

y i = f( ∑ i<br />

β ji f( ∑ k<br />

α ik x kp )). (3.28)<br />

Se ha <strong>de</strong>mostrado que un perceptrón con dos capas ocultas pue<strong>de</strong> aproximar<br />

con un grado <strong>de</strong> exactitud dado cualquier conjunto <strong>de</strong> funciones<br />

F i (x 1 , . . .,x n ). Cuando estas funciones son continuas entonces una única<br />

capa oculta es suficiente. Esto resuelve parcialmente uno <strong>de</strong> los principales<br />

<strong>de</strong>fectos <strong>de</strong> los perceptrones multi-capa: el diseño <strong>de</strong> una estructura <strong>de</strong> red<br />

apropiada para un problema dado. Ahora, el problema se reduce a elegir<br />

un número apropiado <strong>de</strong> unida<strong>de</strong>s ocultas para ajustar el mo<strong>de</strong>lo evitando<br />

el problema <strong>de</strong> sobreajuste. La solución a este problema habrá <strong>de</strong> lograse<br />

mediante un procedimiento <strong>de</strong> prueba y error en la mayoría <strong>de</strong> los casos.<br />

El método <strong>de</strong> aprendizaje más popular para perceptrones multi-capa es<br />

conocido como retro-propagación (backpropagation) y está basado en minimizar<br />

la función que da el error cuadrático total usando el método <strong>de</strong>l<br />

<strong>de</strong>scenso <strong>de</strong> gradiente.


64 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

El Algoritmo <strong>de</strong> Retro-propagación<br />

Supóngase que se tienen unos conjuntos <strong>de</strong> entradas {x 1p , . . .,x mp } y sus<br />

correspondientes salidas {y 1p , . . .,y np }, p = 1, . . .,a, como patrones <strong>de</strong> entrenamiento.<br />

Como en el caso <strong>de</strong>l perceptrón simple, se consi<strong>de</strong>ra la función<br />

que da el error cuadrático total:<br />

E(α, β) = 1 ∑<br />

(y jp − f( ∑ 2<br />

j,p i<br />

= ∑ p<br />

β ji f( ∑ k<br />

α ik x kp ))) 2<br />

||y p − f(β T f(α T x p ))|| (3.29)<br />

don<strong>de</strong> β tiene por columnas los vectores <strong>de</strong> pesos <strong>de</strong> la neurona j-ésima <strong>de</strong><br />

la capa <strong>de</strong> salida, y α los <strong>de</strong> la k-ésima neurona <strong>de</strong> la capa oculta.<br />

El algoritmo <strong>de</strong> retro-propagación está basado en la misma i<strong>de</strong>a <strong>de</strong>l <strong>de</strong>scenso<br />

<strong>de</strong> gradiente usado en el método <strong>de</strong> la regla <strong>de</strong>lta. Por tanto, se han <strong>de</strong><br />

cambiar los pesos <strong>de</strong> forma que se <strong>de</strong>scienda por la pendiente <strong>de</strong> la función<br />

<strong>de</strong> error:<br />

∆β ik = −η ∂E ; ∆α kj = −η ∂E , (3.30)<br />

∂β ik ∂α kj<br />

don<strong>de</strong> el término η es el parámetro <strong>de</strong> aprendizaje, relacionado con el índice<br />

<strong>de</strong>l peso cambiante.<br />

Como (3.29) involucra los pesos <strong>de</strong> las neuronas ocultas y las <strong>de</strong> salida,<br />

el problema <strong>de</strong> actualizar iterativamente los pesos no es tan simple como en<br />

el caso <strong>de</strong> los perceptrones <strong>de</strong> una capa. Una solución a este problema fue<br />

dada con el algoritmo <strong>de</strong> retro-propagación <strong>de</strong> dos pasos (ver, por ejemplo,<br />

Rumelhart and McClelland, 1986). En primer lugar, la entrada <strong>de</strong> un patrón<br />

x p se propaga hacia <strong>de</strong>lante obteniendo el valor <strong>de</strong> las unida<strong>de</strong>s ocultas, ĥp,<br />

y la salida, ŷ p , y, por tanto, el error asociado. Los valores obtenidos se usan<br />

luego para actualizar los pesos β ik <strong>de</strong> la capa <strong>de</strong> salida usando (3.29). Más<br />

tar<strong>de</strong>, los pesos obtenidos se utilizarán para actualizar los pesos <strong>de</strong> la capa<br />

oculta, α kj , usando (3.29) para propagar hacia atrás los errores anteriores.<br />

La forma final <strong>de</strong> algoritmo resulta como sigue:<br />

1. Iniciar los pesos con valores aleatorios.<br />

2. Elegir un patrón <strong>de</strong> entrenamiento y propagarlo hacia a<strong>de</strong>lante obteniendo<br />

los valores ĥp y ŷ p para las neuronas <strong>de</strong> las capas ocultas y <strong>de</strong><br />

salida.<br />

3. Calcular el error asociado a las unida<strong>de</strong>s <strong>de</strong> salida:<br />

δ jp = (y jp − ŷ jp )f ′ (β T j ĥp).<br />

4. Calcular el error asociado a las unida<strong>de</strong>s ocultas:<br />

ψ jp = ∑ k<br />

δ jp β jk f ′ (α T k x p ).


3.5. REDES NEURONALES MULTICAPA 65<br />

5. Calcular:<br />

y<br />

∆β jk = η ĥk δ jp ,<br />

∆α ki = −η ∑ j<br />

x ip δ jp ψ jp ,<br />

y actualizar los pesos <strong>de</strong> acuerdo con los valores obtenidos.<br />

6. Repetir los pasos anteriores para cada patrón <strong>de</strong> entrenamiento.<br />

Ejemplo 3.9 (Sistemas no Lineales: El Sistema <strong>de</strong> Lorenz). En los<br />

últimos años, el análisis <strong>de</strong> sistemas no lineales ha cobrado un fuerte interés.<br />

Uno <strong>de</strong> los fenómenos más sorpren<strong>de</strong>ntes relacionados con estos sistemas<br />

es la aparición <strong>de</strong>l caos <strong>de</strong>terminista, caracterizado por su sensibilidad<br />

a las perturbaciones en las condiciones iniciales, que resulta en un<br />

comportamientos aparentemente impre<strong>de</strong>cible y errático <strong>de</strong>l sistema que se<br />

<strong>de</strong>sarrolla sobre un soporte fractal en su espacio <strong>de</strong> fases llamado atractor<br />

(ver Grassberger and Procaccia, 1983, para más <strong>de</strong>talles). Los mo<strong>de</strong>los <strong>de</strong><br />

circulación atmosférica contienen términos no lineales, por lo que la teoría<br />

<strong>de</strong>l caos ha tenido notable repercusión en este campo; <strong>de</strong> hecho, el caos fue<br />

analizado por primera vez por Lorenz (1963) en las ecuaciones <strong>de</strong> un mo<strong>de</strong>lo<br />

atmosférico simplificado:<br />

˙u(t) = (ẋ,ẏ, ż) = F(u(t)) = (σ(y − x), −x z + r x − y, x y − bz). (3.31)<br />

Lorenz <strong>de</strong>dujo estas ecuaciones cuando estudiaba la posibilidad <strong>de</strong> pre<strong>de</strong>cir<br />

la formación <strong>de</strong> tornados y otras estructuras convectivas tan frecuentes en la<br />

naturaleza y en tan diversas escalas. Las ecuaciones que <strong>de</strong>scriben este experimento<br />

tienen en cuenta los tres efectos más importantes que aparecen en<br />

formaciones convectivas: la fuerza <strong>de</strong>bida al gradiente térmico, la viscosidad<br />

y la difusión térmica.<br />

Las variables (x, y, z) <strong>de</strong> la ecuación (3.31), forman lo que se <strong>de</strong>nomina<br />

el espacio <strong>de</strong> fases o <strong>de</strong> estados (cada punto <strong>de</strong> este espacio es un estado o<br />

fase <strong>de</strong>l sistema). Por ejemplo, para los valores <strong>de</strong> los parámetros σ = 10,<br />

b = 8/3, y r = 28, el sistema presenta una dinámica caótica. Partiendo <strong>de</strong> la<br />

condición inicial (x(0), y(0), z(0)) = (−10, −5, 35) y utilizando un método <strong>de</strong><br />

integración <strong>de</strong> Runge-Kutta <strong>de</strong> cuarto or<strong>de</strong>n y paso <strong>de</strong> integración τ = 10 −2<br />

se obtiene la evolución <strong>de</strong>l sistema en el espacio <strong>de</strong> fases (Fig. 3.21). Por otra<br />

parte, la Fig. 3.22 muestra la evolución en el tiempo <strong>de</strong> las tres variables.<br />

Dado que estos sistemas son <strong>de</strong>terministas, pue<strong>de</strong>n ser predichos a corto<br />

plazo utilizando una técnica <strong>de</strong> ajuste no paramétrico para inferir la estructura<br />

funcional <strong>de</strong>l sistema a partir <strong>de</strong> los datos disponibles. Sin embargo,<br />

dada la sensibilidad <strong>de</strong> estos sistemas a las perturbaciones en sus condiciones<br />

iniciales, una predicción a largo plazo sólo es posible en términos<br />

probabilísticos.<br />

En este ejemplo se analiza la eficiencia <strong>de</strong> las re<strong>de</strong>s multicapa para pre<strong>de</strong>cir<br />

la dinámica caótica <strong>de</strong>l sistema <strong>de</strong> Lorenz. Para ello, se consi<strong>de</strong>ra la


¡£<br />

¤£<br />

¡£<br />

£<br />

¥£<br />

¦£<br />

¡£<br />

¤£<br />

66 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

zn<br />

yn<br />

xn<br />

Figura 3.21: Atractor <strong>de</strong>l sistema <strong>de</strong> Lorenz.<br />

x(t)<br />

¡¢<br />

y(t)<br />

¡£ ¢£¢¡£¡¢ ¤£<br />

z(t)<br />

t<br />

¢ ¡£ ¡¢ ¤£<br />

Figura 3.22: Series temporales para cada una <strong>de</strong> las tres variables <strong>de</strong>l sistema.<br />

serie temporal obtenida integrando el sistema. Esto es equivalente a extraer<br />

una muestra <strong>de</strong>l sistema a intervalos <strong>de</strong> tiempo equi-espaciados t n = n τ,<br />

n = 0, 1, 2, . . .. Se está interesado en la aproximación <strong>de</strong>l mo<strong>de</strong>lo funcional<br />

F a partir <strong>de</strong> una serie u 0 ,u 1 , . . .,u N . En este caso, el mo<strong>de</strong>lo inferido<br />

será <strong>de</strong> la forma u n+p = f(u n ), don<strong>de</strong> f estará dada en términos <strong>de</strong> F, <strong>de</strong>l<br />

tiempo <strong>de</strong> muestreo τ, y <strong>de</strong>l horizonte <strong>de</strong> predicción p.<br />

Para este propósito se consi<strong>de</strong>ra una red multicapa con funciones <strong>de</strong><br />

activación sigmoidales para las capas ocultas y lineales para la capa <strong>de</strong> salida.<br />

El proceso <strong>de</strong> entrenamiento es llevado a cabo consi<strong>de</strong>rando pares entrada–<br />

salida <strong>de</strong> la forma (u n ,u n+p ), don<strong>de</strong> p es el horizonte <strong>de</strong> predicción. Al<br />

tratarse <strong>de</strong> un sistema continuo se han consi<strong>de</strong>rado distintas re<strong>de</strong>s multicapa<br />

3 : a : 3 con una única capa oculta con a neuronas, a<strong>de</strong>más <strong>de</strong> tres neuronas<br />

<strong>de</strong> entrada (x n , y n , z n ) y tres neuronas <strong>de</strong> salida (x n+1 , y n+1 , z n+1 ). Para<br />

cada una <strong>de</strong> estas re<strong>de</strong>s (con a variando entre 1 y 20) se realizaron diez<br />

experimentos con diferentes pesos iniciales; en cada caso se tomó la mejor<br />

solución como el mo<strong>de</strong>lo neuronal aproximado representativo. Por ejemplo,<br />

la Figura 3.23(a) muestra los errores obtenidos para la variable <strong>de</strong> predicción


3.5. REDES NEURONALES MULTICAPA 67<br />

0.1<br />

(a) 0.1<br />

xn-xn<br />

0<br />

0<br />

-0.1<br />

0.015<br />

-0.1<br />

200 400 600 800 1000<br />

(b)<br />

0.015<br />

xn-xn<br />

0<br />

0<br />

-0.015<br />

-0.015<br />

200 400 600 800 1000<br />

Figura 3.23: Residuos x n − ˆx n para dos mo<strong>de</strong>los neuronales con (a) seis y (b)<br />

quince neuronas en la capa oculta. Las re<strong>de</strong>s neuronales han sido entrenadas con<br />

los 500 primeros puntos y una validación cruzada se realiza con los 500 últimos.<br />

Ningún sobreajuste se pue<strong>de</strong> apreciar en ninguno <strong>de</strong> los mo<strong>de</strong>los.<br />

n<br />

x con el mejor mo<strong>de</strong>lo <strong>de</strong> red <strong>de</strong> 6 neuronas en la capa oculta para ˆx n+1 :<br />

0.34<br />

−3768.18 −<br />

1 + e 9.31+0.53 xn−0.68 yn−0.21 + 0.92<br />

−<br />

zn 1 + e7.64−0.121 xn−0.149 yn−0.13 zn<br />

2.75<br />

1 + e 6.19+0.15 xn+0.0451 yn−0.09 − 2.04<br />

+ (3.32)<br />

zn 1 + e1.13+0.06 xn+0.0119 yn−0.06 zn<br />

7164.31<br />

1 + e −0.12+0.00021 xn−0.0002 yn+0.000021 − 63.52<br />

,<br />

zn 1 + e−0.24+0.08 xn−0.016 yn+0.0049 zn<br />

El error cuadrático medio (RMSE) obtenido por esta red fue <strong>de</strong> 0.133 para<br />

el proceso <strong>de</strong> aprendizaje y <strong>de</strong> 0.149 para la validación. Estos resultados<br />

muestran que no se produce sobreajuste en los datos.<br />

A pesar <strong>de</strong>l buen comportamiento <strong>de</strong> la red <strong>de</strong> seis neuronas ocultas para<br />

la predicción a un paso, no está claro que el mo<strong>de</strong>lo neuronal obtenido pueda<br />

reproducir la dinámica <strong>de</strong>l sistema <strong>de</strong> Lorenz. La Figura 3.24 ilustra este hecho<br />

mostrando la evolución <strong>de</strong> la red neuronal para dos condiciones iniciales<br />

distintas; en el primer caso, el sistema neuronal converge a una trayectoria<br />

periódica (Fig. 3.24(a)), mientras que en el segundo caso converge a un<br />

punto fijo (Fig. 3.24(b)); ninguno <strong>de</strong> ellos refleja el comportamiento caótico<br />

<strong>de</strong>l sistema <strong>de</strong> Lorenz.<br />

Cuando se aumenta el número <strong>de</strong> neuronas en la capa oculta por encima<br />

<strong>de</strong> diez, el error disminuye y el comportamiento dinámico <strong>de</strong>l mo<strong>de</strong>lo neuronal<br />

obtenido se asemeja al sistema caótico original. Por ejemplo, la Figura<br />

3.23(b) muestra el error <strong>de</strong> entrenamiento y <strong>de</strong> test asociados a una red<br />

multicapa con 15 neuronas en la capa oculta (este error es un or<strong>de</strong>n <strong>de</strong> magnitud<br />

menor que el asociado con el mo<strong>de</strong>lo <strong>de</strong> 6 neuronas mostrado en (a)).


68 3. MINERÍA DE DATOS Y APRENDIZAJE AUTOMÁTICO<br />

(a)<br />

10 20<br />

0<br />

-10<br />

-20<br />

(b)<br />

10 20<br />

0<br />

-10<br />

-20<br />

10 20 -10<br />

40<br />

40<br />

z<br />

30<br />

20<br />

10<br />

0<br />

-10<br />

x<br />

0 10<br />

y<br />

z<br />

30<br />

20<br />

10<br />

0<br />

-10<br />

x<br />

0 10<br />

Figura 3.24: Evolución en el espacio <strong>de</strong> fases <strong>de</strong> un mo<strong>de</strong>lo neuronal 3 : 6 : 3 con<br />

dos condiciones iniciales diferentes. La parte sombreada en el fondo correspon<strong>de</strong> a<br />

la órbita caótica original y se muestra con propósito ilustrativo.<br />

y<br />

El RMSE <strong>de</strong>l entrenamiento y test fueron <strong>de</strong> 0.0221 y 0.0237, respectivamente,<br />

los cuales indican que no hubo sobre-ajuste. La Figura 3.25 muestra<br />

la evolución <strong>de</strong> los sistemas original y neuronal, comenzando en la misma<br />

condición inicial. El punto don<strong>de</strong> ambos sistemas comienzan a separarse<br />

(≈ t = 3) es aproximadamente el umbral impuesto por el comportamiento<br />

caótico en la precisión numérica <strong>de</strong> los cálculos realizados.<br />

(a)<br />

(b)<br />

z<br />

-20 -1001020 -20 -1001020<br />

40<br />

40<br />

30<br />

30<br />

z<br />

20<br />

20<br />

10<br />

10<br />

-10 y<br />

-10 0 0 10<br />

x<br />

10<br />

x<br />

(c)<br />

15<br />

x<br />

10<br />

-5 05<br />

-10<br />

-15<br />

0 1 2 3 4 5<br />

(d)<br />

y<br />

15<br />

x<br />

10<br />

-5 05<br />

-10<br />

-15<br />

0 1 2 3 4 5<br />

t n x 102<br />

Figura 3.25: Evolución en el espacio <strong>de</strong> fase <strong>de</strong> (a) el mo<strong>de</strong>lo <strong>de</strong> Lorenz y (b) un<br />

mo<strong>de</strong>lo neuronal aproximado con 15 neuronas ocultas.<br />

Finalmente, si se sigue incrementando el número <strong>de</strong> neuronas en la capa<br />

oculta por encima <strong>de</strong> veinte el error <strong>de</strong> entrenamiento continúa <strong>de</strong>creciendo,<br />

pero los mo<strong>de</strong>los neuronales comienza a sobre-ajustarse a los datos. Como<br />

consecuencia, el comportamiento <strong>de</strong> estos mo<strong>de</strong>los presenta diferencias<br />

significativas con el sistema original (la mayoría <strong>de</strong> las veces los mo<strong>de</strong>los<br />

neuronales divergen asimptóticamente).


CAPÍTULO 4<br />

Validación <strong>de</strong> Sistemas Probabiĺısticos <strong>de</strong> Predicción<br />

Meteorológica<br />

4.1. Introducción<br />

Cada variable meteorológica y cada tipo <strong>de</strong> predicción requieren unos<br />

métodos <strong>de</strong> validación apropiados. En este capítulo se analizan las medidas<br />

<strong>de</strong> validación utilizadas a lo largo <strong>de</strong> la Tesis (para una introducción más<br />

general, se refiere al lector a Jolliffe and Stephenson, 2003). Una predicción<br />

es probabilística cuando la salida es una distribución <strong>de</strong> probabilidad sobre<br />

el rango <strong>de</strong> valores o categorías <strong>de</strong> la variable. La forma específica <strong>de</strong> esta<br />

distribución vendrá dada por las características <strong>de</strong> la variable analizada. Por<br />

ejemplo, la temperatura sigue una distribución normal y, por tanto, una predicción<br />

probabilística vendrá dada por la media y la varianza. Los meteoros<br />

son eventos binarios (nieve/no nieve) y su predicción se especifica en base<br />

a un única probabilidad. En otros casos, la situación es más complicada,<br />

especialmente en la precipitación, que es una variable mixta con carácter<br />

discreto (lluvia/no lluvia) y continuo (cantidad <strong>de</strong> lluvia). En este caso la<br />

predicción probabilística se pue<strong>de</strong> dar <strong>de</strong> varias formas; la forma más sencilla<br />

es mediante una probabilidad <strong>de</strong> precipitación por intervalos, discretizando<br />

la variable en todo su rango (Fig. 4.1); otra forma es consi<strong>de</strong>rar la variable<br />

ocurrencia <strong>de</strong> precipitación (que se distribuye aproximadamente según una<br />

Gamma) y dar una predicción probabilística especificando su media (Fig.<br />

4.2). Esta misma distribución proporciona la probabilidad <strong>de</strong> cualquier evento<br />

discreto que se quiera consi<strong>de</strong>rar como, por ejemplo, que la precipitación<br />

supere un cierto umbral. Estos son los tipos <strong>de</strong> predicciones probabilísticas<br />

que se consi<strong>de</strong>ran en esta Tesis y cada uno <strong>de</strong> ellos tiene sus propias medidas<br />

<strong>de</strong> validación.<br />

Se pue<strong>de</strong>n diseñar sistemas <strong>de</strong> predicción probabilística elementales como<br />

la persistencia(τ), don<strong>de</strong> la probabilidad <strong>de</strong> la variable observada o(t) para<br />

69


70 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS<br />

0.6<br />

0.5<br />

Probabilidad<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

[0, 1) mm [1, 5) mm [5, 15) mm >15 mm<br />

Precipitación<br />

Figura 4.1: Predicción probabilística <strong>de</strong> precipitación discretizada.<br />

Probabilidad<br />

Prob. acumulada<br />

0.10<br />

0.08<br />

0.06<br />

0.04<br />

0.02<br />

PDF<br />

0<br />

0 5 10 15 20 25 30 35 40 45<br />

Precipitacion (mm)<br />

1<br />

0.83<br />

0.8<br />

0.6<br />

0.4<br />

CDF<br />

0.2<br />

La prob. <strong>de</strong> superar 15 mm es <strong>de</strong>l 17%<br />

0<br />

0 5 10 15 20 25 30 35 40 45<br />

Precipitacion (mm)<br />

Figura 4.2: Funciones <strong>de</strong> <strong>de</strong>nsidad y distribución <strong>de</strong>l fenómeno “ocurrencia <strong>de</strong><br />

precipitación”. La probabilidad <strong>de</strong> que la precipitación supere un umbral se obtiene<br />

fácilmente a partir <strong>de</strong> la función <strong>de</strong> distribución.<br />

el instante t viene dada por los valores anteriores (o(t − 1), . . .,o(t − τ));<br />

y la climatología, que pue<strong>de</strong> ser <strong>de</strong>finida como la climatología estacional,<br />

mensual, diaria, etc., don<strong>de</strong> la distribución para el instante t viene dada por<br />

los valores ocurridos en un cierto subconjunto <strong>de</strong>l registro histórico.<br />

Son numerosos los aspectos que se pue<strong>de</strong>n tener en cuenta para analizar<br />

la calidad <strong>de</strong> un sistema <strong>de</strong> predicción, especialmente en los sistemas <strong>de</strong><br />

predicción probabilística. Sin embargo, no hay ninguna medida <strong>de</strong> validación<br />

que proporcione una información completa <strong>de</strong> la calidad <strong>de</strong>l sistema, sino que<br />

cada índice <strong>de</strong> validación <strong>de</strong>scribe algún atributo particular <strong>de</strong> la relación<br />

entre observaciones y predicciones. Algunos <strong>de</strong> estos atributos caracterizan a<br />

un único sistema, mientras que otros son comparativos e indican la diferencia<br />

entre sistemas <strong>de</strong> predicción distintos (o entre un sistema y otro sistema <strong>de</strong><br />

referencia como la climatología o la persistencia).


4.2. ASPECTOS DE LA CALIDAD DE UNA PREDICCIÓN 71<br />

4.2. Aspectos <strong>de</strong> la Calidad <strong>de</strong> una Predicción<br />

Murphy and Winkler (1987) establecen que toda la información <strong>de</strong> una<br />

validación está contenida en la distribución conjunta <strong>de</strong> predicciones o y observaciones<br />

ô: P(o,ô). En el caso particular <strong>de</strong> variables discreta (con estados<br />

o categorías C 0 , . . ., C d ), esta información se pue<strong>de</strong> representar mediante una<br />

tabla <strong>de</strong> contingencia:<br />

Observación<br />

C 0 C 1 . . . C d<br />

C 0 P 00 P 01 . . . P 0d<br />

Predicción C 1 P 10 P 11 . . . P 1d<br />

. . . . . .<br />

C d P d0 P d1 . . . P dd<br />

que permite obtener distintos índices <strong>de</strong> validación en base a la información<br />

condicional o marginal asociada a la misma: P(o|ô), P(ô|o), P(ô), P(o);<br />

a pesar <strong>de</strong> las relaciones obvias que existen entre estas probabilida<strong>de</strong>s, su<br />

interpretación y utilidad meteorológica es muy distinta y, por ello, cada<br />

índice aporta información interesante <strong>de</strong>s<strong>de</strong> un punto <strong>de</strong> vista diferente.<br />

Una vez que se tiene la distribución conjunta formada por las predicciones<br />

y las observaciones P(o,ô), se pue<strong>de</strong>n examinar sus características <strong>de</strong><br />

varias formas:<br />

Se pue<strong>de</strong>n analizar globalmente las correspon<strong>de</strong>ncias entre pares <strong>de</strong><br />

observación-predicción; es <strong>de</strong>cir, se analiza la distribución conjunta<br />

total. El Brier Score pertenece a este grupo.<br />

Se pue<strong>de</strong> condicionar el análisis a valores concretos <strong>de</strong> la predicción.<br />

La fiabilidad, la resolución y la <strong>de</strong>finición pertenecen a este grupo.<br />

P(o,ô) = P(o|ô)P(ô). (4.1)<br />

Se pue<strong>de</strong> condicionar el análisis a valores concretos <strong>de</strong> la observación.<br />

La discriminación (área ROC, etc.) es <strong>de</strong> este tipo.<br />

P(ô, o) = P(ô|o)P(o). (4.2)<br />

Estos tres tipos <strong>de</strong> análisis <strong>de</strong> la distribución conjunta permiten examinar<br />

diferentes aspectos <strong>de</strong> la calidad <strong>de</strong> las predicciones, llamados atributos <strong>de</strong><br />

la predicción. Murphy (1993) i<strong>de</strong>ntifica una serie <strong>de</strong> atributos importantes<br />

para una predicción (numérica o probabilística):<br />

Sesgo o <strong>de</strong>sviación sistemática (bias): Referido a la concordancia<br />

entre la predicción media y la observación media; un sesgo positivo indica<br />

una sobreestimación <strong>de</strong>l valor a pre<strong>de</strong>cir, mientras un sesgo negativo<br />

indica una subestimación (por ejemplo, se predice menos cantidad<br />

<strong>de</strong> lluvia <strong>de</strong> la que realmente ocurre).


72 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS<br />

Asociación: Indica el grado <strong>de</strong> relación lineal entre observación y<br />

predicción. La covarianza y la correlación, son medidas <strong>de</strong> asociación.<br />

Precisión(accuracy): Relativa a la concordancia entre el valor previsto<br />

y el observado realmente, promediada sobre una muestra <strong>de</strong> parejas<br />

individuales <strong>de</strong> predicciones y observaciones. Medidas <strong>de</strong> precisión son,<br />

por ejemplo, el error absoluto medio, el error cuadrático medio, y el<br />

Brier Score (BS).<br />

Habilidad(skill) o precisión relativa: Es la precisión <strong>de</strong> un sistemas<br />

respecto a la obtenida con otro <strong>de</strong> referencia (por ejemplo, climatología<br />

o persistencia). Se <strong>de</strong>finen <strong>de</strong> modo que un valor positivo (negativo)<br />

indica que el sistema es más (menos) preciso que el <strong>de</strong> referencia. El<br />

Brier Skill Score (BSS) es el más conocido.<br />

Fiabilidad(reliability) o bias condicional: Para que un sistema sea fiable,<br />

la probabilidad prevista y la observada <strong>de</strong>ben coincidir lo máximo<br />

posible en todo el rango <strong>de</strong> probabilidad; cuando no es así se habla <strong>de</strong><br />

bias condicionado. La fiabilidad se refiere a un <strong>de</strong>terminado evento y<br />

se representa gráficamente dibujando la curva <strong>de</strong> probabilidad prevista<br />

frente a probabilidad observada (climatológica) para intervalos <strong>de</strong> 5<br />

ó 10 % (ver Fig. 4.3). Cuanto más cerca esté <strong>de</strong> la diagonal más fiable<br />

será el sistema <strong>de</strong> predicción probabilística.<br />

probabilidad observada<br />

probabilidad observada<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

(a) Fiabilida<strong>de</strong>s individuales<br />

184 localida<strong>de</strong>s <strong>de</strong> la Península,<br />

Baleares y Canarias<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

probabilidad prevista<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

(c) Fiabilida<strong>de</strong>s individuales<br />

184 localida<strong>de</strong>s <strong>de</strong> la Península,<br />

Baleares y Canarias<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

probabilidad prevista<br />

probabilidad observada<br />

probabilidad observada<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

(b) Fiabilidad media<br />

Evento: Precipitación > 0.1 mm<br />

%<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

probabilidad prevista<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

(d) Fiabilidad media<br />

Evento: Precipitación > 20 mm<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

probabilidad prevista<br />

Figura 4.3: Curvas <strong>de</strong> fiabilidad individuales y promedio para (a)-(b) Precip ><br />

0.1mm y (c)-(d) Precip > 20mm.


4.2. ASPECTOS DE LA CALIDAD DE UNA PREDICCIÓN 73<br />

Cuando se analiza la fiabilidad <strong>de</strong> distintas predicciones (por ejemplo,<br />

distintos observatorios), utilizar el promedio es un concepto engañoso,<br />

ya que las fiabilida<strong>de</strong>s individuales generalmente son peores,<br />

como ocurre cuando se promedian errores. La fiabilidad media únicamente<br />

indica si el sistema subestima o sobreestima en promedio. En la<br />

Fig. 4.3 se muestran las fiabilida<strong>de</strong>s obtenidas al aplicar un método <strong>de</strong><br />

predicción local a 184 observatorios Españoles. Las Figs. (a)-(b) están<br />

asociadas al evento Precip > 0.1mm, mientras que (c)-(d) correspon<strong>de</strong>n<br />

a Precip > 20mm. Se aprecia que la fiabilidad es mayor/menor en<br />

probabilida<strong>de</strong>s extremas/intermedias; en este caso, el promedio resulta<br />

ser aceptablemente representativo <strong>de</strong> las fiabilida<strong>de</strong>s individuales, ya<br />

que todas subestiman. A<strong>de</strong>más se ve como se <strong>de</strong>teriora la fiabilidad a<br />

medida que el evento es más raro.<br />

Es muy importante estudiar la fiabilidad <strong>de</strong> los sistemas para diferentes<br />

eventos, ya que los eventos raros casi nunca se predicen con<br />

probabilida<strong>de</strong>s altas, manifestando una fuerte pérdida <strong>de</strong> fiabilidad<br />

que <strong>de</strong>be ser corregida, como en la Fig. 4.3 (c)-(d). Existen diversas<br />

técnicas para realizar estas correcciones, entre las que se encuentran<br />

las <strong>de</strong> inflado que básicamente consisten en hacer un cambio <strong>de</strong> escala<br />

para aumentar la varianza estimada hasta su valor real. Existen versiones<br />

más sofisticadas, como la <strong>de</strong>l expan<strong>de</strong>d downscaling, don<strong>de</strong> la<br />

corrección se realiza mediante correlación canónica (Burguer, 1996).<br />

Estas técnicas paramétricas <strong>de</strong> inflado tienen como contrapartida que<br />

el error <strong>de</strong>l estimador corregido siempre es mayor que el <strong>de</strong>l estimador<br />

original (ver von Storch, 1999, para más <strong>de</strong>talles).<br />

Definición: Es la distribución <strong>de</strong> las probabilida<strong>de</strong>s predichas. La <strong>de</strong>finición<br />

se representa mediante un histograma que representa las frecuencias<br />

<strong>de</strong> las probabilida<strong>de</strong>s previstas. Es <strong>de</strong>seable que el histograma<br />

tenga forma <strong>de</strong> ’U’ <strong>de</strong> manera que prediga pocas veces valores ambiguos<br />

en torno a 0.5 (ver Fig. 4.4).<br />

0.6<br />

0.5<br />

Frecuencia<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1<br />

Probabilidad Prevista<br />

Figura 4.4: En negro la <strong>de</strong>finición i<strong>de</strong>al y en blanco un ejemplo <strong>de</strong> <strong>de</strong>finición real.


74 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS<br />

4.3. Medidas <strong>de</strong> Validación <strong>de</strong> Predicciones Probabiĺısticas<br />

Si se tiene un conjunto <strong>de</strong> observaciones o 1 , o 2 , ..., o n sobre las que se<br />

realizan las predicciones ô 1 , ô 2 , ...,ô n , los índices <strong>de</strong> validación más habituales<br />

son los <strong>de</strong> precisión y habilidad, ya que proporcionan una medida numérica<br />

<strong>de</strong> la calidad <strong>de</strong> la predicción realizada.<br />

4.3.1. Brier Score<br />

El Brier Score(BS) (Brier, 1950) es una medida clásica <strong>de</strong> la calidad<br />

(precisión) <strong>de</strong> una predicción probabilística para una variable discreta. Es<br />

una distancia medida en unida<strong>de</strong>s <strong>de</strong> probabilidad para la ocurrencia <strong>de</strong> las<br />

distintas categorías <strong>de</strong> la variable.<br />

BS =< (p i − o i ) 2 > i , (4.3)<br />

don<strong>de</strong> p i = P(ô i = 1), y o i es 1 si ocurre el evento y 0 en caso contrario. El<br />

valor <strong>de</strong> BS es nulo para una predicción perfecta.<br />

Es muy usual utilizar la <strong>de</strong>scomposición <strong>de</strong>l Brier score como suma <strong>de</strong><br />

tres componentes; para realizar la <strong>de</strong>scomposición se utiliza el siguiente argumento<br />

(véase Murphy, 1973):<br />

(p i − o i ) 2 = f i (p i − 1) 2 + (1 − f i )p 2 i , (4.4)<br />

don<strong>de</strong> f i = p(o i = 1|p i ) es el número <strong>de</strong> casos observados <strong>de</strong> entre los<br />

previstos con probabilidad p i . Por tanto,<br />

BS = BS f − BS r + I, (4.5)<br />

don<strong>de</strong> BS f es la componente <strong>de</strong> fiabilidad cuya expresión es:<br />

BS f =< (p i − f i ) 2 > (4.6)<br />

BS r es la componente <strong>de</strong> resolución cuya expresión es:<br />

BS r =< (f i − p c ) 2 > (4.7)<br />

p c es la probabilidad climática <strong>de</strong>l evento. Por último I es la componente <strong>de</strong><br />

incertidumbre cuya expresión es:<br />

I = 1 M<br />

M∑<br />

(p c − o i ) 2 = P c (1 − P c ). (4.8)<br />

i=1<br />

I es el Brier Score <strong>de</strong> un sistema <strong>de</strong> predicción climatológico.<br />

El BS da una i<strong>de</strong>a <strong>de</strong>l error cometido en una predicción, pero no dice nada<br />

acerca <strong>de</strong> la dificultad <strong>de</strong> dicha predicción. La dificultad <strong>de</strong> una predicción<br />

está muy asociada con su rareza, cuanto más infrecuente sea, es más difícil<br />

<strong>de</strong> pre<strong>de</strong>cir; por ejemplo, es mucho mas difícil pre<strong>de</strong>cir lluvia en Almería que<br />

en Santan<strong>de</strong>r. Por otra parte, si el evento es muy raro, como por ejemplo


4.3. MEDIDAS DE VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS 75<br />

la lluvia en Almería, un sistema sin utilidad que siempre diga que no va a<br />

llover (como la climatología o la persistencia) tendría un BS casi nulo por<br />

lo que sería casi imposible <strong>de</strong> superar por un sistema <strong>de</strong> mayor utilidad. Es<br />

<strong>de</strong>cir, cuando está muy <strong>de</strong>scompensada la frecuencia <strong>de</strong> ocurrencia y <strong>de</strong> no<br />

ocurrencia, el BS sólo es representativo <strong>de</strong>l evento más frecuente.<br />

Precipitación > [0.1−2−10−20] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

0.7<br />

Brier Score Climatología<br />

Brier Score Predicción<br />

Brier Skill Score<br />

0.6<br />

probabilidad climatológica<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

−0.1 0 0.1 0.2 0.3 0.4 0.5 0.6<br />

Score<br />

Figura 4.5: Brier Scores y Brier Skill Scores correspondientes a un sistema <strong>de</strong> predicción<br />

para 184 estaciones completas y cuatro eventos <strong>de</strong> precipitación. A medida<br />

que el error es inferior al error climatológico el BSS aumenta, los valores máximos<br />

se dan para p c = 0.5.<br />

4.3.2. Brier Skill Score<br />

Como se ve en la fig.4.5, el BS da una i<strong>de</strong>a muy particular <strong>de</strong>l comportamiento<br />

<strong>de</strong> un sistema <strong>de</strong> predicción ya que <strong>de</strong>pen<strong>de</strong> fuertemente <strong>de</strong> la<br />

frecuencia <strong>de</strong>l evento, <strong>de</strong> la localidad don<strong>de</strong> se aplica y <strong>de</strong> la serie utilizada.<br />

Por tanto, si se quiere conocer correctamente la calidad <strong>de</strong>l sistema, se<br />

tendrían que especificar todos y cada uno <strong>de</strong> los valores <strong>de</strong>l BS para cada<br />

localidad y para cada evento, resultando una matriz <strong>de</strong> datos diferente<br />

para cada período consi<strong>de</strong>rado. Para evitar este problema se pue<strong>de</strong> obtener<br />

una medida <strong>de</strong> validación relativa, en lugar <strong>de</strong> absoluta, consi<strong>de</strong>rando<br />

un sistema <strong>de</strong> predicción <strong>de</strong> referencia (como la climatología o la persistencia)<br />

(Talagrand, 1997). A estas medidas relativas se las <strong>de</strong>nomina índices <strong>de</strong><br />

pericia (Skill Scores, SS) y se calculan <strong>de</strong> la siguiente forma:<br />

SS = P(o = 1|p) − P(o = 1|p c)<br />

1 − P(o = 1|p c )<br />

(4.9)


76 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS<br />

don<strong>de</strong> p es el sistema <strong>de</strong> predicción que se <strong>de</strong>sea validar, p c es el sistema<br />

<strong>de</strong> referencia, y P(o = 1|p) es la probabilidad <strong>de</strong> que se produzca el evento<br />

dado que el sistema lo predice con probabilidad p.<br />

Teniendo en cuenta que el BS es equivalente a 1 − P(o = 1|p), se pue<strong>de</strong><br />

obtener un índice <strong>de</strong> pericia a partir <strong>de</strong> (4.9). Este índice se <strong>de</strong>nomina Brier<br />

Skill Score (BSS):<br />

BSS = 1 − BS p<br />

BS c<br />

, (4.10)<br />

don<strong>de</strong> BS p es el BS <strong>de</strong>l sistema <strong>de</strong> predicción y BS c el BS <strong>de</strong> la climatología<br />

(u otro sistema <strong>de</strong> referencia). La interpretación es sencilla: Si BSS > 0,<br />

entonces el sistema <strong>de</strong> predicción es mejor que el climatológico; en cambio,<br />

si BSS < 0 el sistema no mejora la climatología. En el caso <strong>de</strong> que BSS = 1<br />

se tendría una predicción perfecta.<br />

4.4. Validación <strong>de</strong> Predicciones Categóricas<br />

Cuando la predicción se refiere a la ocurrencia o no-ocurrencia <strong>de</strong> las<br />

categorías <strong>de</strong> una variable discreta, se habla <strong>de</strong> predicciones categóricas. Las<br />

predicciones categóricas se verifican utilizando tablas <strong>de</strong> contingencia, que<br />

se construyen combinando todas las posibilida<strong>de</strong>s entre categoría prevista y<br />

categoría observada.<br />

Este tipo <strong>de</strong> predicciones son populares para variables binarias (por ejemplo,<br />

Precip > 0.1mm). En este caso, dada una predicción probabilística<br />

P(Precip > 0.1mm) = p, se pue<strong>de</strong> asociar una predicción categórica consi<strong>de</strong>rando<br />

un cierto umbral <strong>de</strong> probabilidad u p para <strong>de</strong>terminar la ocurrencia<br />

o no <strong>de</strong>l evento. Por ejemplo, si se toma u p = 0.5 se <strong>de</strong>terminará la ocurrencia<br />

<strong>de</strong>l evento si la probabilidad es superior a 0.5 y se <strong>de</strong>terminará la no<br />

ocurrencia en caso contrario. En el caso binario, las tablas <strong>de</strong> contingencia<br />

están <strong>de</strong>terminadas por cuatro parámetros:<br />

Observado<br />

Si No<br />

Previsto Si α β<br />

No γ δ<br />

Para variables binarias <strong>de</strong>finidas a partir <strong>de</strong> una variable continua, utilizando<br />

un umbral, se tiene una tabla <strong>de</strong> contingencia diferente para cada valor <strong>de</strong>l<br />

umbral utilizado u p ; por tanto, α, β, γ y δ <strong>de</strong>pen<strong>de</strong>n <strong>de</strong> u p .<br />

Si se quieren contrastar dos sistemas <strong>de</strong> predicción, para un <strong>de</strong>terminado<br />

rango <strong>de</strong> operación, los criterios globales como el BSS pue<strong>de</strong>n inducir a<br />

equivocaciones a la hora <strong>de</strong> elegir el mejor sistema. Cuando se toman <strong>de</strong>cisiones,<br />

se pue<strong>de</strong>n cometer dos tipos <strong>de</strong> errores: falsa alarma y omisión,<br />

conocidos como errores <strong>de</strong> Tipo I y Tipo II respectivamente. Generalmente<br />

en Meteorología, se consi<strong>de</strong>ra que la omisión es un error más grave que la<br />

falsa alarma y esto conduce a que el error más frecuente es, el <strong>de</strong> Tipo I.


4.4. VALIDACIÓN DE PREDICCIONES CATEGÓRICAS 77<br />

Sin embargo si se producen muchas falsas alarmas se pier<strong>de</strong> credibilidad.<br />

Un aspecto importante a tener en cuenta es que la importancia relativa <strong>de</strong><br />

estos dos errores es diferente para diferentes usuarios. Por ello, hay que tener<br />

en cuenta los requerimientos específicos <strong>de</strong>l usuario a quien va dirigida la<br />

predicción.<br />

A continuación se <strong>de</strong>scriben algunas <strong>de</strong> las medidas más utilizadas. Para<br />

indicar su rango <strong>de</strong> valores y el valor óptimo, se utilizará la notación: [a,b]<br />

don<strong>de</strong> se indica el rango y el valor óptimo (en negrita).<br />

Precisión [0,1]:<br />

ACC =<br />

α + δ<br />

α + β + γ + δ<br />

(4.11)<br />

Realmente mi<strong>de</strong> la proporción <strong>de</strong> aciertos, y pue<strong>de</strong> ser maximizada prediciendo<br />

siempre la categoría más común. En regiones don<strong>de</strong> el evento<br />

es muy raro, se hace prácticamente la unidad <strong>de</strong>bido al gran número<br />

<strong>de</strong> aciertos negativos (no aporta información para eventos raros). La<br />

precisión <strong>de</strong> un sistema que nunca predice el evento es:<br />

ACC no =<br />

δ<br />

γ + δ = 1 − p c (4.12)<br />

0.7<br />

0.6<br />

Precipitación > [0.1−2−10−20] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

Sistema I (10%)<br />

Sistema II (50%)<br />

Vigo<br />

Vigo<br />

Sistema NO (100%)<br />

probabilidad climatológica<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

Región Húmeda<br />

0.1<br />

Región Arida<br />

0<br />

0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 1<br />

Precisión(ACC)<br />

Figura 4.6: Se constata una fuerte <strong>de</strong>pen<strong>de</strong>ncia entre la precisión y la rareza <strong>de</strong>l<br />

evento para diferentes umbrales <strong>de</strong> predicción en diferentes localida<strong>de</strong>s. El sistema<br />

II resulta ser el más preciso en todo el rango. La recta negra representa a la precisión<br />

<strong>de</strong>l sistema que nunca predice la ocurrencia <strong>de</strong>l evento.<br />

En la figura 4.6 queda claro que atendiendo a la precisión, el sistema<br />

con el umbral <strong>de</strong> predicción <strong>de</strong>l 50 % es mejor; a<strong>de</strong>más, se ve que un<br />

promedio global <strong>de</strong> ACC para todas las localida<strong>de</strong>s estaría fuertemente


78 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS<br />

sesgado en favor <strong>de</strong> las regiones áridas, por lo que el empleo <strong>de</strong> éste<br />

índice no es aconsejable para ello.<br />

Critical Success In<strong>de</strong>x ó Threat Score [0,1]:<br />

CSI =<br />

α<br />

α + β + γ<br />

(4.13)<br />

Es similar a la precisión, pero se han quitando los aciertos negativos.<br />

Aunque es más equilibrado que el ACC, sus mayores valores se dan<br />

en aquellas localida<strong>de</strong>s don<strong>de</strong> el evento es más común. El CSI <strong>de</strong> un<br />

sistema que nunca predice el evento es nulo, mientras que el CSI <strong>de</strong><br />

un sistema que siempre lo predice es:<br />

CSI si =<br />

α<br />

α + β = p c (4.14)<br />

Al igual que la precisión, es muy inestable para eventos raros.<br />

0.7<br />

0.6<br />

Precipitación > [0.1−2−10−20] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

Sistema I (10%)<br />

Sistema II (50%)<br />

Sistema SI (0%)<br />

probabilidad climatológica<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

Región Húmeda<br />

0.1<br />

Región Arida<br />

0<br />

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8<br />

Critical Success In<strong>de</strong>x(CSI)<br />

Figura 4.7: Nuevamente se constata una notable <strong>de</strong>pen<strong>de</strong>ncia respecto a la rareza<br />

<strong>de</strong>l evento para diferentes umbrales <strong>de</strong> predicción en diferentes localida<strong>de</strong>s. La línea<br />

negra correspon<strong>de</strong> al sistema que siempre predice el evento.<br />

En la figura 4.7 no queda claro qué sistema es mejor según el criterio<br />

<strong>de</strong>l CSI ya que el sistema II con el umbral <strong>de</strong> predicción <strong>de</strong>l 50 % es<br />

mejor en zonas húmedas mientras que el sistema I con el 10 % resulta<br />

mejor para zonas áridas, o equivalentemente para eventos raros; como<br />

en el caso <strong>de</strong>l ACC, no es recomendable un promedio global <strong>de</strong> CSI<br />

para toda las localida<strong>de</strong>s ya que es muy inestable en la zona <strong>de</strong> eventos<br />

raros.


4.4. VALIDACIÓN DE PREDICCIONES CATEGÓRICAS 79<br />

Hit Rate(HIR) [0,1]:<br />

HIR(u p ) = P(p ≥ u p |o = 1) =<br />

α<br />

α + γ<br />

(4.15)<br />

Es una medida <strong>de</strong> precisión, que mi<strong>de</strong> la probabilidad <strong>de</strong> <strong>de</strong>tección; es<br />

<strong>de</strong>cir, pre<strong>de</strong>cir eventos que realmente se han observado.<br />

False Alarm Rate(FAR) [0, 1]:<br />

FAR(u p ) = P(p ≥ u p |o = 0) =<br />

β<br />

β + δ<br />

(4.16)<br />

También es una medida <strong>de</strong> precisión, que mi<strong>de</strong> la proporción <strong>de</strong> fallos<br />

cuando se predice positivamente un evento. Obsérvese que el concepto<br />

habitual <strong>de</strong> falsa alarma es un suceso que se ha predicho, pero luego no<br />

ha ocurrido; sin embargo, en este caso, el evento que condiciona es na<br />

no ocurrencia <strong>de</strong>l evento. Con este cambio se consigue que cualquier<br />

usuario tendrá un criterio <strong>de</strong> comparación referido siempre a la incertidumbre<br />

climatológica <strong>de</strong>l evento, que es un invariante estadístico<br />

in<strong>de</strong>pendiente <strong>de</strong>l tipo <strong>de</strong> sistema <strong>de</strong> predicción empleado.<br />

Curvas ROC (Relative Operating Characteristics)<br />

Las Curvas ROC permiten validar <strong>de</strong> forma uniforme los sistemas <strong>de</strong><br />

predicción categóricos basados en umbrales <strong>de</strong> probabilidad. Se obtienen<br />

representando los valores FAR frente a los HIR para diferentes<br />

umbrales <strong>de</strong> probabilidad u p . Sobre ellas se pue<strong>de</strong>n comparar dos sistemas<br />

diferentes, para los niveles relativos <strong>de</strong> falsas alarmas y omisiones<br />

que más convengan al usuario.<br />

Hay que tener en cuenta cómo se categoriza respecto a u p ; si tomamos<br />

u p = 0, el evento se predice siempre, y por tanto FAR(0) = 1 y<br />

HIR(0) = 1. En cambio si se toma u p = 1, el evento sólo será predicho<br />

cuando éste genere valores <strong>de</strong> p = u p = 1, por lo que no necesariamente<br />

FAR(100) = 0 y HIR(100) = 0. Por contra, si la <strong>de</strong>finición <strong>de</strong> los<br />

umbrales fuese menor o igual en vez <strong>de</strong> mayor o igual, tendríamos que<br />

la curva ROC pasa necesariamente por (0, 0).<br />

La curva ROC para el PPS climatológico<br />

Es sencillo simular un sistema <strong>de</strong> predicción climatológico utilizando<br />

una variable uniforme que genere 0 con probabilidad (1 − p c ) y 1 con<br />

probabilidad p c . La tabla <strong>de</strong> contingencia resultante sería:<br />

Observado<br />

Si No<br />

Previsto Si p 2 c<br />

No p c (1 − p c )<br />

p c (1 − p c )<br />

(1 − p c ) 2


80 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS<br />

en este caso:<br />

HIR(p c ) = FAR(p c ) = p c (4.17)<br />

Y si se utiliza un umbral u p , se obtienen fácilmente dos puntos: el (0, 0)<br />

y el (1, 1), ya que en este caso, el pronóstico climático es 0 ó 1, por<br />

tanto, se consi<strong>de</strong>ra que la curva ROC <strong>de</strong> los sistemas climatológicos<br />

siempre está sobre la diagonal.<br />

En la figura 4.8 se ve cómo reduciendo el valor <strong>de</strong>l umbral u p , se<br />

consigue aumentar el HIR con poco aumento <strong>de</strong> FAR hasta que, <strong>de</strong>pendiendo<br />

<strong>de</strong>l sistema <strong>de</strong> predicción, un pequeño aumento en el HIR<br />

produce un gran aumento en el FAR. Operando con un umbral inferior<br />

a la probabilidad climatológica, el sistema comete más falsas alarmas<br />

que aciertos, ya que la pendiente <strong>de</strong> la curva ROC se hace menor que<br />

la diagonal.<br />

Precipitación > [0.1] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

Sistema I (10%)<br />

0.8<br />

Sistema III (up=pc)<br />

Precipitación > [2] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

Sistema I (10%)<br />

0.8<br />

Sistema III (up=pc)<br />

HIR<br />

0.6<br />

0.4<br />

Sistema II (50%)<br />

HIR<br />

0.6<br />

0.4<br />

Sistema II (50%)<br />

0.2<br />

0.2<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

FAR<br />

Precipitación > [10] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

FAR<br />

Precipitación > [20] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

0.8<br />

Sistema III (up=pc)<br />

0.8<br />

HIR<br />

0.6<br />

0.4<br />

Sistema I (10%)<br />

HIR<br />

0.6<br />

0.4<br />

Sistema III (up=pc)<br />

0.2<br />

0.2<br />

Sistema I (10%)<br />

Sistema II (50%)<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

FAR<br />

0 Sistema II (50%)<br />

0 0.2 0.4 0.6 0.8 1<br />

FAR<br />

Figura 4.8: Ejemplo <strong>de</strong> curvas ROC promediadas para cuatro eventos <strong>de</strong> precipitación.<br />

Se han reasaltado los umbrales correspondientes a distintos sistemas.<br />

Para cada umbral <strong>de</strong> probabilidad, el mejor sistema será aquel cuya<br />

tasa HIR sea más alta para un mismo nivel <strong>de</strong> FAR. El criterio más<br />

empleado es el <strong>de</strong>l área bajo la curva ROC, <strong>de</strong> forma que es mejor<br />

aquel sistema que mayor área cubre bajo su curva ROC. Por ejemplo,<br />

la Fig. 4.9 muestra las áreas bao la curva ROC para las predicciones<br />

sobre 196 estaciones <strong>de</strong> la Península consi<strong>de</strong>radas anteriormente. Se<br />

pone claramente <strong>de</strong> manifiesto que lo que para algunas estaciones es<br />

un evento raro, para otras es muy común. Asimismo, el área ROC


4.4. VALIDACIÓN DE PREDICCIONES CATEGÓRICAS 81<br />

aumenta exponencialmente con la probabilidad climatológica.<br />

Precipitación > [0.1] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

0.6<br />

Precipitación > [2] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

0.5<br />

probabilidad climatológica<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

probabilidad climatológica<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

Eventos Raros<br />

0<br />

0.5 0.6 0.7 0.8 0.9 1<br />

Roc Area<br />

Eventos Raros<br />

0<br />

0.5 0.6 0.7 0.8 0.9 1<br />

Roc Area<br />

Precipitación > [10] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

0.2<br />

Precipitación > [20] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

0.1<br />

probabilidad climatológica<br />

0.15<br />

0.1<br />

0.05<br />

Eventos Raros<br />

probabilidad climatológica<br />

0.08<br />

0.06<br />

0.04<br />

0.02<br />

Eventos Raros<br />

0<br />

0.5 0.6 0.7 0.8 0.9 1<br />

Roc Area<br />

0<br />

0.5 0.6 0.7 0.8 0.9 1<br />

Roc Area<br />

Figura 4.9: Areas ROC frente a la frecuencia climatológica <strong>de</strong> cuatro eventos <strong>de</strong><br />

precipitación parar 196 estaciones en la Península.<br />

Valor Económico [-inf,1]<br />

Un potencial usuario <strong>de</strong> un sistema <strong>de</strong> predicción pue<strong>de</strong> tomar alguna<br />

acción preventiva <strong>de</strong>pendiendo <strong>de</strong> la probabilidad <strong>de</strong> que un <strong>de</strong>terminado<br />

evento ocurra. Adoptar la acción preventiva supone un coste C<br />

in<strong>de</strong>pendientemente <strong>de</strong> que el evento suceda o no; por otro lado, si<br />

ocurre el evento y no se toma ninguna acción se produce una pérdida<br />

P. El usuario necesita un criterio sencillo que le permita adoptar la<br />

estrategia que minimice los gastos.<br />

Una curva ROC indica, para cada u p , la relación entre la tasa HIR y<br />

la tasa FAR <strong>de</strong> un <strong>de</strong>terminado sistema <strong>de</strong> predicción. Como se mencionó<br />

anteriormente, esta información por sí sola no es completa ya<br />

que es muy importante especificar la probabilidad <strong>de</strong> ocurrencia <strong>de</strong>l<br />

evento, es <strong>de</strong>cir, su probabilidad climática, que marca el límite a partir<br />

<strong>de</strong>l cual el valor <strong>de</strong> falsas alarmas supera al <strong>de</strong> aciertos en valor absoluto.<br />

Es obvio que no todos los usuarios admiten el mismo número <strong>de</strong><br />

falsas alarmas. Por un lado, cuantas más falsas alarmas pueda admitir<br />

el usuario, conseguirá mayor número <strong>de</strong> aciertos con el mismo sistema;<br />

sin embargo, por otra parte, el número <strong>de</strong> falsas alarmas no pue<strong>de</strong><br />

crecer in<strong>de</strong>finidamente ya que <strong>de</strong>s<strong>de</strong> un punto <strong>de</strong> vista económico, la<br />

alarma conlleva la toma <strong>de</strong> acciones preventivas que tienen un coste


82 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS<br />

C, mientras que la omisión <strong>de</strong> un evento conlleva unas pérdidas P, <strong>de</strong><br />

tal manera que si un evento se presenta con probabilidad P c , el gasto<br />

generado por las acciones preventivas nunca <strong>de</strong>berá superar el límite<br />

P ∗ P c . La tabla <strong>de</strong> gasto sería:<br />

Observado<br />

Si No<br />

Acción Si α . Coste β . Coste<br />

Preventiva No γ . Pérdida δ . 0<br />

De acuerdo con la tabla, el gasto <strong>de</strong>l sistema sería:<br />

Utilizando (4.15) y (4.16) queda:<br />

G = αC + βC + γP (4.18)<br />

G = HIRP c C + FAR(1 − P c )C + (1 − HIR)P c P (4.19)<br />

Si el sistema fuese perfecto, entonces HIR = 1 y FAR = 0 por lo que:<br />

G perfecto = P c C (4.20)<br />

y utilizando como sistema <strong>de</strong> referencia el climatológico se tendría:<br />

G climatico = min[C, P c P] (4.21)<br />

ya que como se dijo anteriormente, el gasto generado por las acciones<br />

preventivas nunca <strong>de</strong>berá superar el límite P P c .<br />

Definiendo el valor económico como la diferencia <strong>de</strong>l gasto, respecto a<br />

un sistema perfecto, <strong>de</strong>l sistema que se preten<strong>de</strong> validar frente a un<br />

sistema climatológico, se tiene:<br />

V =<br />

G − G climatico<br />

G perfecto − G climatico<br />

(4.22)<br />

sustituyendo y poniendo V en función <strong>de</strong> R = C/P, es <strong>de</strong>cir, <strong>de</strong> la<br />

relación Coste-Pérdidas:<br />

V = HIRP cR + FAR(1 − P c )R + (1 − HIR)P c − min[R, P c ]<br />

P c R − min[R, P c ]<br />

(4.23)<br />

• Ya que tanto HIR como FAR <strong>de</strong>pen<strong>de</strong>n <strong>de</strong>l umbral <strong>de</strong> probabilidad<br />

(u p ), V es función <strong>de</strong> u p y R: V = V (u p , R) es <strong>de</strong>cir, existe<br />

una curva V = f(R) para cada valor <strong>de</strong> u p .<br />

• Para cada valor <strong>de</strong> R existe un único valor <strong>de</strong> u p que maximiza<br />

el valor económico <strong>de</strong>l sistema.


4.4. VALIDACIÓN DE PREDICCIONES CATEGÓRICAS 83<br />

• El valor económico máximo se produce cuando R = P c para cualquier<br />

u p .<br />

• Cuando R < P c y a medida que R disminuye, el sistema pier<strong>de</strong><br />

rápidamente su valor económico ya que el coste <strong>de</strong> la acción preventiva<br />

se hace tan pequeño que llega a ser rentable una acción<br />

preventiva permanente haciendo que el sistema sea obsoleto.<br />

• Del mismo modo si R > P c , y a medida que R aumenta, el sistema<br />

pier<strong>de</strong> más lentamente su valor económico a costa <strong>de</strong> ir aumentando<br />

u p para reducir las falsas alarmas hasta que, incapaz <strong>de</strong><br />

soportar más falsas alarmas, vuelve a hacerse obsoleto.<br />

Valor Economico<br />

Valor Economico<br />

Precipitación > [0.1] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

HK Score<br />

Pc: 0.28 HK Score(Pc)<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

R = Coste/Perdidas<br />

Precipitación > [10] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

HK Score<br />

Pc: 0.04<br />

HK Score(Pc)<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

I<br />

I<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

R = Coste/Perdidas<br />

II<br />

II<br />

Valor Economico<br />

Valor Economico<br />

Precipitación > [2] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

HK Score<br />

Pc: 0.17<br />

HK Score(Pc)<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

R = Coste/Perdidas<br />

Precipitación > [20] mm, 184 localida<strong>de</strong>s, PPS: ProMeteo<br />

1<br />

HK Score<br />

Pc: 0.01<br />

HK Score(Pc)<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

I<br />

I<br />

II<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

R = Coste/Perdidas<br />

II<br />

Figura 4.10: Curvas <strong>de</strong> valor económico para diferentes eventos. Para costes bajos<br />

es mejor el sistema I, pero para costes altos es mejor el sistema II.<br />

La validación <strong>de</strong> predicciones realizadas sobre un dominio espacial (una<br />

región, rejilla, o conjunto <strong>de</strong> estaciones) se suelen realizar promediando resultados<br />

espacialmente, o hallando los percentiles espaciales (sobre las estaciones)<br />

<strong>de</strong> los índices. Recientemente se han presentado distintas técnicas que<br />

no promedian los resultados. Por ejemplo Briggs and Levine (1997) presentan<br />

una medida utilizando wavelets para caracterizar la estructura espacial<br />

<strong>de</strong> los errores.


84 4. VALIDACIÓN DE PREDICCIONES PROBABILÍSTICAS


Parte II<br />

Aportaciones <strong>de</strong> la Tesis<br />

85


CAPÍTULO 5<br />

Predicción Local en el Corto Plazo con Técnicas <strong>de</strong><br />

<strong>Agrupamiento</strong><br />

5.1. Introducción<br />

En la actualidad, los servicios meteorológicos utilizan mo<strong>de</strong>los atmosféricos<br />

operativos que simulan con bastante precisión la dinámica <strong>de</strong> la atmósfera<br />

a gran escala sobre rejillas <strong>de</strong> una resolución aproximada <strong>de</strong> 50 a 100 km<br />

(ver Cap. 2). Estos mo<strong>de</strong>los permiten pre<strong>de</strong>cir con bastante pericia el comportamiento<br />

sinóptico <strong>de</strong> la atmósfera en el corto plazo (hasta tres días <strong>de</strong><br />

antelación). Sin embargo, estos mo<strong>de</strong>los poseen menos pericia para pre<strong>de</strong>cir<br />

ciertas variables, como la precipitación, que <strong>de</strong>pen<strong>de</strong>n <strong>de</strong> procesos físicos<br />

complejos, como la formación <strong>de</strong> nubes, evaporación, orografía, turbulencia,<br />

etc., que tienen una escala menor que los mo<strong>de</strong>los (o incluso carecen <strong>de</strong> una<br />

escala característica) y cuya física no es fácil <strong>de</strong> resolver. Esto obliga a incluir<br />

estos procesos en los mo<strong>de</strong>los mediante parametrizaciones, que aproximan<br />

los efectos <strong>de</strong> estos fenómenos a la escala <strong>de</strong> la rejilla empleada (ver Sec.<br />

2.3.2). Por tanto, la predicción a corto plazo <strong>de</strong> meteoros como la precipitación,<br />

niebla, tormenta, etc., es todavía un problema a resolver con enorme<br />

interés científico, social y económico.<br />

En la literatura se han propuesto diferentes métodos para abordar este<br />

problema <strong>de</strong>s<strong>de</strong> distintas perspectivas, utilizando no sólo las predicciones<br />

<strong>de</strong> los mo<strong>de</strong>los numéricos, sino también las series temporales <strong>de</strong> observaciones<br />

disponibles en la región o localidad <strong>de</strong> interés. Estos métodos podrían<br />

clasificarse en tres gran<strong>de</strong>s grupos:<br />

Las técnicas <strong>de</strong> predicción estadística para series temporales, que se<br />

basan únicamente en la información proce<strong>de</strong>nte <strong>de</strong> las observaciones<br />

históricas <strong>de</strong> los meteoros en las localida<strong>de</strong>s o puntos geográficos don<strong>de</strong><br />

87


88 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

se <strong>de</strong>sea realizar la predicción. Con esta información se pue<strong>de</strong>n estimar<br />

mo<strong>de</strong>los estadísticos <strong>de</strong> predicción (mo<strong>de</strong>los autoregresivos, <strong>de</strong><br />

Markov, etc.) que pue<strong>de</strong>n ser posteriormente utilizados para pre<strong>de</strong>cir<br />

futuros valores y ten<strong>de</strong>ncias. Estos métodos son estadísticos y no utilizan<br />

las salidas numéricas <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> circulación atmosférica.<br />

Por otra parte, las técnicas <strong>de</strong> downscaling dinámico (o incremento<br />

dinámico <strong>de</strong> resolución) tienen como propósito aumentar la resolución<br />

<strong>de</strong> los mo<strong>de</strong>los atmosféricos globales, anidando a éstos un mo<strong>de</strong>lo atmosférico<br />

regional o mesoescalar limitado a la zona <strong>de</strong> interés. Para<br />

ello se usan los campos <strong>de</strong>l mo<strong>de</strong>lo global como condiciones <strong>de</strong> contorno<br />

para el mo<strong>de</strong>lo regional o mesoescalar <strong>de</strong> mayor resolución, el cual<br />

incluye parametrizaciones adaptadas a la zona. Por tanto, la predicción<br />

local se limita a los valores <strong>de</strong> algunas variables que proporciona<br />

el mo<strong>de</strong>lo (temperatura, precipitación, etc.) en los puntos <strong>de</strong> rejilla<br />

en superficie. Estos métodos son esencialmente numéricos (basados<br />

en la integración <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> circulación atmosférica), aunque en<br />

ocasiones se utilizan técnicas estadísticas, como los filtros <strong>de</strong> Kalman<br />

(Bergman and Delleur, 1985), para eliminar la influencia <strong>de</strong> los errores<br />

sistemáticos <strong>de</strong>l mo<strong>de</strong>lo global.<br />

Finalmente, los llamados métodos <strong>de</strong> downscaling estadístico son técnicas<br />

híbridas que combinan las salidas <strong>de</strong> los mo<strong>de</strong>los numéricos con la<br />

información estadística <strong>de</strong> las observaciones. Estas técnicas se basan<br />

en la relación que existe entre los campos atmosféricos previstos por<br />

un mo<strong>de</strong>lo numérico <strong>de</strong>l tiempo y los meteoros realmente ocurridos<br />

localmente. Esta relación se pue<strong>de</strong> analizar estadísticamente utilizando<br />

los registros históricos <strong>de</strong> observaciones disponibles (en una región<br />

o punto <strong>de</strong> interés) y los correspondientes campos atmosféricos simulados<br />

por algún proyecto <strong>de</strong> re-análisis (ver Sec. 2.7). Estos métodos<br />

también pue<strong>de</strong>n consi<strong>de</strong>rarse técnicas <strong>de</strong> interpolación avanzadas, pues<br />

estiman el valor <strong>de</strong> una variable en un punto a partir <strong>de</strong> los valores en<br />

una rejilla que lo contiene.<br />

En esta Tesis se analizan las técnicas estadísticas <strong>de</strong> series temporales y<br />

las híbridas que combinan éstas con predicciones <strong>de</strong> los mo<strong>de</strong>los atmosféricos<br />

globales (el lector interesado en el downscaling dinámico pue<strong>de</strong> consultar las<br />

referencias incluidas en la Sec. 2.4). En concreto, se presentan algunos resultados<br />

comparativos que muestran la superioridad <strong>de</strong> los mo<strong>de</strong>los híbridos<br />

y se introduce un nuevo método, basado en técnicas <strong>de</strong> agrupamiento, que<br />

mejora a los algoritmos actuales en velocidad <strong>de</strong> cómputo y en la pericia <strong>de</strong><br />

las predicciones <strong>de</strong> eventos poco probables.<br />

En la Sec. 5.2 se <strong>de</strong>scriben las técnicas <strong>de</strong> predicción estadística lineales y<br />

no lineales estándar para series temporales, y se muestran sus aplicaciones en<br />

el ámbito <strong>de</strong> la Meteorología. A continuación, la Sec. 5.3 <strong>de</strong>scribe en <strong>de</strong>talle<br />

el problema <strong>de</strong>l downscaling y analiza las técnicas lineales, neuronales y


5.2. TÉCNICAS ESTADÍSTICAS PARA SERIES TEMPORALES 89<br />

locales que han sido propuestas en la literatura para abordar este problema.<br />

Finalmente, la Sec. 5.4 <strong>de</strong>scribe un nuevo método <strong>de</strong>sarrollado en esta Tesis<br />

y compara su eficiencia con otras técnicas en el marco <strong>de</strong> la predicción a<br />

corto plazo.<br />

5.2. Técnicas Estadísticas para Series Temporales<br />

La predicción local <strong>de</strong> meteoros pue<strong>de</strong> abordarse como un problema <strong>de</strong><br />

series temporales: Dada una serie <strong>de</strong> observaciones x 1 , . . .,x N <strong>de</strong> una cierta<br />

variable (por ejemplo, la precipitación diaria en una localidad), se <strong>de</strong>sea pre<strong>de</strong>cir<br />

el estado futuro <strong>de</strong> la misma x N+1 , . . .. En la actualidad se dispone <strong>de</strong><br />

series históricas homogéneas y suficientemente largas (ver Sec. 2.7), por lo<br />

que es posible aplicar técnicas estándar <strong>de</strong> series temporales a este problema.<br />

Por ejemplo, las técnicas lineales autoregresivas tratan <strong>de</strong> explicar la estructura<br />

<strong>de</strong> la serie temporal <strong>de</strong> forma que el valor actual <strong>de</strong> la serie <strong>de</strong>penda<br />

<strong>de</strong> los valores inmediatamente anteriores y <strong>de</strong> una componente aleatoria ɛ n<br />

<strong>de</strong> media zero y varianza σ 2 (ver, por ejemplo, Box and Jenkins, 1976). Así,<br />

un proceso x n se dice que es un proceso autoregresivo <strong>de</strong> or<strong>de</strong>n p (AR(p)) si<br />

x n = α 1 x n−1 + α 2 x n−2 + ... + α p x n−p + ɛ n , (5.1)<br />

don<strong>de</strong> α 1 , . . .,α p son los parámetros <strong>de</strong>l mo<strong>de</strong>lo. Suponiendo que el proceso<br />

es estacionario y <strong>de</strong> varianza finita, estos parámetros pue<strong>de</strong>n obtenerse a<br />

partir las ecuaciones <strong>de</strong> Yule-Walker, que relacionan la función <strong>de</strong> autocorrelación<br />

ρ(k) con los parámetros <strong>de</strong>l mo<strong>de</strong>lo:<br />

p∑<br />

ρ(k) = α m ρ(k − m). (5.2)<br />

m=1<br />

Aparte <strong>de</strong> los mo<strong>de</strong>los autoregresivos, han sido propuestas numerosas variantes<br />

<strong>de</strong> mo<strong>de</strong>los <strong>de</strong> series temporales en la literatura, cada una <strong>de</strong> las<br />

cuales incorpora un nuevo elemento para mo<strong>de</strong>lizar el comportamiento <strong>de</strong> la<br />

serie: Mo<strong>de</strong>los <strong>de</strong> media móvil (MA), que incorporan efectos <strong>de</strong> retraso en<br />

los términos aleatorios; mo<strong>de</strong>los ARMA, que son combinación <strong>de</strong> los mo<strong>de</strong>los<br />

autoregresivos y <strong>de</strong> los <strong>de</strong> media móvil; mo<strong>de</strong>los ARIMA, que permiten<br />

tratar series no estacionarias en la media; SARIMA, que incluyen componentes<br />

periódicas estacionales, etc. (ver Chatfield, 2003, para una <strong>de</strong>scripción<br />

actualizada <strong>de</strong> estos mo<strong>de</strong>los).<br />

Estos mo<strong>de</strong>los han sido aplicados en Meteorología con cierto éxito en<br />

escalas <strong>de</strong> tiempo mensual o estacional, don<strong>de</strong> los promedios <strong>de</strong> las variables<br />

son aproximadamente gaussianos. Por ejemplo, Zwiers and von Storch<br />

(1990) emplean un mo<strong>de</strong>lo AR para la mo<strong>de</strong>lización <strong>de</strong>l patrón El Niño/Oscilación<br />

<strong>de</strong>l Sur (ENSO); por otra parte Verma et al. (2002) utilizan un mo<strong>de</strong>lo<br />

ARIMA para caracterizar medias mensuales <strong>de</strong> precipitación. Sin embargo,<br />

dado que la mayoría <strong>de</strong> las variables meteorológicas son no gaussianas en el<br />

corto plazo, estas técnicas son ina<strong>de</strong>cuadas para la predicción local aplicada


90 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

a esta escala temporal. Para solventar este problema, se han introducido<br />

distintas extensiones no lineales <strong>de</strong> los mo<strong>de</strong>los autoregresivos; por ejemplo,<br />

Buhamra et al. (2003) analizan en <strong>de</strong>talle las propieda<strong>de</strong>s <strong>de</strong> distintas<br />

extensiones basadas en re<strong>de</strong>s neuronales; por otra parte, Furundzic (1998)<br />

aplica con cierto éxito uno <strong>de</strong> estos mo<strong>de</strong>los autoregresivos neuronales para<br />

la predicción <strong>de</strong> escorrentías (ver Masters, 1995, para una <strong>de</strong>scripción general<br />

<strong>de</strong> este tipo <strong>de</strong> técnicas). Sin embargo, como se verá más a<strong>de</strong>lante,<br />

estos mo<strong>de</strong>los no consiguen alcanzar la pericia <strong>de</strong> otras técnicas híbridas <strong>de</strong><br />

predicción local.<br />

En el ámbito <strong>de</strong> la predicción probabilística también han sido aplicadas<br />

distintas técnicas estocásticas para pronosticar la probabilidad <strong>de</strong><br />

un cierto evento meteorológico (por ejemplo la ocurrencia o no <strong>de</strong> lluvia<br />

“Precip > 0.5mm”; <strong>de</strong> vientos fuertes “Racha > 80km/h”, etc.). Las ca<strong>de</strong>nas<br />

<strong>de</strong> Markov han sido utilizadas profusamente en este campo, comenzando<br />

con Gabriel and Neumann (1962) que <strong>de</strong>sarrollaron un mo<strong>de</strong>lo probabilístico<br />

<strong>de</strong> precipitación para Tel Aviv. Posteriormente, el uso <strong>de</strong> estos<br />

mo<strong>de</strong>los se ha extendido a la predicción <strong>de</strong> eventos más complejos, como<br />

el día <strong>de</strong> comienzo <strong>de</strong> lluvias (el primer día que lloverá a partir <strong>de</strong> la fecha<br />

actual), o el primer día que se superará un cierto umbral <strong>de</strong> precipitación<br />

(Stern, 1982). Estos mo<strong>de</strong>los estocásticos también se han combinado<br />

con técnicas <strong>de</strong> simulación (tipo Monte Carlo) para generar simulaciones<br />

numéricas <strong>de</strong> series <strong>de</strong> precipitación. Para cada día, primero se simula la<br />

ocurrencia o no <strong>de</strong> lluvia utilizando un mo<strong>de</strong>lo <strong>de</strong> Markov (generalmente<br />

<strong>de</strong> or<strong>de</strong>n uno); en el caso <strong>de</strong> ocurrencia, se simula a continuación un valor<br />

numérico para la misma a partir <strong>de</strong> la distribución empírica <strong>de</strong> la cantidad<br />

<strong>de</strong> precipitación. Estos métodos se conocen como generadores <strong>de</strong> tiempo<br />

(weather generators) (ver Wilby and Wilks, 1999, y las referencias incluidas).<br />

A<strong>de</strong>más <strong>de</strong> las ca<strong>de</strong>nas <strong>de</strong> Markov, también han sido aplicados otros<br />

métodos estocásticos a estos problemas: procesos continuos puntuales (point<br />

process) (Rodriguez-Iturbe et al., 1987), procesos <strong>de</strong> renovación (Markov renewal<br />

process) (Faufoula-Georgiou and Lettenmaier, 1987), etc.<br />

Para ilustrar la aplicación <strong>de</strong> estas técnicas en la predicción local se<br />

ha realizado un sencillo experimento consistente en pronosticar la probabilidad<br />

<strong>de</strong>l evento “Precip > 0.5mm” (es <strong>de</strong>cir, ocurrencia <strong>de</strong> lluvia). Se<br />

ha consi<strong>de</strong>rado la serie diaria <strong>de</strong> precipitaciones en Santan<strong>de</strong>r durante los<br />

inviernos (Noviembre-Enero) <strong>de</strong>l período 1979-2000. Con esta serie se han<br />

ajustado los parámetros <strong>de</strong> un mo<strong>de</strong>lo autoregresivo neuronal (una red multicapa<br />

5:3:1, con activación sigmoidal <strong>de</strong> rango [0, 1] en la salida; ver Sec.<br />

3.5) y un mo<strong>de</strong>lo <strong>de</strong> Markov <strong>de</strong> or<strong>de</strong>n 5. Las entradas <strong>de</strong> la red neuronal<br />

son los valores numéricos <strong>de</strong> la precipitación en los cinco días previos al día<br />

<strong>de</strong> predicción y su salida es la probabilidad <strong>de</strong> ocurrencia <strong>de</strong>l evento binario<br />

Precip > 0.5mm (ceros y unos en la muestra <strong>de</strong> entrenamiento); por<br />

otra parte, la ca<strong>de</strong>na <strong>de</strong> Markov es generada consi<strong>de</strong>rando la serie <strong>de</strong> datos<br />

binaria obtenida discretizando la serie según la ocurrencia o no ocurrencia<br />

<strong>de</strong>l evento. Los resultados se comparan con los obtenidos por una técnica


5.2. TÉCNICAS ESTADÍSTICAS PARA SERIES TEMPORALES 91<br />

híbrida <strong>de</strong> downscaling estadístico que combina la información <strong>de</strong> las series<br />

temporales con las salidas <strong>de</strong> mo<strong>de</strong>los numéricos atmosféricos globales (se<br />

trata <strong>de</strong> una técnica basada en vecinos cercanos, que se <strong>de</strong>scribirá en la Sec.<br />

5.4). La Fig. 5.1 muestra el valor real (observación), así como las probabilida<strong>de</strong>s<br />

predichas por los mo<strong>de</strong>los anteriores para los tres meses <strong>de</strong> invierno<br />

<strong>de</strong>l año 2001. Esta figura pone <strong>de</strong> manifiesto la utilidad <strong>de</strong> las salidas <strong>de</strong> los<br />

mo<strong>de</strong>los atmosféricos numéricos <strong>de</strong> predicción, combinados con las técnicas<br />

estadísticas (downscaling estadístico). Una comparación más extensa <strong>de</strong><br />

estas técnicas pue<strong>de</strong> encontrarse en Gutiérrez et al. (2002c).<br />

Observacioón Local Neuronal Markov<br />

probabilidad<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

10 20 30 40 50 60 70 80 90<br />

día<br />

Figura 5.1: Valor observado y probabilida<strong>de</strong>s predichas con un mo<strong>de</strong>lo neuronal,<br />

una ca<strong>de</strong>na <strong>de</strong> Markov y un método híbrido (local) para la ocurrencia <strong>de</strong> precipitación<br />

durante los tres meses <strong>de</strong> invierno <strong>de</strong>l año 2001.<br />

5.2.1. Series Caóticas. Técnicas <strong>de</strong> Inmersión (Embedding).<br />

En los últimos años, el análisis <strong>de</strong> series temporales caóticas ha cobrado<br />

un fuerte interés <strong>de</strong>bido a sus múltiples aplicaciones (ver, por ejemplo,<br />

Abarbanel, 1995). Las técnicas clásicas autoregresivas <strong>de</strong> análisis <strong>de</strong> series<br />

temporales <strong>de</strong>scritas en la sección anterior han sido generalizadas teniendo<br />

en cuenta las propieda<strong>de</strong>s dinámicas <strong>de</strong> los sistemas caóticos. Des<strong>de</strong> un<br />

punto <strong>de</strong> vista práctico, el avance más importante en este campo ha sido la<br />

llamada técnica <strong>de</strong> inmersión o embedding (Sauer, 1994), que supone que la<br />

serie temporal proviene <strong>de</strong> un sistema dinámico <strong>de</strong>terminista (por ejemplo,<br />

una ecuación diferencial) <strong>de</strong>finido en un conjunto <strong>de</strong> variables que componen<br />

su espacio <strong>de</strong> fases:<br />

dx(t)<br />

= F(x(t)), (5.3)<br />

dt<br />

Una serie temporal x 1 ,x 2 , . . .,x N tomada <strong>de</strong>l sistema caótico respon<strong>de</strong>rá<br />

a la relación funcional <strong>de</strong>l sistema (5.3). Por tanto, con técnicas apropiadas<br />

se podrá obtener un mo<strong>de</strong>lo aproximado <strong>de</strong>l mismo. Sin embargo, en<br />

la práctica no suele ser posible medir todas las variables que componen el<br />

espacio <strong>de</strong> fases <strong>de</strong> un sistema, sino que sólo se tiene acceso a observables<br />

<strong>de</strong>rivados <strong>de</strong> estas variables o(t) = G(x(t)); por ejemplo, no se pue<strong>de</strong>n medir


92 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

todos los grados <strong>de</strong> libertad que componen la atmósfera, pero se dispone <strong>de</strong><br />

la medición <strong>de</strong> algunas variables <strong>de</strong>rivadas (precipitación, temperatura, etc.)<br />

en puntos concretos. En estos casos, la técnica <strong>de</strong>l <strong>de</strong>lay-embedding ofrece<br />

una forma <strong>de</strong> reconstruir un espacio <strong>de</strong> fases topológicamente equivalente al<br />

original, tomando vectores <strong>de</strong> retrasos temporales <strong>de</strong>l observable <strong>de</strong> la forma:<br />

(o(t), o(t−τ), ..., o(t−(m−1)τ)), don<strong>de</strong> o(t) es el valor <strong>de</strong>l observable en<br />

el tiempo t y los parámetros τ y m son el salto y la dimensión <strong>de</strong> embedding,<br />

respectivamente. Bajo ciertas condiciones (Sauer, 1994), existe un difeomorfismo<br />

(aplicación biyectiva, diferenciable y con inversa diferenciable) entre<br />

el espacio <strong>de</strong> fases original y el espacio <strong>de</strong> embedding resultante, <strong>de</strong> forma<br />

que la evolución <strong>de</strong>l sistema en el espacio <strong>de</strong> fases pue<strong>de</strong> ser <strong>de</strong>terminada<br />

a partir <strong>de</strong> una función en el espacio <strong>de</strong> embedding. De este modo se tiene<br />

una relación funcional <strong>de</strong> la forma:<br />

o(t) = G(x(t)) = H(o(t − τ), ..., o(t − (m − 1)τ)), (5.4)<br />

don<strong>de</strong> H será la función compuesta dada por el difeomorfismo G, la función<br />

<strong>de</strong> evolución <strong>de</strong>l sistema dinámico y la función característica <strong>de</strong>l observable.<br />

Los parámetros τ y m han <strong>de</strong> elegirse a<strong>de</strong>cuadamente para que el espacio<br />

resultante sea topológicamente equivalente al espacio <strong>de</strong> fases original. Para<br />

la dimensión <strong>de</strong> embedding se ha hallado la cota teórica m < 2D +1, don<strong>de</strong><br />

D es la dimensión <strong>de</strong>l atractor <strong>de</strong>l sistema original. A este valor <strong>de</strong> m se<br />

le <strong>de</strong>nomina “dimension <strong>de</strong> embedding” <strong>de</strong>l sistema dinámico. El intervalo<br />

temporal τ es arbitrario <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista teórico; sin embargo, una<br />

mala elección obligará a tomar más retrasos <strong>de</strong> los necesarios. En la práctica,<br />

una forma sencilla <strong>de</strong> seleccionar τ es garantizar la in<strong>de</strong>pen<strong>de</strong>ncia lineal entre<br />

sucesivos retrasos; para ello se pue<strong>de</strong> utilizar la función <strong>de</strong> autocorrelación<br />

o la información mutua <strong>de</strong> la serie (ver Abarbanel, 1995, para más <strong>de</strong>talles).<br />

Para ilustrar esta técnica se consi<strong>de</strong>ra el mo<strong>de</strong>lo <strong>de</strong> Lorenz <strong>de</strong>scrito en el<br />

Ejemplo 3.9, y se supone que sólo se dispone <strong>de</strong> un observable <strong>de</strong>l sistema:<br />

Una serie temporal <strong>de</strong> 5000 puntos <strong>de</strong> la variable x, obtenida integrando<br />

el sistema con un método <strong>de</strong> Runge-Kutta <strong>de</strong> cuarto or<strong>de</strong>n y paso <strong>de</strong> integración<br />

∆t = 10 −2 . La Fig. 5.2 muestra una proyección <strong>de</strong>l espacio <strong>de</strong><br />

embedding dado por τ = 10 y m = 4; se observa la similitud topológica con<br />

el atractor real <strong>de</strong>l sistema mostrado en la Fig. 3.21. Por tanto, se pue<strong>de</strong><br />

aplicar una red neuronal para tratar <strong>de</strong> mo<strong>de</strong>lizar la dinámica <strong>de</strong>l sistema<br />

en el espacio <strong>de</strong> retrasos. La Fig. 5.3 muestra el error obtenido por una red<br />

neuronal 4:3:3:1 entrenada para estimar x n utilizando x n−τ , x n−2τ , x n−3τ y<br />

x n−4τ . En este caso, el tiempo <strong>de</strong> predicción es τ (en este ejemplo τ correspon<strong>de</strong><br />

al mínimo retraso tomado: n = 10 ó t = 10 ∗ 10 −2 = 0.1 unida<strong>de</strong>s <strong>de</strong><br />

tiempo).<br />

Si se trata <strong>de</strong> utilizar este mismo mo<strong>de</strong>lo para pre<strong>de</strong>cir el valor <strong>de</strong>l sistema<br />

a tiempos más largos (iterando el sistema con las predicciones obtenidas),<br />

existe un horizonte a partir <strong>de</strong>l cual el sistema aproximado ya no sigue la<br />

misma dinámica <strong>de</strong>l original. Por ejemplo, en la Fig. 5.4 se muestra la predicción<br />

obtenida por la red neuronal para umbrales <strong>de</strong> tiempo mayores. En


5.2. TÉCNICAS ESTADÍSTICAS PARA SERIES TEMPORALES 93<br />

20<br />

xn<br />

0<br />

-15<br />

20<br />

xn-τ<br />

0<br />

-20 -15<br />

0<br />

x n-2τ<br />

20<br />

Figura 5.2: Atractor en el espacio <strong>de</strong> embedding obtenido a partir <strong>de</strong> un serie<br />

temporal <strong>de</strong> la variable x <strong>de</strong>l sistema <strong>de</strong> Lorenz.<br />

15<br />

10<br />

5<br />

xn<br />

0<br />

xn -xn<br />

-5<br />

-10<br />

-15<br />

0.1<br />

0<br />

0.1<br />

1 100 200 300 400 500<br />

n<br />

Figura 5.3: Serie temporal real x n y error obtenido con la estimación ˆx n dada por<br />

una red neuronal 4:3:3:1 (la abscisa <strong>de</strong> la figura inferior está magnificada un factor<br />

50 para claridad <strong>de</strong> la visualización).<br />

xn ,xn<br />

15<br />

10<br />

5<br />

0<br />

-5<br />

-10<br />

-15<br />

20 21 22 23 24 25 26 27<br />

Figura 5.4: Serie original <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> Lorenz (trazo grueso) y serie obtenida<br />

prolongando la red neuronal a partir <strong>de</strong> la misma condición inicial.<br />

n


94 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

esta figura, tanto la red neuronal como el sistema <strong>de</strong> Lorenz son inicializados<br />

en un instante <strong>de</strong> tiempo y prolongados <strong>de</strong> forma in<strong>de</strong>pendiente. Las<br />

trayectorias <strong>de</strong> ambos sistemas siguen la misma evolución hasta un tiempo<br />

t = 1.8 en que comienzan a diverger, marcando el umbral <strong>de</strong> predicción en<br />

este caso. En Cofiño et al. (2003b) se presenta un estudio más exhaustivo<br />

sobre la capacidad <strong>de</strong> predicción <strong>de</strong> las re<strong>de</strong>s neuronales en este campo.<br />

Para aplicar este tipo <strong>de</strong> técnicas a datos meteorológicos es necesario<br />

consi<strong>de</strong>rar la atmósfera como un sistema caótico <strong>de</strong> baja dimensión<br />

(Tsonis and Elsner, 1988). Un observable pue<strong>de</strong> ser la temperatura medida<br />

en una estación meteorológica (Oviedo). La Fig. 5.5(a) muestra la serie<br />

temporal <strong>de</strong> la temperatura media horaria registrada en Oviedo entre los<br />

años 1979 y 1993. En la figura sólo se han representado 3 años para observar<br />

con claridad la onda anual, con los correspondiente máximos <strong>de</strong> temperatura<br />

alcanzados en la época estival. En la gráfica superior se ha ampliado una<br />

zona <strong>de</strong> la serie temporal para mostrar la onda diurna.<br />

200<br />

150<br />

100<br />

50<br />

0<br />

30<br />

(a)<br />

1.12 1.13 1.14 1.15 1.16 1.17<br />

x 10 4<br />

20<br />

ºC<br />

10<br />

0<br />

10<br />

(b)<br />

5<br />

0<br />

-5<br />

-10<br />

x 10 4<br />

0 0.5 1 1.5 2 2.5<br />

n<br />

Figura 5.5: Temperatura media horaria tomada en el observatorio <strong>de</strong> Oviedo entre<br />

los años 1979 y 1981.<br />

Como pue<strong>de</strong> observarse en este ejemplo, la situación real cuando se trabaja<br />

con datos meteorológicos no es sencilla, pues la serie contiene varias<br />

componentes periódicas (onda anual, diurna, etc.) y ruido, a<strong>de</strong>más <strong>de</strong> la<br />

componente no lineal. Las componentes periódicas pue<strong>de</strong>n separarse fácilmente<br />

(ver Fig. 5.5(b)), pero el efecto <strong>de</strong>l ruido complica la aplicación <strong>de</strong><br />

la técnica <strong>de</strong> embedding. Por ejemplo, la Fig. 5.6 muestra el espacio <strong>de</strong> inmersión<br />

para el ejemplo <strong>de</strong> la temperatura en Oviedo, consi<strong>de</strong>rando tanto la<br />

señal original, como la señal obtenida eliminando la onda anual. En esta última<br />

figura resulta difícil observar alguna dinámica <strong>de</strong>terminista. Este hecho


5.3. TÉCNICAS HÍBRIDAS (DOWNSCALING ESTADÍSTICO) 95<br />

se pue<strong>de</strong> comprobar <strong>de</strong> forma práctica comparando un mo<strong>de</strong>lo no lineal neuronal<br />

y uno lineal entrenados con los datos. Las distintas pruebas realizadas<br />

no mostraron ninguna diferencia significativa entre ambos mo<strong>de</strong>los.<br />

35<br />

30<br />

(a)<br />

15<br />

10<br />

(b)<br />

25<br />

20<br />

5<br />

T(t)<br />

15<br />

T(t)<br />

0<br />

10<br />

5<br />

5<br />

0<br />

0 5 10 15 20 25 30 35<br />

T(t-6)<br />

10<br />

10 5 0 5 10 15<br />

T(t-6)<br />

Figura 5.6: (a) Espacio <strong>de</strong> inmersión (T(t),T(t −6)) para la serie <strong>de</strong> temperaturas<br />

<strong>de</strong> Oviedo. (b) Espacio <strong>de</strong> inmersión para la serie anterior restando una media móvil<br />

(T(i − 24),T(i),T(i + 24)) para eliminar la componente anual.<br />

Por otra parte, la hipótesis <strong>de</strong> la baja dimensionalidad <strong>de</strong> la atmósfera es<br />

bastante cuestionable (Lorenz, 1991) y los mo<strong>de</strong>los <strong>de</strong>sarrollados no se han<br />

mostrado competitivos con otras técnicas. No obstante, en algunas aplicaciones,<br />

estas técnicas han mostrado una gran utilidad en combinación con<br />

mo<strong>de</strong>los numéricos. Por ejemplo, Pérez-Muñuzuri and Gelpi (2000) presentan<br />

un mo<strong>de</strong>lo <strong>de</strong> predicción basado en esta técnica para la cubierta nubosa,<br />

y muestra como estas predicciones pue<strong>de</strong>n ser utilizadas por un mo<strong>de</strong>lo<br />

numérico mesoscalar (ARPS) para mejorar la capacidad <strong>de</strong> predicción <strong>de</strong>l<br />

mismo.<br />

Los recientes avances en el campo <strong>de</strong>l caos espacio-temporal suponen<br />

una prometedora línea <strong>de</strong> trabajo para po<strong>de</strong>r llegar a mo<strong>de</strong>lizar la dinámica<br />

atmosférica <strong>de</strong> forma más sólida y global (Gollub and Cross, 2000), sin<br />

tener que recurrir a hipótesis simplistas como la baja dimensionalidad <strong>de</strong> la<br />

atmósfera.<br />

5.3. Técnicas Híbridas (Downscaling Estadístico)<br />

En la sección anterior se han <strong>de</strong>scrito distintas técnicas <strong>de</strong> predicción que<br />

se aplican directamente a observaciones (series temporales) para pre<strong>de</strong>cir<br />

ten<strong>de</strong>ncias y/o futuras ocurrencias <strong>de</strong> eventos. Sin embargo, estas técnicas<br />

no aprovechan el conocimiento sobre la dinámica <strong>de</strong> la atmósfera contenido<br />

en los mo<strong>de</strong>los numéricos <strong>de</strong> circulación atmosférica. Las predicciones <strong>de</strong><br />

estos mo<strong>de</strong>los proporcionan los valores <strong>de</strong> un conjunto <strong>de</strong> variables fundamentales<br />

(temperatura, presión, humedad, etc.) para un alcance dado sobre<br />

una rejilla 3D con una cierta resolución horizontal y vertical (ver Sec. 2.4).


96 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

A<strong>de</strong>más, en el nivel <strong>de</strong> superficie, el mo<strong>de</strong>lo también proporciona el valor <strong>de</strong><br />

algunas variables <strong>de</strong>rivadas (precipitación, etc.). Éstas son las variables que<br />

más afectan a la actividad humana y, por tanto, las que tienen mayor interés<br />

práctico. Sin embargo, las predicciones obtenidas por los mo<strong>de</strong>los numéricos<br />

para estas variables también están limitadas por la resolución y por la<br />

parametrizaciones físicas empleadas (que aproximan los efectos <strong>de</strong> algunos<br />

fenómenos como la turbulencia, orografía, etc., que afectan a las variables<br />

<strong>de</strong> superficie; ver Sec. 2.3.2).<br />

Dadas las limitaciones <strong>de</strong> ambas técnicas por separado, se han <strong>de</strong>sarrollado<br />

distintos métodos híbridos para combinar <strong>de</strong> forma apropiada ambas<br />

fuentes <strong>de</strong> información: observaciones (con información estadística sobre la<br />

climatología local) y salidas <strong>de</strong> mo<strong>de</strong>los numéricos (con las predicciones <strong>de</strong>l<br />

estado global <strong>de</strong> la atmósfera). Estas técnicas híbridas son <strong>de</strong>nominadas<br />

métodos <strong>de</strong> downscaling estadístico (ver, por ejemplo, Wilby and Wigley,<br />

1997; Zorita and von Storch, 1999). En este caso, en lugar <strong>de</strong> aumentar la<br />

resolución <strong>de</strong> la rejilla sobre la que se realiza la predicción (downscaling<br />

dinámico), se obtienen predicciones sobre aquellas regiones o puntos geográficos<br />

don<strong>de</strong> se disponga <strong>de</strong> observaciones. La Fig. 5.7 ilustra este problema<br />

para el caso concreto <strong>de</strong> la Cuenca Norte <strong>de</strong> la Península Ibérica.<br />

Figura 5.7: El problema <strong>de</strong> downscaling. La figura superior muestra la rejilla <strong>de</strong> un<br />

mo<strong>de</strong>lo numérico <strong>de</strong> 1 o <strong>de</strong> resolución horizontal (aprox. 100 km) sobre la Península<br />

Ibérica; la figura inferior muestra una ampliación <strong>de</strong> la cornisa Cantábrica <strong>de</strong>tallando<br />

los puntos <strong>de</strong> rejilla <strong>de</strong>l mo<strong>de</strong>lo numérico (‘×’), y los observatorios <strong>de</strong> la red<br />

principal (‘+’) y secundaria (triángulos) <strong>de</strong>l INM don<strong>de</strong> se dispone <strong>de</strong> observaciones<br />

históricas.


5.3. TÉCNICAS HÍBRIDAS (DOWNSCALING ESTADÍSTICO) 97<br />

5.3.1. Técnicas Globales Lineales y <strong>Neuronales</strong><br />

Los métodos híbridos <strong>de</strong> downscaling estadístico se basan en la relación<br />

que existe entre el estado <strong>de</strong> la atmósfera y los fenómenos meteorológicos<br />

observados en superficie y t en un instante <strong>de</strong> tiempo t. El estado <strong>de</strong> la<br />

atmósfera se pue<strong>de</strong> aproximar utilizando un mo<strong>de</strong>lo numérico <strong>de</strong> circulación,<br />

que proporciona los campos atmosféricos x t estimados para un tiempo<br />

t. Por tanto, se pue<strong>de</strong> analizar estadísticamente esta relación utilizando los<br />

registros históricos disponibles en un punto <strong>de</strong> interés, y los correspondientes<br />

campos atmosféricos simulados por un mo<strong>de</strong>lo numérico <strong>de</strong> re-análisis (ver<br />

Sec. 2.7). Este esquema se <strong>de</strong>nomina Perfect-Prog puesto que supone que el<br />

mo<strong>de</strong>lo atmosférico proporciona una representación fi<strong>de</strong>digna <strong>de</strong>l estado <strong>de</strong><br />

la atmósfera que no varía en el tiempo, al menos en la periodo <strong>de</strong>l re-análisis<br />

(ver Wilks, 1995, para una <strong>de</strong>scripción más <strong>de</strong>tallada). De esta forma, se pue<strong>de</strong><br />

entrenar un mo<strong>de</strong>lo global <strong>de</strong> regresión para estimar una relación lineal<br />

entre los datos ŷ t = ax t + b. Así, dado un patrón ˆx predicho por un mo<strong>de</strong>lo<br />

numérico para un cierto alcance, se tendrá una estimación aˆx + b <strong>de</strong>l valor<br />

<strong>de</strong> la variable local esperado. Algunas aplicaciones <strong>de</strong> esta técnica están <strong>de</strong>scritas<br />

en Enke and Spekat (1997) y Billet et al. (1997). Un problema <strong>de</strong> esta<br />

técnica es que, en general, los mo<strong>de</strong>los lineales son difícilmente justificables<br />

para la predicción a corto plazo dada la no normalidad <strong>de</strong> las variables a esta<br />

escala temporal. Las limitaciones <strong>de</strong> los métodos lineales han sido recientemente<br />

superadas consi<strong>de</strong>rando mo<strong>de</strong>los no-lineales más generales ŷ t = f(x t ),<br />

don<strong>de</strong> la forma funcional <strong>de</strong> f es ajustada usando técnicas no paramétricas<br />

mo<strong>de</strong>rnas (por ejemplo, re<strong>de</strong>s neuronales, Gardner and Dorling, 1998;<br />

McGinnis, 1994).<br />

Otra aproximación a este problema supone que los patrones atmosféricos<br />

disponibles no son una representación perfecta <strong>de</strong> la atmósfera, sino que<br />

<strong>de</strong>pen<strong>de</strong>n <strong>de</strong>l mo<strong>de</strong>lo numérico utilizado (por ejemplo, cada cambio realizado<br />

en el mo<strong>de</strong>lo atmosférico operativo con nuevos esquemas <strong>de</strong> asimilación<br />

o parametrizaciones tienen influencia directa en los campos previstos). La<br />

técnica conocida como Mo<strong>de</strong>l Output Statistics (MOS) (Klein and Glahn,<br />

1974) ajusta <strong>de</strong> forma dinámica un mo<strong>de</strong>lo <strong>de</strong> regresión entre los campos<br />

previstos por el mo<strong>de</strong>lo y las observaciones ocurridas, <strong>de</strong> forma que este<br />

mo<strong>de</strong>lo está continuamente actualizándose con las nuevas observaciones y<br />

predicciones disponibles. Este proceso se realiza <strong>de</strong> distintas formas, incluyendo<br />

filtros <strong>de</strong> Kalman (ver Bergman and Delleur, 1985, para más <strong>de</strong>talles).<br />

También han sido propuestas distintas extensiones no lineales <strong>de</strong> estos<br />

mo<strong>de</strong>los utilizando, por ejemplo, re<strong>de</strong>s neuronales (Yuval and Hsieh, 2003;<br />

Marzban, 2003). En este caso, el problema es la necesidad <strong>de</strong> disponer <strong>de</strong><br />

observaciones y salidas <strong>de</strong>l mo<strong>de</strong>lo recientes, que sean representativas <strong>de</strong> la<br />

configuración actual <strong>de</strong>l mismo. Esta imposición limita el número <strong>de</strong> estaciones<br />

sobre el que es posible aplicar las técnicas, ya que no se dispone <strong>de</strong><br />

información en tiempo real para la mayoría <strong>de</strong> las estaciones.<br />

Otro tipo <strong>de</strong> mo<strong>de</strong>los globales aplicados a este problema ha sido el


98 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

Análisis <strong>de</strong> Correlación Canónica (CCA, Canonical Correlation Analysis),<br />

que es una generalización <strong>de</strong> la regresión que tiene en cuenta las <strong>de</strong>pen<strong>de</strong>ncias<br />

espaciales existentes entre los distintos observatorios, tanto lineales<br />

(Bergman and Delleur, 1985), como no lineales (Hsieh, 2001); también<br />

han sido aplicadas recientemente técnicas <strong>de</strong> mo<strong>de</strong>los gráficos probabilísticos<br />

(re<strong>de</strong>s Bayesianas) para la predicción local <strong>de</strong> eventos discretos (ver, por<br />

ejemplo, Cofiño et al., 2002).<br />

El <strong>de</strong>nominador común <strong>de</strong> todos estos métodos es su carácter global (es<br />

<strong>de</strong>cir, se consi<strong>de</strong>ra un único mo<strong>de</strong>lo para analizar todas las situaciones que<br />

puedan presentarse). El método <strong>de</strong> los análogos, o vecinos próximos, supone<br />

una alternativa local a estos mo<strong>de</strong>los.<br />

5.3.2. Técnicas Locales basadas en Análogos<br />

El método <strong>de</strong> análogos introducido por Lorenz (1969) en el marco <strong>de</strong> la<br />

predicción <strong>de</strong> series temporales es una versión particular <strong>de</strong> una metodología<br />

más general llamada técnica <strong>de</strong> vecinos próximos (Nearest Neighbors, NN).<br />

Esta técnica utiliza el “entorno” <strong>de</strong>l patrón atmosférico previsto para entrenar<br />

un mo<strong>de</strong>lo local y obtener una predicción ŷ t . Este entorno viene dado<br />

por una distribución o núcleo <strong>de</strong>finido en el espacio continuo <strong>de</strong> patrones<br />

atmosféricos. En la práctica, el espacio <strong>de</strong> patrones atmosféricos se aproxima<br />

por la muestra aleatoria <strong>de</strong> patrones proporcionada por un re-análisis<br />

suficientemente largo (ver Sec. 2.7.3). Por ejemplo, utilizando ERA-15 se<br />

dispone <strong>de</strong> aproximadamente 5500 patrones atmosféricos diarios para aproximar<br />

el espacio <strong>de</strong> configuraciones atmosféricas. De esta forma, el núcleo se<br />

transforma en un vecindario en el nuevo espacio discreto. Por tanto, los mo<strong>de</strong>los<br />

locales se entrenan en base al conjunto <strong>de</strong> patrones atmosféricos más<br />

cercanos al patrón previsto. Este conjunto se <strong>de</strong>nomina conjunto <strong>de</strong> análogos<br />

y está formado por los k días más próximos al patrón previsto en la base<br />

<strong>de</strong> datos <strong>de</strong>l re-análisis (k nearest neighbors, k-NN). La Fig. 5.8 muestra un<br />

esquema con las componentes fundamentales <strong>de</strong> este tipo <strong>de</strong> algoritmos.<br />

En esta figura pue<strong>de</strong> observarse que es necesaria una base <strong>de</strong> datos con<br />

los patrones atmosféricos y otra con los registros históricos <strong>de</strong> la climatología<br />

local. El algoritmo parte <strong>de</strong> una predicción numérica <strong>de</strong>l patrón atmosférico<br />

previsto, y obtiene una predicción local para los observatorios disponibles.<br />

Las zonas sombreadas representan las componentes <strong>de</strong>l algoritmo implicadas<br />

en la fase operativa <strong>de</strong> obtención <strong>de</strong> predicciones locales.<br />

Algunas aplicaciones <strong>de</strong> este método para la predicción <strong>de</strong> anomalías<br />

climáticas (ver Zorita and von Storch, 1999; Wilby and Wigley, 1997, y sus<br />

referencias) y para la predicción a corto plazo (ver p.e., van <strong>de</strong>n Dool, 1989)<br />

se han presentado en la literatura. En general, se ha <strong>de</strong>mostrado que el método<br />

<strong>de</strong> análogos funciona tan bien como otras técnicas más complicadas <strong>de</strong><br />

downscaling (ver, por ejemplo, Zorita and von Storch, 1999), indicando que<br />

estos métodos <strong>de</strong> “hombre pobre” son alternativas eficientes para diversos<br />

problemas <strong>de</strong> downscaling.


5.3. TÉCNICAS HÍBRIDAS (DOWNSCALING ESTADÍSTICO) 99<br />

ACM FORECAST<br />

1979<br />

1993<br />

...<br />

ATMOSPHERIC<br />

PATTERNS<br />

DATABASE<br />

ERA15<br />

reanalisys<br />

1979-1993<br />

ECMWF<br />

operative mo<strong>de</strong>l<br />

Ensemble of<br />

analog dates<br />

d 1 , ..., d k<br />

1979<br />

...<br />

INM primary<br />

stationÕs network<br />

Estimation: y<br />

1993<br />

LOCAL CLIMATE<br />

RECORDS DATABASE<br />

Figura 5.8: Esquema <strong>de</strong>l algoritmo estándar <strong>de</strong> downscaling por análogos (k-NN).<br />

5.3.3. Comparación <strong>de</strong> Técnicas Estándar en el Corto Plazo<br />

En esta sección se <strong>de</strong>scriben los resultados <strong>de</strong> un experimento llevado a<br />

cabo para comparar entre sí los métodos <strong>de</strong>scritos en las secciones anteriores<br />

aplicados a la predicción a corto plazo. Dado que uno <strong>de</strong> los mo<strong>de</strong>los a<br />

comparar es la regresión lineal se ha <strong>de</strong>cidido seleccionar la variable más<br />

“normal” <strong>de</strong> las que se dispone: la racha máxima diaria <strong>de</strong> viento (Wind).<br />

Los métodos son aplicados para obtener un pronóstico probabilístico <strong>de</strong>l<br />

evento “Wind > 50km/h”.<br />

Se han consi<strong>de</strong>rado las salidas <strong>de</strong>l mo<strong>de</strong>lo operativo <strong>de</strong>l ECMWF con un<br />

alcance <strong>de</strong> 1 día para los meses Diciembre, Enero y Febrero <strong>de</strong>l año 1998.<br />

Obsérvese que no existe solapamiento con los 15 años <strong>de</strong> re-análisis <strong>de</strong> ERA-<br />

15 (1979-1993) que se utilizan conjuntamente con observaciones históricas<br />

<strong>de</strong> ese período para entrenar los mo<strong>de</strong>los. Se probaron diferentes estaciones<br />

<strong>de</strong> la red principal <strong>de</strong> estaciones <strong>de</strong>l INM (ver Fig. 2.8(c)) obteniéndose resultados<br />

similares; en esta sección se ilustran los resultados obtenidos para<br />

Santan<strong>de</strong>r. Una metodología estándar <strong>de</strong> validación para predicciones probabilísticas<br />

es el uso <strong>de</strong> curvas ROC, <strong>de</strong>scrito en el Cap. 4. El cálculo <strong>de</strong><br />

las curvas ROC se basa en la tabla <strong>de</strong> contingencia que viene dada por las<br />

ocurrencias y no ocurrencias reales <strong>de</strong> un evento en función <strong>de</strong> las predichas.<br />

Esta tabla <strong>de</strong> contingencia se caracteriza mediante las llamadas tasa<br />

<strong>de</strong> aciertos o Hit Rate (HIR=p(predicho|ocurrido)) y la tasa <strong>de</strong> falsas alarmas<br />

(FAR=p(predicho|no ocurrido)). El area bajo la curva ROC cuantifica<br />

la pericia <strong>de</strong>l método <strong>de</strong> predicción. Este índice <strong>de</strong> validación tiene ventajas<br />

sobre otros índices, como el Brier Score (BS), pues no <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la<br />

frecuencia <strong>de</strong>l evento (un evento raro o extremo), ya que HIR esta condicionado<br />

a la ocurrencia <strong>de</strong>l evento, mientras que FAR está condicionado a la<br />

no ocurrencia (ver Cap. 4 para más <strong>de</strong>talles sobre validación).


100 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

Con objeto <strong>de</strong> comprobar la importancia <strong>de</strong> la resolución espacial y temporal<br />

<strong>de</strong>l patrón atmosférico, se han realizado las pruebas consi<strong>de</strong>rando una<br />

rejilla global y una local (mostradas en las Fig. 2.9(a) y (c), respectivamente).<br />

En ambos casos se consi<strong>de</strong>ran las diez primeras componentes principales<br />

para representar cada uno <strong>de</strong> los patrones. En las Fig. 5.9(a) y (b) se muestran<br />

las curvas ROC y los Brier Scores (BS) para cuatro algoritmos distintos<br />

consi<strong>de</strong>rando los patrones local y global, respectivamente. Los métodos utilizados<br />

son:<br />

Un mo<strong>de</strong>lo <strong>de</strong> regresión lineal, ajustado para pre<strong>de</strong>cir la probabilidad<br />

<strong>de</strong>l evento Wind > 50km/h en función <strong>de</strong> las componentes principales<br />

<strong>de</strong> los patrones atmosféricos.<br />

Un mo<strong>de</strong>lo <strong>de</strong> red neuronal <strong>de</strong> la forma 10:m:1, don<strong>de</strong> las entradas son<br />

las componentes principales y la salida es la probabilidad <strong>de</strong>l evento.<br />

En este caso se probaron distintos valores <strong>de</strong> m y los mejores resultados<br />

se obtuvieron con m = 5.<br />

La técnica k-NN <strong>de</strong> análogos, utilizando como predictor <strong>de</strong> la probabilidad<br />

<strong>de</strong>l evento la distribución empírica obtenida <strong>de</strong>l conjunto <strong>de</strong><br />

análogos. Se han consi<strong>de</strong>rado cuatro valores diferentes para k (100,<br />

50, 25 y 15), obteniéndose los mejores resultados con k = 50.<br />

1<br />

(a)<br />

1<br />

Metodo<br />

BS<br />

stdBS<br />

local k=NN 0.114 0.029<br />

Lineal 0.146 0.035<br />

Neuronal 0.114 0.035<br />

HIR<br />

HIR<br />

0.5<br />

0<br />

(b)<br />

0.5<br />

Metodo<br />

local k-NN 0.106 0.027<br />

Lineal 0.134 0.029<br />

Neuronal 0.139 0.007<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

FAR<br />

Figura 5.9: Curvas ROC y Brier Scores obtenidos para pre<strong>de</strong>cir p(Wind ><br />

50km/h) en Santan<strong>de</strong>r aplicando distintos métodos a los patrones dados por una<br />

rejilla (a) local (Fig. 2.9(c)) y (b) global (Fig. 2.9(a)).<br />

BS<br />

stdBS


5.4. TÉCNICAS BASADAS EN AGRUPAMIENTO Y CLASIFICACIÓN 101<br />

Estos resultados indican que un mo<strong>de</strong>lo lineal es fácilmente mejorable<br />

con un mo<strong>de</strong>lo neuronal. Por otra parte, una técnica local simple <strong>de</strong> vecinos<br />

cercanos (k-NN) permite obtener resultados similares a una técnica complicada<br />

como una red neuronal. En lo referente a la influencia <strong>de</strong> la escala <strong>de</strong>l<br />

patrón en los resultados, se observa que los métodos globales mejoran su<br />

pericia más que el método local cuando se aplican sobre patrones <strong>de</strong>finidos<br />

en rejillas locales, especialmente la red neuronal. Este resultado es lógico<br />

puesto que la reducción <strong>de</strong> escala en el patrón atmosférico tiene un efecto<br />

similar a una localización en los patrones que se utilizan para la predicción.<br />

Una comparación <strong>de</strong> estas técnicas en una escala temporal distinta se pue<strong>de</strong><br />

encontrar en Schoof and Pryor (2001).<br />

Como conclusión se obtiene que los métodos locales basadas en análogos<br />

son las técnicas <strong>de</strong> downscaling estadístico más apropiadas para trabajar<br />

en esta escala temporal (predicción a corto plazo). En la siguiente sección<br />

se presenta un nuevo método <strong>de</strong> downscaling local basado en técnicas <strong>de</strong><br />

agrupamiento y clasificación.<br />

5.4. Técnicas basadas en <strong>Agrupamiento</strong> y Clasificación<br />

Una limitación importante <strong>de</strong> la técnica <strong>de</strong> análogos estándar basada en<br />

k-NN es que consi<strong>de</strong>ra siempre la misma cantidad <strong>de</strong> análogos, sin tener<br />

en cuenta la estructura <strong>de</strong>l espacio don<strong>de</strong> se buscan los vecinos cercanos<br />

<strong>de</strong>l patrón previsto. Este hecho no es consistente con la distribución <strong>de</strong><br />

patrones atmosféricos ya que éstos no siguen una distribución uniforme, sino<br />

que algunas regiones <strong>de</strong>l espacio están más pobladas que otras. La única<br />

regularidad hallada en esta distribución ha sido consi<strong>de</strong>rando una única<br />

estación <strong>de</strong>l año y una dirección radial; en este caso los patrones tienen<br />

una distribución aproximadamente normal (ver Toth, 1991). Por tanto, se<br />

requieren conjuntos <strong>de</strong> análogos <strong>de</strong> tamaño variable que se adapten a las<br />

características <strong>de</strong> la región <strong>de</strong>l espacio don<strong>de</strong> se halle el patrón previsto. Por<br />

otra parte, los algoritmos <strong>de</strong> análogos son computacionalmente costosos, ya<br />

que la búsqueda <strong>de</strong> vecinos involucra el cálculo <strong>de</strong> las distancias <strong>de</strong>l patrón<br />

previsto con todos los patrones <strong>de</strong> la base <strong>de</strong> datos <strong>de</strong> re-análisis.<br />

Los algoritmos <strong>de</strong> agrupamiento proporcionan una solución simple para<br />

estos problemas. Estas técnicas permiten dividir la base <strong>de</strong> datos en grupos<br />

C i , caracterizados por un patrón prototipo v i . Cada grupo resultante pue<strong>de</strong><br />

ser utilizado como conjunto <strong>de</strong> análogos para aquellos patrones que sean<br />

posteriormente clasificados en el grupo (patrones más cercanos a v i , que a<br />

cualquier otro prototipo). Por tanto, el cálculo <strong>de</strong> distancias sólo involucra al<br />

patrón previsto y a los prototipos, lo que reduce significativamente el tiempo<br />

<strong>de</strong> computación. La técnica <strong>de</strong> agrupamiento también resuelve los problemas<br />

causados por las inhomogeneida<strong>de</strong>s <strong>de</strong> la distribución <strong>de</strong> re-análisis, ya<br />

que el número <strong>de</strong> elementos en cada uno <strong>de</strong> los grupos se pue<strong>de</strong> adaptar<br />

automáticamente a la distribución <strong>de</strong> los patrones atmosféricos utilizando<br />

un algoritmo apropiado.


102 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

En la literatura se han aplicado distintas técnicas <strong>de</strong> agrupamiento en<br />

este problema. Por ejemplo, Hughes et al. (1993) <strong>de</strong>scribe una algoritmo <strong>de</strong><br />

downscaling que utiliza una técnica <strong>de</strong> agrupamiento llamada CART (ver<br />

también Zorita et al., 1995). Este algoritmo <strong>de</strong> agrupamiento se basa en un<br />

árbol <strong>de</strong> <strong>de</strong>cisión binario, que se forma dividiendo los valores <strong>de</strong> las variables<br />

<strong>de</strong> entrada (cada uno <strong>de</strong> los valores en un punto <strong>de</strong> rejilla <strong>de</strong> las variables<br />

utilizadas para <strong>de</strong>finir el patrón atmosférico) <strong>de</strong> forma que se obtenga una<br />

separación máxima en la distribución <strong>de</strong> ocurrencia <strong>de</strong>l evento en las hojas<br />

<strong>de</strong>l árbol. Cada nodo terminal <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión correspon<strong>de</strong> a un grupo.<br />

Esta técnica se ha aplicado <strong>de</strong> forma eficiente a problemas <strong>de</strong> predicción<br />

a largo plazo (en particular, a problemas <strong>de</strong> cambio climático) don<strong>de</strong> los<br />

patrones atmosféricos utilizados tienen baja complejidad (normalmente un<br />

único nivel para una única variable en una rejilla <strong>de</strong> baja resolución: presión<br />

a nivel <strong>de</strong>l mar, altura geopotencial en 500mb, etc.). Por otra parte, estos<br />

problemas requieren un número pequeño <strong>de</strong> clases, dado que sólo requiere<br />

un número más elevado <strong>de</strong> grupos y patrones atmosféricos más complejos,<br />

lo que hace que el proceso <strong>de</strong> construcción <strong>de</strong> árbol binario sea irrealizable<br />

en este caso.<br />

Otra aproximación a este problema ha sido realizada por Cavazos (1997),<br />

aplicando re<strong>de</strong>s auto-organizativas (SOM) como algoritmo <strong>de</strong> agrupamiento,<br />

y consi<strong>de</strong>rando también una aplicación en el medio y largo plazo que requiere<br />

patrones simples y un número reducido <strong>de</strong> grupos. A diferencia <strong>de</strong>l caso<br />

anterior, esta técnica es eficiente para trabajar con un número elevado <strong>de</strong><br />

grupos y con patrones <strong>de</strong> alta dimensión. Sin embargo, este método es una<br />

generalización <strong>de</strong> otro algoritmo <strong>de</strong> agrupamiento más simple (el algoritmo<br />

<strong>de</strong> m-medias), al que aña<strong>de</strong> una restricción para conservar la estructura<br />

topológica <strong>de</strong>l espacio original en el espacio <strong>de</strong> grupos (ver Sec. 3.4). Esta<br />

restricción altera el algoritmo original <strong>de</strong> agrupamiento fijando los grupos<br />

<strong>de</strong> la periferia <strong>de</strong> la distribución a sus vecinos <strong>de</strong>l centro, lo que conlleva a<br />

un <strong>de</strong>cremento <strong>de</strong> la varianza <strong>de</strong> los grupos resultantes y <strong>de</strong> la pericia <strong>de</strong>l<br />

método.<br />

Por tanto, los métodos presentados hasta la fecha no son eficientes para<br />

la predicción a corto plazo. En la siguiente sección se presenta un nuevo<br />

algoritmo <strong>de</strong> downscaling que opera en esta escala <strong>de</strong> tiempo utilizando la<br />

técnica <strong>de</strong> agrupamiento <strong>de</strong> m-medias para seleccionar los grupos <strong>de</strong> patrones<br />

análogos en la base <strong>de</strong> datos <strong>de</strong> re-análisis.<br />

5.4.1. Nuevo Método <strong>de</strong> Downscaling para el Corto Plazo<br />

La Figura 5.10 muestra esquemáticamente la estructura <strong>de</strong> la técnica<br />

<strong>de</strong> downscaling propuesta. Como una primera etapa <strong>de</strong> preproceso, se realiza<br />

el agrupamiento <strong>de</strong> la base <strong>de</strong> datos <strong>de</strong> re-análisis utilizando el método<br />

<strong>de</strong> m-medias (los <strong>de</strong>talles <strong>de</strong> este proceso ya han sido <strong>de</strong>scritos en la Sec.<br />

3.3.2). Esta etapa permite prescindir <strong>de</strong> los datos <strong>de</strong> re-análisis en el resto<br />

<strong>de</strong>l proceso, pues éstos son reemplazados por un número <strong>de</strong>terminado


5.4. TÉCNICAS BASADAS EN AGRUPAMIENTO Y CLASIFICACIÓN 103<br />

1979<br />

1993<br />

...<br />

ATMOSPHERIC<br />

PATTERNS<br />

DATABASE<br />

ERA15<br />

reanalisys<br />

1979-1993<br />

ACM FORECAST<br />

ECMWF<br />

operative mo<strong>de</strong>l<br />

CLUSTERING Find Cluster:<br />

C 1 , ..., C m Ci<br />

Estimation:<br />

y 1 , ..., y m<br />

Inference: y i<br />

1979<br />

...<br />

INM primary<br />

stationÕs network<br />

1993<br />

LOCAL CLIMATE<br />

RECORDS DATABASE<br />

Figura 5.10: Esquema <strong>de</strong>l algoritmo <strong>de</strong> downscaling por agrupamiento. Es necesaria<br />

una base <strong>de</strong> datos <strong>de</strong> patrones atmosféricos y un registro histórico <strong>de</strong> <strong>de</strong> la<br />

climatología local <strong>de</strong> un conjunto <strong>de</strong> estaciones.<br />

<strong>de</strong> grupos C 1 , . . .,C m con sus correspondientes prototipos v 1 , . . .,v m . En<br />

la fase operativa, las únicas distancias que es necesario calcular para obtener<br />

el conjunto <strong>de</strong> análogos <strong>de</strong> un patrón <strong>de</strong> predicción dado x t , son entre<br />

x t y v i , i = 1, . . .,m. Esto supone una reducción sustancial <strong>de</strong> la carga<br />

computacional <strong>de</strong>l algoritmo.<br />

Una vez calculados los grupos C k = {x i1 , . . .,x iq(k) }, don<strong>de</strong> q(k) es el<br />

número <strong>de</strong> patrones <strong>de</strong>l grupo k-ésimo e i 1 , . . .,i q(k) se refieren a las fechas <strong>de</strong><br />

los días en el período <strong>de</strong> re-análisis, se pue<strong>de</strong> obtener una predicción probabilística<br />

local correspondiente a cada uno <strong>de</strong> los grupos para una variable y y<br />

una estación s dadas. Esta predicción se pue<strong>de</strong> obtener a partir <strong>de</strong> la función<br />

<strong>de</strong> probabilidad empírica <strong>de</strong> las observaciones históricas {y s i 1<br />

, . . .,y s i q(k)<br />

}:<br />

P s<br />

i = P(y s > u|C i ) = #{ys i j<br />

> u; j = 1, . . .,q(i)}<br />

. (5.5)<br />

q(i)<br />

Sin embargo, es bien sabido que esta estimación es inestable, especialmente<br />

para grupos <strong>de</strong> tamaño pequeño q(i). Una <strong>de</strong> las alternativas propuestas para<br />

sortear esta limitación es la técnica <strong>de</strong> estimación <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad<br />

utilizando una mezcla <strong>de</strong> núcleos continuos (Hastie et al., 2001). En este<br />

caso, cada observación no se consi<strong>de</strong>ra como un único número, sino como una<br />

función núcleo centrado en el punto (normalmente un núcleo Gaussiano).<br />

φ λ (x, x 0 ) = 1<br />

2πλ 2exp − (x − x 0) 2<br />

.<br />

2λ<br />

El uso <strong>de</strong> esta técnica suaviza la estimación ya que la suma <strong>de</strong> núcleos<br />

Gaussianos tiene el efecto <strong>de</strong> una convolución entre un filtro (el núcleo) y


104 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

la distribución empírica. En este caso, una estimación <strong>de</strong> la probabilidad se<br />

obtiene con la integral <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad:<br />

f(y s ) = 1<br />

q(i)<br />

∑<br />

φ λ (y s , yi s q(i)<br />

j<br />

). (5.6)<br />

j=1<br />

De esta ecuación po<strong>de</strong>mos obtener diferentes estadísticos para la distribución.<br />

En particular, se pue<strong>de</strong> obtener fácilmente una estimación <strong>de</strong> (5.5)<br />

para los diferentes umbrales <strong>de</strong> la variable (ver Cofiño et al., 2001a, para<br />

más <strong>de</strong>talles).<br />

El algoritmo propuesto es computacionalmente eficiente, ya que su funcionamiento<br />

operativo sólo requiere la selección <strong>de</strong>l grupo representativo<br />

para el patrón <strong>de</strong> predicción dado por el mo<strong>de</strong>lo numérico (ver la zona<br />

sombreada <strong>de</strong> la Figura 5.10). Sin embargo, el principal inconveniente es la<br />

reducción <strong>de</strong> varianza y resolución <strong>de</strong> la predicción, <strong>de</strong>bido a la cuantificación<br />

y a los efectos <strong>de</strong> bor<strong>de</strong> asociados (todos los patrones asociados a un mismo<br />

grupo C k tienen asociada la misma predicción Pk s , in<strong>de</strong>pendientemente <strong>de</strong><br />

su posición relativa cercana al centro o al bor<strong>de</strong> <strong>de</strong>l grupo). Por tanto, el<br />

método sólo genera m predicciones diferentes para una estación dada.<br />

Para suavizar este problema se ha consi<strong>de</strong>rado una versión pon<strong>de</strong>rada<br />

<strong>de</strong>l algoritmo, don<strong>de</strong> la predicción se obtiene a partir <strong>de</strong> un número m dado<br />

<strong>de</strong> grupos vecinos:<br />

∑ wc=1<br />

d(c)P<br />

ŷt s t(c)<br />

s = ∑ wc=1 , (5.7)<br />

d(c)<br />

don<strong>de</strong> t(c) es el índice <strong>de</strong>l c-ésimo prototipo más cercano a x t , d(c) es la<br />

distancia <strong>de</strong> v t (c) a x, y p s t(c)<br />

es la estimación <strong>de</strong> la probabilidad obtenida<br />

para el grupo t(c) usando (5.6). En lugar <strong>de</strong> asignar la misma estimación para<br />

todos los patrones en un grupo, ahora se consi<strong>de</strong>ra una suma pon<strong>de</strong>rada <strong>de</strong><br />

las estimaciones asociadas a los grupos más cercanos a un patrón dado. Esta<br />

modificación también resuelve el problema <strong>de</strong> la reducción <strong>de</strong> resolución,<br />

ya que ahora las predicciones no se reducen únicamente a m casos (ver<br />

Gutiérrez et al., 2004a, para más <strong>de</strong>talles).<br />

5.4.2. Validación y Comparación con Otros Métodos<br />

Con objeto <strong>de</strong> validar y obtener la pericia <strong>de</strong>l mo<strong>de</strong>lo para pre<strong>de</strong>cir la<br />

precipitación (Precip) y racha máxima <strong>de</strong> viento (Wind) diarias, se consi<strong>de</strong>rará<br />

el método estándar <strong>de</strong> análogos k-NN como mo<strong>de</strong>lo <strong>de</strong> referencia. En<br />

el análisis se comparan distintos valores <strong>de</strong> los parámetros <strong>de</strong> estos algoritmos.<br />

Por una parte el algoritmo <strong>de</strong> análogos (<strong>de</strong>notado Analog) sólo <strong>de</strong>pen<strong>de</strong><br />

<strong>de</strong>l número <strong>de</strong> análogos consi<strong>de</strong>rado para hacer la predicción (k). Por otra<br />

parte, el algoritmo <strong>de</strong> agrupamiento pon<strong>de</strong>rado (<strong>de</strong>notado como WCluster)<br />

<strong>de</strong>pen<strong>de</strong> <strong>de</strong>l número <strong>de</strong> grupos (m) y <strong>de</strong>l número <strong>de</strong> vecinos pon<strong>de</strong>rados en<br />

la predicción (w). Como la base <strong>de</strong> re-análisis contiene aproximadamente<br />

5000 patrones, se compararán los resultados obtenidos con parámetros k y


5.4. TÉCNICAS BASADAS EN AGRUPAMIENTO Y CLASIFICACIÓN 105<br />

m que cumplan 5000/m = k (así el número promedio <strong>de</strong> patrones en cada<br />

grupo coincidirá con el número <strong>de</strong> análogos consi<strong>de</strong>rado). A<strong>de</strong>más, para<br />

eliminar la reducción <strong>de</strong> varianza que conlleva el proceso <strong>de</strong> pon<strong>de</strong>ración se<br />

mantiene constante la razón m/w, <strong>de</strong> forma que se incremente el número <strong>de</strong><br />

grupos si también se incrementa el número <strong>de</strong> elementos que se utilizan en<br />

la pon<strong>de</strong>ración.<br />

Se han consi<strong>de</strong>rado salidas <strong>de</strong>l mo<strong>de</strong>lo operativo <strong>de</strong>l ECMWF durante<br />

el periodo 1998-1999, con un alcance <strong>de</strong> 1 a 5 días, <strong>de</strong> forma que no exista<br />

solapamiento con los 15 años <strong>de</strong> re-análisis <strong>de</strong> ERA-15 (1979-1993). Se consi<strong>de</strong>ra<br />

la red principal <strong>de</strong> estaciones <strong>de</strong>l INM (ver Fig. 2.8(c)); la predicción<br />

sobre cada estación se obtiene <strong>de</strong> forma in<strong>de</strong>pendiente, promediando los parámetros<br />

<strong>de</strong> validación respectivos en los resultados finales. A<strong>de</strong>más <strong>de</strong> las<br />

medias anuales (período 1998-99), algunos <strong>de</strong> los resultados son <strong>de</strong>sglosados<br />

para cada una <strong>de</strong> las estaciones <strong>de</strong>l año: Invierno (Diciembre, Enero y Febrero:<br />

DEF), Primavera (MAM), Verano (JJA) y Otoño (SON). Se consi<strong>de</strong>ran<br />

distintos eventos binarios dados por los umbrales Precip > 0.1mm, 10mm,<br />

y 20mm, y Wind > 50km/h y 80km/h para obtener las predicciones. Una<br />

metodología estándar <strong>de</strong> validación para este tipo <strong>de</strong> predicciones probabilísticas<br />

es el uso <strong>de</strong> curvas ROC, <strong>de</strong>scrito en el Cap. 4 y en la Sec. 5.3.3.<br />

El area A bajo la curva ROC cuantifica la pericia <strong>de</strong>l método <strong>de</strong> predicción;<br />

el valor 2A − 1 se <strong>de</strong>fine como RSA (ROC Skill Area), y está normalizado<br />

en [0, 1] (el valor 1 se alcanza en una predicción perfecta). Como ya se ha<br />

mencionado, este índice tiene ventajas sobre otros parámetros <strong>de</strong> validación,<br />

como el Brier Score (BS), pues no <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la frecuencia <strong>de</strong>l evento (un<br />

evento raro o extremo).<br />

Al igual que en la comparación realizada en la Sec. 5.3.3, con objeto <strong>de</strong><br />

comprobar la eficiencia <strong>de</strong> los métodos para distintas <strong>de</strong>finiciones <strong>de</strong> patrones<br />

atmosféricos (rejillas <strong>de</strong> distinta amplitud y resolución y escalas temporales<br />

diferentes) se realizan los experimentos en tres mo<strong>de</strong>los distintos mostrados<br />

en la Figura 2.9, que correspon<strong>de</strong>n a tres mo<strong>de</strong>los <strong>de</strong> patrones asociados<br />

a una rejilla global y un instante <strong>de</strong> tiempo (M1), una rejilla que cubre la<br />

Península Ibérica y una ventana <strong>de</strong> tiempo <strong>de</strong> cubre el intervalo <strong>de</strong> predicción<br />

(M2) y una rejilla local con toda la información temporal disponible (M3).<br />

Se han utilizado cuatro valores diferentes para k (100, 50, 25 y 15) y cuatro<br />

valores asociados para m (50, 100, 250, 300, respectivamente). Los mejores<br />

resultados se muestran en las Tablas 5.1 y 5.2 y fueron obtenidos con el<br />

mo<strong>de</strong>lo M3 (el mo<strong>de</strong>lo local <strong>de</strong> la Fig. 2.9(c)) para un número intermedio<br />

<strong>de</strong> elementos k = 50 y m = 100 (en este caso w = 1).<br />

También se consi<strong>de</strong>raron valores diferentes para los parámetros w y m<br />

<strong>de</strong>l método <strong>de</strong> agrupamiento pon<strong>de</strong>rado. La Figura 5.11 muestra el comportamiento<br />

<strong>de</strong>l método pon<strong>de</strong>rado en función <strong>de</strong> sus parámetros; en todos los<br />

casos, la proporción m/w se mantiene cerca <strong>de</strong> 100 (todos ellos son alternativas<br />

al algoritmo <strong>de</strong> m-medias con m = 100). En este caso, una elección<br />

conveniente <strong>de</strong> valores se da para la configuración m = 400 y w = 4 con el<br />

algoritmo <strong>de</strong> m-medias pon<strong>de</strong>radas.


106 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

> 0.1mm > 10.0mm > 20.0mm<br />

M1 M2 M3 M1 M2 M3 M1 M2 M3<br />

D+1 Analog 0.647 0.750 0.791 0.602 0.728 0.776 0.480 0.643 0.673<br />

Cluster 0.538 0.682 0.744 0.501 0.627 0.710 0.427 0.583 0.681<br />

WCluster 0.597 0.733 0.783 0.574 0.715 0.769 0.526 0.685 0.781<br />

D+2 Analog 0.633 0.727 0.771 0.586 0.689 0.737 0.474 0.606 0.647<br />

Cluster 0.523 0.669 0.716 0.478 0.602 0.667 0.408 0.535 0.614<br />

WCluster 0.588 0.711 0.763 0.571 0.685 0.736 0.504 0.647 0.729<br />

D+3 Analog 0.572 0.693 0.734 0.572 0.674 0.694 0.467 0.602 0.624<br />

Cluster 0.449 0.640 0.678 0.449 0.576 0.631 0.372 0.513 0.591<br />

WCluster 0.542 0.680 0.726 0.542 0.668 0.706 0.489 0.632 0.675<br />

Tabla 5.1: Roc Skill Area (RSA) para la precipitación usando los mo<strong>de</strong>los M1,<br />

M2 y M3 para un alcance entre 1 y 3 días (D + 1, D + 2 y D + 3). Se muestran<br />

resultados para los tres métodos Analog (k-NN con k = 50), Cluster (m-medias<br />

con m = 100), y WCluster m-medias pon<strong>de</strong>radas con m = 400 y w = 4).<br />

La Tabla 5.1 muestra los valores <strong>de</strong>l RSA promediados anual y espacialmente<br />

para las 98 estaciones, para el caso <strong>de</strong> la precipitación. De forma<br />

similar, la Tabla 5.2 muestra los resultados para el caso <strong>de</strong>l viento. Por otra<br />

parte, las Fig. 5.12 y 5.13 comparan las curvas ROC y los índices RSA correspondientes<br />

a las configuraciones óptimas <strong>de</strong> los algoritmos para un alcance<br />

<strong>de</strong> un día (D+1).<br />

> 50km/h > 80km/h<br />

M1 M2 M3 M1 M2 M3<br />

D+1 Analog 0.576 0.702 0.721 0.500 0.556 0.511<br />

Cluster 0.453 0.609 0.648 0.428 0.511 0.512<br />

WCluster 0.526 0.671 0.716 0.524 0.670 0.697<br />

D+2 Analog 0.574 0.682 0.707 0.491 0.598 0.590<br />

Cluster 0.421 0.583 0.630 0.384 0.521 0.549<br />

WCluster 0.514 0.653 0.708 0.472 0.703 0.706<br />

D+3 Analog 0.562 0.657 0.668 0.476 0.552 0.572<br />

Cluster 0.428 0.567 0.605 0.359 0.497 0.548<br />

WCluster 0.508 0.630 0.656 0.468 0.652 0.620<br />

Tabla 5.2: Roc Skill Area (RSA) para la racha máxima <strong>de</strong> viento. –Ver <strong>de</strong>talles en<br />

el pie <strong>de</strong> la Tabla 5.1.–<br />

A partir <strong>de</strong> estos resultados se pue<strong>de</strong> concluir lo siguiente:<br />

(a) Como era <strong>de</strong> esperar, el método estándar <strong>de</strong> análogos mejora claramente<br />

al método <strong>de</strong> agrupamiento básico;


5.4. TÉCNICAS BASADAS EN AGRUPAMIENTO Y CLASIFICACIÓN 107<br />

0.8<br />

RSA<br />

0.7<br />

0.6<br />

1 2 4 8<br />

w<br />

Wind>50Km/h<br />

Wind>80Km/h<br />

Precip>0.1mm<br />

Precip>20mm<br />

Figura 5.11: Roc skill area (RSA) para precipitación (eventos Precip > 0.1mm y<br />

Precip > 20mm) y racha máxima <strong>de</strong> viento (eventos Wind > 50km/h y Wind ><br />

80km/h) usando la estimación dada en (5.7) con w variando <strong>de</strong>s<strong>de</strong> 1 a 8 y m =<br />

100 ∗ w (con objeto <strong>de</strong> mantener un número promedio <strong>de</strong> elementos cercano a 50).<br />

(b) el método <strong>de</strong> agrupamiento pon<strong>de</strong>rado mejora al método <strong>de</strong> análogos<br />

para umbrales altos <strong>de</strong> precipitaciones y rachas máximas (eventos<br />

extremos: Precip > 20mm, Wind > 80km/h). Para eventos no extremos,<br />

ambos métodos muestran resultados similares. La Figura 5.14<br />

muestra los índices RSA frente a la frecuencia climatológica <strong>de</strong> los<br />

cuatro eventos diferentes en las 98 estaciones consi<strong>de</strong>radas en este estudio.<br />

Esta figura muestra la relación entre el skill <strong>de</strong> la predicción y<br />

la frecuencia <strong>de</strong> la observación <strong>de</strong>l evento en una estación. En el caso<br />

<strong>de</strong> eventos extremos, po<strong>de</strong>mos ver que, a partir <strong>de</strong> las Figuras 5.14<br />

(b) y (d) como el skill <strong>de</strong> la predicción tien<strong>de</strong> a ser menor en aquellas<br />

estaciones en las que la frecuencia <strong>de</strong>l evento es más pequeña (cuanto<br />

más raro es un evento peor pericia tendremos en nuestra predicción).<br />

Sin embargo, po<strong>de</strong>mos ver que, en esta situación, la pericia <strong>de</strong>l downscaling<br />

por agrupamiento pon<strong>de</strong>rado (WCl) es mayor que la <strong>de</strong>l método<br />

estándar <strong>de</strong> los k-vecinos.<br />

(c) Los mejores resultados se obtienen con el mo<strong>de</strong>lo M3, indicando que<br />

la <strong>de</strong>finición óptima para el estado <strong>de</strong> la atmósfera, es un patrón 4D<br />

restringido a un dominio geográfico local; y<br />

(d) la pericia <strong>de</strong>cae con el alcance <strong>de</strong> la predicción usada en la entrada<br />

<strong>de</strong>l downscaling. La Figura 5.15 muestra que este <strong>de</strong>caimiento es más<br />

pronunciado para un alcance <strong>de</strong> 4 días, mostrando un horizonte para<br />

la pericia <strong>de</strong> las predicciones meteorológicas <strong>de</strong> corto alcance.<br />

Los resultados anteriores están basados en un promedio temporal y espacial<br />

que podría ocultar algún aspecto importante <strong>de</strong> las predicciones para<br />

diferentes regiones <strong>de</strong> la Península Ibérica y para diferentes estaciones <strong>de</strong>l<br />

año. Por esta razón, se ha realizado una validación adicional para analizar la


108 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

1<br />

1<br />

1<br />

0.8<br />

0.8<br />

0.8<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.5 FAR 1<br />

1<br />

(a)<br />

Precip > 0.1mm<br />

Analog (0.647)<br />

WCluster (0.597)<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 0.5 FAR 1<br />

1<br />

(c)<br />

Precip > 0.1mm<br />

Analog (0.750)<br />

WCluster (0.733)<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

Analog (0.791)<br />

WCluster (0.783)<br />

0<br />

0 0.5 FAR 1<br />

1<br />

(e)<br />

Precip > 0.1mm<br />

0.8<br />

0.8<br />

0.8<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

(b)<br />

Precip > 20mm<br />

Analog (0.480)<br />

WCluster (0.526)<br />

0<br />

0 0.5 FAR 1<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

(d)<br />

Precip > 20mm<br />

Analog (0.643)<br />

WCluster (0.685)<br />

0<br />

0 0.5 FAR 1<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

(f)<br />

Precip > 20mm<br />

Analog (0.773)<br />

WCluster (0.781)<br />

0<br />

0 0.5 FAR 1<br />

Figura 5.12: Curvas ROC y RSA (entre corchetes) para precipitación (eventos<br />

Precip > 0.1mm y Precip > 20mm) usando k-NN con k = 50 (etiqueta Analog), y<br />

m-medias pon<strong>de</strong>radas con m = 400 y w = 4 (etiqueta WCluster) para los mo<strong>de</strong>los:<br />

(a)-(b) M1, (c)-(d) M2, y (e)-(f) M3.<br />

1<br />

1<br />

1<br />

0.8<br />

0.8<br />

0.8<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

(a)<br />

Wind > 50 Km/h<br />

Analog (0.576)<br />

WCluster (0.526)<br />

0<br />

0 0.5 FAR 1<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

(c)<br />

Wind > 50 Km/h<br />

Analog (0.702)<br />

WCluster (0.671)<br />

0<br />

0 0.5 FAR 1<br />

HIR<br />

0.6<br />

0.4<br />

0.2<br />

(e)<br />

Wind > 50 Km/h<br />

Analog (0.721)<br />

WCluster (0.716)<br />

0<br />

0 0.5 FAR 1<br />

1<br />

1<br />

1<br />

0.8<br />

0.8<br />

0.8<br />

0.6<br />

0.6<br />

0.6<br />

HIR<br />

0.4<br />

0.2<br />

(b) 0.4<br />

(d) 0.4<br />

(f)<br />

Wind > 80 Km/h Wind > 80 Km/h Wind > 80 Km/h<br />

Analog (0.500) 0.2 Analog (0.556) 0.2 Analog (0.511)<br />

WCluster (0.524)<br />

WCluster (0.670)<br />

WCluster (0.697)<br />

0<br />

0 0.5 1<br />

FAR<br />

HIR<br />

0<br />

0 0.5 1<br />

FAR<br />

HIR<br />

0<br />

0 0.5 1<br />

FAR<br />

Figura 5.13: Curvas ROC y RSA para Racha Máxima <strong>de</strong> Viento (eventos Wind ><br />

50km/h y Wind > 80km/h). –Ver <strong>de</strong>talles en el pie <strong>de</strong> la Figura. 5.12.–


5.4. TÉCNICAS BASADAS EN AGRUPAMIENTO Y CLASIFICACIÓN 109<br />

Prob Clim.<br />

0.08<br />

0.06<br />

0.04<br />

(b)<br />

Analog (k=50)<br />

WCl (m=100, w=5)<br />

Prob Clim.<br />

0.1<br />

0.08<br />

0.06<br />

0.04<br />

(d)<br />

Analog (k=50)<br />

WCl (m=100, w=5)<br />

0.02<br />

0.02<br />

0<br />

-0.5 0<br />

RSA<br />

0.5 1<br />

0<br />

- 0.5 0<br />

RSA<br />

0.5 1<br />

Prob Clim.<br />

0.6<br />

0.4<br />

(a)<br />

Analog (k=50)<br />

WCl (m=100, w=5)<br />

Prob Clim.<br />

0.4<br />

0.2<br />

(c)<br />

Analog (k=50)<br />

WCl (m=100, w=5)<br />

0.2<br />

0<br />

0.4 0.6 0.8 1<br />

RSA<br />

0<br />

0.2 0.4 0.6 0.8 1<br />

RSA<br />

Figura 5.14: Dibujos <strong>de</strong> dispersión <strong>de</strong> los valores <strong>de</strong>l RSA frente a la frecuencia<br />

climatológica <strong>de</strong>l evento para las 98 estaciones climatológicas: (a) Precip > 0.1mm,<br />

(b) Precip > 20mm, (c) Wind < 50km/h, y (d) Wind < 80km/h.<br />

0.8<br />

0.7<br />

RSA<br />

0.6<br />

0.5<br />

0.4<br />

Analog (0.1mm)<br />

WClus (0.1mm)<br />

Analog (20mm)<br />

WClus (20mm)<br />

1 2 3 4<br />

lead time (days)<br />

5<br />

Figura 5.15: RSA frente al alcance <strong>de</strong> la predicción para la precipitación (eventos<br />

Precip > 0.1mm y Precip > 20mm) usando el método <strong>de</strong> análogos con k = 50 y el<br />

método <strong>de</strong> agrupamiento con m = 400 y w = 4. Para un alcance <strong>de</strong> cuatro dias, se<br />

aprecia un <strong>de</strong>caimiento <strong>de</strong>l skill más pronunciado (se ha utilizado el mo<strong>de</strong>lo M2).


110 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO<br />

distribución espacial <strong>de</strong> los resultados. En particular, la Tabla 5.3 muestra<br />

los valores RSA para las once cuencas hidrográficas en la Península y Baleares<br />

(ver Figura 2.8(b)). Entre las diferentes estaciones, los peores resultados<br />

se dan en Verano en la mayor parte <strong>de</strong> las cuencas. Este hecho pue<strong>de</strong> ser <strong>de</strong>bido<br />

a que la precipitación en verano es <strong>de</strong>bida fundamentalmente a procesos<br />

convectivos que son más difíciles <strong>de</strong> pre<strong>de</strong>cir dado que su escala espacial es<br />

menor que la <strong>de</strong> los frentes que producen lluvia en otras estaciones <strong>de</strong>l año.<br />

En la Figura 5.16 se muestra los resultados diarios correspondientes al<br />

período Septiembre-Noviembre <strong>de</strong> 1998 para la precipitación. Las diferencias<br />

entre estos métodos se caracterizan mediante un diagrama <strong>de</strong> cajas que<br />

muestra los percentiles sobre las 98 estaciones para las pericias <strong>de</strong> cada uno<br />

<strong>de</strong> los días.<br />

BS(WCluster) - BS(Analog)<br />

0.4<br />

0.2<br />

0<br />

-0.2<br />

-0.4<br />

(a) Precip > 0.1mm<br />

-0.6<br />

BS(WCluster) - BS(Analog)<br />

0.4<br />

0.2<br />

0<br />

-0.2<br />

(b) Precip > 10mm<br />

-0.4<br />

1 10 20 30 40 50 60 70 80 90<br />

Day<br />

Figura 5.16: Diagramas <strong>de</strong> terciles para las diferencias <strong>de</strong> Brier Score (BS) entre<br />

los métodos <strong>de</strong> agrupamiento pon<strong>de</strong>rado (WClust con m = 400 y w = 4) y el<br />

método <strong>de</strong> análogos estándar (k-NN con k = 50) para un periodo <strong>de</strong> 90 días (SON,<br />

1998). Cada día, las cajas representan los terciles <strong>de</strong> los índices <strong>de</strong> las 98 estaciones<br />

y las rectas muestran los valores extremos.<br />

Por último, el término “corto plazo” se refiere al hecho <strong>de</strong> que las salidas<br />

<strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> predicción por conjuntos (ensembles) no se usan. La pericia<br />

<strong>de</strong> la predicción <strong>de</strong>cae rápidamente el cuarto día (<strong>de</strong> forma equivalente al <strong>de</strong><br />

los mo<strong>de</strong>los numéricos). Sin embargo el método es susceptible <strong>de</strong> ser aplicado<br />

a la salida <strong>de</strong> la predicción numérica por conjuntos, ya que cada uno <strong>de</strong> los<br />

miembros <strong>de</strong>l ensemble correspon<strong>de</strong>ría a uno <strong>de</strong> los grupos y, por tanto, el<br />

conjunto completo <strong>de</strong>finiría una distribución sobre los grupos, obteniendo<br />

así un mecanismo natural para trabajar con predicciones probabilísticas.<br />

Esta aplicación se <strong>de</strong>talla en el siguiente capítulo.


5.4. TÉCNICAS BASADAS EN AGRUPAMIENTO Y CLASIFICACIÓN 111<br />

> 0.1mm > 20mm<br />

Wi Sp Su Fa Wi Sp Su Fa<br />

Segura kNN 0.831 0.779 0.415 0.808 0.832 0.818 − 0.783<br />

WCl 0.836 0.800 0.476 0.831 0.930 0.977 − 0.829<br />

Baleares kNN 0.717 0.804 0.600 0.726 0.625 0.826 − 0.662<br />

WCl 0.722 0.794 0.624 0.719 0.750 0.831 − 0.774<br />

Catalana kNN 0.808 0.734 0.685 0.727 0.772 0.582 0.305 0.758<br />

WCl 0.817 0.739 0.662 0.714 0.774 0.611 0.512 0.728<br />

Duero kNN 0.800 0.824 0.743 0.818 0.514 0.623 0.594 0.507<br />

WCl 0.789 0.819 0.751 0.808 0.633 0.654 0.676 0.585<br />

Ebro kNN 0.730 0.742 0.648 0.742 0.816 0.676 0.376 0.724<br />

WCl 0.744 0.745 0.674 0.744 0.798 0.808 0.517 0.775<br />

Guadalq. kNN 0.913 0.856 0.556 0.836 0.894 0.584 0.838 0.827<br />

WCl 0.916 0.863 0.701 0.841 0.940 0.661 0.951 0.909<br />

Guadiana kNN 0.842 0.837 0.713 0.833 0.799 0.868 0.258 0.781<br />

WCl 0.842 0.852 0.889 0.857 0.821 0.825 0.378 0.812<br />

Levante kNN 0.855 0.801 0.688 0.794 0.810 0.746 0.851 0.474<br />

WCl 0.873 0.798 0.690 0.805 0.916 0.788 0.948 0.604<br />

Norte kNN 0.869 0.852 0.740 0.819 0.807 0.734 0.741 0.718<br />

WCl 0.870 0.844 0.751 0.806 0.842 0.754 0.835 0.751<br />

Sur kNN 0.815 0.804 0.698 0.783 0.731 0.428 0.892 0.666<br />

WCl 0.840 0.823 0.716 0.790 0.813 0.640 0.964 0.720<br />

Tajo kNN 0.884 0.849 0.725 0.874 0.982 0.525 0.922 0.394<br />

WCl 0.879 0.845 0.741 0.880 0.980 0.885 0.946 0.668<br />

Tabla 5.3: Roc Skill Area (RSA) para la precipitación usando el método <strong>de</strong> análogos<br />

con k = 50 (etiqueta kNN), y <strong>de</strong> agrupamiento pon<strong>de</strong>rado con m = 400 y w = 4<br />

(etiqueta WCl). El signo “-” indica la falta <strong>de</strong> datos <strong>de</strong> validación para ese periodo.


112 5. PREDICCIÓN LOCAL A CORTO PLAZO. TÉCNICAS DE AGRUPAMIENTO


CAPÍTULO 6<br />

Predicción por Conjuntos a Plazo Medio y<br />

Estacional. Re<strong>de</strong>s Auto-Organizativas<br />

6.1. Introducción<br />

La no linealidad <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> circulación, y su consiguiente sensibilidad<br />

a las distintas fuentes <strong>de</strong> incertidumbre (el estado inicial <strong>de</strong> la atmósfera,<br />

la no exactitud <strong>de</strong>l mo<strong>de</strong>lo numérico, etc.), impone una limitación al alcance<br />

<strong>de</strong> las predicciones <strong>de</strong>terministas y ha obligado a formular el problema <strong>de</strong> la<br />

predicción a plazo medio y estacional, en términos probabilísticos (Lorenz,<br />

1996). Por ello, en el último <strong>de</strong>cenio, se han <strong>de</strong>sarrollado distintos métodos<br />

<strong>de</strong> predicción por conjuntos (ensemble forecast) para tener en cuenta el<br />

crecimiento exponencial <strong>de</strong> las fluctuaciones (errores) producidas por las distintas<br />

fuentes <strong>de</strong> incertidumbre asociadas con la predicción; por una parte,<br />

la incertidumbre producida por las condiciones iniciales (errores <strong>de</strong> observaciones<br />

y <strong>de</strong> análisis <strong>de</strong> los mo<strong>de</strong>los), y por otra la incertidumbre producida<br />

por el mo<strong>de</strong>lo (imperfecciones en la parametrización <strong>de</strong> diversos procesos<br />

físicos, representación <strong>de</strong> la orografía, etc.).<br />

Los métodos <strong>de</strong> predicción por conjuntos, estiman la probabilidad a posteriori<br />

<strong>de</strong> las distintas variables atmosféricas, a partir <strong>de</strong> un conjunto <strong>de</strong><br />

predicciones obtenidas, integrando el mo<strong>de</strong>lo atmosférico con distintas realizaciones<br />

<strong>de</strong> las fuentes <strong>de</strong> incertidumbre. Por una parte, para tener en<br />

cuenta la incertidumbre asociada al estado inicial, se perturban ligeramente<br />

las condiciones iniciales y se integra el mo<strong>de</strong>lo numérico, tantas veces como<br />

miembros tenga el conjunto <strong>de</strong> perturbaciones. Este coste computacional<br />

impone la necesidad <strong>de</strong> equipos más rápidos y potentes, y limita el número<br />

<strong>de</strong> miembros que pue<strong>de</strong>n ser tratados <strong>de</strong> forma operativa (unas <strong>de</strong>cenas).<br />

Este tipo <strong>de</strong> predicción por conjuntos, es el más difundido y el implantado<br />

operativamente en los principales centros meteorológicos. Por otra parte,<br />

113


114 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

para consi<strong>de</strong>rar la incertidumbre causada por el mo<strong>de</strong>lo, se consi<strong>de</strong>ran perturbaciones<br />

en las parametrizaciones (incluida la orografía) y, más generalmente,<br />

se calcula un conjunto <strong>de</strong> predicciones aplicando distintos mo<strong>de</strong>los<br />

(predicción multi-mo<strong>de</strong>lo). Pese a las dificulta<strong>de</strong>s teóricas y computacionales<br />

asociadas con este tipo <strong>de</strong> técnicas, los avances producidos han dado un<br />

enorme impulso a la predicción meteorológica en el plazo medio (entre 4 y 15<br />

días) y a la predicción mensual y estacional. Por ello, estos métodos se han<br />

convertido en un componente central en los gran<strong>de</strong>s centros meteorológicos<br />

mundiales, incluyendo el ECMWF en Europa y el NCEP en EEUU.<br />

Aunque la predicción probabilística, no resulta familiar para los usuarios<br />

finales <strong>de</strong> las predicciones meteorológicas (sectores energético, hidrológico,<br />

agricultura, etc.), ésta posee el valor añadido <strong>de</strong> permitir <strong>de</strong>finir una estrategia<br />

<strong>de</strong> toma <strong>de</strong> <strong>de</strong>cisiones, en base a los costes <strong>de</strong> protegerse <strong>de</strong> los<br />

eventuales efectos <strong>de</strong> una predicción adversa, y a las pérdidas que se producirían<br />

si no se toman las medidas <strong>de</strong> protección. Este esquema <strong>de</strong> valoración<br />

<strong>de</strong> las predicciones probabilísticas <strong>de</strong> un mo<strong>de</strong>lo concreto en un período dado<br />

se obtiene a partir <strong>de</strong> la llamada “curva <strong>de</strong> valor económico”, que muestra<br />

la ganancia <strong>de</strong> la predicción realizada con el mo<strong>de</strong>lo, frente a la predicción<br />

climatológica, y para los distintos valores <strong>de</strong> la razón coste/pérdidas (ver<br />

Cap. 4). De esta forma, es más sencillo obtener el valor <strong>de</strong> las predicciones<br />

meteorológicas, para los distintos sectores socio-económicos <strong>de</strong> aplicación,<br />

permitiendo una mayor difusión y un uso más racional <strong>de</strong> los productos <strong>de</strong><br />

predicción meteorológica por parte <strong>de</strong> los usuarios.<br />

En este capítulo se analizan diversas aplicaciones <strong>de</strong> las re<strong>de</strong>s autoorganizativas<br />

(ver Sec. 3.4) en la predicción por conjuntos. En la Sec. 6.2<br />

se <strong>de</strong>scriben en más <strong>de</strong>talle algunas técnicas <strong>de</strong> este tipo <strong>de</strong> predicciones.<br />

En la Sec. 6.3 se ilustran las aplicaciones <strong>de</strong> las re<strong>de</strong>s auto-organizativas<br />

para visualizar e interpretar el conjunto <strong>de</strong> predicciones, y para obtener predicciones<br />

locales a partir <strong>de</strong>l mismo. En esta sección también se <strong>de</strong>scriben<br />

las ventajas <strong>de</strong> esta técnica frente a los algoritmos <strong>de</strong> agrupamiento presentados<br />

en el capítulo anterior. Una aplicación <strong>de</strong> este método en el plazo<br />

medio se analiza en la Sec. 6.4 y, por último, la Sec. 6.5 aplica el mismo<br />

esquema <strong>de</strong> predicción por conjuntos a la predicción estacional, don<strong>de</strong> se<br />

tratan <strong>de</strong> pre<strong>de</strong>cir los efectos asociados a cambios en los patrones <strong>de</strong> circulación<br />

atmosférica (anomalías <strong>de</strong> temperatura, precipitación, etc.) con varios<br />

meses <strong>de</strong> antelación. En esta sección, se <strong>de</strong>muestra que es posible obtener<br />

predicciones locales durante episodios <strong>de</strong> “El Niño” fuertes, con meses <strong>de</strong><br />

antelación.<br />

6.2. Predictibilidad y Predicción por Conjuntos<br />

Como ya se ha comentado, el problema <strong>de</strong> la predictibilidad <strong>de</strong> los mo<strong>de</strong>los<br />

numéricos <strong>de</strong> circulación atmosférica está asociado con su no linealidad,<br />

ya que cualquier incertidumbre o error introducido en el sistema fluctúa<br />

exponencialmente en el tiempo. Analizado <strong>de</strong> forma general, el origen <strong>de</strong>


6.2. PREDICTIBILIDAD Y PREDICCIÓN POR CONJUNTOS 115<br />

fluctuaciones en estos mo<strong>de</strong>los pue<strong>de</strong> provenir <strong>de</strong> errores en la condición<br />

inicial (caos), <strong>de</strong> reducción <strong>de</strong> variables en el mo<strong>de</strong>lo (ruido) o <strong>de</strong> las parametrizaciones<br />

y condiciones orográficas <strong>de</strong> contorno (<strong>de</strong>sor<strong>de</strong>n).<br />

La dispersión producida por errores en la condición inicial, ha sido el caso<br />

más estudiado en la predicción meteorológica. Se suele analizar aplicando un<br />

método <strong>de</strong> predicción por conjuntos, a mo<strong>de</strong>los numéricos con muchos modos<br />

espaciales (An<strong>de</strong>rson, 1996). Los conjuntos se pue<strong>de</strong>n formar <strong>de</strong> muy diversas<br />

formas, siendo el método <strong>de</strong> vectores singulares (Buizza and Palmer, 1995) o<br />

el método <strong>de</strong> breeding (Pu et al., 1997) los más utilizados para la generación<br />

<strong>de</strong> miembros, a partir <strong>de</strong> perturbaciones específicas <strong>de</strong> las condiciones iniciales.<br />

El método <strong>de</strong> vectores singulares ha sido adoptado por el ECMWF y<br />

el método <strong>de</strong> breeding por el NCEP. Ambos métodos presentan características<br />

muy distintas, y a veces contrarias, pero sus resultados finales, medidos<br />

en valores económicos, no son muy distintos. El método <strong>de</strong> breeding no requiere<br />

gran<strong>de</strong>s esfuerzos computacionales, y es técnicamente muy simple.<br />

Consiste en seguir la evolución lineal en una <strong>de</strong>terminada trayectoria, con<br />

condiciones iniciales aleatorias muy alejada <strong>de</strong>l tiempo <strong>de</strong> observación. El<br />

método <strong>de</strong> vectores singulares es computacionalmente mucho más costoso y<br />

técnicamente más complejo, pues calcula, mediante técnicas <strong>de</strong> componentes<br />

principales, las fluctuaciones lineales más significativas ocurridas en un<br />

alcance <strong>de</strong> predicción dado.<br />

En la práctica, este tipo <strong>de</strong> predicción por conjuntos se realiza, tanto<br />

para la predicción a medio plazo, como para la predicción estacional.<br />

En este período la predicción se entien<strong>de</strong> en sentido probabilístico y cobra<br />

importancia el concepto <strong>de</strong> predictibilidad, y su caracterización para<br />

cada situación (unas situaciones son más pre<strong>de</strong>cibles que otras). En estos<br />

casos, la predicción por conjuntos proporciona una solución práctica, ya que<br />

los miembros <strong>de</strong>l conjunto <strong>de</strong> predicciones, nos proporcionan <strong>de</strong>scripciones<br />

equiprobables <strong>de</strong>l patrón atmosférico previsto, y a partir <strong>de</strong> las cuales se<br />

pue<strong>de</strong> obtener una predicción probabilística, así como una estimación <strong>de</strong> su<br />

predictibilidad.<br />

Por otra parte, la dispersión producida por la no exactitud <strong>de</strong>l mo<strong>de</strong>lo,<br />

y <strong>de</strong> las distintas parametrizaciones, está siendo abordada consi<strong>de</strong>rando<br />

conjuntos <strong>de</strong> predicciones obtenidos por varios mo<strong>de</strong>los (predicción multimo<strong>de</strong>lo).<br />

Quizás la iniciativa más <strong>de</strong>stacada en este ámbito sea la llevada a<br />

cabo en el proyecto DEMETER (Development of a European Multimo<strong>de</strong>l<br />

Ensemble system for seasonal to inTERannual prediction) que está integrado<br />

por seis mo<strong>de</strong>los globales <strong>de</strong> predicción por conjuntos con distintos esquemas<br />

<strong>de</strong> perturbación (www.ecmwf.int/research/<strong>de</strong>meter/) con los que se<br />

aborda el problema <strong>de</strong> la predicción mensual y estacional (Palmer et al.,<br />

2003).<br />

Por ejemplo, uno <strong>de</strong> los casos más comunes <strong>de</strong> predicción estacional por<br />

conjuntos, es el fenómeno <strong>de</strong> El Niño; en concreto, la zona Niño-3 que compren<strong>de</strong><br />

un área <strong>de</strong>l Océano Pacífico entre la latitu<strong>de</strong>s 5N − 5S y longitu<strong>de</strong>s<br />

90W − 150W. El promedio <strong>de</strong> la temperatura <strong>de</strong>l agua <strong>de</strong>l mar en esta re-


116 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

gión, se suele utilizar como indicador <strong>de</strong> la actividad <strong>de</strong> El Niño. La Figura<br />

6.1 muestra las predicciones realizadas por el mo<strong>de</strong>lo estacional, System-II<br />

<strong>de</strong>l ECMWF en (a) Abril y (b) Agosto, para cada uno <strong>de</strong> los miembros <strong>de</strong>l<br />

conjunto <strong>de</strong> predicciones. En ambas figuras se muestra el valor real ocurrido<br />

en trazo discontinuo. En la figura (a) todos los miembros <strong>de</strong> la predicción<br />

indican una anomalía positiva en el futuro. En cambio, en la figura (b) unos<br />

miembros <strong>de</strong>l conjunto indican anomalía positiva, mientras otros indican lo<br />

contrario. En este caso, la situación se supone menos pre<strong>de</strong>cible y la confianza<br />

asociada a la predicción es baja. En la figura inferior se muestra la<br />

probabilidad obtenida a partir <strong>de</strong>l conjunto <strong>de</strong> predicciones, para que la<br />

temperatura en la superficie <strong>de</strong>l mar tenga una anomalía positiva durante<br />

el trimestre septiembre-noviembre <strong>de</strong> 2003.<br />

(a)<br />

(b)<br />

Figura 6.1: Predicción por conjuntos <strong>de</strong>l fenómeno <strong>de</strong> El Niño con un conjunto <strong>de</strong><br />

51 miembros. (a) La predicción realizada en Abril muestra una anomalía positiva<br />

hasta octubre; (b) los miembros <strong>de</strong> la predicción realizada en Julio no coinci<strong>de</strong>n<br />

en una misma predicción. La figura inferior muestra la probabilidad (en tanto por<br />

ciento) predicha el 1 <strong>de</strong> Agosto <strong>de</strong> que la temperatura a 2m se encuentre en el tercil<br />

superior (anomalía positiva) en el período SON 2003. (FUENTE: ECWMF)<br />

Distintas validaciones <strong>de</strong> la predicción probabilística por conjuntos, han<br />

mostrado su superioridad frente a la predicción <strong>de</strong>terminista tradicional<br />

(Zhu et al., 2001). Sin embargo, a pesar <strong>de</strong> que cualitativamente la dispersión<br />

<strong>de</strong>l conjunto parece apropiada, como medida <strong>de</strong> predictibilidad, todavía<br />

no se ha obtenido ningún resultado concluyente relacionando estos conceptos.<br />

En la siguiente sección se muestra que las re<strong>de</strong>s auto-organizativas proporcionan<br />

criterios cualitativos, y cuantitativos, para relacionar predictibilidad<br />

y dispersión <strong>de</strong>l conjunto <strong>de</strong> predicciones.


6.3. APLICACIÓN DE LAS REDES AUTO-ORGANIZATIVAS 117<br />

6.3. Aplicación <strong>de</strong> las Re<strong>de</strong>s Auto-Organizativas<br />

En la Sec. 3.4 se <strong>de</strong>scribieron diversas aplicaciones <strong>de</strong> las re<strong>de</strong>s autoorganizativas<br />

(Self-Organizing Maps, SOM) para la visualización y clasificación<br />

<strong>de</strong> patrones atmosféricos y <strong>de</strong> patrones fenomenológicos (observaciones<br />

en superficie). Esta técnica es una generalización <strong>de</strong> la técnica <strong>de</strong> agrupamiento<br />

<strong>de</strong> m-medias (ver Sec. 3.3.2) y divi<strong>de</strong> el espacio original <strong>de</strong> patrones<br />

(por ejemplo, una base <strong>de</strong> datos <strong>de</strong> re-análisis) en grupos caracterizados<br />

por un patrón prototipo. La diferencia entre la técnicas <strong>de</strong> m-medias y la<br />

SOM consiste en que esta última, lleva a cabo una proyección no lineal <strong>de</strong>l<br />

espacio <strong>de</strong> patrones (<strong>de</strong> muy alta dimensionalidad), en un espacio arbitrario<br />

(normalmente un espacio reticular bidimensional <strong>de</strong> fácil visualización),<br />

conservando la distancia y, por tanto, la noción <strong>de</strong> vecindad. De esta forma,<br />

patrones vecinos en la retícula 2D también son vecinos (similares) en el espacio<br />

real, mientas que los patrones alejados en esta representación reticular,<br />

también se encuentran alejados en el espacio real.<br />

40<br />

T 1000mb<br />

30<br />

20<br />

10<br />

PC2<br />

0<br />

-10<br />

-20<br />

-30<br />

-40<br />

-40 -30 -20 -10 0 10 20 30 40<br />

PC1<br />

T 500mb<br />

Z, (U,V) 500mb<br />

Figura 6.2: Ejemplo <strong>de</strong> una SOM <strong>de</strong> 5 × 5 grupos representada en el espacio<br />

generado por las dos primeras componentes principales <strong>de</strong>l re-análisis ERA-15. Cada<br />

grupo tiene asociado un prototipo proyectado sobre la retícula 5 × 5; en este caso<br />

se muestran tres campos atmoféricos asociados a cada prototipo: temperatura en<br />

500 y 1000 mb y geopotencial y dirección <strong>de</strong> viento en 500 mb.<br />

Por ejemplo, la Fig. 6.2 muestra una retícula 5×5 (25 grupos) proyectada<br />

sobre el espacio <strong>de</strong>finido por las dos primeras componentes principales <strong>de</strong><br />

los patrones atmosféricos <strong>de</strong> ERA-15 (la retícula está proyectada sobre todo<br />

el espacio, pero se muestran solamente las dos primeras componentes para


118 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

facilitar su visualización). Cada punto <strong>de</strong> la retícula representa un prototipo,<br />

que caracteriza al conjunto <strong>de</strong> los patrones atmosféricos que están en su<br />

vecindad (más cerca <strong>de</strong> ese prototipo que <strong>de</strong> ningún otro). Asimismo, cada<br />

uno <strong>de</strong> los prototipos está representado por un punto en la retícula 2D<br />

original, y tiene asociado un conjunto <strong>de</strong> vecinos (los 8 vecinos <strong>de</strong> la retícula<br />

que lo ro<strong>de</strong>an). El entrenamiento <strong>de</strong> la SOM calcula la ubicación óptima <strong>de</strong><br />

los prototipos en el espacio real (agrupamiento), pero, manteniendo la noción<br />

<strong>de</strong> vecindad <strong>de</strong>finida en la retícula original. Por ejemplo, en la Fig. 6.2, se<br />

muestran por separado los valores <strong>de</strong> tres campos atmosféricos (temperatura<br />

en 1000mb, temperatura en 500mb, y geopotencial y dirección <strong>de</strong>l viento en<br />

500mb) asociados a cada uno <strong>de</strong> los prototipos resultantes, <strong>de</strong> entrenar una<br />

SOM 2D reticular 5 × 5 con los patrones atmosféricos <strong>de</strong>l re-análisis ERA-<br />

15, limitados a la región <strong>de</strong>l Atlántico Norte. En esta figura se pue<strong>de</strong> ver<br />

que existe una continuidad en los patrones atmosféricos, mostrados en la<br />

retícula, que refleja la conservación <strong>de</strong> distancias <strong>de</strong> la proyección realizada.<br />

La utilidad <strong>de</strong> este tipo <strong>de</strong> representaciones ha sido puesta <strong>de</strong> manifiesto en<br />

la Sec. 3.4 para la clasificación y visualización <strong>de</strong> patrones <strong>de</strong> tiempo (otras<br />

aplicaciones en Climatología se ilustran en Hewitson and Crane, 2002).<br />

Esta técnica ha sido también utilizada para la predicción local (downscaling<br />

estadístico), permitiendo clasificar los patrones atmosféricos, y estimar<br />

mo<strong>de</strong>los <strong>de</strong> regresión locales para cada uno <strong>de</strong> los grupos resultantes<br />

(Cavazos, 2000). Por una parte, este método podría ser mejorado aplicando<br />

algún método <strong>de</strong> estimación no lineal a los grupos resultantes (ver, por ejemplo,<br />

Fontela-Romero et al., 2002). Sin embargo, la aplicación <strong>de</strong> las SOM en<br />

este ámbito no presenta ninguna ventaja <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> la calidad<br />

<strong>de</strong> la predicción, con respecto al método <strong>de</strong> downscaling por agrupamiento,<br />

presentado en el Capítulo 5. Sin embargo, en la predicción por conjuntos la<br />

SOM aporta un valor añadido, que todavía no ha sido tenido en cuenta en<br />

este ámbito. En esta sección se analiza esa aplicación.<br />

El método <strong>de</strong> predicción local por agrupamiento, <strong>de</strong>scrito en el Capítulo<br />

5 se <strong>de</strong>scribe en la Fig. 5.10, en la muestra un esquema <strong>de</strong> las partes principales.<br />

Esta figura muestra que la generalización <strong>de</strong> esta técnica, a la predicción<br />

por conjuntos, resulta trivial: en lugar <strong>de</strong> trabajar con un único patrón, se<br />

repite el proceso con cada uno <strong>de</strong> los patrones miembro <strong>de</strong> la predicción por<br />

conjuntos, obteniéndose un valor local, previsto a partir <strong>de</strong> las predicciones<br />

asociadas con cada uno <strong>de</strong> los grupos obtenidos, para los miembros. La etapa<br />

<strong>de</strong> agrupamiento, requerida como preproceso <strong>de</strong>l algoritmo, no varía, lo<br />

que varía es la aplicación operativa, ya que sólo es necesario hallar el grupo<br />

correspondiente a cada patrón miembro <strong>de</strong> la predicción. Si en lugar <strong>de</strong> utilizar<br />

una técnica <strong>de</strong> agrupamiento estándar (como m-medias) se utiliza una<br />

SOM en este esquema, se cuenta con la ventaja adicional <strong>de</strong> tener organizados<br />

los grupos en una retícula 2D, don<strong>de</strong> se conserva la misma noción <strong>de</strong><br />

vecindad que en el espacio real <strong>de</strong> patrones. Por tanto, los miembros <strong>de</strong> la<br />

predicción por conjunto <strong>de</strong>finirán una función <strong>de</strong> probabilidad en la retícula<br />

<strong>de</strong> la SOM, que podrá combinarse con las funciones <strong>de</strong> probabilidad feno-


6.3. APLICACIÓN DE LAS REDES AUTO-ORGANIZATIVAS 119<br />

menológicas para ŷ i , obtenidas para cada grupo, para así obtener un valor<br />

final <strong>de</strong> la predicción (ver Fig. 6.3).<br />

1979<br />

1993<br />

...<br />

ATMOSPHERIC<br />

PATTERNS<br />

DATABASE<br />

ERA15<br />

reanalisys<br />

1979-1993<br />

CLUSTERING<br />

C 1 , ..., C m<br />

SELF-ORGANIZING<br />

MAP (SOM)<br />

Topological arrangement<br />

in a 2D lattice (e.g. m=36)<br />

C1 C2 ...<br />

C36<br />

Find Cluster:<br />

C i1<br />

ENSEMBLE<br />

FORECAST<br />

...<br />

f1 f 2 ...<br />

Find Cluster:<br />

C in<br />

1979<br />

...<br />

Daily records:<br />

Precip, wind, ...<br />

Estimation for<br />

each cluster<br />

and station<br />

y 1 , ..., y m<br />

f36<br />

Inference: y i<br />

1993<br />

LOCAL CLIMATE<br />

RECORDS DATABASE<br />

Figura 6.3: Esquema <strong>de</strong>l algoritmo <strong>de</strong> downscaling por agrupamiento generalizado<br />

a la predicción por conjuntos. En este caso, la técnica <strong>de</strong> agrupamiento está basada<br />

en re<strong>de</strong>s auto-organizativas consi<strong>de</strong>rando una retícula 2D.<br />

Por tanto, el uso <strong>de</strong> las SOM como técnica <strong>de</strong> agrupamiento permite<br />

obtener:<br />

Una predicción probabilística y numérica, a partir <strong>de</strong> algún estadístico<br />

central, o algún percentil, <strong>de</strong> la función <strong>de</strong> probabilidad resultante, <strong>de</strong><br />

combinar la probabilidad <strong>de</strong> la SOM y la probabilidad fenomenológica<br />

<strong>de</strong> cada grupo (véase Sec. 5.4.1).<br />

Una medida <strong>de</strong> predictibilidad (o confianza) basándose en algún estadístico<br />

<strong>de</strong> dispersión <strong>de</strong> la probabilidad <strong>de</strong> la SOM. Obsérvese, que<br />

la dispersión estadística <strong>de</strong> la función <strong>de</strong> probabilidad, está relacionada<br />

con la dispersión <strong>de</strong> los patrones <strong>de</strong> los miembros <strong>de</strong> la predicción<br />

por conjuntos, ya que la SOM conserva las distancias <strong>de</strong>l espacio real<br />

en la retícula 2D, que sirve <strong>de</strong> soporte a la función <strong>de</strong> probabilidad.<br />

Por tanto, la dispersión <strong>de</strong> los miembros <strong>de</strong> la predicción en el espacio<br />

real redundará en una mayor dispersión <strong>de</strong> la probabilidad sobre la<br />

retícula <strong>de</strong> la SOM.<br />

Por ejemplo, la Fig. 6.4(a) muestra la función <strong>de</strong> probabilidad <strong>de</strong>finida<br />

en la SOM por los días <strong>de</strong> Invierno (Diciembre-Febrero) <strong>de</strong>l período ERA-<br />

15 (1979-1993), mientras que la la Fig. 6.4(b) muestra la probabilidad correspondiente<br />

al verano (Junio-Agosto). Comparando estas dos figuras se<br />

pue<strong>de</strong> observar que cada una <strong>de</strong> ellas se distribuye en una parte distinta<br />

<strong>de</strong>l soporte, indicando la diferencia entre ambos conjuntos <strong>de</strong> patrones. Por<br />

otra parte, las Fig. 6.4(c) y (d) muestran las probabilida<strong>de</strong>s <strong>de</strong> los invierno


120 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

(a) DJF<br />

0.1<br />

(b) JJA<br />

0.1<br />

0.08<br />

0.08<br />

0.06<br />

0.06<br />

0.04<br />

0.04<br />

0.02<br />

0.02<br />

(c) DJF 1998<br />

0<br />

0.1<br />

(d) DJF 2000<br />

0<br />

0.1<br />

0.08<br />

0.08<br />

0.06<br />

0.06<br />

0.04<br />

0.04<br />

0.02<br />

0.02<br />

0<br />

0<br />

Figura 6.4: Función <strong>de</strong> probabilidad empírica <strong>de</strong>finida sobre la SOM por (a) los<br />

días <strong>de</strong> invierno (Diciembre-Febrero) <strong>de</strong>l período ERA-15 (1979-1993), (b) los días<br />

<strong>de</strong> verano (Junio-Agosto) <strong>de</strong> ERA-15. (c) los días <strong>de</strong> invierno <strong>de</strong>l año 1998 (d) los<br />

días <strong>de</strong> invierno <strong>de</strong>l año 2000.<br />

para los años 1998 y 2000, respectivamente. Estas funciones <strong>de</strong> probabilidad<br />

<strong>de</strong>finen la variabilidad <strong>de</strong> cada uno <strong>de</strong> los años y una comparación con la<br />

Fig. (a) permitiría reflejar lo anomalía <strong>de</strong> la estación correspondiente con<br />

respecto a la climatología. Estas mismas i<strong>de</strong>as se pue<strong>de</strong>n aplicar para el caso<br />

<strong>de</strong> la predicción por conjuntos. En la siguiente sección se analizan distintas<br />

medidas que pue<strong>de</strong>n caracterizar la dispersión <strong>de</strong> la función <strong>de</strong> probabilidad<br />

y comparar dos funciones entre sí.<br />

6.3.1. Medidas <strong>de</strong> Dispersión y Predictibilidad<br />

Aparte <strong>de</strong> las medidas estándar para caracterizar la dispersión <strong>de</strong> una<br />

función <strong>de</strong> probabilidad (por ejemplo, la <strong>de</strong>sviación estándar σ), existen<br />

otras medidas, como la entropía, <strong>de</strong>sarrolladas en el campo <strong>de</strong> la “teoría<br />

<strong>de</strong> la información” con propieda<strong>de</strong>s interesantes para el problema que nos<br />

ocupa (Shannon, 1948).<br />

La entropía es una medida utilizada para caracterizar el <strong>de</strong>sor<strong>de</strong>n y la<br />

pérdida <strong>de</strong> información en distintos problemas (sistemas físicos como mezclas<br />

<strong>de</strong> gases, códigos digitales para comunicaciones, etc.). Des<strong>de</strong> el punto<br />

<strong>de</strong> vista estadístico, la entropía <strong>de</strong> una función <strong>de</strong> probabilidad caracteriza<br />

la uniformidad <strong>de</strong> la misma (para el caso discreto). Dada una función <strong>de</strong><br />

probabilidad (p 1 , . . .,p n ) = (P(c 1 ), . . .,P(c n )) <strong>de</strong>finida sobre una variable<br />

discreta C con n estados (C 1 , . . .,C n ), se <strong>de</strong>fine su entropía como:<br />

H(P) = − ∑ i<br />

p i log b p i = ∑ i<br />

[ ]<br />

1 1<br />

p i log b = E log b<br />

p i P(x)<br />

(6.1)<br />

don<strong>de</strong> la base <strong>de</strong>l logaritmo nos va a <strong>de</strong>terminar la unidad en la que se mi<strong>de</strong><br />

la información <strong>de</strong> los datos (si es 2, la unidad <strong>de</strong> medida es el bit). A partir


6.4. APLICACIÓN EN LA PREDICCIÓN A MEDIO PLAZO 121<br />

<strong>de</strong> esta <strong>de</strong>finición, y consi<strong>de</strong>rando las propieda<strong>de</strong>s <strong>de</strong> una probabilidad, se<br />

pue<strong>de</strong> <strong>de</strong>ducir que H(P) ≥ 0, y será nula cuando toda la probabilidad se<br />

acumule en un sólo estado (la variable tome un único valor).<br />

Otra medida <strong>de</strong> interés es la entropía relativa, también llamada distancia<br />

<strong>de</strong> Kullback-Leibler, que mi<strong>de</strong> la distancia entre dos posibles distribuciones<br />

<strong>de</strong> probabilidad, P y Q, <strong>de</strong> una misma variable aleatoria X. Se <strong>de</strong>fine como:<br />

H(P |Q) = ∑ q i ≠0<br />

p i log p i<br />

q i<br />

(6.2)<br />

como en el caso anterior se tiene que H(P |Q) ≥ 0 y el valor nulo sólo se<br />

alcanza cuando P ≡ Q ⇔ p i = q i ∀i.<br />

Cada una <strong>de</strong> estas medidas, proporciona una caracterización <strong>de</strong> la dispersión<br />

<strong>de</strong> los miembros <strong>de</strong> la predicción por conjuntos, a partir <strong>de</strong> la probabilidad<br />

que <strong>de</strong>finen sobre la SOM. La <strong>de</strong>sviación típica es la más simple<br />

<strong>de</strong> estas caracterizaciones y mi<strong>de</strong> la separación promedio <strong>de</strong> los miembros<br />

<strong>de</strong> la predicción, al patrón medio previsto. Por otra parte, la entropía tiene<br />

en cuenta la mayor, o menor dispersión <strong>de</strong> los miembros, sin consi<strong>de</strong>rar la<br />

distancia a la que se encuentran <strong>de</strong>l centro <strong>de</strong> la probabildiad. Por último,<br />

la entropía relativa <strong>de</strong> la probabilidad, respecto a la probabilidad climatológica,<br />

ofrece una medida <strong>de</strong> la información proporcionada por el mo<strong>de</strong>lo<br />

numérico, o <strong>de</strong> la anomalía <strong>de</strong>l patrón previsto. La conveniencia <strong>de</strong> estas<br />

medidas se analiza en <strong>de</strong>talle en dos aplicaciones concretas: la predicción a<br />

plazo medio y la predicción estacional.<br />

6.4. Aplicación en la Predicción a Medio Plazo<br />

En esta sección se analiza la aplicación <strong>de</strong> la técnica <strong>de</strong> la Sección anterior,<br />

a la predicción por conjuntos <strong>de</strong> plazo medio. Para ello se consi<strong>de</strong>ran<br />

las salidas operativas <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> predicción por conjuntos <strong>de</strong>l ECMWF,<br />

para el período DEF 1998 y 2000 (180 días). Para cada uno <strong>de</strong> los días,<br />

este mo<strong>de</strong>lo realiza una predicción hasta D + 9 a partir <strong>de</strong> una condición<br />

inicial, a esta predicción se la <strong>de</strong>nomina control. Después se generan otras<br />

50 predicciones, a partir <strong>de</strong> perturbaciones <strong>de</strong> la condición inicial, aplicando<br />

el método <strong>de</strong> vectores singulares. Por tanto, para cada alcance <strong>de</strong> predicción<br />

entre D + 1 y D + 9 se tienen 51 patrones atmosféricos que se consi<strong>de</strong>ran<br />

igualmente probables, para la <strong>de</strong>scripción <strong>de</strong>l patrón atmosférico previsto.<br />

Tal como se comentó en la sección anterior, cada conjunto <strong>de</strong> 51 patrones<br />

<strong>de</strong>fine una función <strong>de</strong> probabilidad que tiene como soporte la retícula <strong>de</strong><br />

la SOM. Por ejemplo, la Fig. 6.5 muestra las funciones <strong>de</strong> probabilidad<br />

dadas por los 51 patrones para cada uno <strong>de</strong> los alcances obtenidos a partir<br />

<strong>de</strong>l día 24 <strong>de</strong> febrero <strong>de</strong> 1998. Como pue<strong>de</strong> observarse en esta figura, la<br />

predicción para los primeros dos días se centra en un sólo grupo, mientras<br />

que la dispersión comienza a crecer a partir <strong>de</strong>l tercer día, a medida que<br />

aumenta la incertidumbre sobre la predicción. Los dos números que aparecen


122 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

EPS 24/2/1998<br />

H=0 σ=0 0 0<br />

1<br />

1<br />

0.743 0.793<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+1 D+2 D+3<br />

1.612 1.614 2.190 1.571 1.998 1.984<br />

1<br />

1<br />

1<br />

0.5<br />

0<br />

1<br />

0.5<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+4 D+5 D+6<br />

2.433 3.018 2.393 3.441 2.718 3.385<br />

1<br />

1<br />

0<br />

1<br />

0.5<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+7 D+8 D+9<br />

0<br />

Figura 6.5: Probabilida<strong>de</strong>s <strong>de</strong>finidas sobre la SOM por los miembros <strong>de</strong> la predicción<br />

por conjuntos <strong>de</strong>l día 24/2/1998 para los alcances entre D + 1 y D + 9.<br />

sobre la distribución, indican la entropía (izquierda) y la <strong>de</strong>sviación típica<br />

(<strong>de</strong>recha).<br />

Sin embargo, no todas las situaciones son similares a la anterior, ya que<br />

se pue<strong>de</strong> encontrar un período estable don<strong>de</strong> los miembros <strong>de</strong>l conjunto <strong>de</strong><br />

predicciones tienen escasa variabilidad (ver Fig. 6.6), y también una situación<br />

más impre<strong>de</strong>cible, en la que la dispersión es consi<strong>de</strong>rable <strong>de</strong>s<strong>de</strong> el primer<br />

día <strong>de</strong> alcance (ver Fig. 6.7).<br />

A pesar <strong>de</strong> la variabilidad <strong>de</strong> unas situaciones a otras, se pue<strong>de</strong> esperar<br />

que, en promedio, la dispersión <strong>de</strong> las funciones <strong>de</strong> probabilidad crezca a<br />

medida que aumenta el alcance <strong>de</strong> la predicción (y, por tanto, su incertidumbre).<br />

Para constatar este hecho se han calculado los respectivos cuartiles <strong>de</strong><br />

las dispersiones, y para los distintos alcances, consi<strong>de</strong>rando las predicciones<br />

realizadas en los 180 días. Las Figs. 6.8 (a) y (c) muestran la entropía y la<br />

<strong>de</strong>sviación típica <strong>de</strong> la probabilidad para el alcance D. En estas figuras pue<strong>de</strong><br />

observarse que, la <strong>de</strong>sviación tiene algunos valores fuera <strong>de</strong> rango durante los<br />

primeros días <strong>de</strong> la predicción y comienza a saturar a partir <strong>de</strong>l quinto día,<br />

y por otra parte, el comportamiento <strong>de</strong> la entropía es más monótono. Cada<br />

una <strong>de</strong> estas dos medidas da una información distinta sobre la variabilidad<br />

<strong>de</strong> cada uno <strong>de</strong> los patrones. Por ello, se consi<strong>de</strong>ra también un parámetro <strong>de</strong><br />

dispersión <strong>de</strong>finido como la suma <strong>de</strong> los parámetros anteriores. En la Fig.<br />

6.8(d) se muestra que este parámetro presenta la característica <strong>de</strong> satura-


6.4. APLICACIÓN EN LA PREDICCIÓN A MEDIO PLAZO 123<br />

H=0.321 σ=0.297 0.321 0.297 0.670 0.488<br />

1<br />

1<br />

1<br />

EPS 25/1/1988<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+1 D+2 D+3<br />

1.097 1.083 0.415 0.425 0.546 0.798<br />

1<br />

1<br />

0.5<br />

0<br />

1<br />

0.5<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+4 D+5 D+6<br />

1.333 1.477 1.528 1.565 1.626 1.637<br />

1<br />

1<br />

0<br />

1<br />

0.5<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+7 D+8 D+9<br />

Figura 6.6: Probabilida<strong>de</strong>s <strong>de</strong>finidas sobre la SOM por los miembros <strong>de</strong> la predicción<br />

por conjuntos <strong>de</strong>l día 25/1/1998 para los alcances entre D + 1 y D + 9.<br />

0<br />

EPS 19/12/1997<br />

H=0.756 σ=0.693 1.571 3.005 2.172 3.517<br />

1<br />

1<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+1 D+2 D+3<br />

2.205 2.627 2.040 2.870 1.971 2.645<br />

1<br />

1<br />

1<br />

0.5<br />

0<br />

1<br />

0.5<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+4 D+5 D+6<br />

2.629 2.497 2.540 2.529 2.366 3.291<br />

1<br />

1<br />

0<br />

1<br />

0.5<br />

0.5<br />

0.5<br />

0<br />

0<br />

D+7 D+8 D+9<br />

Figura 6.7: Probabilida<strong>de</strong>s <strong>de</strong>finidas sobre la SOM por los miembros <strong>de</strong> la predicción<br />

por conjuntos <strong>de</strong>l día 19/12/1997 para los alcances entre D + 1 y D + 9.<br />

0


124 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

H(P(D))<br />

3<br />

2<br />

1<br />

(a)<br />

H(P(D)|P(D-1))<br />

4<br />

3<br />

2<br />

1<br />

(b)<br />

0<br />

1 2 3 4 5 6 7 8 9<br />

alcance (dias)<br />

0<br />

1 2 3 4 5 6 7 8 9<br />

alcance (dias)<br />

4<br />

6<br />

σ(P(D))<br />

3<br />

2<br />

1<br />

0<br />

(c)<br />

1 2 3 4 5 6 7 8 9<br />

alcance (dias)<br />

Dispersión<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

(d)<br />

1 2 3 4 5 6 7 8 9<br />

alcance (dias)<br />

Figura 6.8: (a) Entropía <strong>de</strong> la probabilidad para el alcance D, H(P(D)); (b) Entropía<br />

relativa <strong>de</strong> la probabilidad <strong>de</strong> un día, respecto a la probabilidad <strong>de</strong>l día<br />

anterior, H(P(D)|P(D −1)); (c) <strong>de</strong>sviación típica <strong>de</strong> la probabilidad y (d) parámetros<br />

<strong>de</strong> dispersión, <strong>de</strong>finido como la suma <strong>de</strong> la <strong>de</strong>sviación típica y la entropía.<br />

ción <strong>de</strong> la <strong>de</strong>sviación, mientras que reduce el problema <strong>de</strong> los valores fuera<br />

<strong>de</strong> rango. Por último, la Fig. 6.8(c) muestra la entropía relativa <strong>de</strong> un día<br />

respecto al anterior. Como se pue<strong>de</strong> observar en la figura, este valor <strong>de</strong>cae<br />

<strong>de</strong> forma continua a medida que se incrementa el alcance <strong>de</strong> la predicción;<br />

se observa un gran crecimiento incremental <strong>de</strong> la dispersión los primeros<br />

cinco días, mientras que la dispersión aumenta más lentamente a partir <strong>de</strong>l<br />

quinto día <strong>de</strong> alcance. Este hecho coinci<strong>de</strong> con la saturación indicada por la<br />

<strong>de</strong>sviación típica.<br />

La validación <strong>de</strong>l sistema <strong>de</strong> predicción probabilística por conjuntos ha<br />

mostrado ser superior a un sistema <strong>de</strong>terminista clásico basado en una única<br />

integración (ver, por ejemplo, Richardson, 2000) en el medio plazo. A continuación<br />

se comprueba que este resultado también es cierto cuando se utilizan<br />

los patrones atmosféricos para realizar predicciones locales utilizando el<br />

método <strong>de</strong> downscaling <strong>de</strong>scrito en el Capítulo 5. Para ello, se ha entrenado<br />

una SOM consi<strong>de</strong>rando el patrón <strong>de</strong> la Cuenca Norte <strong>de</strong> la Península Ibérica<br />

mostrado en la Fig. 2.9(c) y se ha aplicado el método <strong>de</strong> downscaling <strong>de</strong>scrito<br />

en la Fig. 6.3 para pre<strong>de</strong>cir el evento P(Precip > 0.1mm) en 100 estaciones<br />

<strong>de</strong> la Cuenca Norte. La Fig. 6.9 muestra los Brier Scores (BS) diarios promediados<br />

para todas la estaciones obtenidos con los 50 miembros, perturbados,


6.4. APLICACIÓN EN LA PREDICCIÓN A MEDIO PLAZO 125<br />

1<br />

D+1 1 D+2 1 D+3<br />

0<br />

0<br />

0<br />

0 BS Control 1 0 BS Control 1 0 BS Control 1<br />

1<br />

D+4 1 D+5 1 D+6<br />

BS EPS<br />

BS EPS<br />

0<br />

0<br />

0<br />

0 BS Control 1 0 BS Control 1 0 BS Control 1<br />

1<br />

D+7 1 D+8 1 D+9<br />

BS EPS<br />

BS EPS<br />

BS EPS<br />

BS EPS<br />

BS EPS<br />

BS EPS<br />

BS EPS<br />

0<br />

0<br />

0<br />

0 BS Control 1 0 BS Control 1 0 BS Control 1<br />

Figura 6.9: Brier Score (BS) <strong>de</strong> la predicción local realizada con todos los miembros<br />

<strong>de</strong>l conjunto (BS EPS) y sólo con el control (BS Control) para alcances entre uno<br />

y nueve días. Los valores representados son las medias para todas la estaciones<br />

principales <strong>de</strong> la Cuenca Norte.<br />

<strong>de</strong> la predicción por conjuntos (etiqueta EPS) y una única predicción dada<br />

por el control (el patrón correspondiente a la condición inicial sin perturbar)<br />

(etiqueta control). En esta figura pue<strong>de</strong> verse que el downscaling realizado<br />

con la predicción por conjuntos es claramente superior al downscaling tradicional,<br />

basado en una única predicción entre los días quinto y octavo, siendo<br />

ligeramente mejor el resto <strong>de</strong> los días. En concreto el noveno día el comportamiento<br />

<strong>de</strong>l sistema <strong>de</strong> predicción por conjuntos comienza a per<strong>de</strong>r pericia<br />

respecto al control.<br />

Por último, se muestra que la medida <strong>de</strong> dispersión <strong>de</strong> la probabilidad<br />

<strong>de</strong> la SOM, <strong>de</strong>finida como la suma <strong>de</strong> la <strong>de</strong>sviación típica y <strong>de</strong> la entropía,<br />

está correlacionada con la predictibilidad <strong>de</strong> la situación correspondiente.<br />

Para ello, en la Fig. 6.10 se muestra la dispersión frente al error BS obtenido<br />

en la respectiva predicción realizada, para los distintos alcances <strong>de</strong>l<br />

mo<strong>de</strong>lo. Se pue<strong>de</strong> observar que a partir <strong>de</strong>l tercer día <strong>de</strong> predicción, aparece<br />

una relación entre, la medida <strong>de</strong> dispersión <strong>de</strong>finida a partir <strong>de</strong> la SOM,<br />

y el error que se produce en la predicción (confianza en la predicción, o<br />

predictibilidad). Esta relación indica que el rango <strong>de</strong> errores posibles crece<br />

linealmente al crecer la dispersión (estos resultados se analizan con más<br />

<strong>de</strong>talle en Cofiño et al., 2003a).


126 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

D+1 D+2 D+3<br />

0<br />

0 1 2 3<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 2 4<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 2 4<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

D+4 D+5 D+6<br />

1 2 3 4 5<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

2 4 6<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

2 4 6<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

D+7 D+8 D+9<br />

0<br />

2 4 6<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

2 4 6<br />

Dispersión<br />

BS<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

2 4 6<br />

Dispersión<br />

Figura 6.10: Brier Score (BS) <strong>de</strong> la predicción local realizada con el conjunto <strong>de</strong><br />

predicciones frente a la medida <strong>de</strong> dispersión (<strong>de</strong>sviación típica mas entropía) para<br />

alcances entre uno y nueve días. Los BS representados son las medias para todas<br />

la estaciones principales <strong>de</strong> la Cuenca Norte.<br />

6.5. Predicción Mensual y Estacional<br />

En secciones anteriores el objetivo <strong>de</strong> la predicción a corto y medio plazo<br />

era estimar numérica o probabilísticamente el valor <strong>de</strong> una cierta variable<br />

atmosférica con una anticipación <strong>de</strong> entre uno y nueve días. Este es el límite<br />

que se suele fijar como umbral <strong>de</strong> predictibilidad <strong>de</strong> la atmósfera 1 , ya que a<br />

tiempos superiores, la no-linealidad <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> circulación atmosférica,<br />

junto con los errores asociados a las observaciones y las aproximaciones<br />

<strong>de</strong> los mo<strong>de</strong>los utilizados, impi<strong>de</strong>n una predicción numérica acertada. Por<br />

tanto, en principio, los términos “predicción mensual” o “predicción estacional”<br />

pue<strong>de</strong>n parecer incorrectos. Sin embargo, aunque no es posible precisar<br />

el valor concreto <strong>de</strong> una cierta variable con una antelación <strong>de</strong> un mes (o<br />

un trimestre), en ocasiones sí resulta posible dar algún tipo <strong>de</strong> información<br />

útil asociada a la misma; por ejemplo, se podría tratar <strong>de</strong> pre<strong>de</strong>cir si el<br />

valor medio <strong>de</strong>l siguiente mes, o trimestre, será significativamente inferior<br />

o superior a la media climatológica correspondiente (es <strong>de</strong>cir, hablando en<br />

términos <strong>de</strong> precipitación, si se espera un mes o estación más húmeda o<br />

1 El límite <strong>de</strong> la predicción a medio plazo (o la predictibilidad <strong>de</strong> la atmósfera, en otras<br />

palabras) no es un valor fijo que haya sido obtenido teóricamente (obsérvese que a<strong>de</strong>más<br />

este valor oscilará temporal y espacialmente). Sin embargo, se suele consi<strong>de</strong>rar entre 10 y<br />

15 días para fines prácticos <strong>de</strong> la predicción operativa.


6.5. PREDICCIÓN MENSUAL Y ESTACIONAL 127<br />

4<br />

2<br />

0<br />

−2<br />

−4<br />

1900 1905 1910 1915 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000<br />

Figura 6.11: Índice <strong>de</strong> Oscilación <strong>de</strong>l Sur (SOI) durante el siglo XX. El índice <strong>de</strong><br />

un mes se <strong>de</strong>fine como (T − D)/s, don<strong>de</strong> T y D son las anomalías mensuales en<br />

Taití y Darwin, respectivamente y S es la varianza <strong>de</strong> T − D para el mes dado.<br />

seca <strong>de</strong> lo normal). Así pues, en este tipo <strong>de</strong> predicciones, se trabaja con<br />

anomalías (estimaciones <strong>de</strong> <strong>de</strong>sviaciones mensuales, o trimestrales, respecto<br />

<strong>de</strong> la climatología) o con su carácter (positivo, normal, o negativo) y no con<br />

valores concretos <strong>de</strong> las variables.<br />

La razón <strong>de</strong> esta predictibilidad estacional es la existencia <strong>de</strong> patrones<br />

sinópticos persistentes, que influyen en la circulación atmosférica a gran<br />

escala, durante largos períodos <strong>de</strong> tiempo. Algunos <strong>de</strong> estos patrones son<br />

dipolares y su estado (positivo o negativo) se pue<strong>de</strong> caracterizar en base a<br />

un índice. Ejemplos <strong>de</strong> estos patrones son:<br />

NAO (North Atlantic Oscillation) (Wanner et al., 2001), característica<br />

<strong>de</strong> latitu<strong>de</strong>s medias y asociada a un patrón alta/baja presión en<br />

Islandia - baja/alta presión en las Azores (ver Capítulo 3, Fig. 3.1).<br />

Este patrón suele <strong>de</strong>finirse a través <strong>de</strong> un índice que caracteriza su fase<br />

y que es obtenido como la diferencia <strong>de</strong> presiones a nivel <strong>de</strong>l mar en<br />

ambos puntos (o como la componente principal asociada a la primera<br />

EOF <strong>de</strong> la presión en 500 mb <strong>de</strong>l Atlántico Norte; ver Capítulo 3, Figs.<br />

3.2 y 3.3).<br />

La NAO posee una marcada variabilidad interanual lo cual posibilita<br />

una hipotética predicción estacional. A causa <strong>de</strong> su notable impacto<br />

sobre el tiempo y clima <strong>de</strong> Europa, existe un creciente interés en <strong>de</strong>terminar<br />

su predictibilidad estacional e interanual. Por <strong>de</strong>sgracia la NAO<br />

es un fenómeno <strong>de</strong> latitu<strong>de</strong>s medias muy ruidoso, con un espectro <strong>de</strong><br />

potencias casi plano, muy parecido a un ruido blanco, <strong>de</strong> manera que<br />

incluso las predicciones posibles con mo<strong>de</strong>los estadísticos, reproducen<br />

sólo un pequeño rango <strong>de</strong> la varianza total (Wunsch, 1999). Por tanto,<br />

un problema <strong>de</strong> es la predicción <strong>de</strong> este patrón, con mo<strong>de</strong>los <strong>de</strong><br />

circulación atmosférica.<br />

ENSO (El Niño-Southern Oscillation) (Philan<strong>de</strong>r, 1990) es un fenómeno<br />

tropical <strong>de</strong>l Pacífico Sur (ver Capítulo 3, Fig. 3.1) caracterizado por<br />

un calentamiento <strong>de</strong>l agua <strong>de</strong> la superficie <strong>de</strong>l Pacífico central y Este<br />

y por la variación a gran escala asociada <strong>de</strong>l sistema <strong>de</strong> presión<br />

atmosférica <strong>de</strong>l trópico (<strong>de</strong>nominado Oscilación <strong>de</strong>l Sur, SO). Este pa-


128 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

Figura 6.12: Precipitación en el Pacífico durante el episodio fuerte <strong>de</strong> El Niño<br />

(Enero-Marzo <strong>de</strong> 1998). La figura izquierda muestra la precipitación total y la<br />

figura <strong>de</strong>recha la <strong>de</strong>sviación en tanto por uno <strong>de</strong>l valor medio (FUENTE: NCEP)<br />

trón se caracteriza tradicionalmente basándose en las diferencias en las<br />

anomalías en la presión <strong>de</strong>l aire entre Tahiti y Darwin. La variabilidad<br />

<strong>de</strong> este índice se muestra en la Fig. 6.11.<br />

El ciclo ENSO tiene un periodo medio <strong>de</strong> cuatro años, aproximadamente,<br />

aunque en el registro histórico, el periodo ha variado entre dos<br />

y siete años. Entre 1980 y 1990 <strong>de</strong>stacó un ciclo ENSO muy activo, con<br />

cinco episodios <strong>de</strong> El Niño,(1982/83, 1986/87, 1991 −1993, 1994/95, y<br />

1997/98) y tres episodios <strong>de</strong> La Niña (1984/85, 1988/89, 1995/96). En<br />

este periodo también tuvieron lugar dos <strong>de</strong> los episodios más fuertes<br />

<strong>de</strong>l siglo (1982/83 y 1997/98), así como dos periodos consecutivos <strong>de</strong><br />

las condiciones <strong>de</strong> El Niño durante 1991 − 1995 sin una intervención<br />

<strong>de</strong> episodio frío. El episodio más fuerte y reciente <strong>de</strong> La Niña fue en<br />

1988/89, y entre las consecuencias más graves <strong>de</strong>l fenómeno <strong>de</strong> El Niño,<br />

están un fuerte incremento <strong>de</strong> las lluvias producidas sobre el sur <strong>de</strong> los<br />

EEUU y en Perú, lo que provoca <strong>de</strong>structivas inundaciones, así como<br />

sequías en el Pacífico Oeste, a veces asociadas a gran<strong>de</strong>s incendios en<br />

Australia. Por ejemplo, la Fig. 6.12 muestra los efectos <strong>de</strong> El Niño<br />

1998 sobre la precipitación en el Pacífico.<br />

En la Tabla 6.1 <strong>de</strong> citan algunos <strong>de</strong> los patrones mas importantes(para<br />

más <strong>de</strong>talles ver www.cpc.ncep.noaa.gov/products).<br />

A<strong>de</strong>más <strong>de</strong> estos patrones, se han <strong>de</strong>scubierto distintas teleconexiones<br />

entre ellos, que inter-relacionan, <strong>de</strong> forma compleja, sus efectos globales<br />

sobre la circulación atmosférica, en distintas regiones <strong>de</strong>l globo (ver, por<br />

ejemplo, Mo and Livezey, 1986).<br />

Los avances producidos en las técnicas <strong>de</strong> predicción por conjuntos han<br />

dado un enorme impulso a los mo<strong>de</strong>los acoplados océano-atmósfera, <strong>de</strong> predicción<br />

estacional, que actualmente permiten pre<strong>de</strong>cir con cierta fiabilidad<br />

anomalías mensuales o estacionales durante ciertas épocas y en ciertas regiones<br />

<strong>de</strong>l globo (asociadas principalmente a anomalías en la ENSO). Estos<br />

resultados han motivado la puesta en marcha operativa, <strong>de</strong> distintos produc-


6.5. PREDICCIÓN MENSUAL Y ESTACIONAL 129<br />

Índice<br />

EA<br />

EAJET<br />

WP<br />

EP<br />

NP<br />

PNA<br />

EA/WR<br />

SCA<br />

TNH<br />

POL<br />

PT<br />

SZ<br />

ASU<br />

Descripción<br />

Patrón <strong>de</strong>l Atlántico Este<br />

Patrón <strong>de</strong>l chorro <strong>de</strong>l Atlántico Este<br />

Patrón <strong>de</strong>l Pacífico Oeste<br />

Patrón <strong>de</strong>l Pacífico Este<br />

Patrón <strong>de</strong>l Pacífico Norte<br />

Patrón Pacífico-NorteAmérica<br />

Patrón <strong>de</strong>l Atlántico Este-Rusia Oeste<br />

Patrón Escandinavia<br />

Patrón Tropical <strong>de</strong>l Hemisferio Norte<br />

Patrón Polar-Eurasia<br />

Patrón <strong>de</strong> Transición <strong>de</strong>l Pacífico<br />

Patrón Subtropical zonal<br />

Patrón <strong>de</strong> Verano <strong>de</strong> Asia<br />

Tabla 6.1: Algunos patrones atmosféricos más importantes (para más <strong>de</strong>talle<br />

ver www.cpc.ncep.noaa.gov/products).<br />

tos <strong>de</strong> predicción estacional en distintos centros internacionales. Por ejemplo,<br />

el mo<strong>de</strong>lo System-II <strong>de</strong>l ECMWF produce predicciones estacionales operativas.<br />

Asimismo también se dispone <strong>de</strong> un re-análisis (DEMETER), <strong>de</strong> un<br />

conjunto <strong>de</strong> seis mo<strong>de</strong>los Europeos globales <strong>de</strong> predicción por conjuntos con<br />

distintos esquemas <strong>de</strong> perturbación (www.ecmwf.int/research/<strong>de</strong>meter/)<br />

(Palmer et al., 2003).<br />

No sólo se ha puesto <strong>de</strong> manifiesto la posibilidad <strong>de</strong> pre<strong>de</strong>cir en cierta<br />

medida los patrones estacionales <strong>de</strong> circulación sinóptica, sino que también,<br />

se ha mostrado su asociación con anomalías regionales y locales <strong>de</strong> precipitación,<br />

y <strong>de</strong> temperatura, tanto <strong>de</strong> la NAO como <strong>de</strong> la ENSO (ver, por<br />

ejemplo, Hurrell, 1995; Rodríguez-Fonseca and Serrano, 1991). Por ejemplo,<br />

si se consi<strong>de</strong>ra por una parte la temperatura media mensual <strong>de</strong>l agua <strong>de</strong>l<br />

mar (SST) frente a la costa <strong>de</strong> Chicama en el Norte <strong>de</strong> Perú (representante<br />

<strong>de</strong> la oscilación sinóptica <strong>de</strong>l ENSO), la precipitación en la ciudad <strong>de</strong> Piura<br />

(medias mensuales) y el caudal <strong>de</strong>l río Piura, se pue<strong>de</strong> comprobar fácilmente<br />

que existe una relación entre estas variables, que permite trasladar anomalías<br />

Precip. Piura (mm/mes)<br />

1000<br />

500<br />

0<br />

14 16 18 20 22 24 26 28<br />

SST Chicama (ºC)<br />

Figura 6.13: Precipitación mensual media en la ciudad <strong>de</strong> Piura (Perú) vs. temperatura<br />

media mensual <strong>de</strong> la superficie <strong>de</strong>l agua <strong>de</strong>l mar frente a la costa <strong>de</strong> Chicama.


130 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

sinópticas a anomalías locales (ver Fig. 6.13). Sin embargo, los efectos en<br />

otras regiones cercanas son distintos e incluso opuestos (épocas <strong>de</strong> sequía<br />

asociadas con los episodios fuertes <strong>de</strong> El Niño en la sierra <strong>de</strong> Perú y en el<br />

altiplano).<br />

Con este ejemplo se pone <strong>de</strong> manifiesto la utilidad <strong>de</strong> disponer <strong>de</strong> técnicas<br />

<strong>de</strong> downscaling, que permitan trasladar las anomalías predichas por los<br />

mo<strong>de</strong>los estacionales a anomalías regionales y locales <strong>de</strong> variables <strong>de</strong> interés<br />

para la actividad humana.<br />

6.5.1. Predicción Local <strong>de</strong> Precipitación durante El Niño<br />

Una dificultad para realizar estudios <strong>de</strong> predicción local a partir <strong>de</strong> predicciones<br />

mensuales y estacionales es que, hasta la fecha, no se disponía<br />

<strong>de</strong> una base <strong>de</strong> datos con predicciones durante un período <strong>de</strong> tiempo suficientemente<br />

representativo. Durante los últimos años, el proyecto Europeo<br />

DEMETER ha creado una base <strong>de</strong> datos con las predicciones estacionales<br />

<strong>de</strong> seis mo<strong>de</strong>los acoplados atmósfera-océano con nueve miembros en cada<br />

caso (obtenidos aplicando distintos esquemas perturbativos). Para ello se ha<br />

utilizado información <strong>de</strong>l re-análisis ERA-40 (1957-2002). Los mo<strong>de</strong>los estacionales<br />

se inicializan con los datos <strong>de</strong> ERA40 cuatro veces al año (Febrero,<br />

Mayo, Agosto y Noviembre) y son integrados para un alcance <strong>de</strong> seis meses,<br />

almacenando las variables que proporcionan una <strong>de</strong>tallada <strong>de</strong>scripción <strong>de</strong> la<br />

atmósfera predicha día a día. En esta sección se realiza un estudio sistemático<br />

<strong>de</strong> la predictibilidad estacional en latitu<strong>de</strong>s tropicales, teniendo en cuenta<br />

el fenómeno <strong>de</strong> El Niño.<br />

80 ° W<br />

60 ° W<br />

40 ° W<br />

°<br />

Sausal <strong>de</strong><br />

Culucán<br />

Morropón<br />

20 ° S<br />

40 ° S<br />

60 ° S<br />

Figura 6.14: Localización geográfica <strong>de</strong> Perú y <strong>de</strong> las dos estaciones que se utilizan<br />

en este trabajo.


6.5. PREDICCIÓN MENSUAL Y ESTACIONAL 131<br />

5<br />

0<br />

5<br />

10<br />

15<br />

20<br />

(a)<br />

90 85 80 75 70<br />

5<br />

5<br />

0<br />

0<br />

5<br />

5<br />

10<br />

10<br />

15<br />

(b)<br />

20<br />

85 80 75 70 65<br />

15<br />

(c)<br />

20<br />

85 80 75 70 65<br />

Figura 6.15: Rejillas consi<strong>de</strong>radas para la <strong>de</strong>finición <strong>de</strong>l patrón atmosférico en la<br />

zona Norte <strong>de</strong> Perú.<br />

Para ello, se consi<strong>de</strong>ra la región Norte <strong>de</strong> Perú que se muestra en la Fig.<br />

6.14, don<strong>de</strong> se dispone <strong>de</strong> datos diarios <strong>de</strong> precipitación para dos estaciones:<br />

Sausal <strong>de</strong> Culucán y Morropón.<br />

Para aplicar la técnica basada en re<strong>de</strong>s auto-organizativas <strong>de</strong>scrita en<br />

la Sec. 6.3 se consi<strong>de</strong>ran distintas rejillas sobre la zona <strong>de</strong> interés <strong>de</strong> diferentes<br />

resoluciones y coberturas (ver Fig. 6.15). Sobre cada una <strong>de</strong> ellas se<br />

entrenaron distintas re<strong>de</strong>s auto-organizativas con los patrones <strong>de</strong> re-análisis<br />

<strong>de</strong>l período 1957-2002. Una vez realizado todo el estudio se comprobó que,<br />

<strong>de</strong> nuevo, los mejores resultado se obtuvieron con el patrón local (en este<br />

con la rejilla dinámica <strong>de</strong> la Fig. 6.15(c)). Por ejemplo, la Fig. 6.16 muestra<br />

los histogramas fenomenológicos <strong>de</strong>finidos por la precipitación observada en<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

(a) Morropón<br />

25<br />

20<br />

15<br />

10<br />

5<br />

1 0 1<br />

1 2 3 4 5 6 7 8<br />

1 2 3 4 5 6 7 8<br />

8<br />

7<br />

6<br />

5<br />

4<br />

3<br />

2<br />

(b) Sausal <strong>de</strong> Culucán<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

0.5<br />

0<br />

Precip (mm/day)<br />

Figura 6.16: Histogramas fenomenológicos <strong>de</strong> la precipitación en (a) Morropón y<br />

(b) Sausal <strong>de</strong> Culucán obtenidos sobre una SOM (el valor <strong>de</strong> cada grupo se obtiene<br />

como el promedio <strong>de</strong> los días pertenecientes al grupo).


132 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

1979<br />

...<br />

1993<br />

CIRCULATION<br />

PATTERNS<br />

DATABASE<br />

ERA15<br />

reanalisys<br />

1979-1993<br />

CLUSTERING<br />

C 1 , ..., C m<br />

SELF-ORGANIZING<br />

MAP (SOM)<br />

Topological arrangement<br />

in a 2D lattice (e.g. m=36)<br />

C1 C2 ...<br />

DEMETER<br />

multi-mo<strong>de</strong>l<br />

GCM FORECAST<br />

UKMO ECMWF MPI CNRM<br />

5535 PATTERNS<br />

f1 f 2 ...<br />

f1 f 2 ...<br />

f1 f 2 ...<br />

f1 f 2 ...<br />

C36<br />

1979<br />

f36<br />

f36<br />

f36<br />

f36<br />

...<br />

1993<br />

Daily rainfall<br />

observations<br />

LOCAL CLIMATE<br />

RECORDS DATABASE<br />

Estimation for<br />

each cluster<br />

and station:<br />

y 1 , ..., y m<br />

LOCAL FORECAST<br />

Figura 6.17: Esquema <strong>de</strong> downscaling para DEMETER. Cada mo<strong>de</strong>lo produce 9<br />

patrones atmosféricos diarios durante un período <strong>de</strong> seis meses.<br />

cada una <strong>de</strong> las estaciones sobre una SOM entrenada con la rejilla local.<br />

Estas dos “huellas digitales” muestran las distintas formas <strong>de</strong> llover que se<br />

producen en dos estaciones tan cercanas.<br />

En este trabajo se utilizan sólo los mo<strong>de</strong>los <strong>de</strong>l ECMWF, Météo France,<br />

UKMet Office y Max Plank Institute <strong>de</strong> DEMETER, con nueve miembros<br />

en cada uno. Dado que el fenómeno <strong>de</strong> El Niño tiene especial inci<strong>de</strong>ncia<br />

en el Norte <strong>de</strong> Perú a principios <strong>de</strong> año, se consi<strong>de</strong>ran las predicciones <strong>de</strong><br />

los mo<strong>de</strong>los realizadas en Noviembre para el trimestre Diciembre-Febrero;<br />

por tanto, se tratan <strong>de</strong> pre<strong>de</strong>cir las anomalías locales <strong>de</strong> precipitación a<br />

partir <strong>de</strong> predicciones obtenidas entre uno y tres meses <strong>de</strong> anticipación.<br />

En este caso, se tienen varias opciones para combinar esta información. Se<br />

pue<strong>de</strong> consi<strong>de</strong>rar cada mo<strong>de</strong>lo por separado y añadir un nuevo mo<strong>de</strong>lo, que<br />

consiste en la mezcla <strong>de</strong> todos (multi-mo<strong>de</strong>lo), y luego comparar la eficiencia<br />

<strong>de</strong> todos los mo<strong>de</strong>los frente al multi-mo<strong>de</strong>lo. La Fig. 6.17 muestra el proceso<br />

seguido en este caso.<br />

En la Fig. 6.18 se muestran los resultados obtenidos. Para cada trimestre<br />

Diciembre-Febrero <strong>de</strong> cada año <strong>de</strong>l período 1983-1998 se consi<strong>de</strong>raron las<br />

predicciones obtenidas para los 90 días por cada miembro <strong>de</strong> cada mo<strong>de</strong>lo.<br />

Por tanto, cada trimestre se obtuvieron 9 predicciones para cada mo<strong>de</strong>lo <strong>de</strong><br />

las cuales se obtuvo el valor promedio, que es consi<strong>de</strong>rado como la predicción<br />

<strong>de</strong>l mo<strong>de</strong>lo; por otra parte, se consi<strong>de</strong>ró la predicción conjunta dada por<br />

todos los mo<strong>de</strong>los (la media <strong>de</strong> las predicciones <strong>de</strong> cada uno <strong>de</strong> los mo<strong>de</strong>los).<br />

La observación real (cuando está disponible) se muestra en la línea central<br />

con un cuadrado, mientras que la predicción <strong>de</strong>l multi-mo<strong>de</strong>lo se muestra<br />

con una cruz. Las cajas muestran los respectivos cuartiles <strong>de</strong> precipitación en


6.5. PREDICCIÓN MENSUAL Y ESTACIONAL 133<br />

15<br />

10<br />

5<br />

0<br />

200<br />

100<br />

0<br />

MORROPON<br />

Observation<br />

Multi-mo<strong>de</strong>l forecast<br />

ECMWF forecast<br />

UK MetOffice forecast<br />

MPI forecast<br />

CNRM forecast<br />

Analysis: Nov.<br />

Forecast: Dec,Jan,Feb<br />

(missing data)<br />

79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99<br />

SAUSAL DE CULUCAN<br />

79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99<br />

mm (daily)<br />

mm<br />

(DJF average<br />

daily values)<br />

10<br />

5<br />

mm<br />

(DJF average<br />

daily values)<br />

0<br />

200<br />

100<br />

0<br />

Analysis: Nov.<br />

Forecast: Dec,Jan,Feb<br />

mm (daily)<br />

Figura 6.18: Predicción local <strong>de</strong> precipitación en Morropón y Sausal <strong>de</strong> Culucán<br />

para los cuatro mo<strong>de</strong>los y para el multi-mo<strong>de</strong>lo en el período 1983-1998.


134 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

la estación consi<strong>de</strong>rada, para todo el período <strong>de</strong> estudio. Por tanto, cuando<br />

la predicción está por encima <strong>de</strong> cuartil 75, o por <strong>de</strong>bajo <strong>de</strong>l 25, se consi<strong>de</strong>ra<br />

que se está prediciendo una anomalía positiva, o negativa, <strong>de</strong> precipitación,<br />

respectivamente. A partir <strong>de</strong> esta figura se pue<strong>de</strong> observar que el sistema<br />

predice con acierto la anomalía positiva <strong>de</strong> precipitación durante los dos<br />

episodios <strong>de</strong> El Niño fuertes <strong>de</strong> los años 1982/83 y 1997/98.<br />

A<strong>de</strong>más también se ha probado que durante estos dos episodios <strong>de</strong> El<br />

Niño, se podía pre<strong>de</strong>cir la anomalía positiva con mayor anticipación. Por<br />

ejemplo, la Fig. 6.19 muestra las situaciones predichas para los trimestres<br />

Diciembre-Febrero <strong>de</strong> los años 1982/83 y 1997/98 en las estaciones <strong>de</strong> Morropón<br />

y Sausal <strong>de</strong> Culucán, con una anticipación <strong>de</strong> 4-6 meses (predicción<br />

<strong>de</strong> Agosto). En estas figuras pue<strong>de</strong> observarse que sólo el mo<strong>de</strong>lo Francés<br />

CNRM y el multi-mo<strong>de</strong>lo son capaces <strong>de</strong> pre<strong>de</strong>cir la anomalía <strong>de</strong> precipitación<br />

para el año 1982/83 en la estación <strong>de</strong> Morropón, mientras que todos los<br />

mo<strong>de</strong>los proporcionan el valor correcto <strong>de</strong> la anomalía para el año 1997/98<br />

(ver Cofiño et al., 2003d, para más información).<br />

DJF83<br />

DJF98<br />

DJF83<br />

DJF98<br />

Figura 6.19: Predicción local <strong>de</strong> precipitación en Morropón y Sausal <strong>de</strong> Culucán<br />

para los cuatro mo<strong>de</strong>los y para el multi-mo<strong>de</strong>lo en los períodos 1982/83 y 1997/98<br />

obtenidos con la predicción <strong>de</strong> Agosto <strong>de</strong> los mo<strong>de</strong>los (4 meses <strong>de</strong> anticipación).<br />

De forma análoga al estudio realizado en el caso <strong>de</strong> predicción a medio<br />

plazo para caracterizar la predictibilidad <strong>de</strong> las predicciones, en este se<br />

consi<strong>de</strong>ran las probabilida<strong>de</strong>s <strong>de</strong>finidas en la SOM por cada uno <strong>de</strong> los mo<strong>de</strong>los.<br />

La Fig. 6.20 muestra los histogramas <strong>de</strong>finidos sobre la SOM por los


6.5. PREDICCIÓN MENSUAL Y ESTACIONAL 135<br />

DEMETER DJF. H=1.9702<br />

8<br />

6<br />

DEMETER DJF90. H= 2.675<br />

8<br />

6<br />

DEMETER DJF98. H=2.151<br />

8<br />

6<br />

4<br />

4<br />

4<br />

2<br />

2 4 6 8<br />

2<br />

2 4 6 8<br />

2<br />

2 4 6 8<br />

8<br />

SCWF DJF<br />

8<br />

SCWF DJF90<br />

8<br />

SCWF DJF98<br />

6<br />

6<br />

6<br />

4<br />

4<br />

4<br />

2<br />

2<br />

2<br />

8<br />

2 4 6 8<br />

SMPI DJF<br />

8<br />

2 4 6 8<br />

SMPI DJF90<br />

8<br />

2 4 6 8<br />

SMPI DJF98<br />

6<br />

6<br />

6<br />

4<br />

4<br />

4<br />

2<br />

2<br />

2<br />

8<br />

2 4 6 8<br />

UKMO DJF<br />

8<br />

2 4 6 8<br />

UKMO DJF90<br />

8<br />

2 4 6 8<br />

UKMO DJF98<br />

6<br />

6<br />

6<br />

4<br />

4<br />

4<br />

2<br />

2<br />

2<br />

2 4 6 8<br />

2 4 6 8<br />

2 4 6 8<br />

8<br />

CNRM DJF<br />

8<br />

CNRM DJF90<br />

8<br />

CNRM DJF98<br />

6<br />

6<br />

6<br />

4<br />

4<br />

4<br />

2<br />

2<br />

2<br />

2 4 6 8<br />

2 4 6 8<br />

2 4 6 8<br />

Figura 6.20: Histogramas <strong>de</strong>finidos sobre la SOM por los patrones previstos para<br />

el periodo Diciembre-Febrero por el multi-mo<strong>de</strong>lo DEMETER (primera fila) y<br />

cada uno <strong>de</strong> los cuatro mo<strong>de</strong>los individuales. La columna <strong>de</strong> la izquierda muestra<br />

la climatología (periodo 1983-1998); la columna central muestra un año no Niño<br />

(similar a la climatología); la columna <strong>de</strong> la <strong>de</strong>recha muestra el trimestre <strong>de</strong> un año<br />

Niño. En la primera fila se muestran las entropías <strong>de</strong> cada probabilidad.


136 6. PREDICCIÓN POR CONJUNTOS. REDES AUTO-ORGANIZATIVAS<br />

5<br />

4<br />

Entropía relativa<br />

3<br />

2<br />

1<br />

0<br />

82 84 86 88 90 92 94 96 98<br />

Figura 6.21: Entropía relativa <strong>de</strong> cada mo<strong>de</strong>lo cada año respecto a la climatología<br />

<strong>de</strong> DEMETER. Los colores <strong>de</strong> los mo<strong>de</strong>los son los mismos que en figuras anteriores.<br />

Año<br />

patrones previstos para el periodo Diciembre-Febrero por el multi-mo<strong>de</strong>lo<br />

DEMETER (primera fila) y cada uno <strong>de</strong> los cuatro mo<strong>de</strong>los individuales<br />

con 1-3 meses <strong>de</strong> anticipación. La columna <strong>de</strong> la izquierda muestra la climatología<br />

(periodo 1983-1998); la columna central muestra el año no Niño<br />

1989/90 (similar a la climatología); la columna <strong>de</strong> la <strong>de</strong>recha muestra el<br />

trimestre <strong>de</strong>l año Niño 1997/98. La Fig. 6.21 muestra la entropía relativa<br />

<strong>de</strong>l histograma <strong>de</strong> cada mo<strong>de</strong>lo respecto al histograma <strong>de</strong> la climatología <strong>de</strong><br />

DEMETER. En esta figura se pue<strong>de</strong> comprobar que este índice es un buen<br />

indicador <strong>de</strong> la predictibilidad <strong>de</strong> cada situación.<br />

Por último, indicar que un estudio <strong>de</strong> la aplicación <strong>de</strong> esta técnica en<br />

latitu<strong>de</strong>s medias se tienen en (Díaz et al., 2003).


CAPÍTULO 7<br />

Implementación Operativa. El Sistema PROMETEO<br />

7.1. Introducción<br />

En capítulos anteriores se han <strong>de</strong>scrito los aspectos teóricos <strong>de</strong> la predicción<br />

local probabilística en el corto plazo (Cap. 5) y <strong>de</strong> la aplicación <strong>de</strong> las<br />

re<strong>de</strong>s auto-organizativas a la interpretación <strong>de</strong> la predicción por conjuntos<br />

y más concretamente, a la predicción estacional (Cap. 6). En esos capítulos<br />

se ha mostrado la vali<strong>de</strong>z científica <strong>de</strong> los métodos presentados y también<br />

su utilidad práctica en la predicción operativa. Para ello, se han aplicado<br />

los métodos <strong>de</strong>scritos en estos capítulos a la salida <strong>de</strong> mo<strong>de</strong>los numéricos<br />

operativos (ECMWF y HIRLAM) y a diferentes re<strong>de</strong>s <strong>de</strong> observación (INM<br />

y Perú). A<strong>de</strong>más se han validado los resultados obtenidos, comparándolos<br />

con los <strong>de</strong> otros productos operativos existentes. Todos los algoritmos, <strong>de</strong> los<br />

métodos propuestos en estos capítulos, se han implementado utilizando el<br />

paquete <strong>de</strong> cálculo científico Matlab (por sus prestaciones gráficas y científicas,<br />

como se muestra, por ejemplo, en Middleton (2000)) y aquellas partes<br />

que exigen mayor carga computacional se han codificado en C, para luego<br />

po<strong>de</strong>r ser utilizadas <strong>de</strong>s<strong>de</strong> Matlab, <strong>de</strong>bido a que Matlab posee esta facilidad.<br />

Todo ello siempre sobre la i<strong>de</strong>a <strong>de</strong> que el producto final sea genérico, fácilmente<br />

adaptable, que pueda ser integrado fácilmente en el ciclo operativo<br />

<strong>de</strong> producción <strong>de</strong> cualquier centro meteorológico y aplicado a un problema<br />

particular que pueda tener cualquier usuario. Todos estos algoritmos han<br />

sido codificados en un conjunto <strong>de</strong> herramientas para Matlab, <strong>de</strong>nominado<br />

MeteoLab y que se <strong>de</strong>scribe en Sección 7.3, a este conjunto se le pue<strong>de</strong> consi<strong>de</strong>rar<br />

como el núcleo científico que nos permite diseñar diferentes tipos <strong>de</strong><br />

experimentos, para luego su aplicación operativa.<br />

Sin embargo, para que los resultados prácticos <strong>de</strong> esta Tesis tengan máxima<br />

divulgación y sean <strong>de</strong> utilidad para los distintos usuarios y sectores <strong>de</strong><br />

producción (agrario, industrial, energético, turismo, etc.), se ha optado por<br />

137


138 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

la Web como medio <strong>de</strong> divulgación, <strong>de</strong>bido a su gran difusión en la sociedad,<br />

y ser el medio idóneo para este objetivo. Para ello se ha hecho necesario<br />

crear una aplicación Web con la que se puedan consultar las predicciones en<br />

tiempo real y estas puedan ser validadas para un problema dado, <strong>de</strong> forma<br />

que se pueda comprobar la utilidad <strong>de</strong>l sistema. A<strong>de</strong>más, se ha hecho uso<br />

<strong>de</strong> las tecnologías más utilizadas actualmente en Internet que, por una parte,<br />

permiten acce<strong>de</strong>r a bases <strong>de</strong> datos (que almacenarían las predicciones)<br />

y, por otra, permiten ejecutar la aplicación con unos parámetros concretos<br />

<strong>de</strong> interés (región geográfica, patrón atmosférico, etc...) obteniendo las<br />

predicciones como resultado. En la Sec. 7.2.3 se <strong>de</strong>scribe este <strong>de</strong>sarrollo.<br />

Si a<strong>de</strong>más <strong>de</strong> enten<strong>de</strong>r la Web como un medio <strong>de</strong> divulgación, se entien<strong>de</strong><br />

como un medio <strong>de</strong> compartir recursos (potencia <strong>de</strong> cálculo y almacenamiento),<br />

en la que existen productores y consumidores <strong>de</strong> estos recursos, emerge<br />

lo que actualmente se <strong>de</strong>nomina Tecnología GRID, cuyo objetivo es dar soporte<br />

a esta interacción entre productores y consumidores. Bajo esta i<strong>de</strong>a<br />

se han llevado a cabo los primeros experimentos con la tecnología GRID<br />

para permitir una interacción en tiempo real con el sistema, paralelizando<br />

aquellas partes más costosas (componentes principales, agrupamiento, etc.)<br />

y permitiendo el acceso a bases <strong>de</strong> datos distribuidas. Estos experimentos<br />

son <strong>de</strong>scritos en la Sección 7.5.<br />

Todos estos componentes están englobados por un sistema <strong>de</strong>nominado<br />

Prometeo, y cuyo principal fundamento es la organización tanto <strong>de</strong> los datos,<br />

como <strong>de</strong> los procesos que intervienen y <strong>de</strong> todo el flujo <strong>de</strong> información<br />

que intervienen en cualquier experimento o funcionamiento operativo. Como<br />

ejemplo global <strong>de</strong>l sistema, que nos ayudará a enten<strong>de</strong>r su estructura, en la<br />

Sección 7.2 se <strong>de</strong>scribe, la adaptación hecha en colaboración con el Instituto<br />

Nacional <strong>de</strong> Meterología (INM) para la predicción local diaria en una<br />

red <strong>de</strong> 2500 estaciones en la Península, Baleares y Canarias. Esta aplicación<br />

forma parte <strong>de</strong>l ciclo operativo que tiene lugar en el INM y genera diariamente<br />

predicciones operativas con los mo<strong>de</strong>los que se utilizan en el INM<br />

(HIRLAM, con sus respectivas pasadas <strong>de</strong> la 00UTC y 12UTC con alcances<br />

<strong>de</strong> D+0 y D+1 y los alcances <strong>de</strong> D+2 y D+3 <strong>de</strong>l mo<strong>de</strong>lo operativo <strong>de</strong>l<br />

ECMWF cuya pasada es a las 12UTC). Con estas predicciones numéricas<br />

se realizan predicciones locales para las doce cuencas hidrográficas (diez en<br />

la Península, una para Baleares y otra en Canarias), cada una <strong>de</strong> las cuales<br />

tiene asociado su correspondiente patrón atmosférico. En total se realizan<br />

unas 162500 predicciones diarias (5 salidas numéricas, 2500 observatorios,<br />

y 13 predicciones para cada estación: 6 para precipitación y 7 meteoros). A<br />

la vista <strong>de</strong> la magnitud <strong>de</strong> los datos es evi<strong>de</strong>nte que, si el objetivo es que<br />

el sistema funcione en modo operativo interactivamente, es importante la<br />

organización y la estructura <strong>de</strong> los datos para un acceso rápido y eficiente.


7.2. ESTRUCTURA DE LA APLICACIÓN. SISTEMA OPERATIVO EN EL INM 139<br />

7.2. Estructura <strong>de</strong> la Aplicación. Sistema Operativo en el<br />

INM<br />

En esta sección se <strong>de</strong>scribe la estructura <strong>de</strong>l sistema PROMETEO<br />

(PROnóstico METEOrológico) utilizando como ejemplo la versión configurada<br />

para la predicción local diaria en el INM. Se comienza <strong>de</strong>scribiendo la<br />

fase <strong>de</strong> preproceso y las tareas involucradas, y se finaliza con el sistema <strong>de</strong><br />

consulta Web para predicciones operativas. Para evitar problemas <strong>de</strong> confusión<br />

en la <strong>de</strong>scripción <strong>de</strong>l sistema, usaremos únicamente las salidas <strong>de</strong>l<br />

mo<strong>de</strong>lo operativo y el re-análisis ERA-15 <strong>de</strong>l ECMWF. A<strong>de</strong>más, la base <strong>de</strong><br />

datos <strong>de</strong> observaciones estará limitada a aproximadamente 2500 estaciones<br />

operativas <strong>de</strong> la red secundaria <strong>de</strong>l INM. La Fig. 7.1 muestra la estructura<br />

global <strong>de</strong> la aplicación, <strong>de</strong>stacando sus cuatro módulos (A)-(D). En las<br />

siguientes secciones se <strong>de</strong>scriben en <strong>de</strong>talle cada uno <strong>de</strong> estos módulos.<br />

A<br />

SE SE<br />

ECMWF<br />

Reanálisis ERA<br />

B<br />

SE<br />

ECMWF SE<br />

Mo<strong>de</strong>lo operativo<br />

C<br />

operativo<br />

D+1<br />

D+2<br />

D+3<br />

1<br />

dominios<br />

CPLab<br />

2<br />

Cuenca Norte<br />

Cuenca Duero<br />

Cuenca Norte<br />

D+3<br />

Cuenca Duero<br />

D+3<br />

SE SE<br />

SE SĖ ..<br />

...<br />

cluster<br />

3<br />

Predicciones<br />

locales y validación<br />

Observaciones INM<br />

SE<br />

Precip. SE<br />

SE SE<br />

SE<br />

Nieve Tormenta SE<br />

Predicción<br />

Local<br />

D+3<br />

SE pred.<br />

locales<br />

4<br />

SE SE<br />

Validación<br />

5<br />

Validación<br />

D<br />

6<br />

Aplicación Web<br />

Figura 7.1: Estructura global <strong>de</strong> la aplicación PROMETEO con las etapas: (A)<br />

configuración, (B) producción operativa, (C) consulta a través <strong>de</strong> la Web, y (D)<br />

validación.<br />

7.2.1. Configuración e Inicialización <strong>de</strong>l Sistema<br />

En esta sección se <strong>de</strong>scribe la fase inicial <strong>de</strong> configuración y adaptación<br />

<strong>de</strong>l sistema a un entorno concreto (zona geográfica, variables, bases <strong>de</strong> datos,<br />

etc.). El sistema está basado en el método <strong>de</strong>scrito en la Sec. 5.4 y, por tanto,<br />

a ella se remite al lector para consultar <strong>de</strong>talles sobre los algoritmos. Más<br />

en concreto, en esta sección se <strong>de</strong>scriben los elementos que intervienen para<br />

configurar la aplicación para la predicción local en la red secundaria <strong>de</strong>l INM<br />

a partir <strong>de</strong> las predicciones numéricas <strong>de</strong>l ECMWF. En este módulo se utiliza<br />

la base <strong>de</strong> datos <strong>de</strong> re-análisis ERA-15 <strong>de</strong>l ECMWF, <strong>de</strong>scritas en la Sec. 2.7,<br />

que compren<strong>de</strong> el período 1979-1994 (5569 días en total). Primero, se <strong>de</strong>fine


140 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

el patrón que caracterizará el estado <strong>de</strong> la atmósfera para el problema en<br />

cuestión (tarea 1 en Fig. 7.2); a continuación en la tarea 2 se aplica el<br />

algoritmo <strong>de</strong> componentes principales (Sec. 3.2) para reducir la dimensión<br />

<strong>de</strong> los patrones y, finalmente, se aplica la técnica <strong>de</strong> agrupamiento apropiada<br />

sobre cada uno <strong>de</strong> los vectores <strong>de</strong> componentes principales obtenidos (tarea<br />

3). Este módulo es el que contiene el núcleo <strong>de</strong>l sistema y será necesario<br />

ejecutarlo cada vez que queramos para re-adaptarlo a un nuevo problema o<br />

a una nueva situación. Esta tarea se realizará una única vez, previamente a<br />

la fase operativa <strong>de</strong> la aplicación (la obtención diaria <strong>de</strong> predicciones).<br />

Cuenca Norte<br />

SE SE<br />

SE SE<br />

ECMWF<br />

Reanálisis ERA<br />

1<br />

dominios<br />

CPLab<br />

2<br />

Cuenca Duero<br />

SE SĖ ..<br />

cluster<br />

3<br />

Figura 7.2: Módulo <strong>de</strong> configuración e inicialización, con la <strong>de</strong>finición <strong>de</strong>l patrón<br />

atmosférico abarcando un dominio dado (tarea 1), la compresión <strong>de</strong> información<br />

aplicando componentes principales (2), y la ejecución <strong>de</strong> la técnica <strong>de</strong> agrupamiento<br />

apropiada (3).<br />

La figura 7.2 muestra esquemáticamente este módulo. En esta figura<br />

po<strong>de</strong>mos ver la base <strong>de</strong> datos <strong>de</strong> re-análisis y los 3 módulos siguientes:<br />

1. dominios. Es el encargado <strong>de</strong> extraer los datos necesarios para <strong>de</strong>finir<br />

el patrón atmosférico a partir <strong>de</strong> la base <strong>de</strong> datos <strong>de</strong> re-análisis y<br />

aglutinar la información en forma vectorial. En el Ejemplo 2.1 se había<br />

visto la forma <strong>de</strong> <strong>de</strong>finir un patrón atmosférico concreto ilustrando su<br />

aplicación sobre la península ibérica. En el Cap. 5 se mostró que los<br />

mejores resultados <strong>de</strong> predicción local se obtienen con un patrón 4D<br />

<strong>de</strong> área limitada. Por ello, consi<strong>de</strong>ramos 12 dominios distintos (uno<br />

para cada cuenca) tal como se muestra en la Fig. 7.3.<br />

Para ello se ha <strong>de</strong> especificar en un fichero <strong>de</strong> dominio la región geográfica<br />

<strong>de</strong> interés (cuadrícula longitud-latitud, resolución y nodos a<br />

incluir), las variables, las horas <strong>de</strong> análisis, y los niveles <strong>de</strong> presión<br />

(en la figura 7.4 se muestra un ejemplo <strong>de</strong> <strong>de</strong>finición <strong>de</strong> configuración<br />

atmosférica para la Cuenca Norte). Este es el fichero que usa como<br />

entrada el módulo “dominio”.<br />

Este fichero <strong>de</strong>fine un patrón atmosférico <strong>de</strong> 1 o <strong>de</strong> resolución en longitud<br />

y latitud; tres niveles en altura 1000mb, 850mb, y 500mb; cinco<br />

horas <strong>de</strong> análisis 06, 12, 18, 24, y 30 UTC; y cinco variables Temperatura<br />

(T, parámetro 129), geopotencial (Z, parámetro 130), coor<strong>de</strong>nadas<br />

<strong>de</strong>l viento (U y V, parámetros 131 y 132, respectivamente) y humedad


7.2. ESTRUCTURA DE LA APLICACIÓN. SISTEMA OPERATIVO EN EL INM 141<br />

60 N<br />

(a)<br />

50 N<br />

40 N<br />

30 N<br />

20 W<br />

10 W<br />

0<br />

10 E<br />

20 E<br />

(b)<br />

Figura 7.3: (a) Región geográfica <strong>de</strong> la Cuenca Norte utilizada para la aplicación<br />

Prometeo. (b) Observatorios disponibles en la región.<br />

relativa (H, parámetro 157). El patrón 4D resultante es:<br />

x = (x 06 ,x 12 ,x 18 ,x 24 ,x 30 ), (7.1)<br />

don<strong>de</strong> x t = (T 1000<br />

t , T 850<br />

t , T 500<br />

t , . . .,H 1000<br />

t , H 8500<br />

t , H 500<br />

t ).<br />

2. CPLab. Una vez se ha “filtrado” la base <strong>de</strong> datos <strong>de</strong> re-análisis extrayendo<br />

los patrones (Expresión 7.1) con el módulo dominio, se aplica<br />

un análisis <strong>de</strong> componentes principales con el objetivo <strong>de</strong> reducir la<br />

dimensión <strong>de</strong> los patrones. Dado que esta dimensión pue<strong>de</strong> ser muy<br />

elevada y los patrones pue<strong>de</strong>n contener mucha información redundante<br />

(<strong>de</strong>bido a las gran<strong>de</strong>s correlaciones espaciales que existen en los<br />

datos atmosféricos), es probable obtener matrices <strong>de</strong> covarianza mal<br />

condicionadas, que dificulten la aplicación <strong>de</strong> técnicas estándar. En<br />

este módulo se ha utilizado una técnica iterativa para calcular los primeros<br />

valores singulares. Antes <strong>de</strong> aplicar este análisis es necesario<br />

estandarizar los datos para evitar que las variables con mayor magnitud<br />

dominen al resto. Como resultado <strong>de</strong> este proceso obtenemos<br />

datos necesarios para po<strong>de</strong>r aplicar la misma transformación (matriz<br />

<strong>de</strong> transformación, media y <strong>de</strong>sviación <strong>de</strong> los datos) a las salidas <strong>de</strong><br />

otros mo<strong>de</strong>los numéricos, como por ejemplo el operativo <strong>de</strong>l ECMWF,<br />

que se usa en la etapa <strong>de</strong> explotación <strong>de</strong> la aplicación.<br />

3. cluster (k-medias/SOM). Este módulo es el encargado <strong>de</strong> realizar y almacenar<br />

los resultados <strong>de</strong> agrupar los datos <strong>de</strong> re-análisis <strong>de</strong>spués <strong>de</strong>


142 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

lon=-10,-9,-8,-7,-6,-5,-4,-3,-2,-1,0,1,2,3,4<br />

lat=44,43,42,41,40,39,38,37,36<br />

lvl=1000,850,500<br />

tim=06,12,18,24,30<br />

par=129,130,131,132,157<br />

lop=par,tim,lvl<br />

nod=2,3,4,5,6,7,8,9,17,18,19,20,21,22,23,24,32,33,34<br />

src=../SourceDB/era10<br />

Figura 7.4: Definición <strong>de</strong> la configuración atmosférica <strong>de</strong> un patrón que abarca la<br />

cuenca norte en la península ibérica, consi<strong>de</strong>rando para un día, los patrones 4D <strong>de</strong><br />

cinco variables, para 5 horas <strong>de</strong> análisis distintas, en tres niveles <strong>de</strong> altura.<br />

haber sido filtrados y comprimidos. En este módulo se <strong>de</strong>finen el número<br />

<strong>de</strong> grupos que vamos a realizar, y los parámetros <strong>de</strong> entrenamiento<br />

<strong>de</strong>l algoritmo <strong>de</strong> agrupamiento (para k-medias); en el caso <strong>de</strong> utilizar<br />

una SOM también es necesario indicar la topología y el parámetro <strong>de</strong><br />

vecindad. Debido a la exigencia computacional <strong>de</strong> esta tarea, es necesario<br />

guardar los distintos agrupamientos realizados (centros, etc.),<br />

junto con información auxiliar necesaria para su posterior uso.<br />

Por otra parte, los problemas <strong>de</strong> inicialización en los algoritmos iterativos<br />

<strong>de</strong> agrupamiento, hacen conveniente realizar varios entrenamientos<br />

y evaluarlos posteriormente con el módulo <strong>de</strong> validación para contrastar<br />

la calidad <strong>de</strong> cada uno <strong>de</strong> ellos.<br />

En la aplicación para el INM, los procesos anteriores se han aplicado<br />

a cada una <strong>de</strong> las 12 cuencas hidrográficas, almacenando las CPs <strong>de</strong>l reanálisis,<br />

la matriz <strong>de</strong> transformación, y los agrupamientos realizados.<br />

Esta fase <strong>de</strong> configuración e inicialización, es la que exige una mayor<br />

capacidad <strong>de</strong> cómputo y <strong>de</strong> almacenamiento, y la que marcará más a<strong>de</strong>lante<br />

la interactividad <strong>de</strong>l sistema, aplicando otro paradigma <strong>de</strong> computación<br />

(GRID). Toda esta información almacenada, para hacer el sistema interactivo,<br />

es utilizada en el siguiente proceso <strong>de</strong> explotación operativa.<br />

7.2.2. Explotación Operativa<br />

Este módulo es el encargado <strong>de</strong> obtener las predicciones locales. En la<br />

figura 7.5 se pue<strong>de</strong> observar su estructura, incluyendo su tarea principal<br />

predicción local. Este módulo requiere la configuración e inicialización previa<br />

<strong>de</strong>l sistema, que conlleva la <strong>de</strong>finición <strong>de</strong>l dominio (o dominios) y <strong>de</strong><br />

las correspondientes componentes principales y <strong>de</strong>l agrupamiento a utilizar<br />

(línea discontinua <strong>de</strong> la figura).<br />

En esta fase se precisan las salidas diarias (predicciones numéricas) <strong>de</strong><br />

un mo<strong>de</strong>lo operativo. En esta aplicación se utiliza el mo<strong>de</strong>lo operativo <strong>de</strong>l<br />

ECMWF en la pasada <strong>de</strong> las 12 UTC y para un alcance <strong>de</strong> 10 días, con salida


7.2. ESTRUCTURA DE LA APLICACIÓN. SISTEMA OPERATIVO EN EL INM 143<br />

Observaciones INM<br />

SE<br />

Precip. SE<br />

SE SE Nieve<br />

SE<br />

Tormenta SE<br />

SE SE<br />

ECMWF<br />

operativo<br />

Mo<strong>de</strong>lo operativo<br />

D+1<br />

D+2<br />

D+3<br />

dominios<br />

CPLab<br />

Cuenca Norte<br />

D+3<br />

Cuenca Duero<br />

D+3<br />

...<br />

cluster<br />

Predicciones<br />

locales<br />

Predicción<br />

Local<br />

D+3<br />

SE pred.<br />

locales<br />

4<br />

Figura 7.5: Módulo <strong>de</strong> explotación operativa <strong>de</strong> la aplicación Prometeo.<br />

cada 6 horas, y un dominio espacial global. De estas predicciones se extraen<br />

las mismas variables, niveles y área geográfica previamente especificadas en<br />

el módulo dominios. En este caso sólo es necesario disponer <strong>de</strong> la predicción<br />

para el día <strong>de</strong> interés y, por tanto, no es necesaria una base <strong>de</strong> datos, sino<br />

sólo un fichero <strong>de</strong> entrada. Sin embargo, nuestro objetivo es <strong>de</strong>sarrollar una<br />

herramienta interactiva que permita explorar y validar un periodo amplio <strong>de</strong><br />

predicciones. En esta aplicación se han incluido los dos últimos años (2002 y<br />

2003) <strong>de</strong> predicciones (unos 640 días) en la base <strong>de</strong> datos ECMWF operativo.<br />

Esta base <strong>de</strong> datos se completa diariamente con las nuevas predicciones<br />

obtenidas en días sucesivos. Por tanto, por cada día tendremos 10 días <strong>de</strong><br />

alcance <strong>de</strong> predicción, lo que equivale a la misma magnitud <strong>de</strong> datos que en el<br />

reanálisis (100 gigabytes). Debido a la magnitud <strong>de</strong> información manejada<br />

los datos se encuentran almacenados en su formato original (GRIB) para<br />

impedir duplicidad <strong>de</strong> información; a<strong>de</strong>más su lectura y <strong>de</strong>codificación se<br />

encuentra optimizada (in<strong>de</strong>xada) para un rápido acceso a esta (<strong>de</strong>talles sobre<br />

este formato y códigos <strong>de</strong> codificación/<strong>de</strong>codificación pue<strong>de</strong>n encontrarse en<br />

wesley.wwb.noaa.gov/wgrib.html).<br />

Este módulo involucra las siguientes tareas:<br />

(1,2) dominio, CPLab. Al igual que en la fase <strong>de</strong> configuración, se filtran los<br />

datos operativos sobre la región geográfica indicada. Ahora hay que<br />

tener en cuenta que para cada día tenemos distintos alcances (en la<br />

figura se indican los alcances D+1, D+2 y D+3, correspondientes a las<br />

predicciones hechas un día para cada uno <strong>de</strong> los tres días siguientes).<br />

Las componentes principales <strong>de</strong> los patrones atmosféricos resultantes<br />

son obtenidas aplicando las transformaciones calculadas en la fase <strong>de</strong><br />

configuración. Por tanto, este módulo se limita a un simple cálculo<br />

en la fase operativa. Un aspecto importante <strong>de</strong> esta fase es que ahora<br />

no es necesario almacenar la salidas <strong>de</strong>l módulo CPLab ya que sólo se<br />

calculan en tiempo real para obtener la predicción.<br />

(4) Predicción local. Esta es la tarea central <strong>de</strong> la aplicación ya que en<br />

ella se combinan los resultados <strong>de</strong>l agrupamiento (que con<strong>de</strong>nsan los


144 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

datos <strong>de</strong> re-análisis) con las salidas <strong>de</strong> los mo<strong>de</strong>los numéricos (en forma<br />

<strong>de</strong> vectores <strong>de</strong> CPs) y con las observaciones (almacenadas en bases<br />

<strong>de</strong> datos). Todo ello es necesario para obtener una predicción local a<br />

partir <strong>de</strong>l método <strong>de</strong>scrito en la Sec. 5.4. En este módulo también se<br />

realizan las distintas tareas <strong>de</strong> inferencia probabilística y numérica. Por<br />

ejemplo, se obtienen predicciones probabilísticas <strong>de</strong> la precipitación<br />

para distintos umbrales y se obtiene una predicción numérica <strong>de</strong> la<br />

cantidad estimada <strong>de</strong> precipitación (usando tanto la media como un<br />

percentil superior para compensar la pérdida <strong>de</strong> resolución <strong>de</strong>l grupo;<br />

ver Sec. 5.4 para más <strong>de</strong>talles).<br />

Un fichero <strong>de</strong> configuración <strong>de</strong>fine los observatorios <strong>de</strong> la base <strong>de</strong> datos<br />

<strong>de</strong> observaciones don<strong>de</strong> se <strong>de</strong>sea obtener una predicción (2500 en la<br />

aplicación <strong>de</strong>l INM), y asocia cada uno <strong>de</strong> ellos a un dominio (en este<br />

caso, la cuenca hidrográfica a la que pertenece). Estas predicciones se<br />

almacenan posteriormente en la base <strong>de</strong> datos <strong>de</strong> predicciones locales<br />

para un posterior acceso y tratamiento.<br />

Una vez que hemos obtenido las predicciones <strong>de</strong> nuestro sistema, sería<br />

<strong>de</strong>seable po<strong>de</strong>r acce<strong>de</strong>r a ellas <strong>de</strong> forma interactiva. En la siguiente subsección<br />

se explica el módulo encargado <strong>de</strong> establecer un sistema <strong>de</strong> acceso<br />

interactivo a esta base <strong>de</strong> datos <strong>de</strong> predicciones locales, y como veremos más<br />

a<strong>de</strong>lante, <strong>de</strong> acceso a los resultados <strong>de</strong> las validaciones <strong>de</strong> estas predicciones.<br />

7.2.3. Acceso Web a las Predicciones<br />

Un forma versátil <strong>de</strong> acce<strong>de</strong>r a esta información es a través <strong>de</strong> Internet<br />

utilizando un navegador. Para ello, se ha diseñado una aplicación Web para<br />

que usuarios anónimos y autorizados puedan acce<strong>de</strong>r a esta información<br />

usando cualquier navegador <strong>de</strong> internet (ver Fig. 7.6).<br />

Para ello se ha hecho uso <strong>de</strong> tecnología <strong>de</strong> acceso dinámico a bases<br />

<strong>de</strong> datos a través <strong>de</strong> internet. En particular se ha usado tecnología JAVA<br />

www.sun.com/java, tanto servlets como JSP (Java Server Pages), <strong>de</strong>bido a<br />

su difusión, funcionalidad, y carácter abierto <strong>de</strong> su código. El software <strong>de</strong><br />

conexión utilizado ha sido el <strong>de</strong>sarrollado por el grupo <strong>de</strong> trabajo Apache<br />

(www.apache.org) y se <strong>de</strong>nomina Jakarta. Esta tecnología ha permitido <strong>de</strong>sarrollar<br />

una aplicación WEB (módulo 5) con el objetivo <strong>de</strong> que el usuario<br />

pueda interaccionar con los datos <strong>de</strong> la predicción local. En la figura 7.6<br />

se muestra un ejemplo <strong>de</strong> la página web, en la que se pue<strong>de</strong> seleccionar<br />

la información <strong>de</strong>seada para una fecha concreta y mostrarla en un mapa<br />

dinámico don<strong>de</strong> se muestran las probabilida<strong>de</strong>s con un código <strong>de</strong> colores<br />

(en el ejemplo mostrado se muestra la probabilidad <strong>de</strong> que la precipitación<br />

supere los 0.1mm). A<strong>de</strong>más se pue<strong>de</strong> acce<strong>de</strong>r a la información puntual para<br />

una estación concreta sin más que pulsar sobre ella con el ratón.<br />

A continuación se muestran distintos ejemplos <strong>de</strong>l funcionamiento <strong>de</strong>l<br />

sistema.


7.2. ESTRUCTURA DE LA APLICACIÓN. SISTEMA OPERATIVO EN EL INM 145<br />

Figura 7.6: Aplicación Web <strong>de</strong> acceso a predicciones locales <strong>de</strong>l sistema<br />

Prometeo adaptado a la predicción local en la red secundaria <strong>de</strong>l INM<br />

meteo.macc.unican.es/prometeo/<br />

En la figura 7.7 se muestran las predicciones <strong>de</strong> precipitación y tormenta<br />

realizadas la última semana <strong>de</strong> Enero <strong>de</strong> 2003. En concreto el día 30 <strong>de</strong><br />

Enero se registraron gran<strong>de</strong>s nevadas en los sistemas central, pirenaico y en<br />

los picos <strong>de</strong> Europa, así como tormentas en la mitad norte <strong>de</strong> la Península<br />

Ibérica. También se registraron precipitaciones que superaron los 20mm en<br />

algunos puntos <strong>de</strong> Cantabria y el País Vasco. Las predicciones <strong>de</strong>l sistema<br />

reflejan esta situación claramente con un día <strong>de</strong> antelación (son predicciones<br />

a D+1). La figura 7.7 muestra los eventos Precip > 0.5mm (lluvia débil),<br />

Precip > 20mm (lluvia muy fuerte) y Tormena), mientras que la Fig.<br />

7.8 muestra las predicciones <strong>de</strong> nieve, granizo, y la predicción numérica <strong>de</strong><br />

la temperatura máxima, don<strong>de</strong> se observan valores extremadamente bajos<br />

(tener en cuenta que se trata <strong>de</strong>l máximo <strong>de</strong> temperatura en todo un día)<br />

en muchas localida<strong>de</strong>s.<br />

Cabe también <strong>de</strong>stacar la predicción realizada para las islas Baleares en<br />

las que se observaron nevadas en localida<strong>de</strong>s próximas al mar.<br />

En el ejemplo anterior, las predicciones se obtienen con alcance <strong>de</strong> un<br />

día. Sin embargo, tiene interés analizar cómo varían éstas cuando se aumenta<br />

el horizonte <strong>de</strong> predicción. En la primera columna <strong>de</strong> la Fig. 7.9 se muestra<br />

la predicción <strong>de</strong> precipitación débil para el día 19/3/2003, obtenida con 1,<br />

2, y 3 días <strong>de</strong> antelación. En esta figura pue<strong>de</strong> comprobarse que este evento<br />

era altamente pre<strong>de</strong>cible y las predicciones no varían sustancialmente en un<br />

lapso <strong>de</strong> tres días. Sin embargo, existen otras situaciones menos pre<strong>de</strong>cibles<br />

en las que los distintos alcances <strong>de</strong> predicción muestran distintas situaciones.


146 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

Precip > 0.5mm Precip > 20mm Tormenta<br />

1/2/2003<br />

31/1/2003<br />

30/1/2003<br />

29/1/2003<br />

28/1/2003<br />

Figura 7.7: Predicciones probabilísticas <strong>de</strong>l 28/1/2003 al 1/2/2003 a D+1. En<br />

columnas se muestran los eventos P(Precip > 0.5mm), P(Precip > 20mm) y<br />

P(Tormena).


7.2. ESTRUCTURA DE LA APLICACIÓN. SISTEMA OPERATIVO EN EL INM 147<br />

Nieve Granizo Temp. Max.<br />

1/2/2003<br />

31/1/2003<br />

30/1/2003<br />

29/1/2003<br />

28/1/2003<br />

Figura 7.8: Predicciones <strong>de</strong>l 28/1/2003 al 1/2/2003 a D+1. En columnas se muestran<br />

los eventos P(Nieve), P(Granizo) y valor <strong>de</strong> temperatura máxima previsto.


148 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

Por ejemplo, en la segunda columna <strong>de</strong> la Fig. 7.9 se muestran las predicciones<br />

para 7/3/2003; en esta figura pue<strong>de</strong> comprobarse cómo la predicción<br />

se va afinando con el paso <strong>de</strong>l tiempo. La tercera columna <strong>de</strong> la Fig. 7.9<br />

muestra un caso más extremo, en el que las predicciones no coinci<strong>de</strong>n.<br />

Acierto<br />

Perfilado<br />

Fallo<br />

D+2<br />

D+1<br />

D+0<br />

19/3/2003 7/3/2003 5/6/2003<br />

Figura 7.9: Predicciones probabilísticas <strong>de</strong> P(Precip > 0.5mm). En filas se muestran<br />

los distintos alcances <strong>de</strong> la predicción (D+1, D+2 y D+3); la primera columna<br />

correspon<strong>de</strong> a la fecha 19/3/2003, mientras que la segunda correspon<strong>de</strong> a la fecha<br />

7/3/2003 y la tercera 5/6/2003<br />

Otro aspecto interesante <strong>de</strong>l sistema es su reflejo <strong>de</strong> la dinámica y evolución<br />

<strong>de</strong> distintas situaciones sinópticas (como las entradas <strong>de</strong> frentes en<br />

la península). En la figura 7.10 se pue<strong>de</strong> ver la evolución <strong>de</strong> la probabilidad<br />

<strong>de</strong> lluvia débil, <strong>de</strong>s<strong>de</strong> el 24 <strong>de</strong> Marzo <strong>de</strong>l 2003 al 1 <strong>de</strong> Abril <strong>de</strong>l 2003. En<br />

ese período pue<strong>de</strong> observarse (a través <strong>de</strong> sus efectos en la probabilidad <strong>de</strong><br />

lluvia) la entrada <strong>de</strong> un frente por el noroeste <strong>de</strong> la península y su posterior<br />

evolución hasta que finalmente <strong>de</strong>saparece.<br />

Todos los mapas mostrados en esta Sección se han obtenido directamente<br />

<strong>de</strong> la página Web <strong>de</strong>l sistema (meteo.macc.unican.es/prometeo) y han<br />

sido predicciones realizadas en modo operativo, que pue<strong>de</strong>n ser consultadas<br />

en tiempo pasado para comprobar los distintos aspectos, que hemos <strong>de</strong>sarrollado<br />

en esta subsección, <strong>de</strong> las predicciones realizadas por el sistema. Fruto<br />

<strong>de</strong> esta comprobación también surge la necesidad <strong>de</strong> realizar y almacenar<br />

distintos elementos <strong>de</strong> validación, los cuales ofrecen valiosa información que<br />

permite evaluar las distintas configuraciones <strong>de</strong>pendientes <strong>de</strong> los parámetros<br />

<strong>de</strong>l sistema, y que es utilizada para mejorar las predicciones.


7.2. ESTRUCTURA DE LA APLICACIÓN. SISTEMA OPERATIVO EN EL INM 149<br />

Precip > 0.5mm<br />

30/3/2003<br />

31/3/2003<br />

1/4/2003<br />

27/3/2003<br />

28/3/2003<br />

29/3/2003<br />

24/3/2003<br />

25/3/2003<br />

26/3/2003<br />

Figura 7.10: Predicciones probabilísticas <strong>de</strong> P(Precip > 0.5mm) entre el<br />

24/3/2003 y el 1/4/2003 a D+1.<br />

7.2.4. Proceso <strong>de</strong> validación. Retro-alimentación <strong>de</strong>l Sistema<br />

Una parte importante <strong>de</strong> la aplicación es el módulo <strong>de</strong> validación. Este<br />

módulo tiene un valor tanto informativo (mostrando la calidad <strong>de</strong> las distintas<br />

predicciones), como técnico (proporcionando una medida <strong>de</strong> calidad para<br />

tomar <strong>de</strong>cisiones en el momento <strong>de</strong> construir el sistema; por ejemplo, a la<br />

hora <strong>de</strong> seleccionar el número <strong>de</strong> vecinos óptimo, o un agrupamiento eficiente<br />

para el algoritmo). Para que las validaciones sean representativas, es necesario<br />

consi<strong>de</strong>rar un periodo suficientemente largo <strong>de</strong> predicciones operativas.<br />

Para ello, el módulo <strong>de</strong> validación pue<strong>de</strong> ejecutar el módulo <strong>de</strong> producción<br />

operativa para un período dado y almacenar los resultados en la base <strong>de</strong> datos;<br />

o bien pue<strong>de</strong> trabajar con un conjunto <strong>de</strong> fechas ya almacenadas en la<br />

base <strong>de</strong> datos. Como se comentó anteriormente, en el sistema se han cargado<br />

las predicciones <strong>de</strong> los años 2002-2003 y en base a ellas puedan realizarse<br />

las validaciones oportunas. En la Fig. 7.11 se muestra la estructura <strong>de</strong> este<br />

módulo, que acce<strong>de</strong> a las predicciones locales y las valida frente a las observaciones<br />

almacenadas en la base <strong>de</strong> datos. Después <strong>de</strong> aplicar distintos<br />

scores <strong>de</strong> validación (Brier Score, Brier Skill Score, fiabilidad, resolución,<br />

ROC Area, error cuadrático) almacena los resultados en la base <strong>de</strong> datos<br />

validación para cada uno <strong>de</strong> los alcances <strong>de</strong>l mo<strong>de</strong>lo numérico. Los resultados<br />

<strong>de</strong> validación son posteriormente promediados por estación (Invierno,


150 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

Primavera, Verano u Otoño) y también se almacenan las medias anuales y<br />

la climatología <strong>de</strong>l evento, para que el usuario pueda comprobar cual es la<br />

frecuencia <strong>de</strong>l evento.<br />

Observaciones INM<br />

SE SE<br />

SE SE<br />

SE<br />

Nieve Tormenta SE<br />

Precip.<br />

Predicción<br />

Local<br />

5<br />

Validación<br />

SE<br />

pred.<br />

locales<br />

SE SE<br />

Validación<br />

Figura 7.11: Módulo <strong>de</strong> validación <strong>de</strong> la aplicación Prometeo.<br />

Estas validaciones son usadas para <strong>de</strong>cidir que estaciones, <strong>de</strong> todas las<br />

que el INM dispone <strong>de</strong> información, pue<strong>de</strong>n ser usadas con capacidad predictiva,<br />

y por tanto saber cuáles son buenas estaciones <strong>de</strong> observación. No<br />

sólo eso, si no que a un usuario experto le pue<strong>de</strong> interesar conocer qué configuración<br />

atmosférica <strong>de</strong> patrones ofrece mejores resultados <strong>de</strong> validación.<br />

Todo esto se calcula <strong>de</strong> forma simple utilizando este módulo.<br />

En esta sección hemos visto un ejemplo <strong>de</strong> implementación realizado<br />

con el INM, pero todo este sistema posee un núcleo central que permite<br />

diseñar esquemas adaptables a otras regiones y datos. Este sistema facilita<br />

en gran medida esta labor ya que esta diseñada para aprovechar el esquema<br />

<strong>de</strong> Prometeo <strong>de</strong>scrito, y a<strong>de</strong>más ofrecer validaciones en tiempo real a partir<br />

<strong>de</strong> datos <strong>de</strong> mo<strong>de</strong>los operativos, en tiempo real.<br />

7.3. MeteoLab: Toolbox Meteorológica para Matlab<br />

La implementación <strong>de</strong> los módulos <strong>de</strong>scritos en la sección anterior se ha<br />

realizado en Matlabwww.mathworks.com (para las rutinas científicas y gráficas),<br />

combinándolo con lenguaje C para aquellos algoritmos más costosos.<br />

La aplicación final es eficiente para trabajar con gran<strong>de</strong>s volúmenes <strong>de</strong> datos<br />

provenientes <strong>de</strong> diferentes mo<strong>de</strong>los meteorológicos y con un gran número <strong>de</strong><br />

estaciones <strong>de</strong> distintas re<strong>de</strong>s <strong>de</strong> observación. Aparte <strong>de</strong> los módulos operativos,<br />

en todo el proceso <strong>de</strong> <strong>de</strong>sarrollo se han creado en paralelo herramientas<br />

más amistosas e interactivas para un usuario no experto en Matlab, que puedan<br />

ser utilizadas bajo distintos requerimientos <strong>de</strong> investigación <strong>de</strong> forma<br />

cómoda. Para ello, se han <strong>de</strong>finido distintas interfases <strong>de</strong> usuario en Matlab<br />

(otra <strong>de</strong> sus importantes propieda<strong>de</strong>s) <strong>de</strong> forma que se combinen los núcleos


7.3. METEOLAB: TOOLBOX METEOROLÓGICA PARA MATLAB 151<br />

<strong>de</strong> los módulos con otras rutinas gráficas y auxiliares que permitan investigar<br />

cómodamente sobre distintas configuraciones y sobre los resultados <strong>de</strong><br />

los distintos métodos utilizados. El resultado <strong>de</strong> todo este proceso es un<br />

conjunto <strong>de</strong> herramientas para Matlab, <strong>de</strong>nominada MeteoLab que, a<strong>de</strong>más<br />

<strong>de</strong> ser muy versátil y eficiente para un problema general, permite hacer uso<br />

<strong>de</strong>l sistema Prometeo para otros problemas <strong>de</strong> interés.<br />

Figura 7.12: Interfases <strong>de</strong> usuario <strong>de</strong> configuración y <strong>de</strong> predicción local <strong>de</strong> la<br />

Toolbox Meteolab.<br />

En la Figura 7.12 se muestran las interfases <strong>de</strong> usuario para configuración-inicialización<br />

y predicción local que trabajan a partir <strong>de</strong> los mismos<br />

ficheros <strong>de</strong> configuración <strong>de</strong>scritos en la sección anterior. Una característica<br />

importante son las capacida<strong>de</strong>s gráficas <strong>de</strong> esta herramienta, que nos permiten<br />

visualizar en todo momento los distintos resultados <strong>de</strong>l proceso.<br />

Los dos botones finales <strong>de</strong> la interfase <strong>de</strong> predicción permiten visualizar<br />

tanto la predicción realizada en el período especificado, como los resultados<br />

<strong>de</strong> validación (si se dispone <strong>de</strong> observaciones simultáneas). Dado el carácter<br />

espacio-temporal 3D <strong>de</strong> las predicciones (tiempo, longitud y latitud), se han<br />

<strong>de</strong>finido distintas formas <strong>de</strong> visualización <strong>de</strong> estos resultados. Por ejemplo, la<br />

Fig. 7.13 muestra el resultado <strong>de</strong> las predicciones para el período Diciembre-<br />

Febrero <strong>de</strong> 1999 (90 días). El panel superior muestra las observaciones reales<br />

(blanco/negro) <strong>de</strong> una fecha seleccionada. El panel intermedio muestra las


152 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

probabilida<strong>de</strong>s predichas (grises). Por último, el panel inferior muestra la<br />

evolución <strong>de</strong> las probabilida<strong>de</strong>s predichas para una estación dada. En el<br />

ejemplo mostrado se observa que las probabilida<strong>de</strong>s son todas cercanas a<br />

cero o uno, indicando una buena resolución <strong>de</strong>l mo<strong>de</strong>lo. Tanto la fecha <strong>de</strong><br />

los interfases superiores, como la estación <strong>de</strong> la interfase inferior se pue<strong>de</strong><br />

interaccionar pulsando con el ratón sobre una estación, o sobre una fecha en<br />

la figura. La fecha seleccionada se marca con una línea roja vertical, mientras<br />

que la estación se indica en trazo grueso.<br />

Figura 7.13: Predicción. El panel superior muestra las observaciones reales (1<br />

ocurrencia, 0 no ocurrencia); el panel intermedio muestra las probabilida<strong>de</strong>s predichas.<br />

Finalmente, el panel inferior muestra la evolución <strong>de</strong> las probabilida<strong>de</strong>s para<br />

una cierta estación.<br />

No solo se han <strong>de</strong>sarrollado componentes para la predicción si no también<br />

para la validación, que es quizás el elemento que más información pue<strong>de</strong><br />

ofrecer, y por tanto un buen diseño facilita esta tarea <strong>de</strong> extracción <strong>de</strong> información.<br />

En la Fig. 7.14 se muestra la ventana <strong>de</strong> validación para este<br />

período que contiene paneles con BSS espaciales y temporales, así como las<br />

curvas ROC individuales <strong>de</strong> una estación y promedio <strong>de</strong> todas las estaciones.<br />

Por último, en la Fig. 7.15 se muestra la paleta <strong>de</strong> agrupamiento que<br />

permite ejecutar <strong>de</strong> forma interactiva distintos algoritmos <strong>de</strong> agrupamiento<br />

sobre los datos meteorológicos seleccionados, así como visualizar los prototipos<br />

y grupos obtenidos. Esta paleta permite, entre otras cosas, analizar los<br />

efectos <strong>de</strong> los distintos parámetros en el proceso <strong>de</strong> agrupamiento.


7.3. METEOLAB: TOOLBOX METEOROLÓGICA PARA MATLAB 153<br />

Figura 7.14: Validación. (izquierda) BSS individual para cada estación y evolución<br />

temporal <strong>de</strong>l BSS para una estación concreta; (<strong>de</strong>recha) curva ROC individual para<br />

una estación seleccionada y promedio espacial <strong>de</strong> las curvas ROC.<br />

Figura 7.15: Interfase <strong>de</strong> la Toolbox MeteoLab para el problema <strong>de</strong>l agrupamiento.


154 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

7.4. Validación Operativa <strong>de</strong> Prometeo.<br />

En esta sección se muestra una <strong>de</strong>tallada validación <strong>de</strong>l sistema Prometeo<br />

en el período 1987-1988. Para ello se utilizan las medidas estándar<br />

como la pericia, valor económico, etc., <strong>de</strong>scritas en el Capítulo 4. También<br />

se lleva a cabo una comparación <strong>de</strong> este sistema con el método<br />

<strong>de</strong> análogos en dos etapas <strong>de</strong>sarrollado por el Servicio <strong>de</strong> Aplicaciones<br />

Meteorológicas <strong>de</strong>l INM y utilizado actualmente en la predicción diaria<br />

(en los siguiente este sistema se <strong>de</strong>notará AnalogoINM) (Fernán<strong>de</strong>z et al.<br />

(2001), www.inm.es/web/infmet/predi/preci.html). Dado que este último<br />

sistema está diseñado y especializado para la precipitación, se muestran<br />

únicamente los resultados <strong>de</strong> la validación <strong>de</strong> esta variable. El resto<br />

<strong>de</strong> información pue<strong>de</strong> consultarse directamente en la página <strong>de</strong> Prometeo<br />

(meteo.macc.unican.es/prometeo). Para validar ambos métodos se consi<strong>de</strong>ran<br />

los datos <strong>de</strong> precipitación <strong>de</strong> la red <strong>de</strong> estaciones “synop” <strong>de</strong>l INM<br />

mostrada en la Figura 7.16.<br />

45.0 ° N<br />

42.5 ° N<br />

40.0 ° N<br />

37.5 ° N<br />

35.0 ° N<br />

10.0 ° W<br />

7.5 ° W<br />

5.0 ° W<br />

2.5 ° W<br />

0.0 °<br />

2.5 ° E<br />

5.0 ° E<br />

Figura 7.16: Red <strong>de</strong> 88 estaciones “Synop” <strong>de</strong>l INM <strong>de</strong> datos pluviométricos.<br />

Ambos métodos generan sus predicciones aplicando la técnica <strong>de</strong> análogos<br />

(o <strong>de</strong> los vecinos más cercanos) utilizando patrones con distinta información<br />

tomada <strong>de</strong> los campos atmosféricos integrados en ERA-15. Los Brier<br />

Skill Score (BSS), diagramas <strong>de</strong> fiabilidad y resolución, y curvas ROC y <strong>de</strong><br />

valor económico se han obtenido para el conjunto <strong>de</strong> los dos años (anual), y<br />

separadamente para cada estación <strong>de</strong>l año (DEF: Invierno, MAM: Primavera,<br />

JJA: Verano, SON: Otoño). Estas medidas <strong>de</strong> validación se han calculado<br />

para cuatro umbrales distintos <strong>de</strong> la precipitación 0.5, 2, 10 y 20 mm.<br />

Con el fin <strong>de</strong> comprobar la eficiencia <strong>de</strong> ambos métodos en distintas zonas<br />

<strong>de</strong> la península, se calcularon los BSS anuales <strong>de</strong> AnalogoINM y PROME-<br />

TEO para Prec > 0.5mm consi<strong>de</strong>rando como mo<strong>de</strong>lo <strong>de</strong> referencia la climatología<br />

(un valor positivo indicará una superioridad <strong>de</strong>l método frente a la<br />

climatología, mientras que un valor negativo indicará la situación contraria).<br />

Las Figuras 7.17 (a) y (b) muestran la distribución espacial <strong>de</strong> pericias en la<br />

península para los mo<strong>de</strong>los PROMETEO y AnalogoINM, respectivamente.


7.4. VALIDACIÓN OPERATIVA DE PROMETEO. 155<br />

0.51<br />

0.46<br />

0.38 0.34<br />

0.31<br />

0.57<br />

0.54<br />

0.52 0.50<br />

0.37<br />

0.51 0.39<br />

0.42<br />

0.56 0.53 0.22<br />

0.41 0.37<br />

0.26<br />

0.31 0.26<br />

0.45<br />

0.33 0.42 0.39<br />

0.45<br />

0.33 0.18 0.29<br />

0.35<br />

0.26<br />

0.36 0.35<br />

0.52 0.33 0.34<br />

0.41 0.48<br />

0.45 0.48 0.30<br />

0.51 0.43<br />

0.48<br />

0.31 0.27<br />

0.52<br />

0.28<br />

0.27<br />

0.50 0.50<br />

0.24<br />

0.37<br />

0.21<br />

0.44 0.30<br />

0.25<br />

0.22<br />

0.48 0.20<br />

0.63 0.13<br />

0.48 0.25<br />

0.50 0.44<br />

0.46 0.44<br />

0.49 0.49<br />

0.27<br />

0.41<br />

0.44<br />

0.49<br />

0.37<br />

0.37 0.35 0.390.31<br />

0.20<br />

(a)<br />

0.33<br />

0.45 0.25 0.26 0.24<br />

0.36<br />

0.44<br />

0.25<br />

0.23 0.22 0.27<br />

0.46<br />

0.31<br />

0.46<br />

0.42<br />

0.51 0.42 0.40<br />

0.29 0.33<br />

0.33<br />

0.35<br />

0.33 0.26<br />

0.25<br />

0.30 0.27<br />

0.29<br />

0.31 0.33<br />

0.35 0.32<br />

0.24 0.22 0.21<br />

0.29<br />

0.27<br />

0.33 0.27<br />

0.37 0.33 0.26<br />

0.34 0.32<br />

0.390.35 0.30<br />

0.38 0.34<br />

0.36 0.24<br />

0.26<br />

0.41<br />

0.21<br />

0.27 0.30<br />

0.19<br />

0.35 0.39 0.28<br />

0.19<br />

0.34 0.22<br />

0.21 0.20<br />

0.39 0.24<br />

0.50<br />

0.20<br />

0.12<br />

0.37 0.37<br />

0.39<br />

0.40 0.30<br />

0.43 0.34<br />

0.19<br />

0.40<br />

0.40<br />

0.44<br />

0.21<br />

(b)<br />

Figura 7.17: BSS para evento <strong>de</strong> precipitación > 0.5mm en el periodo 1987-1988<br />

<strong>de</strong> (a) PROMETEO (BSS medio = 0.392) y (b) AnalogoINM (BSS medio = 0.322);<br />

los valores en negrita en esta última figura indican una pericia mayor que el mo<strong>de</strong>lo<br />

PROMETEO.<br />

A partir <strong>de</strong> estas figuras se pue<strong>de</strong> observar que PROMETEO tiene una<br />

pericia superior en toda la península (con la excepción <strong>de</strong> algunas estaciones<br />

aisladas). La zona don<strong>de</strong> ambos métodos tienen menor pericia es la zona <strong>de</strong>l<br />

Mediterráneo (concretamente en Levante), siendo el Noroeste peninsular la<br />

zona con pericias más elevadas. Para el resto <strong>de</strong> umbrales, los resultados son<br />

similares, aunque la diferencia entre ambos métodos es menor a medida que<br />

el umbral <strong>de</strong> predicción aumenta. La Tabla 7.1 muestra los valores <strong>de</strong> Brier<br />

Skill (BS), así como los BSS medios para ambos métodos.<br />

Para ilustrar la resolución <strong>de</strong> las predicciones, en la figura 7.18 se muestran<br />

los histogramas <strong>de</strong> las distintas probabilida<strong>de</strong>s predichas para el evento<br />

<strong>de</strong> precipitación superior a un umbral, en los casos en los que el evento se observó<br />

(y no se observó), respectivamente. Una predicción perfecta <strong>de</strong>bería <strong>de</strong><br />

estar asociada a una función <strong>de</strong>lta centrada en 1 (y en el 0), respectivamente.<br />

Obsérvese que la predicción en una estación <strong>de</strong>l Noroeste (Monteventoso) es


156 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

Brier Score Brier Skill Score<br />

Umbrales CLIMA M1 M2 M1 M2<br />

0.5 mm 0.1729 0.1171 0.1051 0.322 0.392<br />

2 mm 0.1337 0.0963 0.0886 0.279 0.337<br />

10 mm 0.0512 0.0436 0.0425 0.148 0.169<br />

20 mm 0.0201 0.0186 0.0186 0.074 0.074<br />

Tabla 7.1: BSS <strong>de</strong> los mo<strong>de</strong>los AnalogoINM (M1) y PROMETEO (M2) para los<br />

años 1987 y 1988, tomando la climatología como mo<strong>de</strong>lo <strong>de</strong> referencia en ambos<br />

casos. Distintos umbrales <strong>de</strong> precipitación se muestran en cada una <strong>de</strong> las filas.<br />

claramente superior a una predicción en una estación <strong>de</strong> Levante (Alicante).<br />

250<br />

250<br />

Monteventoso > 0.5 mm<br />

Alicante > 0.5mm<br />

200<br />

P(pred=no| observado =no)<br />

P(pred=si | observado =si)<br />

200<br />

150<br />

150<br />

100<br />

100<br />

50<br />

50<br />

0<br />

300<br />

0<br />

[0,0.1) [0.1,0.2) [0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6) [0.6,0.7) [0.7,0.8) [0.8,0.9) [0.9,1)<br />

250<br />

200<br />

Monteventoso > 10 mm<br />

P(pred=no| observado =no)<br />

P(pred=si | observado =si)<br />

150<br />

100<br />

50<br />

0<br />

[0,0.1) [0.1,0.2) [0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6) [0.6,0.7) [0.7,0.8) [0.8,0.9) [0.9,1)<br />

Figura 7.18: Probabilida<strong>de</strong>s condicionadas <strong>de</strong> la predicción o no <strong>de</strong> un evento,<br />

condicionado a la ocurrencia o no <strong>de</strong>l evento, en la estación “Monteventoso” <strong>de</strong>l<br />

Noroeste peninsular y en la estación “Alicante” <strong>de</strong>l Mediterráneo.<br />

En las figuras 7.19, 7.20, y 7.21 se muestran medidas alternativas al BSS<br />

para validar los pronósticos probabilísticos <strong>de</strong> ambos mo<strong>de</strong>los: las curvas <strong>de</strong><br />

fiabilidad y resolución, las curvas ROC, y las curvas <strong>de</strong> valor económico,<br />

respectivamente. Estas figuras muestran que la fiabilidad <strong>de</strong> ambos métodos<br />

es similar, siendo la pericia superior en el caso <strong>de</strong> Prometeo.<br />

Finalmente, las cuatro últimas figuras muestran las curvas <strong>de</strong> valor<br />

económico para las distintas estaciones <strong>de</strong> los dos años <strong>de</strong> validación.


7.4. VALIDACIÓN OPERATIVA DE PROMETEO. 157<br />

1<br />

1<br />

1<br />

1<br />

0.75<br />

0.75<br />

0.5<br />

0<br />

0 0.25 0.5 0.75<br />

0.5<br />

0<br />

0 0.25 0.5 0.75<br />

0.25<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

1<br />

1<br />

1<br />

0.75<br />

0.75<br />

0.5<br />

0<br />

0 0.25 0.5 0.75<br />

0.5<br />

0<br />

0 0.25 0.5 0.75<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0.25<br />

AnalogoINM<br />

PROMETEO<br />

Clim<br />

0<br />

0 0.25 0.5 0.75 1<br />

Figura 7.19: Diagramas <strong>de</strong> Fiabilidad y <strong>de</strong> resolución para los años 1987-1988.<br />

1<br />

Prec > 0.5mm<br />

1<br />

Prec > 2mm<br />

0.75<br />

0.75<br />

0.5<br />

0.5<br />

0.25<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

Prec > 10mm<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

Prec > 20mm<br />

0.75<br />

0.75<br />

0.5<br />

0.5<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0.25<br />

AnalogoINM<br />

PROMETEO<br />

Clim<br />

0<br />

0 0.25 0.5 0.75 1<br />

Figura 7.20: Curvas ROC <strong>de</strong> los mo<strong>de</strong>los PROMETEO y AnalogoINM (1987-<br />

1988).


158 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

1<br />

Prec > 0.5mm<br />

1<br />

Prec > 2mm<br />

0.75<br />

0.75<br />

0.5<br />

0.5<br />

0.25<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

Prec > 10mm<br />

1<br />

Prec > 20mm<br />

0.75<br />

0.75<br />

0.5<br />

0.25<br />

0.5<br />

0.25<br />

AnalogoINM<br />

PROMETEO<br />

Clim<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

Figura 7.21: Valor económico <strong>de</strong> los mo<strong>de</strong>los PROMETEO y AnalogoINM (1987-<br />

1988).<br />

1<br />

Prec > 0.5mm<br />

1<br />

Prec > 2mm<br />

0.75<br />

0.75<br />

0.5<br />

0.5<br />

0.25<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

Prec > 10mm<br />

1<br />

Prec > 20mm<br />

0.75<br />

0.75<br />

0.5<br />

0.25<br />

0.5<br />

0.25<br />

AnalogoINM<br />

PROMETEO<br />

Clim<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

Figura 7.22: Valor económico <strong>de</strong> los mo<strong>de</strong>los PROMETEO y AnalogoINM para<br />

las Primaveras <strong>de</strong> los años 1987-1988.


7.4. VALIDACIÓN OPERATIVA DE PROMETEO. 159<br />

1<br />

Prec > 0.5mm<br />

1<br />

Prec > 2mm<br />

0.75<br />

0.75<br />

0.5<br />

0.5<br />

0.25<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

Prec > 10mm<br />

1<br />

Prec > 20mm<br />

0.75<br />

0.75<br />

0.5<br />

0.25<br />

0.5<br />

0.25<br />

AnalogoINM<br />

PROMETEO<br />

Clim<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

Figura 7.23: Valor económico <strong>de</strong> los mo<strong>de</strong>los PROMETEO y AnalogoINM para<br />

los Veranos <strong>de</strong> los años 1987-1988.<br />

1<br />

Prec > 0.5mm<br />

1<br />

Prec > 2mm<br />

0.75<br />

0.75<br />

0.5<br />

0.5<br />

0.25<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

Prec > 10mm<br />

1<br />

Prec > 20mm<br />

0.75<br />

0.75<br />

0.5<br />

0.25<br />

0.5<br />

0.25<br />

AnalogoINM<br />

PROMETEO<br />

Clim<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

Figura 7.24: Valor económico <strong>de</strong> los mo<strong>de</strong>los PROMETEO y AnalogoINM para<br />

los Otoños <strong>de</strong> los años 1987-1988.


160 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

1<br />

Prec > 0.5mm<br />

1<br />

Prec > 2mm<br />

0.75<br />

0.75<br />

0.5<br />

0.5<br />

0.25<br />

0.25<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

1<br />

Prec > 10mm<br />

1<br />

Prec > 20mm<br />

0.75<br />

0.75<br />

0.5<br />

0.25<br />

0.5<br />

0.25<br />

AnalogoINM<br />

PROMETEO<br />

Clim<br />

0<br />

0 0.25 0.5 0.75 1<br />

0<br />

0 0.25 0.5 0.75 1<br />

Figura 7.25: Valor económico <strong>de</strong> los mo<strong>de</strong>los PROMETEO y AnalogoINM para<br />

los Inviernos <strong>de</strong> los años 1987-1988.<br />

7.5. Computación Distribuida en la Web. Tecnología GRID<br />

En las secciones anteriores se ha <strong>de</strong>scrito al sistema Prometeo en su versión<br />

operativa, que hace uso <strong>de</strong> las tecnologías Web <strong>de</strong>s<strong>de</strong> una perspectiva<br />

cliente-servidor. Las áreas geográficas sobre las que se lleva a cabo la predicción<br />

están prefijadas (España peninsular, y las islas Baleares y Canarias) y el<br />

sistema da acceso al cliente a una base <strong>de</strong> datos con las distintas predicciones<br />

realizadas en las mismas. Una aplicación más interactiva <strong>de</strong> esta aplicación<br />

supondría que el usuario pudiese seleccionar el área <strong>de</strong> interés y proporcionar<br />

la información (observaciones locales) necesaria para realizar la predicción,<br />

todo <strong>de</strong> forma interactiva. Ello supondría ejecutar la aplicación y obtener<br />

las predicciones en tiempo real a partir <strong>de</strong> una petición realizada a través <strong>de</strong><br />

la Web (servicio Web). El problema <strong>de</strong> un servicio Web <strong>de</strong> este tipo es que<br />

requiere la ejecución <strong>de</strong> algunos procesos costosos (como entrenar una SOM<br />

para la región especificada por el usuario) y el acceso a bases <strong>de</strong> datos distribuidas<br />

(la base <strong>de</strong> datos <strong>de</strong> las predicciones numéricas y la base <strong>de</strong> datos<br />

con observaciones <strong>de</strong>l usuario) y la tecnología Web actual no es apropiada<br />

ni eficiente para resolver estos problemas. En concreto, la fase <strong>de</strong> configuración/inicialización<br />

y, en especial, los algoritmos <strong>de</strong> componentes principales<br />

y <strong>de</strong> agrupamiento, son muy exigentes en tiempo <strong>de</strong> computación (por el<br />

gran volumen <strong>de</strong> datos). Más aún, es aconsejable ejecutar repetidas veces el<br />

algoritmo <strong>de</strong> agrupamiento para validar y seleccionar el más eficiente.<br />

Para resolver interactivamente este tipo <strong>de</strong> problemas que requieren


7.5. COMPUTACIÓN DISTRIBUIDA EN LA WEB. TECNOLOGÍA GRID 161<br />

gran<strong>de</strong>s tiempos <strong>de</strong> cómputo, ha surgido en los últimos cinco años una tecnología<br />

llamada GRID. La tecnología GRID preten<strong>de</strong> aprovechar la rapi<strong>de</strong>z<br />

<strong>de</strong> las re<strong>de</strong>s <strong>de</strong> alta velocidad (Internet2 y GEANT) para exten<strong>de</strong>r la i<strong>de</strong>a<br />

<strong>de</strong>l cluster <strong>de</strong> computación, uniendo distintos clusters dispersos geográficamente<br />

mediante una red <strong>de</strong> altas prestaciones. De esta forma se pue<strong>de</strong>n<br />

aprovechar mejor los recursos computacionales y <strong>de</strong> almacenamiento, pudiendo<br />

llevarse a cabo costosos procesos en tiempo real ejecutándolos <strong>de</strong><br />

forma distribuida a través <strong>de</strong> la red. Esta tecnología requiere el <strong>de</strong>sarrollo<br />

<strong>de</strong> software intermedio complejo (middleware) que permita acce<strong>de</strong>r a los recursos<br />

y paralelizar las aplicaciones <strong>de</strong> forma simple (por ejemplo Globus,<br />

www.globus.com), así como <strong>de</strong> técnicas <strong>de</strong> seguridad apropiadas que verifiquen<br />

la i<strong>de</strong>ntidad <strong>de</strong> los usuarios en los distintos clusters y que garanticen la<br />

confi<strong>de</strong>ncialidad <strong>de</strong> datos privados que viajen por la red. Todo este trabajo<br />

está en <strong>de</strong>sarrollo en distintos proyectos Europeos y Estadouni<strong>de</strong>nses (por<br />

ejemplo, el proyecto CrossGrid www.crossgrid.com, en el que se enmarca<br />

el trabajo preliminar presentado en esta sección). En esta Sección se da una<br />

visión sobre que es la tecnología GRID cuales son sus elementos más importantes<br />

y su funcionamiento. A<strong>de</strong>más se introduce cuales son las aplicaciones<br />

GRID en meteorología para luego <strong>de</strong>scribir como Prometeo es un sistema<br />

muy apropiado para utilizar GRID. Por último, se estudia la aplicación <strong>de</strong><br />

los algoritmos <strong>de</strong> agrupamiento a un entorno <strong>de</strong> computación cambiante.<br />

7.5.1. Estructura <strong>de</strong> la tecnología GRID<br />

La tecnología Grid surge en el ámbito <strong>de</strong> la comunidad <strong>de</strong> supercomputación<br />

y está basada en las i<strong>de</strong>as <strong>de</strong> agregar y compartir, utilizando la red<br />

como via <strong>de</strong> comunicación. Con ello se trata <strong>de</strong> dar un salto cuantitativo<br />

en la computación distribuida, equivalente al que se produjo al conseguir<br />

clusters <strong>de</strong> or<strong>de</strong>nadores con capacidad <strong>de</strong> cómputo similar a las máquinas<br />

multiprocesadoras. En ese caso, los or<strong>de</strong>nadores <strong>de</strong>l cluster se comunican<br />

localmente mediante re<strong>de</strong>s <strong>de</strong> alta velocidad, con eficiencias comparables a<br />

las conexiones <strong>de</strong> placas multiprocesadoras. El salto <strong>de</strong> GRID consiste en<br />

permitir que los cluster puedan estar distribuidos geográficamente y conectados<br />

no por una sola red local, sino conjuntamente a través <strong>de</strong> Internet.<br />

Para ello, es necesario generalizar las técnicas y tecnologías <strong>de</strong> paralelización<br />

como, por ejemplo, las basadas en el uso <strong>de</strong> MPI (Message Passing<br />

Interface, www-unix.mcs.anl.gov/mpi/) para que sean eficientes en este<br />

contexto. La primera experiencia <strong>de</strong> este tipo se produjo en 1995 durante<br />

el congreso SuperComputing 95, don<strong>de</strong> se <strong>de</strong>mostró la posibilidad <strong>de</strong> ejecutar<br />

aplicaciones distribuidas <strong>de</strong> diferentes áreas científicas en una red <strong>de</strong><br />

17 centros <strong>de</strong> USA conectados con una red <strong>de</strong> alta velocidad (155 Mbps).<br />

Éste fue el punto <strong>de</strong> partida <strong>de</strong> varios proyectos en diferentes áreas con el<br />

<strong>de</strong>nominador común <strong>de</strong> compartir recursos distribuidos <strong>de</strong> computación. En<br />

Foster and Kesselman (1999) se presenta una analogía con la red eléctrica<br />

(electrical power grid), don<strong>de</strong> el usuario <strong>de</strong>be tener acceso a los recursos


162 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

computacionales en condiciones similares a las que tiene para utilizar la<br />

energía eléctrica; es <strong>de</strong>cir, <strong>de</strong>s<strong>de</strong> cualquier sitio, con un interfase uniforme,<br />

pudiendo confiar en su funcionamiento, y a un coste asequible. Esta i<strong>de</strong>a<br />

marca el <strong>de</strong>sarrollo <strong>de</strong> la supercomputación mo<strong>de</strong>rna a través <strong>de</strong> Internet.<br />

En la actualidad son numerosos los proyectos que se están llevando a cabo<br />

en esta línea, tanto a nivel <strong>de</strong> infraestructura y middleware (EuroGrid<br />

www.eurogrid.org y DataGrid www.eu-datagrid.org), como a nivel <strong>de</strong><br />

aplicaciones (CrossGrid www.crossgrid.org).<br />

En la Fig. 7.26 se muestra un esquema <strong>de</strong> los elementos que intervienen<br />

en un GRID. Dos piezas fundamentales son la autoridad <strong>de</strong> certificación y<br />

el localizador <strong>de</strong> recursos (resource broker). El primer módulo se encarga<br />

<strong>de</strong> gestionar <strong>de</strong> forma segura los certificados <strong>de</strong> usuario que se compartirán<br />

en todas las re<strong>de</strong>s locales para el proceso <strong>de</strong> i<strong>de</strong>ntificación. El localizador<br />

<strong>de</strong> recursos se encarga <strong>de</strong> localizar los recursos óptimos (computacionales y<br />

datos) para llevar a cabo un trabajo solicitado; en otras palabras, es la puerta<br />

a los recursos <strong>de</strong> GRID. Estos recursos se hallan distribuidos en distintas<br />

re<strong>de</strong>s locales (LAN) participantes en el GRID.<br />

Autoridad <strong>de</strong> certificados<br />

servidor <strong>de</strong><br />

certificados<br />

acceso<br />

LAN 1<br />

localizador <strong>de</strong><br />

recursos<br />

LAN UNICAN<br />

LAN INM<br />

Elemento <strong>de</strong><br />

cómputo<br />

Elemento <strong>de</strong><br />

almacenamiento<br />

Interfase <strong>de</strong><br />

usuario<br />

WAN<br />

Elemento <strong>de</strong><br />

almacenamiento<br />

SE SE observaciones<br />

Reanálisis ERA<br />

LAN 2<br />

LAN n<br />

LAN ECMWF<br />

...<br />

Elemento <strong>de</strong><br />

cómputo<br />

Elemento <strong>de</strong><br />

almacenamiento<br />

SE SE<br />

reanálisis<br />

Reanálisis ERA<br />

SE SE<br />

operativo<br />

salidas<br />

operativas<br />

Figura 7.26: Esquema prototipo <strong>de</strong> un entorno GRID, don<strong>de</strong> el componente <strong>de</strong><br />

conexión es una WAN (Wi<strong>de</strong> Area Network): Internet-2, GEANT, etc.<br />

Ejecutar un trabajo en el GRID requerirá lo siguiente:<br />

1. Preparar el código paralelo <strong>de</strong> la aplicación (por ejemplo en MPI para<br />

Globus) <strong>de</strong> forma que pueda compilarse en las distintas plataformas<br />

que intervengan en el GRID. Por ejemplo, la Fig. 7.31 muestra el<br />

código paralelizado <strong>de</strong> algoritmo <strong>de</strong> agrupamiento basado en re<strong>de</strong>s<br />

auto-organizativas (uno <strong>de</strong> los módulos <strong>de</strong>l sistema Prometeo).<br />

2. Disponer <strong>de</strong> un certificado que tenga permisos en distintas re<strong>de</strong>s locales


7.5. COMPUTACIÓN DISTRIBUIDA EN LA WEB. TECNOLOGÍA GRID 163<br />

(LAN) <strong>de</strong>l grid y que esté autorizado por la “autoridad <strong>de</strong> certificados’.<br />

Este certificado será la llave para acce<strong>de</strong>r a los distintos recursos.<br />

3. Ejecutar el localizador <strong>de</strong> recursos con las restricciones <strong>de</strong>seadas (velocidad<br />

mínima <strong>de</strong>l elemento <strong>de</strong> cómputo, tipo <strong>de</strong> sistema operativo,<br />

etc.) y <strong>de</strong>cidir <strong>de</strong>pendiendo <strong>de</strong> las características <strong>de</strong>l algoritmo qué recursos<br />

van a utilizarse.<br />

4. Una vez preparada la petición, se lanza al GRID y se pue<strong>de</strong> realizar<br />

un seguimiento utilizando alguna herramienta <strong>de</strong> monitorización (en<br />

qué máquinas se está ejecutando, etc.).<br />

7.5.2. Tecnologías GRID en Meteorología<br />

Históricamente, la Meteorología ha sido una <strong>de</strong> los principales usuarios<br />

<strong>de</strong> las nuevas tecnologías <strong>de</strong> la Computación, tanto en lo relativo a la capacidad<br />

<strong>de</strong> cálculo, como al almacenamiento <strong>de</strong> gran<strong>de</strong>s volúmenes <strong>de</strong> información<br />

y a su rápida distribución mediante re<strong>de</strong>s <strong>de</strong> alto rendimiento. En<br />

el pasado, muchas <strong>de</strong> las tareas involucradas en este área (integración <strong>de</strong><br />

mo<strong>de</strong>los numéricos <strong>de</strong> predicción, mantenimiento <strong>de</strong> bases <strong>de</strong> datos operativas,<br />

etc.) eran exclusivas <strong>de</strong> gran<strong>de</strong>s centros meteorológicos que disponían<br />

<strong>de</strong> la tecnología necesaria. En la actualidad, la situación es distinta <strong>de</strong>bido al<br />

abaratamiento <strong>de</strong> la tecnología, y diversos grupos <strong>de</strong> investigación públicos<br />

y privados llevan a cabo costosas simulaciones meteorológicas que utilizan<br />

distintas bases <strong>de</strong> datos para realizar tareas tan diversas como: estudios<br />

climatológicos y <strong>de</strong> cambio climático, pronóstico meteorológico local, predicción<br />

<strong>de</strong> viento para la gestión <strong>de</strong> parques eólicos, difusión <strong>de</strong> contaminantes<br />

en el mar y en la atmósfera, etc. Sin embargo, el tipo <strong>de</strong> estudios que pue<strong>de</strong>n<br />

empren<strong>de</strong>r estos grupos en un tiempo reducido está todavía limitado<br />

por los recursos computacionales <strong>de</strong> que disponen (principalmente clusters<br />

<strong>de</strong> or<strong>de</strong>nadores Drake et al. (1995)). Por tanto, la tecnología GRID pue<strong>de</strong><br />

proporcionar un enorme beneficio en este campo, permitiendo abordar<br />

problemas más complejos a los centros <strong>de</strong> investigación y proporcionando<br />

servicios especializados a medida a través <strong>de</strong> Internet. Los centros <strong>de</strong> e-<br />

Ciencia son una iniciativa surgida en el Reino Unido para amparar este<br />

tipo <strong>de</strong> tecnologías, proporcionando el entorno computacional y el soporte<br />

técnico necesarios para dar una cobertura apropiada a los distintos grupos y<br />

empresas con necesidad <strong>de</strong> gestionar recursos a través <strong>de</strong> la red, utilizando<br />

la tecnología GRID como soporte <strong>de</strong> este proceso.<br />

Los temas <strong>de</strong> meteorología han formado y forman parte <strong>de</strong> los distintos<br />

proyectos GRID (Hoffmann, 2001). Uno <strong>de</strong> los primeros <strong>de</strong>sarrollos <strong>de</strong><br />

aplicaciones meteorológicas integradas en Europa en entornos GRID se lleva<br />

a cabo en el proyecto Europeo <strong>de</strong>l V Programa Marco llamado Cross-Grid<br />

(www.crossgrid.org), con una activa participación <strong>de</strong> grupos Españoles<br />

en el ámbito <strong>de</strong> la dispersión <strong>de</strong> contaminantes en la atmósfera y en la<br />

implementación <strong>de</strong> herramientas <strong>de</strong> minería <strong>de</strong> datos para bases <strong>de</strong> datos


164 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

meteorológicas. Fruto <strong>de</strong> estas iniciativas se están resolviendo distintos problemas<br />

<strong>de</strong> migración y adaptación <strong>de</strong> las técnicas y productos existentes<br />

al nuevo entorno GRID, facilitando el trabajo para futuras iniciativas en<br />

este campo. Otra <strong>de</strong> las experiencias piloto en este proyecto es la paralelización<br />

y migración a GRID <strong>de</strong>l mo<strong>de</strong>lo COAMPS en forma <strong>de</strong> servicio Web<br />

en el que el usuario pueda seleccionar interactivamente un área <strong>de</strong> interés,<br />

la resolución horizontal y vertical, y un período <strong>de</strong> predicción, obteniendo<br />

los campos meteorológicos solicitados resultado <strong>de</strong> la integración <strong>de</strong>l mo<strong>de</strong>lo.<br />

Está planeado integrar este servicio web con aplicaciones específicas <strong>de</strong><br />

cálculo <strong>de</strong> contaminates en la atmósfera, cálculo <strong>de</strong> oleaje, y procesamiento<br />

y análisis <strong>de</strong> proyectos <strong>de</strong> re-análisis regionales. En la Fig. 7.27 se muestran<br />

más <strong>de</strong>talles.<br />

Figura 7.27: Esquema previsto <strong>de</strong> integración <strong>de</strong> aplicaciones meteorológicas en el<br />

proyecto Cross-GRID.<br />

Una <strong>de</strong> estas aplicaciones es la utilización <strong>de</strong> técnicas <strong>de</strong> minería <strong>de</strong> datos<br />

a bases <strong>de</strong> datos meteorológicas, y Prometeo es un sistema que engloba parte<br />

<strong>de</strong> estas técnicas.<br />

7.5.3. Prometeo en un Entorno GRID<br />

Debido a las características <strong>de</strong>l sistema Prometo, éstas le hacen apropiado<br />

para el entorno GRID, ya que pue<strong>de</strong> aprovechar tanto recursos compu-


7.5. COMPUTACIÓN DISTRIBUIDA EN LA WEB. TECNOLOGÍA GRID 165<br />

tacionales como <strong>de</strong> almacenamiento distribuido:<br />

Ejecución interactiva <strong>de</strong>finida por el usuario. Cada usuario requiere<br />

una petición concreta <strong>de</strong> la aplicación, que tendrá que ser ejecutada<br />

según sus necesida<strong>de</strong>s <strong>de</strong> forma interactiva (área geográfica, variables<br />

atmosféricas, etc.). Ello supondrá ejecutar el sistema completo (configuración/explotación)<br />

en tiempo real. El tiempo <strong>de</strong> cómputo hace<br />

inviable su uso interactivo con tecnologías web estándar y hace necesario<br />

el uso <strong>de</strong> GRID.<br />

Alto coste computacional, que <strong>de</strong>manda cálculo distribuido masivo, en<br />

lugar <strong>de</strong> computación local en una sola máquina. Todos los algoritmos<br />

están bien <strong>de</strong>finidos y los más costosos <strong>de</strong> ellos (componentes principales<br />

y agrupamiento) son paralelizables. En la Sec. 7.5.4 analizamos<br />

el rendimiento <strong>de</strong> distintas versiones paralelizadas <strong>de</strong> este algoritmo<br />

en un entorno GRID <strong>de</strong> unida<strong>de</strong>s <strong>de</strong> computación y latencias <strong>de</strong> red<br />

heterogéneas.<br />

Acceso masivo a datos distribuidos. Aparte <strong>de</strong> los datos proporcionados<br />

por el usuario, el algoritmo requiere otros datos <strong>de</strong> entrada (reanálisis,<br />

observaciones, etc.) que en principio están distribuidos en distintos<br />

centros. Por ejemplo, la Fig. 7.26 muestra un posible GRID don<strong>de</strong><br />

la Universidad <strong>de</strong> Cantabria, el INM y el ECMWF serían tres <strong>de</strong> las<br />

re<strong>de</strong>s locales, haciendo posible la no replicación <strong>de</strong> datos y el acceso<br />

dinámico a los mismos.<br />

Aplicación paramétrica (parameter driven). Otra característica <strong>de</strong> Prometeo<br />

es que la aplicación forma un núcleo que sólo requiere un conjunto<br />

<strong>de</strong> datos <strong>de</strong> entrada (parámetros) para ejecutar una tarea específica.<br />

Este tipo <strong>de</strong> aplicaciones son manejables en un entorno GRID, tanto<br />

para su réplica en los distintos elementos <strong>de</strong> cómputo, como para su<br />

ejecución.<br />

Las fases más críticas para la implementación <strong>de</strong> Prometeo en un entorno<br />

GRID serían:<br />

1. La paralelización <strong>de</strong> los algoritmos <strong>de</strong> componentes principales y agrupamiento,<br />

teniendo en cuenta las características <strong>de</strong>l entorno GRID.<br />

2. Las inclusión en GRID <strong>de</strong> las bases <strong>de</strong> datos <strong>de</strong> reanálisis, operativa,<br />

y observaciones. En la actualidad no hay una única solución para la<br />

gestión y acceso a bases <strong>de</strong> datos distribuidas en el GRID, sino que se<br />

están planteando distintas alternativas.<br />

En la siguiente sección se muestran resultados <strong>de</strong> la primera tarea. La segunda<br />

tarea está todavía en fase <strong>de</strong> estudio.


166 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

7.5.4. Paralelización GRID <strong>de</strong> los Algoritmos <strong>de</strong> <strong>Agrupamiento</strong><br />

En esta sección se analiza la eficiencia <strong>de</strong> distintas paralelizaciones <strong>de</strong><br />

algoritmos <strong>de</strong> agrupamiento (en particular, <strong>de</strong> la SOM) en un entorno tipo<br />

GRID, don<strong>de</strong> los recursos computacionales disponibles son heterogéneos, y<br />

la velocidad <strong>de</strong> la red es variable <strong>de</strong> unos nodos a otros. Es <strong>de</strong>cir, no se trata<br />

<strong>de</strong> paralelizar el algoritmo teniendo en cuenta unas características estáticas<br />

<strong>de</strong> un cluster, sino tener en cuenta la heterogeneidad y variabilidad <strong>de</strong> estos<br />

factores. En consecuencia, los algoritmos tienen que ser adaptativos según<br />

la situación.<br />

Para <strong>de</strong>sarrollar un algoritmo <strong>de</strong> este tipo se ha comenzado analizando<br />

distintas opciones <strong>de</strong> paralelización <strong>de</strong>l algoritmo <strong>de</strong> la SOM <strong>de</strong>scrito en la<br />

Sec. 3.4 y que constituye la parte con mayor carga computacional <strong>de</strong>l sistema<br />

prometeo. Para este cometido se ha utilizado un cluster <strong>de</strong> 80 maquinas<br />

IBM mo<strong>de</strong>lo x220 server con un procesador Pentium III a una frecuencia <strong>de</strong><br />

1.26 GHz, con 512 MB <strong>de</strong> memoria RAM, y 90 GB <strong>de</strong> disco duro, todas ellas<br />

conectadas con una red Ethernet a 100 Mbps gestionada por dos switch <strong>de</strong><br />

1Gbps en la Figura 7.28 el esquema <strong>de</strong>l cluster. Este cluster es gestionado<br />

por el IFCA (Instituto <strong>de</strong> Física <strong>de</strong> Cantabria) y se pue<strong>de</strong> obtener más información<br />

<strong>de</strong>tallada en grid.ifca.unican.es. Cada uno <strong>de</strong> estos or<strong>de</strong>nadores<br />

constituye una unidad <strong>de</strong> cálculo.<br />

Todos los programas han sido <strong>de</strong>sarrollados en lenguaje C y usando la<br />

implementación <strong>de</strong> la Interfase <strong>de</strong> Paso <strong>de</strong> Mensajes (MPI, Message Passing<br />

Interfase) MPICH-p4 <strong>de</strong>sarrollado por el Argonne National Laboratory<br />

(www-unix.mcs.anl.gov/mpi/mpich). Aunque los resultados mostrados en<br />

esta Sección hayan sido obtenidos a partir <strong>de</strong> esta implementación, pruebas<br />

<strong>de</strong> ejecución, con resultados muy preliminares, se han realizado utilizando<br />

la implementación <strong>de</strong> MPI para Glogus (MPICH-g2). Debido a las inhomogeneida<strong>de</strong>s<br />

<strong>de</strong> comunicación en un entorno GRID, uno <strong>de</strong> los principales<br />

inconvenientes es el tamaño y la cantidad <strong>de</strong> mensajes enviados y recibidos<br />

durante el algoritmo. Así que, elegimos una arquitectura centralizada<br />

<strong>de</strong> maestro-esclavo para evitar el paso <strong>de</strong> una gran cantidad <strong>de</strong> mensajes<br />

entre las unida<strong>de</strong>s <strong>de</strong> cómputo. Mas aún, en un entorno GRID el maestro<br />

<strong>de</strong>bería chequear a las unida<strong>de</strong>s <strong>de</strong> cómputo durante el algoritmo, y tomar<br />

<strong>de</strong>cisiones si cualquiera <strong>de</strong> ellos no funcionase correctamente. Este punto <strong>de</strong><br />

vista es diferente con respecto a otras implementaciones paralelas <strong>de</strong> la SOM<br />

en las cuales se usa un paso masivo <strong>de</strong> mensajes sobre máquinas paralelas.<br />

La forma más simple <strong>de</strong> paralelización <strong>de</strong>l algoritmo <strong>de</strong> la SOM es dividir<br />

los datos, y <strong>de</strong> esta forma la suma en (3.16) pue<strong>de</strong> repartirse entre diferentes<br />

procesadores, como se muestra en la Fig. 7.29(a). Sin embargo, en este caso,<br />

<strong>de</strong>spués <strong>de</strong> cada ciclo completo, los esclavos tienen que enviar los prototipos<br />

al maestro, el cual calcula su actualización, y envía los centros finales a cada<br />

uno <strong>de</strong> los esclavos. Esta no es una implementación eficiente para el entorno<br />

GRID, ya que requiere un paso intensivo <strong>de</strong> datos.<br />

Las Figuras 7.29(b) y (c) muestran dos alternativas diferentes llama-


7.5. COMPUTACIÓN DISTRIBUIDA EN LA WEB. TECNOLOGÍA GRID 167<br />

Figura 7.28: Cluster local <strong>de</strong>l Instituto <strong>de</strong> Física <strong>de</strong> Cantabria (CSIC/Universidad<br />

<strong>de</strong> Cantabria).<br />

das SOM R y SOM C , respectivamente, para distribución computacional <strong>de</strong><br />

recursos con los vectores <strong>de</strong> prototipos replicados (y centralizados). En la Figura<br />

7.31 se muestra el pseudocódigo, <strong>de</strong> estos algoritmos usando la siguiente<br />

notación:<br />

Se consi<strong>de</strong>ra una SOM m = r × r; c k y w k ∈ R d representa el centro<br />

<strong>de</strong>l cluster C k antes y <strong>de</strong>spués <strong>de</strong> aplicar las restricciones topológicas,<br />

respectivamente.<br />

Se utilizan P + 1 procesadores (1 maestro y P esclavos).<br />

T i ⊂ {1, . . .,m}, i = 1, · · ·,P, son los índices <strong>de</strong> los vectores prototipos<br />

asignados al procesador i.<br />

Los diferentes mensajes requeridos para cada uno <strong>de</strong> los esquemas, se muestran<br />

en la Figura 7.29 con líneas discontinuas, las cuales pue<strong>de</strong>n correspon<strong>de</strong>r,<br />

o bien a una iteración <strong>de</strong>l algoritmo, o bien a un ciclo completo. En la<br />

Figura 7.29(b), el tamaño <strong>de</strong> los mensajes es mínimo, pero los prototipos<br />

<strong>de</strong>ben ser replicados y actualizados en cada unidad <strong>de</strong> cómputo (SOM R ).<br />

Por otro lado, en la Figura 7.29(c) se muestra que los cálculos son realizados<br />

únicamente en el maestro, pero para actualizar los centros es necesario<br />

enviar mensajes a los esclavos <strong>de</strong>spués <strong>de</strong> cada ciclo (SOM C ). En ambos<br />

casos, el cálculo <strong>de</strong> distancias <strong>de</strong> 3.15, esta distribuido por igual sobre cada<br />

uno <strong>de</strong> los esclavos. Por tanto, una SOM con m centros podría ser repartida<br />

hasta en P procesos esclavos, cada uno <strong>de</strong> ellos calculando m/P distancias.<br />

Para comprobar la eficiencia <strong>de</strong> estos algoritmos, se han realizado varios<br />

experimentos variando el número <strong>de</strong> centros m, la dimensión <strong>de</strong> los datos d,


168 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

Figura 7.29: Tres esquemas paralelos diferentes para el algoritmo <strong>de</strong> entrenamiento<br />

<strong>de</strong> la SOM: (a) distribución <strong>de</strong> datos (b), SOM R distribución computacional <strong>de</strong> recursos<br />

con los vectores prototipos replicados, (c) SOM C distribución computacional<br />

<strong>de</strong> recursos con los vectores prototipos centralizados.<br />

el tamaño <strong>de</strong> la base <strong>de</strong> datos n, y el número <strong>de</strong> ciclos. La Figura 7.30 muestra<br />

las curvas <strong>de</strong> speedup obtenidas para d = 500, n = 5500 y un tamaño<br />

variable <strong>de</strong> la SOM (<strong>de</strong>s<strong>de</strong> 10 × 5 = 50 a 40 × 40 = 1600 centros, o prototipos);<br />

los centros prototipos, son distribuidos en dos, cuatro y hasta veinte<br />

procesos, obteniendo curvas <strong>de</strong> speedup para los esquemas SOM R y SOM C .<br />

En la Figura 7.30(a) po<strong>de</strong>mos ver como la curva <strong>de</strong> speedup <strong>de</strong>l algoritmo<br />

SOM R tiene una gran <strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong>l tamaño <strong>de</strong> la SOM (m). esto no es<br />

sorpren<strong>de</strong>nte, ya que en cada iteración <strong>de</strong>l algoritmo el maestro calcula la<br />

neurona ganadora y la envía a los esclavos. Este proceso <strong>de</strong> comunicación<br />

arruina por completo el comportamiento paralelo cuando el número <strong>de</strong> centros<br />

es <strong>de</strong>masiado pequeño, ya que el cálculo <strong>de</strong> la distancia es rápido. Por<br />

otro lado, la Fig. 7.30(b) muestra speedup <strong>de</strong>l algoritmo <strong>de</strong> la SOM C . Se<br />

consiguen mejores comportamientos para tamaños <strong>de</strong> SOM pequeños o medianos,<br />

para un número dado <strong>de</strong> unida<strong>de</strong>s procesadoras. Cuando el balance<br />

entre el tiempo <strong>de</strong> paso <strong>de</strong> mensajes y el cálculo en el esclavo, se pier<strong>de</strong> (p.e.<br />

incrementando el numero <strong>de</strong> procesos, y <strong>de</strong> esto, <strong>de</strong>crementando el trabajo<br />

hecho por cada uno <strong>de</strong> los esclavos), el algoritmo se vuelve súbitamente<br />

ineficiente, <strong>de</strong>bido al coste <strong>de</strong> paso <strong>de</strong> mensajes.<br />

Estos resultados muestran que ninguno <strong>de</strong> los esquemas es el más eficiente<br />

para todas las situaciones. Por tanto, para la distribución <strong>de</strong> los primeros<br />

datos y luego la carga computacional es necesaria una estrategia híbrida.<br />

Este esquema adaptativo híbrido es a<strong>de</strong>cuado para el entorno GRID, ya que<br />

la distribución <strong>de</strong> recursos <strong>de</strong> datos y <strong>de</strong> cómputo pue<strong>de</strong> ser hecho <strong>de</strong> acuer-


7.5. COMPUTACIÓN DISTRIBUIDA EN LA WEB. TECNOLOGÍA GRID 169<br />

do a los recursos disponibles en el momento <strong>de</strong> la ejecución <strong>de</strong> cada tarea<br />

en el GRID (ver Gutiérrez et al., 2003, para más <strong>de</strong>talles).<br />

10x5 50x2 50x4 50x8<br />

40x20 40x40 Linear speedup<br />

(a)<br />

speedup<br />

20<br />

18<br />

16<br />

14<br />

12<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

2 4 6 8 10 12 14 16 18 20<br />

processors<br />

10x5 50x2 50x4 50x8<br />

40x20 40x40 Linear speedup<br />

(b)<br />

speedup<br />

20<br />

18<br />

16<br />

14<br />

12<br />

10<br />

8<br />

6<br />

4<br />

2<br />

0<br />

2 4 6 8 10 12 14 16 18 20<br />

processors<br />

Figura 7.30: Curvas <strong>de</strong> speedup para (a) SOM R (b) SOM C .


170 7. IMPLEMENTACIÓN OPERATIVA. PROMETEO<br />

(código esclavo)<br />

Inicializar los vectores prototipos en todos los procesadores<br />

for (epoch = 1, · · · ,N epoch )<br />

Inicializar los vectores <strong>de</strong> los centros a 0<br />

para (pattern = 1, · · · ,N pattern )<br />

para (cada j ∈ T i )<br />

calcular distancia d j<br />

fin para<br />

calcular nodo ganador g i en T i<br />

MPI Gather para pasar g i al maestro<br />

{∗ 1 }<br />

end for<br />

{∗ 2 }<br />

para (cada j ∈ T i )<br />

actualizar vector <strong>de</strong> prototipos w j<br />

fin para<br />

fin para<br />

(código maestro)<br />

for (epoch = 1, · · · ,N epoch )<br />

para (pattern = 1, · · · ,N pattern )<br />

MPI Gather para recibir g i <strong>de</strong> cada esclavo<br />

calcular el nodo ganador g<br />

{∗ 3 }<br />

fin para<br />

{∗ 4 }<br />

end for<br />

PARSOM R<br />

{∗ 1 } MPI Recv para recibir el nodo ganador g <strong>de</strong>l Maestro<br />

{∗ 2 } Nill<br />

{∗ 3 } MPI Bcast para comunicar el nodo ganador g a los esclavos<br />

{∗ 4 } Nill<br />

PARSOM C<br />

{∗ 1 } Nill<br />

{∗ 2 } MPI Recv para recibir los vectors <strong>de</strong> los centros <strong>de</strong>l Maestro<br />

{∗ 3 } update center vectors<br />

{∗ 4 } MPI Bcast para comunicar los vectores <strong>de</strong> los centros a cada<br />

esclavo<br />

Figura 7.31: Pseudo-código <strong>de</strong> los algoritmos paralelos para SOM R y SOM C<br />

.


Bibliografía<br />

Abarbanel, H. D. I. (1995). Analysis of Observed Chaotic Data. Springer.<br />

An<strong>de</strong>rberg, M. R. (1973). Cluster Analysis for Applications. Aca<strong>de</strong>mic<br />

Press, New York.<br />

An<strong>de</strong>rson, J. L. (1996). Selection of initial conditions for ensemble forecasts<br />

in a simple perfect mo<strong>de</strong>l framework. Journal of Atmospheric<br />

Sciences, 53:22–35.<br />

Ayuso, J. J. (1994). Predicción Estadística Operativa en el INM, vol. B-<br />

34 of Monografías <strong>de</strong>l Instituto Nacional <strong>de</strong> Meteorología. Ministerio <strong>de</strong><br />

Medio Ambiente, Madrid.<br />

Barry, R. and Chorley, R. (1998). Atmosphere, Weather and Climate.<br />

Routledge, London, 7th ed.<br />

Beniston, M. (1998). From Turbulence to Climate: Numerical Investigations<br />

of the Atmosphere with a Hierarchy of Mo<strong>de</strong>ls. Springer-Verlag.<br />

Bergman, M. J. and Delleur, J. W. (1985). Kalman filter estimation<br />

and prediction of daily streamflow: 1- review, algorithm, and simulation<br />

experiements; 2-application to the potomac river. Water Resources Bulletin,<br />

21(5):815–832.<br />

Billet, J., Delisi, M., Smith, B. G., and Gates, C. (1997). Use of<br />

regression techniques to predict hail size and the probability of large hail.<br />

Weather and Forecasting, 12:154–164.<br />

Box, G. E. P. and Jenkins, F. M. (1976). Time Series Analysis: Forecasting<br />

and Control. Hol<strong>de</strong>n-Day, Oakland, CA, 2nd ed.<br />

Brier, G. W. (1950). Verification of forecasts expressed in terms of probability.<br />

Monthly Weather Review, 78:1–3.<br />

Briggs, W. M. and Levine, R. A. (1997). Wavelets and field forecast<br />

verification. Monthly Weather Review, 125:1329–1341.<br />

171


172 BIBLIOGRAFÍA<br />

Buhamra, S., Smaoui, N., and Gabr, M. (2003). The box-jenkins analysis<br />

and neural networks: prediction and time series mo<strong>de</strong>lling. Applied<br />

Mathematical Mo<strong>de</strong>lling, 27:805–815.<br />

Buizza, R. and Palmer, T. N. (1995). Singular vector structure of the<br />

atmospheric global circulation. Journal of Atmospheric Sciences, 52:1434.<br />

Buizza, R., Richardson, D. S., and Palmer, T. N. (2001). The new<br />

80km high-resolution ECMWF EPS. ECMWF Newsletter, spring:90.<br />

Burguer, G. (1996). Expan<strong>de</strong>d downscaling for generating local weather<br />

scenarios. Climate Research, 7:111–128.<br />

Castillo, E., Cobo, A., Gutiérrez, J. M., and Pruneda, E. (1999). An<br />

Introduction to Functional Networks with Applications. Kluwer Aca<strong>de</strong>mic<br />

Publishers, Boston.<br />

Castillo, E., Fontela-Romero, O., Guijarro-Berdiñas, B., and<br />

Alonso-Betanzos, A. (2002). A global optimum approach for one-layer<br />

neural networks. Neural Computation, 14(6):1429–1449.<br />

Cavazos, T. (1997). Downscaling large-scale circulation to local winter<br />

rainfall in north-eastern mexico. International Journal of Climatology,<br />

17:1069–1082.<br />

Cavazos, T. (2000). Using self-organizing maps to investigate extreme<br />

climate event: An application to wintertime precipitation in the balkans.<br />

Journal of Climate, 13:1718–1732.<br />

Chatfield, C. (2003). The Analysis of Time Series: An Introduction. CRC<br />

Press, 6th ed.<br />

Chen, M., Xie, P., Janowiak, J. E., and Arkin, P. A. (2002). Precipiation:<br />

A 50-yr monthly analysis based on gauge observations. Journal<br />

of Hydrometeorology, 3:249–266.<br />

Cofiño, A. S., Abbott, P., and Gutiérrez, J. M. (2003a). Linguistic<br />

fractal analysis of symbolic sequences. In P. Mitic and et al., eds.,<br />

Chanllenging the Boundaries of Symbolic Computation, pp. 1–8. World<br />

Scientific Publication, Singapore.<br />

Cofiño, A. S., Cano, R., and Gutiérrez, J. M. (2002). Bayesian networks<br />

for probabilistic weather prediction. In Proceedings of the 15th<br />

European Conference on Artificial Intelligence, pp. 695–700. IOS Press.<br />

Cofiño, A. S., Cano, R., Gutiérrez, J. M., and Rodríguez, M. A.<br />

(1999). Prometeo: Un sistema experto para el pronóstico meteorológico<br />

local basado en re<strong>de</strong>s neuronales y cálculo <strong>de</strong> analogías. In Actas <strong>de</strong> las<br />

III Jornadas <strong>de</strong> Transferencia Tecnológica <strong>de</strong> Inteligencia Artificial., pp.<br />

11–19. CAEPIA.


BIBLIOGRAFÍA 173<br />

Cofiño, A. S., Cano, R., López, F. J., Gutiérrez, J. M., and Rodríguez,<br />

M. A. (2001a). Aplicación <strong>de</strong> métodos <strong>de</strong> clasificación al downscaling<br />

estadístico. In Actas <strong>de</strong>l V Simposio Nacional <strong>de</strong> Predicción, pp.<br />

49–50. Instituto Nacional <strong>de</strong> Meteorología, Madrid.<br />

Cofiño, A. S., Ciszak, M., and Gutierrez, J. M. (2003b). A practical<br />

approach to predictability in chaotic systems. Neural networks and<br />

anticipated synchronization. Enviado a Physica A.<br />

Cofiño, A. S. and Gutiérrez, J. M. (2001). Optimal modular feedforward<br />

neural networks based on functional networks. Lecture Notes in<br />

Artificial Intelligence, 2083:308–315.<br />

Cofiño, A. S., Gutiérrez, J. M., and Ivanissevich, M. L. (2003c).<br />

Evolving modular networks with genetic algorithms. application to nonlinear<br />

time series. Enviado a Expert Systems.<br />

Cofiño, A. S., Ivanissevich, M. L., and Gutiérrez, J. M. (2000). An<br />

hybrid evolutive genetic strategy for solving the inverse fractal problem<br />

of ifs mo<strong>de</strong>ls. Lecture Notes in Artificial Intelligence, 1952:467–476.<br />

Cofiño, A. S., Ivanissevich, M. L., and Gutiérrez, J. M. (2001b).<br />

Minimum <strong>de</strong>scription length quality measurues for modular functional<br />

networks. In Actas <strong>de</strong>l VII Congreso Argentino <strong>de</strong> Ciencias <strong>de</strong> la Computación,<br />

pp. 115–125.<br />

Cofiño, A. S., Primo, C., Cano, R., Sordo, C., and Gutiérrez, J. M.<br />

(2003d). Downscaling <strong>de</strong>meter seasonal ensemble precipitation forecasts<br />

in the tropics during el niño episo<strong>de</strong>s. Geophysical Research Abstracts,<br />

5:14586.<br />

Cofiño, A., Cano, R., and Gutiérrez, J. (2003a). Self-organizing maps<br />

for statistical downcaling in ensemble prediction systems. Climate Dynamics<br />

(enviado).<br />

Cofiño, A. S., Gutiérrez, J. M., Jakubiak, B., and Melonek, M.<br />

(2003b). Implementation of data mining techniques for meteorological<br />

applications. In W. Zwieflhofer and N. Kreitz, eds., Realizing Teracomputing,<br />

pp. 215–240. World Scientific.<br />

Corte-Real, J., Quian, B., and Xu, H. (1999). Circulation patterns,<br />

daily precipitation in portugal and implications for climate change simulated<br />

by the second hadley centre gcm. Climate Dynamics, 15:921–935.<br />

Díaz, E., García-Moya, J. A., Cofiño, A. S., and Orfila, B. (2003).<br />

Downscaling techniques applied to outputs of the <strong>de</strong>meter project over<br />

specific mediterranean regions. Geophysical Research Abstracts, 5:986.


174 BIBLIOGRAFÍA<br />

Drake, J., Foster, I., Michalakes, J., Toonen, B., and Worley, P.<br />

(1995). Design and performance of a scalable parallel community climate<br />

mo<strong>de</strong>l. Parallel Computing, December:245–257.<br />

Enke, W. and Spekat, A. (1997). Downscaling climate mo<strong>de</strong>l outputs<br />

into local and regional weather elements by classification and regression.<br />

Climate Research, 8:195–207.<br />

Faufoula-Georgiou, E. and Lettenmaier, D. P. (1987). A markov<br />

renewal mo<strong>de</strong>l for rainfall occurrences. Water Resources Research, 23:875–<br />

884.<br />

Fayyad, U. M., Piatetsky Shapiro, G., Smyth, P., and Uthurusamy,<br />

R. (1996). Advances in Knowledge Discovery and Data Mining. AAAI<br />

Press/The MIT Press, Cambridge, MA.<br />

Fernán<strong>de</strong>z, A., <strong>de</strong>l Hoyo, J., Peral, C., and Mestre, A. (2001). El<br />

sistema <strong>de</strong> predicción analógica <strong>de</strong>l la precipitación en el inm. Publicación<br />

interna <strong>de</strong>l INM.<br />

Fontela-Romero, O., Alonso-Betanzos, A., Castillo, E., Principe,<br />

J. C., and Guijarro-Berdiñas, B. (2002). Local mo<strong>de</strong>ling using<br />

self-organizing maps and single layer neural networks. Lectures Notes in<br />

Computer Science, 2415:945–950.<br />

Foster, I. and Kesselman, C. (1999). The Grid: Blueprint for a New<br />

Computing Infraestructure. Morgan-Kaufmann.<br />

Fovell, R. G. and Fovell, M. Y. C. (1993). Climate zones of the conterminous<br />

united states <strong>de</strong>fined using cluste analysis. Journal of Climate,<br />

6:2103–2135.<br />

Furundzic, D. (1998). Application example of neural networks for time<br />

series analysis: rainfall-runoff mo<strong>de</strong>ling. Signal Processing, 64:383–396.<br />

Gabriel, K. R. and Neumann, J. (1962). A markov chain mo<strong>de</strong>l for<br />

daily rainfall occurrences at Tel Aviv. Quaterly Journal of the Royal<br />

Meteorological Society, 88:90–95.<br />

Gardner, M. W. and Dorling, S. R. (1998). Artificial neural networks<br />

(the multilayer perceptron). A review of applicatios in the atmospheric<br />

sciences. Journal of Applied Meteorology, 39:147–159.<br />

Gollub, J. P. and Cross, M. C. (2000). Chaos in space and time. Nature,<br />

404:710–711.<br />

Grassberger, P. and Procaccia, I. (1983). Characterization of strange<br />

attractors. Physical Review Letters, 50:346–349.


BIBLIOGRAFÍA 175<br />

Gutiérrez, J. M., Cano, R., Cofiño, A. S., and Rodríguez, M. A.<br />

(2004a). Clustering methods for statistical downscaling in short-range<br />

weather forecast. Monthly Weather Review (en prensa).<br />

Gutiérrez, J. M., Cano, R., Cofiño, A. S., and Sordo, C. (2004b).<br />

Re<strong>de</strong>s Probabilística y <strong>Neuronales</strong> para las Ciencias Atmosféricas. Monografías<br />

<strong>de</strong>l Instituto Nacional <strong>de</strong> Meteorología. Ministerio <strong>de</strong> Medio<br />

Ambiente, Madrid. (en prensa).<br />

Gutiérrez, J. M., Cano, R., Cofiño, A. S., and Rodríguez, M. A.<br />

(1999). Re<strong>de</strong>s neuronales y patrones <strong>de</strong> analogías aplicados al downscaling<br />

climático. In La Climatología Española en los Albores <strong>de</strong>l Siglo XXI, pp.<br />

113–121. Asociación Española <strong>de</strong> Climatología.<br />

Gutiérrez, J. M., Cofiño, A. S., Cano, R., and Sordo, C. (2002a).<br />

A generalization of analogue downscaling methods by bayesian networks.<br />

In International Conference on Quatitative Precipitation Forecasting, pp.<br />

87–87. The World Weather Research Programme’s WWRP.<br />

Gutiérrez, J. M., Cofiño, A. S., Cano, R., and Sordo, C. (2002b).<br />

Probabilistic networks for statistical downscaling and spatialisation of meteorological<br />

data. Geophysical Research Abstracts, 4:192.<br />

Gutiérrez, J. M., Cofiño, A. S., and Ivanissevich, M. L. (2001). A<br />

comparison of different evolutive niching strategies for i<strong>de</strong>ntifying a set of<br />

selfsimilar contractions for the ifs inverse problem. Journal of Computer<br />

Science and Technology, 2(5):234–246.<br />

Gutiérrez, J. M., Cofiño, A. S., and Luengo, F. (2003). Grid oriented<br />

implementation of self-organizing maps for data mining in meteorology.<br />

Lecture Notes in Computer Science (en prensa).<br />

Gutiérrez, J. M., Sordo, C., Cano, R., Cofiño, A. S., and Rodríguez,<br />

M. A. (2002c). Dynamic bayesian networks for probabilistic<br />

time series prediction. Geophysical Research Abstracts, 4:284.<br />

Gutiérrez, J., Cofiño, A., Cano, R., and Primo, C. (2004). Analysis<br />

and downscaling multi-mo<strong>de</strong>l seasonal forecasts using self-organizing<br />

maps. Tellus A (en prensa).<br />

Hastie, T., Tibshirani, R., and Friedman, J. (2001). The Elements of<br />

Statistical Learning. Springer, New York.<br />

Hewitson, B. C. and Crane, R. G. (2002). Self-organizing maps: applications<br />

to synoptic climatology. Climate Research, 22(1):13–26.<br />

Hoerl, A. E. and Kennard, R. W. (1970). Ridge regression: biased<br />

estimation for nonorthogonal problems. Technometrics, 12:55–82.


176 BIBLIOGRAFÍA<br />

Hoffmann, G. (2001). Grid computing for meteorology. In W. Zwieflhofer<br />

and N. Kreitz, eds., Developments in Teracomputing, pp. 117–126. World<br />

Scientific.<br />

Holton, J. (1992). An Introduction to Dynamic Meteorology. Aca<strong>de</strong>mic<br />

Press.<br />

Hsieh, W. W. (2001). Nonlinear canonical correlation analysis of the tropical<br />

pacific climate variability using a neural network approach. Journal<br />

of Climate, 14:2528–2539.<br />

Hsieh, W. W. and Tang, B. (1998). Applying neural network mo<strong>de</strong>ls to<br />

prediction and data analysis in meteorology and oceanography. Bulletin of<br />

the American Meteorological Society, 79:1855–1870.<br />

Hughes, J., Lettemaier, D. P., and Guttorp, P. (1993). A stochastic<br />

approach for assessing the effect of changes in regional circulation patterns<br />

on local precipitation. Water Resources Research, 29:3303–3315.<br />

Hurrell, J. W. (1995). Decadal trends in the north atlantic oscillation and<br />

relationships to regional temperature and precipitation. Science, 269:676–<br />

679.<br />

Jolliffe, I. T. and Stephenson, D. B. (2003). Forecast Verification.<br />

John Wiley and Sons.<br />

Judd, K. (2003). Nonlinear state estimation, indistinguishable states, and<br />

the exten<strong>de</strong>d kalman filter. Physica D, 183:273–281.<br />

Kalkstein, L. S., Tan, G., and Skindlov, J. A. (1987). An evaluation of<br />

three clustering procedures for use in synoptic climatological classification.<br />

Journal of Climate and Applied Meteorology, 26:717–730.<br />

Kalnay, E. (2003). Atmospheric Mo<strong>de</strong>ling, Data Assimilation and Predictability.<br />

Cambridge University Press.<br />

Klein, W. H. and Glahn, H. R. (1974). Forecasting local weather by<br />

means of mo<strong>de</strong>l output statistics. Bulletin of the American Meteorological<br />

Society, 55:1217–1227.<br />

Kohonen, T. (2000). Self-Organizing Maps. Springer-Verlag, Berlin, 3rd<br />

ed.<br />

Köppen, W. (1918). Klassifikation <strong>de</strong>r klimate nach temperatur, nie<strong>de</strong>rschlag<br />

und jahreslauf. Petermanns Mitt, 64:193–203.<br />

Kramer, M. A. (1991). Nonlinear principal component analysis using<br />

autoassociative neural networks. Neural Computation, 9(7):1493–1516.<br />

Lorenz, E. N. (1963). Deterministic nonperiodic flow. Physical Review<br />

Letters, 20:130–141.


BIBLIOGRAFÍA 177<br />

Lorenz, E. N. (1969). Atmospheric predictability as revealed by naturally<br />

occuring analogues. Journal of the Atmospheric Sciences, 26:636–646.<br />

Lorenz, E. N. (1991). Dimension of weather and climate attractors. Nature,<br />

353:241–244.<br />

Lorenz, E. N. (1996). The Essence of Chaos. University of Washington<br />

Press.<br />

Macedo, M., Cook, D., and Brown, T. J. (2000). Visual data mining<br />

in atmospheric science data. Data Mining and Knowledge Discovery,<br />

4:69–80.<br />

Marzban, C. (2003). A neural network for post-processing mo<strong>de</strong>l output:<br />

ARPS. Monthly Weather Review, 131(6):1103–1111.<br />

Masters, T. (1995). Neural, Novel and Hybrid Algorithms for Time Series<br />

Prediction. John Wiley & Sons.<br />

McGinnis, D. L. (1994). Predicting snowfall from synoptic circulation: A<br />

comparison of linear regression and neural networks. In B. Hewitson and<br />

R. G. Crane, eds., Neural Nets: Applications in Geography, pp. 79–99.<br />

Kluwer Aca<strong>de</strong>mic Publishers.<br />

Middleton, G. (2000). Data Analysis in the Earth Sciences Using MAT-<br />

LAB. Prentice Hall.<br />

Mo, K. C. and Livezey, R. E. (1986). Tropical-extratropical geopotential<br />

height teleconnections during the northern hemisphere winter. Monthly<br />

Weather Review, 114:2488–2515.<br />

Murphy, A. H. (1973). A new vector partition of probability score. Journal<br />

of Applied Meteorology, 12:595–600.<br />

Murphy, A. H. (1993). What is a good forecast? an essay on the nature<br />

of goodness in weather forecasting. Weather and Forecasting, 8:281–293.<br />

Murphy, A. H. and Winkler, R. L. (1987). A general framework for<br />

forecast verification. Monthly Weather Review, 115:1330–1338.<br />

Noguer, M. (1994). Using statistical techniques to <strong>de</strong>duce local climate<br />

distributions. an application for mo<strong>de</strong>l validation. Meteorological Applications,<br />

1:277–287.<br />

Oja, E. and Kaski, S. (1999). Kohonen Maps. Elsevier, Amsterdam.<br />

Oliver, J. (1991). The history, status and future of climatic classification.<br />

Physical Geography, 12:231–251.


178 BIBLIOGRAFÍA<br />

Palmer, T. N., Alessandri, A., An<strong>de</strong>rsen, U., Cantelaube, P., Davey,<br />

M., Délécluse, P., Déqué, M., Díez, E., Doblas-Reyes, F. J.,<br />

Fed<strong>de</strong>rsen, H., Graham, R., Gualdi, S., Guérémy, J. F., Hagedorn,<br />

R., Hoshen, M., Keenlysi<strong>de</strong>, N., Latif, M., Lazar, A., Maisonnave,<br />

E., Marletto, V., Morse, A. P., Orfila, B., Rogel, P.,<br />

Terres, J. M., and Thomson, M. C. (2003). Development of a european<br />

enseble system for seasonal to inter-annual prediction (DEMETER).<br />

URL http://www.ecmwf.int/research/<strong>de</strong>meter/. Enviado a Bulletin<br />

of the American Meteorological Society.<br />

Peña, J. M., Lozano, J. A., and Larrañaga, P. (1999). An empirical<br />

comparison of four initialization methods for the k-means algorithm.<br />

Pattern Recognition Letters, 20:1027–1040.<br />

Pérez-Muñuzuri, V. and Gelpi, I. R. (2000). Application of nonlinear<br />

forecasting techniques for meteorological mo<strong>de</strong>ling. Annales Geophysicae,<br />

18:1349–1359.<br />

Philan<strong>de</strong>r, S. G. (1990). El Niño, La Niña, and the Southern Oscillation.<br />

Aca<strong>de</strong>mic Press, San Diego.<br />

Preisendorfer, R. W. and Mobley, C. D. (1988). Principal component<br />

analysis in meteorology and oceanography. Elsevier, Amsterdam.<br />

Press, W. H., Teulosky, S. A., Vetterling, W. T., and Flannery,<br />

B. P. (1992). Numerical Recipies. Cambridge University Press, Cambridge,<br />

2nd ed.<br />

Pu, Z.-X., Kalnay, E., Parrish, D., Wu, W., and Toth, Z. (1997). The<br />

use of the bred vectors in the ncep operational 3-dimensional variational<br />

system. Weather and Forecasting, 12:689–695.<br />

Richardson, D. S. (2000). Skill and economic value of the ecmwf ensemble<br />

prediction system. Quaterly Journal of the Royal Meteorological Society,<br />

126:649–668.<br />

Rodríguez-Fonseca, B. and Serrano, E. (1991). Winter 10-day coupled<br />

patterns between geopotential height and iberian peninsula rainfall using<br />

the ecmwf precipitation reanalysis. Journal of Climate, 15:1309–1321.<br />

Rodriguez-Iturbe, I., Cox, D. R., and Isham, V. (1987). Some mo<strong>de</strong>ls<br />

for rainfall based on stochastic point processes. Proc. of the Royeal Society<br />

of London A, 410:269–288.<br />

Rosenblat, F. (1962). Principles of Neurodynamics. Spartan, New York.<br />

Rumelhart, D. E. and McClelland, J. L. (1986). Parallel Distributed<br />

Processing: Explorations in the Microstructure of Cognition. The MIT<br />

Press, Cambridge.


BIBLIOGRAFÍA 179<br />

Sauer, T. (1994). Time series prediction by using <strong>de</strong>lay coordinate embedding.<br />

In A. S. Weigend and N. A. Gershenfeld, eds., Time Series Prediction:<br />

Forecasting the Future and Un<strong>de</strong>rstanding the Past, pp. 175–193.<br />

Addison-Wesley.<br />

Schizas, C. N., Pattichis, C. S., and Michaeli<strong>de</strong>s, S. C. (1994). Artificial<br />

neural networks in weather forecasting. Neural Networks, pp. 219–<br />

230.<br />

Schoof, J. T. and Pryor, S. C. (2001). Downscaling temperature and precipitation:<br />

A comparison of regression-based methods and artificial neural<br />

networks. International Journal of Climatology, 21(7):773–790.<br />

Shannon, C. E. (1948). A mathematical theory of communication. The<br />

Bell System Technical Journal, 27:623–656.<br />

Stern, R. D. (1982). Computing a probability distribution for the start of<br />

the rains from a markov chain mo<strong>de</strong>l for precipitation. Journal of Applied<br />

Meteorology, 21(3):420–422.<br />

Talagrand, O. (1997). Evaluation of probabilistic prediction systems. In<br />

Workshop on predictability, pp. 1–25. ECMWF.<br />

Toth, Z. (1991). Circulation patterns in phase space. A multinormal distribution?<br />

Montly Weather Review, 119:1501–1511.<br />

Tsonis, A. A. and Elsner, J. B. (1988). The wheater atrractor over very<br />

short time scales. Nature, 333:545–547.<br />

van <strong>de</strong>n Dool, H. M. (1989). A new look at weather forecasting though<br />

analogs. Montly Weather Review, 117:2230–2247.<br />

Verma, U., Yadav, M., and Hasija, R. C. (2002). A seasonal arima<br />

mo<strong>de</strong>l for monthly rainfall sequence. In 16th Australian Statistical Conference.<br />

Canberra, Australia.<br />

von Storch, H. (1999). On the use of “inflation”in statistical downscaling.<br />

Journal of Climate, 12:3505–3506.<br />

Wanner, H., Bronnimann, S., Casty, C., Fyalistras, D., Luterbacher,<br />

J., Schmutz, C., Stephenson, D. B., and Xoplaki, E. (2001).<br />

North atlantic oscillation – concepts and studies. Surveys in Geophysics,<br />

22:321–382.<br />

Wilby, R. L. and Wigley, T. M. L. (1997). Downscaling general circulation<br />

mo<strong>de</strong>l output. A review of methods and limitations. Progress in<br />

Physical Geography, 21:530–548.<br />

Wilby, R. L. and Wilks, D. S. (1999). The weather generation game.<br />

A review of stochastic weather mo<strong>de</strong>ls. Progress in Physical Geography,<br />

23:329–357.


180 BIBLIOGRAFÍA<br />

Wilks, D. S. (1995). Statisticaql methods in the atmospheric sciences.<br />

Aca<strong>de</strong>mic Press.<br />

Witten, I. H. and Frank, E. (1999). Data Mining: Practical Machine<br />

Learning Tools and Techniques with Java Implementations. Morgan<br />

Kaufmann.<br />

WMO (1994). Gui<strong>de</strong> to wmo binary co<strong>de</strong> form grib 1. technical report no.<br />

17.<br />

Wunsch, C. (1999). The interpretation of short climate records, with comments<br />

on the north atlantic and southern oscillation. Bulletin of the<br />

American Meteorological Society (BAMS), 80:245–255.<br />

Yuval and Hsieh, W. W. (2003). An adaptive nonlinear MOS scheme for<br />

precipitation forecasts using neural networks. Weather and Forecasting,<br />

18(2):303–310.<br />

Zhu, Y., Toth, Z., Wobus, R., Richardson, D., and Mylne, K.<br />

(2001). On the economic value of ensemble based weather forecasts. Bulletin<br />

of American Meteorological Society, 83:73–85.<br />

Zorita, E., Hughes, J. P., P, L. D., and von Storch, H. (1995). Stochastic<br />

characterization of regional circulation patterns for climate mo<strong>de</strong>l<br />

diagnosis and estimation of local precipitation. Journal of Climate,<br />

8:1023–1042.<br />

Zorita, E. and von Storch, H. (1999). The analog method as a simple<br />

statistical downscaling technique: Comparison with more complicated<br />

methods. Journal of Climate, 12:2474–2489.<br />

Zwiers, F. W. and von Storch, H. (1990). Regime <strong>de</strong>pen<strong>de</strong>nt autoregressive<br />

time series mo<strong>de</strong>lling of the southern oscillation. Journal of<br />

Climate, 3:1347–1363.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!