17.01.2013 Views

Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Noelia</strong> <strong>Cáceres</strong> <strong>Sánchez</strong><br />

<strong>TESIS</strong> <strong>DOCTORAL</strong>


ESTIMACIÓN DE MATRICES DE MOVILIDAD<br />

MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Septiembre 2009<br />

<strong>TESIS</strong> <strong>DOCTORAL</strong><br />

<strong>Noelia</strong> <strong>Cáceres</strong> <strong>Sánchez</strong>


<strong>TESIS</strong> <strong>DOCTORAL</strong><br />

ESTIMACIÓN DE MATRICES DE MOVILIDAD<br />

MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Presentada por: <strong>Noelia</strong> <strong>Cáceres</strong> <strong>Sánchez</strong><br />

Ingeniero <strong>de</strong> Telecomunicación<br />

Dirigida por: Francisco García Benítez<br />

Dr. Ingeniero Industrial<br />

Luis M. Romero Pérez<br />

Dr. Ingeniero Industrial<br />

Johan Wi<strong>de</strong>berg<br />

Dr. Ingeniero Industrial<br />

Septiembre 2009<br />

Departamento <strong>de</strong> Ingeniería Mecánica y <strong>de</strong> los Materiales<br />

Ingeniería e Infraestructura <strong>de</strong> los Transportes<br />

Escuela Técnica Superior <strong>de</strong> Ingenieros<br />

<strong>Universidad</strong> <strong>de</strong> <strong>Sevilla</strong><br />

Esta Tesis ha sido realizada gracias al proyecto TRA2005–09138, concedido por el Ministerio<br />

<strong>de</strong> Ciencia y Tecnología a través <strong>de</strong>l programa “Plan Nacional I+D”, y a VODAFONE <strong>de</strong>ntro<br />

<strong>de</strong>l marco <strong>de</strong>l “Proyecto Minerva” (1C-021).


A Fran, mi compañero <strong>de</strong> viaje<br />

A Pilar, nuestra ilusión


AGRADECIMIENTOS<br />

Esta Tesis Doctoral, si bien ha requerido <strong>de</strong> esfuerzo y mucha <strong>de</strong>dicación por parte <strong>de</strong> la autora<br />

y sus directores, su finalización no hubiese sido posible sin la cooperación <strong>de</strong> todas y cada una<br />

<strong>de</strong> las personas y entida<strong>de</strong>s que a continuación menciono. A Vodafone, especialmente a<br />

Santiago Borrero, Jesús Pérez y Mª Satur Torre. Al Centro <strong>de</strong> Gestión <strong>de</strong> Tráfico <strong>de</strong>l Suroeste<br />

(DGT), en particular a Ana Luz Jiménez. A Alejandro Carballar y Ana Ma<strong>de</strong>ra <strong>de</strong>l Proyecto<br />

Minerva. A Manuel García <strong>de</strong> ITSoft. A todos ellos gracias por su inestimable colaboración en<br />

el <strong>de</strong>sarrollo <strong>de</strong> este trabajo.<br />

Me gustaría agra<strong>de</strong>cer sinceramente a Dr. Francisco García Benítez, Dr. Luis M. Romero Pérez<br />

y Dr. Johan Wi<strong>de</strong>berg, la confianza <strong>de</strong>positada en mí, así como su <strong>de</strong>dicación y apoyo para que<br />

este trabajo llegara a buen término. Sus conocimientos, orientaciones, paciencia y motivación<br />

han sido fundamentales para mi formación como investigadora.<br />

De igual manera agra<strong>de</strong>cer a Dr. Jose María <strong>de</strong>l Castillo Granados los conocimientos y consejos<br />

ofrecidos para la realización <strong>de</strong> esta Tesis, especialmente en la última etapa.<br />

A mis compañeros <strong>de</strong> Departamento, por ofrecerme su ayuda y amistad, haciendo aún más<br />

agradable el trabajo cotidiano.<br />

A mis padres, mi hermano y mis abuelos, por el apoyo incondicional que me han dado en todo<br />

momento y porque, a pesar <strong>de</strong> la distancia, el ánimo y alegría que me brindan me dan la<br />

fortaleza necesaria para seguir a<strong>de</strong>lante.<br />

A Fran, por ser la persona con la que comparto mi vida, por su amor, paciencia y comprensión,<br />

porque en su compañía las cosas malas se convierten en buenas, la tristeza se transforma en<br />

alegría y la soledad no existe.<br />

Por último, y no menos importante, a mi hija Pilar, su nacimiento ha coincidido con el final <strong>de</strong><br />

la Tesis. Ella es lo mejor que me ha pasado nunca, y ha venido a este mundo a darme el último<br />

empujón para terminar este trabajo.


CONTENIDO<br />

CAPÍTULO 1 INTRODUCCIÓN .................................................................................................. 1<br />

1.1 MOTIVACIÓN ............................................................................................................ 1<br />

1.2 ÁMBITO DE LA <strong>TESIS</strong> ............................................................................................. 2<br />

1.3 OBJETIVOS ................................................................................................................ 4<br />

1.4 ANTECEDENTES ...................................................................................................... 6<br />

1.5 ESTRUCTURA DE LA <strong>TESIS</strong> ................................................................................. 13<br />

CAPÍTULO 2 REDES DE TELEFONÍA CELULAR: GSM .......................................................... 17<br />

2.1 INTRODUCCIÓN ..................................................................................................... 17<br />

2.2 ARQUITECTURA DE LA RED GSM ..................................................................... 18<br />

2.3 BASES DE DATOS HLR Y VLR ............................................................................ 23<br />

2.3.1 Introducción ........................................................................................................... 23<br />

2.3.2 Home Location Register (HLR) ............................................................................ 24<br />

2.3.3 Visitor Location Register (VLR) ........................................................................... 24<br />

2.4 IDENTIDADES Y NÚMEROS DE USUARIO Y RED ........................................... 25<br />

2.4.1 Internacional Mobile Station I<strong>de</strong>ntity (IMSI) ........................................................ 25<br />

2.4.2 Temporary Mobile Subscriber I<strong>de</strong>ntity (TMSI) .................................................... 26<br />

2.4.3 Location Area I<strong>de</strong>ntification (LAI) ....................................................................... 26<br />

2.4.4 Cell Global I<strong>de</strong>ntity CGI o Cell ID ....................................................................... 27<br />

2.5 DISEÑO DE LA RED CELULAR ............................................................................ 27<br />

2.6 GESTIÓN DE MOVILIDAD .................................................................................... 29<br />

2.6.1 Actualización <strong>de</strong> la posición (Location Update) ................................................... 29<br />

2.6.2 Entrega <strong>de</strong> llamada (Paging) ................................................................................. 30<br />

2.6.3 Traspaso (Handover) ............................................................................................. 31<br />

2.7 TRÁFICO Y DIMENSIONADO .............................................................................. 32<br />

2.7.1 Introducción ........................................................................................................... 32<br />

2.7.2 Mo<strong>de</strong>los <strong>de</strong> tráfico telefónico ................................................................................ 33<br />

i


CAPÍTULO 3 ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE<br />

TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL ............................................................................ 37<br />

3.1 INTRODUCCIÓN ..................................................................................................... 37<br />

3.2 MATRICES ORIGEN–DESTINO ............................................................................ 37<br />

3.3 VOLUMEN ............................................................................................................... 42<br />

3.4 VELOCIDAD ............................................................................................................ 46<br />

3.5 TIEMPOS DE VIAJE ................................................................................................ 50<br />

3.6 CONGESTIÓN .......................................................................................................... 53<br />

3.7 DENSIDAD DE TRÁFICO ....................................................................................... 54<br />

3.8 CARACTERÍSTICAS DE LOS DATOS DE TELEFONÍA MÓVIL ....................... 58<br />

3.8.1 Precisión <strong>de</strong> localización ....................................................................................... 58<br />

3.8.2 Tamaño <strong>de</strong> la muestra ............................................................................................ 60<br />

3.8.3 Aspectos legales .................................................................................................... 61<br />

3.9 CONCLUSIONES ..................................................................................................... 62<br />

CAPÍTULO 4 INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL<br />

..................................................................................................................................................... 65<br />

4.1 INTRODUCCIÓN ..................................................................................................... 65<br />

4.2 ANTECEDENTES Y ESTADO ACTUAL ............................................................... 65<br />

4.3 METODOLOGÍA PARA LA INFERENCIA DE VOLÚMENES DE VEHÍCULOS .<br />

................................................................................................................................... 67<br />

4.3.1 Planteamiento <strong>de</strong>l problema .................................................................................. 68<br />

4.3.2 Conteo <strong>de</strong> paso <strong>de</strong> teléfonos entre celdas. Extracción <strong>de</strong> la muestra ..................... 71<br />

4.3.3 Análisis <strong>de</strong>scriptivo <strong>de</strong> los datos <strong>de</strong> llamadas ....................................................... 73<br />

4.3.4 Tratamiento <strong>de</strong> los datos ........................................................................................ 76<br />

4.3.5 Elaboración <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> predicción .................................................................. 82<br />

4.3.6 Contraste <strong>de</strong> mo<strong>de</strong>los ............................................................................................ 97<br />

4.3.7 Conclusiones ....................................................................................................... 112<br />

ii


CAPÍTULO 5 APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN–DESTINO ............ 117<br />

5.1 INTRODUCCIÓN ................................................................................................... 117<br />

5.2 ANTECEDENTES Y ESTADO ACTUAL ............................................................. 119<br />

5.3 METODOLOGÍA DE AJUSTE DE MATRICES ORIGEN–DESTINO MEDIANTE<br />

VOLUMENES AGREGADOS ............................................................................................. 121<br />

5.3.1 Introducción ......................................................................................................... 121<br />

5.3.2 Definición <strong>de</strong>l problema ...................................................................................... 122<br />

5.3.3 Formulación matemática ..................................................................................... 124<br />

5.3.4 Algoritmo <strong>de</strong> ajuste ............................................................................................. 129<br />

5.4 CASOS PRÁCTICOS .............................................................................................. 140<br />

5.4.1 Experimento 1: Red Sioux–Falls ......................................................................... 140<br />

5.4.2 Experimento 2: Red Comunidad Autónoma <strong>de</strong> Madrid ...................................... 145<br />

CAPÍTULO 6 CONCLUSIONES Y LÍNEAS FUTURAS ............................................................. 153<br />

6.1 CONCLUSIONES ................................................................................................... 153<br />

6.1.1 Introducción ......................................................................................................... 153<br />

6.1.2 Evaluación <strong>de</strong>l uso <strong>de</strong> teléfonos móviles para movilidad <strong>de</strong> vehículos ............... 156<br />

6.1.3 Estudio <strong>de</strong> mercado ............................................................................................. 159<br />

6.2 LÍNEAS FUTURAS ................................................................................................ 162<br />

BIBLIOGRAFÍA .......................................................................................................................... 165<br />

APÉNDICE I GLOSARIO ............................................................................................................ 173<br />

APÉNDICE II PUBLICACIONES ................................................................................................. 179<br />

iii


ÍNDICE DE FIGURAS<br />

Figura 2-1: Arquitectura <strong>de</strong> la red GSM. ................................................................................... 19<br />

Figura 2-2: Estructura <strong>de</strong> IMSI (Fuente: Rec. GSM 03.03) ....................................................... 26<br />

Figura 2-3: Estructura <strong>de</strong> LAI (Fuente: Rec. GSM 03.03) ......................................................... 26<br />

Figura 2-4: Estructura <strong>de</strong> CGI (Fuente: Rec. GSM 03.03). ....................................................... 27<br />

Figura 2-5: Definición <strong>de</strong> celdas y áreas <strong>de</strong> localización. .......................................................... 27<br />

Figura 2-6: Antena omnidireccional (izquierda) y directiva – sectores 120º (<strong>de</strong>recha). ............ 28<br />

Figura 3-1: Flujo (rojo) y número <strong>de</strong> llamadas <strong>de</strong> teléfonos (ver<strong>de</strong>) en función <strong>de</strong>l tiempo.<br />

Izquierda: northbound (<strong>de</strong>s<strong>de</strong> ciudad), <strong>de</strong>recha: southbound (hacia ciudad). Todos los datos son<br />

promediados sobre intervalos <strong>de</strong> 15 minutos. (Thiessenhusen et al., 2006) ............................... 44<br />

Figura 3-2: Ejemplo <strong>de</strong> ubicación <strong>de</strong> aforo virtual. ................................................................... 44<br />

Figura 3-3: Comparación entre flujo real por un aforo virtual y el estimado tras el ajuste<br />

(Caceres et al., 2006). ................................................................................................................. 45<br />

Figura 3-4: Representación <strong>de</strong> un aforo “virtual”. ..................................................................... 46<br />

Figura 3-5: Promedio velocida<strong>de</strong>s: teléfonos vs. <strong>de</strong>tectores. Inter–Ciudad (arriba) e Intra–<br />

Ciudad (abajo) Motorway Northbound. (Ygnace, 2001) ............................................................ 47<br />

Figura 3-6: Velocidad en función <strong>de</strong>l tiempo obtenidos <strong>de</strong> datos GSM (+), <strong>de</strong>tectores (�), FCD<br />

(×) (Thiessenhusen et al., 2006). ................................................................................................. 48<br />

Figura 3-7: Concepto <strong>de</strong> estimación <strong>de</strong> velocidad usando doble–handover (Birle et al., 2006).49<br />

Figura 3-8: Zona handover (a) con solapamiento típico y (b) con solapamiento <strong>de</strong>bido a<br />

edificios (Birle et al., 2006). ....................................................................................................... 50<br />

Figura 3-9: Tiempos <strong>de</strong> viaje en la autovía <strong>de</strong> Ayalon, sentido Norte (Bar–Gera, 2007). ......... 52<br />

Figura 3-10: Estimaciones <strong>de</strong> tiempos <strong>de</strong> viajes y velocida<strong>de</strong>s en función <strong>de</strong>l tiempo <strong>de</strong> salida:<br />

datos GSM vs. LPR (Kummala, 2002). ...................................................................................... 52<br />

Figura 3-11: Relación entre volumen <strong>de</strong> llamadas y nivel <strong>de</strong> inci<strong>de</strong>ntes en la autovía A7 (agosto<br />

y septiembre 2000). Nota: Nivel <strong>de</strong> inci<strong>de</strong>ntes (level of inci<strong>de</strong>nt): 0 = ningún inci<strong>de</strong>nte<br />

<strong>de</strong>tectado por los <strong>de</strong>tectores, 14 = al menos 14 <strong>de</strong>tectores (<strong>de</strong> 21) <strong>de</strong>tectan un inci<strong>de</strong>nte en los<br />

correspondientes intervalos <strong>de</strong> 12 min; Volumen <strong>de</strong> llamadas (call volume): promedio <strong>de</strong><br />

v


número <strong>de</strong> llamadas entrantes y salientes registradas en los correspondientes intervalos <strong>de</strong> 12<br />

min (Ygnace, 2001). .................................................................................................................... 54<br />

Figura 3-12: Intensidad <strong>de</strong> tráfico telefónico a 10:00 a.m. en el área metropolitana <strong>de</strong> Graz. .. 55<br />

Figura 3-13: Representaciones <strong>de</strong> la <strong>de</strong>nsidad <strong>de</strong> llamadas <strong>de</strong> teléfonos móviles en el área<br />

metropolitana <strong>de</strong> Milán (20 km × 20 km) entre las 4 p.m. y las 6 p.m. ...................................... 56<br />

Figura 3-14: Medidas <strong>de</strong> uso <strong>de</strong> la red móvil (Erlangs) en 6 lugares <strong>de</strong> Roma (Rea<strong>de</strong>s et al.,<br />

2007). .......................................................................................................................................... 57<br />

Figura 3-15: Localización por I<strong>de</strong>ntificación Global <strong>de</strong> Celda CGI. ......................................... 58<br />

Figura 3-16: Múltiples vías <strong>de</strong>ntro <strong>de</strong> una celda. ....................................................................... 59<br />

Figura 3-17: Fronteras entre celdas y LAs. ................................................................................ 64<br />

Figura 4-1: Llamadas en movilidad: (a) handover y (b) 2 llamadas en t1 y t2 tal que<br />

t2-t1≤T=15min. ............................................................................................................................. 72<br />

Figura 4-2: Definición <strong>de</strong> frontera observada o aforo “virtual” en un mo<strong>de</strong>lo <strong>de</strong> red. .............. 73<br />

Figura 4-3: Tráfico telefónico (número <strong>de</strong> llamadas por hora) durante un día en una celda. .... 74<br />

Figura 4-4: Promedio <strong>de</strong>l número <strong>de</strong> llamadas por hora en diferentes celdas a lo largo <strong>de</strong> 18<br />

días. ............................................................................................................................................. 75<br />

Figura 4-5: Número <strong>de</strong> llamadas por hora durante un día según la duración <strong>de</strong> la llamada td. .. 75<br />

Figura 4-6: Duración media <strong>de</strong> las llamadas durante un día. ..................................................... 76<br />

Figura 4-7: Ejemplos <strong>de</strong> solapamiento entre celdas. .................................................................. 77<br />

Figura 4-8: Puntos kilométricos en los que en sus proximida<strong>de</strong>s existe una frontera entre celdas.<br />

..................................................................................................................................................... 79<br />

Figura 4-9: Coeficiente <strong>de</strong> Variación <strong>de</strong> la distribución <strong>de</strong> llamadas en diferentes celdas. ....... 81<br />

Figura 4-10: Densidad Espectral <strong>de</strong> Potencia <strong>de</strong> la distribución <strong>de</strong> llamadas en una celda. ...... 81<br />

Figura 4-11: Diagrama <strong>de</strong> contorno <strong>de</strong> isoprobabilidad <strong>de</strong> la cópula in<strong>de</strong>pen<strong>de</strong>ncia y la<br />

empírica. ...................................................................................................................................... 84<br />

Figura 4-12: Probabilidad <strong>de</strong> hacer una llamada a bordo <strong>de</strong> vehículo. ...................................... 89<br />

Figura 4-13: Probabilidad <strong>de</strong> handover Ph según el el factor <strong>de</strong> movilidad α. ........................... 90<br />

Figura 4-14: Evolución <strong>de</strong> la probabilidad <strong>de</strong> handover en la celda origen <strong>de</strong> la frontera k según<br />

el intervalo horario ti. .................................................................................................................. 92<br />

vi


Figura 4-15: Evolución <strong>de</strong>l nº <strong>de</strong> llamadas y <strong>de</strong> vehículos en una frontera según el intervalo<br />

horario. ........................................................................................................................................ 94<br />

Figura 4-16: Factor <strong>de</strong> intensidad <strong>de</strong>l paso <strong>de</strong> vehículos según el intervalo horario ti. .............. 95<br />

Figura 4-17: Factor <strong>de</strong> intensidad <strong>de</strong>l paso <strong>de</strong> vehículos según el intervalo horario ti. .............. 96<br />

Figura 4-18: Evolución horaria <strong>de</strong>l error relativo en valor absoluto para cada uno <strong>de</strong> los<br />

mo<strong>de</strong>los. ...................................................................................................................................... 99<br />

Figura 4-19: Evolución horaria <strong>de</strong>l error absoluto para cada uno <strong>de</strong> los mo<strong>de</strong>los. .................... 99<br />

Figura 4-20: Distribución acumulada <strong>de</strong>l valor absoluto <strong>de</strong>l error relativo en porcentajes<br />

(arriba). Zoom en torno a los valores <strong>de</strong> error relativo absoluto 15-30% (abajo). .................... 100<br />

Figura 4-21: Test gráfico <strong>de</strong> normalidad. ................................................................................. 103<br />

Figura 4-22: Histograma <strong>de</strong>l error relativo <strong>de</strong> cada mo<strong>de</strong>lo según el nº <strong>de</strong> bins <strong>de</strong>finido por<br />

Knuth. ........................................................................................................................................ 104<br />

Figura 4-23: Histograma <strong>de</strong>l error relativo <strong>de</strong> cada mo<strong>de</strong>lo según el nº <strong>de</strong> bins <strong>de</strong>finido por<br />

Stone. ......................................................................................................................................... 104<br />

Figura 4-24: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 1 y la frontera 2. ........................................................................................................... 106<br />

Figura 4-25: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 3 y la frontera 4. ........................................................................................................... 106<br />

Figura 4-26: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 5 y la frontera 6 en cada periodo horario. .................................................................... 107<br />

Figura 4-27: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 7 y la frontera 8 en cada periodo horario. .................................................................... 107<br />

Figura 4-28: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 9 y la frontera 10 en cada periodo horario. .................................................................. 108<br />

Figura 4-29: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 11 y la frontera 12 en cada periodo horario. ................................................................ 108<br />

Figura 4-30: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan<br />

la frontera 1 y la frontera 2. ....................................................................................................... 109<br />

Figura 4-31: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan<br />

la frontera 3 y la frontera 4. ....................................................................................................... 110<br />

vii


Figura 4-32: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan<br />

la frontera 5 y la frontera 6 en cada periodo horario. ................................................................ 110<br />

Figura 4-33: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan<br />

la frontera 7 y la frontera 8 en cada periodo horario. ................................................................ 111<br />

Figura 4-34: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan<br />

la frontera 9 y la frontera 10 en cada periodo horario. .............................................................. 111<br />

Figura 4-35: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan<br />

la frontera 11 y la frontera 12 en cada periodo horario. ............................................................ 112<br />

Figura 5-1: Red <strong>de</strong> Sioux Falls, incluyendo distribución ficticia <strong>de</strong> LAs y celdas. ................. 141<br />

Figura 5-2: Correlación entre los volúmenes observados en fronteras (grupos <strong>de</strong> arcos) y los<br />

mo<strong>de</strong>lados al asignar la matriz previa (a) y la matriz estimada (b). .......................................... 144<br />

Figura 5-3: Correlación entre la matriz previa y la matriz estimada. ....................................... 145<br />

Figura 5-4: Nodos <strong>de</strong> la red <strong>de</strong> Madrid agrupados en 15 LAs. ................................................ 146<br />

Figura 5-5: Correlación entre los volúmenes observados en fronteras (grupos <strong>de</strong> arcos) y los<br />

mo<strong>de</strong>lados al asignar la matriz previa (a) y la matriz estimada (b). .......................................... 147<br />

Figura 5-6: Correlación entre los volúmenes <strong>de</strong> arcos observados (pertenecientes a alguna<br />

frontera observada) y los mo<strong>de</strong>lados al asignar la matriz previa (a) y la matriz estimada (b). . 149<br />

Figura 5-7: (a) Evolución <strong>de</strong> la función objetivo durante el proceso <strong>de</strong> ajuste <strong>de</strong> la matriz. (b)<br />

Zoom para los subproblemas 2–5. (c) Zoom para el término <strong>de</strong> las restricciones <strong>de</strong> la función<br />

objetivo. ..................................................................................................................................... 151<br />

viii


ÍNDICE DE TABLAS<br />

Tabla 3-1: Comparativa <strong>de</strong> volúmenes <strong>de</strong>rivados <strong>de</strong> handovers o procesos <strong>de</strong> LU. .................. 64<br />

Tabla 4-1: Extracto <strong>de</strong> los datos entregados por el operador. .................................................... 70<br />

Tabla 4-2: ID fronteras asociados a cada punto kilométrico y sentido. ..................................... 79<br />

Tabla 4-3: Días observados. ....................................................................................................... 80<br />

Tabla 4-4: Medidas <strong>de</strong> error para cada mo<strong>de</strong>lo. ......................................................................... 98<br />

Tabla 4-5: Percentiles <strong>de</strong>l error relativo en valor absoluto para cada mo<strong>de</strong>lo. ........................ 100<br />

Tabla 4-6: Correlación por rango (Spearman) y lineal (Pearson) entre { yi ,ˆ y i } para cada<br />

mo<strong>de</strong>lo. ...................................................................................................................................... 101<br />

Tabla 4-7: Valores <strong>de</strong> Logaritmo <strong>de</strong> la verosimilitud (LLF), AIC y BIC <strong>de</strong>l conjunto <strong>de</strong> errores<br />

relativos <strong>de</strong> cada mo<strong>de</strong>lo, junto al número <strong>de</strong> parámetros <strong>de</strong> cada mo<strong>de</strong>lo. ............................. 105<br />

Tabla 5-1: Fronteras observadas válidas y arcos asociados. .................................................... 142<br />

Tabla 5-2: Comparativa <strong>de</strong> ecuación <strong>de</strong> la recta <strong>de</strong> regresión y R 2 , antes y <strong>de</strong>spués <strong>de</strong> ajuste. 149<br />

Tabla 6-1: Ejemplos <strong>de</strong> Aplicaciones según mercados <strong>de</strong> negocio. ......................................... 161<br />

ix


CAPÍTULO 1<br />

INTRODUCCIÓN<br />

1.1 MOTIVACIÓN<br />

La creciente movilidad existente en la sociedad actual, potenciada por el incremento <strong>de</strong>l uso <strong>de</strong>l<br />

automóvil, exige técnicas y mecanismos cada vez más complejos para una correcta gestión y<br />

planificación <strong>de</strong> la red viaria. El objetivo <strong>de</strong> dicha planificación <strong>de</strong>l transporte es respon<strong>de</strong>r<br />

a<strong>de</strong>cuadamente a las necesida<strong>de</strong>s <strong>de</strong> movilidad <strong>de</strong> la población, por medio <strong>de</strong>l dimensionado <strong>de</strong><br />

la infraestructura y <strong>de</strong> la utilización <strong>de</strong> los medios <strong>de</strong> transporte, estableciendo los costes <strong>de</strong> la<br />

solución adoptada, las fuentes <strong>de</strong> los recursos necesarios, y los plazos respectivos <strong>de</strong> las etapas<br />

propuestas. Asimismo, la complejidad <strong>de</strong> los sistemas <strong>de</strong> transporte actuales ha mostrado la<br />

conveniencia <strong>de</strong> contar con herramientas analíticas que permitan al planificador disponer <strong>de</strong> un<br />

a<strong>de</strong>cuado conocimiento <strong>de</strong>l sistema y po<strong>de</strong>r hacer predicciones. Un modo <strong>de</strong> lograrlo es<br />

caracterizar las vías en términos <strong>de</strong> una serie <strong>de</strong> parámetros como son la velocidad, tiempos <strong>de</strong><br />

viajes, flujos, etc. La obtención <strong>de</strong> esos datos <strong>de</strong> tráfico <strong>de</strong> una forma precisa y rápida es <strong>de</strong> vital<br />

importancia para la planificación y gestión <strong>de</strong>l tráfico.<br />

Las nuevas tecnologías, cada vez más extendidas en la sociedad, juegan un papel clave para<br />

introducir mejoras en la estimación <strong>de</strong> estos parámetros y así hacer frente a los principales<br />

problemas <strong>de</strong> tráfico: movilidad, saturación y seguridad. Un modo <strong>de</strong> conseguirlo es mediante la<br />

telefonía móvil. Según los últimos estudios <strong>de</strong> mercado, las tasas <strong>de</strong> penetración <strong>de</strong> telefonía<br />

celular superan ya el 90% <strong>de</strong> la población <strong>de</strong> gran cantidad <strong>de</strong> países (CDB, 2006). Por ello,<br />

parece lógico pensar que cada vehículo pue<strong>de</strong> llevar a bordo algún teléfono. La propia gestión<br />

<strong>de</strong> movilidad que poseen las re<strong>de</strong>s <strong>de</strong> telefonía celular genera ciertos parámetros para su<br />

correcto funcionamiento, tal que un tratamiento apropiado <strong>de</strong> ellos, sin necesidad <strong>de</strong> revelar<br />

información confi<strong>de</strong>ncial <strong>de</strong> sus abonados, permitirá <strong>de</strong>terminar ciertos datos relativos a la<br />

movilidad <strong>de</strong> vehículos mediante los teléfonos que se lleven a bordo.


2 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

La i<strong>de</strong>a <strong>de</strong>l empleo <strong>de</strong> teléfonos móviles para monitorizar el tráfico rodado no es nueva. Sobre<br />

este tema han aparecido múltiples trabajos en los últimos años, los cuales se revisan con más<br />

<strong>de</strong>talle en la Sección 1.4 y el Capítulo 3. Sobre este campo lleva varios años trabajando el<br />

Grupo <strong>de</strong> Transportes <strong>de</strong> la E.T.S.I. <strong>de</strong> <strong>Sevilla</strong>. En uno <strong>de</strong> los trabajos previos, se realizó un<br />

estudio sobre una zona piloto (<strong>Cáceres</strong> et al., 2005), financiado por el Ministerio <strong>de</strong> Fomento a<br />

través <strong>de</strong> las Ayudas a la Realización <strong>de</strong> Proyectos I+D en el Área <strong>de</strong> Transportes<br />

FOM/486/2003, el cual <strong>de</strong>mostró la viabilidad <strong>de</strong> la inferencia <strong>de</strong> datos <strong>de</strong> tráfico a través <strong>de</strong><br />

información disponible <strong>de</strong> telefonía celular. Para ello se <strong>de</strong>sarrolló una herramienta simuladora<br />

que, al tiempo que mo<strong>de</strong>laba la situación <strong>de</strong> tráfico <strong>de</strong>l escenario <strong>de</strong> estudio mediante un<br />

simulador <strong>de</strong> tráfico comercial, AIMSUN, generaba unos datos <strong>de</strong> localización <strong>de</strong> teléfonos<br />

similares a como se consiguen en las re<strong>de</strong>s GSM. Con esos registros <strong>de</strong> localización “ficticios”,<br />

el proceso <strong>de</strong> estimación se fundamentó en un análisis para controlar el paso por las distintas<br />

celdas que cubrían el tramo estudiado, actuando los teléfonos como equipos <strong>de</strong> medida<br />

anónimos e indirectos. Los datos extraídos proporcionaron información <strong>de</strong> movilidad con la que<br />

inferir parámetros como matrices O–D y volúmenes. A<strong>de</strong>más, este simulador permitió la<br />

posibilidad <strong>de</strong> evaluar los resultados inferidos puesto que, mientras generaba los registros <strong>de</strong><br />

localización oportunos, paralelamente, almacenaba los datos <strong>de</strong> la situación <strong>de</strong> tráfico simulada<br />

a fin <strong>de</strong> evaluar la precisión <strong>de</strong> estimación <strong>de</strong> esta técnica. Los resultados obtenidos revelaron el<br />

potencial <strong>de</strong> esta nueva técnica al obtener gran precisión en la estimación <strong>de</strong> datos <strong>de</strong> tráfico.<br />

Este hecho, junto con la existencia <strong>de</strong> proyectos similares en otros países don<strong>de</strong> participan<br />

operadores <strong>de</strong> telefonía móvil, impulsó la investigación <strong>de</strong>ntro <strong>de</strong> este campo <strong>de</strong> cara a la<br />

implementación sobre un escenario real.<br />

1.2 ÁMBITO DE LA <strong>TESIS</strong><br />

Una <strong>de</strong> las principales características en la sociedad actual es el continuo incremento en la<br />

movilidad <strong>de</strong> personas y mercancías. Esto conlleva un conjunto <strong>de</strong> problemas tales como<br />

congestión y retraso. Resolver problemas <strong>de</strong>rivados <strong>de</strong> la movilidad se consi<strong>de</strong>ra hoy uno <strong>de</strong> los<br />

ejes centrales en la gestión y planificación <strong>de</strong> la red viaria. Para conocer eficientemente las<br />

características <strong>de</strong>l tráfico vehicular existente en la red viaria sería necesario aforar todas las vías<br />

<strong>de</strong> manera casi permanente, lo cual implicaría disponer <strong>de</strong> una infraestructura consi<strong>de</strong>rable cuyo<br />

coste <strong>de</strong> instalación y mantenimiento es poco asumible. Así pues, surge la necesidad <strong>de</strong> nuevas<br />

alternativas que permitan caracterizar el tráfico <strong>de</strong> un modo rápido, preciso y continuo, sin un<br />

excesivo coste. El <strong>de</strong>sarrollo <strong>de</strong> la telefonía móvil impulsa su uso como alternativa para la<br />

gestión <strong>de</strong> tráfico. Su extendido uso en las socieda<strong>de</strong>s mo<strong>de</strong>rnas hace consi<strong>de</strong>rar a sus abonados


Capítulo 1: INTRODUCCIÓN 3<br />

como una muestra extensa <strong>de</strong> la que extraer datos, convirtiéndose sus terminales en sondas<br />

anónimas para caracterizar el tráfico <strong>de</strong> un modo transparente.<br />

En lo que respecta a la gestión <strong>de</strong>l tráfico <strong>de</strong> vehículos, una <strong>de</strong> las fuentes <strong>de</strong> información más<br />

<strong>de</strong>mandadas, con vista a la gestión <strong>de</strong> la red <strong>de</strong> infraestructura terrestre y su planificación<br />

estratégica, son los datos <strong>de</strong> movilidad origen–<strong>de</strong>stino. Estos datos, organizados en matrices<br />

origen–<strong>de</strong>stino (O–D), proporcionan una estimación <strong>de</strong>l número <strong>de</strong> personas que se <strong>de</strong>splazan<br />

entre puntos <strong>de</strong> una <strong>de</strong>terminada red en un periodo <strong>de</strong> tiempo dado, <strong>de</strong>finiendo el mapa <strong>de</strong><br />

movilidad. La estimación precisa <strong>de</strong> estas matrices, para modos <strong>de</strong> transporte mecanizados, es<br />

imprescindible para que la Administración optimice el uso <strong>de</strong> esta infraestructura <strong>de</strong>s<strong>de</strong> el punto<br />

<strong>de</strong> vista <strong>de</strong>l usuario (en su utilización diaria) así como <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> las inversiones<br />

a realizar, necesarias para la a<strong>de</strong>cuación <strong>de</strong> estas infraestructuras a las necesida<strong>de</strong>s previstas y<br />

pronosticadas en escenarios futuros.<br />

La estimación <strong>de</strong> una matriz O–D, <strong>de</strong>s<strong>de</strong> la toma inicial <strong>de</strong> datos hasta la explotación <strong>de</strong> los<br />

primeros resultados, supone un largo proceso que pue<strong>de</strong> abarcar un periodo <strong>de</strong> incluso años.<br />

Esta restricción, junto con los costes económicos y los medios necesarios para llevarla a cabo,<br />

implica que el único usuario posible <strong>de</strong> dichas matrices sea la Administración. Por ello, una<br />

matriz O–D obtenida <strong>de</strong> una forma automática y, en cierto modo, inmediata supondría una<br />

auténtica revolución en los estudios <strong>de</strong> movilidad encargados por la Administración. Junto a<br />

ello, podría dar también una respuesta inmediata a los problemas <strong>de</strong>rivados <strong>de</strong> la movilidad,<br />

permitiendo abordar temas a los que hasta ahora ha <strong>de</strong>dicado pocos recursos, como la movilidad<br />

<strong>de</strong> fin <strong>de</strong> semana, movilidad asociada a ocio, movilidad a pie, etc.<br />

Históricamente, las matrices origen–<strong>de</strong>stino han sido estimadas en base a tres metodologías<br />

diferentes.<br />

1. Estimación directa: Llevando a cabo un proceso <strong>de</strong> encuestación, domiciliario o viario<br />

(directo sobre una muestra <strong>de</strong> vehículos o por ficha proporcionada a conductores, o<br />

indirecto por captación <strong>de</strong> números <strong>de</strong> matrículas).<br />

2. Estimación por mo<strong>de</strong>los <strong>de</strong> <strong>de</strong>manda: Haciendo uso <strong>de</strong> un mo<strong>de</strong>lo <strong>de</strong> distribución (e.g.:<br />

mo<strong>de</strong>lo <strong>de</strong> gravedad).<br />

3. Estimación mediante conteos <strong>de</strong> tráfico: Utilizando conteos <strong>de</strong> tráfico a fin <strong>de</strong> actualizar<br />

una matriz origen–<strong>de</strong>stino preexistente.


4 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

De las tres aproximaciones anteriores, la primera <strong>de</strong> ellas, que utiliza resultados <strong>de</strong> la teoría <strong>de</strong><br />

muestras, es la que proporciona los resultados más fiables. Sin embargo, llevar a cabo una<br />

encuesta amplia y <strong>de</strong>tallada, que permita elaborar matrices O–D completas, resulta ser un<br />

proceso costoso, <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista económico y social (las encuestas a vehículos sobre el<br />

viario son altamente distorsionantes, consumen mucho tiempo y dan lugar a resultados con<br />

ciertos sesgos).<br />

La segunda <strong>de</strong> ellas aplica mo<strong>de</strong>los sintéticos, <strong>de</strong> <strong>de</strong>manda <strong>de</strong> viajes, al sistema <strong>de</strong> transporte<br />

actual para obtener estimaciones <strong>de</strong> los flujos origen–<strong>de</strong>stino. Estos mo<strong>de</strong>los pue<strong>de</strong>n ser<br />

calibrados específicamente para el área <strong>de</strong> estudio o transferidos <strong>de</strong>s<strong>de</strong> áreas similares.<br />

La tercera alternativa es la más profusamente utilizada en las últimas décadas y ha dado lugar a<br />

innumerables contribuciones <strong>de</strong>s<strong>de</strong> el trabajo pionero <strong>de</strong> Low (1972). La metodología en la que<br />

se basa exige, como prerrequisito, un conjunto <strong>de</strong> aforos que recogen conteos <strong>de</strong> tráfico<br />

(volúmenes observados) y una matriz O–D previa (obtenida <strong>de</strong> algún estudio cronológicamente<br />

anterior o <strong>de</strong> una encuestación básica que pre<strong>de</strong>fina la estructura <strong>de</strong> la matriz final a obtener).<br />

Los aforos <strong>de</strong> tráfico es un tipo <strong>de</strong> información que se recoge <strong>de</strong> forma automática en un<br />

conjunto <strong>de</strong> puntos asociados a arcos <strong>de</strong>l viario y, por consiguiente, se encuentran disponibles<br />

en áreas urbanas a muy bajo coste. De aquí que esta última alternativa presenta las ventajas<br />

económicas <strong>de</strong> eliminar encuestas, las manipulaciones <strong>de</strong> datos, los chequeos y las validaciones<br />

en gran medida. Sin embargo, presenta la <strong>de</strong>sventaja <strong>de</strong> <strong>de</strong>pen<strong>de</strong>r <strong>de</strong> la infraestructura <strong>de</strong><br />

<strong>de</strong>tectores (aforos) existente.<br />

El problema <strong>de</strong> ajustar una matriz <strong>de</strong> viajes O–D, a partir <strong>de</strong> mediciones <strong>de</strong> aforos en una red <strong>de</strong><br />

tráfico y <strong>de</strong> una matriz O–D <strong>de</strong>sactualizada, ha suscitado un gran interés en los últimos años.<br />

Esto es <strong>de</strong>bido, fundamentalmente, a que la información se pue<strong>de</strong> obtener más rápida y<br />

económicamente que la obtenida tradicionalmente mediante la realización <strong>de</strong> encuestas. Es en<br />

este contexto don<strong>de</strong> se va a centrar esta Tesis, pero introduciendo una novedad respecto a los<br />

volúmenes observados. En lugar <strong>de</strong> los tradicionales conteos <strong>de</strong> tráfico realizados por los aforos,<br />

se utilizarán como volúmenes observados datos <strong>de</strong> movilidad <strong>de</strong>rivados <strong>de</strong> la telefonía móvil.<br />

Esto implicará el <strong>de</strong>sarrollo <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> inferencia <strong>de</strong> volúmenes <strong>de</strong> tráfico mediante datos <strong>de</strong><br />

teléfonos así como algoritmos <strong>de</strong> ajuste adaptados a las características <strong>de</strong> esos volúmenes.<br />

1.3 OBJETIVOS<br />

Como ya se ha comentado en líneas anteriores, la obtención <strong>de</strong> datos <strong>de</strong> una forma precisa y<br />

rápida es una <strong>de</strong> las principales preocupaciones para la planificación y gestión <strong>de</strong>l tráfico. Entre


Capítulo 1: INTRODUCCIÓN 5<br />

esta información <strong>de</strong> tráfico <strong>de</strong>stacan las matrices origen–<strong>de</strong>stino, las cuales son esenciales con<br />

vista a la gestión <strong>de</strong> la red y su planificación. De las metodologías existentes para la estimación<br />

<strong>de</strong> matrices O–D, la más extendida se basa en el ajuste <strong>de</strong> una matriz previa (obtenida <strong>de</strong> algún<br />

estudio cronológicamente anterior o <strong>de</strong> una encuestación básica que pre<strong>de</strong>fina la estructura <strong>de</strong> la<br />

matriz final a obtener) mediante conteos <strong>de</strong> tráfico medidos en un subconjunto <strong>de</strong> arcos <strong>de</strong> la<br />

red, a fin <strong>de</strong> encontrar una matriz O–D que, cuando sea asignada a la red, reproduzca los<br />

conteos <strong>de</strong> tráfico observados.<br />

Una posible alternativa, tanto para la <strong>de</strong>terminación <strong>de</strong> las matrices <strong>de</strong> movilidad O–D como<br />

para la captación <strong>de</strong> aforos en <strong>de</strong>terminados puntos <strong>de</strong> la red <strong>de</strong> infraestructura terrestre<br />

(carreteras, viarios,…), consiste en la utilización <strong>de</strong> ciertos datos <strong>de</strong> posición <strong>de</strong> teléfonos<br />

móviles, los cuales son conocidos por los operadores móviles para su correcta administración <strong>de</strong><br />

servicios. Estos terminales no tienen una posición fija sino que pue<strong>de</strong>n moverse libremente.<br />

Esto obliga a los operadores a disponer <strong>de</strong> mecanismos para realizar un seguimiento <strong>de</strong> sus<br />

usuarios y así proporcionarles los servicios contratados lo más rápido posible y con menor coste<br />

<strong>de</strong> señalización.<br />

La i<strong>de</strong>a fundamental resi<strong>de</strong> en que si a bordo <strong>de</strong> un vehículo hay un teléfono encendido, dicho<br />

vehículo pue<strong>de</strong> ser consi<strong>de</strong>rado como un “sonda”. Según el informe presentado en Enero <strong>de</strong><br />

2009 por la CMT el número <strong>de</strong> abonados <strong>de</strong> telefonía móvil en España supera ya el 100 % <strong>de</strong> la<br />

población total. En la Unión Europea, la media se sitúa en torno al 90% (CDB, 2006), siendo<br />

esta ten<strong>de</strong>ncia similar en la mayoría <strong>de</strong> países <strong>de</strong>l mundo <strong>de</strong>sarrollado. Dicho crecimiento se<br />

refleja en nuestros hábitos ya que el teléfono móvil se convierte en un elemento indispensable<br />

en nuestra vida diaria. Este hecho hace pensar que los terminales móviles pue<strong>de</strong>n convertirse en<br />

posibles “sondas” <strong>de</strong> nuestra movilidad puesto que nos acompañan a lo largo <strong>de</strong> todo el día.<br />

No resulta extraño que cada vehículo lleve a bordo un teléfono móvil, propiedad <strong>de</strong> su<br />

conductor o <strong>de</strong>l resto <strong>de</strong> sus ocupantes. La propia gestión <strong>de</strong> movilidad que poseen las re<strong>de</strong>s <strong>de</strong><br />

telefonía celular ofrece una estimación <strong>de</strong> la posición <strong>de</strong> sus abonados, referida a la zona que les<br />

proporciona cobertura. De modo que la posición <strong>de</strong> un vehículo pue<strong>de</strong> ser monitorizada<br />

mediante el análisis <strong>de</strong> los registros <strong>de</strong> posición que el teléfono que lleva a bordo envía al<br />

sistema. El tratamiento <strong>de</strong> estos datos, sin la necesidad <strong>de</strong> revelar información confi<strong>de</strong>ncial <strong>de</strong><br />

sus abonados, permitirá <strong>de</strong>terminar ciertos datos relativos al <strong>de</strong>splazamiento <strong>de</strong> vehículos<br />

mediante los teléfonos que se lleven a bordo.<br />

El objetivo final es presentar las nuevas tecnologías como una alternativa viable para su uso en<br />

los estudios <strong>de</strong> movilidad <strong>de</strong> transporte, para lo cual será necesario <strong>de</strong>sarrollar:


6 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

a. Una metodología para la inferencia <strong>de</strong> volúmenes (aforos) en <strong>de</strong>terminadas zonas <strong>de</strong> la<br />

red utilizando información <strong>de</strong> terminales móviles anónimos a bordo <strong>de</strong> vehículos.<br />

Para la captación <strong>de</strong> aforos en <strong>de</strong>terminados puntos <strong>de</strong> la red, los datos <strong>de</strong> móviles<br />

proporcionarían flujos mediante la <strong>de</strong>terminación <strong>de</strong>l número <strong>de</strong> móviles que atraviesan<br />

los arcos que se <strong>de</strong>sean monitorizar y serían transformados, usando métodos estadísticos<br />

<strong>de</strong> estimación oportunos, a su equivalente en número <strong>de</strong> vehículos.<br />

b. Un algoritmo <strong>de</strong> estimación y ajuste para la actualización <strong>de</strong> una matriz <strong>de</strong> movilidad<br />

mediante esos volúmenes inferidos <strong>de</strong> teléfonos móviles.<br />

Conocida una matriz <strong>de</strong> movilidad ya obsoleta, <strong>de</strong>nominada matriz previa, ésta se<br />

ajustaría utilizando técnicas <strong>de</strong> estimación, mediante volúmenes observados en un<br />

conjunto <strong>de</strong> arcos, adaptadas a los requerimientos que exige utilizar información<br />

<strong>de</strong>rivada <strong>de</strong> teléfonos móviles. Con este nuevo algoritmo, en lugar <strong>de</strong> utilizar los<br />

tradicionales aforos, se utilizarían los volúmenes <strong>de</strong>rivados <strong>de</strong> los teléfonos móviles que<br />

pasan <strong>de</strong> una celda a otra, transformados en su equivalente en vehículos. Como ya se<br />

explica en capítulos posteriores, típicamente una frontera entre celdas compren<strong>de</strong> varios<br />

arcos, <strong>de</strong> modo que el paso <strong>de</strong> terminales proporciona volúmenes agregados <strong>de</strong>l grupo<br />

<strong>de</strong> arcos que cruzan la frontera. No obstante, la información <strong>de</strong> los aforos <strong>de</strong>rivados <strong>de</strong><br />

teléfonos móviles podría ser complementada con la <strong>de</strong> aforos tradicionales (espiras,<br />

cámaras <strong>de</strong> ví<strong>de</strong>o, etc.), dado que éstos son un caso especial en la que la frontera es<br />

cruzada por un único arco, dotando al algoritmo <strong>de</strong> mayor versatilidad.<br />

Una vez que las matrices <strong>de</strong> movilidad O–D se han inferido mediante el algoritmo<br />

citado en el punto prece<strong>de</strong>nte, éstas se asignarían al mo<strong>de</strong>lo <strong>de</strong> red existente <strong>de</strong> la región<br />

bajo estudio. Los resultados proporcionados mediante este proceso <strong>de</strong> asignación serían<br />

los flujos <strong>de</strong> tráfico en cada uno <strong>de</strong> los arcos <strong>de</strong> la red.<br />

1.4 ANTECEDENTES<br />

La i<strong>de</strong>a <strong>de</strong> la utilización <strong>de</strong> móviles para monitorizar las condiciones <strong>de</strong>l tráfico rodado no es<br />

nueva. La aparición <strong>de</strong> legislaciones en diferentes países que exigieron precisión en la<br />

localización <strong>de</strong> llamadas <strong>de</strong> emergencias (E–112, Europa 2002/22/EC) propició una exhaustiva<br />

investigación sobre nuevas técnicas que mejoraran los datos <strong>de</strong> posición proporcionados por los<br />

operadores. Como consecuencia <strong>de</strong> estos trabajos, surgieron nuevas aplicaciones relacionadas<br />

con la información <strong>de</strong> posición (LBS), muchas <strong>de</strong> ellas enfocadas al sector <strong>de</strong>l Transporte. Esta


Capítulo 1: INTRODUCCIÓN 7<br />

temática está siendo estudiada en numerosos centros <strong>de</strong> investigación, universida<strong>de</strong>s y<br />

<strong>de</strong>partamentos relacionados con el transporte <strong>de</strong> todo el mundo. Cabe <strong>de</strong>stacar la labor <strong>de</strong>l<br />

Department of Civil Engineering (Univ. <strong>de</strong> Waterloo), con las publicaciones <strong>de</strong> varios trabajos<br />

<strong>de</strong> investigación (Hellinga et al., 2005), y la <strong>de</strong>l Institute of Transportation Studies (Univ. <strong>de</strong><br />

California, Berkeley), por las múltiples aportaciones relacionadas con la materia, como una<br />

revisión <strong>de</strong>l “Estado–<strong>de</strong>l–Arte” (Yim, 2003). No obstante, el creciente interés en este campo ha<br />

hecho surgir en los últimos años numerosos proyectos piloto por parte <strong>de</strong> diferentes entida<strong>de</strong>s.<br />

Una revisión <strong>de</strong>tallada sobre proyectos piloto y otros estudios relacionados con la materia<br />

aparece en trabajos como Caceres et al. (2008) o en un informe presentado por el VDOT, en<br />

referencia al proyecto NCHRP 70–01, (Smith y Fontaine, 2006). En un apéndice <strong>de</strong> este último<br />

informe se revisan diferentes proyectos (finalizados y en curso) que emplean sistemas <strong>de</strong><br />

monitorización <strong>de</strong> tráfico basados en WLT (Wireless Location Technology). Haciendo uso <strong>de</strong><br />

información publicada hasta entonces, se elaboró un documento que recopila datos como<br />

entida<strong>de</strong>s participantes, objetivos, tecnología usada, etc., <strong>de</strong> cada uno <strong>de</strong> esos proyectos, junto<br />

con resultados obtenidos caso <strong>de</strong> haber finalizado.<br />

Sobre este tema se han presentado en los últimos años innumerables publicaciones en revistas y<br />

libros. En 2000, se presentó un mo<strong>de</strong>lo <strong>de</strong> estimación <strong>de</strong> tráfico mediante un algoritmo que<br />

estimaba parámetros <strong>de</strong> tráfico a partir <strong>de</strong> datos <strong>de</strong> posición <strong>de</strong> teléfonos (Bolla et al., 2000). En<br />

2001, se elaboraron diferentes estudios sobre datos anónimos <strong>de</strong> posición <strong>de</strong> teléfonos móviles<br />

orientados a aplicaciones <strong>de</strong> transporte, como velocida<strong>de</strong>s o tiempos <strong>de</strong> viaje (Lovell, 2001,<br />

Smith et al., 2001). También se <strong>de</strong>ben <strong>de</strong>stacar estudios sobre estimación <strong>de</strong> matrices origen–<br />

<strong>de</strong>stino mediante registros <strong>de</strong> teléfonos móviles (Pan et al., 2006) o utilizando simulaciones <strong>de</strong><br />

datos <strong>de</strong> telefonía móvil (Caceres et al., 2007, Sohn, 2004, Akin y Sisiopiku, 2002), así como<br />

otros estudios orientados a la efectividad <strong>de</strong> la técnica, como el <strong>de</strong> Cayford y Johnson (2003),<br />

que examinaron los principales parámetros a consi<strong>de</strong>rar: precisión, frecuencia <strong>de</strong> las mediciones<br />

y número <strong>de</strong> localizaciones necesarias para la correcta <strong>de</strong>scripción <strong>de</strong>l tráfico.<br />

De todos ellos, la precisión es el parámetro que posee mayor relevancia para alcanzar los<br />

resultados <strong>de</strong>seados. El nivel <strong>de</strong> precisión más fino proporcionado por la red GSM sin realizar<br />

ninguna modificación en ella ni en los terminales es a nivel <strong>de</strong> celda, es <strong>de</strong>cir, con el área <strong>de</strong><br />

cobertura <strong>de</strong> la estación base a la que está conectado el terminal móvil. Esta precisión <strong>de</strong>pen<strong>de</strong><br />

<strong>de</strong>l radio <strong>de</strong> la celda, pudiendo ser <strong>de</strong> 200 m en ciuda<strong>de</strong>s y oscilando entre 5 y 20 km en<br />

entornos rurales. No obstante, existen otros mo<strong>de</strong>los que poseen mayor precisión pero requieren<br />

la modificación <strong>de</strong> la red (instalando elementos adicionales para realizar mediciones <strong>de</strong> señal:<br />

ángulo <strong>de</strong> llegada, nivel <strong>de</strong> señal, etc.) o implican la modificación <strong>de</strong> los terminales (GPS,<br />

relojes para medir tiempos <strong>de</strong> llegada, etc.). Dado el gasto asociado a estas modificaciones


8 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

adicionales así como que la información recopilada <strong>de</strong>be ser estadísticamente representativa, es<br />

<strong>de</strong>cir, que el tamaño <strong>de</strong> la muestra sea lo mayor posible (la mayoría <strong>de</strong> los abonados no<br />

disponen <strong>de</strong> terminales modificados), esta Tesis centra su atención en la localización<br />

proporcionada por una red GSM típica sin modificar. Este nivel, a pesar <strong>de</strong> que ofrece una<br />

precisión que no es la óptima, es suficiente para una apropiada estimación <strong>de</strong> ciertos parámetros<br />

<strong>de</strong> tráfico.<br />

En la actualidad, existen multitud <strong>de</strong> estudios piloto relacionados con esta nueva alternativa.<br />

Todos ellos han mostrado magníficos resultados para una posible implementación en la<br />

realidad. Sin embargo, pese a ser una fuente <strong>de</strong> datos fiable y real que permite monitorizar la<br />

movilidad <strong>de</strong> los habitantes <strong>de</strong> una zona, estos datos <strong>de</strong> localización agregados no se utilizan <strong>de</strong><br />

manera sistemática para <strong>de</strong>scribir la planificación <strong>de</strong> sistemas urbanos o interurbanos.<br />

Principalmente, esto se <strong>de</strong>be al acceso restringido a estos datos <strong>de</strong> localización disponibles por<br />

los operadores <strong>de</strong> telefonía. A<strong>de</strong>más, la carencia <strong>de</strong> una normativa <strong>de</strong>tallada para el manejo <strong>de</strong><br />

estos datos por parte <strong>de</strong> terceros junto con la creciente preocupación asociada a términos <strong>de</strong><br />

privacidad frenan el <strong>de</strong>sarrollo <strong>de</strong> esta alternativa. No obstante, numerosos estudios (Ahas y<br />

Ülar, 2005, Ratti et al., 2006, y Rose, 2006) realizados en los últimos años están <strong>de</strong>mostrando<br />

que la utilización <strong>de</strong> estos datos no vulnera los <strong>de</strong>rechos <strong>de</strong> los abonados y que, con la<br />

colaboración <strong>de</strong>l operador, se pue<strong>de</strong>n obtener nuevos productos que beneficien no sólo a los<br />

operadores sino a toda la sociedad. Incluso se muestra que poseen numerosas ventajas respecto<br />

a los métodos anteriores:<br />

▫ Gran tamaño <strong>de</strong> la muestra <strong>de</strong> datos, asociado con la tasa <strong>de</strong> penetración <strong>de</strong><br />

telefonía móvil.<br />

▫ Cualquier zona pue<strong>de</strong> ser monitorizada, dada la extensa cobertura <strong>de</strong> telefonía.<br />

▫ No se precisa <strong>de</strong> instalación adicional <strong>de</strong> elementos en el vehículo ni en la red para<br />

ser monitorizado.<br />

▫ Datos generados quasi en tiempo real.<br />

■ PROYECTOS RELACIONADOS CON DATOS DE TRÁFICO DERIVADOS DE<br />

TELEFONÍA CELULAR<br />

Existen múltiples proyectos en los que se estudia esta técnica. Algunos <strong>de</strong> ellos utilizan la<br />

propia localización usada por los operadores GSM cuando un teléfono está simplemente<br />

encendido, otros emplean ciertos datos asociados a situaciones concretas como llamadas o datos


Capítulo 1: INTRODUCCIÓN 9<br />

<strong>de</strong> facturación, incluso existen proyectos que <strong>de</strong>sarrollan un software propio para captura <strong>de</strong><br />

señalización <strong>de</strong> los teléfonos móviles. A continuación se enumeran una serie <strong>de</strong> proyectos<br />

relacionados con la materia. Todos focalizan su atención en el uso <strong>de</strong> los datos <strong>de</strong> localización<br />

asociados a teléfonos móviles para obtener información sobre <strong>de</strong>splazamientos <strong>de</strong> vehículos,<br />

respetando en todo momento la privacidad <strong>de</strong>l abonado móvil.<br />

Uno <strong>de</strong> los más recientes es el <strong>de</strong>sarrollado por el SENSEable City Laboratory <strong>de</strong>l MIT con<br />

estudios realizados en diferentes ciuda<strong>de</strong>s <strong>de</strong>l mundo como Graz (Austria), Milán o Roma<br />

(Italia). En el <strong>de</strong>sarrollado en Graz se consiguió mapear una ciudad en tiempo real, siguiendo a<br />

miles <strong>de</strong> personas que se <strong>de</strong>splazaban por la ciudad con sus teléfonos móviles encendidos (Ratti<br />

et al., 2005). Esto fue posible gracias a la colaboración <strong>de</strong>l operador austriaco A1/Mobilkom<br />

que entregó datos anónimos <strong>de</strong> los teléfonos para permitir a los investigadores <strong>de</strong>l MIT<br />

<strong>de</strong>sarrollar el proyecto “Mobile Landscapes”. Con ello, se crearon mapas digitales <strong>de</strong>l uso <strong>de</strong> los<br />

terminales en el área metropolitana <strong>de</strong> Graz, visualizando la dinámica total <strong>de</strong> la ciudad en<br />

tiempo real. Los investigadores cruzaron tres tipos <strong>de</strong> datos cedidos por el operador: la <strong>de</strong>nsidad<br />

<strong>de</strong> las llamadas (medida en Erlang), los orígenes y <strong>de</strong>stinos <strong>de</strong> éstas (a través <strong>de</strong> “handovers”), y<br />

las posiciones <strong>de</strong> usuarios muestreados a intervalos regulares. La misma metodología se aplicó a<br />

la ciudad <strong>de</strong> Milán, obteniendo resultados similares (Ratti et al., 2006).<br />

Otro estudio <strong>de</strong>sarrollado por el SENSEable City Laboratory fue en la ciudad <strong>de</strong> Roma, aunque<br />

éste estuvo enfocado a cuestiones <strong>de</strong> dinámica social <strong>de</strong> una ciudad, tales como relaciones entre<br />

hábitos telefónicos y tipos <strong>de</strong> actividad asociadas al terreno (áreas resi<strong>de</strong>nciales, comerciales,<br />

zonas turísticas,…). El proyecto “Real Time Rome” utilizó diferentes tipos <strong>de</strong> datos proce<strong>de</strong>ntes<br />

<strong>de</strong> teléfonos móviles. Uno <strong>de</strong> ellos fue una medida <strong>de</strong> uso <strong>de</strong> ancho <strong>de</strong> banda <strong>de</strong> la red,<br />

recogidos a nivel <strong>de</strong> antena (Erlangs). Los otros se correspondían con datos <strong>de</strong> posición y<br />

trayectoria <strong>de</strong> usuarios llamantes obtenidos mediante la plataforma Lochness <strong>de</strong>l operador<br />

Telecom Italia. La investigación se centró principalmente en revelar la similitud entre zonas<br />

urbanas basándose en patrones <strong>de</strong>l uso <strong>de</strong> la red móvil. Agrupando áreas con actividad<br />

telefónica similar se clasificaba la ciudad en zonas, <strong>de</strong> modo que dichas zonas eran comparadas<br />

con otras <strong>de</strong>finidas según el tipo <strong>de</strong> actividad que se <strong>de</strong>sarrollaba en el área (comercial,<br />

resi<strong>de</strong>ncial, turística…). Para ello, se dividió la ciudad en píxeles y utilizó esos datos <strong>de</strong> uso <strong>de</strong><br />

la red para promediar valores <strong>de</strong> Erlang que caracterizaban cada píxel (Rea<strong>de</strong>s et al., 2007).<br />

Según los valores que tomaba dicha magnitud en cada píxel y aplicando el algoritmo <strong>de</strong><br />

agrupación K-Means, se obtenían clusters que representaban características espacio-temporales<br />

<strong>de</strong> la ciudad en función <strong>de</strong>l uso <strong>de</strong>l teléfono móvil, por ejemplo, se obtenían diferentes clusters a<br />

primera hora <strong>de</strong> la mañana <strong>de</strong>bido a <strong>de</strong>splazamientos asociados a la jornada laboral que a última<br />

hora <strong>de</strong> la tar<strong>de</strong> <strong>de</strong> un fin <strong>de</strong> semana, don<strong>de</strong> los cluster están asociados a activida<strong>de</strong>s <strong>de</strong> ocio. Por


10 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

tanto, el proyecto reveló patrones <strong>de</strong> movilidad diarios según los hábitos telefónicos <strong>de</strong> los<br />

habitantes <strong>de</strong> una ciudad.<br />

En Europa, se ha <strong>de</strong>sarrollado un sistema <strong>de</strong> información sobre tráfico <strong>de</strong>nominado MTS<br />

(Mobile Traffic Services). MTS utiliza la información <strong>de</strong> la red GSM sobre el <strong>de</strong>splazamiento<br />

<strong>de</strong> los teléfonos móviles (presentes en los vehículos) para monitorizar el tráfico y así ayudar a<br />

las autorida<strong>de</strong>s a gestionar el flujo <strong>de</strong> vehículos por vías y/o posibles congestiones. El piloto se<br />

ha realizado en la provincia <strong>de</strong> Noord–Brabant en Holanda, en colaboración con LogicaCMG,<br />

Vodafone y el gobierno local (MTS, 2003). El software base fue <strong>de</strong>sarrollado por Applied<br />

Generics, una empresa que proporciona soluciones avanzadas <strong>de</strong> localización <strong>de</strong> móviles e<br />

información <strong>de</strong> tráfico a los operadores, cuyo producto RoDIN24 monitoriza una red <strong>de</strong><br />

telefonía móvil para adquirir localizaciones anónimas en tiempo real <strong>de</strong> gran cantidad <strong>de</strong><br />

teléfonos, muchos <strong>de</strong> los cuales estarán <strong>de</strong>ntro <strong>de</strong> un vehículo.<br />

En la región <strong>de</strong> Flan<strong>de</strong>s, el operador <strong>de</strong> telefonía belga PROXIMUS y la sociedad británica ITIS<br />

Holdings han <strong>de</strong>sarrollado también un proyecto piloto que utiliza estas técnicas para el control<br />

<strong>de</strong> tráfico en carreteras a través <strong>de</strong> las posiciones <strong>de</strong> teléfonos móviles en los vehículos en<br />

movimiento. ITIS recibe <strong>de</strong>l operador PROXIMUS el número <strong>de</strong> móviles conectados a cada<br />

estación base, sin revelar información confi<strong>de</strong>ncial <strong>de</strong> sus abonados, con objetivo <strong>de</strong> po<strong>de</strong>r<br />

<strong>de</strong>terminar, entre otros datos, la velocidad <strong>de</strong> <strong>de</strong>splazamiento <strong>de</strong> cada teléfono celular entre una<br />

antena y la siguiente (ITIS Holdings, 2004).<br />

En 1999, TRL (Transport Research Laboratory) participó en un proyecto <strong>de</strong> actualización <strong>de</strong><br />

matrices origen–<strong>de</strong>stino con datos <strong>de</strong> telefonía móvil en el Reino Unido. La investigación<br />

encontró que era posible obtener información <strong>de</strong> matrices origen–<strong>de</strong>stino mediante la<br />

localización <strong>de</strong> teléfonos móviles, junto con otras medidas <strong>de</strong> información <strong>de</strong> tráfico tales como<br />

tiempos y velocida<strong>de</strong>s <strong>de</strong>l viaje. TRL <strong>de</strong>sarrolló un algoritmo para analizar los datos anónimos<br />

<strong>de</strong> teléfonos proce<strong>de</strong>ntes <strong>de</strong> facturación, proporcionados por el operador BTCellnet<br />

(actualmente O2) y convertirlos en información asociada a tráfico (White y Gower, 1999; White<br />

y Wells, 2002).<br />

Otro proyecto europeo que ha <strong>de</strong>sarrollado esta técnica es STRIP (System for Traffic<br />

Information and Positioning), el cual investigó y validó el uso <strong>de</strong> la posición <strong>de</strong> un teléfono<br />

móvil para la estimación <strong>de</strong> tiempos <strong>de</strong> viaje (Ygnace, 2001). El proyecto fue realizado bajo el<br />

programa SERTI (Southern European Road Thelematics Implementation), en colaboración con<br />

el gobierno francés y el operador <strong>de</strong> telefonía SFR (Cegetel Group). Para la obtención <strong>de</strong> datos<br />

<strong>de</strong> teléfonos se usó el método <strong>de</strong> localización conocido como “Abis Probing”, que monitoriza la


Capítulo 1: INTRODUCCIÓN 11<br />

información <strong>de</strong> señalización enviada por los interfaces radio Abis y A. STRIP se dividió en dos<br />

subsistemas base: uno <strong>de</strong> captura <strong>de</strong> datos que recogía mensajes <strong>de</strong> teléfonos móviles en tiempo<br />

real y calculaba su localización; y otro <strong>de</strong> procesamiento y presentación que calculaba tiempos<br />

<strong>de</strong> viaje en secciones <strong>de</strong> vía, indicando la dirección <strong>de</strong> movimiento y mostrando la posición <strong>de</strong><br />

las llamadas.<br />

En 2002, Finnra (Finnish Road Administration) y el operador <strong>de</strong> telefonía móvil Radiolinja<br />

<strong>de</strong>sarrollaron un sistema don<strong>de</strong> se capturaron los datos <strong>de</strong> un conjunto <strong>de</strong> teléfonos (encendidos)<br />

en un cierto tramo para proporcionar estimaciones <strong>de</strong> tiempos <strong>de</strong> viaje (Kummala, 2002,<br />

Virtanen, 2002). Teniendo en cuenta que cada terminal intercambia información periódicamente<br />

con las estaciones base más cercanas, el análisis <strong>de</strong>l tiempo que llevaban los teléfonos<br />

comunicándose con estaciones bases permitió estimar tiempos <strong>de</strong> viaje. A fin <strong>de</strong> validar la<br />

técnica, estas estimaciones se compararon con otras obtenidas mediante i<strong>de</strong>ntificación <strong>de</strong><br />

matrícula LPR (License Plate Recognition), mostrando esta nueva alternativa resultados más<br />

exactos cuando se analizaba el tráfico en tramos largos (aproximadamente <strong>de</strong> 10 km) don<strong>de</strong> la<br />

entrada, salida o parada <strong>de</strong> vehículos es poco frecuente. Junto con ello, se observó que el nuevo<br />

sistema no se veía afectado por condiciones atmosféricas adversas, como sí ocurría con los<br />

sistemas <strong>de</strong> LPR. Respecto a la privacidad <strong>de</strong> los datos, el cifrado <strong>de</strong> las i<strong>de</strong>ntida<strong>de</strong>s <strong>de</strong> los<br />

teléfonos impedía que fuera posible conocer qué teléfono realizaba cada viaje <strong>de</strong>tectado; no<br />

obstante, tampoco se almacenaba ninguno <strong>de</strong> los datos <strong>de</strong>spués <strong>de</strong> ser utilizados.<br />

En Alemania, Vodafone (<strong>de</strong>ntro <strong>de</strong>l programa ESGI 2004) propuso ofrecer ciertos servicios <strong>de</strong><br />

información <strong>de</strong> tráfico por carretera a sus clientes <strong>de</strong> telefonía móvil. Para ello, se planteó<br />

generar datos <strong>de</strong> flujo y velocidad <strong>de</strong> vehículos usando información <strong>de</strong> señalización que ya está<br />

disponible <strong>de</strong> las operaciones estándar <strong>de</strong> su red <strong>de</strong> telefonía móvil. En dicho proyecto se<br />

investigó la viabilidad <strong>de</strong>l uso <strong>de</strong>l handover para generar información <strong>de</strong> tráfico, analizando<br />

datos recogidos entre Julio y Septiembre <strong>de</strong>l 2003 (previamente procesados por Vodafone)<br />

sobre una autopista en Alemania. Un handover se produce cuando un teléfono con una llamada<br />

activa se mueve <strong>de</strong> una celda a otra y la llamada es transferida <strong>de</strong>s<strong>de</strong> la antena servidora a la que<br />

gestiona la nueva celda, sin interrumpirse la comunicación. Entonces, la captura <strong>de</strong> información<br />

anónima asociada a cada una <strong>de</strong> esas llamadas traspasadas (como celdas implicadas, instante y<br />

duración <strong>de</strong>l handover, junto con algún otro tipo <strong>de</strong> información <strong>de</strong> señalización) permitió que<br />

fuera posible calcular datos como velocidad o flujo a través <strong>de</strong> los handover efectuados entre<br />

celdas, asociando previamente carreteras a cada una <strong>de</strong> las celdas y realizando cálculos<br />

oportunos <strong>de</strong> ubicación <strong>de</strong> fronteras <strong>de</strong> dichas celdas (Smith Institute, 2006).


12 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Pero no sólo en Europa se están <strong>de</strong>sarrollando proyectos relacionados con esta técnica, la<br />

empresa israelita Decell Ltd. tiene <strong>de</strong>sarrollado un producto <strong>de</strong>nominado AutoRoute–1, el cual<br />

lleva a cabo un muestreo periódico y aleatorio <strong>de</strong> teléfonos móviles que viajan a bordo <strong>de</strong><br />

vehículos en movimiento en una <strong>de</strong>terminada zona. Según estas muestras <strong>de</strong> móviles registrados<br />

en una red sobre un lugar concreto, se estiman ciertos parámetros <strong>de</strong> tráfico (como velocidad,<br />

<strong>de</strong>nsidad o flujos) para cada tramo <strong>de</strong> la carretera (Decell–Autoroute, 2006). Este sistema<br />

convierte datos que constantemente son generados <strong>de</strong>ntro <strong>de</strong> una red móvil en información<br />

precisa y en tiempo real <strong>de</strong> tráfico por una carretera. A<strong>de</strong>más provee a los conductores <strong>de</strong> rutas<br />

recomendadas que correspon<strong>de</strong>n al tiempo <strong>de</strong> recorrido previsto para alcanzar un <strong>de</strong>stino<br />

concreto según la ubicación estimada. Los conductores pue<strong>de</strong>n también recibir alarmas<br />

instantáneas sobre inci<strong>de</strong>ncias relevantes <strong>de</strong> tráfico tales como acci<strong>de</strong>ntes, obras, etc.<br />

AutoRoute–1 genera información en tiempo real <strong>de</strong> tráfico mientras se respeta la privacidad y<br />

anonimato <strong>de</strong> sus abonados móviles. Ello se asegura teniendo en cuenta que toda la información<br />

<strong>de</strong> localización es almacenada y procesada <strong>de</strong>ntro <strong>de</strong>l servidor AutoRoute–1, el cual físicamente<br />

se establece <strong>de</strong>ntro <strong>de</strong>l entorno <strong>de</strong>l operador. De forma que, al igual que pasa con información<br />

<strong>de</strong> facturación, estos datos no pue<strong>de</strong>n emitirse al exterior y son inaccesibles a cualquier persona<br />

fuera <strong>de</strong> la organización <strong>de</strong>l operador.<br />

En EE.UU. existen diferentes proyectos relacionados con esta técnica. La mayoría <strong>de</strong> ellos están<br />

<strong>de</strong>sarrollados por los Departamentos <strong>de</strong> Transporte <strong>de</strong> diferentes estados junto con la<br />

colaboración <strong>de</strong> empresas y operadores <strong>de</strong> telefonía. Uno <strong>de</strong> ellos es el que <strong>de</strong>sarrolló VDOT<br />

(Virginia Department of Transportation) junto con AirSage para <strong>de</strong>mostrar la viabilidad <strong>de</strong>l<br />

empleo <strong>de</strong> datos <strong>de</strong> teléfonos para la vigilancia <strong>de</strong>l tráfico (VDOT, 2005). Para ello, AirSage<br />

elaboró un software que recopilaba información <strong>de</strong> señalización asociada a localización enviada<br />

automáticamente por teléfonos que están simplemente encendidos o en llamada para controlar<br />

su movimiento (Airsage, 2007). Esa información permitía conocer la posición <strong>de</strong> teléfonos<br />

anónimos en ciertos instantes la cual, una vez procesada y representada sobre un mapa,<br />

mostraba la velocidad con la que fluctuaba el tráfico en cualquier carretera dada por la que<br />

existieran vehículos con teléfonos a bordo.<br />

Otro proyecto americano fue el <strong>de</strong>sarrollado en Maryland por Delcan Corp. junto con ITIS<br />

Holdings el cual construía un mapa en tiempo real <strong>de</strong>l tráfico a lo largo <strong>de</strong> sus principales<br />

carreteras usando los movimientos <strong>de</strong> teléfonos (Delcan, 2005). Este proyecto tenía como<br />

objetivo principal el conocer el estado <strong>de</strong>l tráfico en ciertas vías para enfocarlo a la <strong>de</strong>tección <strong>de</strong><br />

eventos, tales como congestión o acci<strong>de</strong>ntes, sin necesidad <strong>de</strong> usar sensores, cámaras u otros<br />

elementos que requieren <strong>de</strong> instalación adicional <strong>de</strong> nuevos equipos sobre el terreno. En lugar


Capítulo 1: INTRODUCCIÓN 13<br />

<strong>de</strong> estos elementos se utilizaron los teléfonos móviles, propiedad <strong>de</strong> los conductores, como<br />

sondas anónimas. De esta manera se logra obtener información sobre cualquier punto <strong>de</strong> la red<br />

viaria en el que existan teléfonos, ya que los operadores conocen aproximaciones <strong>de</strong> las<br />

localizaciones <strong>de</strong> sus abonados en términos <strong>de</strong> antena (celda) a la que <strong>de</strong>ben encaminar las<br />

llamadas. La información tomada <strong>de</strong> los móviles se trató anónimamente, evitando la posibilidad<br />

<strong>de</strong> rastreo <strong>de</strong> personas concretas en su movimiento hacia un <strong>de</strong>stino. Dicha información<br />

pertenecía tanto a señales radio que los teléfonos envían a las estaciones base como a señales<br />

<strong>de</strong>rivadas <strong>de</strong>l proceso <strong>de</strong> movimiento <strong>de</strong> teléfonos con llamada activa <strong>de</strong> una estación base<br />

(antena) a otra, <strong>de</strong>nominado handover. Entonces, conociendo esa información junto con los<br />

mapas <strong>de</strong> carreteras se podía conocer la ubicación aproximada <strong>de</strong> los teléfonos y cómo <strong>de</strong><br />

rápido se estaban moviendo.<br />

Estos son algunos <strong>de</strong> los proyectos <strong>de</strong>sarrollados en los últimos años. Todos ellos centran su<br />

atención en un objetivo común, el uso <strong>de</strong> los datos <strong>de</strong> localización <strong>de</strong> teléfonos móviles, los<br />

cuales son ya conocidos por los operadores, para obtener información sobre <strong>de</strong>splazamientos <strong>de</strong><br />

vehículos. La mayoría <strong>de</strong> ellos se han <strong>de</strong>sarrollado con la colaboración <strong>de</strong> operadores móviles<br />

sin necesidad <strong>de</strong> vulnerar los <strong>de</strong>rechos <strong>de</strong> intimidad <strong>de</strong> sus abonados. No obstante, la principal<br />

barrera a superar para la implantación completa <strong>de</strong> esta alternativa consistirá en el<br />

establecimiento <strong>de</strong> acuerdos con los operadores para la utilización <strong>de</strong> los sistemas <strong>de</strong> telefonía<br />

móvil en aplicaciones <strong>de</strong> valor añadido como son la gestión <strong>de</strong>l tráfico y su planificación. Estos<br />

acuerdos pue<strong>de</strong>n verse favorecidos cuando los operadores <strong>de</strong>scubran el rendimiento económico<br />

real <strong>de</strong>l uso <strong>de</strong> sus sistemas para este tipo <strong>de</strong> servicios enfocados al tráfico, sin afectar a su<br />

funcionamiento.<br />

1.5 ESTRUCTURA DE LA <strong>TESIS</strong><br />

El documento final <strong>de</strong> esta Tesis Doctoral se ha dividido en 6 capítulos.<br />

En el Capítulo 1 se ha expuesto la temática en la cual se enmarca la Tesis, realizándose una<br />

introducción al problema <strong>de</strong> estimación <strong>de</strong> matrices <strong>de</strong> viajes origen–<strong>de</strong>stino en re<strong>de</strong>s <strong>de</strong> tráfico<br />

actuales y procediéndose a revisar los antece<strong>de</strong>ntes sobre el uso <strong>de</strong> la telefonía móvil en la<br />

monitorización <strong>de</strong>l tráfico.<br />

En el Capítulo 2 se <strong>de</strong>scribe el funcionamiento <strong>de</strong> las re<strong>de</strong>s <strong>de</strong> telefonía móvil, revisándose con<br />

especial <strong>de</strong>tenimiento el tratamiento seguido para gestionar la movilidad <strong>de</strong> sus abonados a fin<br />

<strong>de</strong> compren<strong>de</strong>r la utilidad <strong>de</strong> la telefonía móvil en los estudios <strong>de</strong> transporte.


14 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

En el Capítulo 3 se revisa el Estado–<strong>de</strong>l–Arte, procediéndose a presentar los conocimientos<br />

actuales sobre la estimación <strong>de</strong> parámetros <strong>de</strong> tráfico mediante el uso <strong>de</strong> información proce<strong>de</strong>nte<br />

<strong>de</strong> los sistemas <strong>de</strong> telefonía móvil.<br />

El Capítulo 4 está <strong>de</strong>dicado a <strong>de</strong>sarrollar una metodología para la inferencia <strong>de</strong> volúmenes <strong>de</strong><br />

tráfico <strong>de</strong> vehículos mediante el flujo <strong>de</strong> teléfonos móviles que atraviesan una <strong>de</strong>terminada<br />

zona. En el capítulo se lleva a cabo una revisión <strong>de</strong> los procedimientos actuales <strong>de</strong> obtención <strong>de</strong><br />

volúmenes en arcos, enfocando el problema al caso <strong>de</strong>l nivel <strong>de</strong> precisión disponible <strong>de</strong> los<br />

sistemas <strong>de</strong> telefonía móvil. Para el <strong>de</strong>sarrollo <strong>de</strong> la metodología, se propone el uso <strong>de</strong> mo<strong>de</strong>los<br />

matemáticos que permita expresar en forma cuantitativa relaciones <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong> vehículos<br />

y teléfonos móviles <strong>de</strong> modo que puedan ser usados con fines predictivos. En particular, se<br />

preten<strong>de</strong> que los mo<strong>de</strong>los planteados proporcionen medidas admisibles <strong>de</strong> volúmenes <strong>de</strong><br />

vehículos sin necesidad <strong>de</strong> instalar una estación <strong>de</strong> aforo sobre la zona. El capítulo se completa<br />

con un ensayo numérico sobre diferentes fronteras entre celdas en el que se evalúa el<br />

rendimiento <strong>de</strong> los mo<strong>de</strong>los propuestos mediante un análisis comparativo entre ellos,<br />

contrastando los volúmenes estimados con medidas proporcionadas por estaciones <strong>de</strong> aforo<br />

ubicadas en puntos próximos a dichas fronteras, y seleccionando aquellos mo<strong>de</strong>los que mejor<br />

balance alcancen entre todos los criterios evaluados.<br />

Para completar el estudio propuesto para esta Tesis, en el Capítulo 5 se aborda el problema <strong>de</strong><br />

estimación <strong>de</strong> matrices Origen-Destino mediante un algoritmo cuya principal novedad es el uso<br />

<strong>de</strong> datos <strong>de</strong> volúmenes agregados sobre grupos <strong>de</strong> arcos como sería la información inferida<br />

mediante la telefonía móvil. En este capítulo se propone una metodología <strong>de</strong> ajuste <strong>de</strong> una<br />

matriz previa mediante un mo<strong>de</strong>lo <strong>de</strong> estructura binivel empleando la adaptación a nivel <strong>de</strong><br />

grupos <strong>de</strong> arcos <strong>de</strong> un algoritmo robusto y eficiente que trabaja a nivel clásico <strong>de</strong> volumen <strong>de</strong><br />

arco. La elección <strong>de</strong> dicho algoritmo como fundamento resi<strong>de</strong> en la importancia <strong>de</strong> dos criterios<br />

tomados a la hora <strong>de</strong> empren<strong>de</strong>r la resolución <strong>de</strong>l problema: i) que la matriz resultante<br />

reproduzca, al ser asignada a la red, los datos <strong>de</strong> volúmenes agregados lo más fielmente posible<br />

y ii) que la información contenida en la matriz O–D previa no se vea distorsionada en exceso<br />

durante el ajuste, puesto que una distorsión excesiva <strong>de</strong> dicha información invalida cualquier<br />

esfuerzo presupuestario y humano <strong>de</strong>dicado a tareas <strong>de</strong> encuestación. Para analizar la<br />

consistencia y eficiencia <strong>de</strong>l algoritmo <strong>de</strong>sarrollado se completa el capítulo con un estudio<br />

numérico sobre dos re<strong>de</strong>s: una <strong>de</strong> pequeña escala pero muy conocida en los estudios <strong>de</strong><br />

transporte, la red <strong>de</strong> Sioux Falls. Y otra que se correspon<strong>de</strong>ría con la red <strong>de</strong> la Comunidad <strong>de</strong><br />

Madrid, para la cual también se dispone <strong>de</strong> datos <strong>de</strong> aforos tradicionales (a nivel <strong>de</strong> arco), <strong>de</strong>


Capítulo 1: INTRODUCCIÓN 15<br />

modo que es posible realizar una comparación <strong>de</strong>l algoritmo propuesto frente a otros que<br />

utilizan aforos a nivel <strong>de</strong> arco.<br />

Finalmente, en el Capítulo 6 se agrupan las conclusiones y se sugieren posibles líneas para<br />

futuras investigaciones.


16 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL


CAPÍTULO 2<br />

REDES DE TELEFONÍA CELULAR: GSM<br />

2.1 INTRODUCCIÓN<br />

Las re<strong>de</strong>s telefónicas móviles surgieron como un nuevo servicio que facilitaba la comunicación<br />

entre usuarios sin requerir una conexión permanente (fija) con la red, <strong>de</strong> forma que el usuario<br />

conseguía una más amplia libertad <strong>de</strong> movimiento, pudiendo acce<strong>de</strong>r, vía radio, a centrales <strong>de</strong><br />

conmutación a través <strong>de</strong> estaciones base radioeléctricas distribuidas por la zona <strong>de</strong> servicio.<br />

Como consecuencia, un usuario que va a realizar una llamada acce<strong>de</strong> a la red a través <strong>de</strong> la<br />

estación que gestione la zona <strong>de</strong> cobertura en la que se encuentre. Por otro lado, cuando se<br />

recibe una llamada, la red <strong>de</strong>be conocer, en todo momento, dón<strong>de</strong> está el usuario <strong>de</strong>stinatario <strong>de</strong><br />

la llamada para que ésta pueda ser encaminada correctamente. Por ello <strong>de</strong>be realizar un<br />

seguimiento <strong>de</strong> forma automática que permita encontrar la estación base (celda) que da servicio<br />

a cada teléfono con el menor retraso posible. Bajo este razonamiento, un teléfono móvil que esté<br />

encendido, in<strong>de</strong>pendientemente <strong>de</strong> que esté haciendo uso <strong>de</strong> la red (llamada, sms, etc.),<br />

puntualmente informa a la red <strong>de</strong> su posición actual en términos <strong>de</strong> la zona <strong>de</strong> cobertura en la<br />

que se encuentra. Este hecho permite que un sistema <strong>de</strong> telefonía móvil tenga continuamente<br />

localizados a sus abonados para proporcionar los servicios contratados lo más rápido posible y<br />

con el menor coste <strong>de</strong> señalización.<br />

A esta propiedad <strong>de</strong> la red se le llama localización, la cual <strong>de</strong>be ser dinámica, ya que, por<br />

<strong>de</strong>finición, el usuario pue<strong>de</strong> moverse por la red, y <strong>de</strong>be actualizarse en función <strong>de</strong>l<br />

<strong>de</strong>splazamiento y <strong>de</strong>l tiempo. Asimismo, como consecuencia <strong>de</strong> esa movilidad, un usuario<br />

pue<strong>de</strong> cambiar <strong>de</strong> zona <strong>de</strong> cobertura <strong>de</strong> las estaciones base <strong>de</strong> la red. En esos casos, <strong>de</strong>be<br />

asegurarse la continuidad <strong>de</strong> las llamadas en curso <strong>de</strong> forma automática, para lo cual existe la<br />

operación <strong>de</strong> traspaso <strong>de</strong> llamadas o handover.<br />

El dinamismo característico <strong>de</strong> la vida mo<strong>de</strong>rna está modificando el estilo <strong>de</strong> vida tanto a nivel<br />

individual como colectivo <strong>de</strong> la sociedad actual. Como consecuencia, surge la necesidad <strong>de</strong>


18 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

soluciones cada vez más avanzadas que permitan la comunicación entre personas mientras éstas<br />

se están <strong>de</strong>splazando por la red. Este hecho fomenta que los sistemas <strong>de</strong> telefonía móvil estén<br />

experimentando un rápido crecimiento, especialmente impulsado por la característica <strong>de</strong><br />

permitir establecer cualquier tipo <strong>de</strong> comunicación con la red (llamadas, sms, acceso a<br />

Internet…), in<strong>de</strong>pendientemente <strong>de</strong> la posición y movimiento <strong>de</strong>l terminal. Para garantizar esta<br />

movilidad <strong>de</strong> los abonados manteniendo la calidad <strong>de</strong> los servicios, una red <strong>de</strong> telefonía dispone<br />

<strong>de</strong> un sistema completo con funciones <strong>de</strong> acceso, transmisión, conmutación y señalización, que<br />

proporcionan servicios <strong>de</strong> telecomunicación a usuarios a través <strong>de</strong> acceso vía radio.<br />

En los siguientes apartados se presentan conceptos básicos relacionados con los sistemas <strong>de</strong><br />

telefonía móvil, revisando su arquitectura <strong>de</strong> red y sus principales elementos. A<strong>de</strong>más se<br />

introducen nociones básicas respecto a la planificación y dimensionado <strong>de</strong> la red, <strong>de</strong>scribiendo<br />

las principales funcionalida<strong>de</strong>s asociadas a la gestión <strong>de</strong> movilidad a fin <strong>de</strong> compren<strong>de</strong>r mejor<br />

cómo pue<strong>de</strong> ayudar la telefonía móvil en la inferencia <strong>de</strong> parámetros asociados al tráfico. Para<br />

su elaboración se ha utilizado la siguiente bibliografía: Gibson (1999), Hernando Rábanos<br />

(2002), Huidobro (2002), Sallent et al. (2003), Rappaport (2002) y Ilyas y Mahgoub (2005).<br />

2.2 ARQUITECTURA DE LA RED GSM<br />

En lo que se refiere a la estructura básica <strong>de</strong>l sistema GSM, éste se organiza como una red <strong>de</strong><br />

estaciones base radioeléctricas que proporcionan cobertura completa al área <strong>de</strong> servicio. Cada<br />

estación base (BTS) tiene asociada una zona <strong>de</strong> cobertura, <strong>de</strong>nominada celda, que opera en un<br />

conjunto <strong>de</strong> canales <strong>de</strong> radio diferentes a los usados en las celdas adyacentes y que se<br />

encuentran distribuidas según un plan celular. Un grupo <strong>de</strong> BTSs se encuentra conectado a un<br />

controlador (BSC), encargado <strong>de</strong> aspectos como el handover (traspaso <strong>de</strong> llamada <strong>de</strong> una<br />

estación base a otra) o el control <strong>de</strong> potencia <strong>de</strong> las BTSs y <strong>de</strong> los móviles. En consecuencia, el<br />

BSC se encarga <strong>de</strong>l manejo <strong>de</strong> toda la red <strong>de</strong> radio y supone una auténtica novedad respecto a<br />

los anteriores sistemas celulares.<br />

Una o varias BSCs se conectan a una central <strong>de</strong> conmutación <strong>de</strong> móviles (MSC). Éste es el<br />

corazón <strong>de</strong>l GSM como responsable <strong>de</strong> la inicialización, enrutamiento, control y finalización <strong>de</strong><br />

las llamadas, así como <strong>de</strong> la información sobre la tarificación. Es también el interfaz entre<br />

diversas re<strong>de</strong>s GSM o entre una <strong>de</strong> ellas y las re<strong>de</strong>s públicas <strong>de</strong> telefonía o datos. La<br />

información referente a los abonados se encuentra almacenada en dos bases <strong>de</strong> datos que se<br />

conocen como registro <strong>de</strong> posiciones base (HLR) y registro <strong>de</strong> posiciones <strong>de</strong> visitantes (VLR).


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 19<br />

Los diferentes elementos que constituyen una red <strong>de</strong> telefonía celular GSM se clasifican en<br />

cuatro grupos fundamentales:<br />

1. MS (Mobile Station).<br />

– ME (Mobile Equipment).<br />

– SIM (Subscriber I<strong>de</strong>ntity Module).<br />

2. BSS (Base Station Sub–System).<br />

– BSC (Base Station Controller).<br />

– BTS (Base Transceiver Station).<br />

3. NSS (Network and Switching Subsystem).<br />

– MSC (Mobile Switching Center).<br />

– GMSC (Gateway Mobile Switching Center).<br />

– VLR (Visitor Location Register).<br />

– HLR (Home Location Register).<br />

– AuC (Authentication Center).<br />

– EIR (Equipment I<strong>de</strong>ntity Register).<br />

4. NMC (Network Management Center).<br />

– OMC (Operation and Maintenance Center).<br />

Figura 2-1: Arquitectura <strong>de</strong> la red GSM.


20 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

A continuación se <strong>de</strong>scribe cada elemento en base a la clasificación anterior.<br />

1.– Estación Móvil (Mobile Station, MS). Consta <strong>de</strong> dos elementos básicos: el equipo móvil<br />

(ME) y la tarjeta SIM (Subscriber I<strong>de</strong>ntity Module).<br />

� Mobile Equipment (ME)<br />

Es el dispositivo móvil y se i<strong>de</strong>ntifica <strong>de</strong>ntro <strong>de</strong> cualquier red GSM por el International Mobile<br />

Equipment I<strong>de</strong>ntity (IMEI). El IMEI es un número <strong>de</strong> 15 cifras y tiene la siguiente estructura:<br />

IMEI = TAC / FAC / SNR / sp don<strong>de</strong>:<br />

TAC = Type Approval Co<strong>de</strong> (6 CIFRAS).<br />

FAC = Final Assembly Co<strong>de</strong>, i<strong>de</strong>ntifica al fabricante (2 cifras).<br />

SNR = Serial Number (6 cifras).<br />

sp = Cifra suplementaria <strong>de</strong> reserva (1 cifra).<br />

Los equipos tienen la peculiaridad <strong>de</strong> variar la potencia <strong>de</strong> emisión <strong>de</strong> señal sobre la celda en la<br />

que se encuentren con el objetivo <strong>de</strong> po<strong>de</strong>r mantener en todo momento el nivel <strong>de</strong> potencia <strong>de</strong><br />

transmisión óptimo, limitando interferencias co–canal inducidas sobre celdas adyacentes y<br />

reduciendo el consumo. Esta potencia <strong>de</strong> emisión es característica <strong>de</strong>l móvil, <strong>de</strong> manera que su<br />

nivel <strong>de</strong> potencia máximo es importante dado que implica un aumento <strong>de</strong> la capacidad <strong>de</strong>l<br />

terminal para po<strong>de</strong>r alejarse <strong>de</strong> la estación base y po<strong>de</strong>r seguir disfrutando <strong>de</strong>l servicio.<br />

� Subscriber I<strong>de</strong>ntity Module (SIM)<br />

La SIM es una pequeña tarjeta inteligente dotada <strong>de</strong> memoria y microprocesador que sirve para<br />

i<strong>de</strong>ntificar al abonado. Esta tarjeta se inserta en el interior <strong>de</strong>l móvil y permite al usuario acce<strong>de</strong>r<br />

a todos los servicios disponibles por parte <strong>de</strong> su operador. Sin la tarjeta SIM, el terminal no<br />

tiene utilidad porque no pue<strong>de</strong> hacer uso <strong>de</strong> la red. Puesto que la tarjeta SIM permite i<strong>de</strong>ntificar<br />

al abonado in<strong>de</strong>pendientemente <strong>de</strong>l terminal usado, se proporciona al usuario la posibilidad <strong>de</strong><br />

continuar recibiendo y efectuando llamadas y utilizar todos los servicios que tiene contratados<br />

insertando la tarjeta SIM en otro terminal.<br />

La SIM está protegida por un número <strong>de</strong> cuatro dígitos que recibe el nombre <strong>de</strong> PIN (Personal<br />

I<strong>de</strong>ntification Number). Una vez que se introduce el PIN en el terminal, éste activa el proceso <strong>de</strong><br />

búsqueda <strong>de</strong> las re<strong>de</strong>s GSM que estén disponibles para intentar validarse en ellas. Una vez que<br />

la red valida el terminal, el teléfono queda registrado en la celda que lo ha validado. Es<br />

importante <strong>de</strong>stacar que la red que valida el terminal es la que se tiene contratada.


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 21<br />

La tarjeta SIM contiene el IMSI (International Mobile Subscriber I<strong>de</strong>ntity), usado para<br />

i<strong>de</strong>ntificar y validar al abonado en cualquier sistema GSM. A<strong>de</strong>más, contiene los<br />

procedimientos <strong>de</strong> criptografía para la confi<strong>de</strong>ncialidad <strong>de</strong> la información <strong>de</strong>l usuario o las<br />

memorias <strong>de</strong>l teléfono (alfanuméricas o para mensajes <strong>de</strong> texto, SMS).<br />

2.– Subsistema <strong>de</strong> estaciones base (Base Station Subsystem, BSS): Sirve para conectar a las<br />

estaciones móviles con los NSS (Network Sub–System), a<strong>de</strong>más <strong>de</strong> ser los encargados <strong>de</strong> la<br />

transmisión y recepción. Constan <strong>de</strong> dos elementos diferenciados: la estación base o BTS (Base<br />

Transceiver Station) y la BSC (Base Station Controller).<br />

� Base Transceiver Station (BTS)<br />

La BTS alberga todos los receptores/transmisores que dan servicio a una celda, los cuales están<br />

encargados <strong>de</strong> recibir y enviar información al canal radio, abasteciendo una interfaz física entre<br />

la estación móvil y la BSC. Las antenas usadas en cada celda <strong>de</strong> la red pue<strong>de</strong>n estar situadas en<br />

el centro <strong>de</strong> la celda (omnidireccional) o directivas (sectores <strong>de</strong> 120º). Normalmente la potencia<br />

<strong>de</strong> transmisión <strong>de</strong>termina el tamaño <strong>de</strong> la celda.<br />

� Base Station Controller (BSC)<br />

Se encarga <strong>de</strong> la gestión <strong>de</strong> varias BTSs en lo relativo a los recursos <strong>de</strong> radio: asignación,<br />

utilización y liberación <strong>de</strong> las frecuencias, handovers y funcionamiento con saltos <strong>de</strong><br />

frecuencias, controlando la conexión entre las BTSs y las MSCs (centrales <strong>de</strong> conmutación que<br />

proporcionan la conexión con la red física y otras re<strong>de</strong>s).<br />

3. Subsistema <strong>de</strong> conmutación y red (Network and Switching Subsystem, NSS): Es el<br />

sistema encargado <strong>de</strong> administrar las comunicaciones que se realizan entre los diferentes<br />

elementos <strong>de</strong> la red. Para po<strong>de</strong>r realizarlas, la NSS se divi<strong>de</strong> en 7 sistemas diferentes, cada uno<br />

con una misión <strong>de</strong>ntro <strong>de</strong> la red:<br />

� Mobile Services Switching Center (MSC): Es el componente central <strong>de</strong>l NSS y se<br />

encarga <strong>de</strong> las labores <strong>de</strong> conmutación para estaciones móviles situadas en su área <strong>de</strong><br />

influencia, así como <strong>de</strong> proporcionar la conexión con otras re<strong>de</strong>s. A<strong>de</strong>más, proporciona<br />

las funciones adicionales necesarias para sustentar la movilidad y organizar la<br />

asignación <strong>de</strong> los recursos radioeléctricos. Entre esas funciones se <strong>de</strong>stacan las<br />

siguientes:<br />

� Procedimientos para la localización y registro <strong>de</strong> abonados y su<br />

actualización.


22 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

� Gestión <strong>de</strong> llamadas y aviso a la estación móvil <strong>de</strong> llamadas entrantes.<br />

� Procedimientos para el traspaso <strong>de</strong> llamadas (handovers).<br />

� Recopilación <strong>de</strong> datos <strong>de</strong> tráfico y facturación.<br />

� Gateway Mobile Services Switching Center (GMSC): Es una MSC que a<strong>de</strong>más es<br />

utilizada para dirigir hacia la red móvil las llamadas originadas en la red fija. De modo<br />

que actúa como dispositivo “pasarela” que se encarga <strong>de</strong> servir <strong>de</strong> mediador entre las<br />

re<strong>de</strong>s <strong>de</strong> telefonía fijas y las móviles, haciendo que los protocolos <strong>de</strong> comunicaciones<br />

que existen en ambas re<strong>de</strong>s se entiendan. Esta central se encarga <strong>de</strong> interrogar al HLR<br />

a<strong>de</strong>cuado para conocer la posición <strong>de</strong>l móvil al que va dirigida la llamada para,<br />

posteriormente, encaminar la llamada hacia la MSC correspondiente.<br />

� Home Location Registrer (HLR): Es una base <strong>de</strong> datos que contiene información sobre<br />

los usuarios conectados a un <strong>de</strong>terminado MSC. Analiza información relativa a los<br />

niveles <strong>de</strong> suscripción, servicios suplementarios y localización actual o más reciente <strong>de</strong><br />

los móviles que pertenecen a la red local <strong>de</strong> ese MSC. El HRL funciona conjuntamente<br />

con el VLR.<br />

� Visitor Location Registrer (VLR): Contiene información sobre los niveles <strong>de</strong><br />

suscripción, servicios suplementarios y localización para un abonado que se encuentra o<br />

al menos se encontraba recientemente visitando el área gestionada por el MSC. Esta<br />

base <strong>de</strong> datos dispone también <strong>de</strong> información relativa a si el abonado se encuentra<br />

activo o no, lo que evita el uso improductivo <strong>de</strong> la red (envío <strong>de</strong> señales a una<br />

localización que se encuentra <strong>de</strong>sconectada).<br />

� Authentication Center (AuC): Asociado al HLR trabaja el centro <strong>de</strong> autentificación<br />

(AuC), que contiene la información por la que se comprueba la autenticidad <strong>de</strong> las<br />

llamadas con el fin <strong>de</strong> evitar los posibles frau<strong>de</strong>s, la utilización <strong>de</strong> tarjetas <strong>de</strong> abonado<br />

(SIMs) robadas o el disfrute <strong>de</strong>l servicio por parte <strong>de</strong> morosos. También se encarga <strong>de</strong><br />

soportar funciones <strong>de</strong> encriptación.<br />

� Equipment I<strong>de</strong>nty Registrer (EIR): También es un elemento para la seguridad <strong>de</strong> las<br />

re<strong>de</strong>s GSM pero a nivel <strong>de</strong> vali<strong>de</strong>z <strong>de</strong> terminales. La EIR contiene una base <strong>de</strong> datos con<br />

la i<strong>de</strong>ntificación <strong>de</strong> todos los terminales que son válidos para ser usados en la red. De<br />

manera que se pue<strong>de</strong> impedir que se realice una llamada cuando se <strong>de</strong>tecte que ha sido<br />

robado, pertenece a algún mo<strong>de</strong>lo no homologado o sufre algún fallo susceptible <strong>de</strong><br />

afectar negativamente a la red.


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 23<br />

4. Network Management Center (NMC): Es un sistema <strong>de</strong> operación que constituye la<br />

máxima jerarquía <strong>de</strong>ntro <strong>de</strong>l sistema <strong>de</strong> explotación. De este centro <strong>de</strong>pen<strong>de</strong>n todos los <strong>de</strong>más<br />

centros <strong>de</strong> operación y mantenimiento (Operation and Maintenance Center, OMC). Estos<br />

centros tienen las siguientes funciones:<br />

o Acceso remoto a todos los elementos que componen la red GSM (BSS, MSC,<br />

VLR, HLR, EIR y AuC).<br />

o Gestión <strong>de</strong> las alarmas y <strong>de</strong>l estado <strong>de</strong>l sistema con posibilidad <strong>de</strong> efectuar<br />

varios tipos <strong>de</strong> pruebas para analizar las prestaciones y verificar el correcto<br />

funcionamiento <strong>de</strong>l mismo.<br />

o Recogida <strong>de</strong> todos los datos relativos al tráfico <strong>de</strong> los abonados necesarios para<br />

la facturación.<br />

o Supervisión <strong>de</strong>l flujo <strong>de</strong> tráfico a través <strong>de</strong> las centrales.<br />

o Visualización <strong>de</strong> la configuración <strong>de</strong> la red con posibilidad <strong>de</strong> cambiarla por<br />

control remoto.<br />

o Administración <strong>de</strong> los abonados y posibilidad <strong>de</strong> po<strong>de</strong>r conocer su posición<br />

<strong>de</strong>ntro <strong>de</strong>l área <strong>de</strong> cobertura.<br />

En re<strong>de</strong>s <strong>de</strong> telefonía <strong>de</strong> gran<strong>de</strong>s dimensiones pue<strong>de</strong>n existir más <strong>de</strong> una OMC. En este caso<br />

existirá un OMC general <strong>de</strong>s<strong>de</strong> el que es posible controlarlo todo (OMC–N) y otros OMC<br />

limitados al control <strong>de</strong> algunas zonas (OMC–R).<br />

2.3 BASES DE DATOS HLR Y VLR<br />

2.3.1 Introducción<br />

En los sistemas <strong>de</strong> telefonía móvil, dado que los terminales pue<strong>de</strong>n moverse libremente por la<br />

red, es necesario realizar un seguimiento automático <strong>de</strong> los mismos para po<strong>de</strong>r encontrar la<br />

celda don<strong>de</strong> se encuentra con el menor retardo posible, lo cual es fundamental, por ejemplo, en<br />

el caso <strong>de</strong> una llamada entrante. Para lograrlo se emplea una base <strong>de</strong> datos jerárquica <strong>de</strong> dos<br />

niveles formados por el HLR y varios VLRs. Dada la importancia <strong>de</strong> estas bases <strong>de</strong> datos para<br />

las funciones <strong>de</strong> movilidad implementadas en las re<strong>de</strong>s <strong>de</strong> telefonía móvil, a continuación se<br />

<strong>de</strong>scribe con más <strong>de</strong>talle aspectos significativos relacionados con estas bases <strong>de</strong> datos.


24 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

2.3.2 Home Location Register (HLR)<br />

Cuando se inscribe un nuevo abono <strong>de</strong> usuario a la red GSM, todas las informaciones para su<br />

i<strong>de</strong>ntificación se memorizan en el HLR <strong>de</strong> la MSC asociada al área en la que se encuentre en ese<br />

momento inicial. El HLR contiene información administrativa (nivel <strong>de</strong> subscripción, servicios<br />

suplementarios, etc.) <strong>de</strong> cada abonado asignado al mismo, junto con los datos <strong>de</strong> localización,<br />

incluyendo información sobre la posible área visitada a efectos <strong>de</strong> enrutar llamadas <strong>de</strong>stinadas al<br />

mismo. Para ello, requiere trabajar conjuntamente con los VLRs. La información contenida en<br />

el HLR pue<strong>de</strong> clasificarse como:<br />

o Datos permanentes, entre los que figuran la i<strong>de</strong>ntificación <strong>de</strong>l abonado (IMSI y<br />

MSISDN), información relativa a teleservicios, servicios portadores y servicios<br />

suplementarios (con sus parámetros) contratados, junto a limitaciones <strong>de</strong><br />

servicio.<br />

o Datos temporales (actualizables), que son los relativos a la localización <strong>de</strong>l<br />

terminal a fin <strong>de</strong> encaminar las llamadas entrantes al MSC don<strong>de</strong> está<br />

registrado. Esta información compren<strong>de</strong> el MSRN, direcciones <strong>de</strong>l VLR y <strong>de</strong>l<br />

MSC e i<strong>de</strong>ntidad temporal (TMSI) que tiene asignado el terminal.<br />

El HLR, como todas las bases <strong>de</strong> datos <strong>de</strong> la red, está implementado en una estación <strong>de</strong> trabajo<br />

cuyas prestaciones (memoria, procesadores, capacidad <strong>de</strong> los discos) son actualizables cuando<br />

crece el número <strong>de</strong> abonados. Asociado al HLR trabaja el centro <strong>de</strong> autentificación (AuC), que<br />

contiene la información por la que se comprueba la autenticidad <strong>de</strong> las llamadas con el fin <strong>de</strong><br />

evitar los posibles frau<strong>de</strong>s, la utilización <strong>de</strong> tarjetas <strong>de</strong> abonado (SIMs) robadas o el disfrute <strong>de</strong>l<br />

servicio por parte <strong>de</strong> impagados.<br />

2.3.3 Visitor Location Register (VLR)<br />

El VLR almacena, <strong>de</strong> modo temporal, información <strong>de</strong> todos los abonados que en un momento<br />

dado están registrados <strong>de</strong>ntro <strong>de</strong> su área <strong>de</strong> servicio. Esta información es requerida y obtenida a<br />

partir <strong>de</strong> los datos contenidos en el HLR <strong>de</strong>l que <strong>de</strong>pen<strong>de</strong> el usuario. En general, para simplificar<br />

las señalizaciones requeridas y la estructura <strong>de</strong>l sistema, los fabricantes implementan el VLR y<br />

el MSC juntos, <strong>de</strong> modo que el área geográfica controlada por el MSC correspon<strong>de</strong> a la<br />

controlada por el VLR.<br />

Cuando un terminal entra en la zona controlada por un MSC, esta central chequea en su base <strong>de</strong><br />

datos asociada para <strong>de</strong>terminar si el usuario está en su “Home Area” (don<strong>de</strong> se registró por<br />

primera vez), o en un “Roaming Area”, es <strong>de</strong>cir, que el usuario se encuentra en modo


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 25<br />

itinerancia. En el caso <strong>de</strong> un usuario itinerante, se notifica esa situación al VLR correspondiente<br />

a ese área visitada. El terminal ejecuta entonces un proceso <strong>de</strong> inscripción o registro y recibe<br />

una dirección <strong>de</strong> visitante que se traduce en un número <strong>de</strong> ruta, MSRN (Mobile Subscriber<br />

Roaming Number), que sirve para encaminar las llamadas <strong>de</strong>stinadas a él hacia el área don<strong>de</strong> se<br />

encuentra actualmente el móvil. A<strong>de</strong>más, es necesario enviar esta información hacia el HLR<br />

asociado al usuario (el <strong>de</strong> su Home Area).<br />

El VLR contiene también otras informaciones necesarias para el tratamiento <strong>de</strong> las llamadas<br />

entrantes/salientes, las cuales se obtienen mediante un diálogo entre el VLR y el HLR. La<br />

información básica contenida en el VLR, toda ella <strong>de</strong> carácter temporal, es la siguiente:<br />

o I<strong>de</strong>ntidad permanente <strong>de</strong>l abonado (IMSI).<br />

o I<strong>de</strong>ntidad temporal <strong>de</strong>l abonado (TMSI).<br />

o Número telefónico <strong>de</strong>l abonado (MSISDN).<br />

o Número <strong>de</strong> encaminamiento (MSRN).<br />

o I<strong>de</strong>ntidad <strong>de</strong> la zona <strong>de</strong> localización (LAI).<br />

o Servicios contratados por el usuario (servicios suplementarios, restricciones…).<br />

Esta base <strong>de</strong> datos dispone también <strong>de</strong> información relativa a si el abonado se encuentra activo o<br />

no, lo que evita el uso improductivo <strong>de</strong> la red (envío <strong>de</strong> señales a un terminal <strong>de</strong>sconectado).<br />

2.4 IDENTIDADES Y NÚMEROS DE USUARIO Y RED<br />

Para los procesos <strong>de</strong> autentificación <strong>de</strong> los usuarios y encaminamiento <strong>de</strong> las llamadas, se ha<br />

establecido un conjunto <strong>de</strong> números asociados a los usuarios y a los elementos <strong>de</strong> la red. A<br />

continuación se <strong>de</strong>scriben los más relevantes.<br />

2.4.1 Internacional Mobile Station I<strong>de</strong>ntity (IMSI)<br />

El IMSI se almacena en la tarjeta SIM y se asigna al abonado en el momento <strong>de</strong> suscribirse. Es<br />

un número interno <strong>de</strong> red que i<strong>de</strong>ntifica al abonado para el acceso a las bases <strong>de</strong> datos. Como<br />

este número se difun<strong>de</strong> por el interfaz radio y pue<strong>de</strong> ser captado, para preservar la<br />

confi<strong>de</strong>ncialidad <strong>de</strong> la i<strong>de</strong>ntidad, la red asigna una i<strong>de</strong>ntidad ficticia al abonado, <strong>de</strong>nominada<br />

TMSI (Temporary Mobile Subscriber I<strong>de</strong>ntity), una vez que éste ya está registrado. De modo<br />

que sólo se transmite por radio si es necesario. Se compone <strong>de</strong> un máximo <strong>de</strong> 15 dígitos y tiene<br />

la siguiente estructura:


26 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

MCC MNC MSIN<br />

NMSI<br />

IMSI<br />

Figura 2-2: Estructura <strong>de</strong> IMSI (Fuente: Rec. GSM 03.03)<br />

Se aprecia que está compuesto <strong>de</strong> tres elementos:<br />

i) Mobile Country Co<strong>de</strong> (MCC): tres dígitos que i<strong>de</strong>ntifican el país <strong>de</strong> domicilio <strong>de</strong>l<br />

abonado móvil (Ej.: 214 para España).<br />

ii) Mobile Network Co<strong>de</strong> (MNC): dos dígitos para usos GSM. EL MNC i<strong>de</strong>ntifica al<br />

operador (GSM/PLMN) <strong>de</strong>ntro <strong>de</strong>l país <strong>de</strong>l abonado móvil (Ej.: 01 para Vodafone).<br />

iii) Mobile Station I<strong>de</strong>ntification Number (MSIN) i<strong>de</strong>ntifica al abonado móvil <strong>de</strong>ntro<br />

<strong>de</strong> un operador (GSM/PLMN), máximo 10 cifras.<br />

2.4.2 Temporary Mobile Subscriber I<strong>de</strong>ntity (TMSI)<br />

Es la i<strong>de</strong>ntidad temporal que se le da al abonado móvil para evitar enviar continuamente el IMSI<br />

por el interfaz radio. Consiste en un i<strong>de</strong>ntificador ficticio que tendrá el abonado durante un<br />

intervalo <strong>de</strong> tiempo. El TMSI tiene importancia únicamente local, es <strong>de</strong>cir, i<strong>de</strong>ntifica a un<br />

terminal únicamente <strong>de</strong>ntro <strong>de</strong>l área controlada por el VLR y, por tanto, <strong>de</strong>l MSC. Su<br />

significado temporal es crear la correspon<strong>de</strong>ncia entre TMSI e IMSI, <strong>de</strong> modo que cuando el<br />

móvil se <strong>de</strong>splaza al área controlada por otro MSC, se le tiene que asignar un nuevo TMSI.<br />

2.4.3 Location Area I<strong>de</strong>ntification (LAI)<br />

Un área <strong>de</strong> localización (LA) es una zona geográfica cubierta por una agrupación <strong>de</strong> celdas,<br />

siendo una celda la zona en la cual una estación base proporciona los servicios. Las áreas <strong>de</strong><br />

localización se i<strong>de</strong>ntifican mediante un número <strong>de</strong>nominado LAI (Location Area I<strong>de</strong>ntity), que<br />

tiene la estructura mostrada en la Figura 2-3, don<strong>de</strong> MCC y MNC tienen el mismo significado<br />

que en el IMSI. El LAC es un código que i<strong>de</strong>ntifica el LA <strong>de</strong>ntro <strong>de</strong> la red.<br />

MCC MNC LAC<br />

Location Area I<strong>de</strong>ntification<br />

Figura 2-3: Estructura <strong>de</strong> LAI (Fuente: Rec. GSM 03.03)


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 27<br />

2.4.4 Cell Global I<strong>de</strong>ntity (CGI)<br />

La celda <strong>de</strong>ntro <strong>de</strong> un LA se i<strong>de</strong>ntifica unívocamente mediante el parámetro CI (Cell I<strong>de</strong>ntity).<br />

Para i<strong>de</strong>ntificar la celda <strong>de</strong>ntro <strong>de</strong> la red se emplea el parámetro CGI o Cell-ID. Este parámetro<br />

es la i<strong>de</strong>ntidad global <strong>de</strong> celda y se emplea para conocer la celda con la que la estación móvil<br />

tiene actualmente contacto radio o con la que tuvo el último contacto radio. El parámetro Cell<br />

ID o CGI se obtiene concatenando la i<strong>de</strong>ntificación <strong>de</strong> LA (LAI) y la i<strong>de</strong>ntidad <strong>de</strong> celda (CI).<br />

MCC MNC LAC CI<br />

Location Area I<strong>de</strong>ntification<br />

Cell Global I<strong>de</strong>ntification (CGI)<br />

Figura 2-4: Estructura <strong>de</strong> CGI (Fuente: Rec. GSM 03.03).<br />

2.5 DISEÑO DE LA RED CELULAR<br />

Puesto que el ámbito geográfico <strong>de</strong> cobertura pue<strong>de</strong> ser muy gran<strong>de</strong>, se introduce el concepto <strong>de</strong><br />

área <strong>de</strong> localización (LA), que consiste en una zona geográfica cubierta por una agrupación <strong>de</strong><br />

celdas, siendo una celda la zona en la cual una estación base proporciona los servicios.<br />

Figura 2-5: Definición <strong>de</strong> celdas y áreas <strong>de</strong> localización.<br />

La forma <strong>de</strong> las celdas usada en la planificación radio <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l tipo <strong>de</strong> antena y <strong>de</strong> la<br />

potencia emitida por cada estación base. En los mo<strong>de</strong>los <strong>de</strong> planificación, las coberturas <strong>de</strong><br />

estaciones base se i<strong>de</strong>alizan mediante hexágonos que recubren el plano sin superposición.<br />

Normalmente se usan dos tipos <strong>de</strong> antenas, las <strong>de</strong> diagrama horizontal omnidireccional y las<br />

directivas.<br />

Si se usan antenas omnidireccionales, i<strong>de</strong>almente el área <strong>de</strong> cobertura será circular, y se utiliza<br />

un círculo para mo<strong>de</strong>lar dicha área. En un contexto real, si se preten<strong>de</strong> cubrir una <strong>de</strong>terminada<br />

zona con antenas omnidireccionales (círculos), se producirá solapamiento entre ellos, lo cual es


28 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

poco eficiente <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> uso <strong>de</strong>l espectro pues en la zona <strong>de</strong> superposición se<br />

aten<strong>de</strong>ría el tráfico con más frecuencias <strong>de</strong> las necesarias. Por otro lado, para reducir la<br />

interferencia y obtener mayor ganancia que favorezca la comunicación en entornos <strong>de</strong> cobertura<br />

difícil, como son los <strong>de</strong> naturaleza urbana e interiores <strong>de</strong> edificios, se utilizan las antenas<br />

directivas. En este caso, en cada emplazamiento se disponen tres antenas con diagramas <strong>de</strong><br />

radiación horizontal que abarcan 120º, como se ve en la Figura 2-6.<br />

Figura 2-6: Antena omnidireccional (izquierda) y directiva – sectores 120º (<strong>de</strong>recha).<br />

Como se ha comentado en líneas anteriores, i<strong>de</strong>almente, las superficies cubiertas por cada<br />

antena se asimilan a hexágonos, y se les suele llamar sectores. Cada sector tiene sus propias<br />

frecuencias y es servido por sus propios transmisores, <strong>de</strong> forma que los sectores son celdas pero<br />

“iluminadas” <strong>de</strong>s<strong>de</strong> un vértice. Esta disposición reduce la interferencia producida ya que las<br />

antenas directivas radian muy poca potencia hacia atrás y en direcciones separadas<br />

angularmente, por lo que la interferencia será pequeña en esas direcciones.<br />

Con la incorporación <strong>de</strong> los sistemas <strong>de</strong> telefonía <strong>de</strong> generaciones más avanzadas (2.5G/3G),<br />

surgen nuevos y más completos servicios a proporcionar a los abonados. Los sistemas móviles<br />

GSM, GPRS y UMTS comparten una estructura <strong>de</strong> red para la conmutación <strong>de</strong> paquetes<br />

sustancialmente equivalente, ya que UMTS hereda la arquitectura creada para GSM y GPRS.<br />

No obstante, los nuevos servicios ofrecidos implica la incorporación <strong>de</strong> nuevos elementos en la<br />

red para lograr una optimización en la localización <strong>de</strong> los terminales en los diferentes servicios<br />

existentes. Al igual que ocurre para servicios <strong>de</strong> voz, estas re<strong>de</strong>s <strong>de</strong>ben mantener actualizada la<br />

información sobre la posición <strong>de</strong> cada teléfono para conocer hacia dón<strong>de</strong> enrutar los paquetes <strong>de</strong><br />

datos que le llegan. En esos casos, se precisa conocer con mayor exactitud el conjunto <strong>de</strong> celdas<br />

sobre el que difundir el mensaje <strong>de</strong> aviso a un terminal para el envío <strong>de</strong> paquetes <strong>de</strong> datos. Con<br />

objeto <strong>de</strong> obtener una solución <strong>de</strong> compromiso entre el tráfico <strong>de</strong> señalización <strong>de</strong>bido a avisos y<br />

el originado por actualizaciones <strong>de</strong> posición, adicionalmente a la jerarquía <strong>de</strong> celda y área <strong>de</strong><br />

localización, aparecen otros niveles como son el RA (Routing Area). Un RA se <strong>de</strong>fine como un


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 29<br />

subconjunto <strong>de</strong> celdas <strong>de</strong> un LA y posee una funcionalidad similar a la <strong>de</strong> las LA en GSM. El<br />

tamaño <strong>de</strong> un RA es siempre menor o igual al <strong>de</strong>l LA al que pertenece.<br />

2.6 GESTIÓN DE MOVILIDAD<br />

La creciente movilidad exigida en la vida mo<strong>de</strong>rna está modificando los hábitos <strong>de</strong> vida tanto a<br />

nivel individual como colectivo en la sociedad actual. Como consecuencia, surge la necesidad<br />

<strong>de</strong> soluciones que permitan la comunicación entre personas mientras éstas se están <strong>de</strong>splazando<br />

por la red. Para garantizar esta movilidad <strong>de</strong> los abonados, manteniendo la calidad <strong>de</strong> los<br />

servicios, una red <strong>de</strong> telefonía celular dispone <strong>de</strong> un conjunto <strong>de</strong> procesos encargados,<br />

básicamente, <strong>de</strong>l seguimiento <strong>de</strong>l usuario y <strong>de</strong> la llamada. Esta sección <strong>de</strong>scribe los principales<br />

procesos relacionados con la gestión <strong>de</strong> la movilidad.<br />

2.6.1 Actualización <strong>de</strong> la posición (Location Update)<br />

Dado que entre los terminales móviles y la red no existe un vínculo físico continuo, se necesitan<br />

una serie <strong>de</strong> procesos para dar soporte a la movilidad <strong>de</strong> los terminales. Es <strong>de</strong>cir, la red <strong>de</strong>be<br />

conocer una cierta estimación <strong>de</strong> la posición <strong>de</strong> esos terminales a fin <strong>de</strong> conocer la central con la<br />

que establecer una conexión (por ejemplo, en caso <strong>de</strong> una llamada entrante). La gestión <strong>de</strong> la<br />

movilidad se ocupa <strong>de</strong>l seguimiento <strong>de</strong>l usuario y, cuando proceda, <strong>de</strong>l mantenimiento <strong>de</strong> la<br />

comunicación establecida. Su correcta ejecución <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l estado <strong>de</strong>l terminal.<br />

En GSM se utiliza un esquema <strong>de</strong> dos estados: DEDICATED (ocupado con una llamada) y<br />

IDLE (encendido y <strong>de</strong>socupado). En el caso <strong>de</strong> que el usuario se encuentre realizando una<br />

llamada (DEDICATED), como consecuencia <strong>de</strong> su movilidad pue<strong>de</strong> ocurrir que se aleje <strong>de</strong> la<br />

estación base servidora y sea necesario conmutar la comunicación a otra estación base <strong>de</strong>s<strong>de</strong> la<br />

que recibirá mejor calidad <strong>de</strong> señal. Esta operación se <strong>de</strong>nomina Handover y se <strong>de</strong>scribe en el<br />

siguiente subapartado. En esta situación, la red siempre conoce la estación base a la que está<br />

conectado el terminal durante la comunicación, es <strong>de</strong>cir, las celdas por las que transita,<br />

notificando la nueva posición cada vez que cambie <strong>de</strong> celda.<br />

Cuando un terminal se encuentra encendido y <strong>de</strong>socupado (IDLE), el usuario <strong>de</strong>be estar<br />

localizado en todo momento para que la red pueda encaminarle las llamadas entrantes cuando<br />

éstas ocurran. El área <strong>de</strong> localización (LA) es el nivel <strong>de</strong> resolución con el que trabajará la red<br />

celular en la búsqueda <strong>de</strong> terminales. Esto es, cada terminal móvil se encuentra asociado a una<br />

única área <strong>de</strong> localización y esta información se mantiene continuamente actualizada en las<br />

base <strong>de</strong> datos. Como los terminales pue<strong>de</strong>n cambiar <strong>de</strong> posición y, por tanto, el punto <strong>de</strong> acceso


30 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

a la red, <strong>de</strong>be existir un proceso automático y transparente que mantenga a la red informada <strong>de</strong><br />

las ubicación <strong>de</strong> sus terminales a nivel <strong>de</strong> LA.<br />

Para conseguirlo aparece el proceso Location Update (LU), el cual implica un intercambio <strong>de</strong><br />

mensajes <strong>de</strong> señalización entre el terminal y la red, y el posterior registro en las bases <strong>de</strong> datos<br />

para actualizarlas con arreglo a esos mensajes. La frecuencia <strong>de</strong> ejecución <strong>de</strong>l proceso <strong>de</strong> LU<br />

<strong>de</strong>pen<strong>de</strong> <strong>de</strong>l estado <strong>de</strong>l teléfono. Cuando el teléfono está encendido y <strong>de</strong>socupado (IDLE), basta<br />

que la red conozca el LA don<strong>de</strong> se encuentra para alertarle en caso <strong>de</strong> una llamada entrante. Por<br />

tanto, el teléfono pue<strong>de</strong> moverse por las distintas celdas <strong>de</strong>l LA sin necesidad <strong>de</strong> actualizar su<br />

posición. En este caso, los eventos que lanzan el proceso LU para actualizar la posición son los<br />

siguientes. i) Cuando el terminal móvil se encien<strong>de</strong> y se conecta a la red, se registra en el LA en<br />

el que se encuentre. ii) Por otro lado, la movilidad <strong>de</strong>l terminal pue<strong>de</strong> provocar un cambio <strong>de</strong><br />

posición que suponga la entrada en un área <strong>de</strong> localización diferente. Mediante un análisis <strong>de</strong> la<br />

señalización enviada por canales <strong>de</strong> “broadcast” se conoce el LA en el que se encuentra un<br />

terminal. De ese modo, es posible <strong>de</strong>tectar la entrada en un nuevo área, comparando el nuevo<br />

valor recibido con el anterior valor <strong>de</strong> LA almacenado <strong>de</strong> modo que, si ha cambiado se ejecuta<br />

el “Location Area Update”. iii) Asimismo, si el teléfono no tiene ningún tipo <strong>de</strong> actividad existe<br />

un mecanismo periódico que lanza reportes automáticos a la red con la última posición<br />

almacenada por el teléfono. Por ello, cada vez que finaliza un temporizador, se obliga a realizar<br />

un registro periódico para notificar su presencia en la red aunque se encuentre en el mismo LA.<br />

Este conjunto <strong>de</strong> procesos permite que la red conozca continuamente la ubicación <strong>de</strong>l terminal<br />

en términos <strong>de</strong> área <strong>de</strong> localización.<br />

Para gestionar la movilidad en sistemas <strong>de</strong> telefonía <strong>de</strong> generaciones más avanzadas (2.5G/3G),<br />

entre otros procedimientos, existe una actualización a nivel <strong>de</strong> RA. De este modo, cuando el<br />

terminal <strong>de</strong>tecta que ha entrado en un nuevo RA, comparando el i<strong>de</strong>ntificador <strong>de</strong> área <strong>de</strong><br />

enrutamiento (RAI) que tiene almacenado con el RAI recibido vía radio, se inicia<br />

automáticamente un proceso para la actualización correspondiente.<br />

2.6.2 Entrega <strong>de</strong> llamada (Paging)<br />

En caso <strong>de</strong> que haya una llamada dirigida a un terminal móvil, la red <strong>de</strong>be tener sus mecanismos<br />

para po<strong>de</strong>r avisar al móvil y establecer finalmente la conexión. Este proceso se <strong>de</strong>nomina<br />

“paging” y consiste en el envío <strong>de</strong> mensajes <strong>de</strong> aviso por canales radio <strong>de</strong>stinados a ello.<br />

Cuando se presenta una llamada entrante, se consulta la base <strong>de</strong> datos HLR para <strong>de</strong>terminar el<br />

LA en el que se encuentra actualmente el <strong>de</strong>stinatario <strong>de</strong> la llamada. A continuación, el mensaje<br />

<strong>de</strong> búsqueda sólo se difun<strong>de</strong> en las celdas pertenecientes a ese LA, enviando un mensaje con el


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 31<br />

i<strong>de</strong>ntificador <strong>de</strong>l terminal al que se <strong>de</strong>be entregar la llamada. Finalmente todos los terminales<br />

analizan este mensaje y respon<strong>de</strong> solamente el terminal buscado. En ese momento ya se pue<strong>de</strong><br />

establecer el canal necesario para cursar la llamada puesto que se conoce la estación base<br />

(celda) que daría servicio al teléfono.<br />

2.6.3 Traspaso (Handover)<br />

Para mantener una comunicación (voz y/o datos) con un terminal móvil, es necesario que exista<br />

una conexión “punto a punto” entre el terminal origen y el <strong>de</strong> <strong>de</strong>stino, la cual <strong>de</strong>be exten<strong>de</strong>rse en<br />

el tiempo mientras dure la comunicación. Por ello, la red precisa conocer continuamente el<br />

punto <strong>de</strong> acceso a la red por el que encaminar la comunicación, es <strong>de</strong>cir, la estación base (celda)<br />

en la que se encuentran los terminales implicados. Esa información <strong>de</strong> posición <strong>de</strong> los abonados<br />

a nivel <strong>de</strong> celda es almacenada y actualizada en las bases <strong>de</strong> datos (HLR y VLR) oportunas.<br />

Dado que un terminal pue<strong>de</strong> moverse entre áreas <strong>de</strong> servicio <strong>de</strong> distintas estaciones base durante<br />

una conexión activa con la red (voz y/o datos), una red <strong>de</strong>be disponer <strong>de</strong> mecanismos a<strong>de</strong>cuados<br />

para que ese terminal esté permanentemente conectado y controlado por la red durante la<br />

comunicación. El HandOver (HO) surge como solución al problema <strong>de</strong>l mantenimiento <strong>de</strong> una<br />

comunicación cuando la calidad <strong>de</strong>l enlace es insuficiente, principalmente cuando el terminal se<br />

mueve entre dos celdas <strong>de</strong> la red. Con los mecanismos a<strong>de</strong>cuados, se consigue un cambio <strong>de</strong><br />

una celda a otra <strong>de</strong> un modo transparente para el usuario y sin <strong>de</strong>gradar la calidad <strong>de</strong> la<br />

comunicación. Este proceso permite que un terminal esté siempre conectado tanto a la red como<br />

a la mejor estación base servidora. Existen otros casos en los que pue<strong>de</strong> iniciarse el handover tal<br />

como un elevado nivel <strong>de</strong> interferencia, el cual imposibilita la comunicación con la calidad<br />

a<strong>de</strong>cuada, o bien que por razones <strong>de</strong> tráfico se <strong>de</strong>ban liberar recursos <strong>de</strong> esa estación base y<br />

continuar la comunicación a través <strong>de</strong> otra con menor tráfico. En el proceso <strong>de</strong> handover<br />

intervienen mecanismos para evitar efectos in<strong>de</strong>seados, como los cambios <strong>de</strong> estación base<br />

innecesarios (efecto ping–pong), mediante el uso <strong>de</strong> parámetros que mi<strong>de</strong>n la calidad <strong>de</strong>l enlace<br />

como el RSSI (Radio Signal Strenght Indicator), BER (Bit Error Rate), relación CIR, entre<br />

otros.<br />

Durante el diseño <strong>de</strong> la red, el operador <strong>de</strong>fine un conjunto <strong>de</strong> celdas para cada estación base<br />

(celda) a las que se permite realizar el handover. Típicamente, este conjunto <strong>de</strong> celdas coinci<strong>de</strong><br />

con las celdas vecinas que la ro<strong>de</strong>an, aunque pue<strong>de</strong> variar según la topología <strong>de</strong> la zona.<br />

Asimismo, se or<strong>de</strong>na dicha lista <strong>de</strong> celdas vecinas conforme a una prioridad en función <strong>de</strong><br />

parámetros <strong>de</strong> diseño <strong>de</strong> la red. En el caso <strong>de</strong> que se tome la <strong>de</strong>cisión <strong>de</strong> ejecutar un handover, el<br />

BSC inicia el proceso <strong>de</strong> traspaso a aquella celda <strong>de</strong> la lista con mayor prioridad.


32 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Des<strong>de</strong> el punto <strong>de</strong> vista operativo, el handover tiene 3 etapas: medida, toma <strong>de</strong> <strong>de</strong>cisión y<br />

ejecución. Por ello, durante el handover se produce un intercambio <strong>de</strong> información <strong>de</strong><br />

señalización entre el terminal y centrales <strong>de</strong> la red (como son las BTS, BSC, MSC). Como<br />

resultado, se toma la <strong>de</strong>cisión <strong>de</strong> hacer o no el handover. La <strong>de</strong>cisión la toma siempre la BSC<br />

que se ocupa <strong>de</strong>l abonado en ese momento. Si la <strong>de</strong>cisión es negativa, se mantiene la<br />

comunicación con la estación base actual (misma celda). En caso <strong>de</strong> que se <strong>de</strong>ba ejecutar el<br />

handover, se produce un intercambio <strong>de</strong> información con la red, <strong>de</strong>rivándose ciertos parámetros<br />

asociados a cada una <strong>de</strong> esas llamadas traspasadas (como celdas implicadas, instante y duración<br />

<strong>de</strong>l handover, junto con algún otro tipo <strong>de</strong> información <strong>de</strong> señalización).<br />

En el caso <strong>de</strong> GSM, el handover consiste en una transferencia <strong>de</strong> recursos que implica la<br />

interrupción <strong>de</strong>l enlace actual y la creación <strong>de</strong> uno nuevo. Esto se <strong>de</strong>be fundamentalmente a que<br />

las estaciones base vecinas utilizan portadoras y/o bases <strong>de</strong> tiempo distintas y los terminales no<br />

son capaces <strong>de</strong> conectarse simultáneamente a ambas. En esos casos, <strong>de</strong>nominado Hard–<br />

Handover, el terminal se <strong>de</strong>sconecta <strong>de</strong> su estación base origen y durante un tiempo (<strong>de</strong>l or<strong>de</strong>n<br />

<strong>de</strong> milisegundos) no está conectada a ninguna otra estación base. Esto provoca una interrupción<br />

<strong>de</strong> la señal vocal apenas perceptible por el abonado. Sin embargo, esta situación no es aplicable<br />

a comunicaciones <strong>de</strong> datos (2.5G/3G), don<strong>de</strong> una interrupción <strong>de</strong> ese tipo se traduce en pérdida<br />

<strong>de</strong> los datos, dado que la red no está preparada para estos cortes. Por ello existe otro tipo <strong>de</strong><br />

handover, <strong>de</strong>nominado Soft–Handover, durante el cual el terminal estará conectado a la estación<br />

base origen mediante un canal y a la estación base <strong>de</strong>stino mediante otro. Así pues, la<br />

transmisión se realiza en paralelo por los dos canales, es <strong>de</strong>cir, no se produce interrupción <strong>de</strong>l<br />

enlace. Este es el esquema utilizado en re<strong>de</strong>s más avanzadas.<br />

2.7 TRÁFICO Y DIMENSIONADO<br />

2.7.1 Introducción<br />

El dimensionado en un sistema <strong>de</strong> telefonía móvil es una actividad compleja que requiere<br />

cuantificar, aunque sea <strong>de</strong> manera teórica e incorporando muchas simplificaciones e hipótesis, la<br />

capacidad que tendrá la red <strong>de</strong> soportar usuarios para una configuración dada y unos ciertos<br />

requisitos <strong>de</strong> calidad. Esta capacidad vendrá referida, esencialmente, al tráfico telefónico<br />

ofrecido en una celda y su distribución con respecto al tiempo, para garantizar un grado <strong>de</strong><br />

servicio básico. Ese tráfico telefónico varía según la estación base, el mes, día e incluso instante<br />

<strong>de</strong>ntro <strong>de</strong>l día. La duración <strong>de</strong> las conversaciones es otra variable importante a consi<strong>de</strong>rar a la<br />

hora <strong>de</strong>l dimensionado.


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 33<br />

Tradicionalmente, este dimensionado se efectúa conforme a la intensidad <strong>de</strong> tráfico <strong>de</strong> la hora<br />

<strong>de</strong> mayor ocupación BH (Busy Hour) – período <strong>de</strong> 60 min. <strong>de</strong> un día para el cual la carga <strong>de</strong><br />

tráfico es máxima –, y viene expresada en Erlangs. Un Erlang es una unidad adimensional<br />

utilizada en telecomunicaciones como una medida estadística <strong>de</strong>l volumen <strong>de</strong> tráfico o<br />

intensidad; en concreto, se emplea para caracterizar el sistema en el ámbito <strong>de</strong> tráfico telefónico.<br />

Por ejemplo, si el uso total <strong>de</strong>l teléfono móvil por hora en un área dada es <strong>de</strong> 180 minutos, esto<br />

representa 3 Erlangs.<br />

El tráfico telefónico indica la cantidad <strong>de</strong> información (voz y/o datos) transportada por una vía<br />

<strong>de</strong> comunicación o canal. Este tráfico se mi<strong>de</strong> en términos <strong>de</strong> tiempo (entendido como tiempo<br />

<strong>de</strong> ocupación <strong>de</strong>l canal) y <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l número <strong>de</strong> comunicaciones y <strong>de</strong> la duración <strong>de</strong> las<br />

mismas. Por ejemplo, en el caso <strong>de</strong> un canal que se ha utilizado para diez llamadas en una hora,<br />

cada una con una duración <strong>de</strong> tres minutos, dado que el comportamiento <strong>de</strong>l canal es en serie<br />

(las comunicaciones se suce<strong>de</strong>n una <strong>de</strong>trás <strong>de</strong> la otra), se cuantifica que el canal ha estado<br />

ocupado durante un periodo <strong>de</strong> tiempo <strong>de</strong> treinta minutos: 0,5 Erlang, o bien que la ocupación<br />

<strong>de</strong>l canal ha sido <strong>de</strong>l 50%. Así pues, la intensidad <strong>de</strong> tráfico telefónico expresada en Erlangs<br />

mi<strong>de</strong> el promedio <strong>de</strong> llamadas en progreso simultáneamente durante el periodo <strong>de</strong> una hora o la<br />

ocupación media <strong>de</strong> un canal por unidad <strong>de</strong> tiempo (hora).<br />

2.7.2 Mo<strong>de</strong>los <strong>de</strong> tráfico telefónico<br />

En el <strong>de</strong>spliegue y la operación <strong>de</strong> una red móvil, el dimensionado <strong>de</strong> los recursos<br />

radioeléctricos <strong>de</strong>be ser tratado como un aspecto clave. Para abordar el problema <strong>de</strong>l<br />

dimensionado suelen emplearse mo<strong>de</strong>los <strong>de</strong> tráfico, los cuales <strong>de</strong>finen una serie <strong>de</strong> conceptos y<br />

parámetros que posteriormente serán utilizados en las metodologías <strong>de</strong>sarrolladas en esta Tesis.<br />

En re<strong>de</strong>s telefónicas fijas el tráfico es caracterizado con gran precisión. En cambio, un mo<strong>de</strong>lado<br />

preciso <strong>de</strong> las características <strong>de</strong> tráfico en re<strong>de</strong>s <strong>de</strong> telefonía móvil suele ser más complejo. En<br />

general, el tráfico telefónico generado en una zona pue<strong>de</strong> <strong>de</strong>scribirse, principalmente,<br />

atendiendo a dos mo<strong>de</strong>los <strong>de</strong> tráfico que difieren <strong>de</strong> su punto <strong>de</strong> vista <strong>de</strong> la red. i) El mo<strong>de</strong>lo <strong>de</strong><br />

movilidad (mobility mo<strong>de</strong>l o traffic source mo<strong>de</strong>l), el cual <strong>de</strong>scribe el sistema <strong>de</strong>s<strong>de</strong> la<br />

perspectiva <strong>de</strong>l usuario móvil. En él, el escenario <strong>de</strong> tráfico telefónico se representa como un<br />

conjunto <strong>de</strong> entida<strong>de</strong>s individuales (usuarios) realizando un recorrido aleatorio a través <strong>de</strong>l área<br />

<strong>de</strong> servicio y con una <strong>de</strong>manda aleatoria <strong>de</strong> recursos, es <strong>de</strong>cir, <strong>de</strong> canales <strong>de</strong> radio. ii) En<br />

cambio, existe un mo<strong>de</strong>lo <strong>de</strong> tráfico <strong>de</strong> red (network traffic mo<strong>de</strong>l), para el cual el tráfico<br />

telefónico viene <strong>de</strong>scrito como una observación realizada <strong>de</strong>s<strong>de</strong> elementos <strong>de</strong> la red, como


34 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

estaciones base (BTS) o centrales (MSC). Este mo<strong>de</strong>lo caracteriza la <strong>de</strong>pen<strong>de</strong>ncia temporal y<br />

espacial <strong>de</strong> la distribución <strong>de</strong> tráfico <strong>de</strong> llamadas mediante el tráfico ofrecido A 1 en una celda.<br />

Este último mo<strong>de</strong>lo es muy utilizado a la hora <strong>de</strong> <strong>de</strong>terminar la ubicación <strong>de</strong> los principales<br />

componentes en una red móvil (BTS, MSC,…). Estos componentes <strong>de</strong>ben estar dimensionados<br />

para soportar un tráfico próximo al previsto a fin <strong>de</strong> aumentar la eficiencia <strong>de</strong>l sistema. En<br />

cambio, <strong>de</strong>bido a su capacidad para <strong>de</strong>scribir la <strong>de</strong>pen<strong>de</strong>ncia temporal <strong>de</strong>l comportamiento <strong>de</strong><br />

los usuarios en <strong>de</strong>talle, el mo<strong>de</strong>lo <strong>de</strong> movilidad es el más extendido para la caracterización <strong>de</strong>l<br />

tráfico en cada celda particular.<br />

A continuación se presenta un mo<strong>de</strong>lo <strong>de</strong> tráfico, simplificado pero bastante general, cuyo<br />

planteamiento está basado en la teoría <strong>de</strong> tráfico telefónico usando el citado mo<strong>de</strong>lo <strong>de</strong><br />

movilidad. El mo<strong>de</strong>lo se encarga <strong>de</strong> estudiar el dimensionamiento y la gestión <strong>de</strong> los recursos<br />

que se ponen a disposición <strong>de</strong> un sistema <strong>de</strong> telecomunicación, en este caso, <strong>de</strong> telefonía móvil,<br />

para optimizar tanto su rentabilidad como la calidad <strong>de</strong> servicio ofrecida por celda.<br />

En el contexto <strong>de</strong> las re<strong>de</strong>s móviles 2G, como GSM, el concepto <strong>de</strong> capacidad queda fácilmente<br />

<strong>de</strong>finido en la medida en que hay básicamente tráfico <strong>de</strong> voz en la red. En cambio, en el marco<br />

<strong>de</strong> los sistemas 2,5G y 3G, en los que se plantea un entorno multiservicio con requerimientos <strong>de</strong><br />

calidad <strong>de</strong> servicio muy diversos, el concepto <strong>de</strong> capacidad <strong>de</strong> la red <strong>de</strong>be enten<strong>de</strong>rse <strong>de</strong> forma<br />

más amplia y su estimación no resulta tan inmediata como en el entorno sólo <strong>de</strong> voz. En base al<br />

razonamiento anterior y dado que el estudio se centra en re<strong>de</strong>s GSM, el mo<strong>de</strong>lo está referido<br />

únicamente al tráfico telefónico <strong>de</strong> voz, por ser el tráfico dominante en GSM. Asimismo, el<br />

mo<strong>de</strong>lo <strong>de</strong>be estar basado en pronósticos <strong>de</strong> <strong>de</strong>manda en función <strong>de</strong>l tipo <strong>de</strong> zona, ya que el<br />

tráfico telefónico varía según las características <strong>de</strong> los abonados y <strong>de</strong> la celda en cuestión.<br />

En este mo<strong>de</strong>lo se consi<strong>de</strong>ra que la llegada <strong>de</strong> llamadas pue<strong>de</strong> mo<strong>de</strong>larse mediante un proceso<br />

<strong>de</strong> Poisson <strong>de</strong> tasa <strong>de</strong> llegada λ, <strong>de</strong> forma que la probabilidad <strong>de</strong> que en la hora <strong>de</strong> mayor<br />

ocupación (o BH) se produzcan n llamadas, se <strong>de</strong>fine como:<br />

��<br />

n<br />

e ( � )<br />

pn<br />

� (1)<br />

n!<br />

En este mo<strong>de</strong>lo simplificado <strong>de</strong> tráfico <strong>de</strong> voz, si M es el número <strong>de</strong> estaciones móviles y L el<br />

número medio <strong>de</strong> intentos <strong>de</strong> llamada por móvil en la hora <strong>de</strong> mayor ocupación, BH, se tiene:<br />

1 El tráfico A se cuantifica mediante la intensidad <strong>de</strong>l tráfico λ – la cual se mi<strong>de</strong> como intentos <strong>de</strong> llamadas por unidad <strong>de</strong> tiempo y<br />

espacio (llamadas/seg·km 2 ) – y teniendo en cuenta la media <strong>de</strong> duración <strong>de</strong> llamadas E[tllamadasl], siendo A=λ E[tllamadasl] (en<br />

Erlang/km 2 ). Esta medida representa la cantidad <strong>de</strong> tráfico que se ofrece en una zona <strong>de</strong>terminada.


Capítulo 2: REDES DE TELEFONÍA CELULAR GSM 35<br />

M � L<br />

� � (2)<br />

3600<br />

En los procesos <strong>de</strong> llegada <strong>de</strong> Poisson, el tiempo t comprendido entre dos intentos consecutivos<br />

es una variable aleatoria continua que se mo<strong>de</strong>la mediante una distribución exponencial<br />

�td<br />

negativa, cuya <strong>de</strong>nsidad <strong>de</strong> probabilidad es: f( t ) � e , t 0<br />

�<br />

� � � . El parámetro μ <strong>de</strong> la<br />

d d<br />

distribución es igual a 1/Tc, siendo Tc la duración media <strong>de</strong> la ocupación <strong>de</strong>l recurso, es <strong>de</strong>cir,<br />

duración media <strong>de</strong> la llamada. Entonces, la intensidad <strong>de</strong>l tráfico A ofrecido al recurso en<br />

cuestión se <strong>de</strong>fine como:<br />

A (Erlang)<br />

�<br />

� (3)<br />

�<br />

Sustituyendo en (3) los valores λ y μ resulta:<br />

M �L�Tc A � (Erlang).<br />

3600<br />

Esta expresión permite interpretar la intensidad <strong>de</strong> tráfico como el tiempo medio total <strong>de</strong><br />

ocupación <strong>de</strong> los recursos en la hora <strong>de</strong> mayor ocupación, BH.<br />

Con este parámetro <strong>de</strong> intensidad <strong>de</strong> tráfico quedan expuestos los conceptos básicos que más<br />

a<strong>de</strong>lante serán usados en el ámbito <strong>de</strong> la Tesis. Sin embargo, es necesario indicar que una<br />

llamada generada en una celda <strong>de</strong>terminada pue<strong>de</strong> proce<strong>de</strong>r <strong>de</strong> una llegada nueva o una llegada<br />

<strong>de</strong> traspaso ya que una llamada pue<strong>de</strong> concluir en la celda don<strong>de</strong> se origina o ser objeto <strong>de</strong><br />

traspaso a otra u otras celdas. Por tanto, en general, toda llamada pue<strong>de</strong> <strong>de</strong>scomponerse en dos:<br />

las que se inician y concluyen en una misma celda y las que experimentan traspasos<br />

(handovers). De modo que la tasa <strong>de</strong> llamadas entrantes λ <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> Poisson estará formada<br />

por λc y λh, siendo éstas las tasas <strong>de</strong> llegada <strong>de</strong> nuevas llamadas y las <strong>de</strong> traspasadas,<br />

respectivamente. Estas tasas λc y λh <strong>de</strong>finen sendos procesos <strong>de</strong> Poisson y estarán relacionadas<br />

entre sí. Esta relación se <strong>de</strong>muestra utilizando la hipótesis <strong>de</strong> equilibrio <strong>de</strong> flujos <strong>de</strong> llamadas, en<br />

la cual la tasa <strong>de</strong> llamadas que abandonan una celda coinci<strong>de</strong> con las que llegan y vale λh:<br />

ph(1 � pb)<br />

�c<br />

�h � ph[(1 � pb) �c �(1 � pbh)<br />

�h] ��h �<br />

1 � p (1 � p )<br />

h bh<br />

Don<strong>de</strong> ph es la probabilidad <strong>de</strong> handover, pb es la probabilidad <strong>de</strong> bloqueo para una nueva<br />

llamada y pbh es la probabilidad <strong>de</strong> bloqueo para un intento <strong>de</strong> handover, consi<strong>de</strong>rando bloqueo<br />

como la ausencia <strong>de</strong> canales para asignar. De la ecuación anterior se <strong>de</strong>spren<strong>de</strong> que la tasa <strong>de</strong><br />

llamadas entrantes por traspaso en una celda λh es una fracción <strong>de</strong> la tasa <strong>de</strong> llamadas ofrecidas a<br />

esa celda λc, siendo ese parámetro <strong>de</strong> proporcionalidad n h el siguiente:<br />

(4)


36 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

�h<br />

ph(1 � pb)<br />

� �n<br />

� 1 � p (1 � p )<br />

c h bh<br />

La probabilidad <strong>de</strong> handover ph será igual a la probabilidad <strong>de</strong> que la duración <strong>de</strong> una llamada<br />

(td) supere el tiempo <strong>de</strong> permanencia en la celda (tp). Para el cálculo <strong>de</strong> pb y pbh se utilizan<br />

mo<strong>de</strong>los <strong>de</strong> procesos estocásticos <strong>de</strong> tráfico para obtener la probabilidad <strong>de</strong> que haya n canales<br />

ocupados, generalmente mediante el mo<strong>de</strong>lo <strong>de</strong> Erlang–B.<br />

En este apartado se han presentado algunos <strong>de</strong> los conceptos básicos relacionados con el tráfico<br />

<strong>de</strong> voz en el ámbito <strong>de</strong> un mo<strong>de</strong>lo para la evaluación y dimensionado <strong>de</strong> sistemas <strong>de</strong> telefonía<br />

móvil. Estos conceptos serán empleados posteriormente en el planteamiento <strong>de</strong> las<br />

metodologías <strong>de</strong>sarrolladas en la Tesis. El mo<strong>de</strong>lo <strong>de</strong> tráfico expuesto pue<strong>de</strong> ser aplicado a<br />

situaciones muy generales ya que sigue las principales hipótesis asumidas en re<strong>de</strong>s <strong>de</strong> telefonía<br />

móvil: las llegadas <strong>de</strong> llamadas siguen un proceso <strong>de</strong> Poisson y el intervalo <strong>de</strong> tiempo entre<br />

llegadas sucesivas sigue una distribución exponencial negativa. En la literatura existen<br />

numerosos mo<strong>de</strong>los <strong>de</strong> tráfico que asumen estas distribuciones (Hong y Rappaport, 1986; Steele<br />

y Nofal, 1992; Zeng et al., 1997; Gavish y Sridhar, 1996), cuyos <strong>de</strong>sarrollos son mucho más<br />

extensos que los expuestos en este apartado. Es necesario indicar que este apartado sólo se ha<br />

centrado en los aspectos básicos relativos al dimensionado <strong>de</strong> los recursos radio a fin <strong>de</strong><br />

presentar unas nociones básicas al lector.<br />

h<br />

(5)


CAPÍTULO 3<br />

ESTADO DEL ARTE EN EL ÁMBITO DE LA<br />

ESTIMACIÓN DE PARÁMETROS DE<br />

TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL<br />

3.1 INTRODUCCIÓN<br />

El capítulo anterior <strong>de</strong>scribe los conceptos básicos y funcionalida<strong>de</strong>s principales existentes en<br />

los sistemas <strong>de</strong> telefonía móvil para garantizar la movilidad <strong>de</strong> los abonados, manteniendo la<br />

calidad <strong>de</strong> los servicios. Durante su ejecución, estos procedimientos proporcionan información<br />

sobre la localización <strong>de</strong> los usuarios que, tras el tratamiento oportuno, pue<strong>de</strong> ser útil para la<br />

caracterización <strong>de</strong>l tráfico vehicular, con parámetros tales como velocidad, volumen o<br />

movilidad origen–<strong>de</strong>stino, entre otros. En los siguientes apartados se hace una revisión<br />

exhaustiva <strong>de</strong>l “Estado–<strong>de</strong>l–Arte” en el ámbito <strong>de</strong> la estimación <strong>de</strong> estos parámetros a partir <strong>de</strong><br />

la telefonía móvil, <strong>de</strong>scribiendo métodos usados en diferentes proyectos, tanto <strong>de</strong> simulación<br />

como pruebas piloto, existentes en el sector académico e industrial.<br />

3.2 MATRICES ORIGEN–DESTINO<br />

Las matrices origen–<strong>de</strong>stino (O–D) se utilizan para cuantificar y sintetizar la movilidad asociada<br />

al <strong>de</strong>splazamiento <strong>de</strong> personas y/o mercancías sobre una región. Estas matrices aportan<br />

información sobre el número <strong>de</strong> viajes realizados entre una “zona <strong>de</strong> transporte” origen i y una<br />

<strong>de</strong>stino j en un <strong>de</strong>terminado intervalo <strong>de</strong> tiempo. Así pues, se trata <strong>de</strong> una estructura <strong>de</strong><br />

información que representa la <strong>de</strong>manda <strong>de</strong> transporte sobre un área durante un período temporal<br />

específico. Tradicionalmente, las áreas que conforman las “zonas <strong>de</strong> transporte” orígenes y<br />

<strong>de</strong>stinos <strong>de</strong> una matriz, es <strong>de</strong>cir, las zonas don<strong>de</strong> empiezan y terminan los viajes, vienen<br />

<strong>de</strong>finidas por criterios socioeconómicos o agregaciones <strong>de</strong> población que se correspon<strong>de</strong>n con


38 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

zonas que pudieran tener una relación causal con los movimientos <strong>de</strong> transporte que se dan entre<br />

ellas.<br />

Estas matrices pue<strong>de</strong>n ser elaboradas con diferentes niveles <strong>de</strong> agregación, <strong>de</strong>pendiendo <strong>de</strong>l<br />

grado <strong>de</strong> <strong>de</strong>talle que se <strong>de</strong>see (tamaño <strong>de</strong> las zonas) o el tipo <strong>de</strong> información necesario: por<br />

modo <strong>de</strong> transporte (vehículo privado, autobús…), por bien transportado (personas,<br />

mercancías…). Las unida<strong>de</strong>s empleadas para <strong>de</strong>finir una matriz O–D están fuertemente<br />

relacionadas con este nivel <strong>de</strong> agregación. De este modo éstas podrían ser vehículos, personas,<br />

mercancías, o incluso teléfonos móviles.<br />

En los sistemas <strong>de</strong> telefonía existe una clasificación <strong>de</strong> la zona <strong>de</strong> servicio en celdas y áreas <strong>de</strong><br />

localización (LA), aunque adicionalmente existen las áreas <strong>de</strong> enrutamiento (RA) para 2.5G y<br />

3G. Según lo visto en el Capítulo 2, la red maneja una estimación <strong>de</strong> posición <strong>de</strong> un terminal<br />

mientras esté encendido <strong>de</strong>ntro <strong>de</strong> su cobertura según los diferentes estados: encendido y<br />

<strong>de</strong>socupado (idle), o con comunicaciones activas (<strong>de</strong>dicated o active), incluso, en 2.5G/3G<br />

existe un estado adicional en el cual el terminal se encuentra en espera <strong>de</strong> iniciar una<br />

comunicación en el contexto <strong>de</strong> paquetes una vez registrado en GPRS (standby). Si esto se<br />

traslada al dominio <strong>de</strong> teléfonos a bordo <strong>de</strong> vehículos en movimiento, un terminal que tenga<br />

establecida una comunicación con la red proporciona datos bastante continuos <strong>de</strong>l recorrido: a<br />

nivel <strong>de</strong> celdas por las que está circulando. Incluso si el terminal no está en uso sino<br />

simplemente encendido, también ofrece datos válidos <strong>de</strong>l recorrido, puesto que continuamente<br />

se conoce el LA en el que se encuentra. En este caso, aunque los datos <strong>de</strong> localicazión son<br />

menos precisos y frecuentes, también permiten i<strong>de</strong>ntificar viajes. Por ello, construir una matriz<br />

O–D mediante datos <strong>de</strong> localización <strong>de</strong> teléfonos móviles exige <strong>de</strong>finir el nivel <strong>de</strong> agregación<br />

que se <strong>de</strong>sea conseguir, es <strong>de</strong>cir, si las “zonas <strong>de</strong> transporte” serán las celdas o las LAs<br />

existentes en la zona <strong>de</strong> servicio <strong>de</strong> la red <strong>de</strong> telefonía existente en la región bajo estudio.<br />

Según lo expuesto anteriormente, el nivel <strong>de</strong> agregación <strong>de</strong> la matriz está directamente<br />

relacionado con el tipo <strong>de</strong> datos <strong>de</strong> localización que la genere. Por ello, si se preten<strong>de</strong> obtener<br />

una matriz <strong>de</strong> viajes entre celdas origen–<strong>de</strong>stino, se precisa conocer las celdas por las que los<br />

teléfonos transitan en todo momento. Esto es posible cuando se trata <strong>de</strong> datos asociados a<br />

comunicaciones (llamadas) efectuadas por los teléfonos. En estos casos, la muestra <strong>de</strong> datos<br />

asociada es más reducida que si se utilizara el conjunto <strong>de</strong> teléfonos encendidos.<br />

Sobre esta i<strong>de</strong>a <strong>de</strong> matriz entre celdas O–D se han presentado recientemente varios trabajos.<br />

Tras años <strong>de</strong> estudio, White y Wells (2002) publicaron los resultados <strong>de</strong> un proyecto<br />

<strong>de</strong>sarrollado conjuntamente por TRL (Transport Research Laboratory) y HA (Highways


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 39<br />

Agency) en el Reino Unido. Dicho proyecto consistió en la extracción <strong>de</strong> información sobre<br />

movilidad entre celdas origen–<strong>de</strong>stino con datos anónimos <strong>de</strong> localización asociados a llamadas<br />

realizadas por usuarios, proporcionados por el operador BTCellnet (actualmente O2). Se sabe<br />

que, cuando un teléfono efectúa una llamada, se conoce la estación base servidora en todo<br />

momento y, por tanto, la celda en la que se encuentra. Con fines <strong>de</strong> facturación, se almacenan<br />

múltiples datos asociados a cada llamada, como la posición <strong>de</strong>l teléfono al inicio y fin <strong>de</strong> la<br />

llamada o la duración <strong>de</strong> la misma, entre otros. El citado trabajo hace uso <strong>de</strong> esos datos <strong>de</strong><br />

posiciones inicial y final <strong>de</strong> cada llamada para obtener información <strong>de</strong> movilidad sobre una<br />

región bajo estudio en términos <strong>de</strong> celdas origen y <strong>de</strong>stino. Así pues, se consigue construir una<br />

matriz <strong>de</strong> viajes don<strong>de</strong> las “zonas <strong>de</strong> transporte” se correspon<strong>de</strong>n con las celdas que <strong>de</strong>finen la<br />

cobertura en la región analizada. El principal inconveniente <strong>de</strong> las matrices eleboradas bajo este<br />

criterio es que la información recopilada es parcial. El viaje <strong>de</strong>tectado con las llamadas está<br />

limitado al recorrido que realizó el usuario con la llamada activa, el cual lógicamente no suele<br />

correspon<strong>de</strong>rse con el recorrido completo realizado por el usuario; por ejemplo, en su<br />

<strong>de</strong>splazamiento <strong>de</strong> casa al trabajo. No obstante, la matriz resultante proporcionaría una matriz<br />

<strong>de</strong> partida que podría ser tratada posteriormente con algoritmos <strong>de</strong> expansión u otros<br />

procedimientos similares para inferir una matriz válida.<br />

Lógicamente, el empleo <strong>de</strong> este tipo <strong>de</strong> información asociada a la telefonía móvil implica la<br />

colaboración <strong>de</strong> un operador que los suministre. Esos datos se recibirían y tratarían <strong>de</strong> forma<br />

agregada y anónima, según los reglamentos vigentes, <strong>de</strong> modo que no exista posibilidad <strong>de</strong><br />

asociar datos con abonados reales. Sólo se preten<strong>de</strong> conocer información referente a la<br />

localización <strong>de</strong> un terminal, visto como una sonda anónima que se mueve a través <strong>de</strong> la red. A<br />

pesar <strong>de</strong> ello, conseguir la cooperación <strong>de</strong> un operador <strong>de</strong> telefonía no es una tarea sencilla. Por<br />

ello, es habitual recurrir a la ayuda <strong>de</strong> simuladores para conseguir datos <strong>de</strong> localización<br />

necesarios para implementar sus algoritmos <strong>de</strong> estimación ya que poseen la ventaja <strong>de</strong> que la<br />

información “real” <strong>de</strong> posición <strong>de</strong> cada vehículo pue<strong>de</strong> ser extraída según un tiempo <strong>de</strong><br />

muestreo <strong>de</strong>seado, y así validar con mayor facilidad dichos algoritmos.<br />

Uno <strong>de</strong> esos trabajos basados en simulaciones es el <strong>de</strong>sarrollado por Akin y Sisiopiku (2002), el<br />

cual también elaboró una matriz <strong>de</strong> viajes entre celdas pero mediante datos <strong>de</strong> localización<br />

generados por un conjunto específico <strong>de</strong> teléfonos sobre una cierta zona. Para <strong>de</strong>sarrollar los<br />

mo<strong>de</strong>los y validar sus algoritmos, los datos <strong>de</strong> localización (registros en las celdas <strong>de</strong> una<br />

región) fueron creados mediante una función generadora <strong>de</strong> números aleatorios en MS Excel.<br />

Los números generados representaban los i<strong>de</strong>ntificadores <strong>de</strong> celdas visitadas durante un día por<br />

un conjunto <strong>de</strong> teléfonos móviles pertenecientes a un operador ficticio. Esos teléfonos


40 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

técnicamente transmitían su posición cada 5 minutos, representando una muestra <strong>de</strong> viajeros<br />

sobre una ciudad ficticia. Tras obtener una matriz mediante algoritmos oportunos, se efectuaban<br />

los correspondientes ajustes dado que los viajes se <strong>de</strong>rivaban <strong>de</strong> una muestra limitada asociada a<br />

un conjunto concreto <strong>de</strong> teléfonos y había que exten<strong>de</strong>rlo a la <strong>de</strong>manda total <strong>de</strong> tráfico.<br />

Pese a los buenos resultados logrados, los anteriores estudios no aprovechan la ventaja <strong>de</strong> la alta<br />

penetración <strong>de</strong> la telefonía celular en la sociedad actual, puesto que manejan solamente una<br />

pequeña muestra <strong>de</strong>l total <strong>de</strong> teléfonos existentes en la zona. En un caso utilizan sólo datos <strong>de</strong><br />

aquellos que efectúan llamadas y en otro, datos <strong>de</strong> un conjunto exclusivo <strong>de</strong> teléfonos capaces<br />

<strong>de</strong> transmitir periódicamente su posición a un servidor central. Sería <strong>de</strong> vital importancia<br />

aumentar el tamaño <strong>de</strong> esa muestra <strong>de</strong> las que se <strong>de</strong>rivan las matrices. Esto supone utilizar datos<br />

<strong>de</strong>l conjunto <strong>de</strong> teléfonos que estén encendidos <strong>de</strong> un operador, <strong>de</strong> los cuales se conoce en todo<br />

momento el LA en el que se encuentran.<br />

Este es el objetivo perseguido en el trabajo elaborado por Caceres et al. (2007). Su investigación<br />

planteó la obtención directa <strong>de</strong> una matriz O–D consi<strong>de</strong>rando como “zonas <strong>de</strong> transporte” <strong>de</strong> la<br />

matriz el conjunto <strong>de</strong> áreas <strong>de</strong> localización (LA), <strong>de</strong>finidas por una red GSM, existentes sobre la<br />

región a estudiar. Debido a que la gestión <strong>de</strong> movilidad <strong>de</strong> una red GSM obliga a que el terminal<br />

notifique al sistema su posición cuando entra en un nuevo LA (proceso LU, Location Update),<br />

junto a los reportes periódicos <strong>de</strong> posición (PLU), los teléfonos móviles encendidos siempre<br />

proporcionarán información actualizada <strong>de</strong> las LAs por las que han pasado. El análisis <strong>de</strong> los<br />

registros efectuados por cada teléfono en un intervalo <strong>de</strong> tiempo dado permitió conocer el LA <strong>de</strong><br />

origen (registro inicial) y <strong>de</strong> <strong>de</strong>stino (registro final) asociado al viaje que ha seguido el vehículo<br />

que transportaba el teléfono. A<strong>de</strong>más, este tipo <strong>de</strong> análisis <strong>de</strong> registros logró distinguir entre<br />

viajes válidos, pares O–D <strong>de</strong> la matriz estudiada, <strong>de</strong>l resto <strong>de</strong> viajes <strong>de</strong> paso, los cuales son<br />

viajes que se iniciaron o terminaron en orígenes o <strong>de</strong>stinos distintos a los que conforman la<br />

matriz. La validación <strong>de</strong> la metodología se realizó mediante un simulador <strong>de</strong> tráfico, generando<br />

bases <strong>de</strong> datos HLR y VLR ficticias con los registros <strong>de</strong> localización. Asimismo, dado que los<br />

valores estimados venían expresados en términos <strong>de</strong> movilidad <strong>de</strong> teléfonos, este trabajo<br />

implementó un algoritmo para exten<strong>de</strong>r datos <strong>de</strong> teléfonos encendidos <strong>de</strong> un operador concreto<br />

al conjunto global <strong>de</strong> vehículos mediante un factor <strong>de</strong> corrección. Entonces, tras comparar la<br />

matriz O–D <strong>de</strong> viajes “real” y estimada, los reducidos niveles <strong>de</strong> error mostraron la posibilidad<br />

<strong>de</strong> obtener una matriz correlada con los viajes realizados en un área extensa <strong>de</strong> estudio. Sin<br />

embargo, dado que los LA abarcan áreas <strong>de</strong> gran dimensión, lógicamente existirán<br />

<strong>de</strong>splazamientos <strong>de</strong>ntro <strong>de</strong> ellas, <strong>de</strong>nominados viajes intra–zonales, que no podrían ser


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 41<br />

<strong>de</strong>tectados analizando exclusivamente registros generados mediante procesos LU (cuyo<br />

resolución más fina es a nivel <strong>de</strong> LA).<br />

Un <strong>de</strong>sarrollo intermedio entre las dos i<strong>de</strong>as anteriores fue el propuesto por Pan et al. (2006), el<br />

cual fue validado en la ciudad <strong>de</strong> Shanghai. En el citado trabajo se combinó la alta penetración<br />

<strong>de</strong> la telefonía móvil, empleando teléfonos que simplemente están encendidos, y la precisión a<br />

nivel <strong>de</strong> celda para confeccionar una distribución <strong>de</strong> viajes. Al ejecutar el proceso <strong>de</strong> LU<br />

(off/on, cambio LA o registro periódico en ausencia <strong>de</strong> actividad telefónica), se notifica a la red<br />

el LA en el que se encuentra junto con la celda <strong>de</strong>ntro <strong>de</strong> ese LA. Pero la posición <strong>de</strong> un<br />

terminal no sólo se actualiza cada vez que se ejecuta un proceso <strong>de</strong> LU, sino cuando el teléfono<br />

registra algún tipo <strong>de</strong> actividad (realice una llamada o envíe un sms). Empleando ambos<br />

conjuntos <strong>de</strong> datos se logra fusionar las ventajas <strong>de</strong> utilizar una muestra extensa (cualquier<br />

teléfono encendido) y precisión a nivel <strong>de</strong> celda. Sin embargo, se pier<strong>de</strong> cierta información <strong>de</strong><br />

movilidad asociada al hecho <strong>de</strong> que un teléfono encendido pue<strong>de</strong> moverse por las celdas <strong>de</strong> un<br />

LA sin que que<strong>de</strong> constancia <strong>de</strong> su paso por ninguna <strong>de</strong> ellas, ya que no se precisa ejecutar un<br />

proceso <strong>de</strong> LU mientras no cambie <strong>de</strong> LA o registre actividad telefónica (llamadas, sms…); no<br />

obstante el registro periódico PLU suaviza este inconveniente. Para obtener la distribución <strong>de</strong><br />

viajes, la metodología utiliza dos escenarios <strong>de</strong> tiempo basados en las características <strong>de</strong> las<br />

zonas que conforman la matriz. Por ejemplo, los viajeros permanecen en casa <strong>de</strong>s<strong>de</strong> las 10:30<br />

p.m. hasta las 6:30 a.m. <strong>de</strong>l día siguiente (escenario temporal A) y estarán en sus lugares <strong>de</strong><br />

trabajo <strong>de</strong>s<strong>de</strong> las 9:30a.m. hasta las 11:30a.m. (escenario temporal B) <strong>de</strong> ese nuevo día.<br />

Analizando los registros <strong>de</strong> localización generados por los teléfonos, una tabla <strong>de</strong> distribución<br />

<strong>de</strong> viajes es generada computando teléfonos que han permanecido en la zona i (e.g. casa)<br />

durante el escenario temporal A y están en la zona j (e.g. trabajo) durante el escenario temporal<br />

B. El almacenamiento propio <strong>de</strong> los sistemas <strong>de</strong> telefonía, tanto <strong>de</strong> la localización como los<br />

instantes <strong>de</strong> actualización, permite que los flujos O–D puedan ser obtenidos <strong>de</strong> una forma<br />

sencilla mediante un análisis <strong>de</strong> dicha información.<br />

En cualquier caso, tanto para matrices obtenidas mediante llamadas como con procesos LU, la<br />

principal ventaja es que los datos son recopilados directamente <strong>de</strong> flujo <strong>de</strong> tráfico y no <strong>de</strong><br />

procesos <strong>de</strong> encuestación (encuestas domiciliarias, telefónicas, reconocimiento matrículas, etc.)<br />

los cuales son procesos costosos y suelen dar lugar a resultados con ciertos sesgos. Sin embargo,<br />

ambos procesos presentan como <strong>de</strong>sventaja la pobre precisión obtenida en la localización. Los<br />

datos <strong>de</strong> posición <strong>de</strong>rivados <strong>de</strong> la telefonía móvil vienen expresados en términos <strong>de</strong> celdas y LA<br />

en la que se encuentran. El tamaño <strong>de</strong> esas zonas, aunque varía <strong>de</strong> entornos urbanos o rurales,<br />

suele ser gran<strong>de</strong>, <strong>de</strong> modo que es normal que muchos <strong>de</strong> los viajes ocurran <strong>de</strong>ntro <strong>de</strong> dichas


42 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

áreas (viajes intra–zonales). En base al razonamiento anterior, ambas metodologías pue<strong>de</strong>n ser<br />

consi<strong>de</strong>radas como válidas para obtener una matriz previa para, posteriormente ajustarla con<br />

otra información mediante métodos tradicionales, pero no para ser usada directamente como<br />

matriz <strong>de</strong> viajes fiable.<br />

3.3 VOLUMEN<br />

Se <strong>de</strong>nomina volumen <strong>de</strong> tráfico Q al número <strong>de</strong> vehículos que pasan por un punto o sección<br />

transversal <strong>de</strong> una vía por unidad <strong>de</strong> tiempo. Las unida<strong>de</strong>s más usadas son la hora y el día,<br />

<strong>de</strong>finiendo el volumen horario [veh/h] y volume diario [veh/día], respectivamente. Las<br />

distribuciones temporales <strong>de</strong> los volúmenes <strong>de</strong> tráfico se <strong>de</strong>ben a diferentes estilos y forma <strong>de</strong><br />

vida, los cuales <strong>de</strong>terminan patrones <strong>de</strong> viaje basados en el tiempo (ciertas épocas <strong>de</strong>l año, horas<br />

específicas <strong>de</strong>l día, etc.). Estos volúmenes pue<strong>de</strong>n ser entendidos como la utilización <strong>de</strong> la<br />

vialidad por la <strong>de</strong>manda <strong>de</strong> transporte. De modo que los estudios <strong>de</strong> volúmenes se realizan con<br />

el propósito <strong>de</strong> obtener información sobre el movimiento <strong>de</strong> vehículos sobre puntos o secciones<br />

específicas <strong>de</strong>ntro <strong>de</strong> una red viaria, proporcionando una <strong>de</strong>scripción intuitiva <strong>de</strong>l<br />

comportamiento dinámico <strong>de</strong>l tráfico.<br />

Para la medición <strong>de</strong> esta magnitud suelen utilizarse los aforos. Un aforo mi<strong>de</strong> la cantidad <strong>de</strong><br />

vehículos que transitan por un <strong>de</strong>terminado punto o sección <strong>de</strong>l viario. Tradicionalmente, estos<br />

aforos son un tipo <strong>de</strong> información que se recoge <strong>de</strong> forma automática en un conjunto <strong>de</strong> puntos<br />

asociados a tramos <strong>de</strong>l viario. La medición <strong>de</strong> este parámetro <strong>de</strong> tráfico obliga por tanto a<br />

instalar elementos adicionales en las vías (espiras, cámaras, etc…). Este volumen <strong>de</strong> paso <strong>de</strong><br />

vehículos varía según la movilidad <strong>de</strong> la población, categoría <strong>de</strong> la vía, temporalidad, etc. Para<br />

conocer <strong>de</strong> un modo preciso y continuo las características <strong>de</strong>l tráfico <strong>de</strong> vehículos que circula<br />

por la red viaria sería necesario observar todas las vías <strong>de</strong> manera casi permanente, lo cual<br />

implicaría disponer <strong>de</strong> una infraestructura consi<strong>de</strong>rable <strong>de</strong> elementos medidores <strong>de</strong>l aforo. Así<br />

pues, surge la necesidad <strong>de</strong> nuevos medios que permitan caracterizar el tráfico <strong>de</strong> un modo<br />

rápido, preciso y permanente, sin excesivo coste.<br />

La telefonía móvil constituye una alternativa real, plausible y competitiva para conseguir esta<br />

información. En contraste con los sensores fijos, los teléfonos móviles proporcionan<br />

información respecto a comportamiento <strong>de</strong>l tráfico sobre cualquier zona don<strong>de</strong> exista cobertura<br />

telefónica, sin necesidad <strong>de</strong> un <strong>de</strong>spliegue adicional <strong>de</strong> infraestructura. En estos casos, el<br />

volumen estaría asociado al paso <strong>de</strong> teléfonos por un <strong>de</strong>terminado punto o zona <strong>de</strong> la red, en<br />

lugar <strong>de</strong> vehículos. Para ello existen ciertos eventos y procesos en GSM relacionados con la


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 43<br />

gestión <strong>de</strong> movilidad que permiten <strong>de</strong>tectar el cambio <strong>de</strong> zonas, bien a nivel <strong>de</strong> celdas<br />

(handover) o bien a nivel <strong>de</strong> áreas <strong>de</strong> localización (proceso LU).<br />

Analizando la topología <strong>de</strong> la red junto con la distribución <strong>de</strong> celdas y áreas <strong>de</strong> localización es<br />

posible asociar fronteras entre dichas zonas con secciones <strong>de</strong> vía en las que es posible<br />

monitorizar el paso <strong>de</strong> teléfonos. En tales fronteras se consi<strong>de</strong>rará que existe una especie <strong>de</strong><br />

aforo “virtual” para la observación <strong>de</strong>l paso <strong>de</strong> entida<strong>de</strong>s por las vías como hacen los aforos<br />

tradicionales. Con ello, cada vez que un teléfono cambie <strong>de</strong> celda durante una llamada<br />

(handover) o cambie <strong>de</strong> LA mientras esté encendido (proceso LU), se podrá consi<strong>de</strong>rar que ha<br />

pasado por alguna <strong>de</strong> las vías monitorizada por un aforo “virtual” localizado en la frontera<br />

correspondiente. El número <strong>de</strong> vías que atraviesen la frontera, el cual <strong>de</strong>termina la precisión <strong>de</strong><br />

la medida <strong>de</strong>l aforo, <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la extensión <strong>de</strong> la zona fronteriza. En el caso <strong>de</strong> un aforo<br />

“virtual” que monitorice el paso <strong>de</strong> una celda a otra, el número <strong>de</strong> vías observadas suele ser<br />

menor que en caso <strong>de</strong> uno que monitorice el paso <strong>de</strong> un área <strong>de</strong> localización a otro puesto que<br />

un LA compren<strong>de</strong> una extensión <strong>de</strong> terreno mayor formado por varias celdas.<br />

En los últimos años se han publicado diferentes estudios relacionados con esta i<strong>de</strong>a. Uno <strong>de</strong><br />

ellos es el <strong>de</strong>sarrollado por Thiessenhusen et al. (2006) <strong>de</strong>l DLR utilizando datos suministrados<br />

por Vodafone. La investigación utilizó el handover como evento para <strong>de</strong>tectar el paso <strong>de</strong><br />

teléfonos <strong>de</strong> un cierto operador por aforos “virtuales” ubicados en las fronteras entre dos celdas.<br />

Durante un handover, se almacena una serie <strong>de</strong> parámetros asociados, como celdas implicadas o<br />

instante en el que se produce. El análisis <strong>de</strong> esos parámetros permitió <strong>de</strong>tectar el tránsito por la<br />

frontera correspondiente. Los resultados publicados mostraron cómo ese flujo <strong>de</strong> teléfonos<br />

(llamadas) está estrechamente relacionado con el flujo <strong>de</strong> vehículos medido por <strong>de</strong>tectores<br />

instalados sobre los mismos puntos en la red. En la Figura 3-1 se comparan ambos valores a lo<br />

largo <strong>de</strong> un día. Se aprecia que existen los picos típicos asociados a horas puntas tanto por la<br />

mañana como por la tar<strong>de</strong>, mostrando la influencia <strong>de</strong> los hábitos telefónicos (horarios típicos<br />

<strong>de</strong> llamadas) en los cambios <strong>de</strong> flujo <strong>de</strong> vehículos típicos.<br />

No obstante, con el uso <strong>de</strong>l handover sólo se monitoriza el paso <strong>de</strong> teléfonos que tengan una<br />

comunicación activa (p.ej., llamada). De este modo, la muestra <strong>de</strong> terminales <strong>de</strong> las que se<br />

obtienen datos es reducida e interesaría ampliar su tamaño a fin <strong>de</strong> conseguir una muestra más<br />

representativa <strong>de</strong>l conjunto total <strong>de</strong> vehículos. Por ello, existe otra alternativa <strong>de</strong> monitorización<br />

<strong>de</strong> tráfico por una frontera pero, en este caso, a nivel <strong>de</strong> área <strong>de</strong> localización.


44 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

flow (veh/h)<br />

8000<br />

6000<br />

4000<br />

2000<br />

0<br />

Mobil phone calls - northbound<br />

flow (loop data)<br />

GSM counts<br />

0 5 10 15 20<br />

time (h)<br />

80<br />

60<br />

40<br />

20<br />

0<br />

counts/h<br />

flow (veh/h)<br />

8000<br />

6000<br />

4000<br />

2000<br />

0<br />

Mobil phone calls - southbound<br />

flow (loop data)<br />

GSM counts<br />

0 5 10 15 20<br />

time (h)<br />

Figura 3-1: Flujo (rojo) y número <strong>de</strong> llamadas <strong>de</strong> teléfonos (ver<strong>de</strong>) en función <strong>de</strong>l tiempo.<br />

Izquierda: northbound (<strong>de</strong>s<strong>de</strong> ciudad), <strong>de</strong>recha: southbound (hacia ciudad). Todos los datos son<br />

promediados sobre intervalos <strong>de</strong> 15 minutos. (Thiessenhusen et al., 2006)<br />

El trabajo presentado por Caceres et al. (2007) utiliza este criterio. Para validar sus algoritmos,<br />

no utilizó datos reales <strong>de</strong> un operador sino una herramienta conjunta que integraba un simulador<br />

<strong>de</strong> tráfico vehicular junto con un módulo específico para mo<strong>de</strong>lar la gestión <strong>de</strong> movilidad usada<br />

en una red GSM sobre un conjunto <strong>de</strong> teléfonos asociados a vehículos. Con ello se elaboraban<br />

unas bases <strong>de</strong> datos HLR y VLR ficticias con registros <strong>de</strong> localización. Como ya se ha<br />

comentado, cuando el teléfono está simplemente encendido, el teléfono notifica su nueva<br />

posición cuando entra en un nuevo LA (proceso LU), quedando reflejado el tránsito entre ese<br />

par <strong>de</strong> LA. En su investigación, se consi<strong>de</strong>ró la existencia <strong>de</strong> aforos “virtuales” sobre secciones<br />

<strong>de</strong> vías que coincidían con las fronteras entre áreas <strong>de</strong> localización. Aunque, dado que el paso <strong>de</strong><br />

un LA a otro se efectúa por una celda concreta <strong>de</strong>l LA <strong>de</strong>stino, y esa información <strong>de</strong> celda <strong>de</strong><br />

entrada es conocida (cuando se ejecuta el proceso <strong>de</strong> LU se indica tanto el LA como la celda<br />

<strong>de</strong>ntro <strong>de</strong> ese LA), realmente se observarán fronteras entre celdas <strong>de</strong> LA contiguos por los que<br />

se va a efectuar el tránsito. En base a ello, el aforo virtual monitorizaría el paso <strong>de</strong>s<strong>de</strong> un LA a<br />

otro por una celda concreta, logrando una resolución a nivel <strong>de</strong> celda para la i<strong>de</strong>ntificación <strong>de</strong> la<br />

vía por la que circuló el teléfono (Figura 3-2).<br />

Figura 3-2: Ejemplo <strong>de</strong> ubicación <strong>de</strong> aforo virtual.<br />

80<br />

60<br />

40<br />

20<br />

0<br />

counts/h


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 45<br />

Para validar esta i<strong>de</strong>a se analizaron unas bases <strong>de</strong> datos generadas con simuladores buscando,<br />

para cada teléfono, los registros asociados a cambios <strong>de</strong> área <strong>de</strong> localización. Conociendo ese<br />

registro (instante <strong>de</strong> tiempo, nuevo LA y celda) junto con el LA anterior, y observando si<br />

pertenece a una frontera <strong>de</strong> interés, se conocería el instante <strong>de</strong> paso por dicha frontera, se logró<br />

computar el paso <strong>de</strong> un teléfono por el aforo virtual correspondiente. Este flujo se correspon<strong>de</strong><br />

con teléfonos encendidos <strong>de</strong> un único operador, por lo que es extendido a un conjunto <strong>de</strong><br />

vehículos equivalente mediante algoritmos <strong>de</strong> ajuste apropiados. La Figura 3-3 compara el flujo<br />

real y el estimado tras el ajuste que se obtuvo para un aforo virtual típico.<br />

Flow [ veh / h ]<br />

2500<br />

2000<br />

1500<br />

1000<br />

500<br />

0<br />

loop data<br />

mobile phones counts adjusted to vehicles<br />

2:00 3:00 4:00 6:00 8:00 9:00 10:00 12:00 14:00 15:00 16:00 18:00 20:00 21:00 22:00 23:59<br />

Time [ hh : mm ]<br />

Figura 3-3: Comparación entre flujo real por un aforo virtual y el estimado tras el ajuste.<br />

(Caceres et al., 2006).<br />

Los resultados mostraron alta correlación entre valores reales medidos por un <strong>de</strong>tector y los<br />

estimados con teléfonos mediante datos proce<strong>de</strong>ntes <strong>de</strong> procesos <strong>de</strong> LU por cambiar <strong>de</strong> LA,<br />

<strong>de</strong>bido a que la mayoría <strong>de</strong> los vehículos (teléfonos a bordo) son contabilizados. Cualquier<br />

teléfono encendido notifica a la red el cambio <strong>de</strong> LA y, por tanto, ese paso será <strong>de</strong>tectado por el<br />

aforo “virtual”. Esta es una <strong>de</strong> las ventajas que esta alternativa presenta con respecto al<br />

handover, consi<strong>de</strong>rar como muestra el conjunto <strong>de</strong> todos los teléfonos encendidos <strong>de</strong> un<br />

operador y no exclusivamente los que están haciendo handover (llamada al pasar <strong>de</strong> una celda a<br />

otra). Asimismo, el uso <strong>de</strong> un nivel <strong>de</strong> agregación en términos <strong>de</strong> LA no supone per<strong>de</strong>r<br />

precisión respecto al handover (nivel <strong>de</strong> celda). Esto se <strong>de</strong>be a que un LA es una agrupación <strong>de</strong><br />

celdas y, por tanto, la entrada en un nuevo LA se efectúa por una <strong>de</strong> esas celda. En la Figura<br />

3-4, un proceso <strong>de</strong> LU ejecutado al pasar <strong>de</strong>s<strong>de</strong> el LA1 al LA2 no permitiría distinguir si el paso<br />

ha sido por el punto 1 o el 3 <strong>de</strong>bido a que ambos puntos pertenecen a la celda por la que se entra<br />

al LA2 (celda 3). En cambio, un proceso <strong>de</strong> LU ejecutado al pasar en el otro sentido (<strong>de</strong>s<strong>de</strong> el<br />

LA2 al LA1) sí que permitiría i<strong>de</strong>ntificar si ha ocurrido por el punto 1 o el 3, puesto que los<br />

puntos pertenecen a celdas diferentes para la entrada al LA1 (celda 1 y celda 2,<br />

respectivamente). En esos casos, se aprecia que la precisión es la misma que con el handover.<br />

No obstante, esta alternativa presenta una <strong>de</strong>sventaja respecto al handover ya que las fronteras


46 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

entre LAs son espacialmente menos frecuentes que entre celdas y, por tanto, se dispondrán <strong>de</strong><br />

menos aforos “virtuales” <strong>de</strong> ese tipo.<br />

LA 1<br />

celda 1<br />

3.4 VELOCIDAD<br />

1<br />

2<br />

celda 3<br />

3<br />

celda 2<br />

Figura 3-4: Representación <strong>de</strong> un aforo “virtual”.<br />

LA 2<br />

La velocidad es uno <strong>de</strong> los parámetros más estudiados para evaluar la calidad <strong>de</strong>l servicio <strong>de</strong><br />

una vía según la <strong>de</strong>manda que soporta, especialmente en entornos urbanos. Muestra la relación<br />

entre el espacio recorrido por un vehículo y la unidad <strong>de</strong> tiempo (km/h o m/s). La velocidad se<br />

suele medir en un punto o tramo corto <strong>de</strong> una vía para <strong>de</strong>terminar la rapi<strong>de</strong>z con que pasan los<br />

vehículos (flui<strong>de</strong>z <strong>de</strong>l tráfico). La velocidad pue<strong>de</strong> ser <strong>de</strong>finida según diferentes enfoques:<br />

velocidad instantánea, velocidad media temporal, velocidad media espacial o velocidad <strong>de</strong><br />

recorrido, entre otros. La velocidad <strong>de</strong> cada vehículo sufre variaciones durante un viaje ya que<br />

<strong>de</strong>pen<strong>de</strong> <strong>de</strong> muchos factores, como la categoría <strong>de</strong> la vía (urbana, autovía…), ancho <strong>de</strong> la vía o<br />

número <strong>de</strong> carriles por sentido <strong>de</strong> circulación. A<strong>de</strong>más existen otros factores variables que<br />

también influyen, como climatología, temporalidad (hora punta, día festivo…). Des<strong>de</strong> el punto<br />

<strong>de</strong> vista <strong>de</strong> tráfico, conocer la velocidad <strong>de</strong> un vehículo en un momento dado es poco<br />

representativo y resulta más eficiente trabajar con velocida<strong>de</strong>s medias <strong>de</strong> recorrido. Para ello, se<br />

utilizan diferentes alternativas como el empleo <strong>de</strong> coche flotante (vehículos equipados con<br />

sensores que se sumergen en la circulación <strong>de</strong> una vía y capturan información <strong>de</strong> tráfico) o<br />

<strong>de</strong>tectores en puntos fijos que realizan las mediciones mediante i<strong>de</strong>ntificación <strong>de</strong> vehículos.<br />

Ambas alternativas suponen un gasto adicional <strong>de</strong> instalación y mantenimiento <strong>de</strong> los equipos.<br />

Bajo el enfoque <strong>de</strong> la telefonía, Lovell (2001) comenzó e investigar sobre la viabilidad <strong>de</strong><br />

mediciones <strong>de</strong> velocidad <strong>de</strong> vehículos usando el seguimiento anónimo <strong>de</strong> llamadas proce<strong>de</strong>ntes<br />

<strong>de</strong> teléfonos móviles. Para ello utilizó métodos <strong>de</strong> simulación que incluían algoritmos <strong>de</strong>


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 47<br />

posicionamiento para diferentes técnicas <strong>de</strong> localización (AOA, TDOA), tamaños <strong>de</strong> muestra,<br />

media y varianza <strong>de</strong> velocida<strong>de</strong>s <strong>de</strong> vehículos o incluso distancia. Los resultados mostraron que<br />

un sistema <strong>de</strong> este tipo podía clasificar las velocida<strong>de</strong>s <strong>de</strong> los vehículos que transportaban los<br />

teléfonos, así como el grado <strong>de</strong> congestión conforme a tres niveles: bajo, medio, y alto. Este<br />

trabajo necesitó la incorporación <strong>de</strong> módulos adicionales a los que existen comúnmente en las<br />

re<strong>de</strong>s <strong>de</strong> telefonía para aumentar la precisión <strong>de</strong> localización con la que efectuar los cálculos.<br />

Algo similar presentó Ygnace (2001) en el informe <strong>de</strong>l proyecto STRIP. Este proyecto instaló<br />

elementos sobre una vía a estudiar para monitorizar los interfaces radio Abis/A. Esto permitía<br />

i<strong>de</strong>ntificar ciertos mensajes <strong>de</strong> señalización intercambiados entre un terminal encendido y la red<br />

para conseguir una estimación temporal <strong>de</strong> la posición <strong>de</strong>l terminal mediante técnicas <strong>de</strong> re<strong>de</strong>s<br />

neuronales (precisión: 100–150m). Esta estimación, junto con ciertos algoritmos e información<br />

histórica en bases <strong>de</strong> datos, servían para i<strong>de</strong>ntificar correctamente la posición <strong>de</strong>l vehículo sobre<br />

la vía que lo soportaba y así hacer predicciones <strong>de</strong> velocidad y tiempos <strong>de</strong> viaje. Los resultados<br />

<strong>de</strong> la estimación fueron contrastados con los medidos por <strong>de</strong>tectores instalados en la vía<br />

analizada, mostrando la relación entre ambas cantida<strong>de</strong>s. Estas estimaciones eran menos<br />

precisas en secciones urbanas <strong>de</strong> la vía <strong>de</strong>bido al posicionamiento erróneo <strong>de</strong> usuarios que<br />

realmente estaban próximos a la vía pero no sobre ella. A pesar <strong>de</strong> ello, los resultados (Figura<br />

3-5) mostraron que la tecnología <strong>de</strong> monitorización <strong>de</strong>l interfaz Abis/A pue<strong>de</strong> consi<strong>de</strong>rarse<br />

viable para segmentos <strong>de</strong> vía interurbanos; aunque resaltó la necesidad <strong>de</strong> una mejora <strong>de</strong> los<br />

algoritmos <strong>de</strong> posicionamiento, especialmente para aplicaciones enfocadas a su uso en tiempo<br />

real.<br />

Mean speed in km/hour<br />

160<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

23:00:00<br />

22:00:00<br />

21:00:00<br />

20:00:00<br />

19:00:00<br />

18:00:00<br />

17:00:00<br />

16:00:00<br />

15:00:00<br />

14:00:00<br />

13:00:00<br />

12:00:00<br />

11:00:00<br />

10:00:00<br />

09:00:00<br />

08:00:00<br />

07:00:00<br />

06:00:00<br />

05:00:00<br />

04:00:00<br />

03:00:00<br />

02:00:00<br />

01:00:00<br />

00:00:00<br />

time distribution<br />

probe speed N.bound<br />

segment<br />

loop speed N.bound<br />

segment<br />

Average speed in km/h<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

22:48:00.00<br />

21:36:00.00<br />

20:24:00.00<br />

19:12:00.00<br />

18:00:00.00<br />

16:47:59.99<br />

15:36:00.00<br />

14:24:00.00<br />

13:12:00.00<br />

12:00:00.00<br />

10:48:00.00<br />

9:36:00.00<br />

8:23:59.99<br />

7:12:00.00<br />

6:00:00.00<br />

4:48:00.00<br />

3:36:00.00<br />

2:24:00.00<br />

1:12:00.00<br />

0:00:00.00<br />

time distribution on the urban freeway<br />

probe speeds<br />

N.bound<br />

loop speeds<br />

N.bound<br />

Figura 3-5: Promedio velocida<strong>de</strong>s: teléfonos vs. <strong>de</strong>tectores Inter–Ciudad (arriba) e Intra–Ciudad<br />

(abajo) Motorway Northbound. (Ygnace, 2001)


48 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

En general, los trabajos anteriores necesitaron la instalación <strong>de</strong> elementos adicionales en la red<br />

y/o modificación <strong>de</strong> los terminales. Sin embargo, una <strong>de</strong> las principales ventajas <strong>de</strong>l uso <strong>de</strong> la<br />

telefonía celular es que no es necesario llevar a cabo dichas modificaciones para obtener<br />

parámetros <strong>de</strong> tráfico viables. El trabajo presentado por Thiessenhusen et al. (2006) <strong>de</strong>l DLR<br />

con datos <strong>de</strong> Vodafone pone <strong>de</strong> manifiesto esta afirmación. En el citado se empleó información<br />

proce<strong>de</strong>nte <strong>de</strong> los handover ejecutados para medir ciertos parámetros <strong>de</strong> tráfico como la<br />

velocidad. El handover se produce cuando un teléfono pasa <strong>de</strong> una celda a otra mientras<br />

mantiene una comunicación activa (p.ej., llamada), produciéndose una conmutación <strong>de</strong> la<br />

llamada a la estación base que gestiona esa nueva celda. Ese instante en el que se produce el<br />

handover queda registrado, junto con otros parámetros como las celdas implicadas en él. Si la<br />

llamada es suficientemente larga como para que la nueva celda a la que se acaba <strong>de</strong> entrar sea<br />

atravesada completamente, se dispondrá <strong>de</strong> información temporal <strong>de</strong> entrada (handover inicial)<br />

y salida (handover final) <strong>de</strong> dicha celda. Estos tiempos, junto con las ubicaciones <strong>de</strong> las<br />

fronteras entre celdas (conocidas por el operador), permiten realizar una estimación <strong>de</strong><br />

velocidad media para la sección <strong>de</strong> vía que atraviesa la celda comprendida entre ambas fronteras<br />

don<strong>de</strong> existió handover. Esto será viable en aquellos casos en los que la i<strong>de</strong>ntificación <strong>de</strong> la vía<br />

<strong>de</strong>ntro <strong>de</strong> la celda sea única y la duración <strong>de</strong> la llamada sea la suficiente para que se produzca un<br />

doble handover. La Figura 3-6 compara las mediciones <strong>de</strong> velocidad tomadas con tres fuentes<br />

diferentes: datos <strong>de</strong> teléfonos GSM, <strong>de</strong>tectores y FDC tomados por GPS instalados en taxis.<br />

Speed (km/h)<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0<br />

Southbound, A9, 2003-07-18<br />

GSM<br />

Loop<br />

FCD<br />

5 10 15 20<br />

Time (h)<br />

Figura 3-6: Velocidad en función <strong>de</strong>l tiempo obtenidos <strong>de</strong> datos GSM (+), <strong>de</strong>tectores (�), FCD (×)<br />

(Thiessenhusen et al., 2006).<br />

El principal problema <strong>de</strong> esta metodología es que la muestra sólo consi<strong>de</strong>ra a aquellos teléfonos<br />

que efectúan llamadas lo suficientemente largas como para atravesar la celda completamente, lo<br />

cual es poco frecuente. A<strong>de</strong>más, la i<strong>de</strong>ntificación <strong>de</strong> la ruta seguida por el teléfono–vehículo


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 49<br />

pue<strong>de</strong> ser problemática <strong>de</strong>bido a la existencia <strong>de</strong> varias posibles, especialmente en entornos<br />

urbanos. Aun así, el reducido coste <strong>de</strong> implantación <strong>de</strong> un sistema <strong>de</strong> este tipo permite<br />

consi<strong>de</strong>rarlo como alternativa viable para la <strong>de</strong>terminación <strong>de</strong> velocidad.<br />

Una metodología similar presentaron Birle et al. (2006) en referencia al proyecto<br />

TrafficOnLine, que también consi<strong>de</strong>ró el handover como principio básico para estimar<br />

parámetros <strong>de</strong> tráfico como velocidad (Figura 3-7). Como se ha comentado, el método es<br />

preciso mientras sea posible i<strong>de</strong>ntificar la sección <strong>de</strong> vía (ruta) que conecta ese par <strong>de</strong> zonas<br />

don<strong>de</strong> se producen los handovers. En general, esto ocurre en autovías o carreteras principales en<br />

las que no existen otras vías próximas con las que confundir la i<strong>de</strong>ntificación.<br />

End of Call at 18:59:19<br />

Velocity:<br />

23 m/s = 82.5 km/h<br />

Start Call at 18:59:07<br />

Figura 3-7: Concepto <strong>de</strong> estimación <strong>de</strong> velocidad usando doble–handover (Birle et al., 2006).<br />

Sin embargo, en entornos urbanos suelen existir diferentes rutas para conectar zonas don<strong>de</strong> se<br />

producen los handover. Por lo que esa i<strong>de</strong>ntificación <strong>de</strong> vía es más problemática y no es<br />

suficiente el concepto típico <strong>de</strong> handover como fuente <strong>de</strong> información. Para solventar ese<br />

problema en áreas urbanas, propusieron utilizar datos proce<strong>de</strong>ntes <strong>de</strong> handovers en zonas don<strong>de</strong><br />

éstos se producen <strong>de</strong>bido a un solapamiento <strong>de</strong> cobertura causado por la presencia <strong>de</strong> edificios,<br />

las cuales son más pequeñas y excepcionales <strong>de</strong>ntro <strong>de</strong> una celda (Figura 3-8 b).<br />

Con ello se consigue en áreas urbanas una i<strong>de</strong>ntificación <strong>de</strong> localizaciones únicas <strong>de</strong>ntro <strong>de</strong> una<br />

celda más viable que con el solapamiento típico (Figura 3-8 a). Sin embargo, este método<br />

requiere información adicional <strong>de</strong>l nivel <strong>de</strong> potencia <strong>de</strong> señal <strong>de</strong> las celdas vecinas, es <strong>de</strong>cir,<br />

informes <strong>de</strong> medida con los que i<strong>de</strong>ntificar la ruta tomada por el terminal móvil al cruzar la<br />

celda. Los resultados conseguidos mejoraron en gran medida la precisión en la estimación <strong>de</strong><br />

velocidad para entornos urbanos, pese a requerir un tratamiento más exhaustivo <strong>de</strong> los datos.


50 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

(a)<br />

(b)<br />

Figura 3-8: Zona handover (a) con solapamiento típico y (b) con solapamiento <strong>de</strong>bido a edificios<br />

(Birle et al., 2006).<br />

3.5 TIEMPOS DE VIAJE<br />

La <strong>de</strong>terminación <strong>de</strong> tiempos <strong>de</strong> recorrido, junto con la <strong>de</strong> velocidad, resulta imprescindible en<br />

los estudios <strong>de</strong> planificación <strong>de</strong> una red viaria. Se <strong>de</strong>nomina tiempo <strong>de</strong> recorrido al tiempo que<br />

invierte cada vehículo en <strong>de</strong>splazarse entre dos puntos fijos. Estos tiempos son medidos en<br />

tramos <strong>de</strong> vía <strong>de</strong> cierta longitud para conocer la calidad <strong>de</strong>l servicio que prestan así como sus<br />

variaciones a lo largo <strong>de</strong> ellos. El modo <strong>de</strong> obtención <strong>de</strong> estos tiempos varía según el tramo<br />

observado. En tramos <strong>de</strong> longitud media y/o corta se utilizan, normalmente, equipos <strong>de</strong><br />

observadores que anotan el instante en que entra y sale <strong>de</strong>l tramo cada vehículo, distinguiéndolo<br />

mediante el número <strong>de</strong> placa, tipo <strong>de</strong> vehículo, etc. En cambio, para tramos <strong>de</strong> mayor longitud,<br />

se suele medir recorriendo varias veces dicho tramo con un vehículo y hacer mediciones <strong>de</strong><br />

tiempo mediante la técnica <strong>de</strong> vehículo flotante. La incorporación <strong>de</strong> nuevas tecnologías está<br />

dotando <strong>de</strong> cierto automatismo a los procesos <strong>de</strong> medición con el empleo <strong>de</strong> cámaras y técnicas<br />

<strong>de</strong> reconocimiento <strong>de</strong> imágenes; aunque la estimación final continúa siendo un proceso costoso.<br />

Lógicamente, el concepto <strong>de</strong> tiempo está estrechamente relacionado con la velocidad, por ello<br />

cualquiera <strong>de</strong> los métodos basados en telefonía móvil <strong>de</strong>scritos en el apartado anterior pue<strong>de</strong><br />

emplearse para la estimación <strong>de</strong> tiempos <strong>de</strong> viaje en la sección <strong>de</strong> vía que discurre por una<br />

celda. En general, el concepto <strong>de</strong> doble–handover es el más extendido para la estimación <strong>de</strong><br />

tiempos y velocida<strong>de</strong>s. Tal es el caso <strong>de</strong>l trabajo presentado por Linauer y Leihs (2003), en el


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 51<br />

cual se i<strong>de</strong>ntificaron las zonas don<strong>de</strong> existía el típico solapamiento <strong>de</strong> cobertura entre celdas<br />

(zonas handover). Los tiempos <strong>de</strong> viaje fueron obtenidos mediante el análisis <strong>de</strong> la señalización<br />

enviada al ejecutar el traspaso <strong>de</strong> una llamada entre dos “zonas handover” contiguas. Sin<br />

embargo, esta alternativa presenta como dificultad añadida problemas en el emparejamiento <strong>de</strong><br />

zonas handover con la red viaria <strong>de</strong>bido al tamaño que poseen. Solventar esta problemática<br />

requiere la utilización <strong>de</strong> algoritmos avanzados <strong>de</strong> “map–matching” como los <strong>de</strong>sarrollados por<br />

Estimotion Ltd. (ITIS Inc.), cuya tecnología patentada se encarga <strong>de</strong> la medición y predicción<br />

<strong>de</strong> tiempos <strong>de</strong> viaje en tramos <strong>de</strong> carretera con alta calidad y en tiempo real.<br />

Utilizando la citada tecnología <strong>de</strong> Estimotion, Bar–Gera (2007) estudió las velocida<strong>de</strong>s y<br />

tiempos proporcionados utilizando el evento <strong>de</strong> handover. El sistema recibía observaciones<br />

proce<strong>de</strong>ntes <strong>de</strong> handovers ejecutados por teléfonos existentes en la zona estudiada y<br />

almacenaba, para cada handover, el instante <strong>de</strong> tiempo junto con el i<strong>de</strong>ntificador <strong>de</strong> celda<br />

asociado a las antenas <strong>de</strong> antes y <strong>de</strong>spués <strong>de</strong> la ejecución <strong>de</strong> dicho handover. El sistema era<br />

capaz <strong>de</strong> calcular el área don<strong>de</strong> era más probable que el terminal estuviera localizado cuando<br />

ejecutó el handover (zonas handover), con una probabilidad <strong>de</strong> acierto <strong>de</strong>l 85%. La dimensión<br />

típica <strong>de</strong> esas zonas handover estaba en torno a 300–1000m, <strong>de</strong> ahí la complejidad <strong>de</strong> emparejar<br />

esas zonas con secciones <strong>de</strong> la red viaria. Esta tecnología <strong>de</strong> análisis consi<strong>de</strong>raba la posibilidad<br />

<strong>de</strong> que las observaciones realmente no estuvieran relacionadas con vehículos <strong>de</strong>splazándose por<br />

la vía <strong>de</strong>signada sino por otras próximas a ella, lo cual es frecuente en entornos urbanos.<br />

Finalmente, el sistema generaba estimaciones válidas <strong>de</strong> tiempos <strong>de</strong> viaje (en torno al 63%) para<br />

las secciones analizadas durante el periodo <strong>de</strong> observación (10:00–20:00), empleando una<br />

muestra cuyo tamaño está en torno al 1–3% <strong>de</strong>l tráfico total. Los tiempos <strong>de</strong> viaje eran<br />

convertidos a velocida<strong>de</strong>s medias <strong>de</strong> sección aplicando simplemente el ratio <strong>de</strong> longitud<br />

correspondiente a dicha sección.<br />

Para probar la vali<strong>de</strong>z <strong>de</strong> las estimaciones, las medidas basadas en teléfonos móviles fueron<br />

comparadas con otras obtenidas con <strong>de</strong>tectores y coches flotantes. Los resultados mostraron una<br />

buena correlación entre todas las medidas, don<strong>de</strong> sólo 4 valores atípicos fueron excluidos <strong>de</strong> la<br />

muestra al obtener medidas (con coches flotantes) consi<strong>de</strong>rablemente mayores que las <strong>de</strong>l resto<br />

(con <strong>de</strong>tectores y teléfonos móviles). La Figura 3-9 compara los tiempos <strong>de</strong> viaje obtenidos con<br />

los <strong>de</strong>tectores, coches flotantes (Floating Car Data, FCD) y mediante teléfonos móviles,<br />

observándose una buena correspon<strong>de</strong>ncia entre los tres tipos <strong>de</strong> medidas. Según la figura, existe<br />

una leve <strong>de</strong>sviación, en torno a 1 minuto, entre los tiempos <strong>de</strong> viaje estimados con datos <strong>de</strong><br />

telefonía móvil y los proce<strong>de</strong>ntes <strong>de</strong> <strong>de</strong>tectores, especialmente en situaciones <strong>de</strong> no-congestión.


52 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Figura 3-9: Tiempos <strong>de</strong> viaje en la autovía <strong>de</strong> Ayalon, sentido Norte (Bar–Gera, 2007).<br />

Respecto a los tiempos <strong>de</strong> viaje, cabe <strong>de</strong>stacar el trabajo <strong>de</strong> investigación <strong>de</strong>sarrollado por<br />

Finnra (Finnish Road Administration) en 2002 (Kummala, 2002; Virtanen, 2002). Este trabajo<br />

se basó en la i<strong>de</strong>a <strong>de</strong> que los teléfonos móviles que se muevan siguiendo una cierta ruta siempre<br />

cambiarán <strong>de</strong> estación base (celda) en torno al mismo lugar. Según lo expuesto en el capítulo<br />

anterior, un teléfono móvil encendido intercambia regularmente información con las estaciones<br />

base que conforman la red. Esto permite que la red conozca, aproximadamente, dón<strong>de</strong> buscar a<br />

un teléfono, por ejemplo, a la hora <strong>de</strong> encaminar una llamada entrante.<br />

Travel Time [min]<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

Cellphone (GSM) Camera (LPR)<br />

5:00 7:00 9:00 11:00 13:00 15:00 17:00 19:00 21:00 23:00<br />

Departure Time<br />

Figura 3-10: Estimaciones <strong>de</strong> tiempos <strong>de</strong> viajes y velocida<strong>de</strong>s en función <strong>de</strong>l tiempo <strong>de</strong> salida: datos<br />

GSM vs. LPR (Kummala, 2002).


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 53<br />

Así pues, el trabajo <strong>de</strong>sarrollado por Finnra propuso una monitorización <strong>de</strong> esa señalización<br />

intercambiada entre el teléfono y la red para estudiar el tiempo que precisaba cada teléfono en<br />

cruzar una sección <strong>de</strong> vía, <strong>de</strong>s<strong>de</strong> que entra en un área gestionada por una estación base<br />

<strong>de</strong>terminada hasta la siguiente. Esto permite estimar la duración <strong>de</strong> tiempo <strong>de</strong> viaje asociado a<br />

esa sección. Para la prueba piloto sólo se necesitó monitorizar el 5% <strong>de</strong> los teléfonos para<br />

actualizar los patrones <strong>de</strong> tiempos cada 30 minutos. Los resultados obtenidos (Figura 3-10)<br />

fueron contrastados con los obtenidos mediante cámaras (LPR, License Plate Recognition),<br />

mostrando la alternativa basada en GSM mayor precisión <strong>de</strong>bido a que no se veía afectada por<br />

problemas asociados a la visibilidad como condiciones meteorológicas adversas, frecuentes en<br />

países nórdicos.<br />

3.6 CONGESTIÓN<br />

Un fenómeno <strong>de</strong> congestión se origina por la existencia <strong>de</strong> algún evento que motive un cambio<br />

en los valores medios típicos <strong>de</strong> velocidad y tiempos <strong>de</strong> viaje asociados a una sección. En los<br />

apartados anteriores se han <strong>de</strong>scrito algunos métodos basados en telefonía que consiguen<br />

caracterizar secciones <strong>de</strong> vías en términos <strong>de</strong> velocidad y tiempos. Un análisis <strong>de</strong> variaciones<br />

bruscas en cualquiera <strong>de</strong> esos parámetros respecto a valores típicos pue<strong>de</strong> ser empleado para la<br />

<strong>de</strong>tección <strong>de</strong> congestiones. Análogamente, se pue<strong>de</strong> hacer uso <strong>de</strong> otra magnitud relacionada con<br />

la intensidad <strong>de</strong> tráfico telefónico. El dimensionado <strong>de</strong> una red <strong>de</strong> telefonía móvil atien<strong>de</strong> a la<br />

naturaleza <strong>de</strong>l tráfico telefónico cursado y su distribución con respecto al tiempo y <strong>de</strong>stino. Esta<br />

magnitud varía según proceda <strong>de</strong> un tráfico continuo <strong>de</strong> llamadas (núcleos urbanos) u otro más<br />

esporádico característico <strong>de</strong> zonas <strong>de</strong> poca población. Generalmente, estas zonas se asocian a<br />

vías, como carreteras o autovías, alejadas <strong>de</strong> los núcleos urbanos. Por ello, el tráfico telefónico<br />

que soportan las estaciones base <strong>de</strong> esas vías se correspon<strong>de</strong> dominantemente con el generado<br />

por los ocupantes <strong>de</strong> los vehículos que circulen por ellas.<br />

Para la <strong>de</strong>tección <strong>de</strong> eventos como acci<strong>de</strong>ntes, atascos o cualquier inci<strong>de</strong>nte que altere el flujo<br />

normal <strong>de</strong> tráfico, es posible hacer uso <strong>de</strong> un histórico <strong>de</strong> intensida<strong>de</strong>s típicas <strong>de</strong> tráfico<br />

telefónico medidas sobre esas mismas estaciones bases en diferentes horarios. Para compren<strong>de</strong>r<br />

este razonamiento es necesario resaltar que los usuarios <strong>de</strong> telefonía móvil poseen ciertos<br />

hábitos en la realización <strong>de</strong> llamadas. Estos hábitos siguen ciertos patrones <strong>de</strong> modo que,<br />

cuando aparecen eventos que motivan un cambio, los valores típicos <strong>de</strong> intensidad suelen<br />

modificarse. Este es el caso <strong>de</strong> situaciones <strong>de</strong> congestión, en los cuales los usuarios tien<strong>de</strong>n a<br />

realizar más llamadas por diversas razones, como avisar en el trabajo o incluso aprovechar el<br />

tiempo para hablar con algún conocido. Este motivo modifica la intensidad <strong>de</strong> tráfico típica al


54 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

incrementarse el volumen <strong>de</strong> llamadas cursado por el sistema. Una simple comparación con<br />

valores tradicionales pue<strong>de</strong> <strong>de</strong>tectar la existencia <strong>de</strong> alguna inci<strong>de</strong>ncia que motive el aumento <strong>de</strong><br />

la actividad telefónica.<br />

call volume (12 mn frame)<br />

40,00<br />

30,00<br />

20,00<br />

10,00<br />

�<br />

�<br />

�<br />

�<br />

� �<br />

� �<br />

� � � � � � � �<br />

�<br />

� �<br />

0,00<br />

0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00<br />

level of inci<strong>de</strong>nt on A7<br />

�<br />

�<br />

�<br />

� � � �<br />

� � �<br />

�<br />

Nº of calls (mean)<br />

� incalls<br />

� outcalls<br />

Dot/Lines show Means<br />

Figura 3-11: Relación entre volumen <strong>de</strong> llamadas y nivel <strong>de</strong> inci<strong>de</strong>ntes en la autovía A7 (agosto y<br />

septiembre 2000). Nota: Nivel <strong>de</strong> inci<strong>de</strong>ntes (level of inci<strong>de</strong>nt): 0 = ningún inci<strong>de</strong>nte <strong>de</strong>tectado por<br />

los <strong>de</strong>tectores, 14 = al menos 14 <strong>de</strong>tectores (<strong>de</strong> 21) <strong>de</strong>tectan un inci<strong>de</strong>nte en los correspondientes<br />

intervalos <strong>de</strong> 12 min; Volumen <strong>de</strong> llamadas (call volume): promedio <strong>de</strong> número <strong>de</strong> llamadas<br />

entrantes y salientes registradas en los correspondientes intervalos <strong>de</strong> 12 min (Ygnace, 2001).<br />

El estudio <strong>de</strong>sarrollado por INRETS analizó la relación entre el volumen <strong>de</strong> llamadas (entrantes<br />

y salientes) y la congestión <strong>de</strong> una vía (Ygnace, 2001). Para ello, se consi<strong>de</strong>ró la hipótesis <strong>de</strong><br />

que los conductores tien<strong>de</strong>n a hacer más llamadas cuando se encuentran en alguna situación <strong>de</strong><br />

congestión. En la Figura 3-11 se muestra la relación entre el volumen <strong>de</strong> llamadas <strong>de</strong> teléfonos<br />

móviles y el nivel <strong>de</strong> inci<strong>de</strong>ntes en un tramo <strong>de</strong> autovía <strong>de</strong> 80 millas. El análisis <strong>de</strong>mostró que<br />

las llamadas entrantes no aportaban información relevante. Sin embargo, se <strong>de</strong>tectó una relación<br />

significativa entre llamadas salientes <strong>de</strong> móviles sobre esa vía y el nivel <strong>de</strong> inci<strong>de</strong>ntes, la cual<br />

reflejaba el incremento <strong>de</strong> la actividad telefónica al estar los vehículos parados.<br />

3.7 DENSIDAD DE TRÁFICO<br />

En el ámbito <strong>de</strong> vehículos, la <strong>de</strong>nsidad es otro parámetro clave para medir la calidad <strong>de</strong> servicio<br />

que ofrece una sección <strong>de</strong> vía. La <strong>de</strong>nsidad <strong>de</strong> tráfico ρ representa el número <strong>de</strong> vehículos que<br />

ocupan una longitud específica <strong>de</strong> una vía o carril <strong>de</strong> ella, en un instante dado, excluyendo los<br />

vehículos estacionados. Se expresa en vehículos por kilómetro [veh/km], ya sea referido a un<br />

carril o a todos los carriles <strong>de</strong> una vía. Por su naturaleza espacial (se mi<strong>de</strong> a lo largo <strong>de</strong> una


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 55<br />

longitud), la medición directa <strong>de</strong> la <strong>de</strong>nsidad no es una tarea sencilla ya que precisa la<br />

observación <strong>de</strong> longitu<strong>de</strong>s significativas <strong>de</strong> una sección <strong>de</strong> vía. No obstante, si se dispone <strong>de</strong><br />

cierta información en puntos <strong>de</strong> esa sección, la <strong>de</strong>nsidad [veh/km] se estima como el cociente<br />

entre flujo [veh/h] y velocidad [km/h], pero esto sólo es válido bajo ciertas condiciones.<br />

La telefonía móvil sugiere nuevas formas <strong>de</strong> obtención <strong>de</strong> esta magnitud. La unidad Erlang está<br />

relacionada con la <strong>de</strong>manda <strong>de</strong> utilización <strong>de</strong> los recursos <strong>de</strong> estaciones base que dan servicio a<br />

una zona, es <strong>de</strong>cir, tráfico telefónico que se produce durante un <strong>de</strong>terminado periodo <strong>de</strong> tiempo<br />

en cada celda. Como cualquier otro tipo <strong>de</strong> tráfico, el telefónico posee también un concepto<br />

ligado a la ocupación. Así pues, esta magnitud pue<strong>de</strong> proporcionar una estimación <strong>de</strong> la<br />

ocupación <strong>de</strong> una celda en términos <strong>de</strong> consumo <strong>de</strong> recursos ofrecidos por la estación base<br />

asociada y, por tanto, medir el número <strong>de</strong> teléfonos a los que dicha celda está dando servicio.<br />

Figura 3-12: Intensidad <strong>de</strong> tráfico telefónico a 10:00 a.m. en el área metropolitana <strong>de</strong> Graz.<br />

(Fuente: http://senseable.mit.edu/projects/graz/highres/highres.zip)<br />

Esta línea es la que sigue Ratti et al. (2005) en su trabajo <strong>de</strong>l SENSEable City Laboratory<br />

(MIT). En él se consigue representar sobre mapas <strong>de</strong> una ciudad ciertos parámetros <strong>de</strong> tráfico,<br />

visualizando la dinámica <strong>de</strong> sus habitantes en tiempo real. Uno <strong>de</strong> esos parámetros fue la<br />

intensidad <strong>de</strong> tráfico telefónico o <strong>de</strong>nsidad <strong>de</strong> las llamadas (medida en Erlang) <strong>de</strong> los abonados<br />

<strong>de</strong> un cierto operador, para lo cual contó con la cooperación <strong>de</strong>l operador austriaco<br />

A1/Mobilkom que proporcionó ciertos datos anónimos <strong>de</strong> teléfonos. Esta investigación también<br />

representaba sobre mapas información relacionada con la movilidad <strong>de</strong> usuarios a través <strong>de</strong><br />

handovers. Asimismo, mediante una inscripción previa en un servicio <strong>de</strong> rastreo <strong>de</strong>l operador,


56 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

se monitorizaban periódicamente las posiciones <strong>de</strong> usuarios que previamente se habían dado <strong>de</strong><br />

alta. La Figura 3-12 muestra los valores <strong>de</strong> intensidad <strong>de</strong> tráfico gestionada por antenas <strong>de</strong> Graz<br />

(Austria) usando mapas <strong>de</strong> color, don<strong>de</strong> colores claros representan intensida<strong>de</strong>s altas, y ver<strong>de</strong>s y<br />

negros valores bajos o nulos <strong>de</strong> intensidad, respectivamente. En Milán (Italia) se aplicó también<br />

la misma metodología (Ratti et al., 2006). La Figura 3-13 muestra gráficamente<br />

representaciones <strong>de</strong> la <strong>de</strong>nsidad <strong>de</strong> llamadas en diferentes horarios, observando una variación <strong>de</strong><br />

niveles <strong>de</strong> <strong>de</strong>nsidad en función <strong>de</strong>l tiempo.<br />

Figura 3-13: Representaciones <strong>de</strong> la <strong>de</strong>nsidad <strong>de</strong> llamadas <strong>de</strong> teléfonos móviles en el área<br />

metropolitana <strong>de</strong> Milán (20 km × 20 km) entre las 4 p.m. y las 6 p.m.<br />

(Fuente:http://www.envplan.com/misc/b32047).<br />

En ambos estudios <strong>de</strong>l MIT se llegó a la conclusión <strong>de</strong> que el número <strong>de</strong> llamadas realizadas<br />

con teléfonos móviles está estrechamente relacionado con la <strong>de</strong>nsidad <strong>de</strong> personas y, en el caso<br />

<strong>de</strong> zonas don<strong>de</strong> no existen núcleos resi<strong>de</strong>nciales próximos sino autovías o carreteras, con la<br />

<strong>de</strong>nsidad <strong>de</strong> vehículos mediante los teléfonos <strong>de</strong> sus ocupantes. Así pues, aplicando ciertos<br />

algoritmos <strong>de</strong> expansión, es posible convertir esa medida <strong>de</strong> intensidad <strong>de</strong> tráfico en celda<br />

[teléfonosLLAMADA/celda] a magnitu<strong>de</strong>s relacionadas con la <strong>de</strong>nsidad en términos <strong>de</strong><br />

vehículos/celda.


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 57<br />

Figura 3-14: Medidas <strong>de</strong> uso <strong>de</strong> la red móvil (Erlangs) en 6 lugares <strong>de</strong> Roma (Rea<strong>de</strong>s et al., 2007).<br />

Este enfoque se compren<strong>de</strong> mejor en otro estudio <strong>de</strong>sarrollado por el SENSEable City<br />

Laboratory (MIT) en Roma (Rea<strong>de</strong>s et al., 2007). En el citado estudio, se consiguió <strong>de</strong>finir<br />

patrones <strong>de</strong> actividad, según la zona y el día analizado, empleando medidas expresadas en<br />

Erlangs <strong>de</strong> uso <strong>de</strong> la red celular (llamadas) proporcionados por un operador. La Figura 3-14<br />

muestra cómo las medidas <strong>de</strong> Erlang cambiaban con el tiempo en seis lugares seleccionados, los<br />

cuales representaban zonas resi<strong>de</strong>nciales (Piazza Bologna), turísticas (Panteón), ocio<br />

(Trastevere, Estadio Olímpico) y principales puntos <strong>de</strong> entrada a la cuidad por tren (Termini) y<br />

coche (Tiburtina). Como indican las gráficas, los valores <strong>de</strong> Erlangs <strong>de</strong> lunes a viernes en cada<br />

punto son muy similares, aunque el ratio varía <strong>de</strong> un lugar a otro. Por otro lado, los valores <strong>de</strong>l<br />

sábado y domingo suelen tener valores inferiores respecto a los valores típicos <strong>de</strong> días<br />

laborables, reflejando un patrón <strong>de</strong> comportamiento diferente según el tipo <strong>de</strong> día. Sin embargo,<br />

a pesar <strong>de</strong> esas diferencias entre días laborables y fin <strong>de</strong> semana, la Figura 3-14 muestra que los<br />

seis lugares muestran un comportamiento similar: una rápida subida <strong>de</strong> actividad telefónica por<br />

la mañana entre las 6 y 10 a.m. en días laborables, con un ritmo más lento y algo retrasado en el<br />

tiempo durante el fin <strong>de</strong> semana, un valle al mediodía, una nueva subida por la tar<strong>de</strong> y un<br />

<strong>de</strong>scenso abrupto por la noche.<br />

Por otro lado, los altos niveles nocturnos <strong>de</strong> uso <strong>de</strong> red, entre medianoche y las 2 a.m., los fines<br />

<strong>de</strong> semana cerca <strong>de</strong>l Panteón y Trastevere, en comparación con los <strong>de</strong> lugares orientados a zonas<br />

resi<strong>de</strong>nciales o industriales, sugerían una actividad fuertemente orientada al ocio. Esta<br />

característica permite la posibilidad <strong>de</strong> i<strong>de</strong>ntificar, por ejemplo, zonas <strong>de</strong> ocio y culturales


58 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

atendiendo al patrón <strong>de</strong> uso <strong>de</strong> la red celular. Por ello, este estudio también aplicó la actividad<br />

telefónica (<strong>de</strong>nsidad <strong>de</strong> llamadas) a otra línea como es la dinámica <strong>de</strong> una ciudad. Según esas<br />

medidas <strong>de</strong> uso <strong>de</strong> la red (en erlangs) se dividió la ciudad en zonas, <strong>de</strong> modo que se estableció<br />

una relación <strong>de</strong> dichas zonas con otras zonas <strong>de</strong>finidas según la actividad <strong>de</strong>sarrollada en ellas<br />

(comercial, turística, resi<strong>de</strong>ncial,…). Ello permitió representar características espaciotemporales<br />

<strong>de</strong> la ciudad en función <strong>de</strong>l uso <strong>de</strong>l teléfono móvil. Se observó que la actividad<br />

telefónica <strong>de</strong> días laborables en cada zona exhibía un patrón temporal más dinámico, mientras<br />

que en fin <strong>de</strong> semana la actividad presentó mayor dispersión espacial. Una característica con<br />

implicaciones para la comprensión <strong>de</strong> la dinámica urbana <strong>de</strong> una ciudad fue el alto nivel <strong>de</strong><br />

actividad por la mañana <strong>de</strong> días laborables en zonas asociadas a estaciones <strong>de</strong> trenes, autobuses<br />

o intercambiadores, en comparación con los niveles <strong>de</strong> zona resi<strong>de</strong>nciales a esa misma hora.<br />

Des<strong>de</strong> un punto <strong>de</strong> vista <strong>de</strong> planificación urbana, esta relación era obvia pero la visualización<br />

espacial y temporal <strong>de</strong> estas características a esta escala está comenzando a ser posible mediante<br />

la infraestructura ya existente en sistemas <strong>de</strong> telefonía móvil.<br />

3.8 CARACTERÍSTICAS DE LOS DATOS DE TELEFONÍA<br />

MÓVIL<br />

3.8.1 Precisión <strong>de</strong> localización<br />

El esquema <strong>de</strong> localización en los sistemas GSM se basa en la existencia <strong>de</strong> áreas <strong>de</strong><br />

localización y celdas (Figura 3-15). Con ello se preten<strong>de</strong> tener organizado el área <strong>de</strong> servicio<br />

(cobertura) en una serie <strong>de</strong> zonas para proporcionar eficientemente servicios a sus usuarios.<br />

Figura 3-15: Localización por I<strong>de</strong>ntificación Global <strong>de</strong> Celda, CGI.<br />

El nivel <strong>de</strong> precisión <strong>de</strong> posición más fino conseguido <strong>de</strong> una red <strong>de</strong> telefonía celular, sin<br />

realizar ninguna modificación en ella ni en los terminales, es a nivel <strong>de</strong> celda. Es <strong>de</strong>cir, se<br />

localiza el terminal <strong>de</strong>ntro el área <strong>de</strong> cobertura <strong>de</strong> la estación base a la que está conectado. Con


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 59<br />

ello se obtiene una aproximación <strong>de</strong> la zona geográfica en la que se encuentra el teléfono, pero<br />

no la posición exacta. Por ello, existe un margen <strong>de</strong> error que <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l radio <strong>de</strong> la celda. Este<br />

radio oscila entre los 100 m y 1 km en ciuda<strong>de</strong>s. En entornos rurales <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la <strong>de</strong>nsidad <strong>de</strong><br />

las antenas, aunque suele oscilar entre 5 y 20 km. Ese margen <strong>de</strong> error empeora a medida que<br />

aumenta el nivel <strong>de</strong> agregación, por ejemplo, a nivel <strong>de</strong>l área <strong>de</strong> localización (agrupaciones <strong>de</strong><br />

celdas), que es el nivel <strong>de</strong> resolución con el que trabaja la red celular para gestionar terminales<br />

simplemente encendidos. El uso <strong>de</strong> resolución a nivel <strong>de</strong> LA implica que la zona geográfica en<br />

la que se pue<strong>de</strong> encontrar el teléfono es más extensa, dando lugar a una mayor incertidumbre.<br />

Esta resolución afecta al mapeado <strong>de</strong> teléfonos sobre vías existentes en la zona en la que se<br />

informe que se encuentra el terminal, lo cual pue<strong>de</strong> ser relevante para ciertos parámetros. Una<br />

<strong>de</strong> esas situaciones problemáticas se presenta con la existencia <strong>de</strong> múltiples vías <strong>de</strong>ntro <strong>de</strong> una<br />

celda para parámetros que usen handover (véase la Figura 3-16), don<strong>de</strong> las celdas implicadas en<br />

los handovers son las mismas para las dos posibles rutas. En tales situaciones no es posible<br />

<strong>de</strong>sagregar la velocidad o el tiempo <strong>de</strong> viaje estimado por ruta, ya que cada una tiene diferente<br />

longitud <strong>de</strong> sección <strong>de</strong> vía que recorre la celda. Sin embargo, esta situación no es tan relevante<br />

en otros casos como la medida <strong>de</strong> volúmenes. En ellos, la información <strong>de</strong> volúmenes <strong>de</strong> paso <strong>de</strong><br />

teléfonos móviles entre dos celdas proporciona información agregada <strong>de</strong> paso total por las dos<br />

vías. No obstante, cada método toma el nivel <strong>de</strong> agregación apropiado según la resolución<br />

requerida para la predicción <strong>de</strong>l parámetro. Incluso pue<strong>de</strong>n paliarse tales efectos mediante el uso<br />

<strong>de</strong> algoritmos <strong>de</strong> “map–matching” (Pyo et al., 2001, White et al., 2000) o completando la<br />

información disponible con otros <strong>de</strong> los muchos parámetros que se pue<strong>de</strong>n extraer <strong>de</strong> la red <strong>de</strong><br />

telefonía móvil para <strong>de</strong>terminar una posición más exacta <strong>de</strong>l terminal.<br />

Figura 3-16: Múltiples vías <strong>de</strong>ntro <strong>de</strong> una celda.<br />

Asimismo, hay diferencias en los requerimientos <strong>de</strong> calidad en las estimaciones <strong>de</strong> parámetros<br />

según los usos finales a los que estén <strong>de</strong>stinados. Por ejemplo, datos que puedan ser usados con<br />

el fin <strong>de</strong> informar al viajero probablemente sean menos exigentes que si se utilizarán para la<br />

<strong>de</strong>tección <strong>de</strong> inci<strong>de</strong>ntes o la gestión <strong>de</strong>l tráfico. Por ello, en casos <strong>de</strong> altos niveles <strong>de</strong> calidad, los


60 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

parámetros <strong>de</strong> tráfico estimados mediante telefonía móvil <strong>de</strong>berían ser utilizados para completar<br />

otro sistema <strong>de</strong> monitorización <strong>de</strong> tráfico, pero no como sistema exclusivo. Incluso realizar<br />

modificaciones en la red o en los propios terminales también supondría una mejora en la calidad<br />

<strong>de</strong> las predicciones, por ejemplo la utilización <strong>de</strong> teléfonos equipados con A–GPS con el<br />

objetivo <strong>de</strong> obtener una mejor precisión <strong>de</strong> los datos <strong>de</strong> localización.<br />

Otro factor que <strong>de</strong>be ser seriamente consi<strong>de</strong>rado es la frecuencia <strong>de</strong> renovación <strong>de</strong> esos datos <strong>de</strong><br />

localización, la cual <strong>de</strong>pen<strong>de</strong>rá <strong>de</strong> si el teléfono está simplemente encendido (las actualizaciones<br />

tienen lugar tras vencer un temporizador o cambiar <strong>de</strong> área <strong>de</strong> localización) o si realiza algún<br />

tipo <strong>de</strong> uso <strong>de</strong> la red, como una llamada, en la que la actualización es continua e instantánea<br />

mientras dure la conexión.<br />

No obstante, en términos <strong>de</strong> coste y prestaciones ofrecidas para lograr calidad en las<br />

estimaciones, la información <strong>de</strong> posición proporcionada por una red GSM sin modificaciones<br />

permite obtener datos fiables para monitorizar el movimiento <strong>de</strong> teléfonos y, por tanto,<br />

vehículos sin necesidad <strong>de</strong> <strong>de</strong>splegar una infraestructura adicional. Así mismo, se trata <strong>de</strong> un<br />

sistema bastante más económico dado que aprovecha la tecnología y módulos propios <strong>de</strong> las<br />

re<strong>de</strong>s GSM para obtener la posición <strong>de</strong> cualquier terminal móvil, por muy sencillo que sea.<br />

3.8.2 Tamaño <strong>de</strong> la muestra<br />

Como ya se ha referido previamente, una <strong>de</strong> las ventajas <strong>de</strong> la obtención <strong>de</strong> parámetros <strong>de</strong><br />

tráfico basados en la telefonía móvil es la posibilidad <strong>de</strong> capturar información <strong>de</strong> un modo más<br />

continuo que con los métodos tradicionales. Esta continuidad en la captura <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la<br />

frecuencia <strong>de</strong> renovación <strong>de</strong> los datos obtenidos <strong>de</strong> cada terminal. Lo <strong>de</strong>seable es conocer la<br />

posición exacta en términos <strong>de</strong> sus coor<strong>de</strong>nadas espaciales y temporales (x, y, z; t). Sin<br />

embargo, eso no es posible con re<strong>de</strong>s o terminales sin modificar. Así pues, lo más preciso que se<br />

pue<strong>de</strong> conseguir es conocer la localización en la que se encuentra cada terminal en términos <strong>de</strong><br />

celda, dado que es el nivel <strong>de</strong> resolución más preciso disponible sin alterar la red ni los<br />

terminales. Pero esto sólo es posible cuando el teléfono tiene establecida una comunicación con<br />

la red. Con ello, el tamaño <strong>de</strong> la muestra <strong>de</strong> datos <strong>de</strong>pen<strong>de</strong>rá <strong>de</strong>l número <strong>de</strong> llamadas efectuadas<br />

por los abonados así como la duración <strong>de</strong> las mismas. Sin embargo, la realización <strong>de</strong> llamadas<br />

no tiene una tasa tan elevada como la mera existencia <strong>de</strong> terminales que simplemente están<br />

encendidos. Un teléfono encendido y <strong>de</strong>socupado, estado más frecuente, ofrece datos menos<br />

precisos en términos <strong>de</strong> posición y más dispersos en el tiempo, dado que el terminal interactúa<br />

con la red menos frecuentemente. En ese estado, las notificaciones a la red <strong>de</strong> la posición son<br />

puntuales bajo ciertos eventos, como el vencimiento <strong>de</strong> un temporizador o cambio <strong>de</strong> área <strong>de</strong>


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 61<br />

localización, por lo que la actualización <strong>de</strong> datos <strong>de</strong> posición es menos frecuente. Tampoco<br />

aportaría información a nivel <strong>de</strong> tráfico telefónico (Erlangs), dado que en ese estado no consume<br />

recursos. De modo que el empleo <strong>de</strong> información proce<strong>de</strong>nte <strong>de</strong> terminales en ese estado limita<br />

su aplicación a ciertos parámetros <strong>de</strong> tráfico.<br />

En cambio, utilizar información obtenida <strong>de</strong> terminales ocupados con llamadas afectaría al<br />

tamaño <strong>de</strong> la muestra <strong>de</strong> datos disponible para las estimaciones, dado que el conjunto <strong>de</strong><br />

terminales en ese estado se reduce consi<strong>de</strong>rablemente. Esta limitación restringe su uso a<br />

estimaciones <strong>de</strong> parámetros que necesiten muestras pequeñas. En algunos casos pue<strong>de</strong> ser<br />

necesario obtener mayor precisión <strong>de</strong> posición y no una muestra <strong>de</strong> teléfonos <strong>de</strong> tamaño<br />

elevado, como ocurre con la velocidad o tiempos <strong>de</strong> viaje. En cambio en otros, la calidad <strong>de</strong> la<br />

estimación <strong>de</strong>pen<strong>de</strong> en gran medida <strong>de</strong> la alta penetración <strong>de</strong> teléfonos que actúan como<br />

“sondas” para inferir los datos <strong>de</strong> tráfico, como ocurre con las matrices O–D, <strong>de</strong>nsidad, etc. Por<br />

ello, las metodologías <strong>de</strong>scritas anteriormente llegan a un equilibrio entre tamaño <strong>de</strong> muestra y<br />

precisión <strong>de</strong> posición <strong>de</strong>seada a la hora <strong>de</strong> su planteamiento, consiguiendo que estas<br />

limitaciones no afecten a la calidad <strong>de</strong> los resultados.<br />

3.8.3 Aspectos legales<br />

Es importante <strong>de</strong>stacar que estas técnicas <strong>de</strong> estimación <strong>de</strong> parámetros <strong>de</strong> tráfico mediante<br />

teléfonos móviles no infringen aspectos relacionados con la privacidad <strong>de</strong> los usuarios. Todos<br />

los datos analizados se reciben y se tratan en forma agregada y anónima, según las normativas<br />

europeas, <strong>de</strong> modo que no exista posibilidad <strong>de</strong> asociar datos <strong>de</strong> localización con abonados<br />

concretos. El objetivo <strong>de</strong> estas técnicas basadas en telefonía móvil es mostrar su aplicabilidad y<br />

aptitud para mejorar los métodos <strong>de</strong> cálculo <strong>de</strong> parámetros <strong>de</strong> tráfico y así lograr una eficiente<br />

gestión y planificación <strong>de</strong>l tráfico.<br />

Sin embargo, la principal preocupación asociada a estos servicios basados en localización (LBS)<br />

resi<strong>de</strong> en la característica <strong>de</strong> que los movimientos que un abonado realiza sean continuamente<br />

monitorizados, especialmente cuando esos datos <strong>de</strong> localización se ponen a disposición <strong>de</strong><br />

aplicaciones cuyos beneficiarios son terceras personas. Pero todos estos servicios se enmarcan<br />

<strong>de</strong>ntro <strong>de</strong> la legalidad puesto que se rigen por normativas que se encargan <strong>de</strong> velar por la<br />

protección <strong>de</strong> la intimidad. En concreto, la directiva 2002/58/EC <strong>de</strong> la Unión Europea se<br />

encarga <strong>de</strong> regular el tratamiento <strong>de</strong> los datos personales y la protección <strong>de</strong> la intimidad en el<br />

sector <strong>de</strong> las comunicaciones electrónicas. En ella se distinguen tres grupos <strong>de</strong> datos asociados


62 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

al abonado: datos <strong>de</strong>l tráfico, personales, y <strong>de</strong> localización. Los datos <strong>de</strong> mayor interés para los<br />

servicios LBS son los asociados al último grupo, los datos <strong>de</strong> localización.<br />

En el punto 14 <strong>de</strong> la citada directiva aparece una <strong>de</strong>scripción <strong>de</strong> los datos <strong>de</strong> localización,<br />

indicando que: “Los datos <strong>de</strong> localización pue<strong>de</strong>n referirse a la latitud, la longitud y la altitud<br />

<strong>de</strong>l equipo terminal <strong>de</strong>l usuario, a la dirección <strong>de</strong> la marcha, al nivel <strong>de</strong> precisión <strong>de</strong> la<br />

información <strong>de</strong> la localización, a la i<strong>de</strong>ntificación <strong>de</strong> la celda <strong>de</strong> red en la que está localizado el<br />

equipo terminal en un <strong>de</strong>terminado momento o a la hora en que la información <strong>de</strong> localización<br />

ha sido registrada.” A<strong>de</strong>más, esta directiva proporciona regulaciones sobre los datos <strong>de</strong><br />

localización en el artículo 9, don<strong>de</strong> indica:<br />

“En caso <strong>de</strong> que puedan tratarse datos <strong>de</strong> localización […] sólo podrán tratarse estos datos si<br />

se hacen anónimos, o previo consentimiento <strong>de</strong> los usuarios o abonados, en la medida y por el<br />

tiempo necesarios para la prestación <strong>de</strong> un servicio con valor añadido. El proveedor <strong>de</strong>l<br />

servicio <strong>de</strong>berá informar a los usuarios o abonados, antes <strong>de</strong> obtener su consentimiento, <strong>de</strong>l<br />

tipo <strong>de</strong> datos <strong>de</strong> localización distintos <strong>de</strong> los datos <strong>de</strong> tráfico que serán tratados, <strong>de</strong> la finalidad<br />

y duración <strong>de</strong>l tratamiento y <strong>de</strong> si los datos se transmitirán a un tercero a efectos <strong>de</strong> la<br />

prestación <strong>de</strong>l servicio con valor añadido.”<br />

Con ello, queda claro que estos servicios requieren acuerdos previos y que la protección <strong>de</strong> la<br />

privacidad es un aspecto fundamental para cualquiera <strong>de</strong> estos servicios. En particular, la<br />

inferencia <strong>de</strong> datos <strong>de</strong> tráfico mediante datos <strong>de</strong> localización proce<strong>de</strong>ntes <strong>de</strong> telefonía se trata <strong>de</strong><br />

un ejemplo claro <strong>de</strong>l empleo <strong>de</strong> los servicios LBS don<strong>de</strong> el beneficiario principal no sólo es la<br />

Administración sino la sociedad al completo, puesto que este servicio supone una mejora en la<br />

gestión y planificación <strong>de</strong> la red. Es necesario resaltar que el servicio no infringe la ley sobre<br />

protección <strong>de</strong> la intimidad, ya que hace uso <strong>de</strong> datos anónimos para no asociar <strong>de</strong>splazamientos<br />

a usuarios concretos. Sólo se preten<strong>de</strong> conocer información referente a la localización <strong>de</strong> un<br />

terminal, visto como un elemento anónimo <strong>de</strong> la red que se mueve a través <strong>de</strong> ella, sin importar<br />

las características <strong>de</strong>l usuario u otro tipo <strong>de</strong> información asociada a él.<br />

3.9 CONCLUSIONES<br />

Una vez expuestos los procesos asociados a la gestión <strong>de</strong> movilidad <strong>de</strong> los sistemas <strong>de</strong> telefonía<br />

en el Capítulo 2 y revisado el “Estado <strong>de</strong>l Arte” respecto a su aplicabilidad en la estimación <strong>de</strong><br />

parámetros <strong>de</strong> tráfico, se pue<strong>de</strong> concluir afirmando que son dos los procesos viables que<br />

permiten monitorizar el movimiento <strong>de</strong> terminales. Por un lado se dispone <strong>de</strong>l handover, el cual<br />

permite conocer el momento en el que un terminal con una llamada activa cambia <strong>de</strong> una celda


Capítulo 3: ESTADO DEL ARTE EN EL ÁMBITO DE LA ESTIMACIÓN DE PARÁMETROS DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL 63<br />

a otra al necesitar la comunicación ser transferida <strong>de</strong> la estación base servidora a una nueva.<br />

Con ello se permite <strong>de</strong>tectar el paso <strong>de</strong> terminales con llamadas activas por las fronteras entre<br />

celdas. Por otro lado existe el proceso <strong>de</strong> LU, el cual es ejecutado por cualquier terminal<br />

encendido para que la red se mantenga informada <strong>de</strong> la localización aproximada <strong>de</strong>l terminal, en<br />

términos <strong>de</strong> área <strong>de</strong> localización (LA), logrando así encaminar rápidamente las llamadas<br />

entrantes en el caso que éstas ocurran. En base a este razonamiento, cada vez que un teléfono<br />

cambie <strong>de</strong> LA mientras esté encendido se consi<strong>de</strong>rará que ha cruzado la correspondiente<br />

frontera entre LAs.<br />

La <strong>de</strong>tección <strong>de</strong>l movimiento <strong>de</strong> terminales <strong>de</strong>rivados <strong>de</strong> handovers y/o procesos <strong>de</strong> LU presenta<br />

una serie <strong>de</strong> ventajas e inconvenientes comparándolos entre sí. Cuando se emplea el handover,<br />

la información extraída viene referida a frontera entre celdas, la cual, dada las dimensiones<br />

típicas <strong>de</strong> una celda, no abarca una extensión <strong>de</strong> terreno muy amplia. Con ello, el número <strong>de</strong><br />

vías que discurren por la frontera es limitado, alcanzándose una mejor precisión cuanto menor<br />

es la zona fronteriza. En el caso <strong>de</strong> un proceso <strong>de</strong> LU para monitorizar el paso <strong>de</strong> un LA a otro,<br />

al ser un área <strong>de</strong> localización una región que compren<strong>de</strong> un grupo <strong>de</strong> celdas, la zona fronteriza<br />

observada posee un mayor tamaño que en el caso anterior. Esto provoca el aumento <strong>de</strong>l número<br />

<strong>de</strong> vías que cruzan la frontera y, por tanto, <strong>de</strong>l nivel <strong>de</strong> agregación <strong>de</strong> la información <strong>de</strong><br />

traspasos proporcionada en este caso. No obstante, esta situación no ocurre siempre al utilizar el<br />

proceso <strong>de</strong> LU. Al ejecutarse este proceso no sólo se dispone <strong>de</strong> información <strong>de</strong>l nuevo LA <strong>de</strong><br />

entrada sino <strong>de</strong> la celda por la que lo ha hecho. De modo que la zona fronteriza a monitorizar<br />

realmente no compren<strong>de</strong> toda la frontera entre los LAs sino la sección <strong>de</strong> esa frontera limítrofe<br />

con una celda concreta. En base a este razonamiento, la <strong>de</strong>sventaja <strong>de</strong>l proceso <strong>de</strong> LU respecto<br />

al handover en términos <strong>de</strong> precisión a nivel <strong>de</strong> celda sólo ocurre en <strong>de</strong>terminadas situaciones.<br />

Esta afirmación se pue<strong>de</strong> ver más claramente en la Figura 3-17. El paso <strong>de</strong>s<strong>de</strong> la celda 1 a la 3<br />

monitorizado por un aforo “virtual” que emplee el handover entre ese par <strong>de</strong> celdas observaría<br />

el movimiento <strong>de</strong> terminales por el punto 1. En cambio, ese movimiento no podría ser <strong>de</strong>tectado<br />

por un aforo “virtual” que emplee el proceso <strong>de</strong> LU ejecutado cuando se cambia <strong>de</strong>l LA1 al<br />

LA2, ya que éste observaría tanto el punto 1 como el 3. En este caso no se podría distinguir si el<br />

paso ha sido a través <strong>de</strong>l punto 1 o <strong>de</strong>l 3 <strong>de</strong>bido a que ambos puntos limitan con la misma celda<br />

por la que se entra al LA2 (celda 3). Con ello, la información proporcionada por ese aforo<br />

“virtual” se correspon<strong>de</strong>ría con el movimiento por cualquiera <strong>de</strong> las vías asociadas a ambos<br />

puntos, es <strong>de</strong>cir, información agregada <strong>de</strong> traspaso. Por el contrario, un proceso <strong>de</strong> LU ejecutado<br />

al pasar en el otro sentido (<strong>de</strong>s<strong>de</strong> el LA2 al LA1) sí que permitiría i<strong>de</strong>ntificar si ha ocurrido por


64 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

el punto 1 o el 3, puesto que los puntos limitan con celdas diferentes para la entrada al LA1<br />

(celda 1 y celda 2, respectivamente).<br />

LA 1<br />

celda 1<br />

1<br />

2<br />

celda 3<br />

3<br />

celda 2<br />

Figura 3-17: Fronteras entre celdas y LAs.<br />

LA 2<br />

Por otro lado, el hecho <strong>de</strong> analizar datos proce<strong>de</strong>ntes <strong>de</strong> handover (llamadas) conlleva que la<br />

muestra <strong>de</strong> terminales <strong>de</strong> la que se recogen los datos la forman aquellos que han tenido activa<br />

una llamada en el momento <strong>de</strong> paso por la frontera. Esto implica que el tamaño <strong>de</strong> la muestra es<br />

estadísticamente menos representativo que si se utilizaran datos <strong>de</strong> terminales que estuvieran<br />

simplemente encendidos, como ocurre en el caso <strong>de</strong> datos proce<strong>de</strong>ntes <strong>de</strong>l proceso LU. La Tabla<br />

3-1 resume estas características básicas.<br />

Tabla 3-1: Comparativa <strong>de</strong> volúmenes <strong>de</strong>rivados <strong>de</strong> handovers o procesos <strong>de</strong> LU.<br />

LU Mayor tamaño <strong>de</strong> la muestra<br />

Handover<br />

Ventajas Inconvenientes<br />

Mayor precisión<br />

(menor número <strong>de</strong> vías por frontera)<br />

Menor precisión<br />

(mayor número <strong>de</strong> vías por frontera)<br />

Menor tamaño <strong>de</strong> la muestra<br />

Atendiendo a estas conclusiones, una red GSM (sin modificar) pue<strong>de</strong> no ofrecer prestaciones<br />

óptimas para fines <strong>de</strong> localización y monitorización <strong>de</strong> usuarios, especialmente en lo que a<br />

movilidad se refiere. No obstante, la rápida expansión <strong>de</strong> este tipo <strong>de</strong> sistemas <strong>de</strong> telefonía junto<br />

a los resultados alcanzados en proyectos similares relacionados con la obtención <strong>de</strong> parámetros<br />

<strong>de</strong> tráfico, impulsa a incorporar métodos basados en estas nuevas tecnologías en los estudios <strong>de</strong><br />

transporte. Por ello, los Capítulos 2 y 3 han <strong>de</strong>scrito y revisado conceptos y procedimientos<br />

relacionados con los sistemas <strong>de</strong> telefonía móvil para afrontar los objetivos <strong>de</strong> esta Tesis con un<br />

mayor conocimiento <strong>de</strong> la materia.


CAPÍTULO 4<br />

INFERENCIA DE VOLÚMENES DE TRÁFICO<br />

MEDIANTE LA TELEFONÍA MÓVIL<br />

4.1 INTRODUCCIÓN<br />

Se <strong>de</strong>nomina volumen <strong>de</strong> tráfico al número <strong>de</strong> vehículos que pasan por un punto o sección<br />

transversal <strong>de</strong> una vía durante un periodo <strong>de</strong> tiempo <strong>de</strong>terminado. Estos volúmenes pue<strong>de</strong>n ser<br />

entendidos como una medida <strong>de</strong>l nivel <strong>de</strong> utilización <strong>de</strong>l viario por la <strong>de</strong>manda <strong>de</strong> transporte.<br />

Los estudios <strong>de</strong> volúmenes se realizan con el propósito <strong>de</strong> obtener información <strong>de</strong>l movimiento<br />

<strong>de</strong> vehículos sobre puntos o secciones específicas <strong>de</strong>ntro <strong>de</strong> una red viaria, proporcionando una<br />

<strong>de</strong>scripción intuitiva <strong>de</strong>l comportamiento dinámico <strong>de</strong>l tráfico.<br />

Las distribuciones temporales <strong>de</strong> volúmenes <strong>de</strong> tráfico se <strong>de</strong>ben a diferentes estilos y formas <strong>de</strong><br />

vida, los cuales <strong>de</strong>terminan patrones <strong>de</strong> viaje basados en el tiempo (épocas <strong>de</strong>l año, horas <strong>de</strong>l<br />

día, etc.). Por otro lado, los teléfonos móviles se han convertido en un elemento indispensable<br />

en nuestra rutina diaria. Éstos intercambian continuamente información con las estaciones <strong>de</strong> un<br />

sistema <strong>de</strong> telefonía móvil a fin <strong>de</strong> disponer <strong>de</strong> servicios telefónicos <strong>de</strong> calidad, con lo que una<br />

monitorización <strong>de</strong> datos generados por dichos terminales pue<strong>de</strong> ofrecer un fiel reflejo <strong>de</strong> las<br />

pautas <strong>de</strong> movilidad <strong>de</strong> los usuarios. En concreto, ciertas situaciones que tienen lugar durante el<br />

funcionamiento típico <strong>de</strong> esos sistemas pue<strong>de</strong>n <strong>de</strong>sempeñar una tarea similar a las llevadas a<br />

cabo por las tradicionales estaciones <strong>de</strong> aforo en lo referente a conteos <strong>de</strong> tráfico. Este capítulo<br />

está <strong>de</strong>dicado a profundizar en este campo, <strong>de</strong>sarrollando una metodolología para inferir<br />

volúmenes <strong>de</strong> tráfico <strong>de</strong> vehículos a partir <strong>de</strong> la telefonía móvil mediante mo<strong>de</strong>los matemáticos.<br />

4.2 ANTECEDENTES Y ESTADO ACTUAL<br />

Para la medición <strong>de</strong> los volúmenes <strong>de</strong> tráfico suelen utilizarse estaciones <strong>de</strong> aforo. Una estación<br />

<strong>de</strong> aforo mi<strong>de</strong> la cantidad <strong>de</strong> vehículos que transitan por un <strong>de</strong>terminado punto o sección <strong>de</strong>l


66 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

viario; a este valor medido se le conoce con el nombre <strong>de</strong> “aforo”, término que también<br />

i<strong>de</strong>ntifica al <strong>de</strong> “estación <strong>de</strong> aforo” o “punto <strong>de</strong> aforo”. Tradicionalmente, estos aforos son un<br />

tipo <strong>de</strong> información que se recoge <strong>de</strong> forma automática en un conjunto <strong>de</strong> puntos asociados a<br />

arcos <strong>de</strong>l viario. Para ello se han <strong>de</strong> instalar elementos adicionales en las vías (espiras, cámaras<br />

<strong>de</strong> vi<strong>de</strong>o…). Este volumen <strong>de</strong> paso <strong>de</strong> vehículos no es constante sino que oscila según la<br />

movilidad <strong>de</strong> la población, categoría <strong>de</strong> la vía, temporalidad, etc. Para conocer en <strong>de</strong>talle las<br />

características <strong>de</strong>l tráfico <strong>de</strong> vehículos que circula por la red sería necesario monitorizar un<br />

número consi<strong>de</strong>rable <strong>de</strong> vías <strong>de</strong> modo casi permanente con algún tipo <strong>de</strong> <strong>de</strong>tector, algo inviable<br />

cuando existen restricciones presupuestarias. Así pues, surge la necesidad <strong>de</strong> otras alternativas<br />

que permitan caracterizar el tráfico <strong>de</strong> un modo rápido, preciso y permanente, sin excesivo<br />

coste.<br />

Un modo <strong>de</strong> conseguir esta información es mediante la telefonía móvil. En contraste con los<br />

sensores fijos, los teléfonos móviles proporcionan información respecto al comportamiento <strong>de</strong>l<br />

tráfico sobre cualquier zona don<strong>de</strong> exista cobertura telefónica, sin necesidad <strong>de</strong> un <strong>de</strong>spliegue<br />

adicional <strong>de</strong> infraestructura. En estos casos, el volumen estaría asociado al movimiento <strong>de</strong><br />

teléfonos por una <strong>de</strong>terminada zona <strong>de</strong> la red, dado que existen ciertos eventos y procesos en la<br />

telefonía móvil relacionados con la gestión <strong>de</strong> movilidad que permiten <strong>de</strong>tectar el cambio <strong>de</strong><br />

zona, bien entre celdas (mediante handover) o bien entre áreas <strong>de</strong> localización (mediante<br />

procesos LU, Location Update). Respecto a esta i<strong>de</strong>a, en la sección 3.3 se presentaron los<br />

conocimientos actuales sobre el cálculo <strong>de</strong> volúmenes mediante la telefonía móvil, junto con<br />

una revisión <strong>de</strong>l “Estado–<strong>de</strong>l–Arte” sobre la obtención <strong>de</strong> volúmenes con datos proce<strong>de</strong>ntes <strong>de</strong><br />

teléfonos.<br />

Existen estudios en la literatura en los cuales se afirma que el flujo <strong>de</strong> teléfonos móviles<br />

<strong>de</strong>rivado <strong>de</strong> llamadas con handover y el flujo <strong>de</strong> vehículos proporcionado por <strong>de</strong>tectores<br />

(espiras, gomas, cámaras…) en los mismos puntos están directamente relacionados en la<br />

mayoría <strong>de</strong> los intervalos horarios <strong>de</strong> un día típico (Thiessenhusen et al., 2006; Höpfner et al.,<br />

2007), mostrando picos característicos similares en las horas punta <strong>de</strong> mañana y <strong>de</strong> tar<strong>de</strong>. No<br />

obstante, esos estudios manifestaron la dificultad <strong>de</strong> obtener flujos <strong>de</strong> vehículos precisos<br />

directamente <strong>de</strong> datos <strong>de</strong> llamadas <strong>de</strong>bido a la naturaleza <strong>de</strong> dichos datos. Por tanto, la principal<br />

cuestión es <strong>de</strong>terminar cómo el flujo <strong>de</strong> teléfonos estará relacionado con el flujo <strong>de</strong> vehículos ya<br />

que en los conteos <strong>de</strong> terminales que pasan por fronteras entre celdas no se monitoriza el<br />

conjunto completo <strong>de</strong> vehículos que la han atravesado, sino sólo una muestra <strong>de</strong> ellos.<br />

Ciertos factores que tienen su origen en la naturaleza <strong>de</strong> los datos <strong>de</strong> teléfonos móviles afectan a<br />

la hora <strong>de</strong> cuantificar la relación entre vehículos y teléfonos. Por un lado, la telefonía móvil


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 67<br />

aporta información asociada a movilidad <strong>de</strong> teléfonos que i) son <strong>de</strong> un cierto operador y ii) que<br />

están encendidos. Los teléfonos apagados o <strong>de</strong> otro operador son transparentes, es <strong>de</strong>cir, aunque<br />

crucen la frontera no serán <strong>de</strong>tectados en el proceso <strong>de</strong> conteo. En el caso <strong>de</strong>l handover, existe<br />

otro condicionante adicional asociado a la naturaleza <strong>de</strong>l evento, que implica que el teléfono<br />

esté realizando una llamada en el momento <strong>de</strong> cambio <strong>de</strong> celda. Adicionalmente a los factores<br />

citados, la existencia <strong>de</strong> más <strong>de</strong> un teléfono por vehículo también perturba la estimación <strong>de</strong> flujo<br />

usando datos <strong>de</strong> teléfonos.<br />

La carencia <strong>de</strong> una relación directa e inmediata entre conteos <strong>de</strong> teléfonos que ejecutan<br />

handover y conteos <strong>de</strong> vehículos sugiere la necesidad <strong>de</strong> un tratamiento especial para relacionar<br />

ambas magnitu<strong>de</strong>s, el cual pue<strong>de</strong> requerir la realización <strong>de</strong> algún proceso <strong>de</strong> calibración usando<br />

conteos <strong>de</strong> vehículos obtenidos, por ejemplo, mediante <strong>de</strong>tectores ubicados en la misma zona en<br />

la que se realiza el conteo <strong>de</strong> teléfonos. En la literatura se han propuesto diferentes mo<strong>de</strong>los<br />

diseñados para correlacionar ambas magnitu<strong>de</strong>s, como un sencillo mo<strong>de</strong>lo basado en funciones<br />

<strong>de</strong> transferencia generadas directamente con datos <strong>de</strong> aforos (Bekhor et al., 2008) u otro más<br />

complejo basado en técnicas <strong>de</strong> asimilación <strong>de</strong> datos como la relajación Newtoniana o técnica<br />

nudging (Herrera y Bayen, 2008). En ambos casos, la utilización <strong>de</strong> mo<strong>de</strong>los para relacionar<br />

ambas variables hizo posible alcanzar estimaciones más precisas <strong>de</strong> flujo <strong>de</strong> vehículos.<br />

Ante las conclusiones anteriores, y dada la naturaleza <strong>de</strong> la información proce<strong>de</strong>nte <strong>de</strong> telefonía<br />

móvil, parece lógica la necesidad <strong>de</strong> usar mo<strong>de</strong>los matemáticos que se encarguen <strong>de</strong> medir esa<br />

relación con un objetivo claramente predictivo. Los mo<strong>de</strong>los matemáticos son ampliamente<br />

utilizados para resolver problemas concretos <strong>de</strong> ingeniería u otras áreas científicas, y<br />

constituyen un marco teórico general para la formulación <strong>de</strong> la inferencia estadística. En los<br />

siguientes apartados se proponen una serie <strong>de</strong> mo<strong>de</strong>los para pre<strong>de</strong>cir volúmenes <strong>de</strong> vehículos a<br />

partir <strong>de</strong> la telefonía móvil con objeto <strong>de</strong> ser usados en los estudios <strong>de</strong> transporte en sustitución<br />

o <strong>de</strong> forma complementaria a medidas <strong>de</strong> volúmenes proporcionadas por los habituales aforos.<br />

4.3 METODOLOGÍA PARA LA INFERENCIA DE VOLÚMENES<br />

DE VEHÍCULOS<br />

La inferencia estadística compren<strong>de</strong> una serie <strong>de</strong> métodos y procedimientos para <strong>de</strong>ducir<br />

propieda<strong>de</strong>s (hacer inferencias) <strong>de</strong> una población, a partir <strong>de</strong> una pequeña parte <strong>de</strong> la misma<br />

(muestra). Lógicamente es imposible pre<strong>de</strong>cir con exactitud y es por ello que la bondad <strong>de</strong> estas<br />

<strong>de</strong>ducciones se medirá atendiendo a su grado <strong>de</strong> acierto. En este trabajo se va a plantear el uso<br />

<strong>de</strong> la inferencia estadística para pre<strong>de</strong>cir volúmenes <strong>de</strong> vehículos utilizando información


68 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

<strong>de</strong>rivada <strong>de</strong> la telefonía móvil, <strong>de</strong> modo que el estudio estadístico correspondiente compren<strong>de</strong>rá<br />

los siguientes pasos, los cuales serán abordados en los sucesivos apartados:<br />

1. Planteamiento <strong>de</strong>l problema.<br />

2. Extracción <strong>de</strong> la muestra.<br />

3. Análisis <strong>de</strong>scriptivo <strong>de</strong> los datos.<br />

4. Tratamiento <strong>de</strong> los datos.<br />

5. Elaboración <strong>de</strong> mo<strong>de</strong>los y estimación <strong>de</strong> los parámetros.<br />

6. Contraste <strong>de</strong> mo<strong>de</strong>los.<br />

7. Conclusiones.<br />

4.3.1 Planteamiento <strong>de</strong>l problema<br />

En esta fase inicial <strong>de</strong>l problema se <strong>de</strong>finen con precisión la población, la característica a<br />

estudiar, las variables <strong>de</strong>pendientes e in<strong>de</strong>pendientes, etc. Bajo el contexto <strong>de</strong> nuestro problema,<br />

la población o universo se correspon<strong>de</strong> con el conjunto <strong>de</strong> vehículos que pasan por una zona en<br />

un periodo <strong>de</strong> tiempo <strong>de</strong>terminado (por ejemplo, cada hora), <strong>de</strong> modo que la característica a<br />

estudiar será la intensidad <strong>de</strong> paso <strong>de</strong> vehículos por dicha zona.<br />

4.3.1.1 Alternativas ofrecidas por la telefonía móvil<br />

En esta etapa también se <strong>de</strong>ben analizar los medios <strong>de</strong> los que se dispone y el procedimiento a<br />

seguir. Como se ha comentado en el apartado 3.9, la telefonía móvil ofrece dos procesos<br />

asociados a la gestión <strong>de</strong> movilidad que permiten monitorizar el paso <strong>de</strong> terminales, bien entre<br />

celdas mediante el handover, o bien entre áreas <strong>de</strong> localización (LA) mediante el proceso <strong>de</strong><br />

Location Update (LU). A partir <strong>de</strong> la red viaria real se elabora un mo<strong>de</strong>lo <strong>de</strong> red compuesto,<br />

principalmente, por nodos y arcos. La mayoría <strong>de</strong> los nodos correspon<strong>de</strong>n a una intersección o<br />

cruce, mientras que los arcos correspon<strong>de</strong>n a los segmentos <strong>de</strong> vías <strong>de</strong> comunicación que unen<br />

los nodos. Analizando la topología <strong>de</strong> un mo<strong>de</strong>lo <strong>de</strong> red <strong>de</strong> transporte junto con la distribución<br />

<strong>de</strong> celdas y LAs <strong>de</strong>l sistema celular existente, es posible asociar fronteras entre dichas zonas con<br />

secciones <strong>de</strong> vía (arcos). Con ello, cada vez que un teléfono cambie <strong>de</strong> celda durante una<br />

llamada (handover) o cambie <strong>de</strong> LA mientras esté encendido (proceso LU), se podrá consi<strong>de</strong>rar<br />

que ha pasado por alguno <strong>de</strong> los arcos que conforman la correspondiente frontera. En aquellos<br />

casos en los que la frontera sólo comprenda un arco, el paso <strong>de</strong> terminales computado se<br />

asociará íntegramente a dicho arco. Sin embargo, cuando son más <strong>de</strong> uno los arcos implicados<br />

en una frontera, el nivel <strong>de</strong> resolución proporcionado por estos datos sólo informa <strong>de</strong>l paso por<br />

la frontera, pero no permite distinguir sobre qué arco <strong>de</strong>l total se ha realizado el traspaso. Dada<br />

esta situación, la cual es mayoritaria, la información <strong>de</strong> traspasos proporcionada será en forma


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 69<br />

agregada por grupos <strong>de</strong> arcos, en lugar <strong>de</strong> a nivel individual <strong>de</strong> arco (formato tradicional <strong>de</strong> las<br />

estaciones <strong>de</strong> aforo).<br />

El procedimiento a escoger <strong>de</strong>pen<strong>de</strong>rá, por tanto, <strong>de</strong> las especificaciones que se necesiten para<br />

abordar el problema en cuestión. Las fronteras a monitorizar vienen ya establecidas por el<br />

propio diseño <strong>de</strong> las re<strong>de</strong>s <strong>de</strong> telefonía móvil, puesto que se utilizan las mismas celdas y/o áreas<br />

<strong>de</strong> localización <strong>de</strong>finidas en el dimensionado y diseño <strong>de</strong> la red celular. El tamaño <strong>de</strong> un área <strong>de</strong><br />

localización <strong>de</strong>pen<strong>de</strong> en gran medida <strong>de</strong> las celdas que la forman. El radio <strong>de</strong> las celdas <strong>de</strong>pen<strong>de</strong><br />

<strong>de</strong> parámetros como tráfico que tienen que soportar, topología <strong>de</strong>l terreno, tipo <strong>de</strong> antena o<br />

incluso edificios alre<strong>de</strong>dor <strong>de</strong> la estación base, variando su tamaño <strong>de</strong>s<strong>de</strong> cientos <strong>de</strong> metros a<br />

kilómetros.<br />

Dada una región <strong>de</strong> estudio, puesto que las áreas <strong>de</strong> localización son agrupaciones <strong>de</strong> celdas, el<br />

número <strong>de</strong> fronteras entre celdas es mayor que entre LA y, por tanto, se monitorizaría un<br />

número mayor <strong>de</strong> arcos utilizando handovers que procesos <strong>de</strong> LU. No obstante, si la zona a<br />

estudiar es extensa (p.ej. una comunidad autónoma), las fronteras entre LAs por una celda<br />

concreta pue<strong>de</strong>n englobar un número suficientemente elevado <strong>de</strong> arcos para abordar un<br />

<strong>de</strong>terminado estudio. En esta Tesis, el principal objetivo <strong>de</strong> los datos <strong>de</strong> teléfonos está orientado<br />

al campo <strong>de</strong> la estimación <strong>de</strong> matrices origen–<strong>de</strong>stino mediante volúmenes observados, por lo<br />

que interesa disponer <strong>de</strong> información en un número <strong>de</strong> arcos <strong>de</strong> la red suficientemente<br />

representativo. Así pues, será la dimensión <strong>de</strong> la red <strong>de</strong> transporte la que condicione la elección<br />

<strong>de</strong> tomar datos proce<strong>de</strong>ntes <strong>de</strong> llamadas (cambios <strong>de</strong> celda) o registros <strong>de</strong> LU (cambios <strong>de</strong> LA).<br />

Por ejemplo, si el estudio se centrara en una red urbana, la monitorización <strong>de</strong>l paso <strong>de</strong> un LA a<br />

otro no es admisible dado que típicamente una ciudad es cubierta con un único LA y el número<br />

<strong>de</strong> posibles fronteras a monitorizar es muy bajo; en cambio, existirán numerosas celdas. Por<br />

ello, sería más apropiado en esos casos utilizar datos <strong>de</strong> llamadas al permitir monitorizar un<br />

mayor número <strong>de</strong> fronteras.<br />

4.3.1.2 Proceso <strong>de</strong> captura <strong>de</strong> datos<br />

Una vez conocidos los medios <strong>de</strong> los que se dispone, y los posibles procedimientos que ofrece<br />

la telefonía móvil, es necesario elegir cuál va a ser el procedimiento a seguir. Como se ha<br />

analizado en el apartado anterior, la dimensión <strong>de</strong> la red es <strong>de</strong>terminante a la hora <strong>de</strong> seleccionar<br />

el evento <strong>de</strong> telefonía <strong>de</strong>l que se obtendrán los datos fuente. Sin embargo, la implementación <strong>de</strong><br />

los mo<strong>de</strong>los <strong>de</strong> captura <strong>de</strong> datos <strong>de</strong> teléfonos está sujeta en gran medida a las características<br />

técnicas <strong>de</strong> la plataforma <strong>de</strong>l operador que proporcione los datos. Esa plataforma <strong>de</strong>berá tener<br />

habilitada la funcionalidad necesaria para extraer información <strong>de</strong> las bases <strong>de</strong> datos relativa a


70 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

llamadas o cambios <strong>de</strong> área <strong>de</strong> localización. En su <strong>de</strong>fecto, la disposición por parte <strong>de</strong>l operador<br />

para la instalación <strong>de</strong> módulos que implementen tal extracción también condiciona el éxito <strong>de</strong>l<br />

proceso <strong>de</strong> captura <strong>de</strong> datos.<br />

Para la realización <strong>de</strong> esta Tesis se ha contado con la inestimable colaboración <strong>de</strong>l operador<br />

VODAFONE que se ha prestado a proporcionar datos <strong>de</strong> teléfonos <strong>de</strong>bidamente encriptados. En<br />

el caso <strong>de</strong> la plataforma <strong>de</strong>l citado operador, los datos <strong>de</strong> llamadas están accesibles sin coste ni<br />

impacto en los módulos <strong>de</strong>l sistema puesto que son almacenados con fines <strong>de</strong> facturación y<br />

control <strong>de</strong>l funcionamiento <strong>de</strong> la red. Para el caso <strong>de</strong> datos asociados a procesos <strong>de</strong> LU, aunque<br />

éstos son generados automáticamente por el sistema, sólo se almacenan temporalmente. Por<br />

ello, sería necesario realizar un volcado periódico <strong>de</strong> las bases <strong>de</strong> datos <strong>de</strong>l sistema en un<br />

servidor central <strong>de</strong>l que tomar los datos. Esto requiere una modificación <strong>de</strong> los módulos<br />

existentes en la plataforma <strong>de</strong>l operador ya que las APIs necesarias para su almacenamiento<br />

permanente no están accesibles en la actualidad.<br />

Tras consi<strong>de</strong>rar las posibilida<strong>de</strong>s ofrecidas y <strong>de</strong>s<strong>de</strong> la perspectiva <strong>de</strong> bajo coste e impacto en<br />

módulos <strong>de</strong> la infraestructura <strong>de</strong>l operador, se preferió que los estudios numéricos <strong>de</strong>sarrollados<br />

en este Capítulo utilizaran como datos fuente información <strong>de</strong> llamadas realizadas sobre un<br />

conjunto <strong>de</strong> celdas. En concreto, el conjunto <strong>de</strong> datos proporcionado por VODAFONE se<br />

correspon<strong>de</strong> con registros encriptados <strong>de</strong> llamadas efectuadas por sus abonados en celdas bajo<br />

estudio durante periodos <strong>de</strong> 24 horas. Un extracto <strong>de</strong>l formato <strong>de</strong> los datos entregados por el<br />

operador se muestra en la Tabla 4-1. En particular, estas celdas han sido previamente<br />

seleccionadas por disponer en las proximida<strong>de</strong>s <strong>de</strong> sus fronteras con otras celdas <strong>de</strong> una estación<br />

<strong>de</strong> aforo con la que contrastar y/o calibrar los valores <strong>de</strong> volúmenes <strong>de</strong> tráfico inferidos con el<br />

mo<strong>de</strong>lo diseñado.<br />

IMSI<br />

Tabla 4-1: Extracto <strong>de</strong> los datos entregados por el operador.<br />

ID Número<br />

Origen<br />

ID Numero<br />

Destino<br />

Fecha<br />

Hora<br />

(hh:mm)<br />

Duración<br />

(min)<br />

Cell Id<br />

(Nombre)<br />

20240 3210 508 10/04/2008 9:30:00 1,53 GSM2<br />

20240 3210 508 10/04/2008 9:31:00 2,45 GSM2<br />

20241 3205 17362 10/04/2008 18:10:00 0,33 GSM1<br />

20241 3205 1055 10/04/2008 18:11:00 1,12 GSM1<br />

Es preciso mencionar que cualquier número que aparezca en la información proporcionada por<br />

el operador respecto a la i<strong>de</strong>ntidad <strong>de</strong> los abonados se encuentra encriptado con un i<strong>de</strong>ntificador<br />

único y permanente durante todo el intervalo <strong>de</strong> tiempo analizado (24 horas). Con ello se


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 71<br />

garantiza la privacidad <strong>de</strong> los abonados pero sin impedir realizar un seguimiento <strong>de</strong> la movilidad<br />

que ha tenido cada terminal en términos <strong>de</strong> celdas en las que ha efectuado llamadas. Todo ello<br />

permite, finalmente, monitorizar el paso <strong>de</strong> terminales <strong>de</strong> una celda a otra para inferir<br />

volúmenes agregados por grupos <strong>de</strong> arcos que cruzan la frontera en cuestión.<br />

4.3.2 Conteo <strong>de</strong> paso <strong>de</strong> teléfonos entre celdas. Extracción <strong>de</strong> la muestra<br />

La inferencia estadística persigue estimar parámetros <strong>de</strong> una población a partir <strong>de</strong> una muestra<br />

<strong>de</strong> la misma. En general, la estadística lo que nos permite no es el conocimiento exacto <strong>de</strong> lo<br />

que ocurrirá, sino lo que más probablemente pueda ocurrir. Para ello dicha muestra o porción <strong>de</strong><br />

población tiene como requisito que sea representativa <strong>de</strong> la población o universo al que<br />

pertenece, es <strong>de</strong>cir, sea relativamente similar al conjunto <strong>de</strong> la que fue extraída. Dado que en<br />

nuestro problema la población la constituye el conjunto <strong>de</strong> vehículos que pasan por un tramo <strong>de</strong><br />

vía, la selección <strong>de</strong> la muestra consistirá en tomar miembros <strong>de</strong> ese conjunto <strong>de</strong> vehículos.<br />

Según lo expuesto en apartados anteriores, la telefonía móvil está muy extendida en la sociedad<br />

actual, en especial en el caso <strong>de</strong> usuarios en movilidad dado que les proporciona un modo<br />

eficiente y rápido <strong>de</strong> comunicación. Bajo este enfoque, una posible muestra estaría relacionada<br />

con los teléfonos móviles pertenecientes a los ocupantes <strong>de</strong> los vehículos que circulan por una<br />

vía. El funcionamiento estándar <strong>de</strong> los sistemas <strong>de</strong> telefonía móvil permite conocer el flujo <strong>de</strong><br />

teléfonos que pasan <strong>de</strong> una celda a otra mientras realizan llamadas. En entornos próximos a la<br />

red viaria, ese movimiento <strong>de</strong> teléfonos estaría directamente relacionado con los vehículos que<br />

han pasado por la zona asociada a la frontera entre celdas, en términos <strong>de</strong> la porción <strong>de</strong><br />

vehículos que en su interior transportaban los teléfonos <strong>de</strong>s<strong>de</strong> los que se han realizado tales<br />

llamadas.<br />

Para la i<strong>de</strong>ntificación <strong>de</strong> tal conjunto <strong>de</strong> teléfonos, lo más inmediato es tomar aquellos<br />

terminales que realizaron un handover. Se sabe que cuando un terminal con una llamada activa<br />

entra en el área <strong>de</strong> servicio <strong>de</strong> otra antena (celda), se ejecuta un handover, notificando a la red<br />

tanto su nueva posición en términos <strong>de</strong> i<strong>de</strong>ntidad <strong>de</strong> celda como el instante <strong>de</strong> entrada. Con ello,<br />

en las bases <strong>de</strong> datos <strong>de</strong>l sistema siempre se crea un registro para la entrada <strong>de</strong> un terminal con<br />

una llamada activa en una nueva celda. Un análisis <strong>de</strong> los instantes en los que se producen esos<br />

registros <strong>de</strong>bido a handovers (cambios <strong>de</strong> celda) permite <strong>de</strong>tectar el paso <strong>de</strong> terminales con<br />

llamadas activas por una zona asociada a la frontera <strong>de</strong> una celda con otra (Figura 4-1 a).<br />

No obstante, emplear exclusivamente teléfonos que han generado handovers restringe en cierta<br />

medida el tamaño <strong>de</strong> la muestra dado que el handover requiere unas condiciones apropiadas<br />

para ser ejecutado. Éstas son que un usuario en movilidad (a bordo <strong>de</strong> vehículo) haga una


72 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

llamada y que dure lo suficiente para que sea traspasada a otra celda. Pue<strong>de</strong> darse el caso que la<br />

llamada finalice antes <strong>de</strong> cambiar <strong>de</strong> celda, por lo que el handover no llegaría a realizarse y, a<br />

pesar <strong>de</strong> que el teléfono esté en movimiento, el teléfono no formaría parte <strong>de</strong> la muestra. Por<br />

ello, se <strong>de</strong>ben consi<strong>de</strong>rar otras situaciones <strong>de</strong> movilidad que amplíen los criterios para la<br />

selección <strong>de</strong> la muestra. Se sabe que cuando un usuario realiza una llamada, por cuestiones <strong>de</strong><br />

facturación, el sistema siempre almacena en una base <strong>de</strong> datos un registro conteniendo<br />

información relativa a esa llamada, como hora <strong>de</strong> inicio, duración, ID teléfono llamado, ID<br />

teléfono llamante o i<strong>de</strong>ntificación <strong>de</strong> la celda don<strong>de</strong> se origina la llamada (LAI+CI). Por ello,<br />

también es factible <strong>de</strong>tectar el paso <strong>de</strong> un terminal <strong>de</strong> una celda a otra sin necesidad <strong>de</strong> que esté<br />

realizando una llamada en el momento <strong>de</strong> cruzar la frontera, como en el caso <strong>de</strong>l handover. Esto<br />

ocurre cuando <strong>de</strong>s<strong>de</strong> un mismo terminal se realizan dos llamadas consecutivas en celdas<br />

diferentes y colindantes en un corto periodo <strong>de</strong> tiempo T, por ejemplo, 15 minutos (Figura 4-1<br />

b). En ese caso, dado que hay constancia <strong>de</strong> que el terminal ha estado en dos celdas en un corto<br />

periodo <strong>de</strong> tiempo, se pue<strong>de</strong> consi<strong>de</strong>rar que está en movimiento y que, por tanto, también ha<br />

pasado por la frontera entre celdas. Así pues, aunque el instante <strong>de</strong> paso <strong>de</strong> una celda a otra no<br />

se conozca con la misma exactitud que en el caso <strong>de</strong>l handover, se supone que habrá ocurrido<br />

<strong>de</strong>ntro <strong>de</strong> ese periodo T. Este tiempo (T=15 minutos) es admisible dado que está <strong>de</strong>ntro <strong>de</strong> los<br />

rangos <strong>de</strong> tiempo respecto <strong>de</strong> los cuales se suele proporcionar las medidas <strong>de</strong> intensida<strong>de</strong>s <strong>de</strong><br />

tráfico <strong>de</strong> las tradicionales estaciones <strong>de</strong> aforo. Esta pareja <strong>de</strong> llamadas junto a las que ejecutan<br />

handover permiten construir una muestra mayor <strong>de</strong> terminales para monitorizar su movimiento<br />

<strong>de</strong> una zona a otra, <strong>de</strong>nominándose a esos tipos <strong>de</strong> llamadas como “llamadas en movilidad”.<br />

Figura 4-1: Llamadas en movilidad: (a) handover y (b) 2 llamadas en t1 y t2 tal que t2-t1≤T=15min.<br />

Es importante <strong>de</strong>stacar que la situación mostrada en la Figura 4-1 b sólo se contabiliza como<br />

una única llamada en movilidad, pese a realizarse 2 llamadas. Esto es así dado que el concepto<br />

<strong>de</strong> movilidad se asocia al movimiento <strong>de</strong>l terminal <strong>de</strong>s<strong>de</strong> el cual se realizan llamadas y, en esta<br />

situación, es el mismo terminal el que realiza las dos llamadas, siendo éstas usadas para <strong>de</strong>tectar<br />

su movimiento. Entonces, el análisis <strong>de</strong> registros <strong>de</strong> llamadas almacenados en las bases <strong>de</strong> datos


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 73<br />

en busca <strong>de</strong> llamadas en movilidad, realizadas en las celdas <strong>de</strong> interés, permitirá contabilizar los<br />

terminales que se <strong>de</strong>splazan <strong>de</strong> una celda a otra como si existiera una especie <strong>de</strong> estación <strong>de</strong><br />

aforo “virtual” en la frontera entre ellas.<br />

Un mo<strong>de</strong>lo <strong>de</strong> red <strong>de</strong> transporte es una representación simplificada <strong>de</strong> la red vial y está formado,<br />

principalmente, por nodos y arcos, los cuales representan las intersecciones y los tramos viales,<br />

respectivamente, <strong>de</strong> la infraestructura vial. Analizando la distribución <strong>de</strong> las celdas y el mo<strong>de</strong>lo<br />

<strong>de</strong> red <strong>de</strong> transporte se i<strong>de</strong>ntificarán las posibles fronteras observadas y se establecerá una<br />

correspon<strong>de</strong>ncia con los arcos <strong>de</strong>l mo<strong>de</strong>lo. Una frontera observada o aforo “virtual” lo<br />

conforman los arcos cuyo nodo inicial y nodo final están en celdas distintas y contiguas (Figura<br />

4-2). Con ello, cada vez que un teléfono con una llamada activa acce<strong>de</strong> a la celda B proce<strong>de</strong>nte<br />

<strong>de</strong> otra A o el mismo teléfono realice dos llamadas consecutivas (


74 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

patrones <strong>de</strong> llamadas para usuarios en movimiento y estáticos. Esto conlleva que el tráfico<br />

telefónico en re<strong>de</strong>s móviles <strong>de</strong>penda tanto <strong>de</strong>l tiempo como <strong>de</strong>l espacio, siendo esa <strong>de</strong>pen<strong>de</strong>ncia<br />

espacial mucho más variable que en re<strong>de</strong>s fijas.<br />

Atendiendo a un contexto <strong>de</strong> movilidad <strong>de</strong> vehículos, un modo <strong>de</strong> abordar este análisis<br />

<strong>de</strong>scriptivo es cuantificar la comodidad a la hora <strong>de</strong> efectuar llamadas. Las llamadas se pue<strong>de</strong>n<br />

dividir en dos categorías: aquellas que son recibidas por el usuario, <strong>de</strong>nominadas llamadas<br />

entrantes, y las que son realizadas por ese usuario, <strong>de</strong>nominadas llamadas salientes.<br />

Lógicamente, un parámetro para evaluar la citada comodidad será la tasa <strong>de</strong> llamadas salientes.<br />

Destacar que cada llamada entrante tiene su origen en una saliente <strong>de</strong> otro usuario, por ello sólo<br />

se van a consi<strong>de</strong>rar las llamadas salientes <strong>de</strong> cada usuario al analizar el tráfico telefónico <strong>de</strong> red.<br />

La duración <strong>de</strong> una llamada también será otro parámetro característico a estudiar. Ambos<br />

parámetros están fuertemente afectados por la movilidad <strong>de</strong> los usuarios (estáticos, peatones u<br />

ocupantes <strong>de</strong> vehículos), ya que ésta condiciona la realización <strong>de</strong> llamadas. Por ejemplo, un<br />

conductor normalmente iniciará un número <strong>de</strong> llamadas menor comparado con un usuario<br />

ubicado en su trabajo; respecto a la duración, los pasajeros <strong>de</strong> vehículos harán llamadas más<br />

largas en comparación con las realizadas por conductores.<br />

La Figura 4-3 muestra la intensidad <strong>de</strong>l tráfico telefónico, representada en términos <strong>de</strong> número<br />

<strong>de</strong> llamadas realizadas, en una celda Zk a lo largo <strong>de</strong> un día laboral típico. Para sistemas <strong>de</strong><br />

telefonía móvil, los picos suelen producirse entre las 10:00 y 12:00 <strong>de</strong>bido a la actividad<br />

comercial y laboral <strong>de</strong> los usuarios, mostrando un segundo pico entre 18:00 y 20:00 <strong>de</strong>bido al<br />

fin <strong>de</strong> la jornada laboral.<br />

Tráfico Telefónico [llamadas]<br />

400<br />

300<br />

200<br />

100<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23<br />

Tiempo (24 horas)<br />

Figura 4-3: Tráfico telefónico (número <strong>de</strong> llamadas por hora) durante un día en una celda.<br />

Cabe señalar que la intensidad <strong>de</strong> tráfico telefónico pue<strong>de</strong> variar <strong>de</strong> un día a otro, semanalmente,<br />

o incluso según el periodo <strong>de</strong>l año (verano, Semana Santa,…), mostrando diferentes patrones<br />

asociados con los hábitos <strong>de</strong> los usuarios y/o las características <strong>de</strong> la zona gestionada por la


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 75<br />

celda. Aunque, normalmente, estos patrones <strong>de</strong> volumen <strong>de</strong> llamadas tien<strong>de</strong>n a mostrar un<br />

comportamiento similar en diferentes zonas. La Figura 4-4 muestra el número <strong>de</strong> llamadas<br />

realizadas a lo largo <strong>de</strong> un día laborable típico en diferentes celdas bajo estudio. En ella se<br />

aprecia que, a gran<strong>de</strong>s rasgos, los patrones <strong>de</strong> llamadas son similares.<br />

Tráfico Telefónico [llamadas]<br />

400<br />

300<br />

200<br />

100<br />

Celda 7<br />

Celda 5<br />

Celda 9<br />

Celda 1<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23<br />

Tiempo (24 horas)<br />

Figura 4-4: Promedio <strong>de</strong>l número <strong>de</strong> llamadas por hora en diferentes celdas a lo largo <strong>de</strong> 18 días.<br />

En la Figura 4-4 se pue<strong>de</strong> observar que, esencialmente, existen tres períodos <strong>de</strong> actividad<br />

durante un día laborable típico, uno <strong>de</strong> muy poca actividad y dos claros picos don<strong>de</strong> la actividad<br />

es mayor, variando su rango <strong>de</strong> una celda a otra. El primero se correspon<strong>de</strong> con el período<br />

nocturno (00:00–7:00), don<strong>de</strong> la realización <strong>de</strong> llamadas es poco probable. El segundo periodo<br />

se extien<strong>de</strong> durante la mayor parte <strong>de</strong> la jornada laboral (8:00–16:00). El último período es el<br />

correspondiente a la tar<strong>de</strong> y el final <strong>de</strong>l día (16:00–00:00). A su vez, se observa que la actividad<br />

telefónica en un día laborable aumenta bruscamente por la mañana entre las 7:00 y 10:00; en<br />

cambio, la transición hacia la noche refleja <strong>de</strong>scensos más graduales.<br />

Tráfico Telefónico [llamadas]<br />

400<br />

300<br />

200<br />

100<br />

t d �1min<br />

1min


76 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

duración <strong>de</strong> llamadas a lo largo <strong>de</strong>l día. Analizando esa duración en términos medios (Figura<br />

4-6), se aprecia más claramente que los usuarios tien<strong>de</strong>n a hacer llamadas más largas a partir <strong>de</strong><br />

las 19:00. La propia naturaleza <strong>de</strong>l servicio condiciona esta variación en la duración, ya que<br />

pue<strong>de</strong> verse influenciada por las tarifas existentes o, incluso, por la disponibilidad <strong>de</strong> los<br />

usuarios. A<strong>de</strong>más, el promedio <strong>de</strong> duración <strong>de</strong> llamada pue<strong>de</strong> variar según las características <strong>de</strong><br />

la zona (p. ej., usuarios en zonas resi<strong>de</strong>nciales tien<strong>de</strong>n a hacer llamadas más largas que usuarios<br />

en un zonas comerciales durante la misma hora).<br />

Duración media llamadas [min]<br />

4<br />

3<br />

2<br />

1<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23<br />

Tiempo (24 horas)<br />

Figura 4-6: Duración media <strong>de</strong> las llamadas durante un día.<br />

4.3.4 Tratamiento <strong>de</strong> los datos<br />

En el apartado anterior se han analizado los rasgos característicos <strong>de</strong> los datos en términos <strong>de</strong><br />

número <strong>de</strong> llamadas realizadas y su duración. Esta sección se encarga <strong>de</strong> revisar en <strong>de</strong>talle otros<br />

aspectos significativos relacionados con los datos <strong>de</strong> llamadas, así como el tratamiento que se ha<br />

realizado sobre ellos para eliminar posibles errores.<br />

■ Radio <strong>de</strong> cobertura <strong>de</strong> las celdas<br />

Cada antena transmite a teléfonos móviles resi<strong>de</strong>ntes en el espacio radioeléctrico <strong>de</strong> su área <strong>de</strong><br />

cobertura <strong>de</strong>nominada celda. Ese área <strong>de</strong> cobertura viene caracterizado por dos radios: i) el<br />

radio total <strong>de</strong> la celda y ii) el radio efectivo. El radio <strong>de</strong> servicio efectivo, <strong>de</strong>finido mediante<br />

niveles potencia <strong>de</strong> señal, es aquel en el cual un teléfono se comunica con una única estación<br />

base servidora. El resto <strong>de</strong>l área <strong>de</strong> servicio se diseña <strong>de</strong> modo que sea gestionado por más<br />

estaciones base, <strong>de</strong>nominándose zona <strong>de</strong> solape. Es necesario tener en cuenta que el radio total<br />

<strong>de</strong> las celdas no es estático, sino que pue<strong>de</strong> variar dinámicamente en función <strong>de</strong> ciertos factores<br />

aleatorios (condiciones metereológicas, carga <strong>de</strong> llamadas...). No obstante, esta incertidumbre<br />

en el radio no afecta a la <strong>de</strong>tección <strong>de</strong> paso <strong>de</strong> terminales <strong>de</strong> una celda a otra <strong>de</strong>bido al propio<br />

concepto <strong>de</strong> frontera observada (Figura 4-2). En ella, se i<strong>de</strong>ntifica la celda don<strong>de</strong> se ubican el


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 77<br />

nodo inicial y final <strong>de</strong> un arco, para conocer los arcos que cruzan una frontera observada. De<br />

modo que la fluctuación <strong>de</strong>l radio no suele tener gran impacto en aquellos nodos ubicados<br />

<strong>de</strong>ntro <strong>de</strong>l radio efectivo <strong>de</strong> una celda, como se aprecia en la Figura 4-7 (a) y (b).<br />

Por otro lado, se ha comentado ya que el área <strong>de</strong> servicio <strong>de</strong> una celda suele superponerse<br />

parcialmente con el <strong>de</strong> una o más <strong>de</strong> sus celdas vecinas. Este solapamiento tiene lugar para<br />

evitar “agujeros” en la cobertura <strong>de</strong>bido a una disminución <strong>de</strong>l nivel <strong>de</strong> potencia <strong>de</strong> señal lejos<br />

<strong>de</strong> la antena servidora. El tamaño <strong>de</strong> la zona <strong>de</strong> solape se <strong>de</strong>termina mediante el establecimiento<br />

<strong>de</strong> un umbral mínimo <strong>de</strong> señal recibida. Éste es un parámetro <strong>de</strong> diseño importante en las re<strong>de</strong>s<br />

celulares puesto que garantiza que un abonado situado cerca <strong>de</strong>l bor<strong>de</strong> <strong>de</strong> una celda pueda<br />

recibir servicio <strong>de</strong> múltiples direcciones en caso que la servidora falle. Más información<br />

respecto al solapamiento entre celdas pue<strong>de</strong> ser encontrada en Thornton y Grace (2005).<br />

Zona <strong>de</strong> solape<br />

j<br />

l 1<br />

(a)<br />

l 2<br />

i<br />

j<br />

l 1<br />

l 2<br />

i<br />

l 1<br />

(b) (c)<br />

Figura 4-7: Ejemplos <strong>de</strong> solapamiento entre celdas.<br />

Un valor típico <strong>de</strong> la zona <strong>de</strong> solape en una celda es el 30–40% <strong>de</strong> la cobertura completa <strong>de</strong> la<br />

celda (EIA/TIA IS-95, 1993). Este valor pue<strong>de</strong> variar <strong>de</strong>pendiendo, entre otros factores, <strong>de</strong> la<br />

<strong>de</strong>nsidad <strong>de</strong> población y/o <strong>de</strong> la interferencia causada por gran<strong>de</strong>s edificios. En general, una<br />

celda tiene 6 celdas vecinas, <strong>de</strong> modo que su área total <strong>de</strong> solape es la suma <strong>de</strong>l solapamiento<br />

con cada una <strong>de</strong> esas vecinas, situándose entonces la zona <strong>de</strong> solape <strong>de</strong> una celda con alguna <strong>de</strong><br />

sus vecinas en torno al 5–7% <strong>de</strong>l total <strong>de</strong> cobertura. En entornos no–urbanos, el radio típico <strong>de</strong><br />

una celda se sitúa alre<strong>de</strong>dor <strong>de</strong> 1 km, por tanto la zona <strong>de</strong> solape entre dos celdas pue<strong>de</strong> llegar a<br />

ser mayor que el área <strong>de</strong>finida para ser representada por un nodo. Cuando ocurre esta situación,<br />

el concepto <strong>de</strong> frontera observada no se cumple puesto que no se satisface la condición <strong>de</strong> estar<br />

el nodo inicial y final en celdas diferentes. En esta situación (Figura 4-7 c), el nodo (inicial o<br />

final) <strong>de</strong> un arco se encuentra en una zona que pertenece a dos celdas, pudiendo ser una <strong>de</strong> ellas<br />

la misma en la que se encuentra el otro nodo (final o inicial). En ese caso, esa frontera no pue<strong>de</strong><br />

ser consi<strong>de</strong>rada como frontera observada al no cumplir la <strong>de</strong>finición. Todo ello sugiere la<br />

necesidad <strong>de</strong> prestar especial atención a la hora <strong>de</strong> i<strong>de</strong>ntificar el conjunto <strong>de</strong> fronteras<br />

observadas dado que no todas las fronteras son susceptibles <strong>de</strong> ser monitorizadas.<br />

j<br />

i<br />

l 2


78 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

■ Tráfico peatonal<br />

La presencia <strong>de</strong> peatones es un aspecto importante a consi<strong>de</strong>rar en la inferencia <strong>de</strong> volúmenes<br />

<strong>de</strong> vehículos mediante la realización <strong>de</strong> llamadas en movilidad. Estas llamadas están asociadas a<br />

terminales <strong>de</strong>splazándose <strong>de</strong> una celda a otra, sin conocer la velocidad a la que lo hacen. Esto<br />

implica que las llamadas en movilidad observadas pue<strong>de</strong>n ser efectuadas por teléfonos en<br />

movimiento tanto a bordo <strong>de</strong> vehículos como <strong>de</strong> peatones en el caso <strong>de</strong> que la frontera entre<br />

celdas esté próxima a entornos urbanos. En base a ese razonamiento, no es posible distinguir<br />

únicamente con datos <strong>de</strong> llamadas si un terminal que se mueve <strong>de</strong> una celda a otra pertenece a<br />

un usuario <strong>de</strong> vehículo o a un peatón. Introduciendo modificaciones en la red, la velocidad <strong>de</strong><br />

traspaso podría ser <strong>de</strong>tectada, resolviéndose así este problema. No obstante, dado que se ha<br />

optado por emplear datos <strong>de</strong> telefonía sin introducir modificaciones, se consi<strong>de</strong>rará que las vías<br />

que soporten tráfico <strong>de</strong> peatones no son válidas para ser monitorizadas. Es <strong>de</strong>cir, si existiera una<br />

frontera entre celdas asociada a ese tipo <strong>de</strong> vías, las llamadas observadas proce<strong>de</strong>rían <strong>de</strong><br />

usuarios <strong>de</strong> diferente tipo <strong>de</strong> movilidad. Como el interés se centra en el estudio <strong>de</strong> vehículos,<br />

cuando una frontera entre celdas esté formada por arcos con un tráfico <strong>de</strong> peatones significativo,<br />

esa frontera es <strong>de</strong>sechada <strong>de</strong>l conjunto <strong>de</strong> fronteras observadas, aunque cumpla la <strong>de</strong>finición <strong>de</strong><br />

frontera observada. Sólo fronteras cuyos arcos no poseen un tráfico <strong>de</strong> peatones significativo<br />

son consi<strong>de</strong>radas como válidas para formar parte <strong>de</strong>l conjunto <strong>de</strong> fronteras observadas. Esto<br />

implica la necesidad <strong>de</strong> un procesado previo para evaluar las fronteras entre celdas y calificarlas<br />

como aptas para el proceso <strong>de</strong> inferencia.<br />

■ Puntos kilométricos en estudio<br />

Se preten<strong>de</strong> <strong>de</strong>terminar el volumen <strong>de</strong> vehículos asociado a un número conocido <strong>de</strong> llamadas en<br />

movilidad generadas en una frontera entre celdas. Para alcanzar este objetivo, se van a plantear<br />

una serie <strong>de</strong> mo<strong>de</strong>los que, con fines predictivos, se encarguen <strong>de</strong> proporcionar esa magnitud <strong>de</strong><br />

un modo similar a las clásicas estaciones <strong>de</strong> aforo. La elaboración <strong>de</strong> esos mo<strong>de</strong>los no es una<br />

tarea sencilla ya que, como se expone más a<strong>de</strong>lante, no existe una <strong>de</strong>pen<strong>de</strong>ncia directa entre<br />

ambas magnitu<strong>de</strong>s. Por ello, una vez <strong>de</strong>finidos los mo<strong>de</strong>los, se va a emplear un histórico <strong>de</strong><br />

datos, tanto <strong>de</strong> llamadas en movilidad como <strong>de</strong> vehículos que han pasado por una zona, no sólo<br />

para llevar a cabo el ajuste <strong>de</strong> parámetros <strong>de</strong> esos mo<strong>de</strong>los sino para la validación <strong>de</strong> las<br />

predicciones realizadas. Así pues, se exige que las fronteras entre celdas dispongan <strong>de</strong> una<br />

estación <strong>de</strong> aforo en las proximida<strong>de</strong>s encargada <strong>de</strong> proporcionar los volúmenes <strong>de</strong> vehículos<br />

que realmente atraviesan la frontera entre celdas para constituir el citado histórico <strong>de</strong> datos.<br />

Asímismo, bajo las condiciones expuestas en el punto anterior, la selección <strong>de</strong> los puntos<br />

kilométricos en los que se localizan las fronteras entre celdas en las que se realizará la


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 79<br />

monitorización estará restringida a zonas en las que sea poco probable que los usuarios en<br />

movilidad existentes se correspondan con peatones. Seleccionando fronteras entre celdas<br />

cruzadas por vías don<strong>de</strong> el tráfico sea esencialmente <strong>de</strong> vehículos, alejadas <strong>de</strong> entornos urbanos,<br />

se elimina el efecto negativo que los peatones introducen. Esta será una condición necesaria<br />

para consi<strong>de</strong>rar como válida la información que se pueda <strong>de</strong>rivar <strong>de</strong> las llamadas.<br />

Finalmente, para i<strong>de</strong>ntificar tales fronteras se realizó un estudio <strong>de</strong> campo sobre vías<br />

pertenecientes a anillos alre<strong>de</strong>dor <strong>de</strong>l área metropolitana <strong>de</strong> <strong>Sevilla</strong>. Una vez conocidos los<br />

puntos <strong>de</strong> la red viaria en los que existen estaciones <strong>de</strong> aforo, se seleccionaron los más<br />

a<strong>de</strong>cuados para realizar el estudio. La Figura 4-8 muestra los 6 puntos kilométricos escogidos<br />

pertenecientes a las vías sobre las que se realiza la monitorización. Estos 6 puntos dan lugar a 12<br />

fronteras observadas, dos para cada punto kilómetrico, estando cada una <strong>de</strong> ellas asociada a un<br />

sentido <strong>de</strong> paso. Sobre esos puntos, el Centro <strong>de</strong> Gestión <strong>de</strong> Tráfico <strong>de</strong> la DGT facilitó las<br />

mediciones <strong>de</strong> intensida<strong>de</strong>s horarias <strong>de</strong> vehículos y VODAFONE los registros <strong>de</strong> llamadas<br />

generados en las celdas implicadas en las fronteras durante los días seleccionados para ser<br />

observados. Con ellos se elaboró el histórico <strong>de</strong> datos que relacionaba número <strong>de</strong> vehículos y <strong>de</strong><br />

llamadas en movilidad {(x1,y1), ..., (xn,yn)}. La Tabla 4-2 muestra los IDs <strong>de</strong> cada una <strong>de</strong> las<br />

fronteras observadas en este estudio.<br />

Figura 4-8: Puntos kilométricos en los que en sus proximida<strong>de</strong>s existe una frontera entre celdas.<br />

ID<br />

Frontera<br />

PK<br />

ID<br />

Frontera<br />

PK<br />

Tabla 4-2: ID fronteras asociados a cada punto kilométrico y sentido.<br />

1 2 3 4 5 6<br />

A 49 PK 46<br />

S.HUELVA<br />

A 4 PK 518<br />

S.MADRID<br />

A 4 PK 488<br />

S.MADRID<br />

A 4 PK 527<br />

S.MADRID<br />

A 92 PK 32<br />

S.MALAGA<br />

A 92 PK 43<br />

S.MALAGA<br />

7 8 9 10 11 12<br />

A 4 PK 518<br />

S.SEV<br />

A 49 PK 46<br />

S.SEV<br />

A 92 PK 32<br />

S.SEV<br />

A 92 PK 43<br />

S.SEV<br />

A 4 PK 488<br />

S.SEV<br />

A 4 PK 527<br />

S.MADRID


80 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

■ Días <strong>de</strong> observación<br />

Los datos con los que se <strong>de</strong>be trabajar proce<strong>de</strong>n <strong>de</strong> medidas u observaciones tomadas a partir <strong>de</strong><br />

la muestra. Dado que se preten<strong>de</strong> que la información extraída sea lo más representativa posible,<br />

se seleccionarán para monitorizar días que, a priori, presentan pocas variaciones respecto a un<br />

día “típico”. Esto implica que las mediciones se <strong>de</strong>ben llevar a cabo en días centrales <strong>de</strong> la<br />

semana: Martes, Miércoles y Jueves. A<strong>de</strong>más, <strong>de</strong>ben estar sujetos a las siguientes condiciones:<br />

no ser festivo, que el día anterior y posterior tampoco sea festivo, y que no pertenezca a una<br />

semana con eventos especiales (Semana Santa, Feria <strong>de</strong> Abril,…). En base a esos criterios, los<br />

días seleccionados para tomar las observaciones <strong>de</strong> los datos <strong>de</strong> llamadas son 18 (martes,<br />

miércoles y jueves <strong>de</strong> 6 semanas), los cuales se muestran en la Tabla 4-3.<br />

MARZO 2008<br />

L M X J V S D<br />

1 2<br />

3 4 5 6 7 8 9<br />

10 11 12 13 14 15 16<br />

17 18 19 20 21 22 23<br />

24 25 26 27 28 29 30<br />

31<br />

■ Horario <strong>de</strong> observación<br />

Tabla 4-3: Días observados.<br />

ABRIL 2008<br />

L M X J V S D<br />

1 2 3 4 5 6<br />

7 8 9 10 11 12 13<br />

14 15 16 17 18 19 20<br />

21 22 23 24 25 26 27<br />

28 29 30<br />

CÓDIGO DE<br />

COLORES<br />

Festivos<br />

Observados<br />

El comportamiento <strong>de</strong> los usuarios a la hora <strong>de</strong> realizar llamadas también está condicionado por<br />

la hora, bien por las tarifas existentes, la jornada laboral o porque en ciertos periodos pue<strong>de</strong> ser<br />

socialmente ina<strong>de</strong>cuado realizar una llamada. Incluso, éste pue<strong>de</strong> verse influido por la celda<br />

según las características <strong>de</strong> la zona a la que da servicio (área resi<strong>de</strong>ncial, centro comercial…).<br />

Prueba <strong>de</strong> ello es que la actividad telefónica durante la franja horaria entre la 1:00 a.m. y 6:00<br />

a.m. es muy reducida, siendo poco probable hacer una llamada; en cambio, a partir <strong>de</strong> las 18:00<br />

aumenta la ten<strong>de</strong>ncia a realizar llamadas por el inicio <strong>de</strong> tarifas reducidas. En este sentido, es<br />

conveniente emplear medidas <strong>de</strong> dispersión para <strong>de</strong>terminar el rango horario don<strong>de</strong> el número<br />

<strong>de</strong> llamadas realizadas no presenta mucha dispersión respecto <strong>de</strong> la media. Una <strong>de</strong> estas<br />

medidas es el coeficiente <strong>de</strong> variación (CV), <strong>de</strong>finido como el cociente entre la <strong>de</strong>sviación típica<br />

y la media, CV �<br />

� , el cual cuantifica la separación (dispersión o variabilidad) <strong>de</strong> los valores<br />

�<br />

<strong>de</strong> la distribución respecto a un valor central. El valor <strong>de</strong>l CV será igual a 0 cuando no existan<br />

diferencias entre los datos, resultando entonces una distribución totalmente homogénea. La


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 81<br />

Figura 4-9 muestra el CV conseguido para las distribuciones <strong>de</strong> llamadas realizadas en cada una<br />

<strong>de</strong> las celdas bajo estudio, proce<strong>de</strong>ntes <strong>de</strong> datos cedidos por VODAFONE.<br />

Coeficiente <strong>de</strong> Variación CV<br />

5<br />

4<br />

3<br />

2<br />

1<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24<br />

Tiempo (24 horas)<br />

Figura 4-9: Coeficiente <strong>de</strong> Variación <strong>de</strong> la distribución <strong>de</strong> llamadas en diferentes celdas.<br />

Des<strong>de</strong> el punto <strong>de</strong> vista práctico, interesa centrar el análisis en un rango horario don<strong>de</strong> las<br />

curvas presenten valores bajos <strong>de</strong> CV. Esto ocurre <strong>de</strong>ntro <strong>de</strong>l intervalo 8:00–21:00 observando<br />

la Figura 4-9, en la cual el valor <strong>de</strong> CV permanece en todo momento por <strong>de</strong>bajo <strong>de</strong> 0.5. Fuera <strong>de</strong><br />

ese intervalo, los valores <strong>de</strong> CV alcanzados son bastante mayores que la unidad, indicando en<br />

ese caso que la realización <strong>de</strong> llamadas posee una variabilidad mayor respecto <strong>de</strong> la media.<br />

Entonces, se tomará como intervalo <strong>de</strong> observación la franja horaria entre las 8:00 y 21:00, en la<br />

cual la realización <strong>de</strong> llamadas respon<strong>de</strong> a un comportamiento, en cierto grado, homogéneo para<br />

todas las celdas. Con ello se consigue que los mo<strong>de</strong>los <strong>de</strong> predicción diseñados sean más<br />

estables para cualquier periodo <strong>de</strong> tiempo comprendido en dicha franja.<br />

Magnitud<br />

1.5<br />

1<br />

0.5<br />

x 104<br />

2<br />

24 horas<br />

12 horas<br />

8 horas<br />

0<br />

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5<br />

Frequencia (1/horas)<br />

Figura 4-10: Densidad Espectral <strong>de</strong> Potencia <strong>de</strong> la distribución <strong>de</strong> llamadas en una celda.<br />

Por otro lado, realizando un análisis <strong>de</strong> la actividad telefónica generada por usuarios <strong>de</strong><br />

teléfonos móviles, se aprecian ciertos ciclos <strong>de</strong> comportamiento relacionados con los patrones<br />

<strong>de</strong> movilidad <strong>de</strong> los usuarios. Analizando la Densidad Espectral <strong>de</strong> Potencia <strong>de</strong> las llamadas<br />

(Figura 4-10), para realizar un estudio en frecuencia, se observan 3 picos en torno a periodos <strong>de</strong><br />

C1<br />

C2<br />

C3<br />

C4<br />

C5<br />

C6<br />

C7<br />

C8<br />

C9<br />

C10<br />

C11<br />

C12


82 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

24 horas, 12 horas y 8 horas, los cuales son representativos <strong>de</strong> la periodicidad <strong>de</strong>l conjunto <strong>de</strong><br />

datos <strong>de</strong> llamadas analizados. Lógicamente, el pico <strong>de</strong> las 24 horas está asociado a la frecuencia<br />

con que los datos <strong>de</strong> llamadas son almacenados. El pico en torno a las 12 horas representa ciclos<br />

repetitivos <strong>de</strong> comportamiento cada 12 horas correspondientes a pautas día/noche. Asimismo, el<br />

pico <strong>de</strong> periodicidad en torno a las 8 horas respon<strong>de</strong> a comportamientos asociados a la jornada<br />

laboral.<br />

4.3.5 Elaboración <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> predicción<br />

4.3.5.1 Introducción<br />

La inferencia estadística es una técnica mediante la cual se <strong>de</strong>ducen propieda<strong>de</strong>s o se hacen<br />

predicciones en base a una información parcial o completa obtenida mediante técnicas<br />

<strong>de</strong>scriptivas sobre individuos <strong>de</strong> una muestra. En nuestro problema en cuestión, se preten<strong>de</strong><br />

pre<strong>de</strong>cir volúmenes <strong>de</strong> tráfico <strong>de</strong> vehículos a partir <strong>de</strong> información <strong>de</strong> llamadas generadas por<br />

una muestra constituida por ciertos teléfonos móviles que van a bordo <strong>de</strong> esos vehículos. Por<br />

ello, inicialmente, se buscó analizar la relación <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia entre vehículos y las<br />

<strong>de</strong>nominadas llamadas en movilidad (Figura 4-1). Para abordar el problema, se ha dispuesto <strong>de</strong><br />

un histórico dado por una muestra bidimensional que relaciona ambas variables<br />

{(x1,y1), ..., (xn,yn)}, siendo xi e yi observaciones <strong>de</strong> llamadas en movilidad y <strong>de</strong> vehículos,<br />

respectivamente, que han pasado por alguna frontera observada entre celdas en un intervalo <strong>de</strong><br />

tiempo ti.<br />

Es en este marco <strong>de</strong> cuantificación <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia entre variables en el que aparecen unas<br />

funciones <strong>de</strong>nominadas cópulas. Las cópulas son una po<strong>de</strong>rosa herramienta para representar las<br />

relaciones <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia entre distintas variables aleatorias a través <strong>de</strong> la distribución <strong>de</strong><br />

probabilidad conjunta (Nelsen, 2006). En base a ellas, la función <strong>de</strong> distribución conjunta <strong>de</strong><br />

una serie <strong>de</strong> variables pue<strong>de</strong> expresarse como la función cópula aplicada sobre las distribuciones<br />

marginales consi<strong>de</strong>radas individualmente, esto es, F(x1,, x2,, …xm) = C(F1(x1), F2(x2), …, Fm(xm)).<br />

Así pues, una cópula, C , es una función <strong>de</strong> distribución multivariante cuyas leyes marginales se<br />

distribuyen uniformemente entre �0 , 1�<br />

. En el caso bivariante, C u,<br />

v)<br />

� p�U<br />

� u,<br />

V � v�<br />

2<br />

función <strong>de</strong> distribución <strong>de</strong>finida en �0,1� �0,1� ( es una<br />

� , don<strong>de</strong> U y V son dos variables aleatorias<br />

uniformemente distribuidas. Entonces, dadas dos variables aleatorias X e Y con distribuciones<br />

marginales FX(x) y FY(y) respectivamente, existe una cópula C, tal que FXY(x,,y)=C(FX(x), FY(y)).<br />

Para la obtención <strong>de</strong> la cópula asociada a las variables <strong>de</strong> interés X (número <strong>de</strong> llamadas en<br />

movilidad) e Y (número <strong>de</strong> vehículos), se ha optado por el cálculo <strong>de</strong> la cópula empírica. Las


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 83<br />

cópulas empíricas fueron estudiadas originalmente por Deheuvels (1979). La i<strong>de</strong>a consiste en<br />

construir una función cópula a partir <strong>de</strong> valores muestrales {(x1,y1), ..., (xn,yn)} recogidos para<br />

las variables univariantes sin establecer <strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong> ningún parámetro. De esta forma, la<br />

cópula es no paramétrica y queda <strong>de</strong>finida únicamente a partir <strong>de</strong> la muestra <strong>de</strong> datos disponible.<br />

Sea (x, y)≡{(x1,y1), ..., (xn,yn)} una muestra <strong>de</strong> tamaño n obtenida a partir <strong>de</strong> una distribución<br />

bivariante (X, Y), la <strong>de</strong>finición <strong>de</strong> cópula empírica (Nelsen, 2006) respon<strong>de</strong> a la expresión:<br />

C<br />

i j<br />

� �<br />

�n n� nº <strong>de</strong> pares ( x, y) <strong>de</strong> la muestra tales que x� x<br />

n<br />

e y� y<br />

n 1<br />

� � I( xk n �<br />

� x() i , yk � y( j)<br />

) i, j �1,....<br />

n<br />

� � () i ( j)<br />

n , � �<br />

k 1<br />

con x(i), e y(j) 1≤ i, j ≤ n, los estadísticos <strong>de</strong> or<strong>de</strong>n <strong>de</strong>finidos a partir <strong>de</strong> la muestra. Deheuvels<br />

(1979) <strong>de</strong>mostró que cuando el tamaño muestral crece, la cópula empírica converge a la cópula<br />

verda<strong>de</strong>ra. Es por ello que la cópula empírica constituye un instrumento a<strong>de</strong>cuado para estudiar,<br />

a gran<strong>de</strong>s rasgos, la relación <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia entre U y V, y por tanto, la relación entre X e Y.<br />

En este sentido, existe una cópula que representa la condición <strong>de</strong> in<strong>de</strong>pen<strong>de</strong>ncia entre variables,<br />

<strong>de</strong>finida como Π(u,v)=u·v. Se dice que dos variables X e Y no son <strong>de</strong>pendientes si y sólo si<br />

C(u,v)=Π(u,v). Cuando C(u,v)≠Π(u,v), las variables X e Y son <strong>de</strong>pendientes y la <strong>de</strong>pen<strong>de</strong>ncia<br />

<strong>de</strong>pen<strong>de</strong> <strong>de</strong> las variables a través <strong>de</strong> transformaciones crecientes no lineales <strong>de</strong> las variables.<br />

Esta es una propiedad <strong>de</strong>stacable <strong>de</strong> las funciones cópula, la posibilidad para <strong>de</strong>tectar<br />

in<strong>de</strong>pen<strong>de</strong>ncia entre variables frente a otras medidas clásicas que no lo permiten como el<br />

coeficiente <strong>de</strong> correlación lineal (que en caso <strong>de</strong> ser cero, únicamente permite confirmar la<br />

ausencia <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia lineal entre las variables).<br />

Una manera sencilla <strong>de</strong> presentar y comparar las cópulas es a través <strong>de</strong> los diagramas <strong>de</strong><br />

contorno. El diagrama <strong>de</strong> contorno <strong>de</strong> una cópula es la representación gráfica <strong>de</strong> sus curvas <strong>de</strong><br />

nivel, las cuales son conjuntos en [0, 1] n dados por C(u,v)=k, con k constante. Empleando estos<br />

diagramas, se pue<strong>de</strong>n comparar la cópula <strong>de</strong> in<strong>de</strong>pen<strong>de</strong>ncia y la cópula empírica obtenida para<br />

el conjunto <strong>de</strong> datos {xi, yi} en los puntos kilométricos o fronteras estudiadas (Figura 4-11). Se<br />

aprecia que ambas cópulas muestran un comportamiento similar. A la vista <strong>de</strong> la similitud entre<br />

ambas cópulas, y dado que la cópula empírica converge hacia la verda<strong>de</strong>ra conforme el tamaño<br />

muestral crece (Deheuvels, 1979), es posible afirmar que las variables X e Y no poseen una<br />

relación <strong>de</strong> <strong>de</strong>pen<strong>de</strong>ncia directa.<br />

(6)


84 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

v=F Y (y)<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0.1<br />

In<strong>de</strong>pen<strong>de</strong>ncia �(u,v)<br />

0.1<br />

0.2<br />

0.3<br />

0.4<br />

0.1<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

u=F (x)<br />

X<br />

0.5<br />

0.3<br />

0.7<br />

0.2<br />

0.6<br />

0.8<br />

0.4<br />

0.9<br />

v=F Y (y)<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0.1<br />

0.1<br />

Copula empirica C(u,v)<br />

0.2<br />

0.3<br />

0.1<br />

0.2<br />

0.4<br />

0.3<br />

0.2<br />

0.1<br />

0<br />

0 0.2 0.4 0.6 0.8 1<br />

u=F (x)<br />

X<br />

(a) (b)<br />

Figura 4-11: Diagrama <strong>de</strong> contorno <strong>de</strong> isoprobabilidad <strong>de</strong> la cópula in<strong>de</strong>pen<strong>de</strong>ncia y la empírica.<br />

En estas condiciones, se hace necesario introducir en los mo<strong>de</strong>los otras <strong>de</strong>pen<strong>de</strong>ncias que se<br />

encarguen <strong>de</strong> medir esa relación <strong>de</strong>sconocida entre X e Y que no tiene por qué ser cuantificable<br />

por un único parámetro. A la vista <strong>de</strong>l análisis <strong>de</strong>scriptivo <strong>de</strong> los datos <strong>de</strong> llamadas, <strong>de</strong>finir<br />

mo<strong>de</strong>los en los que, a<strong>de</strong>más <strong>de</strong> las llamadas en movilidad, intervenga una <strong>de</strong>pen<strong>de</strong>ncia temporal<br />

parece lo más intuitivo. Des<strong>de</strong> el enfoque <strong>de</strong> datos discretos, existe una amplia gama <strong>de</strong><br />

mo<strong>de</strong>los estadísticos con capacidad <strong>de</strong> predicción como mo<strong>de</strong>los lineales generalizados,<br />

mo<strong>de</strong>los paramétricos, etc. En los siguientes apartados se van a plantear una serie <strong>de</strong> mo<strong>de</strong>los<br />

empleando ecuaciones paramétricas para mo<strong>de</strong>lar la relación entre las variables Y (número <strong>de</strong><br />

vehículos) y X (número <strong>de</strong> llamadas en movilidad), junto a otros términos <strong>de</strong>pendientes, <strong>de</strong> cara<br />

a que los mo<strong>de</strong>los puedan ser utilizados con un objetivo predictivo.<br />

Para la elección <strong>de</strong>l mo<strong>de</strong>lo más a<strong>de</strong>cuado parece conveniente <strong>de</strong>cidirse por aquél que mejores<br />

resultados proporcione. Como se ha comentado, para abordar el problema se dispone <strong>de</strong> un<br />

histórico dado por una muestra bidimensional que relaciona ambas variables. En este sentido,<br />

para cada uno <strong>de</strong> los días observados se dispone <strong>de</strong> una muestra formada por 13 parejas <strong>de</strong><br />

datos: número <strong>de</strong> llamadas y número <strong>de</strong> vehículos registrados cada hora <strong>de</strong>s<strong>de</strong> las 8:00 a las<br />

21:00. Con objeto <strong>de</strong> disponer <strong>de</strong> un tamaño <strong>de</strong> muestra suficiente para ajustar un mo<strong>de</strong>lo, se<br />

obtuvo para cada punto kilométrico una muestra mayor mediante la agregación <strong>de</strong> los D días<br />

observados (D=18) en una sola muestra. Finalmente, el tamaño <strong>de</strong> la muestra resultante,<br />

{(x1,y1), ..., (xn,yn)}, ha sido <strong>de</strong> n=234 registros (18×13) para cada uno <strong>de</strong> los K=12 puntos<br />

kilométricos estudiados. De modo que el estudio predictivo hará uso <strong>de</strong> esas variables para<br />

ajustar los parámetros <strong>de</strong> los mo<strong>de</strong>los. Esos parámetros se encargarán <strong>de</strong> cuantificar<br />

a<strong>de</strong>cuadamente la relación entre las variables <strong>de</strong> cara a que el mo<strong>de</strong>lo proporcione medidas<br />

admisibles <strong>de</strong> volúmenes <strong>de</strong> vehículos sin necesidad <strong>de</strong> instalar una estación <strong>de</strong> aforo en la zona.<br />

0.5<br />

0.6<br />

0.4<br />

0.7<br />

0.3<br />

0.8<br />

0.6<br />

0.5<br />

0.9<br />

1<br />

0.9<br />

0.8<br />

0.7<br />

0.6<br />

0.5<br />

0.4<br />

0.3<br />

0.2<br />

0.1


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 85<br />

Lógicamente es imposible pre<strong>de</strong>cir con total exactitud, por lo que los resultados obtenidos por<br />

los mo<strong>de</strong>los contendrán ciertos errores <strong>de</strong> predicción. En este sentido, es importante indicar que<br />

no todo el histórico será utilizado para el proceso <strong>de</strong> estimación <strong>de</strong> parámetros, ya que una parte<br />

<strong>de</strong>l histórico, <strong>de</strong>nominada conjunto <strong>de</strong> validación, estará reservada para ser utilizada con<br />

posterioridad en la evaluación <strong>de</strong> las predicciones realizadas, no participando en el ajuste. Por lo<br />

general, se reserva una tercera o cuarta parte <strong>de</strong> los datos disponibles para validar los resultados.<br />

El resto <strong>de</strong>l histórico se utilizará para realizar los ajustes y recibe el nombre <strong>de</strong> conjunto <strong>de</strong><br />

entrenamiento.<br />

En la notación <strong>de</strong> los mo<strong>de</strong>los que a continuación se van a formular se empleará el índice i para<br />

<strong>de</strong>signar el intervalo horario, d para el día observado, y k para el punto kilométrico o frontera.<br />

4.3.5.2 Mo<strong>de</strong>lo basado en la probabilidad <strong>de</strong> llamada y probabilidad <strong>de</strong> handover<br />

Se va a plantear un mo<strong>de</strong>lo <strong>de</strong> predicción basado en el fenómeno físico asociado a las llamadas<br />

en movilidad (Figura 4-1). Para <strong>de</strong>finirlo se ha consi<strong>de</strong>rado que un teléfono móvil ha efectuado<br />

una llamada en movilidad cuando el usuario o bien ha realizado una llamada en cada una <strong>de</strong> las<br />

dos celdas que componen la frontera en un pequeño intervalo <strong>de</strong> tiempo (suceso M), o bien<br />

realiza una llamada en su celda origen con la suficiente duración como para que se efectúe el<br />

handover (suceso L).<br />

Es importante <strong>de</strong>stacar que, aunque el suceso M exige la realización <strong>de</strong> dos llamadas, sólo se<br />

contabiliza como una única llamada en movilidad dado que el concepto <strong>de</strong> movilidad se asocia<br />

únicamente al terminal <strong>de</strong>s<strong>de</strong> el cual se han realizado las dos llamadas, necesarias para la<br />

<strong>de</strong>tección <strong>de</strong> movimiento.<br />

A la vista <strong>de</strong> estas situaciones, parece lógico que las observaciones <strong>de</strong> llamadas en movilidad<br />

estén afectadas por el hecho <strong>de</strong> que las llamadas se realicen en periodos <strong>de</strong> tiempo don<strong>de</strong> sea<br />

más o menos probable realizarlas. A<strong>de</strong>más, en el caso <strong>de</strong> handovers, la duración <strong>de</strong> las llamadas<br />

también afectará a esas observaciones ya que, cuanto mayor sea la duración <strong>de</strong> una llamada,<br />

más probable será que se inicie un handover si el teléfono está en movimiento. Por ello, la<br />

<strong>de</strong>pen<strong>de</strong>ncia temporal <strong>de</strong>l comportamiento <strong>de</strong> los usuarios al realizar llamadas, puesta <strong>de</strong><br />

manifiesto al comprobar como el número total <strong>de</strong> llamadas y su duración media varían a lo largo<br />

<strong>de</strong>l día (apartado 4.3.3), <strong>de</strong>be ser consi<strong>de</strong>rada a la hora <strong>de</strong> diseñar un mo<strong>de</strong>lo que permita<br />

estimar el número <strong>de</strong> vehículos conocido un número <strong>de</strong> llamadas en movilidad.<br />

Para la formulación <strong>de</strong> un mo<strong>de</strong>lo teórico que represente con fi<strong>de</strong>lidad la relación entre el<br />

número <strong>de</strong> llamadas en movilidad y el <strong>de</strong> vehículos, se plantea una expresión que mo<strong>de</strong>le cada<br />

una <strong>de</strong> las situaciones anteriormente citadas haciendo uso <strong>de</strong> parámetros característicos <strong>de</strong> las


86 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

llamadas, como probabilidad <strong>de</strong> hacer una llamada o su duración, según el intervalo horario ti y<br />

la frontera observada k. Cabe resaltar que la naturaleza <strong>de</strong> las celdas estudiadas, alejadas <strong>de</strong><br />

entornos urbanos, permite suponer que prácticamente la totalidad <strong>de</strong> las llamadas en movilidad<br />

observadas el intervalo horario ti y la frontera k, nll mov(ti, k), serán realizadas por usuarios en<br />

movimiento asociados al tráfico vehicular sobre las vías existentes en esa frontera. Estos<br />

usuarios constituyen, por tanto, una muestra <strong>de</strong> la población <strong>de</strong> vehículos que han cruzado la<br />

frontera k en cada intervalo ti, nveh(ti, k).<br />

Respecto al primer tipo <strong>de</strong> llamadas en movilidad (suceso M), se hace necesario introducir un<br />

término que refleje la importancia <strong>de</strong> la probabilidad <strong>de</strong> que un teléfono <strong>de</strong>l operador<br />

monitorizado, y a bordo <strong>de</strong> un vehículo, realice dos llamadas en el intervalo horario ti. Teniendo<br />

en cuenta que el evento “hacer dos llamadas a bordo <strong>de</strong> vehículo con el operador <strong>de</strong> interés” es<br />

una superposición <strong>de</strong> dos realizaciones in<strong>de</strong>pendientes <strong>de</strong>l evento A≡“hacer una llamada a<br />

bordo <strong>de</strong> vehículo con el operador <strong>de</strong> interés”, y consi<strong>de</strong>rando que este evento A tiene una<br />

probabilidad <strong>de</strong> éxito que varía con el tiempo, PA≡Pll veh(ti), entonces la probabilidad <strong>de</strong> éxito <strong>de</strong>l<br />

suceso M se pue<strong>de</strong> aproximar por Pll veh(ti)·Pll veh(ti). Dado que se asume que la población que<br />

genera las llamadas en movilidad son el conjunto <strong>de</strong> vehículos que han cruzado la frontera,<br />

nveh(ti, k), el número <strong>de</strong> llamadas en movilidad originadas por el suceso M vendrá dado por:<br />

2<br />

n ( t , k ) =n ( t , k)· P =n ( t , k)· P ( t )· P ( t ) � n ( t , k)· P ( t ) (7)<br />

M i veh i M veh i ll veh i ll veh i veh i ll veh i<br />

Para el segundo tipo <strong>de</strong> llamada en movilidad (suceso L), el planteamiento es similar pero<br />

introduciendo un término relacionado con la probabilidad <strong>de</strong> que la llamada ejecute handover.<br />

Así pues, la probabilidad <strong>de</strong> éxito <strong>de</strong> este suceso L precisa <strong>de</strong> dos terminos; por un lado, la antes<br />

mencionada probabilidad <strong>de</strong> A≡“hacer una llamada a bordo <strong>de</strong> vehículo con el operador <strong>de</strong><br />

interés”, y por otro, la probabilidad <strong>de</strong> que dicha llamada requiera handover, Ph. Respecto a ello,<br />

la probabilidad <strong>de</strong> que sobre una llamada se ejecute un handover viene dada por el hecho <strong>de</strong> que<br />

la duración <strong>de</strong> la misma, td, supere el tiempo <strong>de</strong> permanencia en la celda, tp. Asumiendo que la<br />

población que genera las llamadas en movilidad es el conjunto <strong>de</strong> vehículos que han cruzado la<br />

frontera, nveh(ti, k), el número <strong>de</strong> llamadas en movilidad generadas en las condiciones asociadas<br />

al suceso L vendría <strong>de</strong>finido como:<br />

nL( ti, k ) =nveh ( ti, k)· P L =nveh ( ti, k)· Pllveh ( ti)· Ph( ti, k )<br />

(8)<br />

El total <strong>de</strong> llamadas en movilidad observadas en el intervalo horario ti se correspon<strong>de</strong> con la<br />

suma <strong>de</strong> ambos conjuntos <strong>de</strong> llamadas {nM y nL}, obteniéndose una expresión en la que el valor<br />

observado <strong>de</strong> las llamadas en movilidad se correspon<strong>de</strong> con la media <strong>de</strong> vehículos que realizan<br />

una llamada en movilidad:


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 87<br />

n t k n t k P t n t k P t P t k<br />

2<br />

ll mov ( i , ) � veh ( i , )· ll veh ( i ) � veh ( i , )· ll veh ( i )· h ( i , )<br />

�n t k P t �P<br />

t P t k<br />

2<br />

veh ( i , )·[ ll veh ( i ) ll veh ( i )· h ( i , )]<br />

Esta expresión es obtenida consi<strong>de</strong>rando <strong>de</strong>spreciable la probabilidad <strong>de</strong> sucesos tales como que<br />

se realicen dos llamadas <strong>de</strong>s<strong>de</strong> el mismo vehículo en la misma celda, o que se llame en cada<br />

celda efectuando adicionalmente el proceso <strong>de</strong> handover. Dichos sucesos, posibles en la<br />

realidad, no llegaron a presentarse en ninguna ocasión sobre la muestra tomada en los puntos<br />

monitorizados, por lo que no fueron consi<strong>de</strong>rados como situaciones en movilidad factibles.<br />

Atendiendo a la expresión anterior, la probabilidad <strong>de</strong> que un terminal efectúe una llamada en<br />

movilidad, <strong>de</strong>nominada P(ti,k), pue<strong>de</strong> aproximarse por:<br />

Pt k � P t �Pt� P t k<br />

(10)<br />

2<br />

( i , ) ll veh ( i ) ll veh ( i ) h ( i , )<br />

Entonces, el número <strong>de</strong> vehículos que cruzan una frontera k en el intervalo horario ti vendrá<br />

dado por:<br />

nll mov ( ti, k) nll mov ( ti, k)<br />

nllmov ( ti, k) � P( ti, k)· nveh ( ti, k) � nveh ( ti, k)<br />

� �<br />

(11)<br />

2<br />

Pt ( , k) P ( t) � P ( t)· P( t, k)<br />

i ll veh i ll veh i h i<br />

Esta expresión proporciona un valor para el volumen <strong>de</strong> vehículos que pasan por frontera entre<br />

celdas en función <strong>de</strong> las llamadas en movilidad <strong>de</strong>tectadas y otras variables relacionadas con las<br />

llamadas. El número <strong>de</strong> llamadas en movilidad asociadas al cruce <strong>de</strong> una frontera en el intervalo<br />

horario dado, nll mov(ti, k), se obtiene mediante un análisis <strong>de</strong> los registros <strong>de</strong> llamadas realizadas<br />

sobre las celdas implicadas en la frontera k, proporcionados por el operador. Para los otros<br />

términos: probabilidad <strong>de</strong> que un vehículo haga una llamada y probabilidad <strong>de</strong> handover, Pll veh y<br />

Ph respectivamente, se precisa <strong>de</strong> un tratamiento estadístico adicional atendiendo a la<br />

<strong>de</strong>pen<strong>de</strong>ncia temporal <strong>de</strong> las características <strong>de</strong> las llamadas. Los siguientes puntos exponen en<br />

<strong>de</strong>talle el método <strong>de</strong>sarrollado para la obtención <strong>de</strong> los citados términos.<br />

■ Probabilidad <strong>de</strong> hacer una llamada a bordo <strong>de</strong> vehículo con el operador <strong>de</strong> interés, Pll veh(ti)<br />

Es habitual que un conjunto <strong>de</strong> datos siga algún tipo <strong>de</strong> distribución estadística. Definir<br />

a<strong>de</strong>cuadamente la probabilidad <strong>de</strong> éxito <strong>de</strong> algún suceso pue<strong>de</strong> resultar tedioso si no se conoce<br />

esa distribución. La propia representación <strong>de</strong> los valores nos pue<strong>de</strong> sugerir el empleo <strong>de</strong> alguna<br />

<strong>de</strong> las muchas distribuciones conocidas (Poisson, Uniforme, Normal, etc.), <strong>de</strong>terminando así la<br />

que mejor se ajuste a los datos. Sin embargo, hay algunas formas <strong>de</strong> acercarse a tal término <strong>de</strong><br />

probabilidad sin necesidad <strong>de</strong>l conocimiento previo <strong>de</strong> la distribución; tal es el caso <strong>de</strong> un<br />

procedimiento empírico en el cual la asignación <strong>de</strong> las probabilida<strong>de</strong>s <strong>de</strong> los sucesos <strong>de</strong> interés<br />

se basa en la información observada. En esos casos, se requiere realizar un gran número <strong>de</strong><br />

experimentos para hallar la probabilidad <strong>de</strong> éxito <strong>de</strong>l suceso, en nuestro caso la probabilidad <strong>de</strong><br />

(9)


88 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

hacer una llamada a bordo <strong>de</strong> un vehículo con el operador monitorizado (Vodafone). Bajo este<br />

enfoque empírico, la probabilidad se <strong>de</strong>termina sobre la base <strong>de</strong> la proporción <strong>de</strong> veces que<br />

ocurre un evento favorable o éxitos respecto al total <strong>de</strong> resultados posibles.<br />

Nº veces que ocurre el evento <strong>de</strong> interés<br />

Nº total <strong>de</strong> resultados posibles<br />

Como ya se ha comentado anteriormente, la naturaleza <strong>de</strong> las celdas estudiadas, alejadas <strong>de</strong><br />

entornos urbanos y <strong>de</strong> zonas resi<strong>de</strong>nciales, permite suponer que prácticamente la totalidad <strong>de</strong> las<br />

llamadas en movilidad observadas en cada una <strong>de</strong> las fronteras serán realizadas por usuarios<br />

inmersos en el tráfico vehicular. Así pues, la probabilidad <strong>de</strong> “hacer una llamada a bordo <strong>de</strong><br />

vehículo con el operador <strong>de</strong> interés”, Pll veh(ti), será igual al número <strong>de</strong> llamadas <strong>de</strong> dicho<br />

operador realizadas a bordo <strong>de</strong> vehículos en el intervalo horario ti divido por el número <strong>de</strong> total<br />

<strong>de</strong> vehículos que han pasado en dicho intervalo:<br />

Nº veces que ocurre el evento <strong>de</strong> interés Nº llamadas realizadas por vehículos<br />

�<br />

Nº total <strong>de</strong> resultados posibles t Nº total <strong>de</strong> vehículos cruzan fronteras ti<br />

i<br />

En esta expresión, el número total <strong>de</strong> vehículos que cruzan las fronteras se conoce a partir <strong>de</strong> las<br />

estaciones <strong>de</strong> aforo existentes en las proximida<strong>de</strong>s <strong>de</strong> cada frontera. Por otro lado, el término <strong>de</strong><br />

llamadas <strong>de</strong>l operador <strong>de</strong> interés realizadas <strong>de</strong>s<strong>de</strong> vehículos estará relacionado directamente con<br />

las llamadas en movilidad observadas. Teniendo en cuenta que una llamada en movilidad<br />

originada por el suceso M implica la realización <strong>de</strong> dos llamadas por parte <strong>de</strong>l terminal que viaja<br />

a bordo <strong>de</strong>l vehículo, la probabilidad <strong>de</strong> “hacer una llamada a bordo <strong>de</strong> vehículo con el operador<br />

<strong>de</strong> interés” en el intervalo horario ti se <strong>de</strong>fine como:<br />

D K<br />

�n ( t , k) �2 �n<br />

( t , k)<br />

�<br />

� L i, d M i, d �<br />

d�1 k�1<br />

ll veh ( i ) �<br />

D K<br />

P t<br />

��<br />

��<br />

d�1 k�1<br />

n ( t , k)<br />

veh i, d<br />

siendo K el número total <strong>de</strong> fronteras estudiadas y D el número total <strong>de</strong> días observados. Como<br />

se pue<strong>de</strong> notar, se ha establecido una <strong>de</strong>pen<strong>de</strong>ncia según el intervalo horario ti consi<strong>de</strong>rado. A la<br />

vista <strong>de</strong> las conclusiones alcanzadas en la sección 4.3.3, la fuerte <strong>de</strong>pen<strong>de</strong>ncia temporal<br />

existente en el comportamiento <strong>de</strong> los usuarios para la realización <strong>de</strong> llamadas también influye<br />

en esta probabilidad. La Figura 4-12, que representa la probabilidad Pll veh(ti) obtenida<br />

empíricamente, refleja tal variación con el tiempo. Cabe <strong>de</strong>stacar que esta probabilidad Pll veh(ti)<br />

es válida para cualquiera <strong>de</strong> las fronteras monitorizadas ya que el evento “hacer llamada a bordo<br />

<strong>de</strong> vehículo con el operador <strong>de</strong> interés” es in<strong>de</strong>pendiente <strong>de</strong> la celda en la que se haga, salvo<br />

quizá zonas agrestes <strong>de</strong> difícil conducción en las que la incomodidad <strong>de</strong>l viaje hace poco<br />

<strong>de</strong>seable la realización <strong>de</strong> una llamada. No obstante, sería interesante recalibrar dicha<br />

(12)


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 89<br />

probabilidad cada cierto tiempo para aten<strong>de</strong>r posibles modificaciones en la red viaria, como<br />

creación <strong>de</strong> nuevas vías cruzando una frontera, o cambios en la conducta <strong>de</strong> los usuarios al<br />

realizar llamadas.<br />

P ll veh (t i )<br />

0.015<br />

0.01<br />

0.005<br />

0<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario t<br />

i<br />

Figura 4-12: Probabilidad <strong>de</strong> hacer una llamada a bordo <strong>de</strong> vehículo.<br />

Se aprecia que esta probabilidad <strong>de</strong> hacer una llamada a bordo <strong>de</strong> un vehículo por parte <strong>de</strong><br />

usuarios en movilidad sigue en gran medida los patrones <strong>de</strong> la actividad telefónica diaria<br />

reflejados en la Figura 4-3 (cualquier usuario). El pico <strong>de</strong> mañana se centra en torno al mismo<br />

rango horario en ambos casos; mientras que el pico <strong>de</strong> la tar<strong>de</strong> está más suavizado en el caso <strong>de</strong><br />

llamadas realizadas por usuarios en movilidad. Esta característica pue<strong>de</strong> tener su origen en que,<br />

durante la jornada laboral, el hecho <strong>de</strong> estar en movimiento no impi<strong>de</strong> que los usuarios realicen<br />

llamadas cuando así lo requieran. Mientras que, fuera <strong>de</strong> ese horario laboral, el usuario es más<br />

reacio a llamar mientras esté en movimiento. De ahí la menor ten<strong>de</strong>ncia a realizar llamadas<br />

fuera <strong>de</strong> la jornada laboral en el caso <strong>de</strong> usuarios en movimiento.<br />

■ Probabilidad <strong>de</strong> handover Ph(t i, k)<br />

Se consi<strong>de</strong>ra a continuación un escenario <strong>de</strong> handover simplificado (Sallent et al., 2003),<br />

suponiendo un sistema celular regular con celdas por las cuales discurren una serie <strong>de</strong> vías. Se<br />

mo<strong>de</strong>la la distancia que recorre un móvil <strong>de</strong>ntro <strong>de</strong> una celda antes <strong>de</strong> cruzar la frontera <strong>de</strong> esa<br />

celda como una variable aleatoria con distribución uniforme en el intervalo [0, L] metros. El<br />

tiempo <strong>de</strong> permanencia en la celda, tp, si el móvil se <strong>de</strong>splaza a velocidad uniforme <strong>de</strong> V m/s<br />

será también una variable aleatoria con distribución uniforme en el intervalo tp� [0, L/V]<br />

segundos, <strong>de</strong> manera que su función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad vendrá dada por:<br />

1 � L �<br />

f( tp) � tp�<br />

0,<br />

LV / � V�<br />

� � (13)<br />

Si la duración <strong>de</strong> la llamada, td, pue<strong>de</strong> mo<strong>de</strong>larse como una variable aleatoria exponencial <strong>de</strong><br />

media Tc segundos, su correspondiente función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad se expresa como:


90 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

t<br />

d<br />

1 �<br />

Tc<br />

f( td) � e td<br />

��0, �� �<br />

(14)<br />

T<br />

c<br />

La probabilidad <strong>de</strong> que dicho usuario <strong>de</strong>ba efectuar un handover a lo largo <strong>de</strong> la llamada viene<br />

dada por el hecho <strong>de</strong> que la duración <strong>de</strong> la misma supere el tiempo <strong>de</strong> permanencia en la celda.<br />

Así, la probabilidad <strong>de</strong> handover pue<strong>de</strong> calcularse a partir <strong>de</strong> un ejercicio <strong>de</strong> probabilidad<br />

condicionada:<br />

L<br />

V<br />

P �� P( t �t<br />

| t ) f( t ) dt<br />

(15)<br />

h d p p p p<br />

0<br />

A su vez, la probabilidad condicionada <strong>de</strong> que la duración <strong>de</strong> la llamada sea superior al tiempo<br />

<strong>de</strong> permanencia en la celda vale:<br />

�<br />

t p<br />

�<br />

Tc<br />

P( td �tp | t p) �� f ( td) dtd �e<br />

(16)<br />

L<br />

Definiendo el factor <strong>de</strong> movilidad como � � , finalmente se tiene que:<br />

VT · c<br />

t p<br />

h<br />

L<br />

V<br />

tp �<br />

Tc p<br />

L<br />

V<br />

tp<br />

�<br />

Tc<br />

p<br />

0 0<br />

1 1 ��<br />

L<br />

P � e f( t ) � e dt � �1 e � con �<br />

LV / � � � � �<br />

VT ·<br />

� � (17)<br />

La Figura 4-13 representa la probabilidad <strong>de</strong> handover en función <strong>de</strong>l factor <strong>de</strong> movilidad α. De<br />

la lectura <strong>de</strong> la ecuación (17) se pue<strong>de</strong> concluir afirmando que será más fácil que la llamada<br />

<strong>de</strong>ba ejecutar un handover:<br />

P h<br />

1. Cuanto más pequeñas sean las distancias a recorrer (menor L).<br />

2. Cuanto mayor sea la velocidad <strong>de</strong>l móvil (mayor V).<br />

3. Cuanto más larga sea la duración <strong>de</strong> las llamadas (mayor Tc).<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

0 1 2 3 4 5 6 7 8 9 10<br />

Factor <strong>de</strong> movilidad �=L/VTc Figura 4-13: Probabilidad <strong>de</strong> handover Ph según el el factor <strong>de</strong> movilidad α.<br />

Cabe <strong>de</strong>stacar que α <strong>de</strong>pen<strong>de</strong> <strong>de</strong> 3 parámetros: longitud L, velocidad V y duración media <strong>de</strong> la<br />

llamada Tc. Respecto al parámetro L, al tratarse <strong>de</strong> la distancia que <strong>de</strong>be recorrer un móvil<br />

c


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 91<br />

<strong>de</strong>ntro <strong>de</strong> una celda hasta entrar en otra celda (cruzar la frontera), esta longitud <strong>de</strong>pen<strong>de</strong> <strong>de</strong> las<br />

vías existentes <strong>de</strong>ntro <strong>de</strong> la celda origen <strong>de</strong> la frontera. Algo similar ocurre con la velocidad, V,<br />

don<strong>de</strong> su valor <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l tipo <strong>de</strong> vía que tenga asociada (autovía, carretera nacional,…).<br />

Aunque la velocidad podría oscilar para la misma vía según el intervalo horario <strong>de</strong>bido, por<br />

ejemplo, al nivel <strong>de</strong> saturación que experimente, se consi<strong>de</strong>rará como uniforme <strong>de</strong>ntro <strong>de</strong> la<br />

celda origen <strong>de</strong> la frontera. Por ello, el valor <strong>de</strong> α <strong>de</strong>pen<strong>de</strong>rá muy estrechamente <strong>de</strong> la frontera k<br />

observada en términos <strong>de</strong> longitud y velocidad asociada a la vía que discurre por la celda origen<br />

<strong>de</strong> esa frontera. De igual modo, teniendo en cuenta la <strong>de</strong>pen<strong>de</strong>ncia temporal <strong>de</strong> la duración <strong>de</strong><br />

las llamadas (apartado 4.3.3), α también <strong>de</strong>pen<strong>de</strong>rá <strong>de</strong>l intervalo horario analizado. Así pues, el<br />

valor <strong>de</strong> la probabilidad <strong>de</strong> handover será función <strong>de</strong>l intervalo horario y <strong>de</strong> la frontera, Ph(ti ,k,).<br />

Para el cálculo <strong>de</strong> la longitud L se podría realizar un estudio previo que utilizara información <strong>de</strong><br />

cobertura proporcionada por el operador, permitiendo <strong>de</strong>finir, con ayuda <strong>de</strong> un GIS, la longitud<br />

<strong>de</strong>l tramo que <strong>de</strong>be recorrer un móvil <strong>de</strong>ntro <strong>de</strong> una celda hasta entrar en otra. No obstante,<br />

existen funcionalida<strong>de</strong>s básicas en la red que permiten conocer el i<strong>de</strong>ntificador <strong>de</strong> la celda<br />

(antena) a la que está conectado un teléfono. De manera que, con ayuda <strong>de</strong> un GPS, es posible<br />

establecer una correspon<strong>de</strong>ncia entre punto kilométrico <strong>de</strong> una vía y celda que le da servicio. En<br />

base a esto, se pue<strong>de</strong> conocer no sólo la longitud <strong>de</strong>l tramo que recorre un móvil <strong>de</strong>ntro <strong>de</strong> una<br />

celda, sino la velocidad media <strong>de</strong> viaje por dicho tramo en cualquier momento <strong>de</strong>l día, todo ello<br />

sin necesitar que el operador revele información confi<strong>de</strong>ncial <strong>de</strong> cobertura. Con esta sencilla<br />

aplicación, implementada sobre dispositivos móviles (BlackBerry, Windows Mobile,…), se<br />

recorrerían varias veces los tramos <strong>de</strong> vía mediante la técnica <strong>de</strong> coche flotante, a fin <strong>de</strong> po<strong>de</strong>r<br />

caracterizar la celda origen <strong>de</strong> cada frontera k en términos <strong>de</strong> longitud L y velocidad V.<br />

Por último, faltaría estimar la duración media <strong>de</strong> la llamada Tc para <strong>de</strong>terminar completamente<br />

el valor <strong>de</strong> α y, por consiguiente, <strong>de</strong> la probabilidad <strong>de</strong> handover. Esta duración es posible<br />

obtenerla empíricamente mediante el análisis <strong>de</strong> los datos <strong>de</strong> llamadas proporcionados por el<br />

operador. Consi<strong>de</strong>rando la <strong>de</strong>pen<strong>de</strong>ncia temporal puesta <strong>de</strong> manifiesto en el apartado 4.3.3, se<br />

<strong>de</strong>termina un valor <strong>de</strong> duración media <strong>de</strong> llamadas según el intervalo horario consi<strong>de</strong>rado, Tc(ti).<br />

Esa duración <strong>de</strong>pendiente <strong>de</strong>l intervalo ti, junto con los valores <strong>de</strong> velocidad y longitud<br />

correspondientes al tramo <strong>de</strong> vía que discurre por la celda origen <strong>de</strong> la frontera k, permiten<br />

<strong>de</strong>finir la probabilidad <strong>de</strong> handover como una función variable con el tiempo y la frontera,<br />

Ph(ti,k,). La Figura 4-14 muestra la probabilidad <strong>de</strong> handover alcanzada en la celda origen <strong>de</strong><br />

una frontera, centrándose en el intervalo 8:00–21:00 según lo expuesto en el apartado 4.3.4.


92 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

P h (t i , k)<br />

0.06<br />

0.05<br />

0.04<br />

0.03<br />

0.02<br />

0.01<br />

0<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario t<br />

i<br />

Figura 4-14: Evolución <strong>de</strong> la probabilidad <strong>de</strong> handover en la celda origen <strong>de</strong> la frontera k según el<br />

intervalo horario ti.<br />

■ Definición <strong>de</strong>l mo<strong>de</strong>lo<br />

Muchos procedimientos estadísticos suponen que los datos siguen algún tipo <strong>de</strong> mo<strong>de</strong>lo<br />

matemático que se <strong>de</strong>fine mediante una ecuación, en la que se <strong>de</strong>sconoce alguno <strong>de</strong> sus<br />

parámetros, siendo éstos calculados o estimados a partir <strong>de</strong> la información obtenida en un<br />

estudio diseñado para tal fin. En este caso, se va a <strong>de</strong>finir un mo<strong>de</strong>lo a partir <strong>de</strong>l fenómeno físico<br />

<strong>de</strong> llamadas en movilidad empleando la expresión teórica <strong>de</strong>l volumen <strong>de</strong> vehículos que pasan<br />

por una frontera k en un intervalo horario ti <strong>de</strong>finida en (11). Tras sustituir las expresiones<br />

anteriores <strong>de</strong> Pllveh ( t i ) y Ph(ti ,k), esa ecuación quedaría expresada como:<br />

n ( t , k) L<br />

n t k t k<br />

ll mov i k<br />

veh ( i , ) � , siendo �(<br />

i , ) �<br />

2<br />

1 ��<br />

( ti, k)<br />

P ( ) ( ) 1<br />

k· c( i)<br />

ll veh t<br />

V T t<br />

i �Pllveh ti� � �e<br />

�<br />

�(<br />

ti, k)<br />

� �<br />

Como ya se comentó, la expresión (18) es obtenida asumiendo una serie <strong>de</strong> hipótesis y<br />

consi<strong>de</strong>rando <strong>de</strong>spreciables sucesos tales como que se llame en cada celda efectuando<br />

adicionalmente el proceso <strong>de</strong> handover, o, incluso, obviando ciertas situaciones en movilidad no<br />

<strong>de</strong>tectadas, como llamadas que terminan antes <strong>de</strong> que el vehículo abandone la celda (no<br />

handover) y, al no realizarse una llamada en la nueva celda, no es <strong>de</strong>tectado. Estos sucesos<br />

inducen pérdidas <strong>de</strong>ben ser consi<strong>de</strong>radas en la <strong>de</strong>finición <strong>de</strong>l mo<strong>de</strong>lo. En este sentido, se<br />

introducen una serie <strong>de</strong> parámetros en la expresión (18) para corregir las in<strong>de</strong>terminaciones<br />

introducidas con las hipótesis necesarias para generar el mo<strong>de</strong>lo, quedando formulado como:<br />

a�x( ti, k) Lk<br />

yt ˆ( i , k) � �d, con �(<br />

ti, k)<br />

�<br />

(19)<br />

2 b1 �b2 ��(<br />

ti, k) P ( ) ( ) 1<br />

Vk· Tc( ti)<br />

ll veh ti�Pllveh ti� � �e ��c<br />

�(<br />

t , k)<br />

� �<br />

i<br />

En ese mo<strong>de</strong>lo, las variables x e y se correspon<strong>de</strong>n, respectivamente, con el número <strong>de</strong> llamadas<br />

en movilidad realizadas entre dos celdas, nll mov(ti, k), y el número <strong>de</strong> vehículos que traspasan<br />

(18)


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 93<br />

una frontera entre esas celdas, nveh(ti, k). La naturaleza <strong>de</strong> los términos y variables implicadas en<br />

el mo<strong>de</strong>lo condiciona que la variable <strong>de</strong> salida sea función <strong>de</strong>l tiempo y el espacio.<br />

Para estimar los parámetros {a,b1,b2,c,d} <strong>de</strong>l mo<strong>de</strong>lo existen diferentes procedimientos <strong>de</strong><br />

ajuste, los cuales utilizarían la parte <strong>de</strong>l histórico que relaciona ambas variables <strong>de</strong>nominada<br />

conjunto <strong>de</strong> entrenamiento para fijar los parámetros. En este caso, se va a emplear una técnica<br />

<strong>de</strong> ajuste <strong>de</strong> parámetros tratando <strong>de</strong> satisfacer algún criterio <strong>de</strong> ajuste. El criterio empleado<br />

atien<strong>de</strong> al error relativo, a la vista <strong>de</strong> que no posee la misma importancia que una estimación<br />

exceda en 50 sobre un valor real <strong>de</strong> 100 que sobre uno <strong>de</strong> 1000, siendo más grave la primera<br />

situación que la última. Así mismo, dado que en este caso tiene la misma importancia errar por<br />

exceso o por <strong>de</strong>fecto, el valor absoluto también <strong>de</strong>be ser consi<strong>de</strong>rado en el criterio. Así pues, el<br />

ajuste buscará la minimización <strong>de</strong> la suma <strong>de</strong>l valor absoluto <strong>de</strong>l error relativo entre valores<br />

observados y mo<strong>de</strong>lados, resolviendo el siguiente problema <strong>de</strong> optimización:<br />

N y ˆ j � yj<br />

Minimizar � , siendo y los valores observados e ˆ<br />

j yj<br />

los valores mo<strong>de</strong>lados<br />

ab , 1, b2, cd , y<br />

j�1 j<br />

La resolución <strong>de</strong> este problema se ha implementado sobre Matlab, resultando los siguientes<br />

valores <strong>de</strong> los parámetros: {a,b1,b2,c,d}≡{2.96417, -43.40174, -0.167134, -0.01205, 707.4249}.<br />

4.3.5.3 Mo<strong>de</strong>los adicionales<br />

El objetivo final <strong>de</strong> esta investigación es correlacionar el volumen <strong>de</strong> vehículos (Y) en una<br />

<strong>de</strong>terminada sección <strong>de</strong>l viario con el número <strong>de</strong> llamadas en movilidad (X) generadas en la<br />

frontera asociada entre celdas. El anterior mo<strong>de</strong>lo estimaba unos valores para ese volumen <strong>de</strong><br />

vehículos a partir <strong>de</strong>l número <strong>de</strong> llamadas en movilidad observado pero, adicionalmente,<br />

introducía una <strong>de</strong>pen<strong>de</strong>ncia temporal y espacial que hacía que las predicciones variaran según el<br />

periodo horario y la frontera en cuestión. Este hecho implica realizar un estudio previo para<br />

caracterizar la frontera en términos <strong>de</strong> longitud y velocidad <strong>de</strong> las vías existentes en la celda<br />

origen correspondiente. En general, lo i<strong>de</strong>al sería emplear mo<strong>de</strong>los que sólo tuvieran<br />

<strong>de</strong>pen<strong>de</strong>ncia con una variable, en este caso, llamadas en movilidad, pero las conclusiones<br />

extraídas <strong>de</strong> las cópulas revelan la imposibilidad <strong>de</strong> emplear ese tipo <strong>de</strong> mo<strong>de</strong>los. Eliminar la<br />

<strong>de</strong>pen<strong>de</strong>ncia espacial evita realizar el estudio para conocer las características geométricas <strong>de</strong><br />

cada frontera monitorizada; en cambio, a la vista <strong>de</strong>l análisis <strong>de</strong>scriptivo <strong>de</strong> datos <strong>de</strong> llamadas,<br />

mantener en la formulación <strong>de</strong> los mo<strong>de</strong>los la <strong>de</strong>pen<strong>de</strong>ncia temporal parece lo más apropiado.<br />

La <strong>de</strong>pen<strong>de</strong>ncia asociada al periodo horario en cuestión es importante puesto que las dos<br />

variables implicadas en el proceso, llamadas realizadas y vehículos circulando, varían en


94 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

función <strong>de</strong>l tiempo <strong>de</strong> una forma diferenciada. Ya se comentó anteriormente que los usuarios<br />

poseen diferentes hábitos en la realización <strong>de</strong> llamadas según la hora consi<strong>de</strong>rada <strong>de</strong>bido a<br />

criterios como tarifas u horario admisible <strong>de</strong> realización <strong>de</strong> llamada. Mientras que, en relación<br />

con el flujo <strong>de</strong> vehículos, éste fluctúa con el tiempo atendiendo a criterios diferentes, como hora<br />

punta por inicio <strong>de</strong> jornada laboral, hora valle, etc.<br />

Llamadas<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223<br />

Intervalo horario t<br />

i<br />

Vehículos<br />

800<br />

600<br />

400<br />

200<br />

0<br />

0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223<br />

Intervalo horario t<br />

i<br />

Figura 4-15: Evolución <strong>de</strong>l nº <strong>de</strong> llamadas y <strong>de</strong> vehículos en una frontera según el intervalo horario.<br />

La Figura 4-15 muestra la variación temporal <strong>de</strong> la intensidad <strong>de</strong>l número <strong>de</strong> llamadas<br />

realizadas y <strong>de</strong>l número <strong>de</strong> vehículos que pasan por una frontera <strong>de</strong>terminada en un día<br />

concreto. Se observa que en ambos casos los periodos horarios <strong>de</strong> mayor intensidad están<br />

próximos en el tiempo pero con cierto <strong>de</strong>sfase; mientras que el pico <strong>de</strong> vehículos aparece en<br />

torno las 7:00 (inicio jornada laboral), a esa hora el número <strong>de</strong> llamadas es bajo ya que es poco<br />

usual realizar llamadas en ese intervalo horario. Este comportamiento es extensible a otras<br />

fronteras. En este sentido, las predicciones <strong>de</strong>ben incluir algún término asociado a esa<br />

variabilidad horaria tanto <strong>de</strong> la intensidad <strong>de</strong> llamadas como <strong>de</strong> la intensidad <strong>de</strong> vehículos. Los<br />

mo<strong>de</strong>los que a continuación se presentan introducen unos factores asociados al tiempo, que<br />

mo<strong>de</strong>lan la <strong>de</strong>pen<strong>de</strong>ncia temporal <strong>de</strong> esas intensida<strong>de</strong>s. El cálculo <strong>de</strong> esos factores <strong>de</strong> intensidad<br />

se realizará <strong>de</strong> modo que sean in<strong>de</strong>pendientes <strong>de</strong> las características <strong>de</strong> la frontera, eliminando la<br />

<strong>de</strong>pen<strong>de</strong>ncia espacial y dando lugar a mo<strong>de</strong>los más versátiles.<br />

■ Factor <strong>de</strong> intensidad <strong>de</strong> vehículos<br />

El factor <strong>de</strong> intensidad, fv, asociado a la variación horaria <strong>de</strong>l flujo <strong>de</strong> vehículos, se <strong>de</strong>fine como:<br />

�<br />

�<br />

�<br />

nveh ( ti)<br />

�<br />

fv( ti)<br />

� , con�<br />

nveh<br />

�<br />

�<br />

�<br />

�<br />

nveh ( ti) es el nº medio <strong>de</strong> vehículos que pasan en el intervalo ti<strong>de</strong><br />

cada uno <strong>de</strong> los<br />

D días observados por las K fronteras, tal que n ( t ) �<br />

1<br />

�<br />

D K<br />

n ( t , k)<br />

��<br />

veh i veh i, d<br />

D�K d�1 k�1<br />

nveh<br />

es el nº medio <strong>de</strong> vehículos que han pasado <strong>de</strong>s<strong>de</strong> las 8h hasta las 21h,<br />

21h<br />

1<br />

tal que nveh � ��nveh<br />

( ti), siendo H el nº <strong>de</strong> intervalos horarios entre 8h-21h<br />

H i�8h


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 95<br />

El factor <strong>de</strong> intensidad es, por tanto, la relación entre el número medio <strong>de</strong> vehículos contados en<br />

un periodo horario ti y el número medio <strong>de</strong>l total <strong>de</strong> vehículos contados <strong>de</strong>s<strong>de</strong> las 8:00 hasta las<br />

21:00. Así pues, este factor se encarga <strong>de</strong> regular las observaciones en cada periodo horario<br />

según su importancia relativa <strong>de</strong>ntro <strong>de</strong> los periodos horarios consi<strong>de</strong>rados. Por ejemplo, en<br />

intervalos horarios don<strong>de</strong> el flujo <strong>de</strong> tráfico tien<strong>de</strong> a ser mayor <strong>de</strong>bido a hora punta, el factor <strong>de</strong><br />

intensidad fv hará que las observaciones <strong>de</strong>staquen sobre las <strong>de</strong> otros intervalos. La Figura 4-16<br />

muestra la variación con el tiempo <strong>de</strong>l factor <strong>de</strong> intensidad fv(ti).<br />

Factor intensidad <strong>de</strong> vehículos f v ( t i )<br />

1.4<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

8h-9h 9h-10h 10h-11h11h-12h 12h-13h 13h-14h 14h-15h15h-16h 16h-17h 17h-18h18h-19h 19h-20h 20h-21h<br />

Intervalo horario t<br />

i<br />

Figura 4-16: Factor <strong>de</strong> intensidad <strong>de</strong>l paso <strong>de</strong> vehículos según el intervalo horario ti.<br />

■ Factor <strong>de</strong> intensidad <strong>de</strong> llamadas<br />

Análogamente, el factor <strong>de</strong> intensidad <strong>de</strong> llamadas, gll, se encarga <strong>de</strong> reflejar la variación<br />

temporal <strong>de</strong>l número <strong>de</strong> llamadas realizadas. Este factor gll se <strong>de</strong>fine como la relación entre la<br />

probabilidad <strong>de</strong> que un vehículo realice una llamada con el operador <strong>de</strong> interés en el intervalo<br />

horario ti, <strong>de</strong>finida en (12), y la probabilidad media en todo el rango horario estudiado,<br />

atendiendo a la siguiente expresión:<br />

� Pllveh ( ti),<br />

es la probabilidad <strong>de</strong> hacer una llamada con el operador <strong>de</strong> interés<br />

Pll veh ( t )<br />

�<br />

i � a bordo <strong>de</strong> vehículo en el intervalo horario ti<br />

,<strong>de</strong>finida en (12)<br />

gll ( ti)<br />

� , don<strong>de</strong> �<br />

P<br />

21h<br />

ll veh � 1<br />

�<br />

Pllveh � � � Pllveh ( ti)<br />

, siendo H el nº <strong>de</strong> intervalos horarios entre 8h-21h<br />

� H i�8h Con ello, se busca regular las observaciones <strong>de</strong> llamadas realizadas en función <strong>de</strong> su<br />

importancia <strong>de</strong>ntro <strong>de</strong> los intervalos horarios consi<strong>de</strong>rados. La Figura 4-17 refleja la variación<br />

con el tiempo <strong>de</strong>l factor <strong>de</strong> intensidad gll (ti), mostrando que en periodos horarios don<strong>de</strong> es más<br />

probable hacer llamadas, este factor <strong>de</strong> intensidad realzará las observaciones.


96 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Cabe <strong>de</strong>stacar que ambos factores <strong>de</strong> intensidad fv (ti) y gll (ti), obtenidos empíricamente con<br />

datos observados, se pue<strong>de</strong>n consi<strong>de</strong>rar válidos durante un cierto tiempo (p.ej: 5 meses), <strong>de</strong>bido<br />

a que las características <strong>de</strong> la muestra son más o menos estables. No obstante, sería aconsejable<br />

realizar un calibrado <strong>de</strong> ambos factores periódicamente, a fin <strong>de</strong> actualizarlos con posibles<br />

cambios <strong>de</strong> ten<strong>de</strong>ncia asociados a los usuarios <strong>de</strong> la vía.<br />

Factor intensidad <strong>de</strong> llamadas g ll ( t i )<br />

1.8<br />

1.6<br />

1.4<br />

1.2<br />

1<br />

0.8<br />

0.6<br />

0.4<br />

0.2<br />

0<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario t<br />

i<br />

Figura 4-17: Factor <strong>de</strong> intensidad <strong>de</strong>l paso <strong>de</strong> vehículos según el intervalo horario ti.<br />

■ Definición <strong>de</strong>l mo<strong>de</strong>lo<br />

Los anteriores factores <strong>de</strong> intensidad fv (ti) y gll (ti) constituyen la base principal en la <strong>de</strong>finición<br />

<strong>de</strong> los nuevos mo<strong>de</strong>los para proporcionar una predicción <strong>de</strong>l número <strong>de</strong> vehículos que<br />

atraviesan una frontera k en función <strong>de</strong>l número <strong>de</strong> llamadas en movilidad observadas nll mov(ti,<br />

k). Es importante resaltar que, a pesar <strong>de</strong> que esas llamadas en movilidad observadas están<br />

asociadas a un punto kilométrico o frontera k, la forma funcional <strong>de</strong> los mo<strong>de</strong>los no tiene en<br />

cuenta esta <strong>de</strong>pen<strong>de</strong>ncia y tratará las observaciones <strong>de</strong> cada frontera <strong>de</strong>l mismo modo.<br />

Así pues, se proponen varios mo<strong>de</strong>los, con diferente número <strong>de</strong> parámetros, para encontrar la<br />

forma funcional que mejor se ajuste al fenómeno. En todos ellos, la variable <strong>de</strong>pendiente es<br />

y(ti,), el número <strong>de</strong> vehículos que cruzan una frontera en un intervalo horario ti.<br />

� �<br />

� Mo<strong>de</strong>lo 1: yˆ 1(<br />

ti) �a� fv ( ti) � gll ( ti)<br />

� �<br />

� Mo<strong>de</strong>lo 2: yˆ 2(<br />

ti) �( a�b�xt ( i )) � fv ( ti) �gll ( ti), don<strong>de</strong> xt ( i ) � nll mov ( ti, k)<br />

� Mo<strong>de</strong>lo 3:<br />

2<br />

� �<br />

yˆ 3(<br />

ti) �( a�b�x( ti) �c�x ( ti)) � fv ( ti) �gll ( ti), don<strong>de</strong> x( ti) � nll mov( ti, k)<br />

El mo<strong>de</strong>lo 1, con 3 parámetros {a, α, β}, carece <strong>de</strong> información sobre el número <strong>de</strong> llamadas en<br />

movilidad observadas. Se ha propuesto para estudiar la importancia <strong>de</strong>l uso <strong>de</strong> las llamadas en<br />

movilidad en la predicción <strong>de</strong>l volumen <strong>de</strong> paso <strong>de</strong> vehículos. El mo<strong>de</strong>lo 2, con 4 parámetros


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 97<br />

{a, b, α, β}, establece una <strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong> primer or<strong>de</strong>n con el número <strong>de</strong> llamadas en<br />

movilidad observadas. Por último, el mo<strong>de</strong>lo 3, con 5 parámetros {a, b, c, α, β}, es similar al<br />

mo<strong>de</strong>lo 2 pero estableciendo una <strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong> segundo or<strong>de</strong>n con el número <strong>de</strong> llamadas en<br />

movilidad observadas.<br />

Así mismo, para estudiar la importancia <strong>de</strong>l uso <strong>de</strong> los factores <strong>de</strong> intensidad fv (ti) y gll (ti) en la<br />

formulación <strong>de</strong>l mo<strong>de</strong>lo, se plantean dos mo<strong>de</strong>los adicionales en los cuales α y β son fijados a<br />

cero, <strong>de</strong>finiendo dos sencillos mo<strong>de</strong>los que únicamente emplean las llamadas en movilidad<br />

observadas. Éstos son los siguientes:<br />

� Mo<strong>de</strong>lo 4: yˆ 4(<br />

ti) �a�b�xt ( i), don<strong>de</strong> xt ( i) � nll mov( ti, k)<br />

, 2 parámetros {a,b}.<br />

� Mo<strong>de</strong>lo 5:<br />

2<br />

yˆ 5(<br />

ti) a b x( ti) c x ( ti), don<strong>de</strong> x( ti) nll mov( ti, k)<br />

� � � � � � , 3 parámetros {a,b,c}<br />

Para la estimación <strong>de</strong> los parámetros <strong>de</strong> cada uno <strong>de</strong> estos cinco mo<strong>de</strong>los, se emplea el mismo<br />

procedimiento presentado en el apartado 4.3.5.2 don<strong>de</strong>, utilizando el conjunto <strong>de</strong> entrenamiento<br />

<strong>de</strong>finido a partir <strong>de</strong>l histórico <strong>de</strong> datos observados, los parámetros son ajustados buscando la<br />

minimización <strong>de</strong> la suma <strong>de</strong>l valor absoluto <strong>de</strong>l error relativo entre valores observados y<br />

mo<strong>de</strong>lados:<br />

N y ˆ j � yj<br />

Minimizar � , siendo y los valores observados e ˆ<br />

j yj<br />

los valores mo<strong>de</strong>lados<br />

parámetros y<br />

j�1 j<br />

La resolución <strong>de</strong> este problema para cada uno <strong>de</strong> los mo<strong>de</strong>los, implementada sobre Matlab, ha<br />

permitido inferir los parámetros que caracterizan los mo<strong>de</strong>los <strong>de</strong> predicción. Estos cinco<br />

mo<strong>de</strong>los, junto al <strong>de</strong>finido en (19), enumerado como mo<strong>de</strong>lo 6 – yˆ 6 � f( x, ti, k)<br />

–, serán<br />

evaluados y comparados entre sí para seleccionar el que proporcione mejores predicciones <strong>de</strong>l<br />

número <strong>de</strong> vehículos que atraviesan una frontera asociado a llamadas en movilidad en ella.<br />

4.3.6 Contraste <strong>de</strong> mo<strong>de</strong>los<br />

4.3.6.1 Introducción<br />

Para abordar la evaluación y comparación entre los seis mo<strong>de</strong>los anteriormente planteados se ha<br />

utilizado el conjunto <strong>de</strong> validación, formado por una parte <strong>de</strong>l histórico <strong>de</strong> valores observados<br />

reservada para este fin. Dada la variedad <strong>de</strong> los mo<strong>de</strong>los, esta comparación se ha realizado en<br />

base a criterios tales como las medidas <strong>de</strong> error clásicas (error medio, error absoluto y relativo,<br />

etc.) o la evaluación <strong>de</strong> la distribución acumulada <strong>de</strong>l error relativo absoluto en términos <strong>de</strong><br />

percentiles. Incluso, se han empleado otros criterios más minuciosos, como la correlación por


98 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

rango (o <strong>de</strong> Spearman) y el coeficiente <strong>de</strong> correlación lineal (o <strong>de</strong> Pearson), para comparar, uno<br />

a uno, los valores yˆ i estimados por cada mo<strong>de</strong>lo frente a los observados yi. Adicionalmente, se<br />

han estudiado otras medidas <strong>de</strong> contraste <strong>de</strong> mo<strong>de</strong>los en las que también se tiene en cuenta la<br />

eficiencia y simplicidad <strong>de</strong> los mo<strong>de</strong>los en términos <strong>de</strong>l número <strong>de</strong> parámetros. Las más<br />

extendidas son el criterio <strong>de</strong> información <strong>de</strong> Akaike, AIC, y criterio <strong>de</strong> información bayesiano,<br />

BIC. Por último, lógicamente, se han comparado los mo<strong>de</strong>los gráficamente, representando en la<br />

misma figura los valores observados y las predicciones hechas por cada mo<strong>de</strong>lo en cada una <strong>de</strong><br />

las fronteras. Los mo<strong>de</strong>los más a<strong>de</strong>cuados han sido los que presentan mejor balance entre todos<br />

los criterios consi<strong>de</strong>rados.<br />

4.3.6.2 Medidas <strong>de</strong> error<br />

Cuando se utilizan mo<strong>de</strong>los <strong>de</strong> predicción, es inevitable que el resultado esté afectado por<br />

errores <strong>de</strong>bidos a los propios mo<strong>de</strong>los, puesto que éstos siempre llevan implícita alguna<br />

in<strong>de</strong>terminación. Dado que se dispone <strong>de</strong> un histórico <strong>de</strong> valores observados yi con los que<br />

comparar las predicciones y ˆi hechas por cada uno <strong>de</strong> los mo<strong>de</strong>los, es posible efectuar un<br />

análisis directo <strong>de</strong> las medidas <strong>de</strong> error. Los estadísticos más comunes a la hora <strong>de</strong> cuantificar el<br />

error son el error medio, el error absoluto medio y el error relativo medio. A la vista <strong>de</strong> que<br />

presenta la misma gravedad errar en una predicción tanto en exceso como por <strong>de</strong>fecto, el error<br />

relativo se ha estudiado en valor absoluto. La Tabla 4-4 muestra esas medidas <strong>de</strong> error para cada<br />

uno <strong>de</strong> los mo<strong>de</strong>los empleando los valores observados y las predicciones. También se han<br />

incluido otras medidas relacionadas con los valores máximos <strong>de</strong>l error absoluto y <strong>de</strong>l error<br />

relativo en valor absoluto que se han encontrado entre los pares <strong>de</strong> datos.<br />

Tabla 4-4: Medidas <strong>de</strong> error para cada mo<strong>de</strong>lo.<br />

Mo<strong>de</strong>lo 1 Mo<strong>de</strong>lo 2 Mo<strong>de</strong>lo 3 Mo<strong>de</strong>lo 4 Mo<strong>de</strong>lo 5 Mo<strong>de</strong>lo 6<br />

ME 118.5430 103.8163 106.6021 112.8573 113.5008 95.1117<br />

MAE 237.2021 210.6609 210.0152 223.9775 223.2356 203.5965<br />

MARE<br />

Error<br />

0.2318 0.2039 0.2032 0.2169 0.2157 0.2000<br />

absoluto 1488.0287 1399.7732 1406.7949 1562.8313 1552.9211 1449.5156<br />

máximo<br />

Error relativo<br />

absoluto<br />

máximo<br />

0.9761 0.8302 0.8529 1.0103 1.0723 0.9985<br />

(ME: error medio; MAE: Error absoluto medio; MARE: Error relativo medio en valor absoluto)<br />

En base a estas medidas, los mejores mo<strong>de</strong>los son el 6, 2 y 3. Conviene <strong>de</strong>stacar que no es<br />

posible establecer un or<strong>de</strong>n claro <strong>de</strong> prioridad entre esos tres mo<strong>de</strong>los dado que sus medidas <strong>de</strong>


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 99<br />

error son muy similares entre ellas. Las Figura 4-18 y Figura 4-19 muestran, respectivamente, el<br />

error relativo medio en valor absoluto y el error absoluto medio para cada mo<strong>de</strong>lo atendiendo al<br />

periodo horario, apreciándose que los mo<strong>de</strong>los 2, 3 y 6 son los que presentan mejor<br />

comportamiento.<br />

Error relativo en valor absoluto [%]<br />

0.35<br />

0.3<br />

0.25<br />

0.2<br />

0.15<br />

0.1<br />

0.05<br />

0<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-18: Evolución horaria <strong>de</strong>l error relativo en valor absoluto para cada uno <strong>de</strong> los mo<strong>de</strong>los.<br />

Error absoluto [veh]<br />

400<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-19: Evolución horaria <strong>de</strong>l error absoluto para cada uno <strong>de</strong> los mo<strong>de</strong>los.<br />

4.3.6.3 Distribución acumulada <strong>de</strong> error relativo en valor absoluto. Percentiles<br />

Los percentiles pertenecen al grupo <strong>de</strong> estadísticos asociados a medidas <strong>de</strong> posición. Se emplean<br />

para proporcionar información sobre el conjunto <strong>de</strong> datos que se está analizando, indicando qué<br />

valores <strong>de</strong> la variable se presentan en la realidad con una frecuencia por <strong>de</strong>bajo <strong>de</strong> un


100 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

porcentaje. Analizando la distribución <strong>de</strong> frecuencias <strong>de</strong>l error relativo en valor absoluto para<br />

cada uno <strong>de</strong> los mo<strong>de</strong>los, los percentiles alcanzados se muestran en la siguiente tabla:<br />

Tabla 4-5: Percentiles <strong>de</strong>l error relativo en valor absoluto para cada mo<strong>de</strong>lo.<br />

Percentiles Mo<strong>de</strong>lo 1 Mo<strong>de</strong>lo 2 Mo<strong>de</strong>lo 3 Mo<strong>de</strong>lo 4 Mo<strong>de</strong>lo 5 Mo<strong>de</strong>lo 6<br />

25 0,0799 0,0769 0,0763 0,0777 0,0799 0,0772<br />

30 0,0982 0,0933 0,0933 0,096 0,0967 0,0938<br />

50 0,2039 0,1694 0,1694 0,1763 0,1783 0,1646<br />

60 0,26 0,2141 0,2121 0,2286 0,2246 0,212<br />

75 0,3596 0,3076 0,3034 0,3351 0,3311 0,2986<br />

85 0,4298 0,379 0,3791 0,4117 0,4113 0,3703<br />

100 0,9765 0,83 0,8492 1,0723 1,0103 0,9985<br />

Los mejores mo<strong>de</strong>los serán aquellos que posean valores más pequeños <strong>de</strong> error relativo en valor<br />

absoluto para cada uno <strong>de</strong> los percentiles. Numéricamente, se observa que los mo<strong>de</strong>los 6, 3 y 2<br />

<strong>de</strong>stacan en estos términos respecto a los <strong>de</strong>más. En ellos, por ejemplo, el percentil 60 refleja<br />

que el 60% <strong>de</strong> las predicciones alcanzaron errores relativos en valor absoluto inferiores a 0.21.<br />

Esto también se aprecia más claramente a nivel gráfico. En este sentido, la Figura 4-20 muestra<br />

la distribución acumulada <strong>de</strong>l error relativo en valor absoluto conseguido por cada mo<strong>de</strong>lo. El<br />

eje vertical está graduado en percentiles, por ello la mediana se alcanza en el percentil 50. Se<br />

observa que los mejores mo<strong>de</strong>los son, por or<strong>de</strong>n <strong>de</strong> preferencia, el mo<strong>de</strong>lo 6, el 3 y el 2, dado<br />

que la curva para el resto <strong>de</strong> mo<strong>de</strong>los es visiblemente inferior a la <strong>de</strong> esos tres mo<strong>de</strong>los.<br />

Percentiles<br />

Percentiles<br />

100<br />

75<br />

50<br />

25<br />

0 10 20 30 80 50 60 70 80 90 100 110 120<br />

era = error relativo absoluto [%]<br />

90<br />

85<br />

80<br />

75<br />

70<br />

65<br />

60<br />

15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30<br />

era = error relativo absoluto [%]<br />

y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-20: Distribución acumulada <strong>de</strong>l valor absoluto <strong>de</strong>l error relativo en porcentajes (arriba).<br />

Zoom en torno a los valores <strong>de</strong> error relativo absoluto 15-30% (abajo).


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 101<br />

4.3.6.4 Correlación por rango (<strong>de</strong> Spearman) y correlación lineal (<strong>de</strong> Pearson)<br />

Otro criterio a tener en cuenta <strong>de</strong>ntro <strong>de</strong> la comparativa <strong>de</strong> mo<strong>de</strong>los es la correlación entre las<br />

predicciones y los valores reales. Se consi<strong>de</strong>ra que dos variables están correlacionadas cuando<br />

los valores <strong>de</strong> una <strong>de</strong> ellas varían sistemáticamente con respecto a los valores <strong>de</strong> la otra. En este<br />

sentido, si tenemos dos variables (A y B) existe correlación si al aumentar los valores <strong>de</strong> A lo<br />

hacen también los <strong>de</strong> B y viceversa. Aplicando esto al conjunto <strong>de</strong> valores observados {yi} y<br />

estimados { y ˆi }, se pue<strong>de</strong> evaluar la calidad <strong>de</strong> las predicciones examinando si existe<br />

correlación. El coeficiente <strong>de</strong> correlación lineal, o coeficiente <strong>de</strong> Pearson, es el instrumento<br />

tradicionalmente utilizado para medir la <strong>de</strong>pen<strong>de</strong>ncia entre variables aleatorias. Si r = 0, no<br />

existe relación lineal. Pero esto no implica necesariamente una in<strong>de</strong>pen<strong>de</strong>ncia total entre las dos<br />

variables. Pue<strong>de</strong> ocurrir que, aún con r próximo a 0, la variación <strong>de</strong> una <strong>de</strong> ellas influya en el<br />

valor que pueda tomar la otra caso que existan relaciones no lineales entre las dos variables.<br />

Estas limitaciones no existen si se utiliza la correlación entre rangos, la cual consi<strong>de</strong>ra la<br />

concordancia <strong>de</strong> los datos. El concepto <strong>de</strong> concordancia está relacionado con la probabilidad <strong>de</strong><br />

encontrar valores altos (o bajos) <strong>de</strong> una variable asociados a valores altos (o bajos) <strong>de</strong> la otra<br />

variable. Si esto no ocurre, las variables son discordantes. De modo que la concordancia <strong>de</strong>tecta<br />

relaciones no lineales que la correlación no pue<strong>de</strong> <strong>de</strong>tectar. En consecuencia, las medidas <strong>de</strong><br />

correlación que trabajan con rangos no presentan las limitaciones <strong>de</strong> la correlación lineal.<br />

Dentro <strong>de</strong> estas medidas <strong>de</strong>staca el <strong>de</strong>nominado coeficiente <strong>de</strong> correlación <strong>de</strong> Spearman.<br />

Se proce<strong>de</strong> a analizar la calidad <strong>de</strong> las predicciones yˆ i <strong>de</strong> cada mo<strong>de</strong>lo analizando la<br />

<strong>de</strong>pen<strong>de</strong>ncia en términos <strong>de</strong> correlación por rango <strong>de</strong> Spearman y correlación lineal o <strong>de</strong><br />

Pearson. La siguiente tabla muestra estas correlaciones para cada uno <strong>de</strong> los mo<strong>de</strong>los.<br />

Tabla 4-6: Correlación por rango (Spearman) y lineal (Pearson) entre { yi , y ˆi } para cada mo<strong>de</strong>lo.<br />

Correlación<br />

por rango<br />

Correlación<br />

lineal<br />

Mo<strong>de</strong>lo 1 Mo<strong>de</strong>lo 2 Mo<strong>de</strong>lo 3 Mo<strong>de</strong>lo 4 Mo<strong>de</strong>lo 5 Mo<strong>de</strong>lo 6<br />

0.25102 0.51398 0.51375 0.39904 0.39904 0.56623<br />

0.28436 0.4698 0.48134 0.33953 0.34893 0.53333<br />

En términos <strong>de</strong> correlación por rango, <strong>de</strong>stacan claramente sobre los <strong>de</strong>más los mo<strong>de</strong>los 6, 2 y<br />

3; especialmente el mo<strong>de</strong>lo 6, alcanzando valores elevados para el tamaño <strong>de</strong> la muestra<br />

consi<strong>de</strong>rada. Respecto al coeficiente <strong>de</strong> correlación lineal, ocurre algo similar. Por ello, se<br />

establece que los mejores mo<strong>de</strong>los bajo este enfoque <strong>de</strong> correlación son el mo<strong>de</strong>lo 6, seguido <strong>de</strong><br />

los mo<strong>de</strong>los 2 y 3.


102 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

4.3.6.5 Criterio <strong>de</strong> información <strong>de</strong> Akaike y criterio <strong>de</strong> información bayesiano: AIC BIC<br />

El mo<strong>de</strong>lo perfecto no existe, puesto que todos constituyen simplificaciones <strong>de</strong> la realidad a<br />

través <strong>de</strong> una serie <strong>de</strong> parámetros. Siempre son preferibles mo<strong>de</strong>los con menos parámetros<br />

<strong>de</strong>bido a que, a<strong>de</strong>más <strong>de</strong> ser más sencillos <strong>de</strong> estimar, son más estables y están sometidos a<br />

menos sesgo. Por ello existen unas medidas <strong>de</strong> contraste entre mo<strong>de</strong>los que penalizan en cierto<br />

modo que éstos tengan muchos parámetros.<br />

Las más conocidas son el criterio <strong>de</strong> información <strong>de</strong> Akaike, AIC, y criterio <strong>de</strong> información<br />

bayesiano, BIC. Ambos estadísticos se utilizan en la selección <strong>de</strong> mo<strong>de</strong>los para tomar el mejor<br />

<strong>de</strong> entre un conjunto <strong>de</strong> varios admisibles. Así pues, un mo<strong>de</strong>lo es mejor que otro si tiene un<br />

valor AIC (o BIC) menor. Las fórmulas matemáticas <strong>de</strong>l AIC y BIC se enuncian a continuación:<br />

AIC ��2�LLF�2�P (20)<br />

BIC ��2�LLF �P �ln(<br />

N)<br />

En ellas intervienen el logaritmo <strong>de</strong> la función verosimilitud <strong>de</strong> cada mo<strong>de</strong>lo (LLF), el número<br />

<strong>de</strong> parámetros ajustados (P) y el número total <strong>de</strong> observaciones o tamaño <strong>de</strong> la muestra (N). En<br />

el cálculo <strong>de</strong> la función <strong>de</strong> verosimilitud interviene un producto <strong>de</strong> probabilida<strong>de</strong>s <strong>de</strong><br />

observaciones individuales, por lo que habitualmente interesa tomar logaritmos, ya que éstos<br />

transforman los productos en sumas y los cocientes en restas. De ahí que el cálculo <strong>de</strong> AIC y<br />

BIC emplee el logaritmo <strong>de</strong> la función <strong>de</strong> verosimilitud.<br />

La función <strong>de</strong> verosimilitud es un indicador para señalar la capacidad <strong>de</strong> ajuste <strong>de</strong> un mo<strong>de</strong>lo,<br />

permitiendo con ello su empleo en la comparación <strong>de</strong> mo<strong>de</strong>los. Su valor será mayor cuanto<br />

mejor sea el ajuste, mientras que tendrá un valor más cercano a 0 cuando el ajuste sea malo. Por<br />

ello, junto a los estadísticos AIC y BIC <strong>de</strong> cada uno <strong>de</strong> los mo<strong>de</strong>los, también se emplea el<br />

logaritmo <strong>de</strong> la función verosimilitud (LLF) para el contraste <strong>de</strong> mo<strong>de</strong>los. El cálculo <strong>de</strong> estos<br />

tres indicadores se realiza sobre un conjunto <strong>de</strong> datos que, en este caso, se tratará <strong>de</strong> medidas <strong>de</strong>l<br />

error relativo entre valores reales y predicciones, yi e yˆ i respectivamente, para cada mo<strong>de</strong>lo,<br />

y ˆ i � yi<br />

eri<br />

� .<br />

y<br />

i<br />

Para <strong>de</strong>terminar el LLF se precisa conocer la función <strong>de</strong> verosimilitud <strong>de</strong>l conjunto <strong>de</strong> medidas<br />

<strong>de</strong>l error relativo, en la cual interviene la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad seguida. La<br />

construcción <strong>de</strong> esta función se simplifica, en gran medida, si se asume que la distribución <strong>de</strong>l<br />

conjunto <strong>de</strong> datos es normal. Sin embargo, realizando un test <strong>de</strong> normalidad, se <strong>de</strong>muestra que<br />

los datos analizados, en este caso errores relativos entre los valores observados y estimados por


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 103<br />

cada uno <strong>de</strong> los mo<strong>de</strong>los, no siguen una distribución normal. Esta afirmación se pue<strong>de</strong><br />

comprobar gráficamente mediante el test gráfico <strong>de</strong> normalidad mostrado en la Figura 4-21. En<br />

ella se representa la probabilidad acumulada empírica <strong>de</strong> cada conjunto <strong>de</strong> datos. Si los puntos<br />

se ajustasen muy bien a la línea recta sería señal <strong>de</strong> que se acepta la bondad <strong>de</strong> ajuste y los datos<br />

provienen <strong>de</strong> una distribución normal. Otras funciones <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad<br />

introducirían curvatura en el gráfico, siendo esto lo que ocurre para las medidas consi<strong>de</strong>radas <strong>de</strong><br />

error relativo.<br />

Figura 4-21: Test gráfico <strong>de</strong> normalidad.<br />

En consecuencia, la hipótesis <strong>de</strong> distribución normal no es válida, <strong>de</strong> manera que se precisa otro<br />

procedimiento para <strong>de</strong>terminar la función <strong>de</strong> verosimilitud <strong>de</strong> cada conjunto <strong>de</strong> errores relativos<br />

<strong>de</strong> los mo<strong>de</strong>los. La conveniencia <strong>de</strong>l uso <strong>de</strong> histogramas como estimadores no-paramétricos <strong>de</strong><br />

la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> una variable sugiere que un modo <strong>de</strong> lograrlo consiste en discretizar la<br />

variable aleatoria continua, asociada a cada conjunto <strong>de</strong> datos, empleando un número apropiado<br />

<strong>de</strong> bins. Así pues, las funciones <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad empleadas estarán basadas en<br />

histogramas cuyo número <strong>de</strong> bins será fijado por algún criterio. En particular, se han usado el<br />

criterio <strong>de</strong> Knuth y el criterio <strong>de</strong> Stone para <strong>de</strong>terminar dicho número <strong>de</strong> bins <strong>de</strong> un modo<br />

óptimo (Knuth, 2006). Aplicando este procedimiento al conjunto <strong>de</strong> medidas <strong>de</strong> error relativo <strong>de</strong><br />

cada mo<strong>de</strong>lo, se obtienen los siguientes histogramas (Figura 4-22 y Figura 4-23), representando<br />

la distribución estadística experimental (histograma) <strong>de</strong> los errores relativos <strong>de</strong> cada mo<strong>de</strong>lo<br />

junto con una curva <strong>de</strong> <strong>de</strong>nsidad normal superpuesta sobre cada histograma. Se observa que la<br />

discretización alcanzada con el número <strong>de</strong> bins <strong>de</strong>finido por Knuth es más armoniosa que la<br />

resultante <strong>de</strong> Stone. Es <strong>de</strong>cir, en el histograma generado con el número <strong>de</strong> bins <strong>de</strong>finido por<br />

Stone (Figura 4-23), la altura <strong>de</strong> las barras no sigue una ten<strong>de</strong>ncia estable <strong>de</strong> subida o bajada,<br />

sino que se aprecia una oscilación en la altura <strong>de</strong> las barras. En cambio, en el histograma


104 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

generado por Knuth (Figura 4-22), la altura <strong>de</strong> las barras mantiene la ten<strong>de</strong>ncia <strong>de</strong> subida o<br />

bajada respecto <strong>de</strong>l máximo. Por ello, se toma el criterio <strong>de</strong> Knuth para la discretización <strong>de</strong>l<br />

error relativo y la obtención <strong>de</strong> las funciones <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad que permitan calcular<br />

la verosimilitud junto a los estadísticos AIC y BIC.<br />

600<br />

400<br />

200<br />

y1 =a·f �<br />

v<br />

·gll<br />

�<br />

0<br />

-1 0<br />

nbins óptimo 20<br />

1<br />

600<br />

400<br />

200<br />

y 4 =(a+b·x)<br />

0<br />

-2 -1 0 1<br />

nbins óptimo 20<br />

600<br />

400<br />

200<br />

y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

�<br />

0<br />

-1 0<br />

nbins óptimo 14<br />

1<br />

600<br />

400<br />

200<br />

y 5 =(a+b·x+c·x 2 )<br />

0<br />

-2 -1 0 1<br />

nbins óptimo 14<br />

600<br />

400<br />

200<br />

y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

�<br />

0<br />

-1 0<br />

nbins óptimo 14<br />

1<br />

600<br />

400<br />

200<br />

y 6 = f (x,t i ,k))<br />

0<br />

-1 0<br />

nbins óptimo 21<br />

1<br />

Figura 4-22: Histograma <strong>de</strong>l error relativo <strong>de</strong> cada mo<strong>de</strong>lo según el nº <strong>de</strong> bins <strong>de</strong>finido por Knuth.<br />

150<br />

100<br />

50<br />

y1 =a·f �<br />

v<br />

·gll<br />

�<br />

0<br />

-1 0<br />

nbins óptimo 65<br />

1<br />

400<br />

300<br />

200<br />

100<br />

y 4 =(a+b·x)<br />

0<br />

-2 -1 0 1<br />

nbins óptimo 29<br />

150<br />

100<br />

50<br />

y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

�<br />

0<br />

-1 0<br />

nbins óptimo 63<br />

1<br />

200<br />

150<br />

100<br />

50<br />

y 5 =(a+b·x+c·x 2 )<br />

0<br />

-2 -1 0 1<br />

nbins óptimo 49<br />

400<br />

300<br />

200<br />

100<br />

y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

�<br />

0<br />

-1 0<br />

nbins óptimo 28<br />

1<br />

200<br />

150<br />

100<br />

50<br />

y 6 = f (x,t i ,k))<br />

0<br />

-1 0<br />

nbins óptimo 67<br />

1<br />

Figura 4-23: Histograma <strong>de</strong>l error relativo <strong>de</strong> cada mo<strong>de</strong>lo según el nº <strong>de</strong> bins <strong>de</strong>finido por Stone.


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 105<br />

Así, tras realizar el proceso y obtener, posteriormente, los estadísticos AIC y BIC, se obtienen<br />

los valores mostrados en la Tabla 4-7.<br />

Tabla 4-7: Valores <strong>de</strong> Logaritmo <strong>de</strong> la verosimilitud (LLF), AIC y BIC <strong>de</strong>l conjunto <strong>de</strong> errores<br />

relativos <strong>de</strong> cada mo<strong>de</strong>lo, junto al número <strong>de</strong> parámetros <strong>de</strong> cada mo<strong>de</strong>lo.<br />

LLF AIC BIC Nº param<br />

Mo<strong>de</strong>lo 1 -7345 14697 14714 3<br />

Mo<strong>de</strong>lo 2 -6423 12854 12877 4<br />

Mo<strong>de</strong>lo 3 -6356 12721 12751 5<br />

Mo<strong>de</strong>lo 4 -7082 14167 14179 2<br />

Mo<strong>de</strong>lo 5 -6175 12357 12375 3<br />

Mo<strong>de</strong>lo 6 -7113 14237 14267 5<br />

Dado que los mejores mo<strong>de</strong>los son los que conseguen el mayor valor <strong>de</strong> LLF, y menor valor <strong>de</strong><br />

AIC y BIC, el ranking <strong>de</strong> mo<strong>de</strong>los según cada criterio es:<br />

� Ranking <strong>de</strong> mejor mo<strong>de</strong>lo por Log-Likelihood: 5 3 2 4 6 1<br />

� Ranking <strong>de</strong> mejor mo<strong>de</strong>lo por AIC: 5 3 2 4 6 1<br />

� Ranking <strong>de</strong> mejor mo<strong>de</strong>lo por BIC: 5 3 2 4 6 1<br />

Es necesario comentar que estos criterios <strong>de</strong> selección <strong>de</strong> mo<strong>de</strong>lo también consi<strong>de</strong>ran el número<br />

<strong>de</strong> parámetros existente, penalizando aquellos que tengan muchos parámetros. De ahí que, en el<br />

or<strong>de</strong>n <strong>de</strong> prioridad anterior, los mo<strong>de</strong>los 5 y 4 <strong>de</strong>staquen en la selección <strong>de</strong> mo<strong>de</strong>los. Estos<br />

mo<strong>de</strong>los 4 y 5, junto al mo<strong>de</strong>lo 1, son los que menos parámetros poseen. Sin embargo,<br />

atendiendo a los criterios estudiados en los anteriores apartados (medidas directas <strong>de</strong> error,<br />

percentiles y correlación por rango y lineal), parece conveniente que los mo<strong>de</strong>los 1, 4 y 5 sean<br />

<strong>de</strong>scartados <strong>de</strong>l conjunto <strong>de</strong> mo<strong>de</strong>los admisibles. En consecuencia, la selección <strong>de</strong> mo<strong>de</strong>los se<br />

establecería entre los mo<strong>de</strong>los 2, 3 y 6, siendo el nuevo or<strong>de</strong>n <strong>de</strong> prioridad:<br />

� Ranking <strong>de</strong> mejor mo<strong>de</strong>lo por Log-Likelihood: 3 2 6<br />

� Ranking <strong>de</strong> mejor mo<strong>de</strong>lo por AIC: 3 2 6<br />

� Ranking <strong>de</strong> mejor mo<strong>de</strong>lo por BIC: 3 2 6<br />

4.3.6.6 Análisis gráfico<br />

Por último, la comparación <strong>de</strong> mo<strong>de</strong>los se realizará gráficamente utilizando el conjunto <strong>de</strong><br />

validación. Para ello, se representan las predicciones <strong>de</strong> vehículos hechas por cada uno <strong>de</strong> los<br />

mo<strong>de</strong>los para cada frontera según el número medio <strong>de</strong> llamadas en movilidad observadas en<br />

cada periodo horario. Junto a ellas, también se representan los valores medios <strong>de</strong> vehículos<br />

observados en cada periodo horario y frontera, estableciendo una comparación visual <strong>de</strong> la<br />

precisión alcanzada por cada mo<strong>de</strong>lo así como el or<strong>de</strong>n <strong>de</strong> magnitud <strong>de</strong>l error <strong>de</strong> predicción.


106 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

[veh]<br />

[veh]<br />

[veh]<br />

[veh]<br />

1400<br />

1200<br />

1000<br />

800<br />

ID Frontera 1<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1600<br />

1400<br />

1200<br />

1000<br />

800<br />

ID Frontera 2<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-24: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 1 y la frontera 2.<br />

1000<br />

900<br />

800<br />

700<br />

600<br />

ID Frontera 3<br />

500<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 2500<br />

2000<br />

1500<br />

1000<br />

ID Frontera 4<br />

500<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-25: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 3 y la frontera 4.


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 107<br />

[veh]<br />

[veh]<br />

[veh]<br />

[veh]<br />

1100<br />

1000<br />

900<br />

800<br />

700<br />

ID Frontera 5<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1200<br />

1100<br />

1000<br />

900<br />

800<br />

700<br />

ID Frontera 6<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-26: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 5 y la frontera 6 en cada periodo horario.<br />

1600<br />

1400<br />

1200<br />

1000<br />

800<br />

ID Frontera 7<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1200<br />

1100<br />

1000<br />

900<br />

800<br />

700<br />

ID Frontera 8<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-27: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 7 y la frontera 8 en cada periodo horario.


108 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

[veh]<br />

[veh]<br />

[veh]<br />

[veh]<br />

1000<br />

950<br />

900<br />

850<br />

800<br />

750<br />

700<br />

ID Frontera 9<br />

650<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1100<br />

1000<br />

900<br />

800<br />

700<br />

ID Frontera 10<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-28: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 9 y la frontera 10 en cada periodo horario.<br />

1000<br />

900<br />

800<br />

700<br />

600<br />

500<br />

ID Frontera 11<br />

400<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 2500<br />

2000<br />

1500<br />

1000<br />

ID Frontera 12<br />

500<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y1 =a·f �<br />

v<br />

·gll<br />

� y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y4 =(a+b·x) y5 =(a+b·x+c·x 2 ) y6 = f (x,ti ,k))<br />

Figura 4-29: Volúmenes <strong>de</strong> vehículos observados y estimados con cada mo<strong>de</strong>lo que cruzan la<br />

frontera 11 y la frontera 12 en cada periodo horario.


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 109<br />

Gráficamente, se aprecia que los mo<strong>de</strong>los 2 y 3 consiguen valores muy similares <strong>de</strong><br />

estimaciones <strong>de</strong> volúmenes <strong>de</strong> vehículos dado un número <strong>de</strong> llamadas en movilidad. Esto tiene<br />

su origen en la forma funcional <strong>de</strong> los mo<strong>de</strong>los, dado que ambas se diferencian únicamente en el<br />

término cuadrático que multiplica al número <strong>de</strong> llamadas en movilidad (c·x 2 ). El or<strong>de</strong>n <strong>de</strong><br />

magnitud <strong>de</strong> ese parámetro c no introduce un cambio significativo en la predicción, mientras<br />

que el resto <strong>de</strong> parámetros se mantienen <strong>de</strong>l mismo or<strong>de</strong>n en ambos mo<strong>de</strong>los. En consecuencia,<br />

las diferencias entre las predicciones <strong>de</strong> ambos mo<strong>de</strong>los apenas son apreciables en la escala<br />

gráfica utilizada, no ocurriendo lo mismo atendiendo a otros criterios como error absoluto, error<br />

relativo o correlación, entre otros, como ya se <strong>de</strong>mostró con anterioridad. Algo similar ocurre<br />

con las predicciones <strong>de</strong> los mo<strong>de</strong>los 4 y 5. Por ello, resulta complejo establecer una clasificación<br />

clara atendiendo a un análisis visual. No obstante, centrándose en los mo<strong>de</strong>los seleccionados<br />

según los criterios <strong>de</strong>sarrollados en los apartados anteriores, mo<strong>de</strong>lo 2, 3 y 6, se observa que sus<br />

predicciones son las que mejor seguimiento realizan <strong>de</strong> los picos y valles <strong>de</strong> los valores<br />

observados <strong>de</strong> volúmenes <strong>de</strong> vehículos. Este hecho encaja con las conclusiones alcanzadas<br />

anteriormente en términos <strong>de</strong> error, percentiles y correlación. Por ello, parece lógico pensar que<br />

esos tres mo<strong>de</strong>los – mo<strong>de</strong>lo 2, 3 y 6 – son los más a<strong>de</strong>cuados para la predicción <strong>de</strong> volúmenes<br />

<strong>de</strong> vehículos a partir <strong>de</strong> un número <strong>de</strong> llamadas en movilidad realizadas en un periodo <strong>de</strong><br />

tiempo. Las siguientes figuras se centran en las predicciones <strong>de</strong> volúmenes <strong>de</strong> vehículos hechas<br />

por esos tres mo<strong>de</strong>los y los valores reales observados por estaciones <strong>de</strong> aforo.<br />

[veh]<br />

[veh]<br />

1400<br />

1200<br />

1000<br />

800<br />

ID Frontera 1<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1600<br />

1400<br />

1200<br />

1000<br />

ID Frontera 2<br />

800<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y6 = f (x,ti ,k))<br />

Figura 4-30: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan la<br />

frontera 1 y la frontera 2.


110 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

[veh]<br />

[veh]<br />

[veh]<br />

[veh]<br />

1000<br />

900<br />

800<br />

700<br />

600<br />

ID Frontera 3<br />

500<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 2500<br />

2000<br />

1500<br />

1000<br />

ID Frontera 4<br />

500<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y6 = f (x,ti ,k))<br />

Figura 4-31: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan la<br />

frontera 3 y la frontera 4.<br />

1100<br />

1000<br />

900<br />

800<br />

700<br />

ID Frontera 5<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1200<br />

1100<br />

1000<br />

900<br />

800<br />

700<br />

ID Frontera 6<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y6 = f (x,ti ,k))<br />

Figura 4-32: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan la<br />

frontera 5 y la frontera 6 en cada periodo horario.


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 111<br />

[veh]<br />

[veh]<br />

[veh]<br />

[veh]<br />

1600<br />

1400<br />

1200<br />

1000<br />

800<br />

ID Frontera 7<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1200<br />

1100<br />

1000<br />

900<br />

800<br />

700<br />

ID Frontera 8<br />

600<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y6 = f (x,ti ,k))<br />

Figura 4-33: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan la<br />

frontera 7 y la frontera 8 en cada periodo horario.<br />

1000<br />

950<br />

900<br />

850<br />

800<br />

750<br />

700<br />

ID Frontera 9<br />

650<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 1050<br />

1000<br />

950<br />

900<br />

850<br />

800<br />

750<br />

ID Frontera 10<br />

700<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y6 = f (x,ti ,k))<br />

Figura 4-34: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan la<br />

frontera 9 y la frontera 10 en cada periodo horario.


112 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

[veh]<br />

[veh]<br />

900<br />

800<br />

700<br />

600<br />

500<br />

ID Frontera 11<br />

400<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti 2500<br />

2000<br />

1500<br />

1000<br />

ID Frontera 12<br />

500<br />

8h-9h 9h-10h 10h-11h 11h-12h 12h-13h 13h-14h 14h-15h 15h-16h 16h-17h 17h-18h 18h-19h 19h-20h 20h-21h<br />

Intervalo horario ti y reales y2 =(a+b·x)·f �<br />

v<br />

·gll<br />

� y3 =(a+b·x+c·x 2 )·f �<br />

v<br />

·gll<br />

� y6 = f (x,ti ,k))<br />

Figura 4-35: Volúmenes <strong>de</strong> vehículos observados y estimados con mo<strong>de</strong>los 2, 3 y 6 que cruzan la<br />

frontera 11 y la frontera 12 en cada periodo horario.<br />

4.3.7 Conclusiones<br />

En este Capítulo se ha presentado una metodología para estimar volúmenes <strong>de</strong> vehículos que<br />

cruzan una frontera entre celdas en función <strong>de</strong> datos <strong>de</strong> una red <strong>de</strong> telefonía móvil. Tras discutir<br />

la información necesaria para este objetivo, se han <strong>de</strong>sarrollado seis mo<strong>de</strong>los para inferir dichos<br />

volúmenes empleando las llamadas en movilidad generadas en cada periodo horario, junto con<br />

otra información asociada a las características <strong>de</strong> esas llamadas, tales como intensidad horaria<br />

<strong>de</strong> llamadas, duración, o incluso las características <strong>de</strong> las vías que cruzan la frontera. Los<br />

mo<strong>de</strong>los formulados han sido los siguientes:<br />

� �<br />

� Mo<strong>de</strong>lo 1: yˆ 1(<br />

ti) �a� fv ( ti) � gll ( ti)<br />

.<br />

� �<br />

� Mo<strong>de</strong>lo 2: yˆ 2(<br />

ti) �[ a�b�xt ( i )] � fv ( ti) �gll ( ti), don<strong>de</strong> xt ( i ) � nll mov ( ti, k)<br />

.<br />

� Mo<strong>de</strong>lo 3:<br />

2 � �<br />

yˆ 3(<br />

ti) [ a b x( ti) c x ( ti)] fv ( ti) gll ( ti), don<strong>de</strong> x( ti) nll mov( ti, k)<br />

� � � � � � � � .<br />

� Mo<strong>de</strong>lo 4: yˆ 4(<br />

ti) �a�b�xt ( i), don<strong>de</strong> xt ( i) � nll mov( ti, k)<br />

.<br />

� Mo<strong>de</strong>lo 5:<br />

2<br />

yˆ 5(<br />

ti) a b x( ti) c x ( ti), don<strong>de</strong> x( ti) nll mov( ti, k)<br />

� � � � � � .


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 113<br />

a�x( ti, k) Lk<br />

� Mo<strong>de</strong>lo 6: yˆ 6 ( ti, k) � �d, con �(<br />

ti, k)<br />

�<br />

2 b1 �b2��( ti, k) V · ( )<br />

( ) ( ) 1<br />

k Tc t<br />

P i<br />

ll veh ti�Pllveh ti� � �e ��c<br />

�(<br />

t , k)<br />

� �<br />

i<br />

Los mo<strong>de</strong>los 1, 2, 3, 4 y 5 no establecen diferenciación en sus predicciones según la frontera<br />

monitorizada, <strong>de</strong> modo que la principal variable <strong>de</strong> entrada al mo<strong>de</strong>lo, x(ti), es el número <strong>de</strong><br />

llamadas en movilidad <strong>de</strong>tectadas en una frontera k cualquiera, x(ti) = nll mov(ti, k). En cambio, el<br />

mo<strong>de</strong>lo 6 sí que posee una <strong>de</strong>pen<strong>de</strong>ncia espacial, estableciendo una diferenciación según la<br />

frontera monitorizada. Así pues, las variables <strong>de</strong> entrada al mo<strong>de</strong>lo son las llamadas en<br />

movilidad en una <strong>de</strong>terminada frontera, x(ti, k) = nll mov(ti, k), junto a otro tipo <strong>de</strong> información<br />

relacionada con características <strong>de</strong> las llamadas y <strong>de</strong> la propia frontera.<br />

El ajuste <strong>de</strong> los parámetros <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong>finidos se ha llevado a cabo buscando la<br />

minimización <strong>de</strong> la suma <strong>de</strong>l valor absoluto <strong>de</strong>l error relativo entre valores observados y<br />

mo<strong>de</strong>lados. El Capítulo se ha completado con un estudio numérico en el que se contrastan los<br />

mo<strong>de</strong>los y se comparan entre sí en base a una serie <strong>de</strong> criterios. Dada la variedad <strong>de</strong> mo<strong>de</strong>los,<br />

estos criterios <strong>de</strong> comparación contemplan indicadores tales como las clásicas medidas <strong>de</strong> error<br />

(medio, absoluto y relativo), percentiles <strong>de</strong>l error relativo absoluto, o correlaciones (lineal y por<br />

rango) entre volúmenes reales y predicciones, a<strong>de</strong>más <strong>de</strong> un análisis gráfico <strong>de</strong> resultados.<br />

También se han empleado el criterio <strong>de</strong> información <strong>de</strong> Akaike y el criterio <strong>de</strong> información<br />

bayesiano como medidas <strong>de</strong> contraste para evaluar la forma funcional en la selección <strong>de</strong> los<br />

mejores mo<strong>de</strong>los.<br />

Tras el estudio <strong>de</strong> comparación y contraste se extraen una serie <strong>de</strong> conclusiones, <strong>de</strong>stacando que<br />

aquellos mo<strong>de</strong>los que incluyen en su forma funcional tanto información <strong>de</strong> llamadas en<br />

movilidad como sobre variabilidad horaria <strong>de</strong> llamadas realizadas y/o <strong>de</strong> vehículos circulando,<br />

alcanzan predicciones más exactas que el resto. Tal es el caso <strong>de</strong> los mo<strong>de</strong>los 2, 3 y 6.<br />

En base a los criterios estudiados, se pue<strong>de</strong> afirmar que los mo<strong>de</strong>los 1, 4 y 5 son los que peores<br />

prestaciones consiguen. En lo que respecta al mo<strong>de</strong>lo 1, esto se refleja en el hecho <strong>de</strong> que el<br />

mo<strong>de</strong>lo <strong>de</strong>pen<strong>de</strong> exclusivamente <strong>de</strong> los factores <strong>de</strong> variabilidad horaria <strong>de</strong> intensidad <strong>de</strong><br />

llamadas y <strong>de</strong> vehículos circulando, in<strong>de</strong>pendientes <strong>de</strong> la frontera. La información <strong>de</strong>l número<br />

<strong>de</strong> llamadas en movilidad realizadas no interviene en el mo<strong>de</strong>lo, perdiéndose entonces la<br />

información respecto a un cierto or<strong>de</strong>n <strong>de</strong> magnitud <strong>de</strong>l paso por la frontera en cuestión.<br />

Respecto a los mo<strong>de</strong>los 4 y 5 ocurre algo similar pero en este caso, aunque su forma funcional sí<br />

que <strong>de</strong>pen<strong>de</strong> <strong>de</strong> las llamadas en movilidad realizadas en cada frontera en cuestión, carece <strong>de</strong><br />

información sobre variabilidad horaria. Ya se razonó en apartados anteriores que el intervalo<br />

horario es un aspecto importante a la hora <strong>de</strong> realizar las predicciones. De ahí que sus


114 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

prestaciones, aunque en menor medida que las <strong>de</strong>l mo<strong>de</strong>lo 1, sigan proporcionando resultados<br />

limitados. En cambio, los mo<strong>de</strong>los 2 y 3, los cuales sí contienen información tanto <strong>de</strong> las<br />

llamadas en movilidad como <strong>de</strong> variabilidad horaria, consiguen resultados eficientes,<br />

<strong>de</strong>mostrando una capacidad predictiva admisible para cualquier frontera entre celdas.<br />

Por otro lado, el mo<strong>de</strong>lo 6 alcanza predicciones razonables <strong>de</strong> volúmenes <strong>de</strong> vehículos aunque<br />

exige realizar un estudio previo para caracterizar la frontera en términos <strong>de</strong> velocidad y longitud<br />

<strong>de</strong> las vías que discurren por la celda origen <strong>de</strong> cada frontera. Su forma funcional establece una<br />

<strong>de</strong>pen<strong>de</strong>ncia espacial con la frontera monitorizada, por lo que las predicciones no sólo <strong>de</strong>pen<strong>de</strong>n<br />

<strong>de</strong>l número <strong>de</strong> llamadas en movilidad sino sobre qué frontera han sido observadas. Este mo<strong>de</strong>lo<br />

es menos flexible que los mo<strong>de</strong>los 2 y 3, dado que requiere un estudio previo <strong>de</strong> la frontera,<br />

pero su capacidad predictiva, evaluada en anteriores apartados, también lo habilita como un<br />

mo<strong>de</strong>lo apto para estimar volúmenes <strong>de</strong> vehículos. En consecuencia, los mo<strong>de</strong>los 2, 3 y 6 serán<br />

los seleccionados para pre<strong>de</strong>cir volúmenes <strong>de</strong> vehículos, por ser los que mejores prestaciones<br />

alcanzan; mientras que los mo<strong>de</strong>los 1, 4 y 5 son <strong>de</strong>scartados como mo<strong>de</strong>los viables para la<br />

inferencia.<br />

Observando los resultados respecto a la comparación <strong>de</strong> los criterios estudiados sobre esos tres<br />

mo<strong>de</strong>los {2, 3 y 6}, resulta difícil establecer un or<strong>de</strong>n <strong>de</strong> prioridad claro dado que:<br />

i) respecto a las medidas <strong>de</strong> error medio, error absoluto y error relativo, así como <strong>de</strong><br />

percentiles <strong>de</strong>l error relativo en valor absoluto, aunque el mo<strong>de</strong>lo 6 presenta una<br />

ligera ventaja respecto a los mo<strong>de</strong>los 2 y 3, el or<strong>de</strong>n <strong>de</strong> magnitud es muy similar en<br />

los tres mo<strong>de</strong>los;<br />

ii) gráficamente, las predicciones <strong>de</strong> los tres mo<strong>de</strong>los reflejan un comportamiento<br />

semejante a la hora <strong>de</strong> alcanzar con exactitud los picos y valles en las curvas <strong>de</strong> los<br />

volúmenes reales;<br />

iii) respecto a correlación por rango y correlación lineal, el mo<strong>de</strong>lo 6 refleja una cierta<br />

mejora respecto a los mo<strong>de</strong>los 3 y 2;<br />

iv) aunque, respecto a los estadísticos AIC, BIC y log-verosimilitud, los mo<strong>de</strong>los 3 y 2,<br />

son mejores que el mo<strong>de</strong>lo 6.<br />

En general, pue<strong>de</strong> <strong>de</strong>cirse que el mo<strong>de</strong>lo 6 presenta una capacidad predictiva ligeramente<br />

superior al consi<strong>de</strong>rar <strong>de</strong>pen<strong>de</strong>ncia espacial, función <strong>de</strong> características geométricas que habría<br />

que medir específicamente para cada punto kilométrico monitorizado. Sin embargo dicha<br />

mejora pue<strong>de</strong> no ser suficiente para justificar la pérdida <strong>de</strong> flexibilidad <strong>de</strong>l mo<strong>de</strong>lo frente a los<br />

mo<strong>de</strong>los 2 y 3, que son in<strong>de</strong>pendientes <strong>de</strong> la frontera. A la vista <strong>de</strong> estas conclusiones,


Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 115<br />

finalmente se ha optado por consi<strong>de</strong>rar como igualmente viables los mo<strong>de</strong>los 2, 3 y 6 para<br />

estimar volúmenes <strong>de</strong> vehículos, poniéndose <strong>de</strong> manifiesto:<br />

i) lo insuficiente <strong>de</strong> usar exclusivamente información <strong>de</strong> llamadas en movilidad,<br />

ii) la necesidad <strong>de</strong> incorporar en los mo<strong>de</strong>los información sobre la variabilidad<br />

horaria <strong>de</strong> la conducta <strong>de</strong> los usuarios que se <strong>de</strong>splazan, en medios mecanizados,<br />

a la hora <strong>de</strong> realizar llamadas, u otras características asociadas a la circulación <strong>de</strong><br />

vehículos, y<br />

iii) la aplicabilidad <strong>de</strong> la metodología a cualquier frontera <strong>de</strong>ntro <strong>de</strong> unos rangos<br />

admisibles <strong>de</strong> error en comparación con medidas proporcionadas por las<br />

tradicionales estaciones <strong>de</strong> aforo.<br />

Respecto a este último punto, es necesario <strong>de</strong>stacar lo siguiente. Los teléfonos móviles se han<br />

convertido hoy en día en un elemento indispensable en nuestra vida diaria, especialmente en lo<br />

que respecta a nuestra movilidad. Los datos que los sistemas <strong>de</strong> telefonía móvil generan para su<br />

propio funcionamiento pue<strong>de</strong>n arrojar cierta información relacionada con nuestros movimientos.<br />

De ahí que existan en la literatura diferentes estudios en los que se afirma que la telefonía móvil<br />

pue<strong>de</strong> convertirse en una herramienta viable para la monitorización <strong>de</strong>l tráfico. En este Capítulo<br />

se han propuesto una serie <strong>de</strong> mo<strong>de</strong>los para la estimación <strong>de</strong> volúmenes <strong>de</strong> vehículos en función<br />

<strong>de</strong>, entre otras variables, llamadas realizadas por teléfonos móviles bajo ciertas situaciones<br />

expuestas en el apartado 4.3.3, <strong>de</strong>nominadas llamadas en movilidad. La naturaleza <strong>de</strong> la<br />

principal variable <strong>de</strong> entrada al mo<strong>de</strong>lo, llamadas en movilidad, posee una fuerte componente <strong>de</strong><br />

aleatoriedad. Este tipo <strong>de</strong> datos no representa el conjunto total <strong>de</strong> teléfonos que han pasado por<br />

una zona sino sólo aquellos pertenecientes al operador <strong>de</strong> interés que, a su vez, han realizado<br />

llamadas bajo ciertas condiciones. Ello condiciona en gran medida la representatividad <strong>de</strong> la<br />

muestra y, por tanto, <strong>de</strong> los resultados. Pese a estas dificulta<strong>de</strong>s, los valores <strong>de</strong> predicción <strong>de</strong> los<br />

mo<strong>de</strong>los finalmente seleccionados han alcanzado resultados razonables en comparación con<br />

valores observados por estaciones <strong>de</strong> aforo. En este sentido, la validación experimental <strong>de</strong> los<br />

mo<strong>de</strong>los propuestos ha manifestado evi<strong>de</strong>ncias <strong>de</strong> que la telefonía móvil, mediante llamadas en<br />

movilidad, constituye una alternativa válida para la <strong>de</strong>terminación <strong>de</strong> volúmenes <strong>de</strong> vehículos<br />

pasando por una zona frente a los procedimientos tradicionales basados en aforos.<br />

Una aplicación inmediata <strong>de</strong> esos volúmenes inferidos <strong>de</strong> la telefonía móvil se pue<strong>de</strong> enfocar al<br />

campo <strong>de</strong> las metodologías <strong>de</strong> ajuste <strong>de</strong> matrices <strong>de</strong> movilidad, tradicionalmente realizadas a<br />

partir <strong>de</strong> aforos <strong>de</strong> la red, aunque realizando una serie <strong>de</strong> modificaciones que contemplen el<br />

origen <strong>de</strong> los volúmenes utilizados. El siguiente capítulo aborda esta cuestión.


116 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL


CAPÍTULO 5<br />

APLICACIÓN A LA ESTIMACIÓN DE<br />

MATRICES ORIGEN–DESTINO<br />

5.1 INTRODUCCIÓN<br />

Las matrices <strong>de</strong> viajes Origen–Destino (O–D) son una fuente esencial <strong>de</strong> información<br />

correspondiente a la <strong>de</strong>manda <strong>de</strong> transporte en todos los estudios <strong>de</strong> planificación, gestión y<br />

control <strong>de</strong>l sistema <strong>de</strong> transporte. Estas matrices aportan información sobre el número <strong>de</strong> viajes<br />

realizados entre una zona origen i y una <strong>de</strong>stino j en un <strong>de</strong>terminado intervalo <strong>de</strong> tiempo. Por<br />

ello, para caracterizar el funcionamiento <strong>de</strong> un sistema <strong>de</strong> transporte es básico conocer, entre<br />

otros parámetros, la matriz origen–<strong>de</strong>stino. Históricamente, las matrices origen–<strong>de</strong>stino han sido<br />

estimadas en base a tres metodologías diferentes:<br />

1. Estimación directa: Llevando a cabo un proceso <strong>de</strong> encuestación, domiciliario o viario<br />

(directo sobre una muestra <strong>de</strong> vehículos o por ficha proporcionada a conductores, o<br />

indirecto por captación <strong>de</strong> números <strong>de</strong> matrículas).<br />

2. Estimación por mo<strong>de</strong>los <strong>de</strong> <strong>de</strong>manda: Haciendo uso <strong>de</strong> un mo<strong>de</strong>lo <strong>de</strong> distribución (e.g.:<br />

mo<strong>de</strong>lo <strong>de</strong> gravedad).<br />

3. Estimación mediante conteos <strong>de</strong> tráfico: Utilizando conteos <strong>de</strong> tráfico a fin <strong>de</strong> actualizar<br />

una matriz origen–<strong>de</strong>stino preexistente.<br />

De las tres aproximaciones anteriores, la tercera alternativa es la más profusamente utilizada en<br />

las últimas décadas y ha dado lugar a innumerables contribuciones <strong>de</strong>s<strong>de</strong> el trabajo pionero <strong>de</strong><br />

Low (1972). La metodología en la que se basa exige, como prerrequisito, un conjunto <strong>de</strong><br />

conteos <strong>de</strong> flujos <strong>de</strong> tráfico (volúmenes observados) y una matriz O–D previa, la cual pue<strong>de</strong> ser<br />

obtenida <strong>de</strong> algún estudio cronológicamente anterior o <strong>de</strong> una encuestación básica que pre<strong>de</strong>fina<br />

la estructura <strong>de</strong> la matriz final a obtener. Bajo el enfoque <strong>de</strong> esta metodología, suelen utilizarse<br />

mo<strong>de</strong>los basados en optimización matemática para intentar <strong>de</strong>terminar la matriz <strong>de</strong> viajes más


118 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

idónea. Dicha matriz <strong>de</strong>be ser consistente con la información contenida en los volúmenes <strong>de</strong><br />

tráfico en los arcos observados mediante el uso <strong>de</strong> una función objetivo a minimizar basada en<br />

información con respecto a la matriz <strong>de</strong> viajes previa. En estos mo<strong>de</strong>los basados, la matriz<br />

previa se supone que es una matriz O–D <strong>de</strong>sactualizada a la que hay que realizar<br />

ajustes/cambios para a<strong>de</strong>cuarse a los volúmenes observados cuando sea asignada a la red.<br />

Recientemente, los sistemas <strong>de</strong> telefonía móvil se están consi<strong>de</strong>rando como una tecnología<br />

prometedora para la captura <strong>de</strong> datos <strong>de</strong> tráfico <strong>de</strong>bido a sus ventajas con respecto a las técnicas<br />

tradicionales. Respecto a ello, en el anterior capítulo se presentó una metodología que permitía<br />

inferir volúmenes <strong>de</strong> tráfico a partir <strong>de</strong> conteos <strong>de</strong> paso <strong>de</strong> teléfonos por fronteras entre celdas.<br />

Dichas fronteras pue<strong>de</strong>n englobar uno o varios arcos <strong>de</strong> la red <strong>de</strong> transporte, proporcionando en<br />

ese caso información agregada <strong>de</strong> volúmenes para grupos <strong>de</strong> arcos en lugar <strong>de</strong> volúmenes a<br />

nivel <strong>de</strong> arco individual. Parece lógico que las metodologías <strong>de</strong> estimación clásicas <strong>de</strong>ban<br />

adaptarse para incorporar este tipo <strong>de</strong> información a su formulación <strong>de</strong> modo que pueda ser<br />

usada en lugar <strong>de</strong> (o a<strong>de</strong>más <strong>de</strong>) medidas proporcionadas por los tradicionales aforos.<br />

Este capítulo presenta una metodología para la estimación o ajuste <strong>de</strong> una matriz previa cuya<br />

principal novedad es el uso <strong>de</strong> información agregada <strong>de</strong> volúmenes observados en agrupaciones<br />

<strong>de</strong> arcos inferidos <strong>de</strong> la telefonía móvil. En particular, se ha optado por adaptar la metodología<br />

propuesta por Doblas y Benitez (2005), que ya <strong>de</strong>mostró su eficiencia en la estimación <strong>de</strong><br />

matrices con aforos tradicionales, para que pueda ser empleada con la información inferida <strong>de</strong> la<br />

telefonía, es <strong>de</strong>cir, a nivel <strong>de</strong> volumen por grupos <strong>de</strong> arcos. La elección como base teórica <strong>de</strong> esa<br />

metodología resi<strong>de</strong> en que, a diferencia <strong>de</strong> otras, ésta implementa un control <strong>de</strong> la distorsión<br />

experimentada por la matriz previa durante el ajuste. En general, este tipo <strong>de</strong> metodologías<br />

busca que la matriz resultante reproduzca, al ser asignada a la red, los volúmenes observados lo<br />

más fielmente posible, y <strong>de</strong>rive <strong>de</strong> una matriz previa que proporciona información útil al<br />

proceso dado que se supone como una observación <strong>de</strong> la “verda<strong>de</strong>ra” matriz O–D a estimar.<br />

Llevar a cabo una encuesta amplia y <strong>de</strong>tallada que permita elaborar una matriz previa resulta ser<br />

un proceso costoso, por lo que una distorsión excesiva <strong>de</strong> dicha información invalida cualquier<br />

esfuerzo presupuestario y humano <strong>de</strong>dicado a su elaboración. En base a este razonamiento, en la<br />

<strong>de</strong>finición <strong>de</strong> la función objetivo se buscará un compromiso entre la distorsión <strong>de</strong> la solución<br />

con relación a la matriz previa y a los volúmenes observados a nivel agregado <strong>de</strong> arcos.<br />

Se ha empleado como punto <strong>de</strong> partida la metodología <strong>de</strong> Doblas y Benitez (2005) por haber<br />

sido ampliamente estudiada y <strong>de</strong>sarrollada por nuestro grupo <strong>de</strong> investigación, así como por<br />

haber mostrado magnificos resultados en el campo <strong>de</strong>l ajuste <strong>de</strong> matrices con volúmenes<br />

observados. No obstante, la adaptación implementada en la formulación a nivel <strong>de</strong> volumen por


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 119<br />

grupos <strong>de</strong> arcos también sería válida para cualquier otra metodología <strong>de</strong> ajuste <strong>de</strong> matrices<br />

basada en volúmenes observados (por ejemplo, Spiess, 1990).<br />

5.2 ANTECEDENTES Y ESTADO ACTUAL<br />

Los métodos <strong>de</strong> estimación <strong>de</strong> matrices origen–<strong>de</strong>stino basados en la utilización <strong>de</strong> datos <strong>de</strong><br />

aforos automáticos para actualizar una matriz previa han experimentado un gran <strong>de</strong>sarrollo en<br />

los últimos 30 años. Esto lo ha motivado, fundamentalmente, el hecho <strong>de</strong> que este tipo <strong>de</strong><br />

información se pue<strong>de</strong> conseguir más rápida y económicamente que la obtenida tradicionalmente<br />

mediante la realización <strong>de</strong> encuestas.<br />

Estimar una matriz O–D pue<strong>de</strong> ser visto como el problema <strong>de</strong> encontrar una matriz que, cuando<br />

sea asignada a la red, reproduzca los conteos <strong>de</strong> tráfico observados. En general, hay un gran<br />

número <strong>de</strong> matrices que pue<strong>de</strong>n reproducir los conteos <strong>de</strong> tráfico observados, <strong>de</strong> modo que el<br />

sistema <strong>de</strong> ecuaciones resultante es in<strong>de</strong>terminado y pue<strong>de</strong> tener muchas soluciones posibles. El<br />

número <strong>de</strong> pares O–D (elementos <strong>de</strong> la matriz) exce<strong>de</strong> en gran medida el número <strong>de</strong> arcos para<br />

los cuales se han recogido los conteos <strong>de</strong> tráfico. Por tanto, el problema pasaría a ser la elección<br />

<strong>de</strong> la mejor matriz entre todas las posibles que reproducen los conteos <strong>de</strong> tráfico observado.<br />

Algunos mo<strong>de</strong>los resuelven este problema postulando un mo<strong>de</strong>lo general <strong>de</strong> distribución <strong>de</strong><br />

viajes, por ejemplo un mo<strong>de</strong>lo <strong>de</strong> gravedad, mientras que otros adoptan técnicas <strong>de</strong> inferencia<br />

estadística. Son innumerables las contribuciones en este campo con algoritmos <strong>de</strong>sarrollados<br />

para la resolución <strong>de</strong>l problema <strong>de</strong> estimación <strong>de</strong> la matriz O–D usando conteos <strong>de</strong> tráfico. Los<br />

métodos más comunes incluyen maximización <strong>de</strong> la entropía (Van Zuylen y Willumsen, 1980),<br />

máxima verosimilitud (Spiess, 1987), mínimos cuadrados generalizados (Cascetta, 1984; Bell,<br />

1991) o técnicas <strong>de</strong> inferencia bayesiana (Maher, 1983). Una revisión <strong>de</strong> esos mo<strong>de</strong>los se pue<strong>de</strong><br />

consultar en Cascetta y Nguyen (1988), Chen y Florian (1996), Abrahamsson (1998).<br />

Respecto a la obtención <strong>de</strong> una matriz O–D, diferentes estudios revisados en el Apartado 3.2<br />

relacionados con uso <strong>de</strong> teléfonos móviles (Pan et al., 2006; White y Wells, 2002; Akin y<br />

Sisiopiku, 2002), sugieren la posibilidad <strong>de</strong> obtener directamente matrices O–D mediante<br />

registros <strong>de</strong> localización generados por usuarios <strong>de</strong> teléfonos móviles. Una matriz O–D<br />

elaborada mediante datos <strong>de</strong> teléfonos pue<strong>de</strong> clasificarse según el nivel <strong>de</strong> agregación que se<br />

logra alcanzar, es <strong>de</strong>cir, según las “zonas <strong>de</strong> transporte” sean las celdas o las áreas <strong>de</strong><br />

localización existentes en la zona <strong>de</strong> servicio <strong>de</strong> red existente en la región bajo estudio. Esta<br />

diferenciación es necesaria puesto que está estrechamente relacionada con el tamaño <strong>de</strong> la<br />

muestra que generará la matriz. Cuando las “zonas <strong>de</strong> transporte” son las celdas, se precisa que<br />

los registros <strong>de</strong> localización estén actualizados a nivel <strong>de</strong> celda, lo cual sólo ocurre en el caso <strong>de</strong>


120 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

teléfonos que realicen llamadas. En el caso <strong>de</strong> que se trabaje a nivel <strong>de</strong> áreas <strong>de</strong> localización, los<br />

registros <strong>de</strong>ben <strong>de</strong> estar actualizados a nivel <strong>de</strong> LA, lo cual ocurre en los sistemas <strong>de</strong> telefonía<br />

con in<strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong>l estado <strong>de</strong>l teléfono, siendo por tanto la muestra más extensa.<br />

In<strong>de</strong>pendientemente <strong>de</strong>l nivel <strong>de</strong> agregación seleccionado, la elaboración <strong>de</strong> este tipo <strong>de</strong><br />

matrices implicaría monitorizar los registros iniciales y finales que cada teléfono efectúa sobre<br />

la región analizada en el intervalo <strong>de</strong> tiempo <strong>de</strong> interés, los cuales <strong>de</strong>terminan la zona origen y<br />

<strong>de</strong>stino <strong>de</strong>l viaje asociado al usuario portador <strong>de</strong>l teléfono. Este análisis permite distinguir entre<br />

los viajes <strong>de</strong> interés (pares O–D <strong>de</strong> la matriz) <strong>de</strong>l resto <strong>de</strong> viajes <strong>de</strong> paso, los cuales son viajes<br />

que se iniciaron o terminaron en otros orígenes o <strong>de</strong>stinos distintos a los estudiados.<br />

En general, un proceso <strong>de</strong> encuestación tradicional requiere trabajar con una muestra<br />

representativa <strong>de</strong> la población. Debido a ello, las metodologías <strong>de</strong> estimación basadas en<br />

matrices proce<strong>de</strong>ntes <strong>de</strong> encuestas resultan o poco fiables o muy costosas <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong><br />

vista económico y/o social. Sin embargo, el empleo <strong>de</strong> datos <strong>de</strong> teléfonos móviles supone<br />

utilizar una muestra muy extensa <strong>de</strong> la población, puesto que las tasas <strong>de</strong> penetración <strong>de</strong><br />

telefonía se sitúan ya en torno al 90% en muchos países europeos (CDB, 2006), siendo en<br />

España el 110.8% (CMT, Enero 2009). Junto a ello <strong>de</strong>staca su bajo coste <strong>de</strong> implantación dado<br />

que utiliza la misma infraestructura existente en los sistemas <strong>de</strong> telefonía, sin necesidad <strong>de</strong><br />

instalar módulos adicionales. Sin embargo, en lo que respecta a precisión <strong>de</strong> localización, este<br />

tipo <strong>de</strong> matrices <strong>de</strong>rivadas directamente <strong>de</strong> la telefonía móvil posee ciertos inconvenientes que<br />

las invalidan como matrices <strong>de</strong> viajes finales. La <strong>de</strong>sventaja principal se encuentra fuertemente<br />

relacionada con el tamaño <strong>de</strong> las “zonas <strong>de</strong> transporte” <strong>de</strong>rivadas <strong>de</strong> una zonificación que<br />

emplee la distribución celular <strong>de</strong> una red <strong>de</strong> telefonía móvil.<br />

Des<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> dimensión <strong>de</strong> las zonas <strong>de</strong> transporte que <strong>de</strong>finen una matriz O–D, la<br />

zonificación tradicional se realiza minuciosamente mediante criterios socioeconómicos o<br />

agregaciones <strong>de</strong> población seleccionando zonas que pudieran tener una relación causal con los<br />

movimientos que se dan entre ellas. El tamaño <strong>de</strong> estas zonas <strong>de</strong>be ser tal que el error <strong>de</strong><br />

agregación causado por el supuesto que todas las activida<strong>de</strong>s se concentran en ella no sea muy<br />

gran<strong>de</strong>, es <strong>de</strong>cir, bajo impacto <strong>de</strong> viajes intra–zonales. A<strong>de</strong>más, estas zonas <strong>de</strong>ben ser lo más<br />

homogéneas posible en cuanto al uso <strong>de</strong>l suelo y/o la composición <strong>de</strong> la población. En cambio,<br />

en matrices elaboradas directamente con registros telefónicos, las “zonas <strong>de</strong> transporte” vienen<br />

ya fijadas por el propio diseño <strong>de</strong>l sistema <strong>de</strong> telefonía, puesto que se utilizan las mismas celdas<br />

y/o áreas <strong>de</strong> localización <strong>de</strong>finidas en el dimensionado <strong>de</strong> la red celular. El tamaño <strong>de</strong> las celdas<br />

respecto al ámbito geográfico <strong>de</strong> su cobertura <strong>de</strong>pen<strong>de</strong> en gran medida <strong>de</strong> parámetros tales como<br />

tráfico que tiene soportar, topología <strong>de</strong>l terreno, tipo <strong>de</strong> antena o incluso edificios alre<strong>de</strong>dor <strong>de</strong>


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 121<br />

la estación base, variando el radio <strong>de</strong> una celda <strong>de</strong>s<strong>de</strong> cientos <strong>de</strong> metros (entornos urbanos) a<br />

kilómetros (entornos rurales). Consi<strong>de</strong>rando a su vez que las áreas <strong>de</strong> localización se <strong>de</strong>finen<br />

como agrupaciones <strong>de</strong> celdas, este tamaño será consi<strong>de</strong>rablemente mayor.<br />

Atendiendo al enfoque <strong>de</strong> uso <strong>de</strong> esas áreas (celdas y/o LA) como “zonas <strong>de</strong> transporte”, no será<br />

válida la hipótesis <strong>de</strong> bajo impacto <strong>de</strong> viajes intra–zonales dado que es lógico que comprendan<br />

varias <strong>de</strong> las clásicas zonas <strong>de</strong> transporte entre las que sí se dan viajes. Con las posibilida<strong>de</strong>s que<br />

ofrece la telefonía móvil, esos viajes intra–zonales serán generalmente imposibles <strong>de</strong> <strong>de</strong>tectar<br />

aunque, si se atien<strong>de</strong> a matrices en términos <strong>de</strong> macro zonas (agrupación <strong>de</strong> varias “zonas <strong>de</strong><br />

transporte” clásicas según un <strong>de</strong>terminado criterio), se permitiría elaborar una matriz <strong>de</strong> viajes.<br />

Por tanto, el uso datos <strong>de</strong> telefonía es válido para obtener una matriz final a nivel <strong>de</strong> macro zona<br />

o una matriz exclusivamente <strong>de</strong> viajes inter–zonales que pueda ser utilizada como previa para,<br />

posteriormente, ajustarla con otra información (aforos, volúmenes agregados <strong>de</strong>rivados <strong>de</strong><br />

teléfonos,…) mediante métodos tradicionales, pero no para usarla directamente como matriz <strong>de</strong><br />

viajes final. A<strong>de</strong>más, la obtención <strong>de</strong> una matriz <strong>de</strong> movilidad monitorizando el origen y <strong>de</strong>stino<br />

<strong>de</strong> una muestra <strong>de</strong> teléfonos móviles presenta como <strong>de</strong>sventaja que las matrices O–D inferidas<br />

no estarían <strong>de</strong>sagregadas ni por motivo ni por modo <strong>de</strong> transporte, ni aportarían información<br />

sobre características <strong>de</strong> los individuos, como así ocurre en el caso <strong>de</strong> las proce<strong>de</strong>ntes <strong>de</strong><br />

encuestas. En cambio presentarían como ventaja <strong>de</strong>stacable que la obtención <strong>de</strong> la matriz sería<br />

<strong>de</strong> forma automática y sobre una muestra <strong>de</strong> tamaño elevado.<br />

No obstante, los métodos más extendidos para la resolución <strong>de</strong>l problema <strong>de</strong> estimación <strong>de</strong> una<br />

matriz <strong>de</strong> viajes O–D son aquellos basados en mo<strong>de</strong>los matemáticos que utilizan las mediciones<br />

<strong>de</strong> aforos en un conjunto <strong>de</strong> arcos <strong>de</strong> la red <strong>de</strong> tráfico junto con otra información previa. Son en<br />

ellos en los que se ha centrado esta Tesis para la estimación <strong>de</strong> matrices, fusionando conceptos<br />

tradicionales <strong>de</strong> estimación mediante mo<strong>de</strong>los matemáticos junto con una nueva fuente <strong>de</strong><br />

información <strong>de</strong> volúmenes <strong>de</strong> tráfico <strong>de</strong>rivados <strong>de</strong> la telefonía móvil.<br />

5.3 METODOLOGÍA DE AJUSTE DE MATRICES ORIGEN–<br />

DESTINO MEDIANTE VOLUMENES AGREGADOS<br />

5.3.1 Introducción<br />

Una matriz O–D <strong>de</strong> viajes, T=[Tij], es una tabla <strong>de</strong> doble entrada que, en una celda genérica ij,<br />

contiene el número <strong>de</strong> viajes que tienen lugar entre la “zona <strong>de</strong> transporte” origen i y la <strong>de</strong><br />

<strong>de</strong>stino j durante un cierto periodo <strong>de</strong> tiempo. Los aforos o conteos <strong>de</strong> tráfico tradicionales


122 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

proporcionan el volumen total <strong>de</strong> vehículos que circula por cada uno <strong>de</strong> los arcos observados <strong>de</strong><br />

la red <strong>de</strong> transporte en dicho periodo <strong>de</strong> tiempo.<br />

La mayoría <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> actualización <strong>de</strong> matrices emplean conteos <strong>de</strong> tráfico obtenidos<br />

<strong>de</strong> aforos (<strong>de</strong>tectores) instalados sobre arcos <strong>de</strong>l viario. Ciertos sistemas que realizan tales<br />

conteos suelen ser <strong>de</strong>scartados para su uso en métodos <strong>de</strong> estimación <strong>de</strong> matrices <strong>de</strong>bido a que<br />

no son capaces <strong>de</strong> <strong>de</strong>sagregar la información medida sobre grupos <strong>de</strong> arcos en información<br />

individual <strong>de</strong> cada arco (e.g. las IMD no <strong>de</strong>sagregan por sentido <strong>de</strong> circulación). Este trabajo<br />

propone una metodología para el uso <strong>de</strong> la información agregada proporcionada por sistemas <strong>de</strong><br />

estas características. En particular, la metodología se va a centrar en datos <strong>de</strong> volúmenes<br />

<strong>de</strong>rivados <strong>de</strong> la telefonía móvil por consi<strong>de</strong>rarse ésta como una tecnología prometedora para la<br />

captura <strong>de</strong> datos <strong>de</strong> tráfico. Para ello es necesario introducir noveda<strong>de</strong>s metodológicas para la<br />

explotación <strong>de</strong> la información agregada <strong>de</strong> movilidad entre zonas <strong>de</strong>rivada <strong>de</strong> tales sistemas <strong>de</strong><br />

telefonía, es <strong>de</strong>cir, volúmenes observados sobre grupos <strong>de</strong> arcos <strong>de</strong> la red en lugar <strong>de</strong> sobre<br />

arcos individuales (tradicionales aforos). Se ha diseñado una metodología fácil <strong>de</strong> aplicar,<br />

a<strong>de</strong>cuada para abordar problemas <strong>de</strong> estimación <strong>de</strong> matrices en aplicaciones reales <strong>de</strong> gran<br />

envergadura con un gran número <strong>de</strong> zonas <strong>de</strong> transporte involucradas.<br />

5.3.2 Definición <strong>de</strong>l problema<br />

La necesidad <strong>de</strong> obtener matrices <strong>de</strong> viajes O–D <strong>de</strong> forma rápida y económica es esencial en la<br />

planificación <strong>de</strong>l transporte. Una matriz O–D es difícil y, en ocasiones, costosa <strong>de</strong> obtener por<br />

mediciones directas o encuestas; en cambio, se pue<strong>de</strong> obtener una estimación razonable <strong>de</strong> ella<br />

usando conteos <strong>de</strong> tráfico en un conjunto <strong>de</strong> arcos <strong>de</strong> la red <strong>de</strong> transporte y otra información<br />

adicional. Esta información pue<strong>de</strong> estar disponible en términos <strong>de</strong> una matriz O–D previa, T ,<br />

y/o en el número <strong>de</strong> viajeros que se atrajeron o se originaron en diversas zonas.<br />

Los métodos <strong>de</strong> estimación <strong>de</strong> matrices más extendidos solamente necesitan <strong>de</strong> conteos <strong>de</strong><br />

tráfico en un conjunto <strong>de</strong> arcos y una información a priori <strong>de</strong> la estructura <strong>de</strong> la matriz <strong>de</strong> viajes.<br />

En general, la mayoría <strong>de</strong> los mo<strong>de</strong>los para la estimación <strong>de</strong> una matriz O–D utilizan<br />

información a priori sobre ella en términos <strong>de</strong> una matriz O–D previa. Ésta pue<strong>de</strong> ser obtenida<br />

por una encuesta sobre una muestra o a partir <strong>de</strong> una matriz antigua, probablemente<br />

<strong>de</strong>sactualizada consi<strong>de</strong>rada como una observación próxima a la “verda<strong>de</strong>ra” matriz que se <strong>de</strong>sea<br />

estimar. Por otro lado, los datos <strong>de</strong>l conjunto <strong>de</strong> conteos <strong>de</strong> tráfico también se consi<strong>de</strong>ran como<br />

una observación directa <strong>de</strong> la realidad que el mo<strong>de</strong>lo matemático <strong>de</strong>be reproducir. Por tanto, en<br />

el proceso <strong>de</strong> ajuste, la matriz previa se consi<strong>de</strong>ra que es una matriz O–D obsoleta a la que hay


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 123<br />

que realizar cambios para obtener las mínimas <strong>de</strong>sviaciones posibles entre los volúmenes<br />

estimados en los arcos y los observados.<br />

En general, se pue<strong>de</strong> concluir que los distintos métodos para el problema <strong>de</strong> estimación <strong>de</strong><br />

matrices <strong>de</strong> viajes O–D, <strong>de</strong>sarrollados en la literatura a partir <strong>de</strong> volúmenes <strong>de</strong> tráfico<br />

observados, presentan la forma genérica siguiente (Yang et al., 1992):<br />

�T,T� � �v, v�<br />

Minimizar<br />

v, T<br />

�F1 �F2<br />

s.a. v = M ( T)<br />

Las funciones F1 y F2 son dos métricas que mi<strong>de</strong>n la distancia entre la matriz O–D estimada,<br />

T , y la matriz previa dada, T , y entre los volúmenes estimados y los observados en los arcos<br />

aforados, v y v respectivamente. Los procedimientos más habituales para las funciones F1 y F2<br />

son el <strong>de</strong> máxima verosimilitud, mínimos cuadrados generalizados y <strong>de</strong>rivaciones <strong>de</strong>l principio<br />

<strong>de</strong> máxima entropía. Los parámetros α y β son los correspondientes factores <strong>de</strong> peso que<br />

reflejan la confianza relativa en los datos disponibles T y v . Finalmente, la expresión v=M(T)<br />

representa el proceso <strong>de</strong> asignación consi<strong>de</strong>rado para mo<strong>de</strong>lar los volúmenes en los arcos a<br />

partir <strong>de</strong> la matriz estimada.<br />

Típicamente, el problema <strong>de</strong> estimación pue<strong>de</strong> ser interpretado como la búsqueda <strong>de</strong> una matriz<br />

O–D que, una vez asignada a la red, reproduzca los conteos <strong>de</strong> tráfico observados y, a<strong>de</strong>más, sea<br />

semejante a la matriz previa. La nueva contribución respecto a los métodos existentes en la<br />

literatura es el uso <strong>de</strong> información agregada <strong>de</strong> volúmenes observados sobre grupos <strong>de</strong> arcos <strong>de</strong><br />

la red en lugar <strong>de</strong> sobre arcos individuales. Este tipo <strong>de</strong> información pue<strong>de</strong> ser usada<br />

conjuntamente con los conteos <strong>de</strong> tráfico obtenidos <strong>de</strong> las tradicionales estaciones <strong>de</strong> aforo,<br />

dado que los aforos son un caso especial en el que el número <strong>de</strong> arcos <strong>de</strong>l grupo es uno. El<br />

procedimiento <strong>de</strong> estimación presentado en esta Tesis se basa en los dos criterios siguientes, que<br />

permiten traducirlo a expresiones matemáticas con vistas a su implementación práctica:<br />

1. Que la matriz resultante reproduzca, al ser asignada a la red, los datos <strong>de</strong> los volúmenes<br />

agregados lo más fielmente posible.<br />

2. Que la información contenida en la matriz O–D previa, obtenida habitualmente por<br />

medio <strong>de</strong> complejos y costosos procesos <strong>de</strong> encuestación domiciliaria, no se vea<br />

distorsionada en exceso. Una distorsión excesiva <strong>de</strong> dicha información invalida<br />

cualquier esfuerzo presupuestario y humano <strong>de</strong>dicado a tareas <strong>de</strong> encuestación.<br />

Esta metodología implementa un algoritmo <strong>de</strong> ajuste <strong>de</strong> matrices a partir <strong>de</strong> información<br />

agregada <strong>de</strong> volúmenes observados, junto con una matriz previa. La matriz previa a utilizar<br />

(21)


124 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

proce<strong>de</strong>rá <strong>de</strong> una generada mediante un proceso <strong>de</strong> encuestación o <strong>de</strong> una matriz antigua<br />

(probablemente <strong>de</strong>sactualizada). Para los volúmenes, pese a que la información pue<strong>de</strong> proce<strong>de</strong>r<br />

<strong>de</strong> cualquier sistema que proporcione conteos <strong>de</strong> tráfico en ese formato agregado sobre grupos<br />

<strong>de</strong> arcos, la metodología se centrará en el uso <strong>de</strong> conteos <strong>de</strong>rivados <strong>de</strong> sistemas <strong>de</strong> telefonía<br />

móvil. Recientemente, estos sistemas están siendo empleados con éxito para la monitorización<br />

<strong>de</strong>l tráfico; por ello el estudio se centra en el contexto <strong>de</strong> volúmenes agregados <strong>de</strong>rivados <strong>de</strong><br />

ellos. No obstante, la metodología es aplicable a cualquier otro sistema que proporcione<br />

volúmenes <strong>de</strong> forma agregada, incluso pue<strong>de</strong> ser combinada con los tradicionales aforos. El<br />

algoritmo <strong>de</strong> ajuste fue diseñado para ser implementado fácilmente en códigos comerciales <strong>de</strong><br />

asignación – EMME/2 (1998), MINUTP (1993), TRANSCAD (2006), TRIPS (1990), etc.<br />

5.3.3 Formulación matemática<br />

La i<strong>de</strong>a más intuitiva y sencilla para traducir los criterios anteriormente expuestos a una<br />

formulación matemática a<strong>de</strong>cuada es plantear el problema como uno <strong>de</strong> optimización<br />

matemática en el que se trata <strong>de</strong> minimizar una función cuadrática que mida las discrepancias<br />

entre volúmenes observados (ya sean <strong>de</strong> aforos automáticos, <strong>de</strong>rivados <strong>de</strong> teléfonos móviles o<br />

<strong>de</strong> cualquier otro sistema) y volúmenes teóricos o mo<strong>de</strong>lados (los que se obtienen por<br />

asignación), así como la “distancia” entre la matriz O–D <strong>de</strong> viajes previa y los sucesivos<br />

estimados que se obtienen como resultado <strong>de</strong>l proceso <strong>de</strong> ajuste. En la formulación que se<br />

propone se respeta esta i<strong>de</strong>a en lo que respecta a los volúmenes observados, sin embargo, para<br />

controlar la distorsión <strong>de</strong> la matriz previa se opta por un conjunto <strong>de</strong> restricciones <strong>de</strong> variables<br />

acotadas (para cada celda <strong>de</strong> la matriz O–D) y <strong>de</strong> restricciones funcionales (para la información<br />

contenida en la matriz O–D en distintos niveles <strong>de</strong> agregación: viajes generados al agregar<br />

según <strong>de</strong>stinos, viajes atraídos al agregar según orígenes y viajes totales al agregar en orígenes y<br />

<strong>de</strong>stinos) que mantengan la variación <strong>de</strong> la información contenida en la matriz estimada<br />

respecto <strong>de</strong> la previa <strong>de</strong>ntro <strong>de</strong> unos rangos consi<strong>de</strong>rados admisibles.<br />

Se consi<strong>de</strong>ra que el área objeto <strong>de</strong> nuestro estudio se encuentra dividida en no+nd zonas <strong>de</strong><br />

transporte (no orígenes y nd <strong>de</strong>stinos) con viajes <strong>de</strong>s<strong>de</strong> cada una <strong>de</strong> las zonas origen hasta todos<br />

los <strong>de</strong>stinos. Cada zona es representada por un nodo <strong>de</strong>nominado centroi<strong>de</strong>, don<strong>de</strong> los viajes se<br />

inician o terminan. La matriz <strong>de</strong> viajes se <strong>de</strong>notará por T = [Tij], siendo su elemento (i, j) el<br />

número <strong>de</strong> viajes <strong>de</strong>s<strong>de</strong> el origen i al <strong>de</strong>stino j durante un cierto periodo <strong>de</strong> tiempo. La red <strong>de</strong><br />

transporte correspondiente al área estudiada se representa mediante un grafo dirigido G=(N,A)<br />

don<strong>de</strong> N y A son el conjunto <strong>de</strong> nodos y arcos (dirigidos) respectivamente. En los arcos <strong>de</strong>l<br />

mo<strong>de</strong>lo <strong>de</strong> la red <strong>de</strong> transporte pue<strong>de</strong>n existir congestión y esto se suele mo<strong>de</strong>lar por funciones<br />

<strong>de</strong> coste sa(va). Las funciones <strong>de</strong> coste <strong>de</strong>scriben la relación entre el volumen <strong>de</strong> tráfico en el


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 125<br />

arco y el coste (o el tiempo) para recorrerlo. Se establece la hipótesis <strong>de</strong> que las funciones <strong>de</strong><br />

coste son separables, el tiempo en recorrer un arco no <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l volumen <strong>de</strong> otros arcos. El<br />

tratamiento <strong>de</strong> los efectos <strong>de</strong> la congestión es una característica importante para distinguir entre<br />

los mo<strong>de</strong>los para la evaluación <strong>de</strong> la matriz O–D. Cada mo<strong>de</strong>lo supone que la congestión se<br />

pue<strong>de</strong> tratar exógenamente (por asignación proporcional) o endógenamente (por asignación en<br />

equilibrio). Finalmente, la asignación <strong>de</strong> la matriz O–D al mo<strong>de</strong>lo <strong>de</strong> red para obtener los<br />

volúmenes y tiempos <strong>de</strong> viaje mo<strong>de</strong>lados sobre cada arco se basa en el equilibrio <strong>de</strong> usuario<br />

(user–equilibrium) <strong>de</strong>terminista o estocástico, cumpliendo los requisitos <strong>de</strong> asignación en<br />

equilibrio según el primer principio <strong>de</strong> Wardrop (Patriksson, 1994).<br />

A continuación se presenta la notación matemática necesaria para la formulación <strong>de</strong>l mo<strong>de</strong>lo.<br />

Índices:<br />

i � I zonas origen (no elementos)<br />

j � J zonas <strong>de</strong>stino (nd elementos)<br />

a � A arcos genéricos <strong>de</strong> la red<br />

b � B fronteras (cada frontera compren<strong>de</strong> un conjunto <strong>de</strong> arcos observados)<br />

k � Kij<br />

Constantes:<br />

rutas o caminos <strong>de</strong>s<strong>de</strong> origen i a <strong>de</strong>stino j<br />

� ak<br />

1 si el arco a pertenece a la ruta k, 0 en otro caso<br />

� 1 si el arco a pertenece a la frontera b, 0 en otro caso<br />

ab<br />

u ij , l ij cotas superiores e inferiores para el par O–D (i, j)<br />

u , O<br />

l cotas superiores e inferiores para viajes generados por la zona i<br />

O<br />

i<br />

D<br />

j<br />

i<br />

u , D<br />

l cotas superiores e inferiores para viajes atraídos por la zona j<br />

j<br />

u , l cotas superiores e inferiores para los viajes totales<br />

v | b volumen observado en la frontera b<br />

� | b factor <strong>de</strong> peso (opcional) otorgado a la frontera b<br />

Funciones:<br />

sa( v a)<br />

funciones <strong>de</strong> coste <strong>de</strong>l arco a


126 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Variables:<br />

v a<br />

volumen en el arco a<br />

h k<br />

flujo en el camino k<br />

p<br />

h<br />

k<br />

k � proporción <strong>de</strong> viajes (<strong>de</strong>l total Tij) que circula por el camino k<br />

Tij<br />

P � � � p proporción <strong>de</strong> viajes <strong>de</strong>s<strong>de</strong> el nodo i al nodo j a través <strong>de</strong>l arco a.<br />

ij, a ak k<br />

k�Kij v | b<br />

volumen en la frontera b<br />

Tij <strong>de</strong>manda (viajes) <strong>de</strong>s<strong>de</strong> el origen i al <strong>de</strong>stino j (Destacar que es una variable<br />

para el proceso global <strong>de</strong> ajuste, pero constante en cada etapa <strong>de</strong> asignación)<br />

Con esto, la formulación matemática que se propone es la siguiente.<br />

1. Nivel Superior<br />

2. Nivel Inferior<br />

� � � � 2<br />

1<br />

ij � 2 ��<br />

� b b b<br />

Minimizar f T v v<br />

(a)<br />

Tij<br />

b�B sa .. l �T�u � i�I, � j�J (b)<br />

ij ij ij<br />

�<br />

l � T �u � i�I O O<br />

i ij i<br />

j�J �<br />

l � T �u � j�J D D<br />

j ij j<br />

i�I ��<br />

l � T �u<br />

i�I j�J ij<br />

v<br />

� �� 0<br />

a<br />

Minimizar g v s ( v) dv<br />

va<br />

st .. v � � h , � a�A a ak k<br />

i�I j�J k�Kij �<br />

k�Kij ��<br />

a a<br />

a�A �� �<br />

h �T , � i�I, j�J k ij<br />

h �0 � k�K , i�I, j�J k ij<br />

(c)<br />

(d)<br />

(e)<br />

(22)<br />

(23)


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 127<br />

El mo<strong>de</strong>lo propuesto tiene una estructura binivel, don<strong>de</strong> el problema <strong>de</strong> nivel superior estima la<br />

matriz <strong>de</strong> viajes Tij en función <strong>de</strong> un volumen va en los arcos dado. El problema <strong>de</strong> nivel inferior<br />

es el conocido como TAP (Traffic Assignment Problem), un problema <strong>de</strong> asignación que<br />

<strong>de</strong>termina los volúmenes va en los arcos, según las condiciones <strong>de</strong> equilibrio <strong>de</strong> usuario, para<br />

una matriz <strong>de</strong> viajes Tij dada (Beckmann et al., 1956).<br />

Respecto al problema <strong>de</strong> estimación <strong>de</strong> una matriz <strong>de</strong> viajes O–D expuesto en la ecuación (22),<br />

los volúmenes <strong>de</strong>rivados <strong>de</strong> la telefonía móvil con los que realizar el ajuste, v , son obtenidos<br />

b<br />

sobre fronteras b entre celdas <strong>de</strong> la red celular, cada una <strong>de</strong> las cuales compren<strong>de</strong> un grupo <strong>de</strong><br />

arcos <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> red. La formulación que se propone en este trabajo incluye un término<br />

cuadrático para controlar la distancia entre los volúmenes observados y estimados (mo<strong>de</strong>lados).<br />

Sin embargo, para controlar la distorsión <strong>de</strong> la matriz estimada (o ajustada) respecto <strong>de</strong> la previa<br />

se opta por un conjunto <strong>de</strong> restricciones <strong>de</strong> variables acotadas (22) (b) y <strong>de</strong> restricciones<br />

funcionales (22) (c, d, e). Dichas restricciones <strong>de</strong>ben <strong>de</strong>finir unos rangos admisibles <strong>de</strong><br />

variación para la información contenida en la matriz O–D en distintos niveles <strong>de</strong> agregación<br />

(para cada celda <strong>de</strong> la matriz O–D, viajes generados al agregar según <strong>de</strong>stinos, viajes atraídos al<br />

agregar según orígenes, y viajes totales al agregar en orígenes y <strong>de</strong>stinos, respectivamente). A<br />

diferencia <strong>de</strong> la formulación empleada en (21), la medida <strong>de</strong> la distorsión entre las matrices<br />

estimada y previa se ha mo<strong>de</strong>lado mediante dicho conjunto <strong>de</strong> restricciones en lugar <strong>de</strong><br />

mediante una función F1. Para obtener estrictamente la notación equivalente a (21) bastaría con<br />

<strong>de</strong>finir la lagrangiana <strong>de</strong>l problema y así elevar las restricciones (22) (b, c, d y e) a la función<br />

objetivo.<br />

Respecto a los volúmenes v <strong>de</strong> todas las fronteras observadas b�B, es necesario realizar un<br />

b<br />

cálculo adicional sobre los volúmenes va obtenidos <strong>de</strong>l nivel inferior (23). De modo que el<br />

volumen en la frontera b pue<strong>de</strong> ser expresado, en términos <strong>de</strong> proporciones <strong>de</strong> viajes, como la<br />

suma <strong>de</strong> los volúmenes va <strong>de</strong> cada uno <strong>de</strong> los arcos que cruzan la frontera b, obteniendo la<br />

siguiente expresión:<br />

� � � �<br />

v � va � �ab | va � � b<br />

ab | � Tij �akpk �� �ab<br />

| TijPij, a � b�B � � � �<br />

a�b a�A a�A� i�I j�J k�Kij � a�A� i, j �<br />

� � � �� � � � (24)<br />

Si las funciones <strong>de</strong> coste son tales que<br />

dsa( va)<br />

� 0 para cada arco a � A, es <strong>de</strong>cir, el tiempo<br />

dv<br />

a<br />

necesario para recorrer un arco aumenta conforme aumenta el tráfico en él, está garantizada la


128 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

unicidad <strong>de</strong> solución con respecto a los volúmenes en arcos va (Sheffi, 1985); pudiéndose<br />

<strong>de</strong>rivar una solución factible para cada v conforme a la expresión (24).<br />

b<br />

El problema <strong>de</strong> la estimación <strong>de</strong> matrices O–D mediante volúmenes observados consiste en<br />

encontrar la distribución <strong>de</strong> viajes entre no×nd celdas (Tij) a partir <strong>de</strong> los aforos disponibles en la<br />

red, en este caso, fronteras observadas. En la mayor parte <strong>de</strong> los casos el número <strong>de</strong> incógnitas<br />

(no×nd) es muy superior al <strong>de</strong> fronteras observadas, por lo que es imposible <strong>de</strong>terminar una<br />

matriz O–D única, consi<strong>de</strong>rando el problema in<strong>de</strong>terminado. Esto significa que existen muchas<br />

matrices que satisfacen las ecuaciones <strong>de</strong>l problema y el objetivo pasa a ser el encontrar la<br />

solución que mejor se adapte a <strong>de</strong>terminados criterios pre–especificados. Para la presente<br />

metodología, dichos criterios son establecidos y mo<strong>de</strong>lados matemáticamente en el problema <strong>de</strong><br />

nivel superior (22) mediante las restricciones (22) (b, c, d y e).<br />

La exactitud <strong>de</strong> las matrices obtenidas mediante esta formulación se encuentra afectada por la<br />

precisión <strong>de</strong> los resultados <strong>de</strong> partida: volúmenes observados, viajes generados y atraídos por<br />

cada centroi<strong>de</strong>, etc. En una red real, la falta <strong>de</strong> exactitud <strong>de</strong> estos datos hace que, en ocasiones,<br />

no se verifiquen las condiciones <strong>de</strong> equilibrio en la red mo<strong>de</strong>lada. Bajo esta hipótesis, es<br />

razonable permitir que las soluciones obtenidas en el proceso <strong>de</strong> la estimación no reproduzcan<br />

los datos exactamente; consecuentemente, el objetivo a perseguir será obtener la matriz O–D<br />

estimada que mejor reproduzca los datos observados tanto a nivel <strong>de</strong> volúmenes como <strong>de</strong> matriz<br />

previa.<br />

Es necesario realizar algunos comentarios sobre el sistema <strong>de</strong> inecuaciones lineales mostrados<br />

en (22) (b, c, d y e). Dado que el objetivo <strong>de</strong> dichas restricciones es controlar la distorsión <strong>de</strong> la<br />

información contenida en la matriz estimada T respecto <strong>de</strong> la matriz previa T , es evi<strong>de</strong>nte que<br />

las correspondientes cotas <strong>de</strong>berían ser <strong>de</strong>finidas, bien en términos absolutos o relativos,<br />

conforme a valores <strong>de</strong>rivados <strong>de</strong> la estimación inicial (0)<br />

T ij , lo cual garantizaría una región<br />

factible no–vacía. Ello se <strong>de</strong>scribe con más <strong>de</strong>talle en el apartado 5.3.4.3. Asimismo, merece la<br />

pena <strong>de</strong>stacar que las cotas superiores e inferiores empleadas en (22) para cada restricción<br />

<strong>de</strong>pen<strong>de</strong>n <strong>de</strong>l diseñador, es <strong>de</strong>cir, no hay un valor universal para todos los casos sino valores<br />

específicos para cada problema dado. Estas consi<strong>de</strong>raciones, junto a algunas orientaciones para<br />

la <strong>de</strong>finición <strong>de</strong> dichas cotas, son parte <strong>de</strong> la práctica usual seguida en aplicaciones <strong>de</strong>sarrolladas<br />

y testeadas en el campo <strong>de</strong> estimaciones <strong>de</strong> matrices O–D (Doblas y Benitez, 2005).


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 129<br />

5.3.4 Algoritmo <strong>de</strong> ajuste<br />

Respecto al problema <strong>de</strong> estimación <strong>de</strong> matrices, dadas las dimensiones <strong>de</strong> las re<strong>de</strong>s reales y la<br />

capacidad <strong>de</strong> los or<strong>de</strong>nadores actuales, pue<strong>de</strong> resultar inviable acometer el problema mediante<br />

un método que trabaje directamente con las restricciones funcionales y <strong>de</strong> variables acotadas<br />

propuestas en (22). Esto se <strong>de</strong>be, principalmente, al cálculo y manipulación <strong>de</strong> matrices <strong>de</strong><br />

gran<strong>de</strong>s dimensiones; por ejemplo, una red <strong>de</strong> transporte real <strong>de</strong> tamaño medio pue<strong>de</strong> tener <strong>de</strong>l<br />

or<strong>de</strong>n <strong>de</strong> unos 500 centroi<strong>de</strong>s, cantidad que implica una matriz O–D <strong>de</strong> 250000 celdas.<br />

Se preten<strong>de</strong> diseñar una metodología fácil <strong>de</strong> aplicar y a<strong>de</strong>cuada para abordar problemas <strong>de</strong><br />

estimación <strong>de</strong> matrices en aplicaciones reales <strong>de</strong> gran envergadura (elevado número <strong>de</strong> zonas y<br />

centroi<strong>de</strong>s). Por ello, la limitación antes mencionada ha motivado la utilización <strong>de</strong> un método <strong>de</strong><br />

transformación (penalización) en el cual las restricciones funcionales se integran en una función<br />

objetivo equivalente, pudiéndose tratar directamente las restricciones <strong>de</strong> variables acotadas.<br />

El planteamiento seguido en esta Tesis está basado en el método propuesto por Doblas y<br />

Benítez (2005) que combina el método <strong>de</strong> transformación <strong>de</strong>nominado método <strong>de</strong>l Lagrangiano<br />

aumentado (o <strong>de</strong> los multiplicadores) con el método <strong>de</strong> aproximación lineal <strong>de</strong> Frank–Wolfe.<br />

Éstos centraron el problema <strong>de</strong> estimación <strong>de</strong> matrices en el uso <strong>de</strong> conteos <strong>de</strong> tráfico en arcos<br />

preservando la estructura <strong>de</strong> una matriz previa conocida. Sin embargo, el planteamiento<br />

<strong>de</strong>sarrollado en esta Tesis introduce una modificación para utilizar en el proceso <strong>de</strong> ajuste<br />

volúmenes agregados en grupos <strong>de</strong> arcos en lugar <strong>de</strong> volúmenes en arcos individuales (aforos<br />

tradicionales). Esta modificación es esencial para la utilización <strong>de</strong> información <strong>de</strong>rivada <strong>de</strong> la<br />

telefonía móvil como volúmenes observados, <strong>de</strong>bido a que estos sistemas proporcionan<br />

información agregada a nivel <strong>de</strong> fronteras entre celdas (grupos <strong>de</strong> arcos que la cruzan) y no a<br />

nivel individual <strong>de</strong> arco. No obstante, el mo<strong>de</strong>lo formulado pue<strong>de</strong> ser usado conjuntamente con<br />

los tradicionales conteos <strong>de</strong> tráfico dado que los aforos son un caso especial en el que el número<br />

<strong>de</strong> arcos <strong>de</strong>l grupo es uno. Por ello, es necesario resaltar que la metodología propuesta no<br />

excluye el uso <strong>de</strong> información proce<strong>de</strong>nte tanto <strong>de</strong> aforos tradicionales como <strong>de</strong> otras fuentes,<br />

aunque por razones <strong>de</strong> claridad se ha dirigido el problema <strong>de</strong> estimación exclusivamente a<br />

información <strong>de</strong> volúmenes observados <strong>de</strong>rivada <strong>de</strong> teléfonos móviles.<br />

Esta sección se <strong>de</strong>dica a introducir la metodología propuesta por Doblas y Benitez (2005), así<br />

como a presentar y discutir las modificaciones necesarias que afectan al algoritmo <strong>de</strong> resolución<br />

<strong>de</strong>l problema <strong>de</strong> optimización propuesto para utilizar los datos <strong>de</strong>rivados <strong>de</strong> teléfonos móviles.


130 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

5.3.4.1 Introducción<br />

A continuación se presenta el método combinado <strong>de</strong> la Función Lagrangiana Aumentada con el<br />

algoritmo <strong>de</strong> Frank–Wolfe. Una <strong>de</strong>scripción más <strong>de</strong>tallada sobre el proceso <strong>de</strong> optimización<br />

matemática pue<strong>de</strong> ser encontrada en Doblas y Benitez (2005).<br />

■ Método <strong>de</strong> la Función Lagrangiana Aumentada o <strong>de</strong> los Multiplicadores<br />

El problema (22) pue<strong>de</strong> formularse como un problema genérico <strong>de</strong> minimización con<br />

restricciones lineales gl(x) y variables acotadas [l, u]:<br />

Minimizar<br />

x<br />

f<br />

�x� s.a. gl( x)<br />

�0, l�x�u N<br />

x�<br />

�<br />

� l= 1,2, �,L<br />

don<strong>de</strong> gl(x) serían las restricciones funcionales <strong>de</strong>finidas en (22) (c, d y e), y l≤x≤u las<br />

restricciones <strong>de</strong> variables acotadas <strong>de</strong>finidas en (22) (b). Para tal problema, se sabe que las<br />

condiciones <strong>de</strong> Kuhn–Tucker son necesarias y suficientes para caracterizar el óptimo <strong>de</strong> dicho<br />

problema. El Método <strong>de</strong> la Función Lagrangiana Aumentada o Método <strong>de</strong> los Multiplicadores<br />

(Reklaitis et al., 1983) consiste, básicamente, en añadir una serie <strong>de</strong> términos cuadráticos a la<br />

función clásica <strong>de</strong> Lagrange f(x), formando una función sin restricciones cuyo mínimo es un<br />

punto que cumple las condiciones <strong>de</strong> Kuhn–Tucker <strong>de</strong>l problema original. Sin embargo, es<br />

necesario indicar que la función Lagrangiana Aumentada conseguida en nuestro caso no incluirá<br />

las restricciones <strong>de</strong> variables acotadas. De modo que la función lagrangiana aumentada queda<br />

expresada como:<br />

2 2<br />

� �<br />

aug l l l l<br />

l�1<br />

(25)<br />

L<br />

L ( x, � ) = f(x) + � g (x) �� ��<br />

(26)<br />

�<br />

L<br />

don<strong>de</strong> σ = (σl) �� , siendo σl y ωl el “multiplicador” y el factor <strong>de</strong> peso (o escala) asociado a la<br />

restricción l–ésima, respectivamente. Cabe <strong>de</strong>stacar que el empleo <strong>de</strong> la función Lagrangiana<br />

Aumentada para resolver el problema pue<strong>de</strong> ser visto, en general, como una optimización sin<br />

restricciones pero, <strong>de</strong>bido a la estructura <strong>de</strong> este problema, se consigue conservar las no×nd<br />

restricciones <strong>de</strong> las variables acotadas <strong>de</strong>l problema original. El término correspondiente a las<br />

restricciones σl se encarga <strong>de</strong> penalizar las violaciones <strong>de</strong> las restricciones que se cometan<br />

durante el proceso <strong>de</strong> optimización. La aplicación <strong>de</strong> este método a problemas <strong>de</strong>l tipo (25)<br />

garantiza la convergencia hacia un punto que cumple las condiciones <strong>de</strong> optimalidad, siendo los


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 131<br />

términos <strong>de</strong> penalización y los multiplicadores (actualizados según una sencilla regla) los que<br />

fuerzan la convergencia hacia una solución factible óptima.<br />

El procedimiento consiste en optimizar (minimizar) en x la función lagrangiana aumentada (26),<br />

siendo el término ωl constante <strong>de</strong> una etapa a otra; mientras que los multiplicadores σl sólo<br />

permanecen constantes durante cada etapa o subproblema. En cada etapa se hallan los x óptimos<br />

para esos multiplicadores <strong>de</strong> modo que, una vez obtenido el óptimo para esa etapa <strong>de</strong>l proceso,<br />

se proce<strong>de</strong> a actualizar los multiplicadores conforme a la regla<br />

�<br />

� � g ( x ) �� para<br />

( n 1) ( n) ( n)<br />

j j j<br />

acometer la siguiente etapa (n+1) <strong>de</strong>l proceso <strong>de</strong> optimización. Esto se repite hasta alcanzar un<br />

grado <strong>de</strong> convergencia razonable. El operador �·� representa:<br />

��<br />

si � < 0<br />

� � �<br />

(27)<br />

�0<br />

si � � 0<br />

En cada etapa o subproblema, es <strong>de</strong>cir, en cada resolución aproximada <strong>de</strong> las sucesivas<br />

lagrangianas aumentadas, el método empleado es el <strong>de</strong> Frank–Wolfe. Este método consiste en<br />

hallar una dirección auxiliar resolviendo el problema (26) linealizado sin salirse <strong>de</strong> la región<br />

factible. Esta dirección auxiliar <strong>de</strong>termina una dirección <strong>de</strong> <strong>de</strong>scenso que permite hallar un<br />

nuevo estimado que mejore el valor <strong>de</strong> la función <strong>de</strong> lagrange aumentada.<br />

■ Método <strong>de</strong> Frank–Wolfe<br />

Centrando la atención en el algoritmo <strong>de</strong> Frank–Wolfe (F–W) presentado en términos <strong>de</strong> la<br />

función Lagrangiana Aumentada genérica sujeta a restricciones <strong>de</strong> variables acotadas, el<br />

problema que preten<strong>de</strong> ser optimizado mediante el método <strong>de</strong> aproximación lineal <strong>de</strong> F–W es:<br />

Minimizar<br />

x<br />

s.a.<br />

L<br />

aug<br />

�x� l�x�u N<br />

x� �<br />

para un vector constante <strong>de</strong> multiplicadores σ asociados a esta etapa <strong>de</strong>l proceso. Se <strong>de</strong>nota m al<br />

contador para i<strong>de</strong>ntificar las sucesivas estimaciones obtenidas por el algoritmo. El método <strong>de</strong><br />

F–W se basa en aproximar linealmente la función objetivo en torno al punto actual<br />

(28)<br />

( ) m<br />

x . A<br />

continuación, se busca el punto y <strong>de</strong> la región factible que minimice la función objetivo<br />

linealizada, que se traduce en el problema <strong>de</strong> optimización lineal <strong>de</strong>finido como:<br />

y<br />

� � T<br />

( m)<br />

Minimizar �L<br />

x y<br />

(a)<br />

aug<br />

s.a. l�y�u (b)<br />

N<br />

y ��<br />

(c)<br />

(29)


132 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Entonces, con la solución en la m–ésima iteración <strong>de</strong>l problema linealizado,<br />

nuevo estimado <strong>de</strong> (28) mediante la siguiente regla <strong>de</strong> actualización:<br />

� �<br />

( m�1) ( m) ( m) ( m) ( m) ( m) ( m) ( m)<br />

ij ij ij ij ij ij<br />

y , se obtiene un<br />

x =x �� y �x �x ��<br />

d<br />

(30)<br />

Esta expresión está escrita en términos <strong>de</strong> la dirección <strong>de</strong> <strong>de</strong>scenso en el estimado actual, d (m) , la<br />

cual es la diferencia entre el punto extremo auxiliar<br />

( m)<br />

y y el estimado actual<br />

se obtiene como solución <strong>de</strong>l siguiente problema <strong>de</strong> optimización unidimensional:<br />

( m�1) ( m) ( m)<br />

�x �x � d �<br />

Minimizar<br />

λ<br />

Laug �<br />

s.a. 0 ���1 ( m)<br />

ij<br />

( m)<br />

x . El paso<br />

don<strong>de</strong> λ pertenece al intervalo [0, 1] puesto que el punto auxiliar y está localizado en un vértice<br />

<strong>de</strong> la región factible <strong>de</strong>finida por el conjunto poliédrico <strong>de</strong>finido por (29).<br />

Por tanto, según el método <strong>de</strong> la Función Lagrangiana Aumentada, las restricciones funcionales<br />

(22) (c, d y e) se integran en una función objetivo equivalente, mientras que las restricciones <strong>de</strong><br />

variables acotadas (22) (b) son tratadas directamente con el método <strong>de</strong> direcciones factibles<br />

(Frank–Wolfe). Con ello se consigue que las restricciones <strong>de</strong> variables acotadas se cumplan en<br />

todo momento, mientras que el cumplimiento <strong>de</strong> las restricciones funcionales es producto <strong>de</strong> un<br />

proceso iterativo que va penalizando las violaciones cometidas por medio <strong>de</strong> términos que<br />

aumentan la función <strong>de</strong> Lagrange clásica.<br />

5.3.4.2 Implementación<br />

A continuación, se introduce una notación adicional a la presentada en la sección 5.3.3 para<br />

reescribir el método combinado <strong>de</strong> la función Lagrangiana Aumentada con el algoritmo <strong>de</strong><br />

Frank–Wolfe en términos <strong>de</strong> magnitu<strong>de</strong>s asociadas al problema <strong>de</strong> estimación <strong>de</strong> matrices O–D.<br />

Constantes:<br />

O<br />

� i factor <strong>de</strong> peso asociado a las restricciones <strong>de</strong> viajes generados por la zona i<br />

D<br />

� j factor <strong>de</strong> peso asociado a las restricciones <strong>de</strong> viajes atraídos por la zona j<br />

� factor <strong>de</strong> peso asociado a las restricciones <strong>de</strong> viajes totales<br />

( m)<br />

�<br />

(31)


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 133<br />

Variables:<br />

O<br />

� i multiplicador asociado a la cota superior <strong>de</strong> la restricción <strong>de</strong> viajes generados por la<br />

zona i<br />

O<br />

� i multiplicador asociado a la cota inferior <strong>de</strong> la restricción <strong>de</strong> viajes generados por la zona<br />

i<br />

D<br />

� j multiplicador asociado a la cota superior <strong>de</strong> la restricción <strong>de</strong> viajes atraídos por la zona j<br />

D<br />

� j multiplicador asociado a la cota inferior <strong>de</strong> la restricción <strong>de</strong> viajes atraídos por la zona j<br />

� multiplicador asociado a la cota superior <strong>de</strong> la restricción <strong>de</strong> viajes totales<br />

� multiplicador asociado a la cota inferior <strong>de</strong> la restricción <strong>de</strong> viajes totales<br />

yij<br />

dij<br />

(m)<br />

punto extremo auxiliar <strong>de</strong>l algoritmo <strong>de</strong> Frank–Wolfe<br />

dirección <strong>de</strong> <strong>de</strong>scenso <strong>de</strong>l algoritmo <strong>de</strong> Frank–Wolfe<br />

m–ésima iteración<br />

Con la anterior notación, la función Lagrangiana Aumentada (26) pue<strong>de</strong> ser escrita como:<br />

1<br />

� � � �<br />

Laug �T, ��� ��<br />

���� � � ��<br />

�<br />

2<br />

��Tij � � �akpkv<br />

b � b�<br />

b�B i�I j�J a�b� k�K � ij � �<br />

1<br />

� no �<br />

� O<br />

� �� � i<br />

2 � i�1 �<br />

� �<br />

nd O O<br />

ui ��Tij ��i j�1 2<br />

2� no �<br />

O O<br />

��� � �� � i<br />

� ��i i�1 �<br />

� �<br />

nd<br />

O O<br />

�Tij<br />

�li ��i j�1<br />

2 � 2�<br />

O<br />

���<br />

� ��<br />

i<br />

��<br />

��<br />

d 1<br />

� n �<br />

D<br />

� ��� � j<br />

2 � j�1 �<br />

� �<br />

n<br />

2<br />

o<br />

2 � nd �<br />

D D D<br />

D<br />

u �� � �� � �<br />

j Tij<br />

� j � j �<br />

i�1<br />

� �� � j<br />

j�1 �<br />

� �<br />

no<br />

D D<br />

�Tij<br />

�lj �� j<br />

i�1<br />

2 � 2 �<br />

D<br />

���<br />

� ��<br />

j<br />

��<br />

��<br />

1<br />

�� � ��� 2 �� �� 2 2<br />

no nd � � no nd<br />

��<br />

2 2<br />

u���T � � ��� � � � ��<br />

ij � �<br />

�1 �1 � � ��Tij<br />

l � �<br />

i j i�1 j�1<br />

��<br />

� � ��<br />

don<strong>de</strong> T = [Tij ], siendo σ = {σ O , σ D }, y τ = {τ O , τ D } vectores <strong>de</strong> multiplicadores asociados a<br />

cotas superiores e inferiores <strong>de</strong> las restricciones, respectivamente. En cada etapa o subproblema<br />

(m) los multiplicadores permanecen constantes, la variable <strong>de</strong> <strong>de</strong>cisión es la matriz Tij. Por lo<br />

que el problema <strong>de</strong> optimización se <strong>de</strong>fine como:<br />

2<br />

(32)


134 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

1<br />

� � � �<br />

Min Laug �Tij�� ���� � �Tij�akpk��v �<br />

T<br />

b<br />

ij<br />

2<br />

��� � � b�<br />

b�B i�I j�J a�b k�K � � ij � �<br />

no 1<br />

� �<br />

O<br />

� ��� � i<br />

2 � i�1 �<br />

� �<br />

nd O O<br />

ui ��Tij ��i j�1 2<br />

no O<br />

2� �<br />

O<br />

���i � �� � � i<br />

� �<br />

i�1 �<br />

� �<br />

nd<br />

O O<br />

�Tij<br />

�li ��i j�1<br />

2 �<br />

O<br />

2�<br />

���i<br />

� ��<br />

��<br />

��<br />

1<br />

� nd� D<br />

� ��� � j<br />

2 � �<br />

�<br />

no<br />

D D<br />

uj ��Tij �� j<br />

2<br />

D<br />

2 � nd �<br />

D<br />

���<br />

j � ��<br />

� �� � j<br />

�<br />

� �<br />

no<br />

D D<br />

�Tij<br />

�lj �� j<br />

2 �<br />

D<br />

2 �<br />

���<br />

j � ��<br />

��<br />

�<br />

s.a.<br />

j�1 �<br />

i�1<br />

j�1 i�1<br />

�<br />

�� ��� �� u<br />

no nd ��Tij i�1 j�1 �<br />

2<br />

�<br />

2<br />

� �<br />

�<br />

�<br />

�<br />

�<br />

no nd<br />

��Tij<br />

i�1 j�1<br />

l �<br />

2<br />

��<br />

2<br />

� ��<br />

��<br />

1<br />

� � � � � � � �<br />

2<br />

�� � � ��<br />

l �T �u<br />

ij ij ij<br />

Al finalizar cada etapa (m) <strong>de</strong> optimización, los multiplicadores para el nuevo subproblema<br />

(m+1) se actualizan en función <strong>de</strong>l estimado óptimo<br />

2<br />

( ) m<br />

ij<br />

(33)<br />

T y <strong>de</strong> los multiplicadores σ y τ<br />

correspondientes a la etapa (m), <strong>de</strong> acuerdo con la regla (34). El proceso se da por concluido<br />

cuando se alcanza un grado <strong>de</strong> convergencia que se consi<strong>de</strong>re razonable.<br />

O�m�1� i<br />

O<br />

i<br />

nd �m� � ij<br />

O�m� i<br />

O�m�1� i<br />

nd<br />

�m� � ij<br />

O<br />

i<br />

O�m� i<br />

j�1 j�1<br />

D�m�1� j<br />

D<br />

j<br />

no �m� � ij<br />

D�m� j<br />

D�m�1� j<br />

no<br />

�m� � ij<br />

D<br />

j<br />

D�m� j<br />

i�1 i�1<br />

�m�1� �<br />

no nd �m� u���Tij �<br />

�m� �m�1� �<br />

no nd<br />

�m� ��Tij<br />

�l� �m� i�1 j�1 i�1 j�1<br />

� � u � T �� � � T �l �� , � i �I<br />

� � u � T �� � � T �l �� , � j �J<br />

� � � �<br />

Para minimizar la función Lagrangiana Aumentada mediante el algoritmo <strong>de</strong> Frank–Wolfe es<br />

necesario calcular su gradiente, resolver el problema linealizado para hallar el punto extremo<br />

auxiliar y la dirección <strong>de</strong> <strong>de</strong>scenso, y obtener el paso óptimo. Teniendo en cuenta la ecuación<br />

(24) <strong>de</strong> los volúmenes en fronteras v expresada en términos <strong>de</strong> Tij y <strong>de</strong> proporciones pk, <strong>de</strong><br />

b<br />

caminos o rutas usadas por los usuarios, es posible introducir una hipótesis que permita<br />

obtener una aproximación <strong>de</strong> la <strong>de</strong>rivada analítica y así obtener L � �<br />

aug<br />

(34)<br />

� T fácilmente. Dicha<br />

hipótesis consiste en consi<strong>de</strong>rar constantes las proporciones <strong>de</strong> viaje pk correspondientes a la<br />

matriz O–D actual, T (m) , al producirse un cambio infinitesimal en los viajes <strong>de</strong> una única casilla<br />

<strong>de</strong> la matriz, conservando el resto constantes. De modo que, las <strong>de</strong>rivadas parciales <strong>de</strong> los<br />

volúmenes <strong>de</strong> frontera v con respecto a las variables Tij se <strong>de</strong>finen como:<br />

b


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 135<br />

�v<br />

�T<br />

b<br />

a<br />

ij<br />

�<br />

�<br />

k�Kij �<br />

v � � v<br />

a�A �<br />

ab<br />

ak k<br />

a<br />

p<br />

� v �v<br />

� ��� ���<br />

��<br />

p<br />

�T �T<br />

b a<br />

ab ab<br />

ij a�A ij a�A k�Kij Con la expresión anterior se pue<strong>de</strong> obtener fácilmente la expresión <strong>de</strong>l gradiente <strong>de</strong> la<br />

Lagrangiana Aumentada, que viene dada por:<br />

�T� � no nd<br />

no nd<br />

�<br />

ak k<br />

�L<br />

�� � � �<br />

�<br />

aug<br />

��� �� �T b ij �ak pk��v ��<br />

�<br />

b<br />

ak p � k<br />

T<br />

��� � � � ��<br />

� ij b�B� a�b� k�Kij �<br />

a�b k�K � �<br />

ij<br />

�<br />

�<br />

�<br />

� O<br />

��i �<br />

�<br />

�<br />

nd O O<br />

�Tij �li ��i j�1 �<br />

nd<br />

O O<br />

ui ��Tij ��i<br />

j�1<br />

�<br />

�<br />

�<br />

�<br />

� D<br />

��j �� �<br />

no D D<br />

�Tij �lj �� j<br />

i�1 �<br />

no<br />

D D<br />

uj ��Tij ��<br />

j<br />

i�1<br />

�<br />

��<br />

�<br />

��<br />

��<br />

��� Tij �l�� � u� Tij<br />

���i�I, j�J �<br />

�<br />

�<br />

� i�1 j�1 i�1<br />

j�1<br />

�<br />

Una vez calculado el gradiente, se proce<strong>de</strong> a obtener el punto extremo yij <strong>de</strong>l problema<br />

linealizado (29) que, adaptado al problema <strong>de</strong> ajuste <strong>de</strong> la matriz Tij, se convierte en:<br />

no nd<br />

�Laug<br />

Minimizar �� � yij<br />

(a)<br />

yij<br />

�T<br />

i�1 j�1 ij<br />

m<br />

Tij<br />

s.a. l � y �u<br />

(b)<br />

ij ij ij<br />

N<br />

yij<br />

��<br />

Debido a la estructura especial <strong>de</strong>l problema, este punto extremo<br />

( m)<br />

ij<br />

(c)<br />

(35)<br />

(36)<br />

(37)<br />

y se pue<strong>de</strong> hallar <strong>de</strong> forma<br />

sencilla, sin necesidad <strong>de</strong> utilizar el método simplex, mediante la siguiente expresión lógica:<br />

�<br />

�L � �<br />

�L � �<br />

�L<br />

�<br />

y �� �0��l �� �0��T �� �0 ��u<br />

� i�I, j�J ( m) aug aug ( m)<br />

aug<br />

ij<br />

� �Tij ( m) Tij �<br />

ij<br />

� �Tij ( m) Tij �<br />

ij<br />

� �Tij<br />

( m)<br />

Tij<br />

�<br />

ij<br />

� � � � � �<br />

Las sucesivas estimaciones <strong>de</strong>l algoritmo <strong>de</strong> F–W son computadas con la siguiente adaptación<br />

<strong>de</strong> la expresión (30) conforme a la notación <strong>de</strong> matrices O–D:<br />

� �<br />

T = T �� y �T �T �� d , don<strong>de</strong>: � ��<br />

(39)<br />

( m�1) ( m) ( m) ( m) ( m) ( m) ( m) ( m) ( m)<br />

ij ij ij ij ij ij<br />

( m) ( m) ( m)<br />

para cada i � I, j � J, don<strong>de</strong> d � y �T<br />

es la dirección <strong>de</strong> <strong>de</strong>scenso F–W .<br />

ij ij ij<br />

(38)


136 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Finalmente, el cálculo <strong>de</strong>l paso óptimo λ será la solución <strong>de</strong>l problema unidimensional <strong>de</strong><br />

optimización (31) adaptado a nuestro problema en notación O–D. Para ello es necesario<br />

formular la función Lagrangiana aumentada (32) para el nuevo estimado (m+1) expresándola en<br />

función <strong>de</strong>l paso λ, es <strong>de</strong>cir, evaluarla para � T �T ��<br />

d , don<strong>de</strong> T y<br />

( m 1) ( m) ( m) ( m)<br />

ij ij ij<br />

conocidos; consiguiendo una función unidimensional Laug �� � :<br />

1<br />

� � � � � �<br />

( m) ( m)<br />

Laug ���� ���� � b ��Tij�ak pk��� �dij�ak pk��v � b<br />

2<br />

� � � �� �<br />

b�B i�I j�J �<br />

�<br />

a�b k�Kij a�b k�K � � � � ij � ��<br />

1 �<br />

O<br />

� �� � i<br />

2 i�I� �<br />

O ( m) ( m) O<br />

ui��Tij ���dij ��i j�J j�J 2<br />

O<br />

2<br />

���i� �<br />

( m) ( m) O O<br />

�Tij ���dij �li��i j�J j�J 2<br />

O<br />

2�<br />

���i�<br />

�<br />

�<br />

�<br />

1 �<br />

D<br />

� ��j �<br />

2 � j�J� D ( m)<br />

( m) D<br />

uj ��Tij<br />

���dij �� j<br />

i�I i�I 2<br />

D<br />

2<br />

��� j � �<br />

( m) ( m) D D<br />

�Tij ���dij �lj�� j<br />

i�I i�I 2<br />

D<br />

2�<br />

���<br />

j � �<br />

�<br />

�<br />

1 �<br />

� �� 2 �<br />

�<br />

2 2<br />

�<br />

( m) ( m) 2 ( m) ( m)<br />

2<br />

u���Tij ����dij �� �� � ��Tij ����dij �l�� ��<br />

�<br />

i�I j�J i�I j�J i�I j�J i�I j�J �<br />

�<br />

2<br />

( ) m<br />

ij<br />

d son<br />

El paso óptimo será la solución <strong>de</strong> un problema unidimensional <strong>de</strong> minimización <strong>de</strong> la función<br />

aug<br />

� �<br />

L � don<strong>de</strong> λ Є [0, 1] (31). Cabe <strong>de</strong>stacar que la magnitud <strong>de</strong>l <strong>de</strong>splazamiento permitido <strong>de</strong><br />

T hasta<br />

( m)<br />

ij<br />

y impi<strong>de</strong> utilizar expresiones analíticas, como la usada en Spiess (1990), para el<br />

( m)<br />

ij<br />

cálculo <strong>de</strong>l paso ya que el cambio no es infinitesimal y no pue<strong>de</strong> admitirse la hipótesis <strong>de</strong> que<br />

las proporciones permanecen costantes. Junto a ello, la existencia <strong>de</strong>l operador �·�, <strong>de</strong>finido en<br />

(27), condiciona la elección <strong>de</strong> un algoritmo robusto <strong>de</strong> búsqueda que, sin hacer uso <strong>de</strong>l cálculo<br />

<strong>de</strong> <strong>de</strong>rivadas, se encargue <strong>de</strong> minimizar una función unidimensional sobre un intervalo [a, b],<br />

tales como búsqueda dicotómica, exhaustiva, sección dorada, etc. En el algoritmo <strong>de</strong> Doblas y<br />

Benítez (2005) se utilizó el método <strong>de</strong> bisección pero, tras consi<strong>de</strong>rar la dificultad <strong>de</strong> usar<br />

<strong>de</strong>rivadas y expresiones analíticas, se ha optado por el algoritmo <strong>de</strong>nominado búsqueda por la<br />

“Sección Dorada”. A<strong>de</strong>más <strong>de</strong> no usar información <strong>de</strong> la <strong>de</strong>rivada <strong>de</strong> la función, este eficiente<br />

algoritmo tiene como ventaja el ser óptimo con respecto al número <strong>de</strong> evaluaciones <strong>de</strong> la<br />

función objetivo, conocido el intervalo <strong>de</strong> incertidumbre, el <strong>de</strong> <strong>de</strong>finición <strong>de</strong> la función y sin<br />

necesidad <strong>de</strong> pre<strong>de</strong>finir el número <strong>de</strong> iteraciones (i.e.: Fibonacci). Este hecho, teniendo en<br />

cuenta las dimensiones <strong>de</strong> las matrices manejadas, simplifica en gran medida los cálculos<br />

necesarios; <strong>de</strong> ahí su elección como método <strong>de</strong> resolución. El algoritmo se basa en la búsqueda<br />

<strong>de</strong>l mínimo <strong>de</strong> una función unimodal, en este caso la función <strong>de</strong>finida en (40), mediante<br />

reducciones iterativas <strong>de</strong>l rango <strong>de</strong> búsqueda <strong>de</strong> valores <strong>de</strong> λ <strong>de</strong>ntro <strong>de</strong>l cual el óptimo se sabe<br />

que existe (Bazaraa y Shetty, 1979). El algoritmo garantiza que cada nueva evaluación <strong>de</strong> la<br />

función acotará el mínimo, tras aplicar los ratios correspondientes, <strong>de</strong>ntro <strong>de</strong> un intervalo<br />

( ) m<br />

ij<br />

(40)


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 137<br />

0.61803 (razón áurea) veces más pequeño que el intervalo <strong>de</strong> búsqueda <strong>de</strong> la anterior iteración.<br />

En nuestro problema, el valor óptimo <strong>de</strong> λ se encuentra aplicando el algoritmo iterativamente<br />

<strong>de</strong>ntro <strong>de</strong>l intervalo inicial [0, 1] en la dirección dij (m) . De modo que una vez encontrado el paso<br />

óptimo, se proce<strong>de</strong> a la actualización <strong>de</strong> la matriz O–D para la siguiente iteración.<br />

Para la finalización <strong>de</strong>l algoritmo <strong>de</strong> optimización, la aproximación relativa a las proporciones<br />

<strong>de</strong> rutas pk implica cierto zigzagueo en los valores <strong>de</strong> la función objetivo entre estimaciones<br />

sucesivas, lo cual dificulta el po<strong>de</strong>r incorporar un criterio <strong>de</strong> finalización basado en valores<br />

<strong>de</strong> las <strong>de</strong>rivadas, en valores <strong>de</strong> la función objetivo en dos pasos consecutivos, o en la<br />

diferencia relativa entre dos estimados sucesivos. Por ello, el criterio <strong>de</strong> terminación <strong>de</strong>l<br />

algoritmo se basa en i) un número máximo <strong>de</strong> subproblemas (o etapas Lagrangianas), y ii) un<br />

número máximo <strong>de</strong> iteraciones por subproblema. Es necesario especificar que no hay reglas<br />

específicas para elegir este número máximo <strong>de</strong> subproblemas e iteraciones, al igual que ocurría<br />

con las cotas superiores e inferiores <strong>de</strong>finidas en (22), sino que estos valores <strong>de</strong>pen<strong>de</strong>n <strong>de</strong>l<br />

criterio <strong>de</strong>l planificador y su conocimiento práctico. Por último, indicar que una característica <strong>de</strong><br />

este algoritmo es que la matriz O–D, para la cual se obtiene el mejor valor <strong>de</strong> la función<br />

objetivo <strong>de</strong>ntro las diferentes iteraciones <strong>de</strong> una etapa o subproblema concreto, es almacenada y<br />

usada como punto <strong>de</strong> partida para el siguiente subproblema.<br />

5.3.4.3 Especificaciones <strong>de</strong>l mo<strong>de</strong>lo<br />

Por razones <strong>de</strong> simplificación <strong>de</strong> las ecuaciones, los valores <strong>de</strong> los factores <strong>de</strong> peso opcionales<br />

� |b serán fijados a uno para todas las fronteras <strong>de</strong> los casos prácticos que en los siguientes<br />

apartados se evalúan. Asimismo, se ha puesto especial interés en la elección <strong>de</strong> los factores <strong>de</strong><br />

peso (� i O , � j D ,� ) asociados con las restricciones funcionales integradas <strong>de</strong>ntro <strong>de</strong> la función<br />

Lagrangiana aumentada (32), y sobre el comportamiento <strong>de</strong>l algoritmo <strong>de</strong>sarrollado para niveles<br />

<strong>de</strong> congestión <strong>de</strong> la red (cuantificada por el número <strong>de</strong> iteraciones necesarias para conseguir una<br />

solución en equilibrio).<br />

El extenso rango o intervalo <strong>de</strong> valores en el cual se encuentran las magnitu<strong>de</strong>s implicadas en el<br />

problema <strong>de</strong> estimación <strong>de</strong> matrices O–D, las cuales son viajes generados, atraídos y totales,<br />

insta hacia un proceso natural <strong>de</strong> escalado <strong>de</strong> las restricciones basado en los valores iniciales <strong>de</strong><br />

dichas magnitu<strong>de</strong>s, es <strong>de</strong>cir, respecto al estimado inicial<br />

(0)<br />

T ij a diferentes niveles <strong>de</strong> agregación.<br />

Por tanto, cada restricción funcional (22) (c, d y e) es normalizada (o escalada) por su<br />

correspondiente valor inicial, resultando un conjunto <strong>de</strong> restricciones normalizadas que dan<br />

lugar a penalizaciones <strong>de</strong> violaciones <strong>de</strong> las restricciones proporcionales a valores relativos <strong>de</strong><br />

las correspondientes magnitu<strong>de</strong>s. En otras palabras, no posee la misma importancia exce<strong>de</strong>r en


138 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

un viaje una cota superior <strong>de</strong> 10 que una cota superior <strong>de</strong> 10 4 , estando más penalizada la<br />

violación <strong>de</strong> la cota superior en la primera situación que en la última.<br />

El proceso <strong>de</strong> escalado <strong>de</strong> restricciones se presenta esquemáticamente para una pareja genérica<br />

<strong>de</strong> restricciones <strong>de</strong> viajes generados, lo cual obliga a modificar levemente la notación<br />

matemática para mostrar claramente la relación directa en la expresión (32). En primer lugar, se<br />

formulan las restricciones y la pareja correspondiente <strong>de</strong> multiplicadores como se indica:<br />

u � T<br />

O<br />

O<br />

i<br />

(0)<br />

i<br />

Oi � � T<br />

j�J ij<br />

� � (0)<br />

i<br />

(0) (0)<br />

Oi � � T<br />

j�J ij<br />

O �<br />

i � (0) �<br />

i �<br />

�<br />

��<br />

�<br />

i j�J ij<br />

O<br />

�0��� (0)<br />

i<br />

Oi<br />

O<br />

� T<br />

j J ij � l<br />

� i<br />

O<br />

�0��� (0)<br />

i<br />

Oi<br />

l u<br />

O O O<br />

para cada i � I con Oi (0) ≠ 0, don<strong>de</strong> Tij (0) representa la estimación actual, que en nuestro caso<br />

coinci<strong>de</strong> con la matriz <strong>de</strong> partida o matriz O–D previa. Las restricciones impuestas sobre los<br />

viajes atraídos y los viajes totales <strong>de</strong>berán ser modificada <strong>de</strong> forma análoga usando las<br />

magnitu<strong>de</strong>s<br />

D T<br />

(0) (0)<br />

j � � i�I ij para cada j � J con Dj (0) ≠ 0 y<br />

�<br />

l T u<br />

O O O<br />

O<br />

i<br />

(0) �<br />

j ij<br />

� (0)<br />

O<br />

i<br />

(0)<br />

i i i<br />

�<br />

l T u<br />

D D D<br />

D D<br />

j<br />

(0) � i ij<br />

� (0)<br />

j<br />

(0)<br />

j j j<br />

��<br />

l T u<br />

T T T<br />

i j ij<br />

� �<br />

(0) (0) (0)<br />

�<br />

T T<br />

� � �<br />

(0) (0)<br />

i�I j�J ij<br />

En base al razonamiento anterior, dado que cada restricción está escalada (normalizada)<br />

respecto a su magnitud correspondiente – Oi (0) , Dj (0) o T (0) –, el término cuadrático <strong>de</strong><br />

penalización <strong>de</strong> la función lagrangiana aumentada es re–formulado introduciendo un factor <strong>de</strong><br />

peso global W común a todas ellas (� i O , � j D ,� ). Este factor <strong>de</strong> peso W se refiere a la<br />

pon<strong>de</strong>ración <strong>de</strong>l término <strong>de</strong> restricciones <strong>de</strong> la Lagrangiana Aumentada (32) con respecto a<br />

los términos <strong>de</strong> la función objetivo original:<br />

2 2<br />

� j�J O O � j�J O O<br />

��� i ���� i � � ���<br />

i ���� i �<br />

� O O<br />

ui � Tij 2 Tij �l<br />

�<br />

i<br />

2<br />

W � �<br />

� (43)<br />

� (0) (0)<br />

i�I � Oi O<br />

�<br />

i<br />

�<br />

� �<br />

don<strong>de</strong> las siguientes manipulaciones llevan hacia la <strong>de</strong>finicion original dada en (32):<br />

.<br />

(41)<br />

(42)


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 139<br />

2<br />

� 1 � �<br />

�W�� (0) � �<br />

i�I�Oi� �<br />

�<br />

O<br />

ui ��Tij j�J O (0)<br />

��� i Oi 2<br />

O (0)<br />

2<br />

���� i Oi � �<br />

O O (0)<br />

�Tij<br />

�li ���<br />

i Oi j�J 2<br />

O (0)<br />

2�<br />

���� i Oi<br />

� �<br />

�<br />

�<br />

�<br />

�<br />

�<br />

� �<br />

�<br />

�<br />

�<br />

O O (0)<br />

�i � ��<br />

i Oi<br />

O O (0)<br />

�i ����<br />

i Oi<br />

O 2W � � i<br />

(0)<br />

2<br />

�Oi� �<br />

�<br />

� 1 �<br />

O<br />

��<br />

�� � i<br />

� 2 i�I� �<br />

�<br />

�<br />

O<br />

ui��Tij j�J Ο<br />

��i 2<br />

Ο<br />

2<br />

���i� � �Tij<br />

j�J O �<br />

�li��i 2<br />

�<br />

2 �<br />

���i� �<br />

�<br />

�<br />

Aquellos casos en los cuales Oi (0) = 0 o Dj (0) = 0, serán tratados individualmente conforme a sus<br />

cotas superiores. La tarea resi<strong>de</strong> ahora en la elección <strong>de</strong> un valor apropiado para W. Es<br />

conveniente usar valores suficientemente gran<strong>de</strong>s a fin <strong>de</strong> no partir <strong>de</strong> una solución inicial con<br />

múltiples restricciones violadas; <strong>de</strong> lo contrario el proceso reajustado a través <strong>de</strong> la penalización<br />

<strong>de</strong>l término cuadrático <strong>de</strong> la función Lagrangiana aumentada y las sucesivas actualizaciones <strong>de</strong><br />

los multiplicadores pue<strong>de</strong> no comportarse correctamente. Por otro lado, el mencionado<br />

parámetro W, aunque suficientemente gran<strong>de</strong>, no <strong>de</strong>bería ser mayor que un valor capaz <strong>de</strong><br />

bloquear el proceso <strong>de</strong> optimización, ya que valores “elevados” <strong>de</strong> W pue<strong>de</strong>n impedir la<br />

evolución <strong>de</strong>l algoritmo hacia estimados que mejoren el valor <strong>de</strong> la función objetivo. Sin<br />

embargo, valores “pequeños” pue<strong>de</strong>n dar lugar a una relajación excesiva en el cumplimiento<br />

<strong>de</strong> las restricciones que se pueda hacer irreversible. Por ello, Doblas y Benítez (2005)<br />

proporcionan una regla simple avalada por un buen comportamiento en trabajos reales <strong>de</strong> ajuste<br />

<strong>de</strong> matrices, la cual consiste en la elección <strong>de</strong> valores <strong>de</strong> W <strong>de</strong>l mismo or<strong>de</strong>n <strong>de</strong> magnitud que el<br />

valor inicial <strong>de</strong> la función objetivo <strong>de</strong>finida en (22) (a).<br />

De forma análoga a lo sucedido con las restricciones, el término <strong>de</strong> la función Lagrangiana<br />

aumentada (32) asociado con los volúmenes <strong>de</strong> frontera <strong>de</strong>be ser modificado mediante una<br />

normalización respecto <strong>de</strong>l volumen observado en cada frontera, v , quedando:<br />

b<br />

L<br />

�T, ��� �<br />

� � � �<br />

1<br />

� ��Tij ��<br />

� ��ak<br />

pkv � b �<br />

� ����<br />

� �<br />

�<br />

2<br />

� a b� k K � �<br />

�<br />

ij<br />

b�B i�I j�J � �<br />

� v<br />

�<br />

aug b<br />

No obstante, por cuestiones <strong>de</strong> sencillez en la formulación matemática así como <strong>de</strong> tamaño <strong>de</strong><br />

las ecuaciones, esta normalización no es introducida en la formulación original. El hecho <strong>de</strong><br />

presentar un mo<strong>de</strong>lo que incluya esta normalización pue<strong>de</strong> complicar la comprensión <strong>de</strong>l<br />

mo<strong>de</strong>lo por lo que se ha optado por no reformular las expresiones en función <strong>de</strong> dichas<br />

normalizaciones.<br />

b<br />

2<br />

(44)<br />

(45)


140 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

5.4 CASOS PRÁCTICOS<br />

5.4.1 Experimento 1: Red Sioux–Falls<br />

5.4.1.1 Configuración <strong>de</strong> la red<br />

Se ha aplicado el procedimiento <strong>de</strong> estimación <strong>de</strong>scrito en la sección anterior a la red <strong>de</strong> Sioux–<br />

Falls. Esta red consta <strong>de</strong> 24 nodos, los cuales son todos centroi<strong>de</strong>s, 528 pares O–D y 76 arcos<br />

dirigidos. Esta red <strong>de</strong> transporte originalmente fue <strong>de</strong>scrita por LeBlanc (1975) y posteriormente<br />

usada por múltiples autores, como Suwansirikul et al. (1987), <strong>de</strong>l cual se han tomado los<br />

atributos <strong>de</strong> arcos para este ensayo. Es necesario resaltar que, para este mo<strong>de</strong>lo <strong>de</strong> red, los<br />

atributos son idénticos para el arco dirigido <strong>de</strong>s<strong>de</strong> el nodo A al nodo B y el asociado al sentido<br />

contrario, aunque esto no suele ocurrir en el caso <strong>de</strong> re<strong>de</strong>s reales.<br />

La información topológica para el diseño <strong>de</strong> red se ha tomado <strong>de</strong> la web <strong>de</strong> Bar–Gera (2007b).<br />

Las funciones <strong>de</strong> coste o <strong>de</strong>mora respon<strong>de</strong>n a la expresión general <strong>de</strong> las BPR (Bureau of Public<br />

Roads),<br />

4<br />

� �v� �<br />

a<br />

a( a) � � a 1�0.15�� � �<br />

� ca<br />

�<br />

s v T<br />

, don<strong>de</strong> va es el volumen <strong>de</strong>l arco a, T a representa el tiempo<br />

� � � �<br />

<strong>de</strong> viaje a velocidad <strong>de</strong> flujo libre y c a es la capacidad <strong>de</strong>l arco a.<br />

Para completar la construcción <strong>de</strong> la red para este ensayo es necesario <strong>de</strong>finir la distribución<br />

celular <strong>de</strong> la red <strong>de</strong> telefonía asociada a dicha red <strong>de</strong> transporte, es <strong>de</strong>cir, las celdas y áreas <strong>de</strong><br />

localización que cubren los nodos <strong>de</strong> la red <strong>de</strong> transporte. Esto permite i<strong>de</strong>ntificar el conjunto <strong>de</strong><br />

fronteras observadas, y sus correspondientes grupos <strong>de</strong> arcos observados, que constituirán el<br />

conjunto <strong>de</strong> volúmenes <strong>de</strong> tráfico inferidos <strong>de</strong> la telefonía móvil. Típicamente, el radio <strong>de</strong> una<br />

celda varía <strong>de</strong>s<strong>de</strong> 200 metros en entornos urbanos a dimensiones entre los 5 y 20 km en<br />

entornos rurales. Debido al carácter <strong>de</strong> este ensayo junto a la sencillez topologica <strong>de</strong> esta red, no<br />

se han utilizado criterios <strong>de</strong> dimensión o tamaño para el diseño celular, <strong>de</strong> modo que los nodos<br />

se han agrupado en celdas <strong>de</strong> un modo arbitrario atendiendo a criterios <strong>de</strong> vecindad.<br />

Posteriormente, dichos conjuntos <strong>de</strong> celdas se han agrupado en áreas <strong>de</strong> localización,<br />

obteniendo la red mostrada en la Figura 5-1, la cual contiene 22 fronteras observadas válidas<br />

con 34 arcos implicados.


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 141<br />

Figura 5-1: Red <strong>de</strong> Sioux Falls, incluyendo distribución ficticia <strong>de</strong> LAs y celdas.<br />

Inicialmente existían un conjunto mayor <strong>de</strong> fronteras entre celdas pero, tras realizar un<br />

procesado previo, finalmente sólo 22 fronteras fueron calificadas como válidas para ser<br />

utilizadas en el ensayo. La razón principal residió en criterios topográficos dado que había arcos<br />

que cruzaban fronteras entre celdas pero cuyo nodo origen o <strong>de</strong>stino no estaba incluido en<br />

alguna <strong>de</strong> las dos celdas asociadas a la frontera. Ese fue el caso <strong>de</strong> los arcos 37 y 38, los cuales<br />

cruzaban las fronteras entre la celda 3 y 9 y entre la 9 y 10, pero su nodo origen o su nodo<br />

<strong>de</strong>stino estaba en la celda 3 o en la 10. Por tanto, esos arcos introducían distorsión en la<br />

monitorización <strong>de</strong> esas fronteras (entre 3 y 9 y entre 9 y 10), dado que pese a cruzarlas, no<br />

cumplían la <strong>de</strong>finición <strong>de</strong> frontera observada indicada en el apartado 4.3.2. Una frontera<br />

observada o aforo “virtual” lo conforman los arcos cuyo nodo inicial y nodo final están en<br />

celdas distintas y contiguas. Ante esta situación, las 4 fronteras correspondientes (una frontera<br />

entre celdas son dos fronteras observadas, una por cada sentido) no podían pertenecer al<br />

conjunto <strong>de</strong> fronteras observadas válidas. Idéntica situación experimentaban los arcos 56 y 60,<br />

anulando las dos fronteras observadas asociadas a la frontera entre la celda 7 y 8. La Tabla 5-1<br />

muestra las fronteras observadas consi<strong>de</strong>radas <strong>de</strong>finitivamente válidas y sus corresponientes<br />

arcos.


142 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Tabla 5-1: Fronteras observadas válidas y arcos asociados.<br />

Id Celda Celda Id Id Celda Celda Id<br />

frontera Origen Destino Arcos frontera Origen Destino Arcos<br />

1 1 2 1, 9 12 5 2 19<br />

2 1 3 7, 10 13 5 4<br />

21, 48,<br />

51<br />

3 2 1 3, 11 14 5 6 20, 50<br />

4 2 4 13 15 5 7 53<br />

5 2 5 16 16 6 5 17, 55<br />

6 3 1 31, 35 17 7 4 43<br />

7 3 4 32 18 7 5 58<br />

8 4 2 23 19 7 9 44, 70<br />

9 4 3 27 20 8 10 66<br />

10 4 5<br />

24, 29,<br />

30<br />

21 9 7 41, 72<br />

11 4 7 28 22 10 8 75<br />

La metodología propuesta exige, como prerrequisito, un conjunto <strong>de</strong> volúmenes en fronteras (o<br />

volúmenes agregados sobre grupos <strong>de</strong> arcos) y una matriz O–D previa. En general, esta matriz<br />

previa es obtenida <strong>de</strong> algún estudio cronológicamente anterior o <strong>de</strong> una encuestación básica que<br />

pre<strong>de</strong>fina la estructura <strong>de</strong> la matriz final a obtener. Para este ensayo, no se dispone <strong>de</strong> tal matriz<br />

<strong>de</strong> partida aunque sí <strong>de</strong> una matriz O–D factible, disponible en la web <strong>de</strong> Bar–Gera (2007b). De<br />

modo que dicha matriz será consi<strong>de</strong>rada como matriz auxiliar para obtener una matriz previa<br />

mediante un proceso <strong>de</strong> distorsión. Este proceso <strong>de</strong> distorsión consiste en multiplicar la matriz<br />

auxiliar por una matriz <strong>de</strong> coeficientes aleatorios entre 0.5 y 1.5, según posibles<br />

incrementos/<strong>de</strong>crementos <strong>de</strong>l número <strong>de</strong> viajes en cada par O–D; obteniendo finalmente una<br />

matriz <strong>de</strong> partida (o previa) para ajustar, la cual estará formada también por 528 pares O–D<br />

<strong>de</strong>finidos por los 24 centroi<strong>de</strong>s <strong>de</strong> la red.<br />

Por otro lado, para el proceso <strong>de</strong> ajuste también se necesitan datos <strong>de</strong> volumen en cada frontera<br />

observada, es <strong>de</strong>cir, volumen agregado por grupos <strong>de</strong> arcos que cruzan cada frontera.<br />

Obviamente, no se dispone <strong>de</strong> datos <strong>de</strong>rivados <strong>de</strong> una red <strong>de</strong> telefonía real para este ensayo. Por<br />

ello, la obtención <strong>de</strong> unos volúmenes para ser utilizados en el proceso implica algún proceso <strong>de</strong><br />

simulación que permita obtener tales datos. De modo que, una vez que se tienen i<strong>de</strong>ntificados<br />

los arcos que pertenecen a cada frontera observada válida, se obtiene el volumen <strong>de</strong> cada<br />

frontera sumando los volúmenes <strong>de</strong>l grupo <strong>de</strong> arcos que conforman tal frontera. Estos<br />

volúmenes <strong>de</strong> arco son tomados <strong>de</strong> una solución factible con respecto a flujos en arcos,<br />

proporcionada por Bar–Gera (2007b). Como se explicó en la sección 4.3 la inferencia <strong>de</strong><br />

volúmenes mediante datos <strong>de</strong> teléfonos no es un proceso exacto sino que ofrece pequeñas<br />

fluctuaciones o errores <strong>de</strong> estimación respecto a la medida proporcionada por un aforo instalado


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 143<br />

en la misma frontera. En este sentido, el error relativo absoluto medio alcanzado por los<br />

mo<strong>de</strong>los <strong>de</strong> prediccion seleccionados en el Capítulo 4 durante la validación numérica<br />

empleando volúmenes observados por estaciones <strong>de</strong> aforo se situó en torno al 20%. Bajo esta<br />

condición, finalmente, los volúmenes observados <strong>de</strong> frontera son obtenidos multiplicando el<br />

volumen agregado <strong>de</strong> cada frontera anteriormente explicado por un coeficiente aleatorio entre<br />

0.8 y 1.2. Este rango es usado para introducir una distorsión en el volumen <strong>de</strong> frontera<br />

observado a fin <strong>de</strong> simular la discrepancia entre volúmenes inferidos <strong>de</strong> datos <strong>de</strong> teléfonos<br />

móviles y volúmenes reales <strong>de</strong> vehículos que realmente circularon.<br />

5.4.1.2 Resultados<br />

El objetivo <strong>de</strong> este apartado es presentar los resultados <strong>de</strong> este primer ensayo realizado para<br />

verificar la consistencia y eficiencia <strong>de</strong>l algoritmo <strong>de</strong>sarrollado. Para este caso se ha tomado un<br />

valor <strong>de</strong> W =10 junto con unos criterios <strong>de</strong> terminación <strong>de</strong> asignaciones para el código<br />

comercial usado (EMME/2) basados en un número medio <strong>de</strong> iteraciones por asignación para<br />

alcanzar las condiciones <strong>de</strong> equilibrio <strong>de</strong> usuario − Nºiter=20, relative gap (%)=0.5, normalized<br />

gap (min)=0.5. Para más <strong>de</strong>talles sobre estos criterios <strong>de</strong> terminación <strong>de</strong> la etapa <strong>de</strong> asignación<br />

(número <strong>de</strong> iteraciones, rgap, ngap) y otros, consultar las referencias EMME/2 (1998),<br />

MINUTP (1993), TRANSCAD (2006), y TRIPS (1990).<br />

Para el problema <strong>de</strong> nivel superior (22), los valores <strong>de</strong> las cotas superiores e inferiores, {uij, lij}<br />

en el caso <strong>de</strong> cada viaje o par O–D, serán +25% y −25% <strong>de</strong><br />

generados { O<br />

i<br />

−15% <strong>de</strong><br />

u , O<br />

l i }, +15% y −15% <strong>de</strong> O � � T<br />

D � � T<br />

(0) (0)<br />

j i�I ij<br />

(0) (0)<br />

i j�J ij<br />

(0)<br />

T ij respectivamente; para viajes<br />

; para viajes atraídos { D<br />

j<br />

u , D<br />

l }, +15% y<br />

; y para viajes totales {u,l}, +10% y 0% <strong>de</strong> T T<br />

� � �<br />

(0) (0)<br />

i�I j�J ij<br />

aprecia que estos valores <strong>de</strong> cotas están expresados en términos <strong>de</strong>l estimado inicial para que,<br />

tras normalizar, se obtengan cotas relativas. Estos valores limitarán la distorsión experimentada<br />

por la matriz O–D previa.<br />

Para presentar los resultados más significativos se utiliza tanto formato numérico como gráfico.<br />

La Figura 5-2a muestra los volúmenes <strong>de</strong> frontera (o agregados por grupos <strong>de</strong> arcos que cruzan<br />

cada frontera) obtenidos al asignar la matriz O–D previa a la red <strong>de</strong> Sioux Falls frente a los<br />

volúmenes observados en dichas fronteras. Estos últimos proce<strong>de</strong>rían <strong>de</strong> datos <strong>de</strong> movilidad<br />

<strong>de</strong>rivados <strong>de</strong> conteos <strong>de</strong> teléfonos cruzando fronteras entre celdas colindantes. La Figura 5-2b<br />

correspon<strong>de</strong> a la representación <strong>de</strong> los volúmenes <strong>de</strong> frontera obtenidos por asignación <strong>de</strong> la<br />

matriz estimada usando el método propuesto frente a los observados <strong>de</strong>rivados <strong>de</strong> paso <strong>de</strong><br />

teléfonos por el mismo conjunto <strong>de</strong> fronteras. Esta figura muestra una buena correlación entre<br />

j<br />

. Se


144 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

los volúmenes observados y los mo<strong>de</strong>lados al asignar la matriz final estimada (R 2 =0.737),<br />

teniendo en cuenta el interés <strong>de</strong> preservar la información contenida en la matriz O–D <strong>de</strong> partida,<br />

alcanzando una razonable mejora respecto al R 2 <strong>de</strong> partida (R 2 =0.488). Respecto a la pendiente<br />

<strong>de</strong> la recta (y=a+bx), también se logrado una mejora (b=0.967) respecto <strong>de</strong> la previa (b=0.912).<br />

Volúmenes <strong>de</strong> frontera mo<strong>de</strong>lados<br />

antes <strong>de</strong>l ajuste (viajes)<br />

35000<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

5000<br />

y = 0,912x + 781,693<br />

R 2 = 0,488<br />

0<br />

0 5000 10000 15000 20000 25000 30000 35000<br />

Volúmenes <strong>de</strong> frontera observados<br />

(viajes inferidos <strong>de</strong> teléfonos)<br />

(a)<br />

Volúmenes <strong>de</strong> frontera mo<strong>de</strong>lados<br />

<strong>de</strong>spués <strong>de</strong>l ajuste (viajes)<br />

35000<br />

30000<br />

25000<br />

20000<br />

15000<br />

10000<br />

y = 0,967x + 645,073<br />

R 2 5000<br />

0<br />

= 0,737<br />

0 5000 10000 15000 20000 25000 30000 35000<br />

Volúmenes <strong>de</strong> frontera observados<br />

(viajes inferidos <strong>de</strong> teléfonos)<br />

(b)<br />

Figura 5-2: Correlación entre los volúmenes observados en fronteras (grupos <strong>de</strong> arcos) y los<br />

mo<strong>de</strong>lados al asignar la matriz previa (a) y la matriz estimada (b).<br />

Lo anterior evalúa los resultados <strong>de</strong>l ajuste en términos <strong>de</strong> volúmenes, no obstante, la<br />

metodología también atien<strong>de</strong> a criterios <strong>de</strong> control <strong>de</strong> la distorsión que experimenta la<br />

información contenida en la matriz estimada, a diferentes niveles <strong>de</strong> agregación (viajes<br />

generados, atraídos y totales), durante el proceso <strong>de</strong> ajuste. En este sentido, para evaluar la<br />

distorsión experimentada por la matriz estimada respecto a la previa durante el ajuste, se<br />

presenta la Figura 5-3, la cual compara el número <strong>de</strong> viajes <strong>de</strong> cada celda <strong>de</strong> la matriz O–D<br />

previa frente al número <strong>de</strong> viajes <strong>de</strong> los mismos pares O–D <strong>de</strong> la matriz final estimada usando la<br />

metodología. El gráfico revela los reducidos niveles <strong>de</strong> <strong>de</strong>sviación <strong>de</strong>l número <strong>de</strong> viajes <strong>de</strong> cada<br />

par O–D <strong>de</strong> la matriz estimada respecto a los <strong>de</strong> la matriz previa (R 2 =0.934). Se pue<strong>de</strong> ver<br />

claramente que la nube <strong>de</strong> puntos queda confinada en una estrecha banda <strong>de</strong>limitada por los<br />

incrementos y <strong>de</strong>crementos máximos establecidos como parámetros <strong>de</strong>l proceso <strong>de</strong> ajuste y que,<br />

en este caso, son <strong>de</strong> un 25%. Una gráfica similar se pue<strong>de</strong> obtener para los viajes generados<br />

(agregación en <strong>de</strong>stinos) y para los viajes atraídos (agregación en orígenes), pero las bandas en<br />

este caso situarán el número <strong>de</strong> viajes <strong>de</strong>ntro <strong>de</strong> unos incrementos/<strong>de</strong>crementos <strong>de</strong>l 15%.


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 145<br />

Viajes <strong>de</strong> los pares O-D <strong>de</strong> la<br />

matriz ajustada<br />

5000<br />

4500<br />

4000<br />

3500<br />

3000<br />

2500<br />

2000<br />

1500<br />

1000<br />

R 2 = 0,934<br />

500<br />

0<br />

Líneas <strong>de</strong> incremento y <strong>de</strong>cremento <strong>de</strong>l 25%<br />

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 5500<br />

Viajes <strong>de</strong> los pares O-D <strong>de</strong> la matriz previa<br />

Figura 5-3: Correlación entre la matriz previa y la matriz estimada.<br />

5.4.2 Experimento 2: Red Comunidad Autónoma <strong>de</strong> Madrid<br />

5.4.2.1 Configuración <strong>de</strong> la red<br />

En este segundo ensayo, se ha tomado una red <strong>de</strong> gran tamaño correspondiente a la red <strong>de</strong> la<br />

Comunidad Autónoma <strong>de</strong> Madrid (para el año 2004), cuyas dimensiones topológicas son 1079<br />

centroi<strong>de</strong>s, 9557 nodos regulares, 1179×1179 pares O–D y 21713 arcos dirigidos (CRT, 2004).<br />

Por cuestiones <strong>de</strong> niti<strong>de</strong>z gráfica, la representación <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> red ha sido omitida ya que la<br />

visualización <strong>de</strong> los arcos y nodos resulta poco nítida <strong>de</strong>bido a sus dimensiones.<br />

Como se ha mencionado anteriormente, se precisa un conjunto <strong>de</strong> volúmenes en fronteras<br />

(agregados sobre grupos <strong>de</strong> arcos) junto con una matriz O–D previa para realizar el proceso <strong>de</strong><br />

ajuste. La matriz O–D previa se toma <strong>de</strong> un estudio anterior <strong>de</strong>sarrollado sobre esta red, el cual<br />

dispone <strong>de</strong> una matriz en período <strong>de</strong> hora punta <strong>de</strong> la mañana (8:00–9:00 a.m.), correspondiente<br />

a la Encuesta Domiciliaria <strong>de</strong> Movilidad 2004, con 1179×1179 pares O–D.<br />

Para los volúmenes observados se ha utilizado un procedimiento basado en el citado estudio<br />

previo <strong>de</strong>sarrollado sobre esta red. De él, se tomó una matriz O–D resultado <strong>de</strong> un proceso <strong>de</strong><br />

ajuste con aforos tradicionales. Esta matriz, tras asignarla a la red, permitió disponer <strong>de</strong> unos<br />

volúmenes <strong>de</strong> todos los arcos que podían consi<strong>de</strong>rarse, teóricamente, como “reales”. Estos<br />

volúmenes <strong>de</strong> arco serían los empleados más a<strong>de</strong>lante para obtener los volúmenes <strong>de</strong> frontera<br />

(grupos <strong>de</strong> arcos). Basándose en los resultados <strong>de</strong>l ensayo <strong>de</strong>sarrollado en el Capítulo 4 sobre<br />

volúmenes inferidos con datos <strong>de</strong> telefonía móvil, éstos presentan pequeñas diferencias respecto<br />

a la medida proporcionada por una estación <strong>de</strong> aforo instalada en la misma frontera. De modo<br />

que esos volúmenes <strong>de</strong> arco anteriormente obtenidos son escalados por un coeficiente aleatorio


146 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

entre 0.8 y 1.2 para introducir una distorsión en el volumen final observado que permita simular<br />

el valor <strong>de</strong> error relativo en valor absoluto, alcanzado en el citado ensayo, entre volúmenes<br />

inferidos <strong>de</strong> datos <strong>de</strong> teléfonos móviles y volúmenes <strong>de</strong> vehículos que realmente circularon.<br />

Pero la metodología emplea volúmenes sobre grupos <strong>de</strong> arcos correspondientes a fronteras entre<br />

celdas. Por ello, se requería disponer <strong>de</strong> una distribución celular, la cual se trazó <strong>de</strong> un modo<br />

ficticio usando 15 LAs y 20 celdas por LA (Figura 5-4). Esta distribución permitió i<strong>de</strong>ntificar<br />

los grupos <strong>de</strong> arcos que conforman cada frontera, agrupando arcos usando la <strong>de</strong>finición <strong>de</strong><br />

frontera observada: arcos cuyos nodos <strong>de</strong> inicio y fin están en celdas diferentes y vecinas.<br />

Figura 5-4: Nodos <strong>de</strong> la red <strong>de</strong> Madrid agrupados en 15 LAs.<br />

Una vez conocidos los grupos <strong>de</strong> arcos para cada frontera existente, el volumen <strong>de</strong> una frontera<br />

observada se generó sumando los volúmenes <strong>de</strong> cada uno <strong>de</strong> los arcos i<strong>de</strong>ntificados como parte


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 147<br />

<strong>de</strong> cada frontera. Sin embargo, no todas las fronteras existentes sobre una red pue<strong>de</strong>n ser usadas<br />

como válidas <strong>de</strong>bido a sus características. Esto implica la realización <strong>de</strong> un pre–procesado sobre<br />

el conjunto inicial <strong>de</strong> fronteras entre celdas para obtener el conjunto final <strong>de</strong> fronteras “válidas”<br />

usadas como observadas para el proceso <strong>de</strong> ajuste. En esta red, existen 412 fronteras observadas<br />

válidas con 1265 arcos implicados, don<strong>de</strong> el principal criterio seguido para su selección ha sido<br />

evitar posibles problemas <strong>de</strong>rivados <strong>de</strong> la existencia <strong>de</strong> peatones, <strong>de</strong>scartando fronteras en las<br />

que existiera algún arco con tráfico <strong>de</strong> peatones asociado.<br />

5.4.2.2 Resultados<br />

En este caso, se ha tomado un valor <strong>de</strong> W =10 3 – en torno al or<strong>de</strong>n <strong>de</strong>l valor inicial <strong>de</strong> la función<br />

objetivo (32) evaluada para este problema – junto con los criterios por <strong>de</strong>fecto <strong>de</strong> terminación<br />

<strong>de</strong> las asignaciones, que emplean un número alto <strong>de</strong> iteraciones por asignación (primer criterio a<br />

ser cumplido en todos los casos) − Nºiter=200, relative gap(%)=1, normalized gap(min)=1.<br />

Estos valores difieren <strong>de</strong> los tomados en la red <strong>de</strong> Sioux Falls, en especial en lo que respecta al<br />

número <strong>de</strong> iteraciones por asignación, <strong>de</strong>bido a que los niveles <strong>de</strong> congestión sobre la red <strong>de</strong><br />

Madrid son ciertamente más altos, <strong>de</strong> modo que las condiciones <strong>de</strong> equilibrio <strong>de</strong> usuario son<br />

más difíciles <strong>de</strong> obtener. En el problema <strong>de</strong> nivel superior (22), los valores <strong>de</strong> las cotas<br />

superiores e inferiores <strong>de</strong> las restricciones son iguales a las <strong>de</strong>l ensayo en la red <strong>de</strong> Sioux Falls.<br />

Volúmenes <strong>de</strong> frontera mo<strong>de</strong>lados<br />

antes <strong>de</strong>l ajuste (viajes)<br />

15000<br />

12500<br />

10000<br />

7500<br />

5000<br />

y = 0,9122x + 98,36<br />

R2 2500<br />

0<br />

= 0,5272<br />

0 2500 5000 7500 10000 12500 15000<br />

Volúmenes <strong>de</strong> frontera observados<br />

(viajes inferidos <strong>de</strong> datos <strong>de</strong> teléfonos)<br />

(a)<br />

Volúmenes <strong>de</strong> frontera mo<strong>de</strong>lados<br />

<strong>de</strong>spués <strong>de</strong>l ajuste (viajes)<br />

15000<br />

12500<br />

10000<br />

7500<br />

5000<br />

y = 0,9929x + 138,42<br />

R2 2500<br />

0<br />

= 0,7631<br />

0 2500 5000 7500 10000 12500 15000<br />

Volúmenes <strong>de</strong> frontera observados<br />

(viajes inferidos <strong>de</strong> datos <strong>de</strong> teléfonos)<br />

(b)<br />

Figura 5-5: Correlación entre los volúmenes observados en fronteras (grupos <strong>de</strong> arcos) y los<br />

mo<strong>de</strong>lados al asignar la matriz previa (a) y la matriz estimada (b).<br />

Como se ha comentado previamente, la metodología <strong>de</strong> ajuste atien<strong>de</strong> a dos criterios: i) que la<br />

matriz resultante reproduzca, al ser asignada a la red, los datos <strong>de</strong> los volúmenes agregados lo<br />

más fielmente posible; y ii) que la información contenida en la matriz O–D previa no se vea<br />

distorsionada en exceso durante el proceso <strong>de</strong> ajuste. Para evaluar la calidad <strong>de</strong>l ajuste en


148 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

términos <strong>de</strong> volúmenes se proce<strong>de</strong> a comparar, numérica y gráficamente, los coeficientes R 2<br />

antes y <strong>de</strong>spués <strong>de</strong>l ajuste a nivel <strong>de</strong> volúmenes <strong>de</strong> frontera. La Figura 5-5a muestra los<br />

volúmenes agregados por grupos <strong>de</strong> arcos que cruzan cada frontera observada obtenidos tras<br />

asignar la matriz O–D previa frente a los volúmenes observados en dichas fronteras <strong>de</strong>rivados<br />

<strong>de</strong> datos <strong>de</strong> teléfonos. La Figura 5-5b correspon<strong>de</strong> a la representación <strong>de</strong> los volúmenes <strong>de</strong><br />

frontera obtenidos al asignar la matriz ajustada usando la metodología frente a los volúmenes<br />

observados <strong>de</strong> frontera <strong>de</strong>rivados <strong>de</strong> los teléfonos. Se aprecia que el proceso <strong>de</strong> ajuste consigue<br />

valores aceptables (R 2 =0.7631) para el número <strong>de</strong> arcos implicados (1265 arcos, un 5.83% <strong>de</strong>l<br />

total <strong>de</strong> arcos <strong>de</strong> la red). Respecto a la valoración <strong>de</strong> la metodología en términos <strong>de</strong> distorsión <strong>de</strong><br />

la información contenida en la matriz O–D estimada respecto a la <strong>de</strong> partida, la matriz O–D<br />

previa y la ajustada alcanzan un indudable alto valor <strong>de</strong> correlación entre ellas (R 2 =0.9893)<br />

<strong>de</strong>bido a las restricciones impuestas.<br />

Cabe <strong>de</strong>stacar que observando la Figura 5-5 se aprecian dos outliers que potencialmente afectan<br />

a los valores <strong>de</strong> R 2 . Esos outliers pue<strong>de</strong>n ser <strong>de</strong>bidos a que la frontera o grupo <strong>de</strong> arcos contiene,<br />

por ejemplo, algún arco con línea <strong>de</strong> transporte público asociada o incluso, que tenga próximo<br />

un núcleo resi<strong>de</strong>ncial que introduzca pérdidas. Estas situaciones inducen alteraciones respecto a<br />

la media, <strong>de</strong> modo que los mo<strong>de</strong>los <strong>de</strong> estimación <strong>de</strong> volúmenes no pronostican con la precisión<br />

esperada. Se podría estudiar en <strong>de</strong>talle el origen <strong>de</strong> esos outliers para <strong>de</strong>cidir si se consi<strong>de</strong>ran<br />

válidas o no las fronteras asociadas; sin embargo, dado que en el planteamiento inicial se<br />

consi<strong>de</strong>raron válidas, se ha optado por mantenerlas en la representación <strong>de</strong> los resultados.<br />

En este ensayo, al disponer <strong>de</strong> volúmenes <strong>de</strong> arcos para generar los <strong>de</strong> frontera surge la<br />

posibilidad <strong>de</strong> evaluar las comparaciones <strong>de</strong> volúmenes pero a nivel <strong>de</strong> arco, es <strong>de</strong>cir,<br />

<strong>de</strong>sagregando los volúmenes observados <strong>de</strong> frontera (grupos <strong>de</strong> arcos) en volumen a nivel<br />

individual <strong>de</strong> arco. La Figura 5-6 a y b muestra la representación <strong>de</strong> los volúmenes observados<br />

<strong>de</strong>sagregados a nivel <strong>de</strong> arco frente a los volúmenes obtenidos por asignación <strong>de</strong> la matriz O–D<br />

previa y la ajustada, respectivamente, sobre el conjunto <strong>de</strong> arcos implicados en las fronteras.<br />

Observando la Figura 5-5b y la Figura 5-6b se hace patente el comportamiento similar en<br />

términos <strong>de</strong> correlación entre los volúmenes observados y estimados, representándolos tanto a<br />

nivel <strong>de</strong> frontera (agregado por arcos) como a nivel <strong>de</strong> arco.


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 149<br />

Volúmenes <strong>de</strong> arco mo<strong>de</strong>lados antes<br />

<strong>de</strong>l ajuste (viajes)<br />

5000<br />

4000<br />

3000<br />

2000<br />

y = 0,8713x + 53,219<br />

R2 1000<br />

0<br />

= 0,5143<br />

0 1000 2000 3000 4000 5000<br />

Volúmenes <strong>de</strong> arco observados<br />

(viajes inferidos <strong>de</strong> teléfonos)<br />

(a)<br />

Volúmenes <strong>de</strong> arco mo<strong>de</strong>lados<br />

<strong>de</strong>spués <strong>de</strong>l ajuste (viajes)<br />

5000<br />

4000<br />

3000<br />

2000<br />

y = 1,0632x + 10,6958<br />

R2 1000<br />

0<br />

= 0,7599<br />

0 1000 2000 3000 4000 5000<br />

Volúmenes <strong>de</strong> arco observados<br />

(viajes inferidos <strong>de</strong> datos <strong>de</strong> teléfonos)<br />

(b)<br />

Figura 5-6: Correlación entre los volúmenes <strong>de</strong> arcos observados (pertenecientes a alguna frontera<br />

observada) y los mo<strong>de</strong>lados al asignar la matriz previa (a) y la matriz estimada (b).<br />

La Tabla 5-2 compara los resultados (R 2 y ecuación <strong>de</strong> recta regresión) evaluados a nivel<br />

individual <strong>de</strong> arco y <strong>de</strong> grupos <strong>de</strong> arcos. Lógicamente, el R 2 alcanzado tras el ajuste evaluado a<br />

nivel <strong>de</strong> volumen agregado (grupos <strong>de</strong> arcos) será mejor que el evaluado a nivel <strong>de</strong> volumen <strong>de</strong><br />

arco, dado que la información observada en la que se basa el proceso <strong>de</strong> ajuste viene expresada<br />

a esa escala agregada por grupos <strong>de</strong> arcos. Bajo este mismo razonamiento, el offset y la<br />

pendiente <strong>de</strong> la recta evaluada a nivel <strong>de</strong> volumen <strong>de</strong> arco no alcanzarán una mejora<br />

significativa frente a los <strong>de</strong> la previa. Mientras que en el caso <strong>de</strong> la recta evaluada sobre<br />

volúmenes agregados tras el ajuste sí se consigue que la pendiente sea muy próxima a la unidad<br />

(b=0.9929), i<strong>de</strong>almente 45º, manteniendo un valor <strong>de</strong> offset bajo pese a trabajar con escala<br />

agregada <strong>de</strong> volúmenes.<br />

Tabla 5-2: Comparativa <strong>de</strong> ecuación <strong>de</strong> la recta <strong>de</strong> regresión y R 2 , antes y <strong>de</strong>spués <strong>de</strong> ajuste.<br />

Comparando volúmenes<br />

en grupos <strong>de</strong> arcos<br />

Comparando volúmenes<br />

en arcos<br />

Antes <strong>de</strong>l ajuste Después <strong>de</strong>l ajuste<br />

R 2 =0.5272<br />

y=98.36+0.9122x<br />

R 2 =0.5143<br />

y=53.219+0.8713x<br />

R 2 =0.7631<br />

y=138.42+0.9929x<br />

R 2 =0.7599<br />

y=10.696+1.0632 x<br />

Otro criterio para evaluar este planteamiento <strong>de</strong> ajuste con volúmenes agregados sobre grupos<br />

<strong>de</strong> arcos en lugar <strong>de</strong> mediante volúmenes en arcos es comparar los resultados que se obtendrían<br />

empleando ambas metodologías: con volúmenes a nivel <strong>de</strong> arco y <strong>de</strong> frontera (grupos <strong>de</strong> arcos).<br />

De cara a la elección <strong>de</strong> una metodología <strong>de</strong> estimación que trabaje con volúmenes <strong>de</strong> arcos<br />

para ajustar una matriz previa, la más a<strong>de</strong>cuada, a efectos <strong>de</strong> comparación con la planteada en


150 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

esta Tesis, es la <strong>de</strong>sarrollada por Doblas y Benitez (2005). Se trata <strong>de</strong> valorar el uso <strong>de</strong><br />

volúmenes agregados sobre grupos <strong>de</strong> arcos en lugar <strong>de</strong> los clásicos conteos <strong>de</strong> tráfico, por ello<br />

esa metodología es la que mejor comparativa <strong>de</strong> prestaciones ofrecería dado que, en esencia, el<br />

algoritmo <strong>de</strong> ajuste seguido en esta Tesis está basado en él, pero con las modificaciones<br />

oportunas para trabajar a nivel <strong>de</strong> grupos <strong>de</strong> arcos.<br />

En base al razonamiento anterior, se realizó un proceso <strong>de</strong> ajuste <strong>de</strong> la misma matriz O–D <strong>de</strong><br />

partida pero utilizando como volúmenes observados medidas proporcionadas por aforos<br />

instalados sobre 1420 arcos <strong>de</strong> la red, disponibles <strong>de</strong> un estudio anterior <strong>de</strong>sarrollado sobre la<br />

misma red. Es preciso hacer notar que en el ensayo empleando volúmenes <strong>de</strong> frontera se<br />

monitorizaron 1265 arcos asociados a las 412 fronteras observadas. De manera que, aplicando la<br />

metodología <strong>de</strong>sarrollada por Doblas y Benitez (2005), la cual realizaba el proceso <strong>de</strong> ajuste con<br />

volúmenes observados a nivel <strong>de</strong> arcos, el coeficiente R 2 entre los volúmenes observados y los<br />

estimados (R 2 ≈0.80) no reflejó una mejora muy significativa comparada con la metodología<br />

propuesta a nivel <strong>de</strong> grupos <strong>de</strong> arcos (R 2 ≈0.76). Sin embargo, utilizar datos proce<strong>de</strong>ntes <strong>de</strong><br />

estaciones <strong>de</strong> aforo implica unos costes asociados a la infraestructura <strong>de</strong> <strong>de</strong>tectores que con la<br />

telefonía móvil no existirían. En este último caso, los volúmenes se basarían en datos <strong>de</strong><br />

teléfonos ya disponibles por los operadores para su propio funcionamiento, sin necesidad <strong>de</strong><br />

instalación <strong>de</strong> módulos adicionales ni reducir significativamente la exactitud obtenida <strong>de</strong>l ajuste,<br />

como se ha <strong>de</strong>mostrado en este ensayo.<br />

Un último aspecto a comentar es la convergencia <strong>de</strong>l algoritmo <strong>de</strong> ajuste. La Figura 5-7a<br />

muestra la evolución <strong>de</strong> la función objetivo <strong>de</strong> la Lagrangiana Aumentada (32) durante el<br />

proceso <strong>de</strong> ajuste, mostrando la rápida convergencia lograda, dadas las dimensiones <strong>de</strong>l<br />

problema, ejecutándolo con 5 subproblemas <strong>de</strong> 10 iteraciones cada una. La evolución típica <strong>de</strong><br />

la Lagrangiana aumentada, respecto al término más significativo, se aprecia con más <strong>de</strong>talle en<br />

la Figura 5-7b. El término correspondiente a las restricciones funcionales (Figura 5-7c) muestra<br />

un or<strong>de</strong>n <strong>de</strong> magnitud muy inferior al <strong>de</strong>l término cuadrático asociado a los volúmenes <strong>de</strong><br />

frontera, reflejando el nivel <strong>de</strong> control que sobre la información contenida en la matriz O–D<br />

ejerce el término correspondiente a las restricciones. Este efecto se <strong>de</strong>be a que las restricciones<br />

<strong>de</strong> viajes generados, atraídos y totales no suelen violar las cotas superiores e inferiores que<br />

tienen impuestas, por lo que no son tan restrictivas como las <strong>de</strong> variables acotadas. La rápida<br />

convergencia alcanzada con las etapas <strong>de</strong>l algoritmo también pue<strong>de</strong> ser observada en las<br />

gráficas <strong>de</strong>mostrando que, a efectos prácticos, el proceso iterativo se podría haber <strong>de</strong>tenido<br />

antes <strong>de</strong> que los criterios <strong>de</strong> terminación impuestos sean alcanzados (número <strong>de</strong> subproblemas y<br />

número <strong>de</strong> iteraciones por subproblema), consiguiendo ajustes más rápidos.


Capítulo 5: APLICACIÓN A LA ESTIMACIÓN DE MATRICES ORIGEN-DESTINO 151<br />

Función objetivo<br />

Función objetivo<br />

Función objetivo<br />

5,00E+08<br />

4,00E+08<br />

3,00E+08<br />

2,00E+08<br />

1,00E+08<br />

0,00E+00<br />

2,696E+08<br />

2,694E+08<br />

2,691E+08<br />

2,689E+08<br />

2,686E+08<br />

2,00E+04<br />

1,75E+04<br />

1,50E+04<br />

1,25E+04<br />

1,00E+04<br />

7,50E+03<br />

5,00E+03<br />

2,50E+03<br />

0,00E+00<br />

Lagrangiana Aumentada<br />

Término restricciones funcionales<br />

Término cuadrático <strong>de</strong> volúmenes observados<br />

1 2 3<br />

Subproblemas<br />

(a)<br />

4 5<br />

Lagrangiana Aumentada<br />

Término cuadrático <strong>de</strong> volúmenes observados<br />

2 3 4 5<br />

Subproblemas<br />

(b)<br />

Término restricciones funcionales<br />

1 2 3<br />

Subproblemas<br />

(c)<br />

4 5<br />

Figura 5-7: (a) Evolución <strong>de</strong> la función objetivo durante el proceso <strong>de</strong> ajuste <strong>de</strong> la matriz. (b) Zoom<br />

para los subproblemas 2–5. (c) Zoom para el término <strong>de</strong> las restricciones <strong>de</strong> la función objetivo.<br />

Con ello se ha realizado una validación experimental en la que se revela que emplear volúmenes<br />

agregados sobre grupos <strong>de</strong> arcos, en lugar <strong>de</strong> <strong>de</strong>sagregados a nivel individual <strong>de</strong> arco, en los<br />

procedimientos para el ajuste <strong>de</strong> matrices constituye una alternativa viable que no penaliza<br />

significativamente la exactitud obtenida. En especial, si estos volúmenes agregados se infirieran<br />

<strong>de</strong> la telefonía móvil se lograría reducir el coste económico y temporal <strong>de</strong>l estudio frente a los<br />

procedimientos tradicionales basados en aforos.


152 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL


CAPÍTULO 6<br />

CONCLUSIONES Y LÍNEAS FUTURAS<br />

6.1 CONCLUSIONES<br />

6.1.1 Introducción<br />

Esta Tesis está enfocada a la aplicación <strong>de</strong> los sistemas <strong>de</strong> telefonía móvil en los estudios <strong>de</strong><br />

movilidad <strong>de</strong> transporte. El objetivo principal ha sido la realización <strong>de</strong> aportaciones importantes<br />

en el campo <strong>de</strong> la inferencia <strong>de</strong> volúmenes <strong>de</strong> tráfico y en la estimación <strong>de</strong> matrices O–D,<br />

orientándolas a datos tomados <strong>de</strong> los sistemas <strong>de</strong> telefonía móvil. La telefonía móvil se está<br />

convirtiendo en un sector <strong>de</strong> gran utilidad en el ámbito <strong>de</strong>l tráfico. En este contexto, el Capítulo<br />

3 revisó en profundidad el “Estado–<strong>de</strong>l–Arte” presentando los conocimientos actuales sobre la<br />

estimación <strong>de</strong> parámetros <strong>de</strong> tráfico mediante el uso <strong>de</strong> información proce<strong>de</strong>nte <strong>de</strong> sistemas <strong>de</strong><br />

telefonía móvil, así como las prestaciones y beneficios que ofrecen este tipo <strong>de</strong> estimaciones.<br />

En el Capítulo 4 se formularon un conjunto <strong>de</strong> mo<strong>de</strong>los para la inferencia <strong>de</strong> volúmenes <strong>de</strong><br />

tráfico <strong>de</strong> vehículos mediante teléfonos móviles que pasan por una <strong>de</strong>terminada zona (frontera<br />

<strong>de</strong> una celda a otra). Tras realizar un minucioso estudio comparativo entre ellos, atendiendo a<br />

diferentes criteros, y contrastar los resultados, se seleccionaron aquellos que presentaron mejor<br />

balance entre todos los criterios junto a una cierta exactitud <strong>de</strong> las predicciones. La forma<br />

funcional <strong>de</strong> los mo<strong>de</strong>los seleccionados puso <strong>de</strong> manifiesto:<br />

i) lo insuficiente <strong>de</strong> usar exclusivamente información <strong>de</strong> llamadas en movilidad,<br />

ii) la necesidad <strong>de</strong> incorporar en los mo<strong>de</strong>los información sobre la variabilidad horaria<br />

<strong>de</strong> la conducta <strong>de</strong> los usuarios que se <strong>de</strong>splazan, en medios mecanizados, a la hora<br />

<strong>de</strong> realizar llamadas, y<br />

iii) la aplicabilidad <strong>de</strong> la metodología a ciertas fronteras entre celdas <strong>de</strong>ntro <strong>de</strong> unos<br />

rangos admisibles <strong>de</strong> error.


154 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

En el estudio numérico, los valores <strong>de</strong> predicción <strong>de</strong> los mo<strong>de</strong>los seleccionados mostraron<br />

resultados razonables en comparación con volúmenes observados por estaciones <strong>de</strong> aforo<br />

instaladas sobre las mismas vías, pese a la naturaleza <strong>de</strong> la principal variable <strong>de</strong> entrada al<br />

mo<strong>de</strong>lo: llamadas en movilidad. Este tipo <strong>de</strong> datos no representa el conjunto total <strong>de</strong> teléfonos<br />

que han pasado por una zona sino sólo aquellos pertenecientes al operador <strong>de</strong> interés que, a su<br />

vez, han realizado llamadas bajo ciertas condiciones analizadas en el apartado 4.3.2. Ante esta<br />

situación, la representatividad <strong>de</strong> la muestra queda condicionada en cierta medida. Lo i<strong>de</strong>al sería<br />

emplear datos generados por teléfonos que simplemente estuvieran encendidos, sin condicionar<br />

la muestra a la realización <strong>de</strong> llamadas. Aunque estos datos son generados internamente por los<br />

sistemas <strong>de</strong> telefonía en su funcionamiento, como ya se explicó en el Capítulo 2, recopilarlos<br />

implica una modificación <strong>de</strong> los módulos existentes en la plataforma <strong>de</strong>l operador ya que las<br />

APIs necesarias para su almacenamiento permanente no están accesibles. En consecuencia, y<br />

buscando un bajo impacto en los módulos <strong>de</strong>l operador <strong>de</strong> telefonía, se optó por emplear datos<br />

<strong>de</strong> llamadas; más concretamente, llamadas en movilidad, las cuales se asocian a un conjunto<br />

menos representativo <strong>de</strong> la población. La validación experimental realizada <strong>de</strong> los mo<strong>de</strong>los<br />

propuestos, los cuales consi<strong>de</strong>raban esas dificulta<strong>de</strong>s, mostró evi<strong>de</strong>ncias <strong>de</strong> que la telefonía<br />

móvil constituye una alternativa válida para la <strong>de</strong>terminación <strong>de</strong> volúmenes <strong>de</strong> vehículos<br />

pasando por una zona frente a los procedimientos tradicionales con aforos, dado que no se<br />

reducía en gran medida la precisión lograda.<br />

Una aplicación inmediata <strong>de</strong> esos volúmenes inferidos <strong>de</strong> la telefonía móvil se enfocó al ámbito<br />

<strong>de</strong> la obtención <strong>de</strong> matrices <strong>de</strong> movilidad. Bajo este planteamiento, el Capítulo 5 abordó el<br />

problema <strong>de</strong> estimación <strong>de</strong> matrices O–D presentando un algoritmo cuya principal novedad es<br />

el uso <strong>de</strong> información agregada <strong>de</strong> volúmenes sobre grupos <strong>de</strong> arcos, la cual podría proce<strong>de</strong>r,<br />

entre otros, <strong>de</strong> los sistemas <strong>de</strong> telefonía móvil. Para ello, se propuso una metodología <strong>de</strong> ajuste<br />

<strong>de</strong> una matriz previa mediante un mo<strong>de</strong>lo <strong>de</strong> estructura binivel empleando la adaptación a escala<br />

<strong>de</strong> volúmenes por grupos <strong>de</strong> arcos <strong>de</strong> un algoritmo robusto y eficiente presentado por Doblas y<br />

Benitez (2005), el cual trabajaba a nivel clásico <strong>de</strong> volumen <strong>de</strong> arco. Respecto al algoritmo <strong>de</strong><br />

resolución propuesto se realizó un estudio numérico que permitió efectuar una comparativa<br />

frente a ajustes <strong>de</strong> matrices mediante datos <strong>de</strong> aforos, <strong>de</strong>stacando i) la convergencia <strong>de</strong>l<br />

algoritmo propuesto y ii) la aplicabilidad <strong>de</strong> la metodología a re<strong>de</strong>s reales <strong>de</strong> mediano o gran<br />

tamaño. En este sentido se puso <strong>de</strong> manifiesto que emplear volúmenes agregados sobre grupos<br />

<strong>de</strong> arcos en los procedimientos para el ajuste <strong>de</strong> matrices constituye una alternativa viable, sin<br />

disminuir significativamente la exactitud alcanzada, frente a los procedimientos basados en<br />

volúmenes <strong>de</strong> arco. Adicionalmente, si los volúmenes agregados se infirieran <strong>de</strong> la telefonía


Capítulo 6: CONCLUSIONES Y LÍNEAS FUTURAS 155<br />

móvil se lograría reducir a su vez el coste económico y temporal <strong>de</strong>l estudio respecto <strong>de</strong>l uso<br />

tradicional <strong>de</strong> estaciones <strong>de</strong> aforo.<br />

Finalmente, se <strong>de</strong>sea <strong>de</strong>stacar que los mayores beneficios que pue<strong>de</strong> reportar un <strong>de</strong>sarrollo<br />

integrado <strong>de</strong> los métodos planteados en esta Tesis, tanto <strong>de</strong> inferencia <strong>de</strong> volúmenes como <strong>de</strong><br />

ajuste <strong>de</strong> matrices, vienen expresados en términos <strong>de</strong> ventajas para la sociedad obtenidos <strong>de</strong>s<strong>de</strong><br />

el punto <strong>de</strong> vista tecnológico. El hecho <strong>de</strong> que cada uno <strong>de</strong> esos métodos pueda ser abordado<br />

mediante la misma tecnología usada por los sistemas <strong>de</strong> telefonía convencionales y que exista la<br />

posibilidad <strong>de</strong> <strong>de</strong>sarrollar una herramienta capaz <strong>de</strong> integrarlos es <strong>de</strong> sumo interés para los<br />

planificadores <strong>de</strong> transporte. Una herramienta <strong>de</strong> ajuste <strong>de</strong> matrices mediante volúmenes<br />

<strong>de</strong>rivados <strong>de</strong> teléfonos móviles confiere un gran potencial práctico al proceso, dado que resuelve<br />

la problemática <strong>de</strong>bida a, fundamentalmente:<br />

� Coste. El <strong>de</strong>sarrollo <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> estimación que tomen datos <strong>de</strong> sistemas <strong>de</strong><br />

telefonía móvil y terminales convencionales usados hoy en día por cualquier usuario<br />

supone un ahorro económico importante asociado a gastos <strong>de</strong> instalación y<br />

mantenimiento que conllevarían las estaciones <strong>de</strong> aforo. Des<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong><br />

cobertura, la red <strong>de</strong> telefonía también ofrece un ahorro consi<strong>de</strong>rable dado que su zona<br />

<strong>de</strong> servicio abarca toda la cobertura nacional, incluyendo la red viaria, mientras que la<br />

infraestructura <strong>de</strong> los clásicos aforos es limitada, condicionando por tanto la captura <strong>de</strong><br />

conteos <strong>de</strong> tráfico.<br />

� Tiempo. La realización <strong>de</strong> gran<strong>de</strong>s encuestas <strong>de</strong> movilidad supone un coste<br />

económico y humano muy elevado, por lo que su ejecución suele abordarse<br />

aproximadamente cada 5 años. Es evi<strong>de</strong>nte que durante ese tiempo pueda producirse un<br />

incremento/<strong>de</strong>cremento <strong>de</strong> la movilidad en una ciudad o región <strong>de</strong>bido a la variación en<br />

la población o <strong>de</strong>l parque automotor, entre otros. Con lo cual, la percepción <strong>de</strong><br />

movilidad reflejada por esas encuestas suele quedarse obsoleta al poco tiempo <strong>de</strong> su<br />

elaboración. El disponer <strong>de</strong> datos <strong>de</strong> movilidad generados por teléfonos <strong>de</strong> usuarios en<br />

los <strong>de</strong>splazamientos que habitualmente realizan durante un día, permite actualizar <strong>de</strong> un<br />

modo más continuo esos datos, incluso pue<strong>de</strong>n servir para elaborar otro tipo <strong>de</strong> matrices<br />

<strong>de</strong> movilidad a niveles más extensos <strong>de</strong> zonificación (macrozonas).<br />

� Fiabilidad. Aunque la realización <strong>de</strong> encuestas está sujeta a fuertes controles <strong>de</strong><br />

calidad para regular su fiabilidad, en ocasiones, suelen introducir cierto sesgo <strong>de</strong>bido al<br />

diseño, selección o <strong>de</strong>terminación <strong>de</strong>l tamaño <strong>de</strong> la muestra que la genera. Incluso,<br />

pue<strong>de</strong> darse el caso que los individuos más móviles sean los que presenten menor


156 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

probabilidad <strong>de</strong> ser entrevistados, pues son los que pasan menos tiempo en casa. Por<br />

otro lado, la realización <strong>de</strong> encuestas directamente a vehículos sobre el viario es<br />

ciertamente incómoda para los usuarios y consumen mucho tiempo, con la consiguiente<br />

distorsión que se <strong>de</strong>riva <strong>de</strong> estos hechos. En cambio, utilizar como muestra ciertos<br />

teléfonos móviles <strong>de</strong> individuos que los llevan consigo en todo momento (i.e.: encuesta<br />

panel), lo cual es algo habitual en nuestros estilos <strong>de</strong> vida, permite obtener datos<br />

razonablemente representativos <strong>de</strong> las pautas <strong>de</strong> movilidad <strong>de</strong> los usuarios sin provocar<br />

ningún tipo <strong>de</strong> perturbación.<br />

No obstante, el mejor criterio para evaluar el uso <strong>de</strong> la telefonía móvil en el ámbito <strong>de</strong> la<br />

movilidad <strong>de</strong> vehículos es <strong>de</strong>terminar el impacto <strong>de</strong> los datos estimados a partir <strong>de</strong> ella en<br />

términos económicos y técnicos. Los siguientes apartados analizan las prestaciones <strong>de</strong><br />

estimaciones <strong>de</strong>rivadas <strong>de</strong> sistemas <strong>de</strong> telefonía móvil, enfocándolas a un nivel generalizado<br />

entre los posibles parámetros <strong>de</strong> tráfico que se pue<strong>de</strong>n <strong>de</strong>rivar <strong>de</strong> estos sistemas.<br />

6.1.2 Evaluación <strong>de</strong>l uso <strong>de</strong> teléfonos móviles para movilidad <strong>de</strong> vehículos<br />

Este apartado revisa las principales ventajas e inconvenientes a nivel técnico que se han<br />

encontrado tanto en el <strong>de</strong>sarrollo <strong>de</strong> este trabajo, como en otros realizados en diferentes<br />

proyectos pilotos.<br />

6.1.2.1 Ventajas<br />

Un modo <strong>de</strong> estudiar la efectividad <strong>de</strong> estas técnicas basadas en la telefonía móvil es<br />

compararlas con los resultados obtenidos con metodologías tradicionales, respecto a las cuales<br />

presenta ciertas ventajas. Principalmente, el tratamiento <strong>de</strong> esos datos supone manejar una<br />

muestra muy extensa <strong>de</strong> la población, <strong>de</strong>bido a las altas cuotas <strong>de</strong> penetración en gran parte <strong>de</strong><br />

las ciuda<strong>de</strong>s <strong>de</strong>l mundo. Junto a ello, <strong>de</strong>staca su bajo coste <strong>de</strong> implantación <strong>de</strong>bido a que<br />

cualquier terminal <strong>de</strong> los que son utilizados hoy en día por la mayoría <strong>de</strong> usuarios pue<strong>de</strong> ser<br />

válido como sonda <strong>de</strong> tráfico.<br />

Para conocer <strong>de</strong>talladamente las características <strong>de</strong>l tráfico vehicular existente en la red viaria<br />

sería necesario aforar un gran número <strong>de</strong> vías <strong>de</strong> manera casi permanente, lo cual implicaría<br />

disponer <strong>de</strong> una infraestructura consi<strong>de</strong>rable. Por ello, en contraste con las re<strong>de</strong>s <strong>de</strong> sensores<br />

fijos (<strong>de</strong>tectores, cámaras, etc.), la telefonía móvil proporciona información para analizar y<br />

cuantificar las variables <strong>de</strong> circulación sobre cualquier zona don<strong>de</strong> exista cobertura telefónica<br />

(GSM, GPRS y/o UMTS), sin necesidad <strong>de</strong> un costoso <strong>de</strong>spliegue <strong>de</strong> infraestructura adicional.<br />

Algunos <strong>de</strong> los trabajos presentados hasta el momento <strong>de</strong>jan constancia <strong>de</strong> que este tipo <strong>de</strong>


Capítulo 6: CONCLUSIONES Y LÍNEAS FUTURAS 157<br />

técnicas consiguen magníficos resultados sin necesidad <strong>de</strong> gastos excesivos <strong>de</strong> mantenimiento,<br />

<strong>de</strong>bido a que no sufre los <strong>de</strong>terioros <strong>de</strong> los equipos que están instalados a lo largo <strong>de</strong> las vías.<br />

Asimismo, su funcionamiento es in<strong>de</strong>pendiente <strong>de</strong> las condiciones meteorológicas, como<br />

pasaría bajo situaciones <strong>de</strong> poca visibilidad con otro tipo <strong>de</strong> sistemas como el <strong>de</strong> lectura <strong>de</strong>l<br />

número <strong>de</strong> matrícula.<br />

Por otro lado, las soluciones basadas en telefonía móvil permiten <strong>de</strong>rivar resultados <strong>de</strong> la<br />

información procesada <strong>de</strong> un modo más rápido que con las técnicas tradicionales. Esto ocurre en<br />

el caso <strong>de</strong> la estimación tradicional <strong>de</strong> matrices O–D mediante encuestas que, <strong>de</strong>s<strong>de</strong> la toma<br />

inicial <strong>de</strong> datos hasta la explotación <strong>de</strong> los primeros resultados, supone un largo proceso que<br />

pue<strong>de</strong> abarcar un periodo <strong>de</strong> incluso años. Las metodologías presentadas en el “Estado–<strong>de</strong>l–<br />

Arte” muestran la rapi<strong>de</strong>z conseguida a la hora <strong>de</strong> confeccionar información <strong>de</strong> las<br />

características <strong>de</strong>l tráfico (tiempos <strong>de</strong> viaje, velocidad, etc.), llegando algunas <strong>de</strong> ellas a<br />

proporcionar información en tiempo real. Esta capacidad mejora <strong>de</strong> modo consi<strong>de</strong>rable los<br />

sistemas <strong>de</strong> información <strong>de</strong> usuarios, como consulta WEB/WAP/SMS o mediante señalización<br />

VMS (Variable Message Signs), dado que facilita la toma <strong>de</strong> <strong>de</strong>cisiones sobre la ruta a tomar,<br />

hora <strong>de</strong> salida e incluso el modo <strong>de</strong> transporte a emplear. En consecuencia, se produce un efecto<br />

<strong>de</strong> “realimentación” que favorece el flujo <strong>de</strong> circulación al conseguirse reducir los tiempos <strong>de</strong><br />

viaje empleados por los viajeros, <strong>de</strong>bido a que éstos escogen las rutas más rápidas y menos<br />

congestionadas.<br />

No obstante, la principal ventaja se refleja en la mejora <strong>de</strong> la gestión y planificación <strong>de</strong>l tráfico<br />

<strong>de</strong>bido al reducido tiempo <strong>de</strong> procesado <strong>de</strong> los datos. Esta mejora no se pue<strong>de</strong> cuantificar en<br />

términos económicos, pero sí en calidad <strong>de</strong>l servicio <strong>de</strong>s<strong>de</strong> la perspectiva <strong>de</strong> uso diario <strong>de</strong> las<br />

vías por parte <strong>de</strong>l usuario. Según lo expuesto en el apartado anterior, estas soluciones basadas en<br />

telefonía móvil conseguirían mejorar los sistemas <strong>de</strong> monitorización <strong>de</strong> tráfico vehicular <strong>de</strong>s<strong>de</strong><br />

el punto <strong>de</strong> vista <strong>de</strong> tiempo, coste (utilizaría la infraestructura existente <strong>de</strong> telefonía celular),<br />

cobertura y representatividad estadística <strong>de</strong> la muestra (alta tasa <strong>de</strong> penetración telefónica).<br />

6.1.2.2 Inconvenientes<br />

Las metodologías basadas en la telefonía celular poseen ciertas limitaciones <strong>de</strong> naturaleza<br />

técnica que podrían afectar a la capacidad <strong>de</strong> la estimación <strong>de</strong> datos <strong>de</strong> tráfico. Estas<br />

limitaciones tienen diferentes impactos según el parámetro <strong>de</strong> tráfico estudiado y, aunque ya han<br />

sido comentadas a lo largo <strong>de</strong> la Tesis, a continuación se <strong>de</strong>scriben las más importantes.


158 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

■ Precisión en la información <strong>de</strong> posición<br />

La precisión <strong>de</strong> localización obtenida a partir <strong>de</strong> datos <strong>de</strong> teléfonos móviles varía según el<br />

estado <strong>de</strong>l teléfono (encendido, llamada...). Lo i<strong>de</strong>al sería conocer la posición exacta en<br />

términos <strong>de</strong> (x, y, z, t). Sin embargo, esto no es posible sin modificaciones en la red o en los<br />

terminales. El nivel <strong>de</strong> precisión más fino proporcionado por un sistema <strong>de</strong> telefonía móvil es a<br />

nivel <strong>de</strong> celda durante una llamada. De modo que se localiza al teléfono <strong>de</strong>ntro <strong>de</strong>l área <strong>de</strong><br />

cobertura <strong>de</strong> la estación base a la que está conectado. Esta ubicación es una aproximación <strong>de</strong> la<br />

zona geográfica en la que un teléfono se encuentra, pero no su posición exacta. Hay un margen<br />

<strong>de</strong> error que <strong>de</strong>pen<strong>de</strong> <strong>de</strong>l radio <strong>de</strong> la celda. Este radio oscila entre los 100 m y 1 km en ciuda<strong>de</strong>s.<br />

En entornos rurales <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la <strong>de</strong>nsidad <strong>de</strong> las antenas, aunque suele oscilar entre 5 y 20 km.<br />

Ese margen <strong>de</strong> error empeora para los teléfonos que no tienen una conexión activa a la red (no–<br />

llamada), don<strong>de</strong> la precisión <strong>de</strong> la información <strong>de</strong> posición es a nivel <strong>de</strong> área <strong>de</strong> localización<br />

(LA). Por ejemplo, si se trabaja a nivel <strong>de</strong> LA (agrupaciones <strong>de</strong> celdas) en lugar <strong>de</strong> a nivel <strong>de</strong><br />

celda, la zona geográfica don<strong>de</strong> el teléfono se pue<strong>de</strong> encontrar es más amplia y, por tanto, hay<br />

una mayor incertidumbre.<br />

Con in<strong>de</strong>pen<strong>de</strong>ncia <strong>de</strong>l inconveniente asociado al tamaño <strong>de</strong> las celdas, y más aún <strong>de</strong> las áreas<br />

<strong>de</strong> localización, existe otra dificultad que afecta al mapeado o “matching” <strong>de</strong> teléfonos sobre<br />

vías existentes en el área <strong>de</strong> servicio <strong>de</strong> estas zonas. Este efecto se pue<strong>de</strong> suavizar mediante un<br />

estudio exhaustivo entre la topología <strong>de</strong> la red viaria y las celdas <strong>de</strong> la red, lo cual es una tarea<br />

difícil, o mediante algoritmos <strong>de</strong> map–matching. El nivel <strong>de</strong> error medio en el mapeado pue<strong>de</strong><br />

ser relevante para ciertos parámetros, por lo que es un aspecto a tener en cuenta a la hora <strong>de</strong><br />

proporcionar resultados.<br />

Adicionalmente, es necesario indicar que el uso <strong>de</strong>l cambio <strong>de</strong> área <strong>de</strong> localización quizá no es<br />

el evento más apropiado para el estudio <strong>de</strong> movilidad <strong>de</strong> áreas urbanas. Debido a la propia<br />

naturaleza <strong>de</strong> la distribución celular <strong>de</strong> una red, las áreas <strong>de</strong> localización (grupos <strong>de</strong> celdas)<br />

pue<strong>de</strong>n abarcar extensiones <strong>de</strong> terreno <strong>de</strong> gran<strong>de</strong>s dimensiones. Esto implica que las fronteras<br />

entre LA sean espacialmente poco frecuentes y, por tanto, el conjunto <strong>de</strong> áreas <strong>de</strong> las que se<br />

podrá inferir los volúmenes <strong>de</strong> paso será pequeño.<br />

■ Vali<strong>de</strong>z <strong>de</strong> los datos<br />

La existencia <strong>de</strong> un único teléfono activo (<strong>de</strong> un pasajero o <strong>de</strong>l propio conductor) <strong>de</strong>ntro <strong>de</strong>l<br />

vehículo asegura dicho vehículo como una sonda válida. Sin embargo, esta suposición no es<br />

suficiente en zonas con <strong>de</strong>nsidad <strong>de</strong> población alta don<strong>de</strong> los peatones, usuarios <strong>de</strong> teléfonos<br />

móviles que están en edificios o cualquier tipo <strong>de</strong> usuarios estáticos, pue<strong>de</strong>n afectar a la


Capítulo 6: CONCLUSIONES Y LÍNEAS FUTURAS 159<br />

estimación <strong>de</strong> parámetros <strong>de</strong> tráfico. Una solución sencilla es consi<strong>de</strong>rar válidas para extraer<br />

datos <strong>de</strong> tráfico mediante telefonía móvil únicamente aquellas zonas alejadas <strong>de</strong> núcleos<br />

urbanos o <strong>de</strong> áreas resi<strong>de</strong>nciales dado que en esos casos los usuarios serán los ocupantes <strong>de</strong> los<br />

vehículos que circulan por vías como autovías, vías interurbanas o similares<br />

Si se quisiera extraer información <strong>de</strong> tráfico mediante la telefonía en entornos urbanos,<br />

consi<strong>de</strong>rando la grave influencia <strong>de</strong> la presencia <strong>de</strong> peatones o usuarios estáticos, se hace<br />

indispensable una diferenciación entre éstos y los usuarios en movimiento. Los procedimientos<br />

encargados <strong>de</strong> la i<strong>de</strong>ntificación y filtrado <strong>de</strong> esos teléfonos no–válidos resultan ser una tarea<br />

compleja pero necesaria en la estimación <strong>de</strong> la mayoría <strong>de</strong> parámetros <strong>de</strong> tráfico. Otros<br />

parámetros, tales como velocidad o tiempos <strong>de</strong> viaje, no se ven tan afectados por estas<br />

circunstancias puesto que los teléfonos estáticos son directamente filtrados <strong>de</strong>bido al propio<br />

carácter <strong>de</strong>l evento usado: el handover.<br />

Por tanto, la estimación <strong>de</strong> datos <strong>de</strong> tráfico basados en telefonía móvil <strong>de</strong>be combinarse con<br />

otros procedimientos basados en velocidad u otros métodos capaces <strong>de</strong> implementar tal<br />

diferenciación. En ese sentido, el IAGB (Institute for Applications of Geo<strong>de</strong>sy to Engineering)<br />

<strong>de</strong>ntro <strong>de</strong>l proyecto Do–iT <strong>de</strong>sarrolló algoritmos para <strong>de</strong>terminar y <strong>de</strong>scribir patrones <strong>de</strong><br />

movilidad mediante datos anónimos <strong>de</strong> telefonía móvil para la i<strong>de</strong>ntificación <strong>de</strong>l modo <strong>de</strong><br />

transporte que está utilizando el teléfono. (Wiltschko, 2006). En ellos se <strong>de</strong>sarrollaron unas<br />

funciones <strong>de</strong> análisis y mo<strong>de</strong>los <strong>de</strong> predicción para estimar la cantidad <strong>de</strong> miembros en cada<br />

clase o modo <strong>de</strong> transporte, logrando así distinguir entre clases “activas” o “no activas” (válidas<br />

o no válidas). En consecuencia, se consiguió mayor precicisón que utilizando mo<strong>de</strong>los <strong>de</strong><br />

estimación <strong>de</strong> verosimilitud, requiriendo la integración <strong>de</strong> horarios y rutas <strong>de</strong> líneas <strong>de</strong><br />

transporte público (autobuses, trenes, etc.) en los mo<strong>de</strong>los. Por otra parte, es necesario resaltar<br />

que la presencia <strong>de</strong> varios teléfonos móviles en un vehículo también perturba la estimación <strong>de</strong><br />

parámetros <strong>de</strong> tráfico. Por todo ello, es necesario indicar que los datos obtenidos <strong>de</strong> teléfonos<br />

móviles <strong>de</strong>ben ser calibrados con otros métodos <strong>de</strong> monitorización, como <strong>de</strong>tectores o cámaras,<br />

antes <strong>de</strong> usarlos como valor <strong>de</strong>finitivo.<br />

6.1.3 Estudio <strong>de</strong> mercado<br />

Según lo expuesto anteriormente, los datos <strong>de</strong> movilidad origen–<strong>de</strong>stino son una <strong>de</strong> las fuentes<br />

<strong>de</strong> información más importantes requeridas con vista a la gestión <strong>de</strong> la red <strong>de</strong> infraestructura<br />

terrestre y su planificación estratégica. En el capítulo anterior se ha planteado una nueva<br />

alternativa para la obtención <strong>de</strong> esos datos <strong>de</strong> movilidad <strong>de</strong> una forma más rápida y precisa,<br />

haciendo uso <strong>de</strong> volúmenes <strong>de</strong> tráfico inferidos <strong>de</strong> teléfonos móviles.


160 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Es obvio que las nuevas tecnologías <strong>de</strong>ben ser aprovechadas para introducir mejoras en la<br />

sociedad actual. Y qué mejor beneficio que hacer frente a los dos problemas fundamentales <strong>de</strong><br />

tráfico: la saturación y la seguridad. La saturación en las carreteras, especialmente aguda en las<br />

zonas urbanas y en las gran<strong>de</strong>s ciuda<strong>de</strong>s, provocan molestias a los conductores, con los<br />

consiguientes efectos negativos sobre el medio ambiente. Por otro lado, para los conductores y<br />

otros usuarios <strong>de</strong> la carretera, unos sistemas que permitan reforzar la seguridad en términos <strong>de</strong><br />

tiempo <strong>de</strong> respuesta constituyen la primera preocupación. De manera que unos sistemas <strong>de</strong><br />

información <strong>de</strong> tráfico que permitan hacer predicciones <strong>de</strong> movilidad <strong>de</strong> usuarios según el<br />

historial <strong>de</strong> movimientos <strong>de</strong> fechas anteriores darían un paso a<strong>de</strong>lante para solventar estos<br />

problemas. Este apartado analiza la aplicabilidad y rentabilidad <strong>de</strong> herramientas basadas en<br />

telefonía móvil, haciendo énfasis en los campos <strong>de</strong> interés <strong>de</strong> esta Tesis: volúmenes <strong>de</strong> tráfico y<br />

matrices <strong>de</strong> movilidad.<br />

6.1.3.1 Aplicabilidad<br />

Una herramienta <strong>de</strong> ajuste <strong>de</strong> matrices mediante volúmenes <strong>de</strong>rivados <strong>de</strong> teléfonos móviles<br />

confiere un gran potencial práctico al proceso. No obstante, la información <strong>de</strong>rivada <strong>de</strong> la<br />

telefonía permite obtener un amplio abanico <strong>de</strong> productos relacionados con datos <strong>de</strong> tráfico, los<br />

cuales pue<strong>de</strong>n ser proporcionados a administraciones públicas, consultoras <strong>de</strong> transporte, otras<br />

compañías <strong>de</strong> telecomunicaciones, compañías <strong>de</strong> logística u otras organizaciones relacionadas<br />

con vehículos.<br />

Principalmente, la metodología expuesta para estimación <strong>de</strong> matrices <strong>de</strong> movilidad está<br />

enfocada a un uso por parte <strong>de</strong> la Administración. Es ella la encargada <strong>de</strong> optimizar el uso <strong>de</strong> la<br />

infraestructura terrestre <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong>l usuario (en su utilización diaria) así como<br />

<strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> las inversiones a realizar para la a<strong>de</strong>cuación <strong>de</strong> estas infraestructuras a<br />

las necesida<strong>de</strong>s previstas y pronosticadas en escenarios futuros. Con técnicas tradicionales, los<br />

datos <strong>de</strong> movilidad obtenidos resultan en ocasiones poco fiables. Por ello, las cuantiosas<br />

inversiones que realiza para afrontar sus objetivos pue<strong>de</strong>n verse justificadas al obtener unas<br />

matrices O–D ajustadas con datos reales y actuales proce<strong>de</strong>ntes <strong>de</strong> telefonía celular. Estos datos<br />

<strong>de</strong> telefonía, dado su extendido uso en la sociedad española actual con una cuota <strong>de</strong> penetración<br />

<strong>de</strong> 110.8% (CMT, Enero 2009) y teniendo Vodafone una cuota <strong>de</strong> mercado por clientes <strong>de</strong>l<br />

31.2% (CMT, Enero 2009), representan a una muestra significativa <strong>de</strong> la población,<br />

contribuyendo con ello a la mejora <strong>de</strong> los estudios <strong>de</strong> movilidad.<br />

No obstante, sus resultados beneficiarán no sólo a la Administración, sino a usuarios <strong>de</strong>l sistema<br />

<strong>de</strong> transporte (tanto privado como público) y a la sociedad en su conjunto. La Tabla 6-1 muestra


Capítulo 6: CONCLUSIONES Y LÍNEAS FUTURAS 161<br />

otras aplicaciones adicionales que se pue<strong>de</strong>n <strong>de</strong>rivar <strong>de</strong> un sistema <strong>de</strong> información <strong>de</strong> este tipo,<br />

algunas <strong>de</strong> las cuales ya fueron comentadas en el capítulo <strong>de</strong>l “Estado–<strong>de</strong>l–Arte”.<br />

Tabla 6-1: Ejemplos <strong>de</strong> Aplicaciones según mercados <strong>de</strong> negocio.<br />

Sector Aplicaciones<br />

Administración y otras autorida<strong>de</strong>s<br />

públicas<br />

Matrices Origen Destino<br />

Volúmenes y flujos<br />

Vigilancia Congestión e Inci<strong>de</strong>ntes<br />

Estudios <strong>de</strong> tiempos <strong>de</strong> viaje y/o velocida<strong>de</strong>s<br />

Estudios <strong>de</strong> planificación<br />

Estudios <strong>de</strong> contaminación<br />

Compañías <strong>de</strong> logística y flotas Gestión y planificación <strong>de</strong> rutas<br />

Proveedores <strong>de</strong> servicios LBS Direccionamiento guiado<br />

Vigilancia <strong>de</strong> congestión<br />

Estudios <strong>de</strong> tiempos <strong>de</strong> viaje<br />

Consultoras <strong>de</strong> Transporte<br />

Planificación<br />

Contaminación atmosférica<br />

Estudios <strong>de</strong> transporte<br />

Empresas <strong>de</strong> Telecomunicaciones Servicios <strong>de</strong> información en tiempo real (sms, WAP)<br />

Marketing Campañas, ubicaciones estratégicas, etc<br />

6.1.3.2 Rentabilidad<br />

En 2006 la Unión Europea (UE) aprobó <strong>de</strong>finitivamente la directiva 2006/24/CE sobre<br />

retención <strong>de</strong> datos telefónicos y <strong>de</strong> comunicaciones electrónicas. Dicha normativa obliga a los<br />

operadores a retener ciertos datos durante un periodo <strong>de</strong> entre 6 y 24 meses para la lucha contra<br />

el terrorismo y otros <strong>de</strong>litos graves. Todas las llamadas telefónicas <strong>de</strong>berán ser registradas, tanto<br />

las recibidas como las perdidas o no contestadas. La citada directiva también afectará a la<br />

retención <strong>de</strong> los datos correspondientes a la localización <strong>de</strong>l lugar <strong>de</strong>s<strong>de</strong> el que se realizan las<br />

llamadas <strong>de</strong>s<strong>de</strong> teléfonos móviles.<br />

Según los cálculos <strong>de</strong> las autorida<strong>de</strong>s europeas, la creación <strong>de</strong> una base <strong>de</strong> datos con todas las<br />

llamadas efectuadas y recibidas por cada usuario, junto con la infraestructura necesaria, le<br />

supondrá a cada compañía una inversión que superará los 100 millones <strong>de</strong> euros, sin incluir el<br />

gasto anual asociado a su mantenimiento. Esta infraestructura para almacenar los datos pue<strong>de</strong><br />

utilizarse adicionalmente para otro tipo <strong>de</strong> aplicaciones. En concreto, según lo comentado en<br />

párrafos anteriores, sería <strong>de</strong> gran utilidad en aplicaciones relacionadas con los sistemas<br />

inteligentes <strong>de</strong> transporte (ITS), los cuales requieren datos <strong>de</strong> localización anónimos para<br />

efectuar sus estimaciones y ajustes. Con ello, el gasto para <strong>de</strong>splegar esta nueva infraestructura<br />

impuesta por la Unión Europea podría verse compensado con la distribución <strong>de</strong> este nuevo


162 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

sistema <strong>de</strong> información <strong>de</strong> tráfico, el cual resultaría muy llamativo para la Administración, que<br />

se encarga <strong>de</strong> realizar las inversiones para mejorar la gestión y planificación <strong>de</strong> la red.<br />

El coste medio <strong>de</strong> una encuesta (encuesta+procesado) para estimar matrices O–D oscila<br />

alre<strong>de</strong>dor <strong>de</strong> los 30 €. Para ajustar las matrices O-D <strong>de</strong> modo apropiado, estas encuestas <strong>de</strong>ben<br />

efectuarse sobre una muestra representativa <strong>de</strong> la población; por ello, su coste resulta muy<br />

elevado. A ello se le une el coste temporal, <strong>de</strong>bido a que el tratamiento <strong>de</strong> los datos <strong>de</strong> las<br />

encuestas supone un largo proceso. Por ello estas encuestas suelen actualizarse con los datos<br />

recogidos por los tradicionales aforos. El emplear información <strong>de</strong>rivada <strong>de</strong> la telefonía para<br />

actualizar o, incluso, generar estas matrices sería una alternativa <strong>de</strong> especial interés para la<br />

Administración puesto que se conseguirían revolucionar los estudios <strong>de</strong> movilidad <strong>de</strong>s<strong>de</strong> el<br />

punto <strong>de</strong> vista <strong>de</strong> coste (utilizaría la infraestructura existente <strong>de</strong> telefonía celular), fiabilidad (son<br />

datos <strong>de</strong> movilidad reales) y temporal, pudiendo dar respuesta inmediata a los problemas<br />

<strong>de</strong>rivados <strong>de</strong> ella.<br />

6.1.3.3 Valor Añadido para la Sociedad <strong>de</strong> la Información<br />

Como ya se ha comentado, una matriz O-D obtenida <strong>de</strong> una forma automática y, en cierto<br />

modo, inmediata supondría una auténtica revolución en los estudios <strong>de</strong> movilidad encargados<br />

por la Administración. Junto a ello, podría dar también una respuesta inmediata a los problemas<br />

<strong>de</strong>rivados <strong>de</strong> la movilidad, permitiendo abordar temas a los que hasta ahora ha <strong>de</strong>dicado pocos<br />

recursos, como la movilidad en fin <strong>de</strong> semana, movilidad motivo ocio, movilidad a pie, etc.<br />

Asimismo, este sistema <strong>de</strong> información pue<strong>de</strong> solventar otros problemas <strong>de</strong>rivados <strong>de</strong>l<br />

incremento <strong>de</strong> tráfico experimentado en la mayoría <strong>de</strong> las áreas metropolitanas <strong>de</strong> los países<br />

<strong>de</strong>sarrollados como la saturación, la seguridad y la escasez <strong>de</strong> nuevos servicios. Por ello, sector<br />

público y privado <strong>de</strong>ben trabajar <strong>de</strong> manera conjunta para introducir estas herramientas <strong>de</strong><br />

automatización, fomentando la integración <strong>de</strong> las nuevas tecnologías en nuestra vida cotidiana.<br />

Adicionalmente, este tipo <strong>de</strong> <strong>de</strong>sarrollo en I+D+i aportaría un retorno proveniente <strong>de</strong> la imagen<br />

social que se generaría en la colaboración operador–organismo público para la incorporación <strong>de</strong><br />

nuevas tecnologías en la mejora <strong>de</strong> la planificación <strong>de</strong> la movilidad mecanizada.<br />

6.2 LÍNEAS FUTURAS<br />

Tras la realización <strong>de</strong> esta Tesis, y teniendo en cuenta el “Estado–<strong>de</strong>l–Arte” y el “Estado–<strong>de</strong>–la–<br />

Práctica” en el momento <strong>de</strong> su terminación, así como las conclusiones anteriormente expuestas,<br />

el siguiente párrafo presenta unas sugerencias para posibles futuras líneas <strong>de</strong> investigación:


Capítulo 6: CONCLUSIONES Y LÍNEAS FUTURAS 163<br />

� Perfeccionamiento <strong>de</strong> los mo<strong>de</strong>los <strong>de</strong> predicción <strong>de</strong> volúmenes <strong>de</strong> vehículos<br />

propuestos.<br />

En primer lugar, resulta prometedora la continuación directa <strong>de</strong> la línea <strong>de</strong> investigación<br />

<strong>de</strong> la Tesis mediante el diseño <strong>de</strong> mo<strong>de</strong>los más robustos para estimar los volúmenes<br />

<strong>de</strong>bido a que las llamadas en movilidad presentan una fuerte componente <strong>de</strong><br />

aleatoriedad y un reducido tamaño <strong>de</strong> la muestra respecto a la población. Se sugiere un<br />

estudio más completo que tenga en cuenta patrones <strong>de</strong> movilidad asociados a las vías<br />

que conforman la frontera entre celdas así como sus características topológicas (cercanía<br />

a una ciudad, polígonos en sus alre<strong>de</strong>dores…).<br />

A continuación se proponen nuevas líneas directamente relacionadas con la Tesis.<br />

� Investigación y <strong>de</strong>sarrollo <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> estimación <strong>de</strong> volúmenes <strong>de</strong> tráfico basados<br />

en datos <strong>de</strong>l cambio <strong>de</strong> área <strong>de</strong> localización generados por teléfonos que simplemente se<br />

encuentran encendidos.<br />

� Estudio <strong>de</strong> otros parámetros <strong>de</strong> tráfico (velocida<strong>de</strong>s, tiempos <strong>de</strong> viaje, <strong>de</strong>nsidad….).<br />

� Desarrollo <strong>de</strong> una metodología para la elaboración <strong>de</strong> matrices a nivel <strong>de</strong> macrozonas.<br />

� Desarrollo <strong>de</strong> mo<strong>de</strong>los <strong>de</strong> i<strong>de</strong>ntificación <strong>de</strong> peatones para el filtrado y <strong>de</strong>puración <strong>de</strong><br />

la muestra con terminales válidos.<br />

� Análisis <strong>de</strong> clusterización entre curvas <strong>de</strong> intensida<strong>de</strong>s <strong>de</strong> vehículos proporcionados<br />

por estaciones <strong>de</strong> aforo e intensida<strong>de</strong>s inferidas <strong>de</strong> la telefonía móvil.


164 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL


BIBLIOGRAFÍA<br />

Abrahamsson T. Estimation of origin-<strong>de</strong>stination matrices using traffic counts – a literature<br />

survey. Interim report, International Institute for Applied Systems Analysis, A-2361. Laxenburg,<br />

Austria, 1998.<br />

Ahas R., Ülar M. Location based services–new challenges for planning and public<br />

administration?. Futures, vol. 37(6), 547-561, 2005<br />

AirSage. Using Cellular Technology to Provi<strong>de</strong> an Intelligent Traffic Roadmap. Disponible on–<br />

line (Acceso Junio, 2007): http://www.airsage.com/pdf/trafficewise_release.pdf<br />

Akin D., Sisiopiku V. P. Estimating origin-<strong>de</strong>stination matrices using location information from<br />

cell phones. Proc. of 49th Annual North American Meetings of the Regional Science Association<br />

International, Puerto Rico, 2002.<br />

Bar-Gera H. Evaluation of a cellular phone-based system for measurement of traffic speeds and<br />

travel times: A case study from Israel. Transportation Research Part C, vol. 15(6), 380–391,<br />

2007.<br />

Bar-Gera H. Transport Network Test Problems. Ben-Gurion University of the Negev.<br />

Disponible online (Acceso Mayo, 2007b): http://www.bgu.ac.il/~bargera/tntp/<br />

Bazaraa M. S., Shetty C. M. Nonlinear Programming: Theory and Algorithms. John Wiley &<br />

Sons, Inc, 1979.<br />

Beckmann M., McGuire C., Winsten C. Studies in the Economics of Transportation. Yale<br />

University Press, New Haven, Connecticut, 1956.<br />

Bekhor S., Hirsh M., Nimre S., Feldman I. I<strong>de</strong>ntifying Spatial and Temporal Congestion<br />

Characteristics using Passive Mobile Phone Data. Transportation Research Board 87th Annual<br />

Meeting, CD-ROM paper no. 1534, 2008.<br />

Bell M.G.H. The estimation of an origin-<strong>de</strong>stination matrix by constrained generalized least<br />

squares. Transportation Research 25, 13–22, 1991.


166 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Birle C., Wermuth M. The Traffic Online Project. Special Session: Cellular-based traffic data<br />

collection. SS45 (EU). 13th World Congress on ITS, London, United Kingdom, 2006.<br />

Bolla R., Davoli F., Giordano F. Estimating road traffic parameters from mobile<br />

communications. 7th World Congress on ITS, Torino, Italy, 2000.<br />

Caceres N., Benitez F.G., Romero L.M., Vázquez J., Wi<strong>de</strong>berg J. Herramienta para la<br />

inferencia y actualización <strong>de</strong> matrices O-D <strong>de</strong> movilidad a través <strong>de</strong> datos <strong>de</strong> telefonía celular.<br />

Informe Final FOM/486/2003, 2005.<br />

Caceres N., Wi<strong>de</strong>berg J. P., Benitez F. G. Deriving origin-<strong>de</strong>stination data from a mobile phone<br />

network. IET Proc. Intelligent Transport Systems, vol. 1(1), pp. 15–26, 2007.<br />

Caceres N., Wi<strong>de</strong>berg J., Benitez F.G. Review of traffic data estimations extracted from cellular<br />

networks, IET Proc. Intelligent Transport Systems, vol. 2(3), pp179–192, 2008.<br />

Cascetta E. Estimation of trip matrices from traffic counts and survey data: A generalized least<br />

squares estimator, Transportation Research, 18B, 1984.<br />

Cascetta E., Nguyen S. A unified framework for estimating or updating origin/<strong>de</strong>stination<br />

matrices from traffic counts. Transportation Research, 22B. 437-455, 1988.<br />

Cayford R., Johnson T. Operational Parameters Affecting Use of Anonymous Cell Phone<br />

Tracking for Generating Traffic Information. Transportation Research Board 82th Annual<br />

Meeting, vol. 1(3):03–3865, 2003.<br />

CMT (Comisión <strong>de</strong>l Mercado <strong>de</strong> las Telecomunicaciones). Informe Telefonía Móvil. Enero,<br />

2009.<br />

CDB, Communities Dominate Brands. A mobile phone for every living person in Western<br />

Europe: penetration hits 100%. Disponible on–line (Acceso Octubre, 2007):<br />

http://communities-dominate.blogs.com/brands/2006/03/phone_for_every.html<br />

CRT, Consorcio Regional <strong>de</strong> Transportes <strong>de</strong> la Comunidad <strong>de</strong> Madrid, Mo<strong>de</strong>lización <strong>de</strong> la<br />

Movilidad en Día Laborable <strong>de</strong> 2004 en la Comunidad <strong>de</strong> Madrid, 2004.<br />

Chen Y., Florian M. O–D <strong>de</strong>mand adjustment problem with congestion: Part I. mo<strong>de</strong>l analysis<br />

and optimality conditions. In L. Bianco and P. Toth (Eds.), Advanced Methods in<br />

Transportation Analysis, pp. 1–22. Berlin: Springer-Verlag, 1996.


BIBLIOGRAFÍA 167<br />

Decell AutoRoute1 – Real-Time Route Guidance. Disponible on–line (Acceso Junio, 2006):<br />

http://www.<strong>de</strong>cell.com/autoroute1/real_time.htm<br />

Deheuvels P. La Fonction <strong>de</strong> Depen<strong>de</strong>nce Empirique et ses Propietés. Un test non parametrique<br />

d’in<strong>de</strong>pen<strong>de</strong>nce. Aca<strong>de</strong>mie Royale <strong>de</strong> Belgique Bulletin <strong>de</strong> la Classe <strong>de</strong>s Sciences-5e, 65: 274–<br />

292, 1979.<br />

Delcan. Press Release. Delcan.NET and ITIS Holdings in Partnership. Disponible on–line<br />

(Acceso Abril, 2005): http://www.itisholdings.com/pdf/<strong>de</strong>lcanitis290405.pdf<br />

Doblas F.J., Benitez F.G., 2005. An Approach to Estimating and Updating Origin-Destination<br />

Matrices Based Upon Traffic Counts Preserving the Prior Structure of a Survey Matrix.<br />

Transportation Research Part B–Methodological, vol. 39, no. 7, pp. 565–591.<br />

EIA/TIA IS-95. Mobile Station-Base Station Compatibility Standard for Dual-Mo<strong>de</strong> Wi<strong>de</strong>band<br />

Spread Spectrum Cellular System, 1993.<br />

EMME/2. User’s Manual, Software Release 9. INRO Consultants Inc, 1998.<br />

Gavish B., Sridhar S. The impact of Mobility on Cellular Network Configuration, 4th Intern.<br />

Conf. on Telecommunication Systems: Mo<strong>de</strong>lling and Analysis, pp. 197–211, ATSMA,1996.<br />

Gibson J.D. (ed). The mobile communications handbook, Second Edition. CRC Press & IEEE<br />

Press, 1999.<br />

Hellinga B., Fu L., Takada H. Traffic network condition monitoring via mobile phone location<br />

referencing – an emerging opportunity. Proc. of the 6th Transportation Specialty Conference<br />

held in conjunction with the Annual Conference of the Canadian Society of Civil Engineers,<br />

Toronto, Canada, 2005.<br />

Hernando Rábanos J.M. Sistemas <strong>de</strong> Comunicaciones Móviles <strong>de</strong> Tercera Generación IMT–<br />

2000 (UMTS). Ed. Fundación Airtel-Vodafone, 2002.<br />

Herrera J., Bayen A. Traffic flow reconstruction using mobile sensors and loop <strong>de</strong>tector data.<br />

Transportation Research Board 87th Annual Meeting, CD-ROM paper no. 1868, 2008.<br />

Hong D., Rappaport S.S. Traffic mo<strong>de</strong>l and performance analysis for cellular mobile radio<br />

telephone systems with prioritized and nonprioritized handoff procedures, IEEE Trans. Veh.<br />

Technol., vol. VT–35, no. 3, pp. 448–461, 1986.


168 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Höpfner M., Lemmer K., Ehrenpfordt I. Cellular Data for Traffic Management – First Results of<br />

a Field Test. ITS Europe Conference, CD-ROM paper no. 2407, 2007.<br />

Huidobro J.M. Comunicaciones Móviles. Ed. Paraninfo, 2002.<br />

Ilyas M., Mahgoub I. (Editors). Mobile Computing Handbook. CRC Press, 2005.<br />

ITIS Holdings – Press Releases. Estimotion Technology chosen for traffic collection in Antwerp.<br />

Disponible online (Acceso Septiembre 2004): http://www.itisholdings.com/pdf/itisproximus.pdf<br />

Kummala J. Travel time service utilising mobile phones. Finnish Road Administration, Helsinki.<br />

Finnra Report 55/2002. 67pp, 2002.<br />

LeBlanc L.J. An Algorithm for the Discrete Network Design Problem. Transport Science, 9(3),<br />

pp. 183–199, 1975.<br />

Linauer M., Leihs D. Generating floating car data by using GSM–network. Proc. of the 10th<br />

World Congress and Exhibition on Intelligent Transport Systems and Services. Madrid, 2003.<br />

Lovell D. J. Accuracy of speed measurements from cellular phone vehicle location systems”.<br />

ITS Journal, vol. 6, no. 4, pp. 303–325, 2001.<br />

Low D.E. A new approach to transport system mo<strong>de</strong>lling. Traffic Quarterly, vol. 26, no. 3, pp.<br />

391–404, 1972.<br />

Maher M.J. Inferences on trip matrices from observations on link volumes: A Bayesian<br />

statistical approach. Transportation Research, 17B. 435–447, 1983.<br />

MINUTP. Technical User Manual. Hague Consulting Group, HCG. V.93A, 1993.<br />

MTS (Mobile Traffic Service), LogicaCMG. LogicaCMG provi<strong>de</strong>s reliable and comprehensive<br />

traffic information based on GSM network data. Disponible on–line (Acceso Noviembre, 2003):<br />

http://www.logica.com/logicacmg+provi<strong>de</strong>s+reliable+and+comprehensive+traffic+information<br />

+based+on+gsm+network+data/400002401<br />

Nelsen R. B. An Introduction to Copulas (Second Edition). Springer Series in Statistics.<br />

Springer, New York, 2006.


BIBLIOGRAFÍA 169<br />

Pan C., Lu J., Di S., Ran B. Cellular-Based Data-Extracting Method for Trip Distribution.<br />

Transportation Research Record: Journal of the Transportation Research Board No. 1945, pp.<br />

33–39, 2006.<br />

Patriksson M. The Traffic Assignment Problem: Mo<strong>de</strong>ls and Methods. VSP BV, 1994.<br />

Pyo J.S., Shin D.H., Sung T.K. Development of a Map Matching Method Using the Multiple<br />

Hypothesis Technique. IEEE Intelligent Transportation Systems Conference Proceedings.<br />

Oakland, Calif., pp. 23–27, 2001.<br />

Rappaport T.S. Wireless Communications: Principles and Practice, Second Edition. Prentice<br />

Hall, New Jersey, 2002.<br />

Ratti C., Pulselli R.M., Williams S., Frenchman D. Mobile Landscapes: using location data<br />

from cell-phones for urban analysis. Environment and Planning B: Planning and Design, vol.<br />

33(5), pp 727-748, 2006.<br />

Ratti C., Sevtsuk A, Huang S., Pailer R. Mobile Landscapes: Graz in Real Time. Proceedings of<br />

the 3rd Symposium on LBS & TeleCartography. Vienna, Austria, 2005.<br />

Rea<strong>de</strong>s J., Calabrese F., Sevtsuk A., Ratti C. Cellular Census: Explorations in Urban Data<br />

Collection. IEEE Pervasive Computing, vol. 6, no. 3, pp. 30–38, 2007.<br />

Reklaitis G.V., Ravindran A., Rags<strong>de</strong>ll K.M. Engineering Optimization: Methods and<br />

Applications. John Wiley & Sons, Inc, 1983.<br />

Rose G. Mobile phones as traffic probes: practices, prospects and issues. Transport Reviews,<br />

vol. 26, no. 3, 275–291, 2006.<br />

Sallent O., Valenzuela J.L., Agustí R. Principios <strong>de</strong> Comunicaciones Móviles. Ediciones UPC,<br />

Barcelona, España, 2003.<br />

Sheffi Y. Urban Transport Networks: Equilibrium Analysis with Mathematical Programming<br />

Methods. Prentice-Hall, Inc., 1985.<br />

Smith B.L., Fontaine M.D. Private-Sector Provision of Congestion Data. NCHRP 70-01,<br />

University of Virginia, 2006.


170 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

Smith B.L., Pack M.L., Lovell D.J., Sermons M.W. Transportation management applications of<br />

anonymous mobile call sampling. Proceedings of the 11th Annual Meeting of ITS America,<br />

Miami, Florida, 2001.<br />

Smith Institute. Real–time traffic monitoring using mobile phone data. Disponible on–line<br />

(Acceso Mayo, 2006): www.smithinst.ac.uk/Projects/ESGI49/ESGI49-<br />

Vodafone/Report/TrafficMonitoring.pdf<br />

Sohn K. Dynamic estimation of origin-<strong>de</strong>stination flows using cell phones as probes. SDI 2004–<br />

R–04, Dept. of Urban Transportation, Seoul Development Institute, Korea, 2004.<br />

Spiess H. A maximum likelihood mo<strong>de</strong>l for estimating origin-<strong>de</strong>stination matrices.<br />

Transportation Research, 21B. 395–412, 1987.<br />

Spiess H. A Gradient Approach for the O-D Matrix Adjustment Problem. Publication no. 693,<br />

Centre for Research on Transportation, University of Montreal, 1990.<br />

Steele R., Nofal M. Teletraffic performance of microcellular personal communication networks,<br />

IEE Proceedings–I, vol. 139, no. 4, pp. 448–461, 1992.<br />

Suwansirikul C., Friesz T.L., Tobin R.L. Equilibrium <strong>de</strong>composed optimization: A heuristic for<br />

the continuous equilibrium network <strong>de</strong>sign problem. Transport Science, 21, pp. 254–263, 1987.<br />

Thiessenhusen K.-U., Schäfer R.-P., Lang T. Traffic data from cell phones: a comparison with<br />

loops and probe vehicle data. 13th World Congress on ITS, CD-ROM, paper no. 1550. London,<br />

United Kingdom, 2006.<br />

Thornton J., Grace D. Effect of Lateral Displacement of a High Altitu<strong>de</strong> Platform on Cellular<br />

Interference and Handoff. IEEE Trans. Wireless Communications, vol. 4(4), pp. 1483–1490,<br />

2005.<br />

TRANSCAD. User's Gui<strong>de</strong>, Version 4.8. Newton, MA, Caliper Corporation, 2006.<br />

TRIPS. MVESTM program. INSMVA Systematica, 1990.<br />

Van Zuylen H.J., Willumsen L.G. The most likely trip matrix estimated from traffic counts.<br />

Transportation Research, 14B, 281–293, 1980.<br />

VDOT. Cell phones could keep you out of traffic jams. Disponible on–line (Acceso Septiembre,<br />

2005): http://www.airsage.com/pdf/news-4-27-05.pdf


BIBLIOGRAFÍA 171<br />

Virtanen J. Mobile phones as probes in travel time monitoring. Finnish Road Administration,<br />

Helsinki, 2002.<br />

White C.E., Bernstein D., Kornhauser A.L. Some Map Matching Algorithms for Personal<br />

Navigation Assistants. Transportation Research Part C, vol. 8, pp. 91–108, 2000.<br />

White J.K., Gower P. Collecting origin-<strong>de</strong>stination information from cellular phone location<br />

data. TRL Unpublished Report, 1999.<br />

White J., Wells I. Extracting origin <strong>de</strong>stination information from mobile phone data. 11th<br />

International Conference on Road Transport Information and Control (Conf. Publ. No. 486).<br />

pp. 30–34, 2002.<br />

Wiltschko T., Schwieger V, Möhlenbrink W. Generating Floating Phone Data for Traffic Flow<br />

Optimization. Proceedings of the 3rd International Symposium Networks for Mobility, Stuttgart,<br />

Germany, 2006.<br />

Yang H., Sasaki T., Iida Y., Asakura Y. Estimation of origin-<strong>de</strong>stination matrices from link<br />

traffic counts on congested networks. Transport Research 26B, 6, pp. 417–434, 1992.<br />

Ygnace J.-L. Travel time/speed estimates on the French Rhone corridor network using cellular<br />

phones as probes. Final report of the SERTI V program, INRETS, Lyon, France, 2001.<br />

Yim Y. The state of cellular probes. California PATH Research Report: UCB–ITS–PRR–2003–<br />

25, 2003.<br />

Zeng Q-A., Mukumoto K., Fukuda K. Performance analysis of mobile cellular radio systems<br />

with two-level priority reservation handoff procedure, IEICE Trans. Commun., vol. E80-B, no.<br />

4, pp. 598–604, 1997.


172 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL


A<br />

AIC: Akaike Information Criterion (Criterio <strong>de</strong> Información <strong>de</strong> Akaike).<br />

AMPS: Advanced Mobile Phone System.<br />

AOA: Angel Of Arrival.<br />

AuC: Authentication Center.<br />

B<br />

BER: Bit Error Rate.<br />

BH: Busy Hour (hora <strong>de</strong> mayor ocupación).<br />

BIC: Bayesian Information Criterion (Criterio <strong>de</strong> Información Bayesiano).<br />

BPR: Bureau of Public Roads.<br />

APÉNDICE I<br />

GLOSARIO


174 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

BSC: Base Station Controller.<br />

BSS: Base Station Sub-System.<br />

BTS: Base Transceiver Station.<br />

C<br />

CC: Country Co<strong>de</strong>.<br />

CGI: Cell Global I<strong>de</strong>ntity. CGI = LAI + CI.<br />

CI: Cell I<strong>de</strong>ntity.<br />

CIR: Carrier to Interference Ratio.<br />

CMT: Comisión Mercado <strong>de</strong> las Telecomunicaciones.<br />

CSPDN: Circuit Switched Public Data Network.<br />

CV: Coeficiente <strong>de</strong> Variación.<br />

E<br />

EIR: Equipment I<strong>de</strong>ntity Register.<br />

F<br />

FCD: Floating Car Data.<br />

F–W: Frank–Wolfe.<br />

G<br />

GMSC: Gateway Mobile Services Switching Center.<br />

GPRS: General Packed Radio Service.<br />

GSM: Global System for Mobile Communications.


Apéndice I: GLOSARIO 175<br />

H<br />

HLR: Home Location Register.<br />

HO: Handover.<br />

I<br />

IMD: Intensidad Media Diaria.<br />

IMEI: International Mobile Equipment I<strong>de</strong>ntity.<br />

IMSI: International Mobile Subscriber I<strong>de</strong>ntity. IMSI = MCC + MNC+ MSIN = MCC + NMSI.<br />

ISDN: Integrated Services Digital Network.<br />

ITS: Intelligent Traffic Systems.<br />

L<br />

LA: Location Area (área <strong>de</strong> localización).<br />

LAC: Location Area Co<strong>de</strong>.<br />

LAI: Location Area I<strong>de</strong>ntification. LAI = MCC +MNC +LAC.<br />

LLF: Log-Likelihood Function.<br />

LMSI: Local Mobile Station I<strong>de</strong>ntity.<br />

LPR: License Plate Recognition.<br />

LU: Location Update.<br />

M<br />

MCC: Mobile Country Co<strong>de</strong>.<br />

ME: Mobile Equipment.


176 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

MNC: Mobile Network Co<strong>de</strong>.<br />

MS: Mobile Station.<br />

MSC: Mobile services Switching Center.<br />

MSIN: Mobile Station I<strong>de</strong>ntification Number.<br />

MSISDN: Mobile Subscriber ISDN Number. MSISDN = CC + NDC +SN<br />

MSRN: Mobile Station Roaming Number. MSRN = CC + NDC + SN<br />

MT: Mobile Termination.<br />

N<br />

NDC: National Destination Co<strong>de</strong>.<br />

NMC: Network management Center.<br />

NMSI: National Mobile Station I<strong>de</strong>ntity.<br />

NSS: Network Sub-System<br />

O<br />

O–D: Origen–Destino.<br />

OMC: Operation and Maintance Center.<br />

OMC-N: Operation and Maintenance Center National.<br />

OMC-R: Operation and Maintenance Center Regional.<br />

P<br />

PDU: Protocol Data Unit.<br />

PIN: Personal I<strong>de</strong>ntification Number.


Apéndice I: GLOSARIO 177<br />

PLMN: Public Land Mobile Network.<br />

PLU: Periodic Location Update.<br />

PSPDN: Packet Switched Public Data Network.<br />

PSTN: Public Switched Telephone Network.<br />

R<br />

RA: Routing Area.<br />

RAI: Routing Area I<strong>de</strong>ntification.<br />

RLC: Radio Link Control.<br />

RLP: Radio Link Protocol.<br />

RSSI: Radio Signal Strenght Indicator.<br />

RTB: Red Telefónica Básica.<br />

S<br />

SIM: Subscriber I<strong>de</strong>ntity Module.<br />

SN: Subscriber Number.<br />

T<br />

TAP: Traffic Assignment Problem.<br />

TAZ: Traffic Analysis Zone.<br />

TDOA: Time Difference Of Arrival.<br />

TMSI: Temporary Mobile Subscriber I<strong>de</strong>ntity.


178 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

U<br />

UMTS: Universal Mobile Telecommunications System.<br />

V<br />

VLR: Visitor Location Register.<br />

VMS: Variable Message Signs.


APÉNDICE II<br />

PUBLICACIONES<br />

Algunos <strong>de</strong> los resultados obtenidos en esta Tesis se encuentran recogidos en las publicaciones<br />

que se listan a continuación, junto con otras aportaciones también relacionadas con ella.<br />

PUBLICACIONES EN REVISTAS<br />

� Caceres N., Wi<strong>de</strong>berg J.P., Benitez F.G. Deriving origin–<strong>de</strong>stination data from a mobile<br />

phone network. IET Proc. Intelligent Transport Systems, vol. 1(1), pp. 15–26, 2007.<br />

� Caceres N., Wi<strong>de</strong>berg J., Benitez F.G. Review of traffic data estimations extracted from<br />

cellular networks, IET Proc. Intelligent Transport Systems, vol. 2(3), pp. 179–192,<br />

2008.<br />

� A Bi–Level Approach to Estimating Origin-Destination Trip Matrices from Cellular<br />

Phone Data preserving the Structure of Prior Matrices' Information. (En revisión 2009).<br />

� Forecasting Traffic Flow Using Anonymous Mobile Phone Data. (En revisión 2009).<br />

CONGRESOS INTERNACIONALES<br />

� Caceres N., Wi<strong>de</strong>berg J. P., Benitez F. G. Deriving Traffic Data from a Cellular<br />

Network. 13th World Congress on Intelligent Transport System and Services. London,<br />

United Kingdom. 2006.


180 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />

CONGRESOS NACIONALES<br />

� Caceres N., Romero L. M., Vázquez J., Wi<strong>de</strong>berg J. P., Benitez F. G. Inferencia y<br />

Actualización <strong>de</strong> Matrices O-D <strong>de</strong> Movilidad a Través <strong>de</strong> Datos <strong>de</strong> Telefonía Celular.<br />

VII Congreso <strong>de</strong> Ingeniería <strong>de</strong>l Transporte. Ciudad Real, España, 2006. CIT 2006.<br />

� Caceres N., Wi<strong>de</strong>berg J. P., Benitez F. G. Monitorización <strong>de</strong> la Movilidad y el Tráfico<br />

Mediante Datos <strong>de</strong> Telefonía Móvil. VII Congreso Español Sobre Sistemas Inteligentes<br />

<strong>de</strong> Transporte. Valencia. ITS España. 2007.<br />

� Caceres N., Romero L.M., Benitez F. G., Wi<strong>de</strong>berg J. P. Metodología Bi–nivel para la<br />

Estimación <strong>de</strong> Matrices <strong>de</strong> Movilidad con Datos Agregados <strong>de</strong> Telefonía Móvil. VIII<br />

Congreso <strong>de</strong> Ingeniería <strong>de</strong> Transporte. A Coruña, España, 2008. CIT 2008.<br />

OTRAS PUBLICACIONES<br />

� <strong>Cáceres</strong> N., Benítez F.G., Romero L.M., Vázquez J., Wi<strong>de</strong>berg J. Herramienta para la<br />

inferencia y actualización <strong>de</strong> matrices O–D <strong>de</strong> movilidad a través <strong>de</strong> datos <strong>de</strong> telefonía<br />

celular. Informe Final FOM/486/2003. ISBN: 84-88783-77-9, 2005.<br />

OTROS MÉRITOS<br />

I Premio Vodafone al Proyecto <strong>de</strong> Desarrollo e Innovación Móvil en el ámbito <strong>de</strong> la<br />

Investigación, entregado por la Fundación Vodafone España en 2007 al equipo formado por<br />

<strong>Noelia</strong> <strong>Cáceres</strong> <strong>Sánchez</strong>, Francisco García Benítez y Johan P. Wi<strong>de</strong>berg <strong>de</strong>l grupo <strong>de</strong><br />

Ingeniería e Infraestructura <strong>de</strong> los Transportes (Escuela Técnica Superior <strong>de</strong> Ingenieros,<br />

<strong>Universidad</strong> <strong>de</strong> <strong>Sevilla</strong>), por el proyecto “Uso <strong>de</strong> datos <strong>de</strong> una Red GSM para la inferencia<br />

<strong>de</strong> datos <strong>de</strong> movilidad interurbana <strong>de</strong> vehículos”.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!