17.01.2013 Views

Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 101<br />

4.3.6.4 Correlación por rango (<strong>de</strong> Spearman) y correlación lineal (<strong>de</strong> Pearson)<br />

Otro criterio a tener en cuenta <strong>de</strong>ntro <strong>de</strong> la comparativa <strong>de</strong> mo<strong>de</strong>los es la correlación entre las<br />

predicciones y los valores reales. Se consi<strong>de</strong>ra que dos variables están correlacionadas cuando<br />

los valores <strong>de</strong> una <strong>de</strong> ellas varían sistemáticamente con respecto a los valores <strong>de</strong> la otra. En este<br />

sentido, si tenemos dos variables (A y B) existe correlación si al aumentar los valores <strong>de</strong> A lo<br />

hacen también los <strong>de</strong> B y viceversa. Aplicando esto al conjunto <strong>de</strong> valores observados {yi} y<br />

estimados { y ˆi }, se pue<strong>de</strong> evaluar la calidad <strong>de</strong> las predicciones examinando si existe<br />

correlación. El coeficiente <strong>de</strong> correlación lineal, o coeficiente <strong>de</strong> Pearson, es el instrumento<br />

tradicionalmente utilizado para medir la <strong>de</strong>pen<strong>de</strong>ncia entre variables aleatorias. Si r = 0, no<br />

existe relación lineal. Pero esto no implica necesariamente una in<strong>de</strong>pen<strong>de</strong>ncia total entre las dos<br />

variables. Pue<strong>de</strong> ocurrir que, aún con r próximo a 0, la variación <strong>de</strong> una <strong>de</strong> ellas influya en el<br />

valor que pueda tomar la otra caso que existan relaciones no lineales entre las dos variables.<br />

Estas limitaciones no existen si se utiliza la correlación entre rangos, la cual consi<strong>de</strong>ra la<br />

concordancia <strong>de</strong> los datos. El concepto <strong>de</strong> concordancia está relacionado con la probabilidad <strong>de</strong><br />

encontrar valores altos (o bajos) <strong>de</strong> una variable asociados a valores altos (o bajos) <strong>de</strong> la otra<br />

variable. Si esto no ocurre, las variables son discordantes. De modo que la concordancia <strong>de</strong>tecta<br />

relaciones no lineales que la correlación no pue<strong>de</strong> <strong>de</strong>tectar. En consecuencia, las medidas <strong>de</strong><br />

correlación que trabajan con rangos no presentan las limitaciones <strong>de</strong> la correlación lineal.<br />

Dentro <strong>de</strong> estas medidas <strong>de</strong>staca el <strong>de</strong>nominado coeficiente <strong>de</strong> correlación <strong>de</strong> Spearman.<br />

Se proce<strong>de</strong> a analizar la calidad <strong>de</strong> las predicciones yˆ i <strong>de</strong> cada mo<strong>de</strong>lo analizando la<br />

<strong>de</strong>pen<strong>de</strong>ncia en términos <strong>de</strong> correlación por rango <strong>de</strong> Spearman y correlación lineal o <strong>de</strong><br />

Pearson. La siguiente tabla muestra estas correlaciones para cada uno <strong>de</strong> los mo<strong>de</strong>los.<br />

Tabla 4-6: Correlación por rango (Spearman) y lineal (Pearson) entre { yi , y ˆi } para cada mo<strong>de</strong>lo.<br />

Correlación<br />

por rango<br />

Correlación<br />

lineal<br />

Mo<strong>de</strong>lo 1 Mo<strong>de</strong>lo 2 Mo<strong>de</strong>lo 3 Mo<strong>de</strong>lo 4 Mo<strong>de</strong>lo 5 Mo<strong>de</strong>lo 6<br />

0.25102 0.51398 0.51375 0.39904 0.39904 0.56623<br />

0.28436 0.4698 0.48134 0.33953 0.34893 0.53333<br />

En términos <strong>de</strong> correlación por rango, <strong>de</strong>stacan claramente sobre los <strong>de</strong>más los mo<strong>de</strong>los 6, 2 y<br />

3; especialmente el mo<strong>de</strong>lo 6, alcanzando valores elevados para el tamaño <strong>de</strong> la muestra<br />

consi<strong>de</strong>rada. Respecto al coeficiente <strong>de</strong> correlación lineal, ocurre algo similar. Por ello, se<br />

establece que los mejores mo<strong>de</strong>los bajo este enfoque <strong>de</strong> correlación son el mo<strong>de</strong>lo 6, seguido <strong>de</strong><br />

los mo<strong>de</strong>los 2 y 3.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!