Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla
Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla
Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 101<br />
4.3.6.4 Correlación por rango (<strong>de</strong> Spearman) y correlación lineal (<strong>de</strong> Pearson)<br />
Otro criterio a tener en cuenta <strong>de</strong>ntro <strong>de</strong> la comparativa <strong>de</strong> mo<strong>de</strong>los es la correlación entre las<br />
predicciones y los valores reales. Se consi<strong>de</strong>ra que dos variables están correlacionadas cuando<br />
los valores <strong>de</strong> una <strong>de</strong> ellas varían sistemáticamente con respecto a los valores <strong>de</strong> la otra. En este<br />
sentido, si tenemos dos variables (A y B) existe correlación si al aumentar los valores <strong>de</strong> A lo<br />
hacen también los <strong>de</strong> B y viceversa. Aplicando esto al conjunto <strong>de</strong> valores observados {yi} y<br />
estimados { y ˆi }, se pue<strong>de</strong> evaluar la calidad <strong>de</strong> las predicciones examinando si existe<br />
correlación. El coeficiente <strong>de</strong> correlación lineal, o coeficiente <strong>de</strong> Pearson, es el instrumento<br />
tradicionalmente utilizado para medir la <strong>de</strong>pen<strong>de</strong>ncia entre variables aleatorias. Si r = 0, no<br />
existe relación lineal. Pero esto no implica necesariamente una in<strong>de</strong>pen<strong>de</strong>ncia total entre las dos<br />
variables. Pue<strong>de</strong> ocurrir que, aún con r próximo a 0, la variación <strong>de</strong> una <strong>de</strong> ellas influya en el<br />
valor que pueda tomar la otra caso que existan relaciones no lineales entre las dos variables.<br />
Estas limitaciones no existen si se utiliza la correlación entre rangos, la cual consi<strong>de</strong>ra la<br />
concordancia <strong>de</strong> los datos. El concepto <strong>de</strong> concordancia está relacionado con la probabilidad <strong>de</strong><br />
encontrar valores altos (o bajos) <strong>de</strong> una variable asociados a valores altos (o bajos) <strong>de</strong> la otra<br />
variable. Si esto no ocurre, las variables son discordantes. De modo que la concordancia <strong>de</strong>tecta<br />
relaciones no lineales que la correlación no pue<strong>de</strong> <strong>de</strong>tectar. En consecuencia, las medidas <strong>de</strong><br />
correlación que trabajan con rangos no presentan las limitaciones <strong>de</strong> la correlación lineal.<br />
Dentro <strong>de</strong> estas medidas <strong>de</strong>staca el <strong>de</strong>nominado coeficiente <strong>de</strong> correlación <strong>de</strong> Spearman.<br />
Se proce<strong>de</strong> a analizar la calidad <strong>de</strong> las predicciones yˆ i <strong>de</strong> cada mo<strong>de</strong>lo analizando la<br />
<strong>de</strong>pen<strong>de</strong>ncia en términos <strong>de</strong> correlación por rango <strong>de</strong> Spearman y correlación lineal o <strong>de</strong><br />
Pearson. La siguiente tabla muestra estas correlaciones para cada uno <strong>de</strong> los mo<strong>de</strong>los.<br />
Tabla 4-6: Correlación por rango (Spearman) y lineal (Pearson) entre { yi , y ˆi } para cada mo<strong>de</strong>lo.<br />
Correlación<br />
por rango<br />
Correlación<br />
lineal<br />
Mo<strong>de</strong>lo 1 Mo<strong>de</strong>lo 2 Mo<strong>de</strong>lo 3 Mo<strong>de</strong>lo 4 Mo<strong>de</strong>lo 5 Mo<strong>de</strong>lo 6<br />
0.25102 0.51398 0.51375 0.39904 0.39904 0.56623<br />
0.28436 0.4698 0.48134 0.33953 0.34893 0.53333<br />
En términos <strong>de</strong> correlación por rango, <strong>de</strong>stacan claramente sobre los <strong>de</strong>más los mo<strong>de</strong>los 6, 2 y<br />
3; especialmente el mo<strong>de</strong>lo 6, alcanzando valores elevados para el tamaño <strong>de</strong> la muestra<br />
consi<strong>de</strong>rada. Respecto al coeficiente <strong>de</strong> correlación lineal, ocurre algo similar. Por ello, se<br />
establece que los mejores mo<strong>de</strong>los bajo este enfoque <strong>de</strong> correlación son el mo<strong>de</strong>lo 6, seguido <strong>de</strong><br />
los mo<strong>de</strong>los 2 y 3.