Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

More documents

Recommendations

Info

Capítulo 4: INFERENCIA DE VOLÚMENES DE TRÁFICO MEDIANTE LA TELEFONÍA MÓVIL 101 4.3.6.4 Correlación por rango (de Spearman) y correlación lineal (de Pearson) Otro criterio a tener en cuenta dentro de la comparativa de modelos es la correlación entre las predicciones y los valores reales. Se considera que dos variables están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores de la otra. En este sentido, si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. Aplicando esto al conjunto de valores observados {yi} y estimados { y ˆi }, se puede evaluar la calidad de las predicciones examinando si existe correlación. El coeficiente de correlación lineal, o coeficiente de Pearson, es el instrumento tradicionalmente utilizado para medir la dependencia entre variables aleatorias. Si r = 0, no existe relación lineal. Pero esto no implica necesariamente una independencia total entre las dos variables. Puede ocurrir que, aún con r próximo a 0, la variación de una de ellas influya en el valor que pueda tomar la otra caso que existan relaciones no lineales entre las dos variables. Estas limitaciones no existen si se utiliza la correlación entre rangos, la cual considera la concordancia de los datos. El concepto de concordancia está relacionado con la probabilidad de encontrar valores altos (o bajos) de una variable asociados a valores altos (o bajos) de la otra variable. Si esto no ocurre, las variables son discordantes. De modo que la concordancia detecta relaciones no lineales que la correlación no puede detectar. En consecuencia, las medidas de correlación que trabajan con rangos no presentan las limitaciones de la correlación lineal. Dentro de estas medidas destaca el denominado coeficiente de correlación de Spearman. Se procede a analizar la calidad de las predicciones yˆ i de cada modelo analizando la dependencia en términos de correlación por rango de Spearman y correlación lineal o de Pearson. La siguiente tabla muestra estas correlaciones para cada uno de los modelos. Tabla 4-6: Correlación por rango (Spearman) y lineal (Pearson) entre { yi , y ˆi } para cada modelo. Correlación por rango Correlación lineal Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 5 Modelo 6 0.25102 0.51398 0.51375 0.39904 0.39904 0.56623 0.28436 0.4698 0.48134 0.33953 0.34893 0.53333 En términos de correlación por rango, destacan claramente sobre los demás los modelos 6, 2 y 3; especialmente el modelo 6, alcanzando valores elevados para el tamaño de la muestra considerada. Respecto al coeficiente de correlación lineal, ocurre algo similar. Por ello, se establece que los mejores modelos bajo este enfoque de correlación son el modelo 6, seguido de los modelos 2 y 3.
102 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL 4.3.6.5 Criterio de información de Akaike y criterio de información bayesiano: AIC BIC El modelo perfecto no existe, puesto que todos constituyen simplificaciones de la realidad a través de una serie de parámetros. Siempre son preferibles modelos con menos parámetros debido a que, además de ser más sencillos de estimar, son más estables y están sometidos a menos sesgo. Por ello existen unas medidas de contraste entre modelos que penalizan en cierto modo que éstos tengan muchos parámetros. Las más conocidas son el criterio de información de Akaike, AIC, y criterio de información bayesiano, BIC. Ambos estadísticos se utilizan en la selección de modelos para tomar el mejor de entre un conjunto de varios admisibles. Así pues, un modelo es mejor que otro si tiene un valor AIC (o BIC) menor. Las fórmulas matemáticas del AIC y BIC se enuncian a continuación: AIC ��2�LLF�2�P (20) BIC ��2�LLF �P �ln( N) En ellas intervienen el logaritmo de la función verosimilitud de cada modelo (LLF), el número de parámetros ajustados (P) y el número total de observaciones o tamaño de la muestra (N). En el cálculo de la función de verosimilitud interviene un producto de probabilidades de observaciones individuales, por lo que habitualmente interesa tomar logaritmos, ya que éstos transforman los productos en sumas y los cocientes en restas. De ahí que el cálculo de AIC y BIC emplee el logaritmo de la función de verosimilitud. La función de verosimilitud es un indicador para señalar la capacidad de ajuste de un modelo, permitiendo con ello su empleo en la comparación de modelos. Su valor será mayor cuanto mejor sea el ajuste, mientras que tendrá un valor más cercano a 0 cuando el ajuste sea malo. Por ello, junto a los estadísticos AIC y BIC de cada uno de los modelos, también se emplea el logaritmo de la función verosimilitud (LLF) para el contraste de modelos. El cálculo de estos tres indicadores se realiza sobre un conjunto de datos que, en este caso, se tratará de medidas del error relativo entre valores reales y predicciones, yi e yˆ i respectivamente, para cada modelo, y ˆ i � yi eri � . y i Para determinar el LLF se precisa conocer la función de verosimilitud del conjunto de medidas del error relativo, en la cual interviene la función de densidad de probabilidad seguida. La construcción de esta función se simplifica, en gran medida, si se asume que la distribución del conjunto de datos es normal. Sin embargo, realizando un test de normalidad, se demuestra que los datos analizados, en este caso errores relativos entre los valores observados y estimados por
Page 1 and 2:
Noelia Cáceres Sánchez TESIS DOCT
Page 4:
TESIS DOCTORAL ESTIMACIÓN DE MATRI
Page 8:
AGRADECIMIENTOS Esta Tesis Doctoral
Page 11 and 12:
CAPÍTULO 3 ESTADO DEL ARTE EN EL
Page 14 and 15:
ÍNDICE DE FIGURAS Figura 2-1: Arqu
Page 16 and 17:
Figura 4-15: Evolución del nº de
Page 18:
ÍNDICE DE TABLAS Tabla 3-1: Compar
Page 21 and 22:
2 ESTIMACIÓN DE MATRICES DE MOVILI
Page 23 and 24:
Page 25 and 26:
Page 27 and 28:
Page 29 and 30:
10 ESTIMACIÓN DE MATRICES DE MOVIL
Page 31 and 32:
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
Page 57 and 58:
Page 59 and 60:
Page 61 and 62:
Page 63 and 64:
Page 65 and 66:
Page 67 and 68:
Page 69 and 70: 50 ESTIMACIÓN DE MATRICES DE MOVIL
Page 119: 100 ESTIMACIÓN DE MATRICES DE MOVI
Page 123 and 124: 104 ESTIMACIÓN DE MATRICES DE MOVI
Page 171 and 172:
152 ESTIMACIÓN DE MATRICES DE MOVI
Page 173 and 174:
Page 175 and 176:
Page 177 and 178:
Page 179 and 180:
Page 181 and 182:
Page 183 and 184:
Page 185 and 186:
Page 187 and 188:
Page 189 and 190:
Page 191 and 192:
Page 193 and 194:
Page 195 and 196:
Page 197 and 198:
Page 199:
show all

Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla

Create successful ePaper yourself

Delete template?

Save as template?