Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla
Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla
Noelia Cáceres Sánchez TESIS DOCTORAL - Universidad de Sevilla
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
102 ESTIMACIÓN DE MATRICES DE MOVILIDAD MEDIANTE DATOS DE TELEFONÍA MÓVIL<br />
4.3.6.5 Criterio <strong>de</strong> información <strong>de</strong> Akaike y criterio <strong>de</strong> información bayesiano: AIC BIC<br />
El mo<strong>de</strong>lo perfecto no existe, puesto que todos constituyen simplificaciones <strong>de</strong> la realidad a<br />
través <strong>de</strong> una serie <strong>de</strong> parámetros. Siempre son preferibles mo<strong>de</strong>los con menos parámetros<br />
<strong>de</strong>bido a que, a<strong>de</strong>más <strong>de</strong> ser más sencillos <strong>de</strong> estimar, son más estables y están sometidos a<br />
menos sesgo. Por ello existen unas medidas <strong>de</strong> contraste entre mo<strong>de</strong>los que penalizan en cierto<br />
modo que éstos tengan muchos parámetros.<br />
Las más conocidas son el criterio <strong>de</strong> información <strong>de</strong> Akaike, AIC, y criterio <strong>de</strong> información<br />
bayesiano, BIC. Ambos estadísticos se utilizan en la selección <strong>de</strong> mo<strong>de</strong>los para tomar el mejor<br />
<strong>de</strong> entre un conjunto <strong>de</strong> varios admisibles. Así pues, un mo<strong>de</strong>lo es mejor que otro si tiene un<br />
valor AIC (o BIC) menor. Las fórmulas matemáticas <strong>de</strong>l AIC y BIC se enuncian a continuación:<br />
AIC ��2�LLF�2�P (20)<br />
BIC ��2�LLF �P �ln(<br />
N)<br />
En ellas intervienen el logaritmo <strong>de</strong> la función verosimilitud <strong>de</strong> cada mo<strong>de</strong>lo (LLF), el número<br />
<strong>de</strong> parámetros ajustados (P) y el número total <strong>de</strong> observaciones o tamaño <strong>de</strong> la muestra (N). En<br />
el cálculo <strong>de</strong> la función <strong>de</strong> verosimilitud interviene un producto <strong>de</strong> probabilida<strong>de</strong>s <strong>de</strong><br />
observaciones individuales, por lo que habitualmente interesa tomar logaritmos, ya que éstos<br />
transforman los productos en sumas y los cocientes en restas. De ahí que el cálculo <strong>de</strong> AIC y<br />
BIC emplee el logaritmo <strong>de</strong> la función <strong>de</strong> verosimilitud.<br />
La función <strong>de</strong> verosimilitud es un indicador para señalar la capacidad <strong>de</strong> ajuste <strong>de</strong> un mo<strong>de</strong>lo,<br />
permitiendo con ello su empleo en la comparación <strong>de</strong> mo<strong>de</strong>los. Su valor será mayor cuanto<br />
mejor sea el ajuste, mientras que tendrá un valor más cercano a 0 cuando el ajuste sea malo. Por<br />
ello, junto a los estadísticos AIC y BIC <strong>de</strong> cada uno <strong>de</strong> los mo<strong>de</strong>los, también se emplea el<br />
logaritmo <strong>de</strong> la función verosimilitud (LLF) para el contraste <strong>de</strong> mo<strong>de</strong>los. El cálculo <strong>de</strong> estos<br />
tres indicadores se realiza sobre un conjunto <strong>de</strong> datos que, en este caso, se tratará <strong>de</strong> medidas <strong>de</strong>l<br />
error relativo entre valores reales y predicciones, yi e yˆ i respectivamente, para cada mo<strong>de</strong>lo,<br />
y ˆ i � yi<br />
eri<br />
� .<br />
y<br />
i<br />
Para <strong>de</strong>terminar el LLF se precisa conocer la función <strong>de</strong> verosimilitud <strong>de</strong>l conjunto <strong>de</strong> medidas<br />
<strong>de</strong>l error relativo, en la cual interviene la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad seguida. La<br />
construcción <strong>de</strong> esta función se simplifica, en gran medida, si se asume que la distribución <strong>de</strong>l<br />
conjunto <strong>de</strong> datos es normal. Sin embargo, realizando un test <strong>de</strong> normalidad, se <strong>de</strong>muestra que<br />
los datos analizados, en este caso errores relativos entre los valores observados y estimados por