12.07.2015 Views

Material Docente - del Departamento de Economía Aplicada III

Material Docente - del Departamento de Economía Aplicada III

Material Docente - del Departamento de Economía Aplicada III

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Estadística Actuarial y Análisis <strong>de</strong> RegresiónAutor:M. Victoria Esteban González<strong>Departamento</strong> <strong>de</strong> Economía <strong>Aplicada</strong> <strong>III</strong>. Econometría y EstadísticaFacultad <strong>de</strong> Ciencias Económicas y EmpresarialesUniversidad <strong><strong>de</strong>l</strong> País Vasco/Euskal Herriko Unibertsitatea


Queda terminantemente prohibida la reproducción no autorizada <strong>de</strong> este material docente, y ladistribución no autorizada <strong>de</strong> copias <strong>de</strong> la misma, así como cualquier otra infracción <strong>de</strong> los <strong>de</strong>rechosque sobre esta recopilación correspon<strong>de</strong>n a la Profesora M a Victoria Esteban junto con el <strong>Departamento</strong><strong>de</strong> Econometría y Estadística <strong>de</strong> la Facultad <strong>de</strong> Ciencias Económicas y Empresariales <strong>de</strong> laUPV/EHU.c○UPV/EHU 2012.


iiEstadística Actuarial: Análisis <strong>de</strong> Regresión


PresentaciónEl objetivo <strong>de</strong> este documento es introducir un conjunto <strong>de</strong> técnicas estadísticas y econométricaspara la estimación <strong>de</strong> mo<strong><strong>de</strong>l</strong>os lineales en situaciones don<strong>de</strong> se cumplen las hipótesis estadísticas <strong>de</strong>comportamiento habituales. Se preten<strong>de</strong> introducir al alumno en el análisis <strong>de</strong> regresión, por lo queprevio a un repaso <strong>de</strong> aspectos fundamentales <strong>de</strong> la estimación <strong>de</strong> parámetros y sus propieda<strong>de</strong>s y<strong>de</strong> la inferencia estadística se estudia en <strong>de</strong>talle el Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal General. El objetivofundamental <strong><strong>de</strong>l</strong> curso es que, al final <strong><strong>de</strong>l</strong> mismo, los estudiantes sean capaces <strong>de</strong> utilizar el mo<strong><strong>de</strong>l</strong>o<strong>de</strong> regresión para resolver un problema sencillo que se les plantee: <strong>de</strong>s<strong>de</strong> la especificación, estimacióny validación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o hasta contrastar hipótesis <strong>de</strong> relevancia económica y pre<strong>de</strong>cir. Este objetivose ha <strong>de</strong> satisfacer tanto <strong>de</strong>s<strong>de</strong> un punto <strong>de</strong> vista teórico, resolver cuestiones y explicar resultados yaobtenidos, como práctico: estimar un mo<strong><strong>de</strong>l</strong>o con una base <strong>de</strong> datos concreta y realizar los contrastespertinentes.Estas notas incluyen seis temas más un tema inicial que aborda la <strong>de</strong>scripción gráfica y numérica<strong>de</strong> una variable más un tema final con orientaciones dirigidas al <strong>de</strong>sarrollo por parte <strong>de</strong> los alumnos<strong>de</strong> un proyecto final don<strong>de</strong> se muestre la evolución <strong>de</strong> un caso práctico <strong>de</strong> interés. Los contenidosse estructuran entorno a dos núcleos centrales, el análisis <strong>de</strong> la información que po<strong>de</strong>mos extraer<strong>de</strong> una única variable y el estudio <strong>de</strong> cómo se relacionan las variable entre sí. El análisis <strong>de</strong> unaúnica variable ocupa los contenidos <strong>de</strong> los tres primeros temas. En el tema uno se estudian losconceptos <strong>de</strong> variable aleatoria, discreta y continua, junto con sus distribuciones <strong>de</strong> probabilidad.Se estudian las distribuciones, normal, chi-cuadrado, t-stu<strong>de</strong>nt y F-Sne<strong>de</strong>cor así como los conceptos<strong>de</strong> población y muestra. El tema 2 introduce la estimación por punto y por intervalo. El tema 3aborda el diseño <strong>de</strong> pruebas estadísticas y el contraste <strong>de</strong> hipótesis.Cómo se relaciona una variable con otras ocupa el contenido <strong>de</strong> los temas cuatro a seis. El temacuatro introduce la nomenclatura y conceptos más habituales a manejar en el contexto <strong><strong>de</strong>l</strong> análisis<strong>de</strong> regresión. El tema cinco aborda el análisis <strong>de</strong> regresión a través <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión linealgeneral. Su especificación, estimación y el contraste <strong>de</strong> hipótesis ocupan este tema. El estimador <strong>de</strong>referencia es el estimador <strong>de</strong> Mínimos Cuadrádos Ordinarios. Se estudiaran sus propieda<strong>de</strong>s y cómocompararlo con otros estimadores <strong>de</strong> interés. El último tema muestra cómo analizar si alguna <strong>de</strong> lashipótesis estadísticas <strong>de</strong> comportamiento habituales no se cumplen y cuáles son las consecuencias<strong>de</strong> su incumplimiento para finalizar abordando la predicción <strong>de</strong> la variable <strong>de</strong> interés.A lo largo <strong>de</strong> los temas se va mostrando cómo utilizar un software libre, el programa gretl, especialmenteindicado para el análisis econométrico y que permite un afianzamiento <strong>de</strong> los contenidosteóricos. Por ello, al final <strong>de</strong> los temas tres, cinco y seis se incluye una sección que muestra cómoutilizar este programa en relación a los contenidos vistos. En cada tema se muestran ejemplos queiii


Estadística Actuarial: Análisis <strong>de</strong> Regresiónilustran los diferentes escenarios <strong>de</strong> trabajo así como se recomienda la realización <strong>de</strong> los ejerciciospropuestos. Al término <strong>de</strong> cada tema se muestra la bibliografía correspondiente. Al final <strong><strong>de</strong>l</strong>documento aparece la bibliografía completa.Las notas tienen como objetivo servir <strong>de</strong> apoyo al proceso <strong>de</strong> aprendizaje <strong>de</strong> los estudiantes <strong>de</strong> laasignatura Estadística Actuarial: Regresión <strong><strong>de</strong>l</strong> Grado en Finanzas y Seguros. Sin embargo, dadasu temática básica <strong>de</strong> estadística y análisis <strong>de</strong> regresión pue<strong>de</strong>n ser útiles en asignaturas afines<strong>de</strong> los Grados en Economía, Administración y Dirección <strong>de</strong> Empresas, Marketing y Fiscalidad yAdministración Pública. Así mismo sirven <strong>de</strong> apoyo a estudiantes <strong>de</strong> master por ejemplo el MasterUniversitario en Economía: Instrumentos <strong><strong>de</strong>l</strong> Análisis económico o el Máster Universitario en Bancay Finanzas Cuantitativas.Las competencias específicas <strong>de</strong> la asignatura y la evaluaciónLa asignatura <strong>de</strong> Estadística Actuarial: Regresión es una asignatura <strong>de</strong> 6 créditos ECTS que conlleva60 horas <strong>de</strong> trabajo presencial en el aula y 90 horas <strong>de</strong> trabajo no presencial. La metodología ymodalida<strong>de</strong>s docentes a utilizar están sujetas al criterio <strong><strong>de</strong>l</strong> docente y pue<strong>de</strong>n variar cada cursoacadémico. Hay que tener en cuenta que la organización <strong>de</strong> la metodología docente junto con eldiseño <strong>de</strong> los contenidos <strong>de</strong> los temas <strong><strong>de</strong>l</strong> curso van dirigidos a que los alumnos alcancen las siguientescompetencias específicas <strong>de</strong> la asignatura:1. Conocer distintos procedimientos <strong>de</strong> estimación <strong>de</strong> parámetros, así como sus propieda<strong>de</strong>s parapo<strong>de</strong>r seleccionar a<strong>de</strong>cuadamente la mejor alternativa <strong>de</strong> análisis.2. Aplicar la metodología estadística a<strong>de</strong>cuada para el diseño <strong>de</strong> contrastes <strong>de</strong> hipótesis para latoma <strong>de</strong> <strong>de</strong>cisiones en el ámbito profesional.3. Analizar <strong>de</strong> forma crítica los elementos básicos <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os econométricos para compren<strong>de</strong>rla lógica <strong>de</strong> la mo<strong><strong>de</strong>l</strong>ización econométrica y po<strong>de</strong>r especificar relaciones causales entre variableseconómicas.4. Aplicar la metodología econométrica básica para estimar y validar relaciones económicas enbase a la información estadística disponible sobre variables económicas y utilizando los instrumentosinformáticos apropiados.5. Obtener e interpretar los resultados <strong>de</strong> un análisis estadístico <strong>de</strong> datos económicos haciendouso <strong>de</strong> las fuentes <strong>de</strong> información apropiadas y <strong>de</strong> los instrumentos informáticos necesarios.6. Presentar <strong>de</strong> forma clara y concisa, tanto oralmente como por escrito, las conclusiones obtenidasen un caso <strong>de</strong> estudio particular.El sistema actual <strong>de</strong> docencia <strong>de</strong>ntro <strong><strong>de</strong>l</strong> EEES tiene como ejes fundamentales el proceso <strong>de</strong> enseñanza-aprendizajey la adquisición no sólo <strong>de</strong> conocimientos, sino también, y fundamentalmente,<strong>de</strong> <strong>de</strong>strezas implica directamente la valoración <strong><strong>de</strong>l</strong> trabajo diario <strong><strong>de</strong>l</strong> alumno y su evolución en laadquisición <strong>de</strong> las competencias. La utilización <strong>de</strong> la evaluación continua en la evaluación <strong>de</strong> losalumnos implica la realización, junto con otras pruebas y tareas que el docente crea <strong>de</strong> interés, <strong>de</strong>iv


Estadística Actuarial: Análisis <strong>de</strong> Regresióntest rápidos o <strong>de</strong> preguntas cortas en relación a todo lo visto en las clases, conceptos teóricos yejercicios prácticos incluido el software gretl que permitan evaluar al alumno y saber si han adquiridolos resultados <strong><strong>de</strong>l</strong> aprendizaje alcanzando así las competencias específicas. Parte <strong>de</strong> las pruebastendrán componente <strong>de</strong> sorpresa, es <strong>de</strong>cir sin previo aviso, y parte serán pactadas en cuanto a fecha.Como se indicaba anteriormente estas notas sirven <strong>de</strong> apoyo al estudio. Analizan los problemas enprofundidad y permiten al alumno profundizar en los temas que conforman el contenido <strong><strong>de</strong>l</strong> curso.Así mismo tienen una fuerte vertiente práctica que permitirá al alumno no solo saber sino tambiénsaber hacer. En ningún caso <strong>de</strong>ben utilizarse como sustituto <strong>de</strong> los libros incluidos en la bibliografía.De igual manera se recomienda la realización <strong>de</strong> ejercicios tanto los recomendados en clase como losque aparecen en la bibliografía. La unión <strong><strong>de</strong>l</strong> estudio <strong>de</strong> los conceptos y la utilización <strong>de</strong> los mismosen los ejercicios permite adquirir la agilidad necesaria para el dominio <strong>de</strong> la asignatura y alcanzarlas competencias específicas <strong>de</strong> la misma.Sobre el software gretlA lo largo <strong><strong>de</strong>l</strong> curso se muestra cómo utilizar un software gretl que permite al alumno un afianzamiento<strong>de</strong> los contenidos teóricos <strong><strong>de</strong>l</strong> curso <strong>de</strong> Econometría como la puesta en práctica <strong>de</strong> casosreales con la utilización <strong><strong>de</strong>l</strong> software gretl 1 .gretl es software libre especialmente dirigido hacia la práctica <strong>de</strong> la econometría y la estadística,muy fácil <strong>de</strong> utilizar. Ha sido elaborado por Allin Cottrell (Universidad Wake Forest) y existenversiones en inglés, castellano y euskera, a<strong>de</strong>más <strong>de</strong> en otros idiomas. Junto con el programa sepue<strong>de</strong>n cargar los datos utilizados como ejemplos <strong>de</strong> aplicaciones econométricas en los siguienteslibros <strong>de</strong> texto Davidson y Mackinnon (2004), Greene (2008), Gujarati (1997), Ramanathan (2002),Stock y Watson (2003), Verbeek (2004), Wooldridge (2003). Al instalar gretl automáticamente secargan los datos utilizados en Ramanathan (2002) y Greene (2008). El resto se pue<strong>de</strong>n <strong>de</strong>scargar<strong>de</strong> la página:http: //gretl.sourceforge.net/gretl − data.htmlen la opción textbook datasets. Este curso se estructura sobre casos prácticos presentados en Ramanathan(2002) y en Wooldridge (2003) y ejercicios a resolver con ayuda <strong>de</strong> gretl.También da acceso a bases <strong>de</strong> datos muy amplias, tanto <strong>de</strong> organismos públicos, como el Banco <strong>de</strong>España, como <strong>de</strong> ejemplos recogidos en textos <strong>de</strong> Econometría. En la páginahttp: //gretl.sourceforge.net/gretl − espanol.htmlse encuentra la información en castellano relativa a la instalación y manejo <strong><strong>de</strong>l</strong> programa. Tambiénhay versiones <strong>de</strong> esta ayuda en euskera y en inglés.Una página web interesante sobre las posibilida<strong>de</strong>s <strong><strong>de</strong>l</strong> programa para el aprendizaje <strong>de</strong> Econometríaes:http://www.learneconometrics.com/gretl.html1 Acrónimo <strong>de</strong> Gnu Regression, Econometric and Time Series (Biblioteca Gnu <strong>de</strong> Regresión Econometría y SeriesTemporales)v


viEstadística Actuarial: Análisis <strong>de</strong> Regresión


Contenido0. Introducción 10.1. La naturaleza <strong>de</strong> los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30.2. Clasificación <strong>de</strong> las variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30.3. Representación gráfica <strong>de</strong> las variables . . . . . . . . . . . . . . . . . . . . . . . . . . 50.4. Descripción numérica <strong>de</strong> los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100.5. Tratamiento <strong>de</strong> la información con gretl : inclusión <strong>de</strong> datos en gretl y análisis <strong>de</strong>scriptivobásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120.6. Bibliografía <strong><strong>de</strong>l</strong> tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181. Variables Aleatorias. Población y muestra 191.1. Variables aleatorias y distribuciones <strong>de</strong> probabilidad. Ejemplos . . . . . . . . . . . . 211.1.1. Variables aleatorias discretas y distribuciones <strong>de</strong> probabilidad . . . . . . . . 211.1.2. Variables aleatorias continuas y distribuciones <strong>de</strong> probabilidad . . . . . . . . 221.1.3. Esperanzas y variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . 241.1.4. Dos variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261.1.5. Más <strong>de</strong> dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301.2. La distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 341.2.1. La distribución normal estandarizada . . . . . . . . . . . . . . . . . . . . . . 361.2.2. La distribución chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 391.2.3. La distribución t-Stu<strong>de</strong>nt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391.2.4. La distribución F-Sne<strong>de</strong>cor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401.3. Muestreo <strong>de</strong> una población. Muestras aleatorias . . . . . . . . . . . . . . . . . . . . . 411.4. Estadísticos y distribuciones en el muestreo . . . . . . . . . . . . . . . . . . . . . . . 421.5. La distribución <strong>de</strong> la media muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . 441.6. Bibliografía <strong><strong>de</strong>l</strong> tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45vii


Estadística Actuarial: Análisis <strong>de</strong> Regresión2. Estimación por punto y por intervalo 472.1. Introducción a la inferencia estadística . . . . . . . . . . . . . . . . . . . . . . . . . . 492.2. Estimadores puntuales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 492.2.1. Propieda<strong>de</strong>s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.2.2. Estimadores <strong>de</strong> la media y la varianza . . . . . . . . . . . . . . . . . . . . . . 522.3. Estimación por intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532.3.1. Intervalos <strong>de</strong> confianza y nivel <strong>de</strong> confianza . . . . . . . . . . . . . . . . . . . 542.3.2. Intervalos <strong>de</strong> confianza para la media <strong>de</strong> una población normal con varianzaconocida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542.3.3. Intervalos <strong>de</strong> confianza para la media <strong>de</strong> una población normal con varianza<strong>de</strong>sconocida. La distribución t <strong>de</strong> Stu<strong>de</strong>nt . . . . . . . . . . . . . . . . . . . . 552.3.4. Otros ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 562.4. Bibliografía <strong><strong>de</strong>l</strong> tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603. Contraste <strong>de</strong> hipótesis 613.1. Concepto <strong>de</strong> hipótesis nula e hipótesis alternativa . . . . . . . . . . . . . . . . . . . . 633.2. Tipos <strong>de</strong> error en el contraste y potencia <strong>de</strong> un contraste . . . . . . . . . . . . . . . . 643.3. El p-valor y conclusiones <strong><strong>de</strong>l</strong> contraste . . . . . . . . . . . . . . . . . . . . . . . . . . 653.4. Pasos en la realización <strong>de</strong> un contraste . . . . . . . . . . . . . . . . . . . . . . . . . . 663.5. Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.5.1. Contrastes <strong>de</strong> la media <strong>de</strong> una distribución normal . . . . . . . . . . . . . . . 663.5.2. Otros ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.6. Bibliografía <strong><strong>de</strong>l</strong> tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 714. Mo<strong><strong>de</strong>l</strong>o econométrico: introducción 734.1. Mo<strong><strong>de</strong>l</strong>o económico y mo<strong><strong>de</strong>l</strong>o econométrico . . . . . . . . . . . . . . . . . . . . . . . . 754.2. Etapas en la elaboración <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o econométrico . . . . . . . . . . . . . . . . . . 774.3. Tipología <strong>de</strong> datos y variables en Econometría . . . . . . . . . . . . . . . . . . . . . 784.3.1. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 794.3.2. Fuentes <strong>de</strong> datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 824.4. Bibliografía <strong><strong>de</strong>l</strong> tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845. Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal General 855.1. Especificación <strong><strong>de</strong>l</strong> Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal General (MRLG): supuestos básicos . 88viii


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.1.1. Hipótesis básicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 905.2. Forma funcional. Interpretación <strong>de</strong> los coeficientes. . . . . . . . . . . . . . . . . . . . 935.3. Estimación por Mínimos Cuadrados Ordinarios (MCO) . . . . . . . . . . . . . . . . 1005.3.1. Método <strong>de</strong> estimación <strong>de</strong> Mínimos Cuadrados Ordinarios (MCO) . . . . . . . 1015.3.2. Propieda<strong>de</strong>s <strong>de</strong> la Función <strong>de</strong> Regresión Muestral, FRM . . . . . . . . . . . . 1075.3.3. Medidas <strong>de</strong> bondad <strong><strong>de</strong>l</strong> ajuste . . . . . . . . . . . . . . . . . . . . . . . . . . . 1085.4. Propieda<strong>de</strong>s <strong>de</strong> los estimadores MCO . . . . . . . . . . . . . . . . . . . . . . . . . . . 1125.4.1. Propieda<strong>de</strong>s <strong>de</strong> los estimadores MCO . . . . . . . . . . . . . . . . . . . . . . 1125.4.2. Estimación <strong>de</strong> la varianza <strong>de</strong> las perturbaciones . . . . . . . . . . . . . . . . . 1145.4.3. Consecuencias <strong><strong>de</strong>l</strong> incumplimiento <strong>de</strong> algunos supuestos: colinealidad . . . . . 1165.4.4. Consecuencias <strong><strong>de</strong>l</strong> incumplimiento <strong>de</strong> algunos supuestos: omisión <strong>de</strong> variablesrelevantes e inclusión <strong>de</strong> variables irrelevantes . . . . . . . . . . . . . . . . . . 1205.5. Utilización <strong>de</strong> variables explicativas cualitativas . . . . . . . . . . . . . . . . . . . . . 1225.5.1. Mo<strong><strong>de</strong>l</strong>o que recoge sólo efectos cualitativos: comparando medias. Sólo un conjunto<strong>de</strong> variables ficticias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1235.5.2. Dos o más conjuntos <strong>de</strong> variables ficticias . . . . . . . . . . . . . . . . . . . . 1265.5.3. Inclusión <strong>de</strong> variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . 1275.5.4. Comportamiento estacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1285.5.5. Efectos <strong>de</strong> interacción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1285.6. Distribución <strong><strong>de</strong>l</strong> estimador MCO. Estimación por intervalo . . . . . . . . . . . . . . . 1305.6.1. Distribución <strong><strong>de</strong>l</strong> estimador <strong>de</strong> MCO bajo Normalidad . . . . . . . . . . . . . 1305.6.2. Estimación por intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1305.7. Contraste <strong>de</strong> hipótesis sobre los coeficientes <strong>de</strong> la regresión . . . . . . . . . . . . . . . 1315.7.1. Contraste <strong>de</strong> restricciones sobre los coeficientes <strong>de</strong> regresión individuales . . . 1315.7.2. Contraste <strong>de</strong> restricciones sobre los coeficientes <strong>de</strong> regresión . . . . . . . . . . 1335.7.3. Contrastes basados en sumas <strong>de</strong> cuadrados <strong>de</strong> residuos . . . . . . . . . . . . . 1375.8. Estimación <strong><strong>de</strong>l</strong> MRLG con gretl: principales resultados, contraste <strong>de</strong> hipótesis . . . . 1545.8.1. Tratamiento <strong>de</strong> las variables ficticias en gretl. . . . . . . . . . . . . . . . . . . 1575.9. Apéndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1635.9.1. Anexo 1. Distintas expresiones <strong>de</strong> SCT, SCE y SCR . . . . . . . . . . . . . . 1635.9.2. Anexo 2. Demostración <strong>de</strong> la insesga<strong>de</strong>z <strong>de</strong> ˆσ 2 . . . . . . . . . . . . . . . . . . 1635.9.3. Anexo 3. Distribuciones que nos interesan . . . . . . . . . . . . . . . . . . . . 165ix


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.10. Bibliografía <strong><strong>de</strong>l</strong> tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1666. Validación 1676.1. Forma funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1696.2. Sobre constancia <strong>de</strong> los coeficientes: contraste <strong>de</strong> cambio estructural . . . . . . . . . 1716.3. Sobre las perturbaciones: contrastes <strong>de</strong> heterocedasticidad y ausencia <strong>de</strong> correlación 1726.3.1. Contraste <strong>de</strong> heterocedasticidad . . . . . . . . . . . . . . . . . . . . . . . . . 1726.3.2. Detección gráfica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1766.3.3. Contraste <strong>de</strong> White . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1796.3.4. Contraste <strong>de</strong> ausencia <strong>de</strong> correlación temporal . . . . . . . . . . . . . . . . . 1806.4. Predicción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1886.5. Validación en gretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1916.5.1. Contraste <strong>de</strong> Ramsey con gretl . . . . . . . . . . . . . . . . . . . . . . . . . . 1916.5.2. Contraste <strong>de</strong> cambio estructural o Chow con gretl . . . . . . . . . . . . . . . 1936.5.3. Contraste <strong>de</strong> heterocedasticidad con gretl . . . . . . . . . . . . . . . . . . . . 1966.5.4. Contraste <strong>de</strong> ausencia <strong>de</strong> correlación con gretl . . . . . . . . . . . . . . . . . . 1986.5.5. Predicción en gretl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2026.6. Bibliografía <strong><strong>de</strong>l</strong> tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2047. Guía para el <strong>de</strong>sarrollo <strong>de</strong> un proyecto empírico 2057.1. Características básicas <strong><strong>de</strong>l</strong> proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205Bibliografía 209x


Figuras1. N o <strong>de</strong> aprobados en tres asignaturas <strong>de</strong> la Licenciatura en Economía. . . . . . . . . . 62. Distribución <strong>de</strong> frecuencias <strong><strong>de</strong>l</strong> gasto en sanidad . . . . . . . . . . . . . . . . . . . . 73. Distribución <strong>de</strong> frecuencias relativas y evolución temporal <strong><strong>de</strong>l</strong> la <strong>de</strong>manda doméstica<strong>de</strong> electricidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94. Evolución temporal <strong><strong>de</strong>l</strong> consumo y renta per cápita junto a la nube <strong>de</strong> puntos . . . . 105. Gráficos <strong>de</strong> las observaciones para las variables price y sqft . . . . . . . . . . . . . . 161.1. Distribución normal bivariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.2. Ejemplos <strong>de</strong> función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución normal . . . . . . . . . . . . . . 351.3. Función <strong>de</strong> distribución acumulada <strong>de</strong> la distribución normal . . . . . . . . . . . . . 351.4. Probabilida<strong>de</strong>s correspondientes a Z = 1, 65 y Z = −1, 65 en la distribución normalestándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371.5. Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución Chi-cuadrado . . . . . . . . . . . . . . . . . . 401.6. Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución t-Stu<strong>de</strong>nt . . . . . . . . . . . . . . . . . . . . 401.7. Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución F-Sne<strong>de</strong>cor . . . . . . . . . . . . . . . . . . . 412.1. Sesgo y varianza <strong>de</strong> estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 502.2. Ejemplos <strong>de</strong> distribución <strong>de</strong> estimadores . . . . . . . . . . . . . . . . . . . . . . . . . 515.1. Perturbaciones homocedásticas versus heterocedásticas . . . . . . . . . . . . . . . . . 915.2. Función <strong>de</strong> regresión poblacional y función <strong>de</strong> regresión muestral . . . . . . . . . . . 1016.1. Relaciones económicas no lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1696.2. Perturbaciones homocedásticas versus heterocedásticas . . . . . . . . . . . . . . . . . 1736.3. Residuos MCO versus P OP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1776.4. Residuos MCO versus P OP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1776.5. Residuos MCO y sus cuadrados versus SEN . . . . . . . . . . . . . . . . . . . . . . . 178xi


Estadística Actuarial: Análisis <strong>de</strong> Regresión6.6. Perturbaciones homocedásticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1786.7. Residuos MCO frente a una variable ficticia . . . . . . . . . . . . . . . . . . . . . . . 1796.8. Proceso autorregresivo <strong>de</strong> or<strong>de</strong>n uno . . . . . . . . . . . . . . . . . . . . . . . . . . . 1846.9. Perturbaciones AR(1) positivo versus AR(1) negativo . . . . . . . . . . . . . . . . . 1856.10. Variable endógena versus exógena . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1936.11. Gasto sanitario real y ajustado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1976.12. Residuos MCO versus RENTA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1986.13. Residuos versus tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1996.14. Residuos en t versus residuos en t-1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 2006.15. Variable endógena versus exógena . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2016.16. Residuos mo<strong><strong>de</strong>l</strong>o (6.20) versus tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . 202xii


Tablas1. N o <strong>de</strong> aprobados en tres asignaturas <strong>de</strong> la Licenciatura en Economía. . . . . . . . . . 62. Gasto sanitario por estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63. Distribución <strong>de</strong> frecuencias para el gasto en sanidad . . . . . . . . . . . . . . . . . . 74. Demanda doméstica <strong>de</strong> electricidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85. Distribución <strong>de</strong> frecuencias para la <strong>de</strong>manda doméstica <strong>de</strong> electricidad . . . . . . . . 91.1. Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad conjunta f(x, y) . . . . . . . . . . . . . . . . . 291.2. Distribuciones marginales para X e Y . . . . . . . . . . . . . . . . . . . . . . . . . . 292.1. Datos sobre salario medio por hora . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532.2. Tamaño <strong>de</strong> la ca<strong>de</strong>ra para 50 individuos. . . . . . . . . . . . . . . . . . . . . . . . . . 595.1. Datos <strong>de</strong> características <strong>de</strong> viviendas. Fichero 4-1.gdt. . . . . . . . . . . . . . . . . . 1065.2. observaciones muestrales <strong>de</strong> la prima pagada y renta . . . . . . . . . . . . . . . . . . 1476.1. Observaciones sobre rendimiento y t/i por país . . . . . . . . . . . . . . . . . . . . . 1917.1. Mo<strong><strong>de</strong>l</strong>os estimados para el precio <strong>de</strong> la vivienda P RICE . . . . . . . . . . . . . . . 2087.2. Función <strong>de</strong> Salarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208xiii


Tema 0IntroducciónLa Estadística, la Econometría y muchas otras materias se alimentan <strong>de</strong> datos. En ocasiones elnúmero <strong>de</strong> datos u observaciones recogidas es tan gran<strong>de</strong> que no es fácil obtener unos resultadosinterpretables con claridad. En este tema vamos a <strong>de</strong>dicar las clases a resumir <strong>de</strong> forma clara yprecisa la información que nos transmiten los datos sin ocultar características importantes. No hayuna estrategia correcta para ello en general <strong>de</strong>pen<strong>de</strong> <strong><strong>de</strong>l</strong> tipo <strong>de</strong> datos y <strong><strong>de</strong>l</strong> fin <strong><strong>de</strong>l</strong> estudio. En estetema vamos a introducir gráficos y tablas que resuman la información <strong>de</strong> los datos, por ejemplográficos <strong>de</strong> barra, tarta, gráficos <strong>de</strong> series temporales. Los gráficos, diagramas y tablas pue<strong>de</strong>nmejorar la comunicación <strong>de</strong> los datos a los clientes u proveedores.A lo largo <strong><strong>de</strong>l</strong> tema se han introducido ejemplos ilustrativos <strong>de</strong> los conceptos a apren<strong>de</strong>r.Competencias a trabajar en estas sesiones:5. Obtener e interpretar los resultados <strong>de</strong> un análisis estadístico <strong>de</strong> datos económicos haciendouso <strong>de</strong> las fuentes <strong>de</strong> información apropiadas y <strong>de</strong> los instrumentos informáticos necesarios.Al final <strong>de</strong> este tema <strong>de</strong>beríais ser capaces <strong>de</strong>:1. Representar gráficamente variables.2. Describir numéricamente los datos observados.3. Incluir datos en gretl y obtener su análisis <strong>de</strong>scriptivo básico.Bibliografía Recomendada:Al final <strong><strong>de</strong>l</strong> tema tenéis recogida la bibliografía correspondiente. En particular se os recomienda leerlos capítulos correspondientes a la bibliografía básica <strong>de</strong>tallados a continuación:1


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Gujarati, D. y Porter, D.C. (2010). Apéndice A.• Newbold, P., Carlson, W.L. y Thorne, B. (2008). Cap. 1, Cap. 2 y Cap. 3.• Ramanathan, R. (2002). Cap. 2.• Ruiz Maya, L. y Martín Pliego, F.J. (2005). Cap. 1• Wooldridge, J.M. (2006). Apéndice B.2


Estadística Actuarial: Análisis <strong>de</strong> Regresión0.1. La naturaleza <strong>de</strong> los datosEn la actualidad el individuo tiene a su disposición datos <strong>de</strong> casi todo aquello que <strong>de</strong>see conocer.La Administraciones públicas, los entes privados y los investigadores científicos publican y recogendatos. Es muy importante saber resumir e interpretar la información que proporcionan. Pensemosen el lanzamiento <strong>de</strong> un nuevo producto al mercado. El productor necesitará conocer su nivel <strong>de</strong><strong>de</strong>manda potencial, todos sus posibles compradores. A este conjunto <strong>de</strong> todos sus posibles compradoresse le <strong>de</strong>nomina población. En ocasiones el tamaño <strong>de</strong> la población pue<strong>de</strong> ser muy gran<strong>de</strong> eincluso infinito por lo que <strong>de</strong>bemos limitarnos a estudiar una parte más reducida <strong>de</strong> la misma, que<strong>de</strong>nominamos muestra.La población es el conjunto <strong>de</strong> todos los objetos que interesan al investigador. Al número <strong>de</strong> observacionesu objetos que conforman la población se le <strong>de</strong>nomina tamaño <strong>de</strong> la población y se <strong>de</strong>nota porN. La muestra es un subconjunto observado <strong>de</strong> valores poblacionales. El número <strong>de</strong> observacionesque conforman la muestra se <strong>de</strong>nomina tamaño <strong>de</strong> la muestra y se <strong>de</strong>nota por n.El muestreo aleatorio simple o muestreo aleatorio es el procedimiento que se utiliza para seleccionaruna muestra <strong>de</strong> n observaciones <strong>de</strong> una población en el que cada miembro <strong>de</strong> la población se eligeestrictamente al azar. Cada miembro <strong>de</strong> la población se elige con la misma probabilidad y todas lasmuestras posibles <strong>de</strong> un tamaño dado, n, tienen la misma probabilidad <strong>de</strong> ser seleccionadas.Tomar una muestra y estudiar sus características es un medio para extraer conclusiones sobre lapoblación. Por ejemplo si estamos interesados en conocer la renta media <strong>de</strong> las familias <strong>de</strong> unpaís, el tamaño <strong>de</strong> la población es tan gran<strong>de</strong> que solo podríamos tomar una muestra aleatoria <strong>de</strong>por ejemplo 1000 familias y calcular su renta media. Esta media basada en datos muestrales sellama estadístico. Si pudiéramos calcular la renta media <strong>de</strong> todas las familias la media resultantese llamaría parámetro. En este curso estudiaremos cómo se toman <strong>de</strong>cisiones sobre un parámetrobasándonos en un estadístico. Trabajaremos en un entorno <strong>de</strong> incertidumbre ya que el valor exacto<strong><strong>de</strong>l</strong> parámetro es <strong>de</strong>sconocido. Un parámetro es una característica específica <strong>de</strong> la población. Unestadístico es una característica específica <strong>de</strong> la muestra.Una vez que tenemos <strong>de</strong>finido un problema y recolectados los datos objeto <strong>de</strong> interés, estos seanalizan utilizando métodos estadísticos. La estadística <strong>de</strong>scriptiva y la estadística inferencial permitenconvertir los datos en conocimiento útil para la toma <strong>de</strong> <strong>de</strong>cisiones. La estadística <strong>de</strong>scriptivaestá formada por métodos gráficos y numéricos que permiten resumir y procesar los datosconvirtiéndolos en información. La estadística inferencial permite hacer estimaciones, contraste <strong>de</strong>hipótesis, predicciones y previsiones.Una vez que tenemos recolectados los datos <strong>de</strong>bemos transformarlos en información. Para ellopo<strong>de</strong>mos llevar a cabo un análisis gráfico <strong>de</strong> los mismos y también un análisis <strong>de</strong>scriptivo.0.2. Clasificación <strong>de</strong> las variablesAntes <strong>de</strong> abordar el estudio gráfico y el estudio <strong>de</strong>scriptivo <strong>de</strong> los datos vamos a hablar <strong>de</strong> lasvariables. Una variable es una característica que al ser medida en diferentes individuos es susceptible<strong>de</strong> adoptar diferentes valores. Las variables pue<strong>de</strong>n clasificarse <strong>de</strong> varias formas, por ahora lo haremos3


Estadística Actuarial: Análisis <strong>de</strong> Regresiónen dos. Cuando las clasificamos según el tipo y la cantidad <strong>de</strong> información que contienen po<strong>de</strong>mosdistinguir entre variables categóricas y numéricas. Cuando las clasificamos por nivel <strong>de</strong> mediciónpo<strong>de</strong>mos distinguir entre variables cualitativas y cuantitativas.Una primera clasificación divi<strong>de</strong> los datos en variables categóricas y variables numéricas. Las variablescategóricas son aquellas que generan respuestas que pertenecen a categorías o grupos. Porejemplo ¿tiene coche? ¿utiliza tarjeta <strong>de</strong> crédito? También son variables categóricas las respuesta apreguntas sobre sexo, estado civil, nivel <strong>de</strong> educación y también lo son las respuestas con diferentesgrados <strong>de</strong> intensidad como las que van <strong>de</strong> totalmente <strong>de</strong> acuerdo a totalmente en <strong>de</strong>sacuerdo.Una variable numérica es aquella que toma valores. Una variable numérica discreta pue<strong>de</strong> tenerun número infinito <strong>de</strong> valores, pero en general proviene <strong>de</strong> un proceso <strong>de</strong> recuento, por ejemplonúmero <strong>de</strong> aprobados en Matemáticas II o el número <strong>de</strong> matriculados en una asignatura. Una variablenumérica continua pue<strong>de</strong> tomar cualquier valor en un intervalo dado <strong>de</strong> números reales ynormalmente proviene <strong>de</strong> un proceso <strong>de</strong> medición. Por ejemplo la altura y el peso, la temperatura,el tiempo, la distancia entre dos puntos, etc.También po<strong>de</strong>mos clasificar los datos por su nivel <strong>de</strong> medición en variables cualitativas y cuantitativas.Variables cuantitativas son aquellas que po<strong>de</strong>mos valorar numéricamente. Por ejemplo, larenta disponible <strong>de</strong> una familia, el precio <strong>de</strong> un bien, la renta per cápita. Variables cualitativasson aquellas que mi<strong>de</strong>n cualida<strong>de</strong>s y que por lo tanto no se mi<strong>de</strong>n con un valor numérico y será elinvestigador el que se lo asigne según un criterio. Por ejemplo, si un individuo es hombre o mujer, siestá o no casado, si trabaja en turno <strong>de</strong> noche o no, si tiene estudios superiores o no. En las variablescualitativas es el investigador el que establece el valor <strong>de</strong> la variable para cada característica.Las variables cualitativas pue<strong>de</strong>n tener niveles <strong>de</strong> medición nominales y ordinales mientras que losdatos cuantitativos pue<strong>de</strong>n tener niveles <strong>de</strong> medición basados en intervalos y en razones. Son datosnominales los que respon<strong>de</strong>n a preguntas categóricas, el sexo, el lugar <strong>de</strong> nacimiento, el estado civil.Por ejemplo, la respuesta a la pregunta sexo <strong><strong>de</strong>l</strong> individuo son palabras que <strong>de</strong>scriben la categoría:hombre, mujer y se ha <strong>de</strong> asignarlas un código <strong>de</strong> manera arbitraria, por ejemplo: hombre = 1,mujer = 0, este valor solo se emplea para clasificar a los individuos, la diferencia entre ellos notienen ningún valor. Los datos ordinales indican el or<strong>de</strong>n que ocupa el objeto, por ejemplo en unaencuesta pue<strong>de</strong>n preguntar sobre el grado <strong>de</strong> dificultad <strong>de</strong> un <strong>de</strong>terminado procedimiento y lasrespuestas pue<strong>de</strong>n ser: alto=1, medio=2, bajo=3. Las respuestas siguen un or<strong>de</strong>n, son ordinales,pero la diferencia entre ellas no tiene significado mensurable.Los niveles <strong>de</strong> medición basados en intervalos y razones se refieren a datos en una escala or<strong>de</strong>nadaen los que la diferencia entre las mediciones tiene un significado. Una escala <strong>de</strong> intervalos indica elor<strong>de</strong>n y la distancia con respecto a un cero arbitrario medidos en intervalos unitarios, por ejemploel año es un dato <strong>de</strong> este tipo don<strong>de</strong> el nivel <strong>de</strong> referencia es el calendario gregoriano. Otro ejemplosería la temperatura. Los datos basados en una escala <strong>de</strong> razones indican el or<strong>de</strong>n y la diferenciacon respecto a un cero natural y los cocientes entre dos medidas tienen un significado. Por ejemplouna persona que tiene 90 años tiene el doble <strong>de</strong> años que una persona <strong>de</strong> 45 años. El peso, la alturason variables <strong>de</strong> este tipo.Con respecto a la unidad <strong>de</strong> medida los po<strong>de</strong>mos clasificar en:4


Estadística Actuarial: Análisis <strong>de</strong> Regresión1. Datos <strong>de</strong> serie temporal: Reflejan la evolución <strong>de</strong> una variable a lo largo <strong><strong>de</strong>l</strong> tiempo, según estola variable estará or<strong>de</strong>nada cronológicamente con un or<strong>de</strong>n lógico. Las variables medidas enseries temporales se <strong>de</strong>notan con el subíndice t y este pue<strong>de</strong> referirse a observaciones temporalesmensuales, trimestrales, diarias, cuatrimestrales, anuales, etc. Ejemplo: la <strong>de</strong>manda doméstica<strong>de</strong> electricidad (DDE) <strong><strong>de</strong>l</strong> segundo trimestre <strong>de</strong> 1972 al cuarto trimestre <strong>de</strong> 1993. En este casola población serían todos los posibles valores <strong>de</strong> dicha <strong>de</strong>manda DDE a lo largo <strong><strong>de</strong>l</strong> tiempo yla muestra el período que vamos a estudiar, 1972:2-1993:4, el tamaño <strong>de</strong> la muestra es <strong>de</strong> 87observaciones.2. Datos <strong>de</strong> sección cruzada o corte transversal: Son datos atemporales dado que mi<strong>de</strong>n el comportamiento<strong>de</strong> una variable en diferentes unida<strong>de</strong>s y en el mismo momento <strong><strong>de</strong>l</strong> tiempo.Ejemplo: el salario <strong>de</strong> los trabajadores <strong><strong>de</strong>l</strong> sector <strong>de</strong> educación en las diferentes comunida<strong>de</strong>sautónomas españolas en el año 2011.3. Datos <strong>de</strong> panel: es la unión <strong>de</strong> datos <strong>de</strong> serie temporal y datos <strong>de</strong> sección cruzada. Están fuera<strong><strong>de</strong>l</strong> objetivo <strong><strong>de</strong>l</strong> curso.Hay que notar que una variable pue<strong>de</strong> ser clasificada en varias <strong>de</strong> las categorías anteriores, unavariable cualitativa pue<strong>de</strong> ser categórica nominal u ordinal. Una variable numérica discreta como laedad, variable cuantitativa en su naturaleza pue<strong>de</strong> ser convertida en una variable cualitativa cuandopor ejemplo en el estudio no nos interese más que conocer en que tramo <strong>de</strong> edad se encuentre elindividuo y por ejemplo lo clasifiquemos en menores <strong>de</strong> 25 años, entre 25 y 45 años y mayores <strong>de</strong>45 años. Son tres tramos <strong>de</strong> edad y a cada uno <strong>de</strong> ellos le asignaremos un valor arbitrario. A<strong>de</strong>másserán datos <strong>de</strong> serie temporal o <strong>de</strong> sección cruzada.Una vez recogidos los datos <strong>de</strong> interés y asignados los arbitrarios si es necesario po<strong>de</strong>mos proce<strong>de</strong>ra analizarlos gráficamente.0.3. Representación gráfica <strong>de</strong> las variablesLas variables categóricas suelen representarse utilizando tablas <strong>de</strong> distribución <strong>de</strong> frecuencias y gráficoscomo los <strong>de</strong> barras, <strong>de</strong> Pareto o <strong>de</strong> tarta. Las variables numéricas se <strong>de</strong>scriben por histogramas,ojivas y diagramas <strong>de</strong> tallo y hojas.La distribución <strong>de</strong> frecuencias o tabla <strong>de</strong> frecuencias es una or<strong>de</strong>nación en forma <strong>de</strong> tabla <strong>de</strong> losdatos estadísticos, asignando a cada dato su frecuencia correspondiente. En principio, en la tabla <strong>de</strong>frecuencias se <strong>de</strong>talla cada uno <strong>de</strong> los valores diferentes en el conjunto <strong>de</strong> datos junto con el número<strong>de</strong> veces que aparece, es <strong>de</strong>cir, su frecuencia. Se pue<strong>de</strong> complementar la frecuencia absoluta con la<strong>de</strong>nominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total <strong>de</strong> datos.La tabla <strong>de</strong> frecuencias pue<strong>de</strong> representarse gráficamente en un histograma o diagrama <strong>de</strong> barras.Normalmente en el eje vertical se colocan las frecuencias y en el horizontal los intervalos <strong>de</strong> valores.Ejemplo 0.1La Tabla 1 muestra el número <strong>de</strong> aprobados en tres asignaturas <strong>de</strong> la Licenciatura enEconomía en los cursos 2009-2010 y 2010-2011. Las clases que muestra la tabla son las5


Estadística Actuarial: Análisis <strong>de</strong> Regresiónrespuestas posibles a la variable categórica. La pregunta realizada es ¿Cuántos alumnoshan aprobado la asignatura XX en el curso Y Y ?Asignatura 2009-2010 2010-2011Microeconomía 60 76Estadística para economistas 89 98Econometría 85 105Tabla 1: N o <strong>de</strong> aprobados en tres asignaturas <strong>de</strong> la Licenciatura en Economía.La misma información muestra el gráfico <strong>de</strong> barras recogido en la Figura 1:Figura 1: N o <strong>de</strong> aprobados en tres asignaturas <strong>de</strong> la Licenciatura en Economía.Ejemplo 0.2La Tabla 2 muestra el gasto en sanidad, GS, en billones <strong>de</strong> dólares en el año 1993 paralos 50 estados <strong>de</strong> Estados Unidos junto con Washington DC:Estado GS Estado GS Estado GS Estado GS Estado GSWY 0,998 NH 3,452 MS 6,187 LA 13,014 GA 20,104VT 1,499 HI 3,485 IA 7,341 MN 14,194 NC 18,241DC 4,285 ME 3,433 OR 7,999 MD 15,154 NJ 25,741AK 1,573 NV 3,747 OK 8,041 WI 14,502 MI 27,136ND 2,021 NE 4,400 CT 12,216 TN 16,203 OH 33,456DE 2,260 NM 3,878 CO 10,066 MO 15,949 IL 34,747SD 1,953 WV 5,197 SC 9,029 WA 15,129 PA 41,521MT 2,103 UT 4,118 KY 10,384 IN 16,401 FL 44,811RI 3,428 AR 6,111 AZ 10,635 MA 23,421 TX 49,816ID 2,277 KS 6,903 AL 12,060 VA 16,682 NY 67,033CA 94,178Tabla 2: Gasto sanitario por estado6


Estadística Actuarial: Análisis <strong>de</strong> RegresiónCon los datos se ha construido la Tabla 3 <strong>de</strong> frecuencias. Se han construido cinco intervalospara los posibles valores <strong>de</strong> la variable. Para cada uno <strong>de</strong> ellos se ha calculado supunto medio y el número <strong>de</strong> observaciones que caen <strong>de</strong>ntro <strong><strong>de</strong>l</strong> intervalo y que aparecenen la columna frecuencia. La columna relativa muestra la frecuencia relativa es <strong>de</strong>cir elporcentaje sobre el total <strong>de</strong> observaciones <strong><strong>de</strong>l</strong> número <strong>de</strong> observaciones que caen <strong>de</strong>ntro<strong><strong>de</strong>l</strong> intervalo. La columna acumulada agrega la frecuencia relativa <strong><strong>de</strong>l</strong> intervalo a la <strong><strong>de</strong>l</strong>anterior.Observaciones 1-51, número <strong>de</strong> cajas = 7,media = 15,2649, <strong>de</strong>sv.típ.=17,8877intervalo punto medio frecuencia relativa acumulada< 15,530 7,7650 35 68,63 % 68,63 %15,530 - 31,060 23,295 9 17,65 % 86,27 %31,060 - 46,590 38,825 4 7,84 % 94,12 %46,590 - 62,120 54,355 1 1,96 % 96,08 %62,120 - 77,650 69,885 1 1,96 % 98,04 %77,650 - 93,180 85,415 0 0,00 % 98,04 %>= 93,180 100,94 1 1,96 % 100,00 %Tabla 3: Distribución <strong>de</strong> frecuencias para el gasto en sanidadA partir <strong>de</strong> la tabla <strong>de</strong> frecuencias se pue<strong>de</strong>n dibujar los siguientes gráficos <strong>de</strong> las distribuciones, ala izquierda <strong>de</strong> frecuencia y a la <strong>de</strong>recha <strong>de</strong> frecuencia acumulada:Figura 2: Distribución <strong>de</strong> frecuencias <strong><strong>de</strong>l</strong> gasto en sanidadEl gráfico <strong>de</strong> la izquierda es un histograma cuyos intervalos se correspon<strong>de</strong>n con los <strong>de</strong> la tabla <strong>de</strong>distribución <strong>de</strong> frecuencias. La altura <strong>de</strong> la barra es proporcional al número <strong>de</strong> observaciones <strong><strong>de</strong>l</strong>intervalo. El gráfico <strong>de</strong> la <strong>de</strong>recha es una ojiva, muestra una línea que conecta los puntos que sonel porcentaje acumulado <strong>de</strong> observaciones situadas por <strong>de</strong>bajo <strong><strong>de</strong>l</strong> límite superior <strong>de</strong> cada intervaloen una distribución <strong>de</strong> frecuencias acumuladas.En el histograma encontramos información sobre la muestra. Si la muestra está equilibrada, es <strong>de</strong>cirsi las observaciones se distribuyen <strong>de</strong> forma uniforme a ambos lados <strong><strong>de</strong>l</strong> punto medio, la forma <strong><strong>de</strong>l</strong>7


Estadística Actuarial: Análisis <strong>de</strong> Regresiónhistograma será simétrica. En el ejemplo la muestra claramente no está equilibrada, esta sesgadapositivamente ya que se extien<strong>de</strong> hacia la <strong>de</strong>recha don<strong>de</strong> los valores son positivos. Si se extien<strong>de</strong>hacia los valores negativos se dice que está sesgada negativamente.Gráficas para datos <strong>de</strong> serie temporalEn el caso <strong>de</strong> disponer <strong>de</strong> datos <strong>de</strong> serie temporal a<strong>de</strong>más <strong>de</strong> analizar su distribución <strong>de</strong> frecuenciasnos interesará su evolución temporal.Ejemplo 0.3Se dispone <strong>de</strong> una muestra <strong>de</strong> observaciones sobre la <strong>de</strong>manda doméstica <strong>de</strong> electricidadpara el periodo <strong>de</strong> 1972:2 a 1993:4 en San Diego en millones <strong>de</strong> kilowatios/hora. Lasobservaciones se recogen en la Tabla 4:t DDE t DDE t DDE t DDE t DDE1972:2 586,608 1976:4 860,741 1981:2 883,718 1985:3 1062,046 1989:4 1279,6261972:3 625,797 1977:1 946,673 1981:3 958,449 1985:4 1079,565 1990:1 1485,4531972:4 704,154 1977:2 793,593 1981:4 980,453 1986:1 1137,534 1990:2 1206,4551973:1 817,206 1977:3 820,803 1982:1 1062,744 1986:2 992,370 1990:3 1394,0551973:2 667,642 1977:4 876,286 1982:2 887,136 1986:3 1087,314 1990:4 1336,9791973:3 661,827 1978:1 993,199 1982:3 933,269 1986:4 1107,644 1991:1 1455,1211973:4 732,839 1978:2 842,539 1982:4 978,160 1987:1 1263,671 1991:2 1210,5951974:1 796,876 1978:3 893,369 1983:1 1020,435 1987:2 1054,402 1991:3 1261,0561974:2 655,335 1978:4 998,721 1983:2 917,487 1987:3 1107,669 1991:4 1407,9251974:3 692,599 1979:1 1135,091 1983:3 975,387 1987:4 1214,441 1992:1 1446,2151974:4 768,172 1979:2 901,289 1983:4 998,109 1988:1 1335,147 1992:2 1255,0081975:1 877,881 1979:3 942,471 1984:1 1015,545 1988:2 1122,214 1992:3 1504,5111975:2 722,124 1979:4 1024,852 1984:2 919,639 1988:3 1238,305 1992:4 1405,3361975:3 697,671 1980:1 1068,690 1984:3 1040,188 1988:4 1233,677 1993:1 1512,3061975:4 804,178 1980:2 914,884 1984:4 1082,732 1989:1 1432,962 1993:2 1241,3451976:1 880,008 1980:3 930,812 1985:1 1164,663 1989:2 1156,211 1993:3 1405,0361976:2 763,618 1980:4 969,382 1985:2 945,277 1989:3 1276,944 1993:4 1392,1831976:3 790,428 1981:1 1028,968Tabla 4: Demanda doméstica <strong>de</strong> electricidadLa distribución <strong>de</strong> frecuencias correspondiente se muestra en la Tabla 5.8


Estadística Actuarial: Análisis <strong>de</strong> RegresiónObservaciones 1-87, número <strong>de</strong> cajas = 9,media = 1035,08, <strong>de</strong>sv.típ.=233,605intervalo punto medio frecuencia relativa acumulada< 644,46 586,61 2 2,30 % 2,30 %644,46 - 760,18 702,32 8 9,20 % 11,49 %760,18 - 875,89 818,03 10 11,49 % 22,99 %875,89 - 991,60 933,74 20 22,99 % 45,98 %991,60 - 1107,3 1049,5 16 18,39 % 64,37 %1107,3 - 1223,0 1165,2 10 11,49 % 75,86 %1223,0 - 1338,7 1280,9 10 11,49 % 87,36 %1338,7 - 1454,4 1396,6 7 8,05 % 95,40 %>= 1454,4 1512,3 4 4,60 % 100,00 %Tabla 5: Distribución <strong>de</strong> frecuencias para la <strong>de</strong>manda doméstica <strong>de</strong> electricidadA continuación se muestra la gráfica <strong>de</strong> la distribución <strong>de</strong> frecuencias relativas, a laizquierda, y a la <strong>de</strong>recha la evolución temporal <strong>de</strong> la variable. El gráfico <strong>de</strong> frecuenciasmuestra una distribución mo<strong>de</strong>radamente asimétrica positiva. El gráfico <strong>de</strong> serie temporalmostrado a la <strong>de</strong>recha indica una ten<strong>de</strong>ncia creciente en la variable y un patrón<strong>de</strong> comportamiento anual que se repite.0,25160015000,214001300Frecuencia relativa0,150,1DDE1200110010009000,058007000600 800 1000 1200 1400 1600DDE6005001975 1980 1985 1990Figura 3: Distribución <strong>de</strong> frecuencias relativas y evolución temporal <strong><strong>de</strong>l</strong> la <strong>de</strong>manda doméstica <strong>de</strong>electricidadGráficas para <strong>de</strong>scribir relaciones entre variablesEn muchas ocasiones los estudios se centran en las relaciones entre dos variables. En este caso lagráfica <strong>de</strong> la nube <strong>de</strong> puntos informa tanto <strong><strong>de</strong>l</strong> rango como <strong>de</strong> la relación entre las variables. Elgráfico muestra la nube <strong>de</strong> puntos o pares <strong>de</strong> observaciones <strong>de</strong> las variables.Por ejemplo po<strong>de</strong>mos estudiar la relación entre el salario <strong>de</strong> un individuo y su antigüedad en laempresa, la <strong>de</strong>pen<strong>de</strong>ncia <strong><strong>de</strong>l</strong> precio <strong>de</strong> una vivienda con respecto a la superficie da la misma, larelación entre consumo y renta, etc. En todos estos ejemplos una variable <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la otra, elconsumo <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la renta, el salario <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la antigüedad en el puesto, el precio <strong>de</strong>pen<strong>de</strong><strong>de</strong> la superficie <strong>de</strong> la vivienda. A las variables consumo, precio <strong>de</strong> la vivienda y salario se les llama9


Estadística Actuarial: Análisis <strong>de</strong> Regresiónvariables <strong>de</strong>pendientes porque <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la renta, la superficie <strong>de</strong> la vivienda y la antigüedadmientras que estas se <strong>de</strong>nominan variables in<strong>de</strong>pendientes ya que no <strong>de</strong>pen<strong>de</strong>n <strong>de</strong> otra. La variablein<strong>de</strong>pendiente (<strong>de</strong>notada habitualmente por X) se muestra en el eje <strong>de</strong> abscisas mientras que lavariable <strong>de</strong>pendiente (<strong>de</strong>notada habitualmente por Y) se muestra en el eje <strong>de</strong> or<strong>de</strong>nadas.Ejemplo 0.4Supongamos que disponemos datos sobre consumo per cápita y renta per cápita endólares <strong>de</strong> 1987 para Estados Unidos en el periodo <strong>de</strong> 1970-1991. En el gráfico <strong>de</strong> laizquierda se muestra la evolución temporal <strong>de</strong> ambas variables. A la <strong>de</strong>recha se muestrala nube <strong>de</strong> puntos <strong>de</strong> ambas variables. La muestra consta <strong>de</strong> 22 observaciones luegola nube está constituida por 22 puntos, para cada año un punto recoge el valor <strong>de</strong> lavariable consumo y el valor <strong>de</strong> la variable renta (P P CE t , P DP I t ).150001400013000PPCEPDPI13500130001250012000PPCE con respecto a PDPI (con ajuste mínimo−cuadrático)Y = −1,22e+003 + 1,01X1200011000100009000PPCE115001100010500100009500900080001970 1975 1980 1985 1990850010000 10500 11000 11500 12000 12500 13000 13500 14000PDPIFigura 4: Evolución temporal <strong><strong>de</strong>l</strong> consumo y renta per cápita junto a la nube <strong>de</strong> puntosEl gráfico <strong>de</strong> serie temporal muestra que ambas variables evolucionan <strong>de</strong> forma parejay son crecientes con t. La nube <strong>de</strong> puntos muestra la misma relación creciente y linealentre las variables. La recta que aparece en la nube <strong>de</strong> puntos muestra esta relaciónlineal. A esta recta se le llama función <strong>de</strong> regresión muestral y nos ocuparemos <strong>de</strong> ellaen el tema 5.0.4. Descripción numérica <strong>de</strong> los datosEn la sección anterior se han <strong>de</strong>scrito los datos <strong>de</strong> una muestra gráficamente. En esta sección vamosa <strong>de</strong>scribirlos numéricamente con medidas <strong>de</strong> ten<strong>de</strong>ncia central, medidas <strong>de</strong> variabilidad y medidas<strong><strong>de</strong>l</strong> sentido y <strong><strong>de</strong>l</strong> grado <strong>de</strong> relación entre dos variables.Medidas <strong>de</strong> la ten<strong>de</strong>ncia central: Las medidas <strong>de</strong> ten<strong>de</strong>ncia central dan información numéricasobre una observación “típica”<strong>de</strong> los datos.• Media aritmética o media muestral: La media aritmética <strong>de</strong> un conjunto <strong>de</strong> datos es la suma <strong><strong>de</strong>l</strong>os valores <strong>de</strong> los datos dividida por el número <strong>de</strong> observaciones.¯X =∑ n1 X in= X 1 + X 2 + . . . + X nn10


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Mediana: es la observación que ocupa el lugar central <strong>de</strong> un conjunto <strong>de</strong> observaciones or<strong>de</strong>nadasen sentido ascen<strong>de</strong>nte o <strong>de</strong>scen<strong>de</strong>nte. Si el tamaño <strong>de</strong> muestra n es impar la mediana es el valor quese encuentra en medio. Si el tamaño muestral es par la mediana es la media <strong>de</strong> las dos observacionesque se encuentran en el medio. La mediana se encuentra en la posición 0, 50(n + 1).• Moda, es el valor que aparece con más frecuencia. Pue<strong>de</strong> no existir.¿Cuál <strong>de</strong> las tres es la mejor medida para <strong>de</strong>scribir la ten<strong>de</strong>ncia central <strong>de</strong> los datos, la media,la mediana o la moda? Depen<strong>de</strong> <strong>de</strong> los datos. Si los datos son numéricos en general será útil lamedia, pero si son categóricos será más útil la mediana o la moda. Por ejemplo imaginemos quetenemos cinco individuos dos hombres y tres mujeres y que el investigador asocia el valor 1 a loshombres y el valor cero a las mujeres. La media muestral <strong>de</strong> la variable“sexo” es 2/5 lo que notine sentido, sin embargo la moda es el valor 0 que indica que hay más mujeres que hombres en lamuestra. Imaginemos que la variable objeto <strong>de</strong> estudio es la renta. La media se verá incrementadapor aquellos valores muy altos y no <strong>de</strong>scribirá bien la variable sin embargo la mediana es el nivel<strong>de</strong> renta por encima <strong><strong>de</strong>l</strong> cual están la mitad <strong>de</strong> los hogares <strong>de</strong> la muestra.Medidas <strong>de</strong> la variabilidad: Junto a la media es necesario presentar estadísticos <strong>de</strong>scriptivos quemidan la variabilidad o dispersión <strong>de</strong> los datos u observaciones con respecto a la media.• Rango: es la diferencia entre los valores mayor y menor <strong>de</strong> la muestra.• Varianza muestral: la varianza muestral es la suma <strong>de</strong> los cuadrados <strong>de</strong> las diferencias entre cadaobservación y la media muestral dividida por el tamaño <strong>de</strong> la muestra menos 1:S 2 =∑ n1 (X i − ¯X) 2n − 1• Desviación típica muestral: Es la raíz <strong>de</strong> la varianza muestral:√ ∑n1 (X i − ¯X) 2S = √ S 2 =n − 1• Coeficiente <strong>de</strong> variación: es una medida <strong>de</strong> la dispersión relativa que expresa la <strong>de</strong>sviación típicaen porcentaje <strong>de</strong> la media (siempre que esta sea positiva). El coeficiente <strong>de</strong> variación muestral se<strong>de</strong>fine:CV = S¯X × 100 % si ¯X > 0Medidas <strong>de</strong> las relaciones entre las variables• Covarianza: es una medida <strong>de</strong> la relación entre dos variables. Un valor positivo indica una relaciónlineal directa o creciente y un valor negativo una relación lineal inversa o <strong>de</strong>creciente. La covarianzamuestral se <strong>de</strong>fine:∑ n1Cov(X, Y ) = S XY =(X i − ¯X)(Y j − Ȳ )n − 1don<strong>de</strong> X i e Y j son los valores observados <strong>de</strong> las variables X e Y , ¯X e Ȳ son, respectivamente,sus medias muestrales y n es el tamaño <strong>de</strong> muestra. El coeficiente <strong>de</strong> correlación da una medidaestandarizada <strong>de</strong> la relación lineal entre dos variables. Indica el sentido y el grado <strong>de</strong> la relación.11


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Coeficiente <strong>de</strong> correlación: es el cociente entre la covarianza y el producto <strong>de</strong> las <strong>de</strong>sviacionestípicas entre las variables:r XY = Cov(X, Y )S X S YEl coeficiente <strong>de</strong> correlación está comprendido entre −1 y 1, −1 ≤ r XY ≤ 1. Cuanto más cercase encuentra <strong>de</strong> 1 más cerca se encuentran los datos <strong>de</strong> puntos <strong>de</strong> una línea recta ascen<strong>de</strong>nte queindica una relación lineal positiva. Cuanto más cerca <strong>de</strong> −1 más cerca se encuentran los datos <strong>de</strong>puntos <strong>de</strong> una línea recta <strong>de</strong>scen<strong>de</strong>nte que indica una relación lineal negativa. Cuando r = 0 noexiste ninguna relación lineal entre las variables.0.5. Tratamiento <strong>de</strong> la información con gretl : inclusión <strong>de</strong> datos engretl y análisis <strong>de</strong>scriptivo básicogretl es un programa que permite obtener <strong>de</strong> manera sencilla mediante ventana resultados estadísticosy econométricos. Una vez ejecutado el programa gretl en la ventana principal aparece un menú <strong>de</strong>ventanas que nos permite diferentes posibilida<strong>de</strong>s. En la pantalla principal, una vez abierto gretlnos aparecen las siguientes pestañas:Archivo Herramientas Datos Ver Añadir Muestra Variable Mo<strong><strong>de</strong>l</strong>o AyudaPero solo tres <strong>de</strong> ellas están activas, las distinguimos porque las no activas aparecen en gris mientrasque las activas están en negrita. Las activas son Archivo, Herramientas y Ayuda. En la primeraleemos datos. Empezaremos viendo como leer datos. Dependiendo <strong><strong>de</strong>l</strong> origen <strong>de</strong> éstos si están enuna archivo <strong>de</strong> muestra incluido en gretl , si están disponibles en papel, en la web o en un archivopropio proce<strong>de</strong>remos <strong>de</strong> una manera u otra.• Para leer datos incluidos en la base <strong><strong>de</strong>l</strong> programa gretl :Pinchar Archivo → Abrir archivo <strong>de</strong> datos → Archivo <strong>de</strong> muestra → Aquí seleccionamos la base<strong>de</strong> datos que necesitemos, por ejemplo ETM → y ahora seleccionamos el archivo, por ejemplomonthly-crsp.gdtAparecerán las variables <strong>de</strong> la muestra y en la barra superior se habrán activado las etiquetas mencionadasanteriormente. Por ejemplo en Datos podremos ver las observaciones y sus características.Algunas <strong>de</strong> las opciones que contiene la etiqueta Datos son las siguientes:Mostrar valoresEditar los valoresInformación <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> datosEstructura <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> datosPara obtener lo que necesitamos sólo tenemos que pinchar la etiqueta correspondiente y la variableo variables a estudiar. Por ejemplo para ver la estructura <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> datos pinchamos enesta etiqueta y obtendremos una pantalla en la que aparecerá seleccionado el tipo <strong>de</strong> datos con elque estamos trabajando, en este caso Serie temporal. Pinchamos a<strong><strong>de</strong>l</strong>ante y veremos la frecuencia,mensual, y el inicio y final <strong>de</strong> la muestra 1968:1 a 1998:12. La etiqueta estructura <strong><strong>de</strong>l</strong> conjunto12


Estadística Actuarial: Análisis <strong>de</strong> Regresión<strong>de</strong> datos es muy útil cuando necesitamos cambiar alguno <strong>de</strong> ellos por ejemplo si añadimos nuevasobservaciones.En el menú inicial aparece también la etiqueta Ver con, entre otras, las siguientes opciones:GráficosGráficos múltiplesEstadísticos principalesMatriz <strong>de</strong> correlación• Para hacer Gráficos:Pinchar Ver → Gráficos → Gráficos <strong>de</strong> series temporales. Seleccionar las variables que se quierenincluir en el gráfico y pinchar Aceptar.Para guardar el gráfico: situar el ratón sobre el gráfico y pinchar con el botón <strong>de</strong>recho. Elegir opción.Po<strong>de</strong>mos guardarlos en postcript (.eps) o .png, etc. En la ventana que aparece para guardarloescribir la dirección <strong>de</strong> la carpeta don<strong>de</strong> queremos guardar el gráfico y ponerle un nombre porejemplo CRSPVW.Dentro <strong>de</strong> las opciones que aparecen al pinchar con el botón <strong>de</strong>recho está la opción Editar. En estaopción se pue<strong>de</strong>n modificar los ejes, los nombres <strong>de</strong> las variables, incluso el tipo <strong>de</strong> línea y colorutilizada para representar la serie <strong>de</strong> observaciones, entre otras posibilida<strong>de</strong>s.• Para obtener los Estadísticos principales <strong>de</strong> las variables <strong>de</strong> la muestra:Pinchar en Ver → Estadísticos principales.La ventana <strong>de</strong> output mostrará la media, moda, valor máximo y mínimo <strong>de</strong> la serie, <strong>de</strong>sviacióntípica, coeficiente <strong>de</strong> variación, curtosis y asimetría. Po<strong>de</strong>mos obtener los estadísticos para unaúnica serie o para el conjunto <strong>de</strong> ellas seleccionándolo previamente.Si queremos guardar el output pinchamos en el icono <strong><strong>de</strong>l</strong> diskette arriba a la izquierda y seleccionamoscómo queremos que lo guar<strong>de</strong>, texto plano, Word o Latex y en la ventana damos el nombre que<strong>de</strong>seemos al fichero <strong>de</strong> resultados, por ejemplo estadVW para la serie CRSP o estadmuestra parael conjunto y a continuación damos la dirección <strong>de</strong> la carpeta don<strong>de</strong> queremos que nos guar<strong>de</strong> elfichero <strong>de</strong> resultados.En el menú inicial también aparece la etiqueta Variable para trabajar con una única serie <strong>de</strong> lamuestra. Algunas <strong>de</strong> las opciones que incluye esta etiqueta son:BuscarMostrar valoresEstadísticos principalesContraste <strong>de</strong> NormalidadDistribución <strong>de</strong> frecuenciasGráfico <strong>de</strong> frecuencias (simple, contra la normal, contra la gamma)Gráfico <strong>de</strong> series temporalesEditar atributosetc.13


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Obtener datos que están en el servidor:Queremos estudiar una serie que se encuentra en el servidor, Crédito más <strong>de</strong> 5 años a hogares. Estaserie aparece publicada en la base <strong>de</strong> datos <strong><strong>de</strong>l</strong> Banco <strong>de</strong> España con el código BE182704.Pinchar Archivo → Bases <strong>de</strong> datos → Sobre servidorEn el listado <strong>de</strong> bases <strong>de</strong> datos que aparece vamos a b<strong>de</strong>18 Banco <strong>de</strong> España (Tipo <strong>de</strong> interés)y pinchamos en Obtener listado <strong>de</strong> series comprobando que contienen la serie que queremos.Series → MostrarPara representarla gráficamente: Series → RepresentarPara importar los datos a gretl situamos el cursor sobre la serie <strong>de</strong> interés, BE182704, y vamos aSeries → ImportarA<strong>de</strong>más tenemos opción <strong>de</strong> hacer lo siguiente:• Añadir o cambiar información sobre la variable: en menú Variable → Editar atributos. En estaventana podremos cambiar también el nombre <strong>de</strong> la serie utilizado en los gráficos.• Añadir notas explicativas: en menú Datos → Editar información• Consultar las notas informativas: en menú Datos → Leer información o en Datos → Descripción• Para crear un conjunto <strong>de</strong> datos:Pinchar Archivo → Nuevo conjunto <strong>de</strong> datos y completar la información que pi<strong>de</strong> sobre:número <strong>de</strong> observacionesestructura <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> datos (serie temporal o sección cruzada)frecuenciaA la pregunta ¿Desea empezar a introducir los valores <strong>de</strong> los datos usando la hoja <strong>de</strong> cálculo <strong>de</strong>gretl ? contestar Sí• Introducir el nombre <strong>de</strong> la variable. El máximo <strong>de</strong> caracteres que acepta es 15, no usar acentosni la letra ñ. Pinchar Aceptar.• En la hoja <strong>de</strong> cálculo situarnos en la primera celda y teclear la observación correspondiente,a continuación pinchar intro. Si nos saltamos alguna observación po<strong>de</strong>mos insertar una fila enel lugar correspondiente con solo situarnos en la celda posterior e ir a observación → insertarobs. Una vez introducidas todas las variables pinchar Aplicar.• Para guardar los datos: en menú Archivo → Guardar datos. Dar nombre al conjunto <strong>de</strong> datos,por ejemplo Azar y se grabará automáticamente con la extensión gdt.Si en otro momento queremos usar este conjunto <strong>de</strong> datos solo habrá que clickear en él dosveces para que se active.14


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Si queremos añadir variables en menú: Pinchar en la etiqueta Añadir tenemos las siguientesposibilida<strong>de</strong>s:• Logaritmos <strong>de</strong> las variables seleccionadas• Cuadrados <strong>de</strong> las variables seleccionadas• Retardos <strong>de</strong> las variables seleccionadas• Primeras diferencias <strong>de</strong> las variables seleccionadas• Diferencias <strong><strong>de</strong>l</strong> logaritmo las variables seleccionadas• Diferencias estacionales <strong>de</strong> las variables seleccionadas• Variable índice• Ten<strong>de</strong>ncia temporal• Variable aleatoria (uniforme, normal, chi cuadrado y t-Stu<strong>de</strong>nt) Por ejemplo para crearuna variable normal <strong>de</strong> media 0 y <strong>de</strong>sviación 1 haremos nombre <strong>de</strong> la variable 0 1• Variables ficticias, etc.• Definir una nueva variable. Esta opción po<strong>de</strong>mos utilizarla para crear combinaciones <strong>de</strong>variables por ejemplo Z t = 4 + ɛ t ɛ t ∼ N(0, 1). Permite los operadores,+, -, *, /, ^(suma, resta, producto, potencia) entre otros.• Para obtener información sobre la muestra pinchar en la etiqueta Muestra. En ellaencontraremos, entre otras, las siguientes opciones:Establecer rangoRecuperar rango completoRestringir, a partir <strong>de</strong> un criterioetc.Ejemplo 0.1Vamos a trabajar con el archivo <strong>de</strong> datos data4 − 1.gdt ya que en los temas siguientesva a ser uno <strong>de</strong> los ejemplos que seguiremos. Está incluido como archivo <strong>de</strong> muestraen la pestaña Ramanathan. Una vez abierto po<strong>de</strong>mos buscar información sobre susvariables tal y como se ha indicado. Siguiendo la ruta indicada encontramos la siguienteInformación <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> datosDATA4-1: Data on single family homes in University City communityof San Diego, in 1990.price = sale price in thousands of dollars (Range 199.9 - 505)sqft = square feet of living area (Range 1065 - 3000)bedrms = number of bedrooms (Range 3 - 4)baths = number of bathrooms (Range 1.75 - 3)15


Estadística Actuarial: Análisis <strong>de</strong> RegresiónDon<strong>de</strong> aparece una somera <strong>de</strong>scripción <strong>de</strong> los datos disponibles y su fuente y/o origen.En este caso nos dicen que son datos <strong>de</strong> hogares <strong>de</strong> la comunidad universitaria <strong>de</strong> SanDiego en 1990, <strong>de</strong> lo que <strong>de</strong>ducimos que son datos <strong>de</strong> sección cruzada ya que se refierena un único año. También aparecen los nombres <strong>de</strong> las variables y su <strong>de</strong>scripción así comoel rango <strong>de</strong> cada una (la amplitud <strong><strong>de</strong>l</strong> intervalo <strong>de</strong> valores que toma la variable en lamuestra) y la fuente <strong>de</strong> los datos. Los estadísticos principales son los siguientes:Estadísticos principales, usando las observaciones 1 - 14Variable Media Mediana Mínimo Máximoprice 317,493 291,500 199,900 505,000sqft 1910,93 1835,00 1065,00 3000,00bedrms 3,64286 4,00000 3,00000 4,00000baths 2,35714 2,25000 1,75000 3,00000Variable Desv. Típ. C.V. Asimetría Exc. <strong>de</strong> curtosisprice 88,4982 0,278741 0,653457 −0,529833sqft 577,757 0,302344 0,485258 −0,672125bedrms 0,497245 0,136499 −0,596285 −1,64444baths 0,446291 0,189336 0,331609 −1,39015Don<strong>de</strong> se nos muestra, para cada variable, su media, mediana, valores mínimo y máximo, <strong>de</strong>sviacióntípica, coeficiente <strong>de</strong> variación (C.V.), coeficiente <strong>de</strong> asimetría y coeficiente <strong>de</strong> exceso <strong>de</strong> curtosis.Los gráficos <strong>de</strong> las variables price y sqft son:55030005002800450260024004002200price350sqft200030018002501600140020012001502 4 6 8 10 12 14in<strong>de</strong>x10002 4 6 8 10 12 14in<strong>de</strong>xFigura 5: Gráficos <strong>de</strong> las observaciones para las variables price y sqftVolviendo a la pantalla <strong>de</strong> inicio. También estaban disponibles al iniciar el programa las etiquetasHerramientas y Ayuda. En Herramientas disponemos <strong>de</strong> instrumentos <strong>de</strong> análisis muy útiles como:- En Tablas estadísticas los valores críticos <strong>de</strong> las distribuciones Normal Tipificada, t-Stu<strong>de</strong>nty F-Sne<strong>de</strong>cor entre otras distribuciones.16


Estadística Actuarial: Análisis <strong>de</strong> Regresión- Un buscador <strong>de</strong> valores p.- Un calculadora <strong>de</strong> estadísticos <strong>de</strong> contraste como la igualdad <strong>de</strong> medias o varianzas.- La posibilidad <strong>de</strong> dibujar distribuciones o curvas.- Hacer contrastes no paramétricos.- Generar numeros aleatorios.En Ayuda encontramos al Guía <strong><strong>de</strong>l</strong> usuario y la Guía <strong>de</strong> instrucciones.17


Estadística Actuarial: Análisis <strong>de</strong> Regresión0.6. Bibliografía <strong><strong>de</strong>l</strong> temaReferencias bibliográficas básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editorial AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. Open Course Ware. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[2] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[3] Esteban, M.V. (2007). Estadística Actuarial y Análisis <strong>de</strong> Regresión. <strong>Material</strong> docente. Servicio<strong>de</strong> Publicaciones.[4] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08. Publicaciónon-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[5] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[6] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[7] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[8] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[9] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.18


Tema 1Variables Aleatorias. Población y muestraEn las clases <strong><strong>de</strong>l</strong> tema <strong>de</strong> Variables Aleatorias vamos a revisar y/o introducir los principales conceptos<strong>de</strong> probabilidad. Comenzaremos <strong>de</strong>finiendo el concepto <strong>de</strong> variable aleatoria discreta y continuaasí como sus funciones <strong>de</strong> distribución <strong>de</strong> probabilidad. Revisaremos las propieda<strong>de</strong>s <strong>de</strong> las funciones<strong>de</strong> distribución <strong>de</strong> probabilidad prestando especial atención al concepto <strong>de</strong> valor esperado y al concepto<strong>de</strong> varianza. En general, no estudiaremos el comportamiento <strong>de</strong> una única variable por lo quenecesitaremos introducir el concepto <strong>de</strong> distribución <strong>de</strong> probabilidad conjunta, probabilidad condicionadae in<strong>de</strong>pen<strong>de</strong>ncia estadística. Dentro <strong>de</strong> las muchas distribuciones <strong>de</strong> probabilidad específicas<strong>de</strong> que disponemos mostraremos las principales funciones <strong>de</strong> distribución <strong>de</strong> probabilidad utilizadasen Econometría: la normal, la normal estándar, la chi-cuadrado, la t-Stu<strong>de</strong>nt y la F-Sne<strong>de</strong>cor.Los métodos estadísticos centran la atención en la realización <strong>de</strong> inferencias sobre gran<strong>de</strong>s poblaciones<strong>de</strong> objetos utilizando una pequeña muestra <strong>de</strong> los mismos. Por ello para finalizar el temaintroduciremos el concepto <strong>de</strong> muestreo aleatorio, estadísticos muestrales y distribuciones en elmuestreo para finalizar mostrando la distribución <strong><strong>de</strong>l</strong> estadístico media muestral.A lo largo <strong><strong>de</strong>l</strong> tema se han introducido ejemplos ilustrativos <strong>de</strong> los conceptos a apren<strong>de</strong>r así comoejercicios básicos que han <strong>de</strong> ser resueltos por el alumno.Competencias a trabajar en estas sesiones:5. Obtener e interpretar los resultados <strong>de</strong> un análisis estadístico <strong>de</strong> datos económicos haciendouso <strong>de</strong> las fuentes <strong>de</strong> información apropiadas y <strong>de</strong> los instrumentos informáticos necesarios.Al final <strong>de</strong> este tema <strong>de</strong>beríais ser capaces <strong>de</strong>:1. Explicar la diferencia entre una variable aleatoria discreta y una variable aleatoria continuaproporcionando ejemplos <strong>de</strong> cada una <strong>de</strong> ellas.2. Explicar la diferencia entre la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad <strong>de</strong> una variable aleatoriadiscreta y a función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad <strong>de</strong> una variable aleatoria continua.19


Estadística Actuarial: Análisis <strong>de</strong> Regresión3. Explicar el concepto <strong>de</strong> media o valor esperado <strong>de</strong> una variable aleatoria.4. Calcular la media y varianza <strong>de</strong> funciones <strong>de</strong> variables aleatorias.5. Calcular probabilida<strong>de</strong>s utilizando la distribución normal.6. Definir los principales estadísticos muestrales.7. Obtener la distribución <strong>de</strong> la media muestral.Bibliografía Recomendada:Al final <strong><strong>de</strong>l</strong> tema tenéis recogida la bibliografía correspondiente. En particular se os recomienda leerlos capítulos correspondientes a la bibliografía básica <strong>de</strong>tallados a continuación:• Gujarati, D. y Porter, D.C. (2010). Apéndice A.• Newbold, P., Carlson, W.L. y Thorne, B. (2008). Cap. 5 sec. 5.1; 5.2; 5.3 y 5.7; Cap. 6 salvola sec. 6.5 y Cap. 7 sec. 7.1 y 7.2.• Ramanathan, R. (2002). Cap. 2.• Ruiz Maya, L. y Martín Pliego, F.J. (2005). Cap. 1• Wooldridge, J.M. (2006). Apéndice B.20


Estadística Actuarial: Análisis <strong>de</strong> Regresión1.1. Variables aleatorias y distribuciones <strong>de</strong> probabilidad. EjemplosUna variable aleatoria es una variable que toma valores numéricos <strong>de</strong>terminados por el azar.Des<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> la notación es importante distinguir entre una variable aleatoria y losvalores posibles que ésta pue<strong>de</strong> tomar. Denotamos en mayúscula, X a la variable aleatoria y con sucorrespondiente minúscula un valor posible <strong>de</strong> la misma.Ejemplo 1.1Se mi<strong>de</strong> la altura <strong>de</strong> un individuo y el peso corporal, dos variables aleatorias son, X =altura, Y = peso y sus valores posibles por ejemplo serían: x = 156 cm, x = 179 cm, . . .;y = 60 kg, y = 87 kg, . . .Ejemplo 1.2Consi<strong>de</strong>remos el lanzamiento <strong>de</strong> un dado. Sea el espacio muestral Ω = {1, 2, 3, 4, 5, 6} lavariable X = N o <strong>de</strong> puntos, pue<strong>de</strong> tomar los valores: x = {1, 2, 3, 4, 5, 6} cada uno conprobabilidad P (x = 1) = P (x = 2) = . . . = P (x = 6) = 1 6 .Hay que distinguir entre variables aleatorias discretas y variables aleatorias continuas.Una variable aleatoria es discreta si no pue<strong>de</strong> tomar más que una cantidad numerable <strong>de</strong> valores.El conjunto <strong>de</strong> realizaciones es finito o infinito pero numerable. Por ejemplo el número <strong>de</strong> hijos <strong>de</strong>una familia, el número <strong>de</strong> clientes <strong>de</strong> un bar en un día, el número <strong>de</strong> veces que sale cara al lanzardiez veces una moneda al aire. En el Ejemplo 1.2 X es una variable discreta.Una variable aleatoria es continua si pue<strong>de</strong> tomar cualquier valor <strong>de</strong> un intervalo. El conjunto<strong>de</strong> realizaciones es infinitamente divisible y por tanto no numerable. Por ejemplo la renta anual <strong>de</strong>una familia, la temperatura, la variación en el precio <strong>de</strong> las acciones ordinarias <strong>de</strong> IBM en un día.En el Ejemplo 1.1 las variables peso y altura son variables continuas.En la práctica se consi<strong>de</strong>ran variables discretas cuando tiene sentido asignar probabilida<strong>de</strong>s a losresultados individuales posibles. La contabilidad <strong>de</strong> los sucesos genera observaciones <strong>de</strong> variablesaleatorias discretas mientras que mediciones como tiempo, renta, generan observaciones sobre variablesaleatorias continuas. Muchos indicadores económicos y empresariales como las ventas, lainversión, el consumo, los ingresos, etc. pue<strong>de</strong>n representarse como variables aleatorias continuas.1.1.1. Variables aleatorias discretas y distribuciones <strong>de</strong> probabilidadSea X una variable aleatoria discreta y x uno <strong>de</strong> sus posibles valores. La probabilidad <strong>de</strong> que la variablealeatoria X tome el valor específico x se <strong>de</strong>nota por P (X = x). El conjunto <strong>de</strong> probabilida<strong>de</strong>sse <strong>de</strong>nomina función <strong>de</strong> cuantía o función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad, fdp y se <strong>de</strong>nota P (x).Función <strong>de</strong> cuantía <strong>de</strong> una variable aleatoria discreta. La función <strong>de</strong> cuantía, P (x), <strong>de</strong> unavariable aleatoria discreta X expresa la probabilidad <strong>de</strong> que X tome el valor x, como una función21


Estadística Actuarial: Análisis <strong>de</strong> Regresión<strong>de</strong> x:P (x) = P (X = x), para todos los valores <strong>de</strong> x.Dado que la función <strong>de</strong> cuantía solo toma valoresdistintos <strong>de</strong> 0 en puntos discretos x, a veces se lallama función <strong>de</strong> masa <strong>de</strong> probabilidad. Se pue<strong>de</strong>representar gráficamente. A la <strong>de</strong>recha se muestrala función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> una variable discretaque toma valores 1, 2 y 3 con probabilidad0,2; 0,3 y 0,5 respectivamente. A<strong>de</strong>más se <strong>de</strong>becumplir 0 ≤ P (x) ≤ 1 para cualquier valor <strong>de</strong> x,es <strong>de</strong>cir las probabilida<strong>de</strong>s no pue<strong>de</strong>n ser negativasni superiores a la unidad y ∑ xP (x) = 1,las probabilida<strong>de</strong>s individuales suman 1.f(x)0,80,70,60,50,40,30,20,100 0,5 1 1,5 2 2,5 3 3,5 4XFunción <strong>de</strong> distribución o función <strong>de</strong> probabilidad acumulada. La función <strong>de</strong> probabilidad acumuladaF (a) <strong>de</strong> una variable aleatoria X expresa la probabilidad <strong>de</strong> que X no tenga un valorsuperior a a, como una función <strong>de</strong> a. Es <strong>de</strong>cir,F (a) = P (X ≤ a)don<strong>de</strong> la función se evalúa en todos los valores <strong>de</strong> a.Relación entre la función <strong>de</strong> cuantía y la función <strong>de</strong> distribución. Sea X una variable aleatoriacon función <strong>de</strong> cuantía P (x) y función <strong>de</strong> distribución F (a). Se pue<strong>de</strong> <strong>de</strong>mostrar queF (a) = ∑ P (x) = P (x 0 ) + P (x 1 ) + . . . + P (a).x≤a1.1.2. Variables aleatorias continuas y distribuciones <strong>de</strong> probabilidadMuchos indicadores económicos y empresariales como las ventas, la inversión, el consumo, los ingresos,etc. pue<strong>de</strong>n representarse como variables aleatorias continuas, por ello vamos a <strong>de</strong>dicar estepunto a su estudio.Sea X una variable aleatoria y x un valor <strong>de</strong>terminado <strong>de</strong> la misma. Po<strong>de</strong>mos <strong>de</strong>finir una función<strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad para variables aleatorias continuas <strong>de</strong> manera análoga a la función <strong>de</strong>cuantía para las variables aleatorias discretas. La fdp nos informa <strong>de</strong> la probabilidad asociada a losresultados posibles <strong>de</strong> la variable aleatoria. Sin embargo no tiene sentido hablar <strong>de</strong> la probabilidad<strong>de</strong> que una variable aleatoria continua tome un valor <strong>de</strong>terminado, usaremos la fdp <strong>de</strong> la variablealeatoria continua solo para calcular la probabilidad <strong>de</strong> los sucesos referidos a un intervalo <strong>de</strong> valores.Si X es continua la probabilidad asociada a cualquier punto en particular es cero por loque nos referimos a la probabilidad <strong>de</strong> que X tome valores en un intervalo.Para calcular probabilida<strong>de</strong>s para variables aleatorias continuas es más sencillo trabajar con lafunción <strong>de</strong> distribución fd ó función <strong>de</strong> probabilidad acumulada.22


Estadística Actuarial: Análisis <strong>de</strong> RegresiónFunción <strong>de</strong> distribución. La función <strong>de</strong> distribución F (x) <strong>de</strong> una variable aleatoria continua Xexpresa la probabilidad <strong>de</strong> que X no sea mayor que el valor x, en función <strong>de</strong> x:F (x) = P (X ≤ x).Para enten<strong>de</strong>r el concepto <strong>de</strong> función <strong>de</strong> distribución, se suele recurrir a un símil físico: una masaigual a la unidad, distribuida a lo largo <strong><strong>de</strong>l</strong> campo <strong>de</strong> variación <strong>de</strong> la variable. En esta situación,la función <strong>de</strong> distribución F (x) = P (X ≤ x) proporciona la cantidad <strong>de</strong> masa que hay en el puntox y a su izquierda hasta el extremo inferior <strong><strong>de</strong>l</strong> campo <strong>de</strong> variación <strong>de</strong> la variable. La función <strong>de</strong>distribución, por su <strong>de</strong>finición no pue<strong>de</strong> ser negativa, al ser una probabilidad, ni <strong>de</strong>creciente, pueses acumulativa. A<strong>de</strong>más por ser una probabilidad está acotada: 0 ≤ F (x) ≤ 1.Probabilidad <strong>de</strong> un intervalo utilizando la función <strong>de</strong> distribución. Sea X una variable aleatoriacontinua que tiene una función <strong>de</strong> distribución F (x) y sean a y b dos valores posibles <strong>de</strong> X, siendoa < b. La probabilidad <strong>de</strong> que X se encuentre entre a y b esP (a < X ≤ b) = F (b) − F (a)Una variable aleatoria es continua si su función <strong>de</strong> distribución, F (x) es continua. Su dominio <strong>de</strong><strong>de</strong>finición es todo R y no existe ningún punto <strong>de</strong> la recta con probabilidad no nula. Suponemos, porsimplicidad, que en las variables aleatorias continuas la función <strong>de</strong> distribución es <strong>de</strong>rivable en elinterior <strong><strong>de</strong>l</strong> dominio. En este caso, a su <strong>de</strong>rivada le llamamos función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidady la <strong>de</strong>notamos por f(x). La relación existente entre la función <strong>de</strong> <strong>de</strong>nsidad y la <strong>de</strong> distribución es:F (x) =∫ ∞−∞f(x)dx,f(x) = F ′ (x)La función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad, f(x), <strong>de</strong> la variable aleatoria es una función que tiene lassiguientes propieda<strong>de</strong>s:1. f(x) ≥ 0 para todos los valores <strong>de</strong> x.2. El área situada <strong>de</strong>bajo <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad<strong>de</strong> probabilidad f(x), cuando se abarcan todoslos valores <strong>de</strong> la variable aleatoria, X, es igual ala unidad.3. El gráfico <strong>de</strong> la <strong>de</strong>recha representa gráficamentela función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> cierta variable aleatoriacontinua. Sean a y b dos valores posibles <strong><strong>de</strong>l</strong>a variable aleatoria X, siendo a < b. En este casola probabilidad <strong>de</strong> que X se encuentre entrea y b es el área situada <strong>de</strong>bajo <strong>de</strong> la función <strong>de</strong><strong>de</strong>nsidad entre estos puntos.P (a ≤ X ≤ b) =∫ baf(x)dx23f(X)0,40,350,30,250,20,150,10,05N(0, 1)0-5 -4 -3 -2 -1 0 a 1 2 b 3 4 5XP(a


Estadística Actuarial: Análisis <strong>de</strong> Regresión1.1.3. Esperanzas y variables aleatoriasLa distribución <strong>de</strong> probabilidad <strong>de</strong> una variable aleatoria contiene toda la información sobre propieda<strong>de</strong>sprobabilísticas <strong>de</strong> una variable aleatoria. Su examen gráfico pue<strong>de</strong> servir para <strong>de</strong>scribirla, sinembargo, es necesario establecer medidas estadísticas que sirvan para caracterizar la distribución.Las medidas más importantes son la media o valor esperado y la varianza.Media <strong>de</strong> una variable aleatoria. La media o valor esperado <strong>de</strong> una variable aleatoria se<strong>de</strong>nota como E(X) y se <strong>de</strong>fine como:⎧ ∑⎨ xxP (x) si X es discretaE(X) = µ X =⎩ ∫(1.1)x xf(x)dx si X es continuadon<strong>de</strong> E se conoce como el operador <strong>de</strong> esperanza matemática.La media es un promedio pon<strong>de</strong>rado <strong>de</strong> los valores x que toma la variable don<strong>de</strong> las pon<strong>de</strong>racionesson las probabilida<strong>de</strong>s respectivas. La media recoge el centro <strong>de</strong> gravedad sobre el que se distribuyela variable. Cuanto mayor es la media, mayor es el valor que se espera que tomen las realizaciones<strong>de</strong> la variable. En la práctica la media no tiene porqué coincidir con un valor que tome la variable.Ejemplo 1.3• Sea X variable aleatoria discreta que pue<strong>de</strong> tomar los valores 1, 2 y 3 con probabilida<strong>de</strong>s0,20; 0,30 y 0,50 respectivamente. Su esperanza matemática es:E(X) = ∑ xxP (x) = 1 · 0, 20 + 2 · 0, 3 + 3 · 0, 50 = 2, 30.• Consi<strong>de</strong>remos la variable continua <strong>de</strong>finida por: f(x) = 4x 3 ∀ 0 ≤ x ≤ 1. Suesperanza matemática es:∫E(X) =xxf(x)dx =∫ 10[ xx4x 3 5dx = 45] 10= 4 5 .Varianza <strong>de</strong> una variable aleatoria. La varianza <strong>de</strong> una variable aleatoria se <strong>de</strong>nota comoV ar(X) = σX 2 y se <strong>de</strong>fine como:⎧ ∑⎨V ar(X) = σX 2 = E[(X − µ X ) 2 x (x − µ X) 2 P (x) si X es discreta.] =⎩ ∫(1.2)x (x − µ X) 2 f(x)dx si X es continua.La varianza es una medida <strong>de</strong> dispersión <strong>de</strong> la distribución, siendo la dispersión la mayor o menorvariabilidad <strong>de</strong> los valores <strong>de</strong> la variable aleatoria alre<strong>de</strong>dor <strong>de</strong> su valor medio.24


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLa varianza también pue<strong>de</strong> expresarse como:σ 2 X = E(X 2 ) − µ 2 X. (1.3)De don<strong>de</strong> trabajando la expresión anterior obtenemos un resultado útil: E(X 2 ) = σ 2 X + µ2 X .La <strong>de</strong>sviación √ típica o estándar es la raíz cuadrada positiva <strong>de</strong> la varianza y se <strong>de</strong>nota porσ X = σX 2 .La varianza es una medida <strong>de</strong> dispersión, siendo la dispersión la mayor o menor variabilidad <strong>de</strong> losvalores <strong>de</strong> la variable aleatoria alre<strong>de</strong>dor <strong>de</strong> su valor medio. Si la varianza es pequeña será porquelas <strong>de</strong>sviaciones <strong>de</strong> la variable aleatoria en torno a su valor medio son pequeñas, con lo que lamedia será representativa <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> valores <strong>de</strong> la distribución y por consiguiente, la dispersiónserá pequeña. Si la varianza es gran<strong>de</strong>, la dispersión será gran<strong>de</strong> y la media <strong>de</strong> la variable aleatoriano será representativa. Cuanto mayor sea la varianza mayor es la probabilidad <strong>de</strong> obtener valoresalejados <strong>de</strong> µ X .Ejemplo 1.4Supongamos que X es la variable rendimiento <strong>de</strong> una cartera <strong>de</strong> valores. µ X mi<strong>de</strong> elrendimiento, en media, que esperamos obtener <strong>de</strong> esa cartera y σX 2 nos da la dispersión<strong>de</strong> los posibles rendimientos. Si σX 2 es gran<strong>de</strong> entonces tendremos una gran probabilidad<strong>de</strong> obtener rendimientos mucho mayores o mucho menores <strong>de</strong> lo esperado µ X . Por lotanto σX 2 mi<strong>de</strong> el riesgo <strong>de</strong> la cartera. Cuanto mayor es σ2 Xmás arriesgada es la cartera.La media y la varianza constituyen dos importantes indicadores sintéticos <strong>de</strong> una distribución <strong>de</strong>probabilidad. La media es una medida <strong><strong>de</strong>l</strong> centro <strong>de</strong> la distribución mientras que la varianza es unamedida <strong>de</strong> su dispersión. Otras dos medidas que también se utilizan habitualmente para <strong>de</strong>scribiruna distribución <strong>de</strong> probabilidad <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> su forma son el coeficiente <strong>de</strong> asimetríay el coeficiente <strong>de</strong> curtosis.Asimetría.El coeficiente <strong>de</strong> asimetría es:γ 1 = E[(X − µ X) 3 ]σ 3 = µ 3σ 3 (1.4)don<strong>de</strong> µ 3 es el momento <strong>de</strong> or<strong>de</strong>n 3 respecto a la media. Si γ 1 = 0 la distribución es simétrica y portanto las <strong>de</strong>sviaciones por la <strong>de</strong>recha tienen el mismo peso que las <strong>de</strong>sviaciones por la izquierda. Siγ 1 > 0 la distribución es asimétrica (+). Si γ 1 < 0 la distribución es asimétrica (−).Curtosis. La curtosis hace referencia al apuntamiento o achatamiento <strong>de</strong> una distribución <strong>de</strong> probabilidadcuando se compara con la normal. El coeficiente <strong>de</strong> curtosis se <strong>de</strong>fine:E[(X − µ X ) 4 ]σ 4 = µ 4σ 4 .25


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEl coeficiente <strong>de</strong> curtosis es un indicativo <strong><strong>de</strong>l</strong> peso que en la distribución tienen los valores másalejados <strong><strong>de</strong>l</strong> centro, tiene que ver con el grosor <strong>de</strong> las colas. Para evaluar la curtosis es necesarioque la distribución tenga perfil campaniforme y sea simétrica o mo<strong>de</strong>radamente asimétrica ya quela curtosis trata <strong>de</strong> analizar la zona central <strong>de</strong> la distribución simétrica o no; la mayor o menorpresencia <strong>de</strong> valores <strong>de</strong> la variable aleatoria alre<strong>de</strong>dor <strong>de</strong> su valor medio, es <strong>de</strong>cir en su zona central,dará lugar a una distribución más o menos apuntada. En general se evalúa el exceso <strong>de</strong> curtosis:γ 2 = µ 4− 3. (1.5)σ4 Esta medida está basada en la distribución normal, <strong>de</strong> su misma varianza, cuyo exceso <strong>de</strong> curtosises cero. Si γ 2 = 0 la distribución tendrá el perfil <strong>de</strong> la distribución normal y se le dice mesocúrtica.Esto quiere <strong>de</strong>cir que tiene las colas igual <strong>de</strong> gruesas que la distribución normal, la cual veremosmás a<strong><strong>de</strong>l</strong>ante. Más concentración en las colas indica colas más <strong>de</strong>nsas que la normal <strong>de</strong> su mismavarianza. Si γ 2 > 0 la distribución es más apuntada que la distribución normal y se le <strong>de</strong>nominaleptocúrtica. Si γ 2 < 0 la distribución es más achatada que la distribución normal y se le <strong>de</strong>nominaplaticúrtica.Coeficiente <strong>de</strong> variación. El coeficiente <strong>de</strong> variación es útil para comparar la volatilidad <strong>de</strong> variablesque tienen una esperanza matemática diferente como por ejemplo, al comparar la volatilidad <strong>de</strong>dos índices bursátiles distintos. Consi<strong>de</strong>ra la <strong>de</strong>sviación típica como porcentaje <strong><strong>de</strong>l</strong> nivel alre<strong>de</strong>dor<strong><strong>de</strong>l</strong> cual fluctúa la variableCoeficiente <strong>de</strong> variación = 100 σ Xµ X. (1.6)Ejercicio 1.1Calcular media, varianza y <strong>de</strong>sviación típica <strong>de</strong> la variable aleatoria discreta X cuyafunción <strong>de</strong> probabilidad es:x 0 1 2 3P(x) 0,1 0,3 0,4 0,21.1.4. Dos variables aleatoriasPara respon<strong>de</strong>r a preguntas relativas a dos o más variables aleatorias <strong>de</strong>bemos conocer su función<strong>de</strong> <strong>de</strong>nsidad conjunta o función <strong>de</strong> cuantía conjunta, según sean discretas o continuas. La función <strong>de</strong><strong>de</strong>nsidad conjunta <strong>de</strong>scribe las probabilida<strong>de</strong>s <strong>de</strong> que se puedan producir combinaciones <strong>de</strong> valores<strong>de</strong> ambas variables. Si las variables aleatorias X e Y son discretas, a cada posible par <strong>de</strong> resultados(x i , y j ) po<strong>de</strong>mos asignar una probabilidad P (x i , y j ). El conjunto <strong>de</strong> probabilida<strong>de</strong>s es la función <strong>de</strong>cuantía conjunta, cumpliéndose que 0 ≤ p(x i , y j ) ≤ 1 y ∑ ∑i j p(x i, y j ) = 1.Si las variables aleatorias son continuas, su distribución conjunta se recoge mediante la función <strong>de</strong><strong>de</strong>nsidad conjunta f(x, y). Si las dos variables siguen una distribución normal, la forma típica <strong>de</strong> sufunción <strong>de</strong> <strong>de</strong>nsidad conjunta se encuentra en la Figura 1.1.26


Estadística Actuarial: Análisis <strong>de</strong> RegresiónFigura 1.1: Distribución normal bivarianteEl volumen total recogido bajo esta superficie es la masa <strong>de</strong> probabilidad total que es igual a launidad, es <strong>de</strong>cir, ∫ ∫x yf(x, y) dx dy = 1. A<strong>de</strong>más, la función no toma valores negativos, f(x, y) ≥ 0.Así, el volumen <strong>de</strong>bajo <strong><strong>de</strong>l</strong> rectángulo <strong>de</strong>finido por dos puntos (a, b) mi<strong>de</strong> la probabilidad <strong>de</strong> que Xtome valores menores o iguales que a e Y menores o iguales que b. Es <strong>de</strong>cir,P (X ≤ a, Y ≤ b) =∫ a−∞∫ b−∞f(x, y) dx dyPor ejemplo, el volumen recogido bajo la superficie marcada en la Figura 1.1 es la probabilidad <strong>de</strong>que X ≤ −2 e Y ≤ 5.La función <strong>de</strong> <strong>de</strong>nsidad marginal <strong>de</strong> cada variable pue<strong>de</strong> obtenerse mediante integración. Así:Marginal <strong>de</strong> X: f X (x) =Marginal <strong>de</strong> Y: f Y (y) =∫ ∞−∞∫ ∞−∞f(x, y) dyf(x, y) dx (1.7)La distribución conjunta <strong>de</strong> dos variables aleatorias se pue<strong>de</strong> resumir mediante:• El centro <strong>de</strong> gravedad <strong>de</strong> cada variable, es <strong>de</strong>cir, las medias (µ X , µ Y ), que se obtienen <strong>de</strong> lasdistribuciones marginales recogidas en (1.7).• Medidas <strong>de</strong> dispersión <strong>de</strong> cada variable alre<strong>de</strong>dor <strong>de</strong> su media, por ejemplo, las varianzas <strong>de</strong>X e Y , σX 2 y σ2 Y, que se <strong>de</strong>rivan <strong>de</strong> las distribuciones marginales recogidas en (1.7).• Medida <strong>de</strong> la relación lineal entre las dos variables aleatorias, para lo que se utiliza la covarianzaσ XY . La covarianza entre dos variables mi<strong>de</strong> el signo <strong>de</strong> la asociación entre las fluctuacionesque experimentan ambas. Nos dice si cuando una <strong>de</strong> ellas está por encima <strong>de</strong> su valor <strong>de</strong>referencia, por ejemplo, su media, la otra variable tien<strong>de</strong> a estar por encima o por <strong>de</strong>bajo <strong>de</strong>su respectiva media:Cov(X, Y ) = σ XY = E[(X − µ X )(Y − µ Y )] = E(XY ) − µ X µ Y .27


Estadística Actuarial: Análisis <strong>de</strong> Regresióno bien el coeficiente <strong>de</strong> correlación entre las variables,corr(X, Y ) = ρ XY =Cov(X, Y )<strong>de</strong>sv(X)<strong>de</strong>sv(Y ) = σ XYσ X σ Y∈ [−1, 1].La covarianza nos da el tipo <strong>de</strong> relación lineal existente entre dos variables + ó −. Así, siσ XY = ρ XY = 0 se dice que las variables X e Y están incorrelacionadas. El coeficiente <strong>de</strong>correlación mi<strong>de</strong> el grado <strong>de</strong> asociación lineal entre dos variables. Su valor se encuentra entre−1 y 1, un valor <strong>de</strong> −1 indica asociación perfecta negativa y un valor <strong>de</strong> 1 asociación perfectapositiva.El vector <strong>de</strong> medias µ y la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong>notada por Σ ó V , son dos importantesestadísticos <strong>de</strong> la variable aleatoria (X, Y ):( ) ( ) ( )µXV (X) Cov(X, Y ) σ2µ =Σ == Xσ XYµ Y Cov(X, Y ) V (Y )σ XYσ 2 YDistribución condicionada. Al estudiar un conjunto <strong>de</strong> variables, interesa evaluar la posibilidad<strong>de</strong> que un suceso ocurra dado que otro suceso ha tenido lugar. Por ejemplo, ¿cuál es la probabilidad<strong>de</strong> que una mujer casada y con hijos en edad escolar participe en el mercado <strong>de</strong> trabajo? La probabilidadcondicionada permite respon<strong>de</strong>r este tipo <strong>de</strong> preguntas. Si las variables son discretas,se <strong>de</strong>fine la función <strong>de</strong> cuantía condicional <strong>de</strong> Y dado que la variable aleatoria X toma el valor x icomo:P (Y = y j |X = x i ) = P (Y = y j, X = x i )P (X = x i )para P (X = x i ) > 0.= p(x i, y j )∑j p(x i, y j ) .Si las variables son continuas, se <strong>de</strong>fine la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> Y condicionada a que la variablealeatoria X tome el valor x (para f(x) > 0):f(y|X = x) =f(x, y)f(x) .De esta forma se obtiene una nueva distribución, con las propieda<strong>de</strong>s ya vistas. Dos momentos <strong>de</strong>interés <strong>de</strong> esta distribución se <strong>de</strong>nominan media y varianza condicionada <strong>de</strong> Y para el valor dado<strong>de</strong> X = x, y se <strong>de</strong>notan E(Y |X = x) y V ar(Y |X = x).In<strong>de</strong>pen<strong>de</strong>ncia. Dos variables aleatorias X y Y son in<strong>de</strong>pendientes o están in<strong>de</strong>pendientementedistribuidas, si conocido el valor que toma una <strong>de</strong> ellas, no aporta ninguna información sobre elvalor que pue<strong>de</strong> tomar la segunda. Si X e Y son in<strong>de</strong>pendientes si y solo si su función <strong>de</strong> <strong>de</strong>nsidadconjunta es igual al producto <strong>de</strong> sus funciones <strong>de</strong> <strong>de</strong>nsidad marginalesf(x, y) = f(x) × f(y) − ∞ < x, y < ∞.A<strong>de</strong>más, se tiene que f(y|X = x) = f Y (y). Se <strong>de</strong>muestra que si X e Y son in<strong>de</strong>pendientes, entoncesCov(X, Y ) = 0. También se <strong>de</strong>muestra que, si las variables X e Y se distribuyen conjuntamentesegún una normal y Cov(X, Y ) = 0, entonces X e Y son in<strong>de</strong>pendientes.28


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEn el caso <strong>de</strong> distribuciones discretas las variables son in<strong>de</strong>pendientes siP (X = x, Y = y) = P (X = x) × P (Y = y).Ejemplo 1.5Distribución <strong>de</strong> probabilidad conjunta <strong>de</strong> dos variables aleatorias discretas:Supongamos que queremos conocer la probabilidad <strong>de</strong> que un individuo seleccionadoaleatoriamente <strong>de</strong> una población posea una licenciatura y haya tenido rentas salarialesen el año 2003. La Tabla 5.2 recoge la función <strong>de</strong> probabilidad conjunta <strong>de</strong> dos variables.La variable X caracteriza los niveles <strong>de</strong> educación que pue<strong>de</strong>n alcanzar los individuos.Toma los valores 1, 2, 3, 4 según el grado <strong>de</strong> estudios alcanzado por el individuo. El valor1 indica alcanzar educación secundaria obligatoria, 2 indica alcanzar bachiller, 3 indicaposeer educación superior y 4 tener un master. La variable Y es una variable dicotómicaque toma valor 1 si el individuo ha tenido rentas salariales en el año 2003 y 0 en casocontrario. Esta tabla permite obtener los siguientes resultados:xy 1 2 3 40 0,19 0,06 0,04 0,021 0,28 0,19 0,14 0,08Tabla 1.1: Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad conjunta f(x, y)• Probabilidad conjunta:La probabilidad <strong>de</strong> que una persona seleccionada al azar tenga estudios superiores yhaya obtenido rentas salariales en el año 2003 es P (X = 3, Y = 1) = f(3, 1) = 0, 14.• Distribuciones marginales:La distribución marginal <strong>de</strong> X se <strong>de</strong>fine: f X (x) = ∑ yf(x, y) para cada valor que Xpue<strong>de</strong> tomar. La distribución marginal <strong>de</strong> Y se <strong>de</strong>fine: f Y (y) = ∑ xf(x, y) para cadavalor que Y pue<strong>de</strong> tomar.Por tanto f Y (y) = ∑ 4x=1 f(x, y) y = 0, 1 luego f Y (0) = ∑ 4x=1f(x, y) = 0, 19 + 0, 06 +0, 04 + 0, 02 = 0, 31.En general las funciones <strong>de</strong> distribución conjunta y marginales se suelen mostrar comoa continuación:xy 1 2 3 4 f Y (y)0 0,19 0,06 0,04 0,02 0,311 0,28 0,19 0,14 0,08 0,69f X (x) 0,47 0,25 0,18 0,10 1Tabla 1.2: Distribuciones marginales para X e Y29


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Probabilidad condicionada:Po<strong>de</strong>mos contestar a preguntas como ¿cuál es la probabilidad <strong>de</strong> que un individuo tengarenta salarial en el año 2003 dado que tiene estudios superiores? En este caso <strong>de</strong>bemos<strong>de</strong> utilizar la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> Y condicionada a X: f(y|x) = P (Y = y|X = x), enrealidad el efecto <strong>de</strong> condicionar es reducir el conjunto <strong>de</strong> posibles resultados. Dada laTabla 1.2 consi<strong>de</strong>ramos solo el 18 % <strong>de</strong> la población con título superior. La tabla siguienterecoge la probabilidad condicionada <strong>de</strong> Y dado X = 3. Dada la tabla la probabilidad<strong>de</strong> seleccionar a un individuo con renta salariales dado que tenga estudios superiores es<strong>de</strong> 0,78. Notar sin embargo que la probabilidad <strong>de</strong> seleccionar a un individuo, <strong>de</strong> entretoda la población, que tenga rentas salariales es <strong>de</strong> 0,69.y f(y|X = 3)0 0,04/0,18=0,221 0,14/0,18=0,78Ejercicio 1.2En la tabla se recoge la función <strong>de</strong> <strong>de</strong>nsidad conjunta <strong>de</strong> dos variables aleatorias discretasX e Y . Se pi<strong>de</strong>:1. La función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad marginal <strong>de</strong> Y .2. La función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad conjunta <strong>de</strong> Y dado que X = 2.3. La covarianza <strong>de</strong> X e Y .4. ¿Son las variables in<strong>de</strong>pendientes?Y1 3 92 1/8 1/24 1/12X 4 1/4 1/4 06 1/8 1/24 1/121.1.5. Más <strong>de</strong> dos variablesLos resultados anteriores se pue<strong>de</strong>n generalizar a un conjunto <strong>de</strong> n variables, X 1 , X 2 , . . . , X n , quese recogen en un vector⎛ ⎞X 1X 2X = ⎜ ⎟⎝ . ⎠X nLa distribución conjunta <strong>de</strong> estas variables se resume en el vector <strong>de</strong> medias E(X) ó ⃗µ y la matriz<strong>de</strong> varianzas y covarianzas V (X) ó Σ X . Así:30


Estadística Actuarial: Análisis <strong>de</strong> Regresión⎛E(X) = ⃗µ = ⎜⎝E(X 1 )E(X 2 ).E(X n )⎞ ⎛⎟⎠ = ⎜⎝⎞µ 1µ 2⎟. ⎠µ nyΣ X =⎛⎜⎝V (X 1 ) Cov(X 1 , X 2 ) . . . Cov(X 1 , X n )Cov(X 1 , X 2 ) V (X 2 ) . . . Cov(X 2 , X n )..... ....Cov(X 1 , X n ) Cov(X 2 , X n ) . . . V (X n )⎞ ⎛⎟⎠ = ⎜⎝σ1 2 σ 1,2 . . . σ 1,nσ 1,2 σ2 2 . . . σ 2,n..... ....σ 1,n σ 2,n . . . σn2⎞⎟⎠don<strong>de</strong> Σ X es una matriz cuadrada <strong>de</strong> or<strong>de</strong>n n, simétrica y <strong>de</strong>finida no negativa. Esto implica quelos elementos <strong>de</strong> la diagonal principal son no negativos, σi 2 ≥ 0, ∀i.Si las variables son in<strong>de</strong>pendientes entre sí, entonces están incorrelacionadas, es <strong>de</strong>cir, σ i,j = 0, ∀i ≠j, por lo que la matriz Σ X es diagonal:⎛⎞σ1 2 0 . . . 00 σΣ X =2 2 . . . 0⎜⎝.. . ..⎟. ⎠0 0 . . . σn2Si, a<strong>de</strong>más, X 1 , . . . , X n siguen la misma distribución, con la misma media y la misma varianza:⎛ ⎞ ⎛⎞µσ 2 0 . . . 0µ0 σE(X) = ⎜ ⎟ Σ X =2 . . . 0⎝ . ⎠ ⎜⎝.. . ..⎟. ⎠ = σ2 Iµ0 0 . . . σ 2entonces se dice que son variables aleatorias idéntica e in<strong>de</strong>pendientemente distribuidas con mediaµ y varianza σ 2 y se <strong>de</strong>nota X i ∼ iid(µ, σ 2 ), ∀i = 1, . . . , n.Si X 1 , . . . , X n son variables aleatorias normales, se dice que el vector X sigue una distribuciónnormal multivariante, y queda caracterizada por su vector <strong>de</strong> medias ⃗µ y su matriz <strong>de</strong> varianzasy covarianzas Σ X . Se <strong>de</strong>nota X ∼ N(⃗µ, Σ X ). Si a<strong>de</strong>más las variables son in<strong>de</strong>pendientes, con mediay varianza común, se <strong>de</strong>nota X i ∼ NID(µ, σ 2 ), i = 1, . . . , n.Propieda<strong>de</strong>s <strong>de</strong> la esperanza matemática• La esperanza matemática <strong>de</strong> una constante es igual a la misma constante: E(c) = c• La esperanza matemática <strong>de</strong> una suma <strong>de</strong> variables aleatorias es igual a la suma <strong>de</strong> las esperanzasmatemáticas <strong>de</strong> cada una <strong>de</strong> las variables aleatorias:E(X 1 ± X 2 ± . . . ± X n ) = E(X 1 ) ± E(X 2 ) ± . . . ± E(X n ) = µ 1 ± µ 2 ± . . . ± µ n .31


Estadística Actuarial: Análisis <strong>de</strong> Regresión• La esperanza matemática <strong>de</strong> un producto <strong>de</strong> variables aleatorias es igual al producto <strong>de</strong> lasesperanzas <strong>de</strong> cada una <strong>de</strong> las variables aleatorias, si y sólo si son in<strong>de</strong>pendientes:E(X 1 · X 2 · X 3 · . . . · X n ) = E(X 1 ) · E(X 2 ) · E(X 3 ) · . . . · E(X n ) = µ 1 · µ 2 · µ 3 · . . . · µ n .• Notar que si X e Y son in<strong>de</strong>pendientes E(XY ) = E(X) · E(Y ) pero E(X|Y ) ≠ E(X)E(Y ) aunqueX e Y lo sean.• El valor medio, o esperanza matemática, <strong>de</strong> las <strong>de</strong>sviaciones <strong>de</strong> los valores <strong>de</strong> la variablealeatoria respecto a su media es cero. Sea E(X) = µ entonces E(X − µ) = 0.• Si a una variable aleatoria se le suma una constante su esperanza matemática queda modificadaen esa misma constante: E(X + c) = E(X) + c = µ + c.• Si una variable aleatoria se multiplica por una constante su esperanza matemática quedamultiplicada por esa misma constante, E(X · c) = c · E(X) = c · µ.Propieda<strong>de</strong>s <strong>de</strong> la varianza• La varianza es siempre no negativa.• Varianza <strong>de</strong> una suma <strong>de</strong> variables aleatorias:V ar(X ± Y ) = V ar(X) + V ar(Y ) ± 2Cov(X, Y ) = σ 2 X + σ 2 Y ± 2 σ XY .• Generalizando:V ar(X 1 + X 2 + . . . + X n ) = V ar(X 1 ) + V ar(X 2 ) + . . . + V ar(X n ) + 2• Si X 1 , X 2 , . . . , X n son in<strong>de</strong>pendientes:= σ 2 1 + σ 2 2 + . . . + σ 2 n + 2n−1∑n∑i=1 j=i+1σ Xi X j.n−1∑n∑i=1 j=i+1Cov(X i , X j ) =V ar(X 1 + X 2 + . . . + X n ) = V ar(X 1 ) + V ar(X 2 ) + . . . + V ar(X n ) = σ 2 1 + σ 2 2 + . . . + σ 2 n.• Si a una variable aleatoria se le suma una constante, su varianza no varía: V ar(X + c) =V ar(X) ya que V ar(c) = 0.• V ar(cX) = c 2 V ar(X).• V ar(aX + bY ) = a 2 V ar(X) + b 2 V ar(Y ) + 2 ab Cov(X, Y ).32


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjemplo 1.6Sea X una variable aleatoria continua <strong>de</strong> media µ X y varianza σX 2 y sean a y b dosconstantes cualesquiera. La media y varianza <strong>de</strong> la transformación lineal W = a + bXson:E(W ) = µ W = E(a + bX) = a + bE(X) = a + b µ X .V ar(W ) = σ 2 W = V ar(a + bX) = b 2 σ 2 X.Ejercicio 1.3Sea X una variable aleatoria continua <strong>de</strong> media µ X y varianza σX 2 y sean a y b dosconstantes cualesquiera. Calcular la media y varianza <strong>de</strong> las siguientes funciones:• Y = a.• Z = bX.• W = X−µ Xσ X.Ejercicio 1.4Sea X una variable aleatoria discreta que toma valores 0, 1, 2 con probabilidad P (X =0) = 0, 30; P (X = 1) = 0, 60; P (X = 2) = 0, 10 respectivamente. Se pi<strong>de</strong>:1. Buscar E(X), E(X 2 ), V (X).2. El valor esperado y varianza <strong>de</strong> g(X) = 3X + 2.Ejercicio 1.5Sea la variable aleatoria X el precio <strong>de</strong> las acciones <strong>de</strong> la empresa Biltox y sea la variablealeatoria Y el precio <strong>de</strong> las acciones <strong>de</strong> la empresa Baltat. El Sr. Martínez ha comprado50 y 80 acciones <strong>de</strong> cada empresa respectivamente. El valor <strong>de</strong> mercado <strong>de</strong> la cartera<strong><strong>de</strong>l</strong> Sr. Martínez es W = 50X + 80Y . Calcular el valor medio y varianza <strong>de</strong> la carterasiendo X ∼ (µ X , σ 2 X ) , Y ∼ (µ Y , σ 2 Y ) y σ XY = cov(X, Y ).Ejemplo 1.7Supongamos que el Sr. Alonso quiere crear una cartera <strong>de</strong> valores con acciones <strong>de</strong> dosempresas. Dispone <strong>de</strong> un capital <strong>de</strong> 3000 e para invertir en acciones <strong>de</strong> las dos empresascuyos rendimientos por e invertido son las variables aleatorias X e Y , in<strong>de</strong>pendientesentre sí y con igual media, µ, y varianza, σ 2 . ¿Cómo <strong>de</strong>bería construir el Sr. Alonso lacartera para minimizar el riesgo <strong>de</strong> pérdida?33


Estadística Actuarial: Análisis <strong>de</strong> RegresiónSupongamos que asignamos α euros a la inversión en una <strong>de</strong> las empresas y (3000 − α)a la otra. El rendimiento total <strong>de</strong> la inversión es:El rendimiento esperado <strong>de</strong> la inversión es:r = α X + (3000 − α) Y.E(r) = α E(X) + (3000 − α) E(Y ) = αµ + (3000 − α)µ = 3000µluego el rendimiento esperado <strong>de</strong> la inversión no <strong>de</strong>pen<strong>de</strong> <strong>de</strong> cómo éste esté asignadosino exclusivamente <strong>de</strong> la media <strong>de</strong> los rendimientos µ. Calculamos ahora la varianzaesperada <strong>de</strong> la inversión:V (r) = α 2 V (X)+(3000−α) 2 V (Y ) = α 2 σ 2 +(3000−α) 2 σ 2 = (2α 2 −6000α+9000000)σ 2 .Si se asigna α = 0 o α = 3000, asignando toda la inversión a acciones en una <strong>de</strong> las dosempresas la varianza <strong>de</strong> la inversión es 9000000σ 2 . Si se asigna la mitad <strong><strong>de</strong>l</strong> dinero, 1500e , a invertir en cada empresa, la varianza <strong><strong>de</strong>l</strong> rendimiento es la más pequeña posible4500000 σ 2 . Luego repartiendo la inversión entre las dos empresas reduce la varianza<strong><strong>de</strong>l</strong> rendimiento <strong>de</strong> la inversión y por lo tanto pue<strong>de</strong> reducir los efectos <strong>de</strong> que losrendimientos <strong>de</strong> las acciones <strong>de</strong> una <strong>de</strong> las empresas sean muy bajos o muy altos. Si elSr. Alonso solo está interesado en el rendimiento esperado qué cantidad <strong>de</strong> dinero invierteen cada empresa no es relevante, pero si a<strong>de</strong>más <strong>de</strong> estar interesado en el rendimientoesperado también le preocupa el riesgo <strong>de</strong> la inversión pue<strong>de</strong> minimizarlo dividiendo suinversión a partes iguales en acciones <strong>de</strong> las dos empresas. Cualquier otra combinaciónaumenta el riesgo <strong>de</strong> la inversión.1.2. La distribución normalAlgunas situaciones experimentales dan lugar a distribuciones <strong>de</strong> probabilidad específicas. Sin embargo,en economía, en la mayoría <strong>de</strong> los casos, las distribuciones utilizadas son simplemente mo<strong><strong>de</strong>l</strong>os<strong>de</strong> los fenómenos observados. Una <strong>de</strong> las distribuciones más utilizadas en economía y en las aplicacionesempresariales es la distribución normal ya que se a<strong>de</strong>cúa a una gran variedad <strong>de</strong> variablesaleatorias, por ejemplo: las ventas <strong>de</strong> una empresa, la producción, los precios <strong>de</strong> las acciones y bonos,los precios <strong>de</strong> viviendas, la renta, etc.La función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> una variable aleatoria X con distribución normal <strong>de</strong> media µ y<strong>de</strong>sviación típica σ es:f(x) =1√2πσ 2 e−(x−µ)2 /2σ 2 para − ∞ < x < ∞. (1.8)La distribución normal representa una gran familia <strong>de</strong> distribuciones, cada una con una especificaciónúnica <strong>de</strong> los parámetros µ y σ 2 . La media <strong>de</strong> la variable aleatoria es: E(X) = µ. La varianza <strong><strong>de</strong>l</strong>a variable aleatoria es: V (X) = E[(X − µ) 2 ] = σ 2 . La forma <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad es una curvasimétrica en forma <strong>de</strong> campana centrada en su media µ y exceso <strong>de</strong> curtosis cero. Habitualmentese <strong>de</strong>notaX ∼ N(µ, σ 2 ).34


Estadística Actuarial: Análisis <strong>de</strong> RegresiónIgual varianza y distinta mediaIgual media y distinta varianza0,4N(0, 1)N(6, 1)0,1N(3, 81)N(3, 16)0,350,30,080,250,06f(X)0,20,15f(X)0,040,10,050,020-6 -4 -2 0 2 4 6 8 10 12X0-40 -30 -20 -10 0 10 20 30 40 50XFigura 1.2: Ejemplos <strong>de</strong> función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución normalLa Figura 1.2 muestra ejemplos <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución normal. A la izquierdase muestran dos funciones <strong>de</strong> <strong>de</strong>nsidad normal con igual varianza, σ 2 = 1, y distinta media. Notarque cuanto mayor es la media, mayor es el valor que se espera que tomen las realizaciones <strong><strong>de</strong>l</strong>experimento. En la <strong>de</strong>recha se muestran dos distribuciones con igual media y distinta varianza. Notarque cuanto menor es la varianza <strong>de</strong> la variable, mayor es la probabilidad concentrada alre<strong>de</strong>dor <strong><strong>de</strong>l</strong>a media.Función <strong>de</strong> distribución acumulada <strong>de</strong> la distribución normal. Supongamos que X ∼ N(µ, σ 2 ).La función <strong>de</strong> distribución acumulada esF (x 0 ) = P (X ≤ x 0 ) (1.9)y se representa por el área <strong>de</strong>bajo <strong>de</strong> la función <strong>de</strong> <strong>de</strong>nsidad normal a la izquierda <strong>de</strong> x 0 en elgráfico <strong>de</strong> la izquierda en la Figura 1.3. A la <strong>de</strong>recha se muestra la la forma general <strong>de</strong> la función<strong>de</strong> distribución acumulada.0,4N(0, 1)10,9FDA normal0,350,80,30,7f(X)0,250,20,150,1f(X)0,60,50,40,30,20,050,10-5 -4 -3 -2 -1 0 1 Xo 2 3 4 5X0-4 -3 -2 -1 0 1 2 3 4XFigura 1.3: Función <strong>de</strong> distribución acumulada <strong>de</strong> la distribución normal35


Estadística Actuarial: Análisis <strong>de</strong> RegresiónProbabilida<strong>de</strong>s <strong>de</strong> intervalos <strong>de</strong> variablesaleatorias normales. Sea X una variablealeatoria con función <strong>de</strong> distribuciónF (x 0 ) y a y b son dos posibles valores <strong><strong>de</strong>l</strong>a misma tal que a < b.. Entonces:P (a < X < b) = F (b) − F (a) (1.10)La probabilidad es el área situada <strong>de</strong>bajo<strong>de</strong> la correspondiente función <strong>de</strong> <strong>de</strong>nsida<strong>de</strong>ntre a y b como muestra la Figura <strong>de</strong> la<strong>de</strong>recha.f(X)N(0, 25)0,080,070,060,050,040,030,020,010-25 -20 -15 -10 a -5 0 5 b10 15 20 25XEjercicio 1.6Sea X ∼ N(µ, σ 2 ) se pi<strong>de</strong> obtener la distribución <strong>de</strong> la variable Y = a + bX siendo a yb dos constantes cualesquiera.Ejercicio 1.7Sean X ∼ N(50, 10) e Y ∼ N(20, 40). La covarianza entre ambas es 0,5. Calcula lamedia y varianza <strong>de</strong> la variable aleatoria Z = 5X − 4Y .1.2.1. La distribución normal estandarizadaEl cálculo <strong>de</strong> la probabilidad <strong>de</strong> cualquier distribución normal <strong>de</strong> media y varianza <strong>de</strong>terminadas esengorroso. Sin embargo es más sencillo si la convertimos en una variable normal estandarizada, es<strong>de</strong>cir <strong>de</strong> media cero y varianza 1. Para ello <strong>de</strong>bemos utilizar la transformaciónZ = X − µσdon<strong>de</strong> X ∼ N(µ, σ 2 ). Habitualmente la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la variable Z normal estandarizadase <strong>de</strong>nota por φ(Z):φ(Z) = 1 √2πe −Z2 /2 . (1.11)Una vez realizada la transformación po<strong>de</strong>mos utilizar la tabla normal estándar para calcular lasprobabilida<strong>de</strong>s <strong>de</strong> cualquier variable aleatoria distribuida normalmente. Como la forma <strong>de</strong> la distribuciónno varía bajo transformaciones lineales, no es necesario tabular la distribución para otrosvalores <strong>de</strong> µ y σ. Para cualquier variable normalmente distribuida se cumple:( a − µP (a < X < b) = Pσ36< X − µσ< b − µ ).σ


Estadística Actuarial: Análisis <strong>de</strong> RegresiónA<strong>de</strong>más dado que la distribución es simétrica Φ(−Z) = 1 − Φ(Z) don<strong>de</strong> Φ(Z) <strong>de</strong>nota función <strong>de</strong>distribución <strong>de</strong> la variable Z normal estandarizada. Por tanto las tablas <strong>de</strong> la distribución mostraranúnicamente la cola positiva <strong>de</strong> la distribución. A continuación mostraremos como utilizar las tablas<strong>de</strong> la normal estándar para el cálculo <strong>de</strong> probabilida<strong>de</strong>s. La tabla da los valores <strong>de</strong>Φ(Z) = P (Z ≤ z) (1.12)correspondientes a valores no negativos <strong>de</strong> z. Ver la Figura 1.4 para los ejemplos siguientes:• La probabilidad acumulada <strong>de</strong> un valor <strong>de</strong> Z = 1, 65 es Φ(1, 65) = P (Z ≤ 1, 65) = 0, 9505.• Dado que la distribución es simétrica la probabilidad <strong>de</strong> que Z > −1, 65 es también 0, 9505;P (Z > −1, 65) = P (Z ≤ −1, 65) = 0, 9505.• La probabilidad acumulada <strong>de</strong> un valor Z = −1, 65 es Φ(−1, 65) = 1−Φ(1, 65) = 1−0, 9505 =0, 0495.0,4N(0, 1)0,4N(0, 1)0,350,350,30,30,250,25f(X)0,2f(X)0,20,150,10,95050,150,1F(-1,65)=0,04951-F(1,65)=1-0,0495=0,95050,050,050-5 -4 -3 -2 -1 0 11,652 3 4 5X0-5 -4 -3 -2 -1 0 1 2 3 4 5XFigura 1.4: Probabilida<strong>de</strong>s correspondientes a Z = 1, 65 y Z = −1, 65 en la distribución normalestándarEjemplo 1.8Suponiendo X ∼ N(8, 4) ¿Cuál es la probabilidad <strong>de</strong> que X tome un valor entre X 1 = 4y X 2 = 12? ¿Cuál es la probabilidad <strong>de</strong> que exceda <strong>de</strong> 12?Para calcular la probabilidad obtenemos los valores <strong>de</strong> Z tal que:Z 1 = X 1 − µσ= 4 − 82= −2 Z 2 = X 2 − µσ= 12 − 82= +2.Luego P (4 < X < 12) = P (−2 < Z < 2) = Φ(2) − Φ(−2) = Φ(2) − (1 − Φ(2)) =0, 9772 − (1 − 0, 9772) = 0, 9544. La probabilidad <strong>de</strong> que X exceda el valor 12 es lamisma que la probabilidad <strong>de</strong> que Z exceda <strong>de</strong> 2, luego (P (X > 12) = P (Z > 2) =P (Z < −2) = 1 − 0, 9772 = 0, 0228.37


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjemplo 1.9Un inversor tiene una cartera cuyo valor medio es <strong>de</strong> 650.000e y su <strong>de</strong>sviación típicaes 18.000e. ¿Cuál es la probabilidad <strong>de</strong> que el valor <strong>de</strong> la cartera esté entre 632.000e y686.000e?Para calcular la probabilidad <strong>de</strong> que el valor <strong>de</strong> su cartera esté entre 632.000e y 686.000eutilizaremos el resultado:( a − µP (a < X < b) = P < X − µ < b − µ )=( a − µ= Pσ< Z < b − µσσ σ) ( b − µ= Fσ)− Fσ( b − µTenemos que calcular primero probabilidad <strong>de</strong> la cartera tenga una valor <strong>de</strong> 632.000 y686.000e respectivamente.632000 − 650000Z (632000) = = −1.18000686000 − 650000Z (686000) = = 2.18000Luego la probabilidad <strong>de</strong> que el valor <strong>de</strong> la cartera esté entre 632.000e y 686.000e esigual a la probabilidad <strong>de</strong> que Z esté entre −1 y 2.( )P (632000 ≤ X ≤ 686000) = P 632000 − 65000018000< Z < 686000 − 65000018000== P (−1 ≤ Z ≤ 2) = Φ(2) − Φ(−1) == Φ(2) − (1 − Φ(1)) == 0, 9772 − (1 − 0, 8413) = 0, 8185.luego la probabilidad <strong>de</strong> que el valor <strong>de</strong> la cartera esté entre 632.000e y 686.000e es<strong><strong>de</strong>l</strong> 81, 85 %.σ).Ejemplo 1.10Supongamos dos inversiones cuya función <strong>de</strong> incertidumbre es una distribución normal.La inversión A ∼ N(10,4, (1,2) 2 ) y la inversión B ∼ N(11, (4) 2 ), ¿cuál se <strong>de</strong>be elegirpara maximizar la probabilidad <strong>de</strong> generar un rendimiento <strong>de</strong> al menos un 10 %?En la inversión A la probabilidad <strong>de</strong> que el rendimiento sea más <strong><strong>de</strong>l</strong> 10 % es:P(Z >)10 − 10, 4= P (Z > −0, 33) = P (Z < 0,33) = Φ(0, 33) = 0, 6293.1, 2En la inversión B la probabilidad <strong>de</strong> que el rendimiento sea más <strong><strong>de</strong>l</strong> 10 % es:()10 − 11P Z > = P (Z > −0, 25) = P (Z < 0, 25) = Φ(0, 25) = 0, 5987.4La inversión A maximiza la probabilidad, luego es más interesante que la B.38


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 1.8La sociedad MaxBolsa gestiona una cartera con 20 acciones <strong>de</strong> la empresa A y 30 acciones<strong>de</strong> la empresa B. Denotamos por X al precio <strong>de</strong> las acciones <strong>de</strong> la empresa A tal queX ∼ N(25, 81). Denotamos por Y al precio <strong>de</strong> las acciones <strong>de</strong> la empresa A tal queY ∼ N(40, 121). La correlación entre los precios <strong>de</strong> las acciones <strong>de</strong> -0,40. ¿Cuál es laprobabilidad <strong>de</strong> que el valor <strong>de</strong> la cartera sea más <strong>de</strong> 2000 e ? Si la correlación entre losprecios es <strong>de</strong> 0,40, ¿cuál es la probabilidad <strong>de</strong> que el valor <strong>de</strong> la cartera sea más <strong>de</strong> 2000e ? ¿Cuál es la relación entre el riesgo <strong>de</strong> una cartera y la correlación <strong>de</strong> los activos quela componen?Derivadas <strong>de</strong> la distribución normal existen otras muchas distribuciones. Tres <strong>de</strong> ellas, las distribucioneschi-cuadrado, t-Stu<strong>de</strong>nt y F-Sne<strong>de</strong>cor, son muy útiles en econometría. Surgen como sumas <strong>de</strong>n variables adicionales. Estas tres distribuciones tienen asociados uno o dos parámetros <strong>de</strong> nominadosgrados <strong>de</strong> libertad que en nuestros términos serán el número <strong>de</strong> variables en la suma relevante.1.2.2. La distribución chi-cuadrado• Si Z ∼ N(0, 1), entonces X = Z 2 ∼ χ 2 (1)y se lee X sigue una distribución chi-cuadrado conun grado <strong>de</strong> libertad. Esta es una distribución asimétrica, solo tiene cola positiva, con media 1 yvarianza 2.• Sea Z i ∼ NID(0, 1)estándar, entonces:i = 1, . . . , n variables aleatorias in<strong>de</strong>pendientes con distribución normalX =n∑Zi 2 ∼ χ 2 (n)(1.13)i=1y se dice que X es una variable aleatoria chi-cuadrado con n grados <strong>de</strong> libertad. Es una distribuciónasimétrica, con media igual a n y varianza 2n.Para valores negativos <strong>de</strong> X, f(x) = 0 y la forma general <strong>de</strong> su función <strong>de</strong> <strong>de</strong>nsidad se muestra en laFigura 1.5. Existen tablas que proporcionan la probabilidad acumulada hasta un punto P (X ≤ x)en función <strong>de</strong> los grados <strong>de</strong> libertad. A la hora <strong>de</strong> buscar en las tablas es necesario una tabladistinta <strong>de</strong> la distribución chi-cuadrado para cada n. En la tabla correspondiente aparecen losvalores <strong>de</strong> la distribución correspondientes a diferentes puntos <strong>de</strong> corte específicos en la única cola<strong>de</strong> la distribución para distintos valores <strong>de</strong> los grados <strong>de</strong> libertad.1.2.3. La distribución t-Stu<strong>de</strong>ntSean Z ∼ N(0, 1) y X ∼ χ 2 (n)in<strong>de</strong>pendientes entonces:Z√X/n∼ t (n) (1.14)39


Estadística Actuarial: Análisis <strong>de</strong> Regresión0,25Chi-cuadrado(3)Chi-cuadrado(6)0,2n=3f(X)0,150,1n=60,0500 2 4 6 8 10 12 14 16 18 20XFigura 1.5: Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución Chi-cuadradoy se lee distribución t-Stu<strong>de</strong>nt con n grados <strong>de</strong> libertad. La Figura 1.6 incluye ejemplos <strong>de</strong> la función<strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la t-Stu<strong>de</strong>nt comparándolas con la distribución normal estándar:0,50,450,4t(2)t(4)t(25)N(0, 1)0,350,3f(X)0,250,20,150,10,050-5 -4 -3 -2 -1 0 1 2 3 4 5XFigura 1.6: Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución t-Stu<strong>de</strong>ntLa distribución t-Stu<strong>de</strong>nt tiene la misma forma que la distribución normal, es campaniforme ysimétrica pero las colas son más anchas, el exceso <strong>de</strong> curtosis es positivo. A medida que aumentanlos grados <strong>de</strong> libertad la distribución t converge a la normal estándar. En su tabla correspondienteaparecen los valores <strong>de</strong> la distribución correspondientes a diferentes puntos <strong>de</strong> corte específicos enlas colas para distintos valores <strong>de</strong> los grados <strong>de</strong> libertad.1.2.4. La distribución F-Sne<strong>de</strong>corSean X 1 ∼ χ 2 (n 1 ) y X 2 ∼ χ 2 (n 2 )in<strong>de</strong>pendientes, entoncesX 1 /n 1X 2 /n 2∼ F (n1 , n 2 ) (1.15)y se lee distribución F-Sne<strong>de</strong>cor con n 1 y n 2 grados <strong>de</strong> libertad. La Figura 1.7 muestra su función<strong>de</strong> <strong>de</strong>nsidad para distintos grados <strong>de</strong> libertad. Las tablas <strong>de</strong> la distribución F-Sne<strong>de</strong>cor se computanpara cada par <strong>de</strong> valores (n 1 , n 2 ), don<strong>de</strong> n 1 son los grados <strong>de</strong> libertad <strong><strong>de</strong>l</strong> numerador y n 2 son40


Estadística Actuarial: Análisis <strong>de</strong> Regresiónlos grados <strong>de</strong> libertad <strong><strong>de</strong>l</strong> <strong>de</strong>nominador. En general solo se tabulan para valores específicos como95 % y 99 % <strong>de</strong> la cola superior. A medida que aumentan los grados <strong>de</strong> libertad <strong><strong>de</strong>l</strong> <strong>de</strong>nominador ladistribución n 1 F (n1 ,n 2 ) converge a la una χ 2 (n 1 ) .1,21F(15, 15)F(15, 100)F(100, 15)0,8f(X)0,60,40,200 0,5 1 1,5 2 2,5 3 3,5 4 4,5XFigura 1.7: Función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> la distribución F-Sne<strong>de</strong>corHay que notar la relación entre la distribución t y la distribución F :Ejercicio 1.9Si t ∼ t (n) entonces t 2 ∼ F (1, n) (1.16)Suponiendo X ∼ N(3, 9) ¿Cuál es la probabilidad <strong>de</strong> que X tome un valor entre X 1 = 4y X 2 = 6?1.3. Muestreo <strong>de</strong> una población. Muestras aleatoriasEn este punto vamos a construir mo<strong><strong>de</strong>l</strong>os <strong>de</strong> probabilidad para distintos estadísticos calculados apartir <strong>de</strong> datos muestrales. Estos mo<strong><strong>de</strong>l</strong>os <strong>de</strong> probabilidad se llaman distribuciones en el muestreoy se utilizan para <strong>de</strong>sarrollar diversos métodos <strong>de</strong> inferencia estadística. Los métodos estadísticos secentran en la realización <strong>de</strong> inferencia sobre gran<strong>de</strong>s poblaciones <strong>de</strong> objetos utilizando una pequeñamuestra <strong>de</strong> objetos.En general el análisis estadístico y el análisis econométrico se basan en el estudio <strong>de</strong> una muestra.Medir una variable para la población en ocasiones es imposible y en otras ocasiones muy costoso.Pensemos que ejemplos <strong>de</strong> una población son todas las familias que viven en un país, región o ciudad;el número <strong>de</strong> hogares <strong>de</strong> una autonomía, todas las empresas que <strong>de</strong>claran su actividad en el sectorservicios, etc. Luego la población son todos los elementos objeto <strong>de</strong> estudio. Medir por ejemplo larenta en todas las familias <strong>de</strong> un país resulta excesivamente costoso en términos <strong>de</strong> tiempo y coste.Sin embargo, quizá no lo sea tanto hacerlo en una muestra aleatoria extraída <strong>de</strong> dicha población.Luego muestra sería la parte <strong>de</strong> la población que vamos a utilizar en el estudio para extraerconclusiones. Por tanto la muestra está contenida en la población y nosotros la utilizaremos paraestablecer conclusiones que puedan extrapolarse a la población. Para ello la muestra extraída <strong>de</strong>beser representativa <strong>de</strong> la población. Una forma <strong>de</strong> conseguirlo es usando una muestra aleatoriasimple. Para ello seleccionamos una muestra <strong>de</strong> n objetos <strong>de</strong> una población <strong>de</strong> N objetos. En el41


Estadística Actuarial: Análisis <strong>de</strong> Regresiónsupuesto <strong>de</strong> las familias la población son todas las familias, que supongamos son N, y la muestraun subconjunto <strong>de</strong> las misma <strong>de</strong> tamaño n. En la muestra seleccionada todos los objetos tienen lamisma probabilidad <strong>de</strong> ser seleccionados y se seleccionan in<strong>de</strong>pendientemente, luego la selección <strong>de</strong>uno <strong>de</strong> ellos no altera la probabilidad <strong>de</strong> que sean seleccionados otros objetos.Definición. Muestra aleatoria simple: Una muestra <strong>de</strong> n observaciones <strong>de</strong> una o más variables,<strong>de</strong>signadas por X 1 , X 2 , . . . , X n es una muestra aleatoria si las n observaciones son extraídas in<strong>de</strong>pendientemente<strong>de</strong> la misma población o distribución <strong>de</strong> probabilidad. La muestra pue<strong>de</strong> ser univariantesi X i es la única variable aleatoria o multivariante si cada observación contiene varias variables. Lamuestra, <strong>de</strong>signada como (X 1 , X 2 , . . . , X n ) o {X i } i=1,...,n se dice que está in<strong>de</strong>pendientemente eidénticamente distribuida, se <strong>de</strong>nota iid.Dada una población po<strong>de</strong>mos muestrearla repetidamente mediante un muestreo aleatorio. El muestreoaleatorio protege <strong>de</strong> que una parte <strong>de</strong> la población esté subrepresentada o sobrerepresentadaen la muestra. Por otra parte cada muestra obtenida <strong>de</strong> una población con el mismo número <strong>de</strong>observaciones tendrá una media muestral ¯X distinta, luego ¯X es una variable aleatoria con unadistribución <strong>de</strong> probabilidad. La distribución en el muestreo <strong>de</strong> este estadístico, ¯X, es la distribución<strong>de</strong> probabilidad <strong>de</strong> las medias muestrales obtenidas <strong>de</strong> estas muestras posibles extraídas <strong><strong>de</strong>l</strong>a población con el mismo número <strong>de</strong> observaciones. La distribución en el muestreo <strong>de</strong> las mediasmuestrales posibles es la base para realizar inferencia sobre la población. Utilizamos la informaciónmuestral para hacer inferencia sobre la población. Por ejemplo, utilizando la media y la varianzamuestral po<strong>de</strong>mos hacer inferencia sobre la media y varianza poblacional, que son <strong>de</strong>sconocidas ycaracterizan la distribución poblacional.1.4. Estadísticos y distribuciones en el muestreoAntes <strong>de</strong> intentar estimar los parámetros <strong>de</strong> una población se examinan los datos. Visualizarlosgráficamente es útil pero si la muestra es <strong>de</strong> tamaño gran<strong>de</strong> <strong>de</strong>bemos usar estadísticos para <strong>de</strong>scribirla.Los más interesantes son las medidas <strong>de</strong> posición, es <strong>de</strong>cir el valor central <strong>de</strong> los datos, y <strong>de</strong>escala o dispersión <strong>de</strong> los datos.• Medidas <strong>de</strong> ten<strong>de</strong>ncia central o posición:Media muestral: ¯X =1n∑ ni=1 X iMediana:Amplitud muestral:m = valor <strong>de</strong> posición centralamm = Máximo-Mínimo2• Medidas <strong>de</strong> dispersión o escala:Varianza muestral: S 2 X = ∑ ni=1 (X i− ¯X) 2n−1Desviación estándar: S X =42[ ∑ ni=1 (X i− ¯X) ] 2 1/2n−1


Estadística Actuarial: Análisis <strong>de</strong> Regresión• En muestras multivariantes, por ejemplo con dos variables X e Y , a<strong>de</strong>más pue<strong>de</strong>n resultar interesanteslas siguientes medidas:Covarianza: S XY =∑ ni=1 (X i− ¯X)(Y i −Ȳ )n−1Correlación: r XY = S XYS X S YLa covarianza mi<strong>de</strong> la variación conjunta <strong>de</strong> dos variables, y su signo indica la dirección <strong>de</strong> lavariación, <strong>de</strong>pen<strong>de</strong> <strong>de</strong> las escalas <strong>de</strong> medida. El coeficiente <strong>de</strong> correlación mi<strong>de</strong> al grado <strong>de</strong> asociaciónlineal y no se ve afectado por la escala <strong>de</strong> las variables, siempre está comprendido entre −1 y 1.Cuando hay más <strong>de</strong> dos variables es más útil or<strong>de</strong>nar estas covarianzas y correlaciones en las matricescorrespondientes como se verá más a<strong><strong>de</strong>l</strong>ante.Cada una <strong>de</strong> las medidas anteriores tienen su correspondiente medida poblacional basada en la distribucióna partir <strong>de</strong> la cual han sido generados los datos. Los valores muestrales se correspon<strong>de</strong>n conesperanzas poblacionales y esperamos que los valores <strong>de</strong> estos estadísticos tiendan a parecerse a losvalores <strong>de</strong> los parámetros poblacionales. La manera en que se aproximan a los valores poblacionalesviene dada por la distribución muestral <strong><strong>de</strong>l</strong> estadístico.Un estadístico es una función que se calcula a partir <strong>de</strong> los datos contenidos en una muestra. Lamedia muestral es un estadístico, la varianza muestral es otro estadístico. Como ya se ha indicadocuando hacemos un muestreo aleatorio simple repetido cada muestra obtenida <strong>de</strong> una población conel mismo número <strong>de</strong> observaciones tendrá una media muestral ¯X distinta, luego el estadístico ¯X esuna variable aleatoria con una distribución <strong>de</strong> probabilidad a la que se llama distribución en elmuestreo o distribución muestral. La distribución muestral es la base para realizar inferenciasobre la población. Los parámetros que caracterizan a la distribución <strong>de</strong> la población, la mediay varianza poblacionales son <strong>de</strong>sconocidos. Po<strong>de</strong>mos <strong>de</strong>cir algo <strong>de</strong> ellos utilizando los estadísticosmuestrales homónimos mediante la inferencia estadística.Los momentos muestrales por ser función <strong>de</strong> la muestra recogida son variables aleatorias y su valorcambia <strong>de</strong> una muestra a otra. La media muestral, ¯X como variable aleatoria que es tiene unaesperanza matemática que coinci<strong>de</strong> con la <strong>de</strong> la distribución <strong>de</strong> que se obtuvo la muestra, es <strong>de</strong>cirE( ¯X) = µ X . A<strong>de</strong>más si las observaciones muestrales son in<strong>de</strong>pendientes la varianza <strong>de</strong> la mediamuestral es igual a la varianza <strong>de</strong> la variable aleatoria <strong>de</strong> la que se obtuvo la muestra dividida porel tamaño muestral, es <strong>de</strong>cir V ( ¯X) = σ2 XnTanto la media poblacional como la muestral son medidas <strong>de</strong> localización. µ X refleja el valor alre<strong>de</strong>dor<strong><strong>de</strong>l</strong> cual se van a situar todas las posibles observaciones que podamos obtener <strong>de</strong> la variablealeatoria X. La media muestral ¯X refleja lo mismo pero relativo a los valores <strong>de</strong> la muestra.Con respecto a la varianza, <strong>de</strong>bemos recordar que es una medida <strong>de</strong> dispersión, siendo la dispersiónla mayor o menor variabilidad <strong>de</strong> los valores <strong>de</strong> la variable aleatoria alre<strong>de</strong>dor <strong>de</strong> su valor medio. Sila varianza es pequeña será porque las <strong>de</strong>sviaciones <strong>de</strong> la variable aleatoria en torno a su valor medioson pequeñas, con lo que la media será representativa <strong><strong>de</strong>l</strong> conjunto <strong>de</strong> valores <strong>de</strong> la distribución ypor consiguiente, la dispersión será pequeña. Si la varianza es gran<strong>de</strong>, la dispersión será gran<strong>de</strong> yla media <strong>de</strong> la variable aleatoria no será representativa. Cuanto mayor sea la varianza mayor es laprobabilidad <strong>de</strong> obtener valores alejados <strong>de</strong> µ X .43


Estadística Actuarial: Análisis <strong>de</strong> Regresión1.5. La distribución <strong>de</strong> la media muestralSean X 1 , X 2 , . . . , X n observaciones <strong>de</strong> una muestra aleatoria extraída <strong>de</strong> una población <strong>de</strong> media µy varianza σ 2 . La media muestral ¯X es una variable aleatoria <strong>de</strong> media µ y varianzaσ 2n . Prueba1 :¯X = 1 ∑ nn i=1 X iE( ¯X) = E ( 1∑ nn i=1 X )i = E(1n (X 1 + X 2 + . . . + X n )) = 1 ∑ nn i=1 E(X i) = 1 ∑ nn i=1 µ = nµ n = µV ( ¯X) = V ( 1∑ nn i=1 X )i = V (1n (X 1 + X 2 + . . . + X n )) = 1 ∑ nn 2 i=1 V (X i) = 1 ∑ nn 2 i=1 σ2 = nσ2n 2Por tanto la media <strong>de</strong> la distribución <strong>de</strong> la media muestral es la media poblacional y la varianza <strong>de</strong> ladistribución <strong>de</strong> la media muestral es la varianza poblacional dividida por el número <strong>de</strong> observacioneso tamaño <strong>de</strong> la muestra, n. Si X i ∼ NID(µ, σ 2 ) i = 1, . . . , n entonces ¯X es una combinación lineal<strong>de</strong> n variables aleatorias in<strong>de</strong>pendientes, por lo que su distribución muestral es:)¯X ∼ N(µ, σ2(1.17)nAnalicemos el significado <strong><strong>de</strong>l</strong> resultado sobre la media <strong>de</strong> la distribución. Que la media <strong>de</strong> la distribución<strong>de</strong> la media muestral sea la media poblacional indica que a medida que aumenta el número<strong>de</strong> muestras la media <strong>de</strong> las medias muestrales se aproxima a la verda<strong>de</strong>ra media poblacional. Unaúnica media muestral pue<strong>de</strong> ser mayor o menor que la poblacional pero en promedio no hay razonespara esperar que una media muestral sea mayor o menor que la poblacional. Con respecto a lavarianza <strong>de</strong> la distribución <strong>de</strong> la media muestral vemos que esta disminuye a medida que aumentael tamaño muestral. Luego más concentrada está la distribución en el muestreo. En resumen cuantomayor es el tamaño muestral más seguros estamos <strong>de</strong> la inferencia sobre la media poblacional.• Si <strong>de</strong>notamos por σ 2¯X a la varianza <strong>de</strong> la media muestral po<strong>de</strong>mos <strong>de</strong>finir la <strong>de</strong>sviación típica <strong><strong>de</strong>l</strong>a misma como σ ¯X = √ σn.• Si el tamaño <strong>de</strong> la muestra no es pequeño en relación al <strong>de</strong> la población los miembros <strong>de</strong> lamuestra no se distribuyen in<strong>de</strong>pendientemente. En este caso la varianza <strong>de</strong> la media muestral esV ( ¯X) = σ2 N−nN−nn N−1don<strong>de</strong> N es el tamaño <strong>de</strong> la población y el términoN−1se <strong>de</strong>nomina factor <strong>de</strong>corrección en el caso <strong>de</strong> una población finita.= σ2nLa distribución muestral se utiliza para hacer inferencia sobre la población. Para ello se utilizanestimadores. Un estimador es un estadístico calculado a partir <strong>de</strong> la muestra que preten<strong>de</strong> ser unaaproximación a un parámetro <strong>de</strong>sconocido. Obviamente <strong><strong>de</strong>l</strong> ejemplo anterior po<strong>de</strong>mos <strong>de</strong>ducir queun estimador <strong>de</strong> la media poblacional es la media muestral dado que la distribución muestral <strong>de</strong> lamedia <strong>de</strong> un conjunto <strong>de</strong> observaciones <strong>de</strong> variables normales tine media µ. La inferencia estadísticanos permitirá obtener conclusiones sobre la media poblacional <strong>de</strong>sconocida utilizando la distribución<strong>de</strong> la media muestral.1 Para calcular el resultado sobre la varianza <strong>de</strong> la distribución se ha utilizado el hecho <strong>de</strong> que las distribuciones<strong>de</strong> los miembros <strong>de</strong> muestras aleatorias son aproximadamente in<strong>de</strong>pendientes cuando la población es muy gran<strong>de</strong> enrelación al tamaño <strong>de</strong> la muestra.44


Estadística Actuarial: Análisis <strong>de</strong> Regresión1.6. Bibliografía <strong><strong>de</strong>l</strong> temaReferencias bibliográficas básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editorial AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. Open Course Ware. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[2] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[3] Esteban, M.V. (2007). Estadística Actuarial y Análisis <strong>de</strong> Regresión. <strong>Material</strong> docente. Servicio<strong>de</strong> Publicaciones.[4] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08. Publicaciónon-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[5] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[6] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[7] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[8] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[9] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.45


46Estadística Actuarial: Análisis <strong>de</strong> Regresión


Tema 2Estimación por punto y por intervaloLos economistas en general estamos interesados en las relaciones entre las variables económicas.Por ejemplo ¿cómo variará el consumo <strong>de</strong> las familias si sus ingresos se ven incrementados en 100eal mes? o ¿cómo influirá en el consumo un incremento <strong><strong>de</strong>l</strong> impuesto <strong><strong>de</strong>l</strong> valor añadido <strong>de</strong> un 1 %?¿cómo variaran las ventas <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> automóvil si se reduce su precio en 1500 e ? Sin embargo,muchas cuestiones <strong>de</strong> intere se centran en el comportamiento <strong>de</strong> una única variable. Por ejemplo,un diseñador <strong>de</strong> espacios públicos para ver espectáculos sentado estará interesado en ver cual es eltamaño a<strong>de</strong>cuado <strong>de</strong> la butaca y cuál <strong>de</strong>be ser su distancia con respecto a la butaca inmediatamente<strong><strong>de</strong>l</strong>ante y <strong>de</strong>trás <strong>de</strong> ella. Quizá su pregunta relevante sea ¿cuál es el tamaño medio <strong>de</strong> los futurosespectadores? Imaginemos que diseña una butaca <strong>de</strong> 45 cm <strong>de</strong> ancho situada a 86 cm <strong>de</strong> la butacaanterior ¿qué porcentaje <strong>de</strong> espectadores no pue<strong>de</strong>n sentarse en estas condiciones? Para contestara estas preguntas <strong>de</strong>beríamos medir a cada miembro <strong>de</strong> la población, cosa que no po<strong>de</strong>mos hacer.Sin embargo, la estadística tiene instrumentos que pue<strong>de</strong>n ayudarnos a contestar estas preguntas.En este tema nos introduciremos en el conocimiento <strong>de</strong> la inferencia estadística para establecerconclusiones sobre una población basándonos en la muestra. Introduciremos el concepto <strong>de</strong> estimadory estimación. Presentaremos dos métodos <strong>de</strong> estimación, la estimación por punto y la estimaciónpor intervalo. Veremos qué propieda<strong>de</strong>s <strong>de</strong>be tener un estimador y como construir intervalos <strong>de</strong>confianza. Aplicaremos los resultados a la media <strong>de</strong> una población normal.Competencias a trabajar en estas sesiones:1. Conocer distintos procedimientos <strong>de</strong> estimación <strong>de</strong> parámetros, así como sus propieda<strong>de</strong>s parapo<strong>de</strong>r seleccionar a<strong>de</strong>cuadamente la mejor alternativa <strong>de</strong> análisis.5. Obtener e interpretar los resultados <strong>de</strong> un análisis estadístico <strong>de</strong> datos económicos haciendouso <strong>de</strong> las fuentes <strong>de</strong> información apropiadas y <strong>de</strong> los instrumentos informáticos necesarios.47


Estadística Actuarial: Análisis <strong>de</strong> RegresiónAl final <strong>de</strong> este tema <strong>de</strong>beríais ser capaces <strong>de</strong>:1. Diferenciar entre población y muestra.2. Relacionar los conceptos <strong>de</strong> población y variable aleatoria y conocer qué información sobre lapoblación proporcionan la función <strong>de</strong> <strong>de</strong>nsidad <strong>de</strong> probabilidad <strong>de</strong> una variable aleatoria, elvalor esperado y la varianza.3. Explicar la diferencia entre media poblacional y media muestral.4. Conocer la diferencia entre parámetro, estimador y estimación. Enten<strong>de</strong>r la razón <strong>de</strong> que unestimador sea una variable aleatoria con distribución asociada.5. Definir los conceptos <strong>de</strong> insesga<strong>de</strong>z y eficiencia.6. Elegir entre estimadores con un criterio estadístico.7. Conocer la diferencia entre estimación por punto y por intervalo.8. Interpretar un intervalo <strong>de</strong> confianza.9. Construir un intervalo <strong>de</strong> confianza para la media <strong>de</strong> una población normal con varianzaconocida y con varianza <strong>de</strong>sconocida.Bibliografía Recomendada:Al final <strong><strong>de</strong>l</strong> tema tenéis recogida la bibliografía correspondiente. En particular os recomendamosleer los capítulos correspondientes a la bibliografía básica <strong>de</strong>tallados a continuación:• Gujarati, D. y Porter, D.C. (2010). Apéndice A.• Newbold, P., Carlson, W.L. y Thorne, B. (2008). Cap. 8 salvo la sección 8.5 y Cap. 9 salvo lasección 9.3.• Ramanathan, R. (2002). Cap. 2.• Wooldridge, J.M. (2006). Apéndice C.48


Estadística Actuarial: Análisis <strong>de</strong> Regresión2.1. Introducción a la inferencia estadísticaEn el tema anterior vimos la diferencia entre población y muestra. La población es el conjunto <strong>de</strong>todos los elementos objeto <strong>de</strong> estudio mientras que la muestra es un subconjunto representativo<strong>de</strong> la población. Para <strong>de</strong>cir algo <strong>de</strong> las características <strong>de</strong> la población a partir <strong><strong>de</strong>l</strong> estudio <strong>de</strong> lamuestra utilizamos la inferencia estadística. Cualquier inferencia extraída <strong>de</strong> la población se basaen estadísticos muestrales.Una vez <strong>de</strong>finida la población, hay que especificar un mo<strong><strong>de</strong>l</strong>o para los datos que recoja las característicaspoblacionales que interesan. En Econometría suponemos que los datos X 1 , X 2 , . . . , X nson realizaciones <strong>de</strong> n variables aleatorias cuya distribución conjunta <strong>de</strong>pen<strong>de</strong> <strong>de</strong> varios parámetros<strong>de</strong>sconocidos Θ. Un mo<strong><strong>de</strong>l</strong>o para los datos especifica las características generales <strong>de</strong> la distribuciónjunto con el vector <strong>de</strong> parámetros <strong>de</strong>sconocidos Θ. Por ejemplo, supongamos que nos interesa conocerlas ventas medias <strong>de</strong> un <strong>de</strong>terminado mo<strong><strong>de</strong>l</strong>o <strong>de</strong> automóvil y la muestra está formada por 30 empresasconcesionarias. Suponemos que los valores recogidos <strong>de</strong> las ventas <strong>de</strong> los 30 concesionarios,X 1 , . . . , X 30 , son realizaciones <strong>de</strong> variables normales idéntica e in<strong>de</strong>pendientemente distribuidas,NID. Por tanto, el mo<strong><strong>de</strong>l</strong>o especificado para los datos es:X i ∼ NID(µ X , σ 2 X) (2.1)Los parámetros que <strong>de</strong>terminan la distribución son la media y la varianza <strong>de</strong> las ventas, que son<strong>de</strong>sconocidos, es <strong>de</strong>cir, Θ = (µ, σ 2 ). A<strong>de</strong>más, la media es el parámetro <strong>de</strong> interés en el estudio yqueremos apren<strong>de</strong>r sobre ella a partir <strong>de</strong> los datos.Para po<strong>de</strong>r <strong>de</strong>cir algo <strong>de</strong> la población a partir <strong>de</strong> la muestra disponemos <strong>de</strong> dos herramientas <strong>de</strong> laestadística, la estimación y el contraste <strong>de</strong> hipótesis. En la estimación se trata <strong>de</strong> calcular posiblesvalores para parámetros <strong>de</strong> interés, por ejemplo, el salario medio <strong>de</strong> los graduados en Finanzas ySeguros o el salario medio <strong>de</strong> las mujeres casadas con carga familiar y estudios superiores. En elcontraste <strong>de</strong> hipótesis hay que establecer una hipótesis o conjetura específica sobre la población, porejemplo, que no hay discriminación salarial por sexo o que la renta disponible <strong>de</strong>termina el consumo<strong>de</strong> las familias, y analizar los datos para <strong>de</strong>cidir si la hipótesis es correcta. En este tema veremosuna introducción al problema <strong>de</strong> la estimación y en el tema siguiente introduciremos el contraste<strong>de</strong> hipótesis.2.2. Estimadores puntualesLos parámetros son <strong>de</strong>sconocidos pero pue<strong>de</strong>n estimarse. El objetivo <strong>de</strong> la estimación es aproximarel valor <strong>de</strong> un conjunto <strong>de</strong> parámetros <strong>de</strong>sconocidos <strong>de</strong> una distribución a partir <strong>de</strong> las observacionesmuestrales <strong>de</strong> la misma. Denotaremos como θ a un parámetro <strong>de</strong>sconocido y Θ = (θ 1 , θ 2 , . . . , θ K ) ′ aun vector <strong>de</strong> K parámetros <strong>de</strong>sconocidos. Un estadístico es una función, o fórmula, que se calculaa partir <strong>de</strong> los datos contenidos en una muestra. La media muestral es un estadístico, la varianzamuestral es otro estadístico. Un estimador <strong>de</strong> un parámetro poblacional es una variable aleatoriaque <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la información <strong>de</strong> la muestra. Su valor proporciona aproximaciones al parámetro<strong>de</strong>sconocido. Notacionalmente un estimador <strong><strong>de</strong>l</strong> parámetro <strong>de</strong>sconocido θ es un estadístico quepreten<strong>de</strong> ser un aproximación a dicho parámetro <strong>de</strong>sconocido y se <strong>de</strong>nota por ˆθ. Una vez se aplica49


Estadística Actuarial: Análisis <strong>de</strong> Regresiónun estimador a la muestra se obtiene un valor numérico que se <strong>de</strong>nomina estimación. Un estimadorque genera un único valor <strong>de</strong> estimación se <strong>de</strong>nomina estimador por punto.2.2.1. Propieda<strong>de</strong>sSin embargo, no existe un único estimador. En el caso anterior hemos propuesto como estimador <strong>de</strong> lamedia poblacional a la media muestral pero igualmente podíamos haber propuesto como estimadora la mediana muestral. ¿Cuál elegir entonces? Para elegir entre estimadores po<strong>de</strong>mos basarnos enlas propieda<strong>de</strong>s <strong>de</strong> la distribución muestral <strong><strong>de</strong>l</strong> estimador. En general exigimos a los estimadoresque se aproximen al verda<strong>de</strong>ro valor <strong>de</strong> los parámetros, vamos a fijarnos en tres propieda<strong>de</strong>s enconcreto: insesga<strong>de</strong>z, eficiencia y error cuadrático medio.Insesga<strong>de</strong>z. Un estimador es insesgado si la media <strong>de</strong> su distribución empírica coinci<strong>de</strong> con elverda<strong>de</strong>ro valor <strong><strong>de</strong>l</strong> parámetro, es <strong>de</strong>cir,E(ˆθ) = θSi se pudieran obtener todas las posibles realizaciones muestrales <strong>de</strong> ˆθ, el promedio <strong>de</strong> todas estasestimaciones sería el verda<strong>de</strong>ro valor <strong><strong>de</strong>l</strong> parámetro. Es una propiedad <strong>de</strong>seable porque indica quesi un estimador es insesgado, el error <strong>de</strong> estimación, ˆθ − θ, se anula en promedio.Cuando E(ˆθ) ≠ θ se dice que el estimador es sesgado. Se <strong>de</strong>fine el sesgo <strong>de</strong> un estimador comoSesgo(ˆθ) = E(ˆθ) − θLa parte izquierda <strong>de</strong> la Figura 2.1 representa las distribuciones <strong>de</strong> tres estimadores <strong>de</strong> un mismoparámetro, θ: el estimador ˆθ 1 es insesgado; ˆθ 2 , tiene sesgo negativo, es <strong>de</strong>cir, en promedio subestima(subvalora) el valor <strong><strong>de</strong>l</strong> parámetro; finalmente el sesgo <strong>de</strong> ˆθ 3 es positivo, es <strong>de</strong>cir, este estimador enpromedio sobrestima (sobrevalora) el valor <strong><strong>de</strong>l</strong> parámetro.Figura 2.1: Sesgo y varianza <strong>de</strong> estimadoresUn ejemplo <strong>de</strong> estimador insesgado <strong>de</strong> la media poblacional, µ, <strong>de</strong> una distribución normal es lamedia muestral ˆµ = ¯X, ya que como se <strong>de</strong>mostró en el Tema 1, E( ¯X) = µ. Un estimador insesgado<strong>de</strong> la varianza <strong>de</strong> una distribución es la varianza muestral, ˆσ 2 = S 2 tal que E(ˆσ 2 ) = σ 2 .50


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEficiencia. Si nos fijamos únicamente en los estimadores insesgados, nos interesa establecer uncriterio para elegir un estimador <strong>de</strong>ntro <strong>de</strong> esta clase <strong>de</strong> estimadores. En la parte <strong>de</strong>recha <strong>de</strong> la Figura2.1 se representa la distribución <strong>de</strong> dos estimadores, ambos insesgados. Claramente, el estimador conmenor varianza, ˆθ 1 , tiene una probabilidad menor <strong>de</strong> obtener realizaciones alejadas <strong><strong>de</strong>l</strong> verda<strong>de</strong>rovalor <strong><strong>de</strong>l</strong> parámetro. Por tanto, se consi<strong>de</strong>ra que ˆθ 1 supera al estimador ˆθ 2 y se dice que ˆθ 1 es máseficiente que ˆθ 2 ya que V (ˆθ 1 ) < V (ˆθ 2 ).En general, si un estimador es el que tiene menor varianza <strong>de</strong>ntro <strong>de</strong> una clase <strong>de</strong> estimadores sedice que es el estimador eficiente <strong>de</strong>ntro <strong>de</strong> esa clase. Así, se dice que un estimador ˆθ es eficiente<strong>de</strong>ntro <strong>de</strong> la clase <strong>de</strong> estimadores insesgados si no hay otro estimador insesgado ˜θ con una varianzamenor:V (ˆθ) ≤ V (˜θ) ∀˜θ insesgadoPor ejemplo, la media <strong>de</strong> los datos es un estimador eficiente <strong>de</strong>ntro <strong>de</strong> la clase <strong>de</strong> estimadoresinsesgados <strong>de</strong> la media poblacional µ <strong>de</strong> una variable normal. Es <strong>de</strong>cir, se <strong>de</strong>muestra que, si X i ∼NID(µ, σ 2 ), i = 1, . . . , n, entonces para todo estimador insesgado <strong>de</strong> µ, ˜µ con E(˜µ) = µ:V ( ¯X) = σ2n ≤ V (˜µ)Si se trata <strong>de</strong> estimar un conjunto <strong>de</strong> K parámetros Θ, se dice que un estimador insesgado ̂Θes más eficiente que otro estimador insesgado ˜Θ si la diferencia [V ( ˜Θ) − V (̂Θ)] es una matrizsemi<strong>de</strong>finida positiva. Esto implica que cada elemento <strong>de</strong> ̂Θ tiene una varianza menor o igual queel correspondiente elemento <strong>de</strong> ˜Θ.Error cuadrático medio. Aunque la insesga<strong>de</strong>z es una propiedad <strong>de</strong>seable, esto no implica que unestimador insesgado siempre sea preferible a uno sesgado. La Figura 2.2 ilustra una situación en laque un estimador insesgado ˆθ 1 pue<strong>de</strong> <strong>de</strong>scartarse frente a otro sesgado, ˆθ 2 . El estimador ˆθ 1 tienemucha varianza, por lo que tiene una probabilidad mayor <strong>de</strong> obtener errores <strong>de</strong> estimación másgran<strong>de</strong>s que el estimador con menor varianza, ˆθ 2 , aunque este sea sesgado.Figura 2.2: Ejemplos <strong>de</strong> distribución <strong>de</strong> estimadoresEsto sugiere utilizar como criterio <strong>de</strong> elección <strong>de</strong> estimadores una medida <strong><strong>de</strong>l</strong> error <strong><strong>de</strong>l</strong> estimador.Se <strong>de</strong>fine el error cuadrático medio <strong>de</strong> un estimador:ECM(ˆθ) = E[(ˆθ − θ) 2 ] = V (ˆθ) + [sesgo(ˆθ)] 251


Estadística Actuarial: Análisis <strong>de</strong> Regresiónque se <strong>de</strong>scompone en un término <strong>de</strong> varianza y otro <strong>de</strong> sesgo. Así, entre un conjunto <strong>de</strong> estimadoresse elige aquel que tiene menor error cuadrático medio.Ejercicio 2.1Sea X ∼ N(µ, σ 2 ). Como estimador <strong>de</strong> la media poblacional se ha utilizado la mediamuestral <strong>de</strong> una muestra aleatoria simple. El valor estimado es 5. Di si son ciertas ofalsas las siguientes afirmaciones:1. Tomando muestras distintas pue<strong>de</strong>n obtenerse otras estimaciones.2. La distribución <strong>de</strong> estas estimaciones <strong>de</strong>be estar centrada entorno al verda<strong>de</strong>rovalor 5.Ejercicio 2.2Un profesor <strong>de</strong> Econometría encarga a sus estudiantes que elijan la mejor estimaciónposible <strong>de</strong> un parámetro <strong>de</strong> entre las alternativas disponibles en los libros <strong>de</strong> Econometría.El estudiante A propone un estimador insesgado tal que ˆθ = 5 V (ˆθ) = 8.El estudiante B propone un estimador insesgado tal que ˆθ ⋆ = 6 V (ˆθ ⋆ ) = 4.El estudiante C propone utilizar la media <strong>de</strong> las dos estimaciones ˆθ ⋆⋆ = 5, 5.¿Cuál <strong>de</strong> las tres estimaciones es más a<strong>de</strong>cuada? ¿ Por qué?2.2.2. Estimadores <strong>de</strong> la media y la varianzaLa media muestral <strong>de</strong> los datos, ¯X pue<strong>de</strong> ser un estimador <strong>de</strong> la media poblacional µX <strong>de</strong> una variablealeatoria X. La varianza muestral SX 2 <strong>de</strong> los datos es un estimador <strong>de</strong> su varianza poblacionalσ 2 X . Es <strong>de</strong>cir,ˆµ X = ¯X = 1 nn∑i=1X i ˆσ 2 X = S 2 X = 1n − 1n∑(X i − ¯X) 2 (2.2)i=1Ejemplo 2.1Supongamos que se dispone <strong><strong>de</strong>l</strong> salario medio por hora percibido 30 individuos. En laTabla 2.1 se recoge dicha información:La estimación <strong>de</strong> la media <strong><strong>de</strong>l</strong> salario medio por hora es:ˆµ X = ¯X =La estimación <strong>de</strong> la varianza es:3, 10 + 3, 24 + 3 + 6 + . . . + 7, 78 + 12, 5 + 12, 5 + 3, 2530ˆσ 2 X = S 2 X = (3, 10 − 7, 8547)2 + (3, 24 − 7, 8547) 2 + . . . + (3, 25 − 7, 8547) 230 − 152= 7, 8547= 23, 8778


Estadística Actuarial: Análisis <strong>de</strong> RegresiónIndividuo Salario Individuo Salario Individuo Salario1 3,10 11 6,25 21 6,882 3,24 12 8,13 22 8,483 3,00 13 8,77 23 6,334 6,00 14 5,5 24 0,535 5,30 15 22,2 25 66 8,75 16 17,33 26 9,567 11,25 17 7,5 27 7,788 5,00 18 10,63 28 12,59 3,60 19 3,6 29 12,510 18,18 20 4,5 30 3,25Tabla 2.1: Datos sobre salario medio por horaˆσ X = √ 23, 8778 = 4, 88652.3. Estimación por intervaloEn la Tabla 2.1 anterior se estima que el salario medio por hora oscila alre<strong>de</strong>dor <strong>de</strong> 7,8547 euros. Sinembargo, ¿qué confianza po<strong>de</strong>mos tener en este resultado? Por ejemplo, ¿valoraríamos igual estacantidad si se hubiera calculado con una muestra <strong>de</strong> 5 observaciones? La respuesta obvia es NO,sino que consi<strong>de</strong>ramos más fiables los resultados con 30 datos que con 5. Por tanto, un estimador<strong>de</strong>be complementarse con una medida <strong>de</strong> su fiabilidad o precisión.Un estimador es una variable aleatoria que <strong>de</strong>pen<strong>de</strong> <strong>de</strong> las variables X i , i = 1, . . . , n. Su distribución<strong>de</strong> probabilidad se <strong>de</strong>nomina distribución muestral o distribución empírica <strong><strong>de</strong>l</strong> estimador. En elejemplo anterior, si X i ∼ NID(µ, σ 2 ), entonces el estimador ˆµ = ¯X es una combinación lineal <strong>de</strong>n variables normales in<strong>de</strong>pendientes. En el Tema 1 se <strong>de</strong>mostró que su distribución muestral es:ˆµ = ¯X ∼ N(µ, σ 2 /n)De la distribución <strong>de</strong> la media muestral se <strong>de</strong>duce que la media muestral se distribuye alre<strong>de</strong>dor <strong><strong>de</strong>l</strong>a media poblacional y se concentra con más probabilidad alre<strong>de</strong>dor <strong>de</strong> µ cuanto mayor es el tamañomuestral n, es <strong>de</strong>cir cuanto menor es la varianza. Por tanto, hay mayor probabilidad <strong>de</strong> obtener unaestimación cercana a µ con 30 datos que con 5. En este caso, es sensato utilizar como indicador <strong><strong>de</strong>l</strong>a precisión a la <strong>de</strong>sviación típica σ/ √ n , menor <strong>de</strong>sviación típica, o lo que es igual menor varianza,indica mayor precisión. Normalmente, σ 2 es <strong>de</strong>sconocido, por lo que sustituimos su valor poblacionalpor el correspondiente muestral, ˆσ 2 = SX 2 . La estimación <strong>de</strong> la <strong>de</strong>sviación típica <strong>de</strong> la distribuciónmuestral <strong>de</strong> ¯X,√ˆσ ¯X = ˆσ 2¯X ˆσ ¯X= √ nse conoce como error típico <strong>de</strong> ¯X. En el ejemplo <strong><strong>de</strong>l</strong> salariomedio por hora obtenemos que el error típico <strong>de</strong> estimación es 4, 8865/ √ 30 = 0, 8921. Es fácilcomprobar que si obtuviéramos los mismos valores <strong>de</strong> ¯X y S X con una muestra <strong>de</strong> 5 observaciones,el error típico casi se multiplicaría por dos veces y media, S ¯X = 4, 8865/ √ 5 = 2, 185.53


Estadística Actuarial: Análisis <strong>de</strong> RegresiónUna forma <strong>de</strong> tener una mayor confianza en la estimación es obtener una estimación por intervalo.Un estimador por intervalo o estimador <strong>de</strong> un intervalo <strong>de</strong> confianza <strong>de</strong> un parámetro poblacionales una regla que utiliza la información muestral para hallar un intervalo que es probable que incluyaese parámetro.2.3.1. Intervalos <strong>de</strong> confianza y nivel <strong>de</strong> confianzaSea θ un parámetro <strong>de</strong>sconocido. Supongamos que utilizando la información muestral se hallandos variables aleatorias A y B tales que P (A < θ < B) = 1 − α, don<strong>de</strong> α es cualquier númerocomprendido entre 0 y 1. Si los valores muestrales específicos A y B son a y b, entonces el intervalo<strong>de</strong> a a b se llama intervalo <strong>de</strong> confianza <strong>de</strong> θ al 100(1 − α) %. La cantidad 100(1 − α) % se llamanivel <strong>de</strong> confianza <strong><strong>de</strong>l</strong> intervalo.Interpretación: Si se extraen repetidamente muestras aleatorias <strong>de</strong> la población, el verda<strong>de</strong>ro valor<strong><strong>de</strong>l</strong> parámetro θ se encontrará en el 100(1 − α) % <strong>de</strong> los intervalos calculados <strong>de</strong> esta forma. Elintervalo <strong>de</strong> confianza calculado <strong>de</strong> esta forma se expresa <strong>de</strong> la manera siguiente: a < θ < b a unnivel <strong>de</strong> confianza <strong><strong>de</strong>l</strong> 100(1 − α) %.2.3.2. Intervalos <strong>de</strong> confianza para la media <strong>de</strong> una población normal con varianzaconocidaSea X 1 , X 2 , . . . , X n una muestra <strong>de</strong> n observaciones extraídas <strong>de</strong> una población que sigue unadistribución normal <strong>de</strong> media µ <strong>de</strong>sconocida y varianza conocida σ 2 . Vamos a calcular un intervalo<strong>de</strong> confianza para la media poblacional al 100(1 − α) %. Sea¯X ∼ N(µ, σ2n)−→ Z = ¯X − µσ/ √ n∼ N(0, 1)Sea z α/2 el valor <strong>de</strong> la distribución normal estándar tal que la probabilidad <strong>de</strong> la cola superior esα/2. A continuación construimos el intervalo <strong>de</strong> confianza:P (−z α/2 < Z < z α/2 ) = 1 − αP (−z α/2 < ¯X−µσ/ √ n < z α/2) = 1 − αP (−z α/2σ √n < ¯X − µ < z α/2σ √n ) = 1 − αP(¯X − zα/2σ √n < µ < ¯X + z α/2σ √n)= 1 − αInterpretación: Si se extraen repetida e in<strong>de</strong>pendientemente muestras aleatorias <strong>de</strong> n observaciones<strong>de</strong> la población y se calculan intervalos <strong>de</strong> confianza al 100(1 − α) %, entonces el 100(1 − α) %contendrá el verda<strong>de</strong>ro valor <strong>de</strong> la media poblacional.Por ejemplo, fijado α = 5 %, z α/2 = 1, 96, el nivel <strong>de</strong> confianza es <strong><strong>de</strong>l</strong> 95 % y tenemos:(P ¯X − 1, 96 √ σ < µ < ¯X + 1, 96 σ )√ = 0, 95 (2.3)n n54


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLa ecuación (2.3) es un intervalo <strong>de</strong> confianza al 95 por ciento para µ, luego el intervalo aleatoriocontiene a µ con probabilidad 0, 95. Es <strong>de</strong>cir antes <strong>de</strong> obtener nuestra muestra aleatoria particularhay una probabilidad <strong><strong>de</strong>l</strong> 95 por ciento <strong>de</strong> que (2.3) contenga a µ. La ecuación (2.3) es un ejemplo <strong>de</strong>estimador por intervalo. El intervalo es aleatorio ya que los límites inferior y superior cambiancon las diferentes muestras.Interpretación: Si se extraen repetida e in<strong>de</strong>pendientemente100 muestras aleatorias<strong>de</strong> n observaciones <strong>de</strong> la población y secalculan 100 intervalos <strong>de</strong> confianza, entonces95 <strong>de</strong> ellos contendrán el verda<strong>de</strong>rovalor <strong>de</strong> la media poblacional. El gráficomuestra que la probabilidad <strong>de</strong> que unavariable aleatoria normal estándar se encuentreentre −1, 96 y 1, 96 es 0, 95.N(0, 1)0,40,350,30,250,20,150,1Región Crítica0,0250,05Región <strong>de</strong> Aceptación0,95Región Crítica0,0250−5 −4 −3 −2 −1 0 1 2 3 4 52.3.3. Intervalos <strong>de</strong> confianza para la media <strong>de</strong> una población normal con varianza<strong>de</strong>sconocida. La distribución t <strong>de</strong> Stu<strong>de</strong>ntSea X 1 , X 2 , . . . , X n una muestra <strong>de</strong> n observaciones extraídas <strong>de</strong> una población que sigue una distribuciónnormal <strong>de</strong> media µ <strong>de</strong>sconocida y varianza <strong>de</strong>sconocida σ 2 . Vamos a calcular un intervalo<strong>de</strong> confianza para la media poblacional al 100(1 − α) %. Sea¯X ∼ N) (µ, σ2n−→ Z = ¯X − µσ/ √ n∼ N(0, 1)En el caso <strong>de</strong> que la varianza σ 2 sea conocida, vimos en el apartado anterior que el intervalo <strong>de</strong>confianza 100(1 − α) % es:()σP ¯X − z α/2 √n < µ < ¯X σ+ z α/2 √n = 1 − αSin embargo si σ 2 es <strong>de</strong>sconocida el resultado no pue<strong>de</strong> ser utilizado directamente. También hemosvisto que la varianza muestral S 2 es un estimador <strong>de</strong> σ 2 por lo que para construir el intervalo <strong>de</strong>confianza po<strong>de</strong>mos utilizar el siguiente estadístico y distribución asociada:t = ¯X − µˆσ/ √ n ∼ t (n−1)siendo ˆσ 2 = S 2 . Sea t (v) α/2 el valor <strong>de</strong> la distribución t-Stu<strong>de</strong>nt con v grados <strong>de</strong> libertad tal quela probabilidad <strong>de</strong> la cola superior es α/2. El intervalo <strong>de</strong> confianza 100(1 − α) % para la mediapoblacional cuando la varianza es <strong>de</strong>sconocida es:()ˆσP ¯X − t (n−1) α/2 √n < µ < ¯X ˆσ+ t (n−1) α/2 √n = 1 − α55


Estadística Actuarial: Análisis <strong>de</strong> Regresióncon la misma interpretación que en el apartado anterior.Por ejemplo, para α = 5 % y n = 49 tenemos t (n−1)α/2 = t (48)0,025 = 2, luego:Ejemplo 2.2(P ¯X − 2 × √ ˆσ < µ < ¯X + 2 × ˆσ )√ = 0, 95n nUtilizando los datos <strong>de</strong> la Tabla 2.1 vamos a construir un intervalo <strong>de</strong> confianza al 95 %para la media <strong><strong>de</strong>l</strong> salario medio por hora.Para la variable X = Salario tenemos:ˆµ X = ¯X = 7, 8547 ; ˆσX 2 = S2 X= 23, 8778 ;ˆσ = 4, 8865 ; t (n−1)α/2 = t (30−1)0,025 = 2, 045(P ¯X − t (n−1)α/2 × √ ˆσ < µ < ¯X + t n (n−1)α/2 × √ ˆσ )= 0, 95 nP (7, 8547 − 2 × 0, 8921 < µ < 7, 8547 + 2 × 0, 8921) = 0, 95P (6, 070 < µ < 9, 6389) = 0, 95Concluimos que con confianza <strong><strong>de</strong>l</strong> 95 % la media poblacional estará entre los valores6, 070 y 9, 6389.2.3.4. Otros ejemplosA<strong>de</strong>más <strong>de</strong> construir intervalos <strong>de</strong> confianza para los parámetros <strong>de</strong> una población, como es la mediao la varianza también po<strong>de</strong>mos construir intervalos <strong>de</strong> confianza para estimar algunos parámetros <strong>de</strong>dos poblaciones. Por ejemplo un empresario pue<strong>de</strong> estar interesado en comparar la productividadmedia <strong>de</strong> sus trabajadores en dos plantas distintas, o po<strong>de</strong>mos estar interesados en comparar lamedia <strong><strong>de</strong>l</strong> salario medio por hora <strong>de</strong> hombres y mujeres. Para ello po<strong>de</strong>mos construir un intervalo<strong>de</strong> confianza para la diferencia <strong>de</strong> las medias. Veamos algunos ejemplos.Intervalos <strong>de</strong> confianza <strong>de</strong> la diferencia entre dos medias: muestras in<strong>de</strong>pendientesSupongamos que extraemos una muestra <strong>de</strong> n X observaciones <strong>de</strong> una población normal <strong>de</strong> media µ Xy varianza σX 2 y una muestra in<strong>de</strong>pendiente <strong>de</strong> n Y observaciones <strong>de</strong> una población normal <strong>de</strong> mediaµ Y y varianza σY 2 . Denotamos las medias muestrales respectivas por ¯X y Ȳ . Estamos interesadosen la diferencia <strong>de</strong> ambas medias, luego basamos la inferencia en dicha diferencia: ¯X − Ȳ . La mediay varianza <strong>de</strong> la variable aleatoria diferencia <strong>de</strong> medias es:E( ¯X − Ȳ ) = E( ¯X) − E(Ȳ ) = µ X − µ YV ( ¯X − Ȳ ) = V ( ¯X) − V (Ȳ ) = σ2 Xn X+ σ2 Yn Y56


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLa distribución <strong>de</strong> la variable aleatoria Z = ¯X − Ȳ combinación lineal <strong>de</strong> variables normales es unanormal:Z = ( ¯X − Ȳ ) − (µ x − µ y )√σ 2XnX+ σ2 Yn Y∼ N(0, 1)suponiendo que las varianzas son conocidas po<strong>de</strong>mos escribir el siguiente intervalo <strong>de</strong> confianza:⎛P ⎝( ¯X − Ȳ ) − z α/2√σ 2 Xn X+ σ2 Yn Y< µ X − µ Y < ( ¯X − Ȳ ) + z α/2√σ 2 Xn X+ σ2 Yn Y⎞⎠ = 0, 95Si las varianzas son <strong>de</strong>sconocidas se han <strong>de</strong> estimar con lo que la variable aleatoria Z ya no sigueuna distribución estándar sino una t-Stu<strong>de</strong>nt con v = n X +n Y −2 grados <strong>de</strong> libertad don<strong>de</strong> estamossuponiendo que las varianzas poblacionales aunque <strong>de</strong>sconocidas son iguales 1 .⎛P ⎝( ¯X − Ȳ ) − t (n X +n Y −2)α/2√ˆσ 2 Xn X+ ˆσ2 Yn Y√ ⎞< µ X − µ Y < ( ¯X − Ȳ ) + t ˆσX2(n X +n Y −2)α/2 + ˆσ2 Y ⎠ = 0, 95n X n YEjemplo 2.3Supongamos que disponemos <strong>de</strong> una muestra sobre salario medio por hora para 252mujeres proveniente <strong>de</strong> una población X ∼ N(µ X , σX 2 ) y una muestra <strong>de</strong> salario mediopor hora para 274 hombres proveniente <strong>de</strong> una población Y ∼ N(µ Y , σY 2 ) tal que:¯X = 4, 5877 ˆσ X = 2, 5294Ȳ = 7, 0995 ˆσ Y = 4, 1609Suponiendo que ambas muestras tienen varianza poblacional <strong>de</strong>sconocida pero igual, elintervalo <strong>de</strong> confianza al 100(1 − α) % para la diferencia <strong>de</strong> las medias es:(4, 5877 − 7, 0995) ± t (524)α/2√2, 5294 2252+4, 160922741 Los grados <strong>de</strong> libertad v <strong>de</strong>pen<strong>de</strong>n <strong><strong>de</strong>l</strong> supuesto que se realice sobre las varianzas <strong>de</strong> ambas poblaciones.• Si suponemos que las varianzas poblacionales son <strong>de</strong>sconocidas pero iguales: v = n X + n Y − 2. Este es elsupuesto más habitual.• Si suponemos que las varianzas poblacionales son <strong>de</strong>sconocidas y no son iguales y las muestras son <strong>de</strong> distintotamaño: v =[ˆσX2 ] 2+ ˆσ2 Yn X n Y(ˆσX 2 /n X )2 + (ˆσ2 Y /n Y )2(n X −1) (n Y −1)• Si suponemos⎛que las varianzas ⎞ poblacionales son <strong>de</strong>sconocidas y no son iguales y las muestras son <strong><strong>de</strong>l</strong> mismotamaño: v = ⎝1 +ˆσ 2 Xˆσ 2 Y2+ ˆσ2 Yˆσ 2 X⎠ × (n − 1)57


Estadística Actuarial: Análisis <strong>de</strong> RegresiónIntervalos <strong>de</strong> confianza <strong>de</strong> la diferencia entre dos medias: muestras <strong>de</strong>pendientesDos muestras son <strong>de</strong>pendientes si en los valores <strong>de</strong> una muestra influyen los <strong>de</strong> la otra. Los miembros<strong>de</strong> la muestra se eligen por pares, uno <strong>de</strong> cada población. Supongamos que se eligen n pares aleatorios(x 1 , y 1 ), (x 2 , y 2 ), . . . , (x n , y n ) extraídos <strong>de</strong> dos poblaciones X ∼ N(µ X , σ 2 X ) y Y ∼ N(µ Y , σ 2 Y )<strong>de</strong>pendientes. Denotamos por d y S d a la media y <strong>de</strong>sviación típicas muestrales observadas <strong>de</strong> las ndiferencias d i = x i − y i . Si suponemos que la distribución poblacional <strong>de</strong> las diferencias es normal,entonces tenemos el siguiente intervalo <strong>de</strong> confianza 100(1 − α) % <strong>de</strong> la diferencia entre las medias:¯d − t (n−1)α/2S d√ n< µ d < ¯d − t (n−1)α/2S d√ nEjercicio 2.3Supongamos que Y 1 , Y 2 , . . . , Y n constituyen una muestra aleatoria simple <strong>de</strong> una poblacióncon media µ y varianza σ 2 . Consi<strong>de</strong>ramos el siguiente estimador <strong>de</strong> µ:Y ⋆ = Y 1 + Y 221. Demostrar que Y ⋆ es un estimador insesgado.2. Obtener V (Y ⋆ ).∑3. Consi<strong>de</strong>ramos ahora Ȳ = ni=1 Y in. ¿Cuál <strong>de</strong> los dos estimadores es mejor?Ejercicio 2.4Supongamos que Y 1 , Y 2 , Y 3 constituyen una muestra aleatoria simple <strong>de</strong> una poblaciónN(µ, σ 2 ). Consi<strong>de</strong>ramos el siguiente estimador <strong>de</strong> µ:Ỹ = 1 2 Y 1 + 1 3 Y 2 + 1 6 Y 31. Demostrar que Ỹ es un estimador insesgado.2. Obtener V (Ỹ ).3. Consi<strong>de</strong>ramos ahora como estimador <strong>de</strong> µ amejor?Ȳ , ¿cuál <strong>de</strong> los dos estimadores esEjercicio 2.5Un diseñador <strong>de</strong> aviones en el proceso <strong>de</strong> diseño <strong><strong>de</strong>l</strong> interior <strong>de</strong> un avión está interesado enconocer el tamaño estándar <strong>de</strong> un asiento <strong>de</strong> forma que se maximice el espacio utilizableen el avión y que el mayor número <strong>de</strong> viajeros viaje cómodamente. Supongamos quela variable Y , medida <strong>de</strong> la ca<strong>de</strong>ra, es tal que Y ∼ N(µ, σ 2 ). La Tabla 2.2 recoge unamuestra <strong>de</strong> la medida <strong>de</strong> la ca<strong>de</strong>ra, en pulgadas, para 50 individuos adultos que vuelanhabitualmente.58


Estadística Actuarial: Análisis <strong>de</strong> RegresiónIndv. Medida Indv. Medida Indv. Medida Indv. Medida Indv. Medida1 14,96 11 14,76 21 15,97 31 15,71 41 17,772 17,34 12 17,89 22 17,19 32 13,53 42 17,813 16,40 13 18,36 23 16,87 33 17,89 43 16,904 19,33 14 17,59 24 15,26 34 17,31 44 19,265 17,69 15 16,64 25 13,90 35 13,71 45 16,036 17,50 16 20,23 26 16,40 36 17,92 46 15,867 15,84 17 16,98 27 20,40 37 14,91 47 16,568 18,69 18 16,23 28 15,94 38 20,00 48 16,719 18,63 19 14,21 29 19,08 39 19,22 49 20,2310 18,55 20 20,33 30 19,40 40 16,48 50 15,54Tabla 2.2: Tamaño <strong>de</strong> la ca<strong>de</strong>ra para 50 individuos.1. Realizar un análisis <strong>de</strong>scriptivo <strong>de</strong> los datos <strong>de</strong> la tabla. Calcular media, varianzay <strong>de</strong>sviación típica muestrales <strong>de</strong> la variable junto con el coeficiente <strong>de</strong> asimetría ycurtosis.2. Supongamos que se diseña una butaca <strong>de</strong> 18 pulgadas <strong>de</strong> ancho, ¿qué porcentaje<strong>de</strong> clientes no podrán volar?3. ¿Cuánto <strong>de</strong>bería medir la butaca para que pudiera volar el 95 % <strong>de</strong> la población?Ejercicio 2.6Para evaluar diferentes planes <strong>de</strong> jubilación para los trabajadores <strong>de</strong> una multinacionalcon una plantilla <strong>de</strong> miles <strong>de</strong> trabajadores la empresa <strong>de</strong>be <strong>de</strong>terminar la edad media<strong>de</strong> sus trabajadores. Asumiendo que la edad <strong>de</strong> los trabajadores sigue una distribuciónnormal y que la <strong>de</strong>sviación estandar es conocida e igual a 21 años, ¿cuál <strong>de</strong>be ser eltamaño <strong>de</strong> la muestra <strong>de</strong> trabajadores que se <strong>de</strong>be muestrear si queremos que el intervalo<strong>de</strong> confianza <strong><strong>de</strong>l</strong> 95 % <strong>de</strong> la edad media no sean más ancho <strong>de</strong> 4 años?59


Estadística Actuarial: Análisis <strong>de</strong> Regresión2.4. Bibliografía <strong><strong>de</strong>l</strong> temaReferencias bibliográficas básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editorial AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. OpenCourseWare. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[2] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[3] Esteban, M.V. (2007). Estadística Actuarial: Regresión. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[4] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08.Publicaciónon-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[5] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[6] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[7] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[8] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[9] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.60


Tema 3Contraste <strong>de</strong> hipótesisEn el tema anterior vimos algunos conceptos <strong>de</strong> la inferencia estadística para establecer conclusionessobre una población basándonos en la muestra y nos centramos en la estimación. En este tema nosvamos a centrar en la inferencia o contrate <strong>de</strong> hipótesis. Apren<strong>de</strong>remos a realizar contraste <strong>de</strong>hipótesis para po<strong>de</strong>r realizar afirmaciones sobre la población a partir <strong>de</strong> la información contenidaen una muestra. Para ello utilizaremos estadísticos calculados a partir <strong>de</strong> muestras aleatorias yvistos en los temas anteriores. Introduciremos los conceptos <strong>de</strong> hipótesis nula y alternativa así comoel concepto <strong>de</strong> estadístico y distribución muestral. Desarrollaremos el proceso <strong>de</strong> tomar <strong>de</strong>cisionespara rechazar o no la hipótesis nula y analizaremos los errores que po<strong>de</strong>mos cometer en el proceso<strong>de</strong> contrastar hipótesis. Finalmente aplicaremos los resultados a la media <strong>de</strong> una población normal.Competencias a trabajar en estas sesiones:1. Conocer distintos procedimientos <strong>de</strong> estimación <strong>de</strong> parámetros, así como sus propieda<strong>de</strong>s parapo<strong>de</strong>r seleccionar a<strong>de</strong>cuadamente la mejor alternativa <strong>de</strong> análisis.2. Aplicar la metodología estadística a<strong>de</strong>cuada para el diseño <strong>de</strong> contrastes <strong>de</strong> hipótesis para latoma <strong>de</strong> <strong>de</strong>cisiones en el ámbito profesional.5. Obtener e interpretar los resultados <strong>de</strong> un análisis estadístico <strong>de</strong> datos económicos haciendouso <strong>de</strong> las fuentes <strong>de</strong> información apropiadas y <strong>de</strong> los instrumentos informáticos necesarios.Al final <strong>de</strong> este tema <strong>de</strong>beríais ser capaces <strong>de</strong>:1. Conocer los elementos y etapas <strong>de</strong> un contraste <strong>de</strong> hipótesis.2. Formalizar la hipótesis nula y alternativa <strong>de</strong> un contraste.3. Conocer la diferencia entre nivel <strong>de</strong> significatividad y valor-p <strong>de</strong> un contraste.4. Definir el error tipo I y el error tipo II <strong>de</strong> una prueba.61


Estadística Actuarial: Análisis <strong>de</strong> Regresión5. Conocer la diferencia entre un contraste a una cola y un contraste a dos colas.Bibliografía Recomendada:Al final <strong><strong>de</strong>l</strong> tema tenéis recogida la bibliografía correspondiente. En particular os recomendamosleer los capítulos correspondientes a la bibliografía básica <strong>de</strong>tallados a continuación:• Gujarati, D. y Porter, D.C. (2010). Apéndice A.• Newbold, P., Carlson, W.L. y Thorne, B. (2008). Caps 10 y 11.• Ramanathan, R. (2002). Cap. 2.• Wooldridge, J.M. (2006). Apéndice C.62


Estadística Actuarial: Análisis <strong>de</strong> Regresión3.1. Concepto <strong>de</strong> hipótesis nula e hipótesis alternativaUno <strong>de</strong> los objetivos <strong>de</strong> la Estadística y <strong>de</strong> la Econometría es el contraste <strong>de</strong> hipótesis. La distribución<strong>de</strong> probabilidad <strong>de</strong> una v.a., f(X; θ) discreta o continua, <strong>de</strong>pen<strong>de</strong> <strong>de</strong> un parámetro θ que tomavalores en el espacio paramétrico Θ , θ ∈ Θ tal que, para cada valor que toma θ en Θ la funciónf(X; θ) es distinta. Una hipótesis estadística sobre el parámetro es una conjetura sobre el valorconcreto que tenga en la realidad. Para contrastar dicha hipótesis, o lo que es lo mismo, paraaceptarla o rechazarla, se diseñan pruebas estadísticas es <strong>de</strong>cir, se establece un criterio <strong>de</strong> contrastepara ver si po<strong>de</strong>mos consi<strong>de</strong>rar la hipótesis cierta o no.Un contraste <strong>de</strong> hipótesis tiene tres etapas: formulación <strong>de</strong> dos hipótesis opuestas; <strong>de</strong>rivación <strong>de</strong> unestadístico <strong>de</strong> contraste y su distribución muestral y <strong>de</strong>terminación <strong>de</strong> un criterio <strong>de</strong> <strong>de</strong>cisión paraelegir una <strong>de</strong> las dos hipótesis planteadas.Una hipótesis estadística es una afirmación sobre la distribución <strong>de</strong> una o varias variables aleatorias.En un contraste se trata <strong>de</strong> <strong>de</strong>cidir cuál, entre dos hipótesis planteadas, es la que mejor se a<strong>de</strong>cúaa los datos 1 . La hipótesis <strong>de</strong> interés se <strong>de</strong>nomina hipótesis nula, H 0 , y la supondremos ciertamientras no haya evi<strong>de</strong>ncia en contra. La hipótesis frente a la que se contrasta la nula se llamahipótesis alternativa, H 1 .Tanto las hipótesis nulas como alternativas pue<strong>de</strong>n ser simples o compuestas. Las hipótesis simplesespecifican un único valor para el parámetro poblacional y por tanto en ellas la distribución <strong>de</strong>probabilidad queda perfectamente <strong>de</strong>finida. En general especificaremos hipótesis nulas simples. Enla hipótesis compuesta se especifica un rango <strong>de</strong> valores para el parámetro poblacional. La hipótesisalternativa pue<strong>de</strong> ser a una cola o a dos colas. La hipótesis alternativa a una cola envuelve todoslos posibles valores <strong><strong>de</strong>l</strong> parámetro poblacional a un lado o a otro <strong><strong>de</strong>l</strong> valor especificado en la H 0 .La hipótesis alternativa a dos colas envuelve todos los valores posibles <strong><strong>de</strong>l</strong> parámetro poblacionalexcepto el especificado por la H 0 .La elección entre las hipótesis se basa en un estadístico <strong>de</strong> contraste, que es una función <strong>de</strong> losdatos que mi<strong>de</strong> la discrepancia entre estos y H 0 . Por ejemplo, si consi<strong>de</strong>ramos que el salario mediopor hora es una variable aleatoria normal po<strong>de</strong>mos plantearnos si los datos <strong><strong>de</strong>l</strong> salario medio porhora es compatible con una distribución con media 5 euros <strong>de</strong> salario medio por hora. En el contrastesobre la media trataremos <strong>de</strong> establecer si la diferencia entre la hipotética media poblacional 5 ey la media muestral 7,8547 e se <strong>de</strong>be únicamente a la naturaleza aleatoria <strong>de</strong> los datos. Para ellocontrastaremos el supuesto <strong>de</strong> que la media poblacional es 5 frente a la alternativa <strong>de</strong> que no lo seacontrastamos:H 0 : µ = 5 frente a H 1 : µ ≠ 5A partir <strong>de</strong> la distribución muestral <strong>de</strong> ¯X, ¯X ∼ N(µ, σ 2 /n) po<strong>de</strong>mos <strong>de</strong>finir el siguiente estadístico<strong>de</strong> contraste:¯X − µ= ¯X − 5σ/ √ nσ ¯X1 El establecimiento <strong>de</strong> una hipótesis sobre el parámetro <strong>de</strong>sconocido θ divi<strong>de</strong> su espacio paramétrico en dos partes,una integrada por los valores que cumplan la hipótesis, le llamaremos Θ 0 y otra formada por el conjunto <strong>de</strong> valoresque no la cumplen y que llamaremos Θ 1 . Θ 0 y Θ 1 son disjuntos por <strong>de</strong>finición, Θ 0 ∪ Θ 1 = Θ.63


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEsta discrepancia, que utilizaremos como estadístico <strong>de</strong> contraste, no <strong>de</strong>pen<strong>de</strong> <strong>de</strong> las unida<strong>de</strong>s <strong>de</strong>medida y tiene en cuenta la diferencia entre los datos (resumidos en ¯X) y el valor establecido enH 0 . A<strong>de</strong>más, <strong>de</strong>be conocerse la distribución <strong>de</strong> esta variable aleatoria cuando la hipótesis nula escorrecta. En el ejemplo, se <strong>de</strong>muestra que si los datos X 1 , X 2 , . . . , X n son una muestra aleatoria <strong>de</strong>un conjunto <strong>de</strong> variables X i ∼ NID(µ, σ 2 ) ∀i, con µ y σ 2 <strong>de</strong>sconocidas, entonces:¯X − µ∼ t(n − 1)y sustituyendo µ = 5, tenemos la distribución muestral <strong><strong>de</strong>l</strong> estadístico bajo H 0 :t = ¯X − 5ˆσ ¯Xˆσ ¯XH ∼0¯X − 5t(n − 1) −→ˆσ/ √ nH 0∼ t(n − 1) (3.1)Este estadístico se aplica mucho en la práctica y se <strong>de</strong>nomina estadístico t <strong>de</strong> la media. De formageneral po<strong>de</strong>mos escribirlo:√¯X − µn( ¯X − µ)∼ t(n − 1) o lo que es igual∼ t(n − 1)ˆσˆσ ¯XUn contraste o test <strong>de</strong> hipótesis es una regla <strong>de</strong> <strong>de</strong>cisión mediante la cual optamos por una uotra hipótesis. La cuestión es por cuál <strong>de</strong> las dos hipótesis nos inclinamos dada la informaciónproporcionada por una muestra aleatoria simple. Para ello se establece la regla o criterio <strong>de</strong><strong>de</strong>cisión que <strong>de</strong>termina la región crítica, subconjunto para el que se rechaza la H 0 . Para <strong>de</strong>terminarel criterio <strong>de</strong> <strong>de</strong>cisión <strong><strong>de</strong>l</strong> contraste se divi<strong>de</strong> el conjunto <strong>de</strong> posibles resultados <strong><strong>de</strong>l</strong> estadístico <strong>de</strong>contraste en dos zonas, la región crítica y su complementaria. Se rechaza H 0 cuando el valor <strong><strong>de</strong>l</strong>estadístico obtenido con la muestra, t m , pertenece a la región crítica. El punto <strong>de</strong> partida paraestablecer la región crítica es que se rechaza H 0 si la discrepancia entre datos y H 0 es gran<strong>de</strong>. En elcontraste bilateral, se rechazaría H 0 si ¯X se alejara mucho <strong><strong>de</strong>l</strong> valor establecido en H0 , lo que parael estadístico implica que:|t m | =¯X − 5∣ ∣ > c (3.2)S ¯Xdon<strong>de</strong> c es la discrepancia máxima que estamos dispuestos a asumir y se <strong>de</strong>nomina valor crítico. Encaso contrario, si |t m | ≤ c, no se rechaza la hipótesis nula. El valor <strong>de</strong> c <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la distribución <strong><strong>de</strong>l</strong>estadístico <strong>de</strong> contraste cuando H 0 es cierta y <strong><strong>de</strong>l</strong> error que estemos dispuestos a aceptar. Por ejemplopara una muestra <strong>de</strong> tamaño n = 30 y α = 5 % tenemos un valor c = t (n−1)|α = t (30−1)| 0,025 = 2, 045.2En el ejemplo que venimos siguiendo tendremos:7, 8547 − 5t m =4, 8865/ √ = 3, 199 > 2, 04530luego rechazamos la hipótesis nula para un nivel <strong>de</strong> significación <strong><strong>de</strong>l</strong> 5 %.3.2. Tipos <strong>de</strong> error en el contraste y potencia <strong>de</strong> un contrasteEl rechazo <strong>de</strong> la H 0 equivale a la aceptación <strong>de</strong> H 1 y viceversa. Se entien<strong>de</strong> la aceptación o rechazo<strong>de</strong> una hipótesis en el sentido <strong>de</strong> que la muestra ha proporcionado evi<strong>de</strong>ncia suficiente, aunque noabsoluta, para que sea razonable aceptar o rechazar la H 0 . Este proceso conlleva cometer errores,las posibilida<strong>de</strong>s son:64


Estadística Actuarial: Análisis <strong>de</strong> Regresión• La probabilidad <strong>de</strong> cometer el error Tipo I, rechazar cuando es cierta, se <strong>de</strong>nomina nivel <strong>de</strong>significación <strong><strong>de</strong>l</strong> contraste o tamaño <strong>de</strong> la región crítica y se <strong>de</strong>nota por α.• La probabilidad <strong>de</strong> cometer el error tipo II, no rechazar la hipótesis nula cuando ésta es falsa,se <strong>de</strong>nota por β y generalmente se utiliza su complementario a la unidad (1 − β) llamadapotencia <strong><strong>de</strong>l</strong> contraste (probabilidad <strong>de</strong> aceptar la hipótesis alternativa cuando es cierta)cuando las hipótesis son simples y función <strong>de</strong> potencia cuando son compuestas.Deseamos cometer el menor error, pero no es posible eliminar los dos errores simultáneamente, es<strong>de</strong>cir, que el tamaño sea 0 y la potencia igual a 1. En general, disminuir el error tipo I lleva consigoun aumento <strong><strong>de</strong>l</strong> error tipo II. Por ejemplo, no cometemos error tipo I si <strong>de</strong>cidimos no rechazar nuncala hipótesis nula; pero la potencia <strong><strong>de</strong>l</strong> contraste sería 0 porque tampoco rechazaremos H 0 cuandosea falsa. Daremos más importancia al error tipo I, por lo que elegiremos el tamaño <strong><strong>de</strong>l</strong> contraste;los niveles más habituales son 10 %, 5 % y 1 %. Para el tamaño elegido, trataremos <strong>de</strong> utilizar elcontraste con mayor potencia.Diseño <strong>de</strong> pruebas estadísticas. Para diseñar una prueba <strong>de</strong>bemos elegir una muestra, un estadístico,un nivel <strong>de</strong> significación y una región crítica. Normalmente se comienza eligiendo el nivel<strong>de</strong> significación α, es <strong>de</strong>cir acotando la probabilidad <strong>de</strong> cometer error Tipo I y para ello se fija laregión crítica a<strong>de</strong>cuada.• Fijamos la región crítica <strong>de</strong> forma que α sea pequeño, es <strong>de</strong>cir que el error sea pequeño,queremos que la probabilidad <strong>de</strong> rechazar H 0 cuando es cierta sea pequeña.• También trataremos <strong>de</strong> que sea pequeño el error Tipo II es <strong>de</strong>cir que la potencia <strong><strong>de</strong>l</strong> contrastesea máxima. En la práctica se acota la probabilidad <strong>de</strong> cometer error Tipo I, α y <strong>de</strong>spués setrata <strong>de</strong> minimizar la probabilidad <strong>de</strong> cometer error Tipo II, β. Cuando minimizamos la P (I)aumenta P (II) por tanto cuando aceptamos H 0 <strong>de</strong>bemos tener en cuenta que la potencia <strong><strong>de</strong>l</strong>contraste sea suficiente.3.3. El p-valor y conclusiones <strong><strong>de</strong>l</strong> contrasteOtra forma <strong>de</strong> llevar a cabo el contraste es utilizar el valor-p. Este valor es una probabilidad eindica cuál sería el menor nivel <strong>de</strong> significación que se tendría que elegir para rechazar la hipótesisnula, dada la realización muestral <strong><strong>de</strong>l</strong> estadístico. Si el contraste es a dos colas, el valor-p es dos vecesel área a la <strong>de</strong>recha <strong>de</strong> la realización muestral <strong><strong>de</strong>l</strong> estadístico en valor absoluto, en la distribución<strong>de</strong> éste bajo la hipótesis nula, esto esvalor-p = 2 P(t j > t m j |H 0 )Si el contraste es a una cola, el valor-p sería el área a la <strong>de</strong>recha <strong>de</strong> la realización muestral <strong><strong>de</strong>l</strong>estadístico en valor absoluto, en la distribución <strong>de</strong> éste bajo la hipótesis nula, esto es valor-p =65


Estadística Actuarial: Análisis <strong>de</strong> RegresiónP(t j > t m j |H 0). A mayor valor-p, mayor sería la probabilidad <strong>de</strong> error <strong>de</strong> tipo I si elegimos rechazarla hipótesis nula. Luego a mayor valor-p menor evi<strong>de</strong>ncia contra la hipótesis nula y por el contrarioa menor valor-p mayor evi<strong>de</strong>ncia contra la hipótesis nula. El cálculo <strong><strong>de</strong>l</strong> valor-p es más complicadoque elegir el nivel <strong>de</strong> significatividad a priori por lo que generalmente se realiza en el or<strong>de</strong>nador.3.4. Pasos en la realización <strong>de</strong> un contrasteResumiendo un contraste <strong>de</strong> hipótesis tiene las siguientes etapas:1) Formulación <strong>de</strong> dos hipótesis opuestas, hipótesis nula, H 0 e hipótesis alternativa H 1 .2) Derivación <strong><strong>de</strong>l</strong> estadístico <strong>de</strong> contraste correspondiente y su distribución.3) Seleccionar el nivel <strong>de</strong> significatividad α o probabilidad <strong>de</strong> cometer error tipo I.4) Cálculo muestral <strong><strong>de</strong>l</strong> estadístico y aplicación <strong><strong>de</strong>l</strong> criterio <strong>de</strong> <strong>de</strong>cisión para elegir una <strong>de</strong> las doshipótesis. El criterio <strong>de</strong> <strong>de</strong>cisión es: si el valor muestral <strong><strong>de</strong>l</strong> estadístico es mayor que el valorc, el valor en tablas <strong>de</strong> la distribución para el nivel <strong>de</strong> significatividad elegido, se rechaza lahipótesis nula. En caso contrario se acepta.Si alternativamente utilizamos el valor-p, una vez calculado éste la regla <strong>de</strong> <strong>de</strong>cisión es sivalor-p < α se rechaza H 0 . Si valor-p > α no se rechaza H 0El contraste <strong>de</strong> hipótesis también pue<strong>de</strong> realizarse mediante un intervalo <strong>de</strong> confianza. En ese casolos pasos 1), 2) y 3) no cambian. En el paso 4) se calcula el intervalo <strong>de</strong> confianza a 100(1 − α) % yse comprueba si el valor <strong><strong>de</strong>l</strong> parámetro según la hipótesis nula pertenece al intervalo, en cuyo casose acepta la hipótesis nula. En caso contrario se rechaza. Notar que la región <strong>de</strong> aceptación es lacomprendida <strong>de</strong>ntro <strong><strong>de</strong>l</strong> intervalo <strong>de</strong> confianza.3.5. Aplicaciones3.5.1. Contrastes <strong>de</strong> la media <strong>de</strong> una distribución normalEjemplo: zona crítica en un contraste bilateral sobre la media <strong>de</strong> una distribución normal.Veamos cómo se <strong>de</strong>termina el valor crítico c en el ejemplo sobre la media <strong><strong>de</strong>l</strong> precio. El tamaño αes la probabilidad <strong>de</strong> rechazar H 0 cuando ésta es cierta. Como (3.2) es la condición para rechazary (3.1) es la distribución <strong><strong>de</strong>l</strong> estadístico cuando H 0 es cierta, esto implica que:α = P rob(|t| > c) cuando el estadístico t ∼ t(n − 1)En este caso, rechazaremos H 0 si el valor <strong><strong>de</strong>l</strong> estadístico t obtenido con los datos es un valor pocoprobable en la distribución <strong><strong>de</strong>l</strong> estadístico bajo H 0 .66


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEste gráfico muestra la distribución <strong><strong>de</strong>l</strong> estadísticosi H 0 : µ = 5 es cierta. La región crítica es la zonapunteada en las dos colas <strong>de</strong> la distribución, <strong>de</strong>modo que en cada cola se acumula una probabilidadα/2. Así, c es la or<strong>de</strong>nada <strong>de</strong> la distribución t(n − 1)que <strong>de</strong>ja en la cola <strong>de</strong>recha una probabilidad α/2.Por ejemplo, para α = 0, 05 y n = 30, entonces,c = 2, 045 y se rechaza H 0 al nivel <strong>de</strong> significación<strong><strong>de</strong>l</strong> 5 % si |t m | > 2, 01.Ejemplo 3.2Con los datos <strong>de</strong> la Tabla 2.1 contrastamos: H 0 : µ = 0 frente a H 1 : µ ≠ 0 con elestadístico:t = ¯X − 0ˆσ/ √ H ∼0t(n − 1)nque aplicado a la muestra:t m =7, 85474, 8865/ √ 30 = 8, 804 > 2, 045 = t (30−1)| 0,052luego rechazamos H 0 para α = 5 %.Ejemplo 3.3= t (30−1)| 0,025Con los datos <strong>de</strong> la Tabla 2.1 contrastamos: H 0 : µ = 8 frente a H 1 : µ ≠ 8 con elestadístico:t = ¯X − 8ˆσ/ √ H ∼0t(n − 1)nque aplicado a la muestra:t m =7, 8547 − 8∣4, 8865/ √ 30∣ = | − 0, 1628| < 2, 045 = t (30−1)| 0,05 = t (30−1)| 0,0252luego no rechazamos H 0 para α = 5 %.Ejemplo: región crítica en el contraste unilateral sobre la media <strong>de</strong> una distribución normal. Enlos estudios econométricos a veces se plantean contrastes a una cola. En el estudio sobre el salariomedio por hora supongamos que interesa contrastar si la media es cinco o mayor que cinco, por loque planteamos las hipótesis:H 0 : µ = 5 frente a H 1 : µ > 5Al mantenerse la misma hipótesis nula, el estadístico <strong>de</strong> contraste es (3.1), que bajo H 0 sigue unadistribución t(n − 1). La hipótesis alternativa <strong>de</strong>termina el criterio <strong>de</strong> <strong>de</strong>cisión. Rechazaremos H 0cuando la discrepancia tome valores alejados <strong>de</strong> H 0 y compatibles con H 1 , es <strong>de</strong>cir, cuando t tomevalores positivos gran<strong>de</strong>s. La región crítica está <strong>de</strong>finida por la condición t > c. El valor crítico c se<strong>de</strong>termina por:α = P (t > c) cuando el estadístico t ∼ t(n − 1)67


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLa región crítica <strong><strong>de</strong>l</strong> contraste es la zona punteadaen una cola <strong>de</strong> la distribución, la <strong>de</strong>recha.Así, c es la or<strong>de</strong>nada <strong>de</strong> la distribución t(n − 1)que acumula en la cola <strong>de</strong>recha una probabilidadα.Por ejemplo, si α = 0, 05 y n = 30, entonces elnivel crítico es c = 1, 699 y no se rechaza H 0 alnivel <strong>de</strong> significación <strong><strong>de</strong>l</strong> 5 % si t m < 1, 699.En general, se usan las expresiones rechazar o no rechazar H 0 . Esto es así porque en un contrastemantenemos la H 0 mientras no haya suficiente evi<strong>de</strong>ncia en contra. Los datos pue<strong>de</strong>n rechazar lahipótesis, pero no pue<strong>de</strong>n probar que H 0 sea correcta, por lo que no se dice que se acepta H 0 . Norechazar H 0 significa que los datos no son capaces <strong>de</strong> mostrar su falsedad.Ejemplo 3.4Con los datos <strong>de</strong> la Tabla 2.1 contrastamos: H 0 : µ = 8 frente a H 1 : µ > 8 con elestadístico:t = ¯X − 8ˆσ/ √ H ∼0t(n − 1)nque aplicado a la muestra:luego no rechazamos H 0 para α = 5 %.t m = | − 0, 1628| < 1, 699 = t (30−1)| 0,05Ejemplo: utilización <strong>de</strong> los intervalos <strong>de</strong> confianza para la realización <strong>de</strong> contrastes. En el Tema2 se construyó, utilizando los datos <strong>de</strong> la Tabla 2.1, un intervalo <strong>de</strong> confianza al 95 % para la media<strong><strong>de</strong>l</strong> salario medio por hora. El intervalo construido es el siguiente:P (6, 070 < µ < 9, 6389) = 0, 95Este intervalo pue<strong>de</strong> utilizarse para realizar contraste <strong>de</strong> hipótesis, por ejemplo si queremos contrastar:H 0 : µ = 8 frente a H 1 : µ ≠ 8 basta con que comprobemos si el valor 8 está o no <strong>de</strong>ntro<strong><strong>de</strong>l</strong> intervalo; 8 ∈ IC 0,95 (µ) luego no rechazamos la hipótesis nula.Para el contraste: H 0 : µ = 0 frente a H 1 : µ ≠ 0 obtendríamos con el mismo intervalo <strong>de</strong>confianza 0 ∉ IC 0,95 (µ) luego rechazamos la hipótesis nula. Lo cual es lógico ya que <strong><strong>de</strong>l</strong> propiointervalo <strong>de</strong> confianza concluimos que con confianza <strong><strong>de</strong>l</strong> 95 % la media poblacional estará entre losvalores 6, 070 y 9, 6389.3.5.2. Otros ejemplosEjemplo: contrate <strong>de</strong> igualdad <strong>de</strong> medias Este es un contraste muy habitual, por ejemplo, enestudios sociales interesa analizar si hay discriminación salarial, <strong>de</strong> modo que las mujeres perciben68


Estadística Actuarial: Análisis <strong>de</strong> Regresiónsalarios más bajos que los hombres. Habitualmente, se contrasta la hipótesis nula <strong>de</strong> que la media<strong><strong>de</strong>l</strong> salario que perciben las mujeres es igual al salario medio <strong>de</strong> los hombres frente a la hipótesisalternativa <strong>de</strong> que la media <strong><strong>de</strong>l</strong> salario es mayor en el grupo <strong>de</strong> hombres.Para ejemplarizar este contraste vamos a retomar el Ejemplo 2.3 <strong><strong>de</strong>l</strong> Tema 2. En este ejemplodisponíamos <strong>de</strong> dos muestras normales in<strong>de</strong>pendientes, con varianzas poblacionales iguales pero<strong>de</strong>sconocidas. Una muestra sobre salario medio por hora para 252 mujeres proveniente <strong>de</strong> unapoblación X ∼ N(µ X , σX 2 ) y una muestra <strong>de</strong> salario medio por hora para 274 hombres proveniente<strong>de</strong> una población Y ∼ N(µ Y , σY 2 ) tal que:¯X = 4, 5877 ˆσ X = 2, 5294Ȳ = 7, 0995 ˆσ Y = 4, 1609Con estos datos construíamos el siguiente intervalo <strong>de</strong> confianza al 100(1 − α) % para la diferencia<strong>de</strong> las medias:(4, 5877 − 7, 0995) ± t (524)α/2√2, 5294 2252+4, 16092274Para contrastar la hipótesis <strong>de</strong> que la media <strong><strong>de</strong>l</strong> salario medio por hora que perciben las mujeres esigual la media <strong><strong>de</strong>l</strong> salario medio por hora <strong>de</strong> los hombres frente a la hipótesis alternativa <strong>de</strong> que lamedia es mayor en el grupo <strong>de</strong> hombres, planteamos H 0 : µ Y = µ X frente a H 1 : µ Y > µ X .El procedimiento <strong>de</strong> contraste se basa en la comparación <strong>de</strong> las dos medias muestrales, Ȳ y ¯X.Pequeñas diferencias entre ellas apoyan la H 0 . El estadístico <strong>de</strong> contraste y su distribución bajo H 0son:t =(Ȳ − ¯X)S√1n X+ 1n YH 0∼ t(nX +n Y −2)don<strong>de</strong> S 2 es el estimador <strong>de</strong> la varianza común utilizando todos los datos:El valor muestral <strong><strong>de</strong>l</strong> estadístico es:t m =S 2 = (n X − 1)ˆσ 2 X + (n Y − 1)ˆσ 2 Yn X + n Y − 27, 0995 − 4, 5877√(252 − 1) 2, 5294 2 + (274 − 1) 4, 1609 2252 + 274 − 2√1252 + 1274= 8, 278523Dada H 1 , rechazamos H 0 si la diferencia (Ȳ − ¯X) es gran<strong>de</strong>. La región crítica, por tanto, está <strong>de</strong>finidapor t > c, siendo c el valor crítico. El contrate es a una cola, 8, 278523 > 1, 64 = t (524)| 0,05 luegorechazamos la hipótesis nula para α = 5 %.Ejemplo: contraste <strong>de</strong> igualdad <strong>de</strong> varianzas. En el contraste anterior hemos supuesto que lasvarianzas <strong>de</strong> ambas distribuciones normales aunque <strong>de</strong>sconocidas, eran iguales. Este supuesto sepue<strong>de</strong> contrastar. Vamos a contrastar si la varianza es la misma en ambas distribuciones frente a69


Estadística Actuarial: Análisis <strong>de</strong> Regresiónque sea menor para la muestra que recoge los salarios medios por hora en las mujeres. Por tanto,planteamos el contraste <strong>de</strong> hipótesis:H 0 : σ 2 Y = σ 2 X frente a H 1 : σ 2 Y > σ 2 XEl procedimiento <strong>de</strong> contraste consiste en comparar las dos varianzas muestrales, ˆσX 2 y ˆσ2 Y, que sonestimadores insesgados <strong>de</strong> las respectivas varianzas poblacionales. Valores cercanos <strong>de</strong> ˆσX 2 y ˆσ2 Y , oratios ˆσY 2 /ˆσ2 X ≃ 1, apoyan H 0. El estadístico <strong>de</strong> contraste y su distribución bajo H 0 son:F = ˆσ2 Yˆσ 2 XH 0∼ F(nY − 1, n X − 1)Dada H 1 , rechazamos H 0 si el ratio ˆσY 2 /ˆσ2 Xestá muy por encima <strong>de</strong> 1. La región crítica, portanto, está <strong>de</strong>finida por ˆσY 2 /ˆσ2 X> c, siendo c el valor crítico. El valor muestral <strong><strong>de</strong>l</strong> estadístico es:F m = 4,160862 = 2, 7061 > 1 = F2,52936 2 (273, 251)| 0,05 luego rechazamos H 0 para α = 5 %.Ejercicio 3.1Utilizando los datos <strong>de</strong> la Tabla 2.2:1. Calcular un intervalo <strong>de</strong> confianza 95 % para la media <strong>de</strong> la distribución.2. Contrastar H 0 : µ = 16, 5 H 1 : µ > 16, 5.3. Contrastar H 0 : µ = 17 H 1 : µ ≠ 17.70


Estadística Actuarial: Análisis <strong>de</strong> Regresión3.6. Bibliografía <strong><strong>de</strong>l</strong> temaReferencias bibliográficas básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editoral AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. OpenCourseWare. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[2] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[3] Esteban, M.V. (2007). Estadística Actuarial: Regresión. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[4] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08. Publicaciónon-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[5] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[6] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[7] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[8] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[9] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.71


72Estadística Actuarial: Análisis <strong>de</strong> Regresión


Tema 4Mo<strong><strong>de</strong>l</strong>o econométrico: introducciónEn los temas anteriores se ha analizado el comportamiento <strong>de</strong> una variable, sin relacionarla con otras.En este tema y los dos siguientes vamos a abordar cómo se relacionan las variables entre sí. De ellose ocupa la Econometría. Así, en estos temas apren<strong>de</strong>remos a interpretar la información estadísticasobre la realidad económica. La importancia <strong>de</strong> la Econometría va más allá <strong>de</strong> la disciplina <strong>de</strong> laeconomía. La Econometría es un conjunto <strong>de</strong> instrumentos <strong>de</strong> investigación empleados en finanzas,marketing, dirección <strong>de</strong> empresas, negocios, historia, sociología incluso agronomía.La herramienta básica es un mo<strong><strong>de</strong>l</strong>o econométrico que conjuga los esquemas teóricos sobre el funcionamiento<strong>de</strong> la Economía con las técnicas estadísticas <strong>de</strong> análisis <strong>de</strong> datos. Un mo<strong><strong>de</strong>l</strong>o pue<strong>de</strong> teneruna estructura muy compleja, pero nos centramos en el mo<strong><strong>de</strong>l</strong>o más sencillo, y que da contenidoa buena parte <strong>de</strong> la asignatura, el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal general. Este mo<strong><strong>de</strong>l</strong>o explica elcomportamiento <strong>de</strong> una única variable económica mediante un conjunto <strong>de</strong> variables. En este tema<strong>de</strong>finiremos la disciplina <strong>de</strong> la Econometría e introduciremos conceptos relacionados con un mo<strong><strong>de</strong>l</strong>oeconométrico: los datos, las variables, los parámetros, entre otros elementos <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o.El <strong>de</strong>sarrollo <strong>de</strong> la Econometría ha sido enormemente facilitado por el avance en la informática. Elcurso, con gran componente aplicado necesita complementarse con el aprendizaje <strong>de</strong> un softwareeconométrico. El paquete econométrico a utilizar es gretl; se trata <strong>de</strong> software <strong>de</strong> libre uso, fácil<strong>de</strong> manejar y que tiene acceso a las bases <strong>de</strong> datos que se estudian en muchos libros <strong>de</strong> análisiseconométrico. El alumno <strong>de</strong>berá apren<strong>de</strong>r su manejo, en paralelo con los conceptos estadísticos yeconométricos, y a interpretar a<strong>de</strong>cuadamente los resultados obtenidos.Competencias a trabajar en estas sesiones:4. Analizar <strong>de</strong> forma crítica los elementos básicos <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os econométricos para compren<strong>de</strong>rla lógica <strong>de</strong> la mo<strong><strong>de</strong>l</strong>ización econométrica y po<strong>de</strong>r especificar relaciones causales entre variableseconómicas.Al final <strong>de</strong> este tema <strong>de</strong>beríais ser capaces <strong>de</strong>:1. Distinguir entre un mo<strong><strong>de</strong>l</strong>o económico y un mo<strong><strong>de</strong>l</strong>o econométrico.73


Estadística Actuarial: Análisis <strong>de</strong> Regresión2. Conocer las etapas en la realización <strong>de</strong> un trabajo aplicado.3. Distinguir los diferentes tipos <strong>de</strong> datos empleados en el análisis econométrico.4. Distinguir las diferentes variables implicadas en un mo<strong><strong>de</strong>l</strong>o econométrico.5. Distinguir entre parámetros <strong>de</strong> la relación económica y parámetros <strong>de</strong> la relación probabilística.6. Distinguir entre estimador y estimación.7. En gretl : Leer datos en gretl , tanto archivos <strong>de</strong> muestra como archivos propios. Introducirdatos en gretl y realizar un análisis <strong>de</strong>scriptivo básico.Bibliografía Recomendada:Al final <strong><strong>de</strong>l</strong> tema tenéis recogida la bibliografía correspondiente. En particular se os recomienda leerlos capítulos correspondientes a la bibliografía básica <strong>de</strong>tallados a continuación:• Gujarati, D. y Porter, D.C. (2010). Introducción.• Newbold, P., Carlson, W.L. y Thorne, B. (2008). Cap. 1.• Ramanathan, R. (2002). Cap. 1.• Ruiz Maya, L. y Martín Pliego, F.J. (2005). Introducción.• Wooldridge, J.M. (2006). Cap. 1.74


Estadística Actuarial: Análisis <strong>de</strong> Regresión¿Qué es la Econometría?Econometría en sentido estricto significa medida <strong>de</strong> la economía. La Econometríase ocupa <strong>de</strong> formular, cuantificar y valorar las relaciones entre variables económicas,para ello necesita <strong>de</strong> otras materias como son la Teoría Económica, la Estadística y lasMatemáticas.La Econometría se ocupa <strong><strong>de</strong>l</strong> estudio <strong>de</strong> estructuras que permitan analizar característicaso propieda<strong>de</strong>s <strong>de</strong> una variable económica utilizando como causas explicativas otrasvariables económicas. (Novales, 1993)4.1. Mo<strong><strong>de</strong>l</strong>o económico y mo<strong><strong>de</strong>l</strong>o econométricoComo es sabido la Teoría Económica se ocupa <strong><strong>de</strong>l</strong> análisis <strong>de</strong> la economía, como consecuencia <strong><strong>de</strong>l</strong>mismo formula las relaciones existentes entre las variables económicas objeto <strong>de</strong> estudio. Sin embargola teoría Económica no se ocupa <strong>de</strong> cuantificarlas, éste es un cometido específico <strong>de</strong> la Econometría,que sí tiene como objetivo cuantificar las relaciones entre variables. Unido a este objetivo aparece unpilar clave para la Econometría que es la disponibilidad <strong>de</strong> información cuantificada sobre las variablesque son objeto <strong>de</strong> estudio, en <strong>de</strong>finitiva lo que llamamos datos. Las Matemáticas nos serviránpara escribir en términos <strong>de</strong> ecuaciones las teorías económicas objeto <strong>de</strong> estudio y la Estadística nosproporciona instrumentos para el tratamiento <strong>de</strong> datos que nos permiten cuantificar las relaciones yvalorar los resultados <strong>de</strong> acuerdo a criterios establecidos. En ocasiones nos encontraremos con problemasespecíficos para los que la estadística no tiene solución y por ello necesitaremos <strong>de</strong>sarrollarlos instrumentos y métodos apropiados para llevar a cabo los objetivos.Resumiendo, podríamos <strong>de</strong>cir que los objetivos <strong>de</strong> la Econometría son: verificación <strong>de</strong> una teoría,estudio <strong><strong>de</strong>l</strong> pasado, <strong>de</strong>scripción <strong><strong>de</strong>l</strong> presente, predicción <strong><strong>de</strong>l</strong> futuro y orientación <strong>de</strong> la acción política.Para tratar <strong>de</strong> enten<strong>de</strong>r las relaciones entre la Econometría y las otras materias mencionadas en elapartado anterior vamos a <strong>de</strong>sarrollar un ejemplo.Supongamos que somos el gerente <strong>de</strong> una empresa y que estamos interesados en la relación existenteentre las ventas <strong>de</strong> un producto <strong>de</strong> la empresa y su precio, las condiciones <strong>de</strong> la competencia y elciclo económico. Un mo<strong><strong>de</strong>l</strong>o que tiene en cuenta estos supuestos podría ser el siguiente:V t = f(p t , pc t , c t ) (4.1)Siendo V las ventas <strong>de</strong> la empresa y p el precio <strong><strong>de</strong>l</strong> producto, la variable pc es el precio <strong>de</strong> lacompetencia y nos sirve para aproximar las condiciones <strong>de</strong> la competencia. La variable c recoge elmomento <strong><strong>de</strong>l</strong> ciclo económico y sirve para aproximar las condiciones <strong>de</strong> mercado. El subíndice t<strong>de</strong>nota el tiempo o momento en el que se consi<strong>de</strong>ra la relación. La ecuación anterior postula quelas ventas son función <strong><strong>de</strong>l</strong> precio <strong><strong>de</strong>l</strong> producto, el precio <strong>de</strong> la competencia y <strong><strong>de</strong>l</strong> ciclo económico.A<strong>de</strong>más la Teoría Económica nos dice que la relación entre ventas y precio es inversa, es <strong>de</strong>cir, amayor precio menores ventas. Sin embargo será positiva con respecto al precio <strong>de</strong> la competencia yaque si el precio <strong>de</strong> la competencia sube y el propio se mantiene es lógico que se espere ven<strong>de</strong>r más.De igual manera se ven<strong>de</strong>rá más en momentos <strong>de</strong> auge económico que en momentos <strong>de</strong> <strong>de</strong>presiónpor lo que la relación entre las ventas y el ciclo económico también se esperará que sea positiva.75


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEl gerente también dispondrá <strong>de</strong> información en forma <strong>de</strong> cifras o datos sobre cuales eran lasventas correspondientes a los diferentes precios que ha podido alcanzar su producto, el precio <strong><strong>de</strong>l</strong>a competencia y el momento <strong><strong>de</strong>l</strong> ciclo económico, variable que pue<strong>de</strong> aproximarse a una variablecuantitativa que se mueva con el ciclo económico, por ejemplo el Índice <strong>de</strong> Producción Industrial.Por ahora como gerentes <strong>de</strong> la empresa disponemos <strong>de</strong> dos informaciones distintas. Por un ladodisponemos <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o económico que nos relaciona un conjunto <strong>de</strong> variables y por otro disponemos<strong>de</strong> observaciones o datos sobre las mismas para un periodo <strong>de</strong> tiempo dado. El gerente tambiéndispone <strong>de</strong> un objetivo que es saber como respon<strong>de</strong>n las ventas <strong>de</strong> su producto a cambios en suprecio. Para unir ambos conjuntos <strong>de</strong> información po<strong>de</strong>mos empezar por dar forma a la función.La elección más sencilla sería tomar una relación lineal, que para la ecuación (4.1) <strong>de</strong>terminaría elsiguiente mo<strong><strong>de</strong>l</strong>o:V t = β 1 + β 2 p t + β 3 pc t + β 4 c t (4.2)Los parámetros o coeficientes <strong>de</strong> cada variable se representan por β 1 , β 2 y β 3 . El coeficiente β 2le indica al gerente cuanto cambian las ventas si el precio <strong>de</strong> su producto cambia en una unidad,permaneciendo el resto <strong>de</strong> variables constantes.Con los datos disponibles, que supongamos son:fecha ventas precio p. competencia IPIt V p pc cenero 80 1725 12,37 11,23 101,7febrero 80 1314 11,25 10,75 97,3po<strong>de</strong>mos relacionar las variables con los valores que han tomado en cada momento siguiendo laecuación (4.2). Así en enero <strong>de</strong> 1980 la relación entre las ventas y el resto <strong>de</strong> variables ha sido:Mientras que en febrero <strong>de</strong> 1980 fue:1725 = β 1 + 12, 37β 2 + 11, 23β 3 + 101, 7β 41314 = β 1 + 11, 25β 2 + 10, 75β 3 + 97, 3β 4Estas relaciones se repetirían para cada mes <strong><strong>de</strong>l</strong> que tengamos datos. Como el valor <strong>de</strong> las variablescambia <strong>de</strong> un mes a otro, para que las igualda<strong>de</strong>s se cumplan también <strong>de</strong>ben cambiar los valores <strong><strong>de</strong>l</strong>os parámetros. Este no es el objetivo <strong><strong>de</strong>l</strong> gerente, quién necesita la mejor aproximación posible <strong><strong>de</strong>l</strong>valor <strong>de</strong> las ventas al precio, que resuma toda la información disponible <strong><strong>de</strong>l</strong> periodo consi<strong>de</strong>rado.Para ello consi<strong>de</strong>raremos que el mo<strong><strong>de</strong>l</strong>o <strong>de</strong>be reflejar el comportamiento medio <strong>de</strong> la relación entrevariables manteniéndose la relación entre las variables estable. Para que esto se cumpla y podamosrecoger el comportamiento medio incluiremos en el mo<strong><strong>de</strong>l</strong>o un nuevo elemento al que llamaremosu t . Así el mo<strong><strong>de</strong>l</strong>o especificado será:V t = β 1 + β 2 p t + β 3 cp t + β 4 c t + u t (4.3)El nuevo elemento <strong>de</strong>berá ser capaz <strong>de</strong> mantener la igualdad <strong>de</strong> la relación para cualquier conjunto<strong>de</strong> datos, tomando por tanto a veces valores positivos y en otras ocasiones valores negativos; aveces gran<strong>de</strong>s, a veces pequeños. La interpretación <strong><strong>de</strong>l</strong> mismo resulta bastante intuitiva: recoge76


Estadística Actuarial: Análisis <strong>de</strong> Regresióntodos los efectos que afectan a las ventas en cada período muestral y que no están explícitamenterecogidos en las variables que el mo<strong><strong>de</strong>l</strong>o contiene. Si el mo<strong><strong>de</strong>l</strong>o ha recogido todas las influencias“importantes y sistemáticas” que existen sobre las ventas, el nuevo elemento, que en a<strong><strong>de</strong>l</strong>antellamaremos perturbación recogerá los efectos no sistemáticos que serán, en general, más erráticos.Por tanto es factible consi<strong>de</strong>rar su comportamiento como aleatorio. Así a la perturbación u t se letrata como una variable aleatoria cuya distribución <strong>de</strong> probabilidad es preciso especificar al mismotiempo que el resto <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.Dado que el mo<strong><strong>de</strong>l</strong>o recogido por la ecuación (4.3) contiene una variable aleatoria para obtenerresultados a partir <strong><strong>de</strong>l</strong> mismo necesitaremos <strong>de</strong> la Estadística. Mediante procedimientos estadísticospodremos cuantificar la relación entre las variables, obteniendo valores numéricos para los coeficientesβ 1 , β 2 , β 3 y β 4 que reflejen la información que contienen los datos. De esta forma el mo<strong><strong>de</strong>l</strong>ogeneral representado por la ecuación (4.3) que en principio pue<strong>de</strong> servir para analizar el comportamiento<strong>de</strong> cualquier empresa servirá para contestar a las preguntas que el gerente se hace sobre supropia empresa convirtiéndose en un mo<strong><strong>de</strong>l</strong>o específico válido para la toma <strong>de</strong> <strong>de</strong>cisiones.El ejemplo anterior <strong>de</strong>scribe una situación muy concreta pero la Econometría es útil en otras muchassituaciones, por ejemplo:• Para analizar el efecto <strong><strong>de</strong>l</strong> impacto <strong>de</strong> cambios en la política fiscal sobre los indicadoreseconómicos <strong>de</strong> un país, la <strong>de</strong>manda interna, los tipos <strong>de</strong> interés, exportaciones e importaciones,<strong>de</strong>sempleo, grado <strong>de</strong> morosidad.• Los directivos <strong>de</strong> la empresa Merce<strong>de</strong>s pue<strong>de</strong>n estar interesados en los factores que <strong>de</strong>terminanla <strong>de</strong>manda <strong>de</strong> automóviles.• Para analizar los efectos <strong>de</strong> la publicidad en las ventas <strong>de</strong> una empresa.• Para analizar el impacto en la función <strong>de</strong> producción <strong>de</strong> cambios en los factores <strong>de</strong> producción.• Analizar si la <strong>de</strong>manda <strong>de</strong> tabaco se ve afectada por las campañas anti tabaco.• Analizar si las campañas publicitarias contra el consumo <strong>de</strong> alcohol cuando se conduce reduceel número <strong>de</strong> siniestros.• Estudiar como afecta el tabaquismo al peso <strong>de</strong> nacimiento y posterior crecimiento <strong>de</strong> un bebe.4.2. Etapas en la elaboración <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o econométricoUn estudio econométrico consta <strong>de</strong> las siguientes etapas, Heij , <strong>de</strong> Boer, Franses, Kloer y Dijk (2004):• Formulación <strong><strong>de</strong>l</strong> problema. Se trata <strong>de</strong> <strong>de</strong>terminar la cuestión <strong>de</strong> interés. Debemos plantear <strong>de</strong>forma precisa las preguntas que nos interesa respon<strong>de</strong>r. La teoría económica pue<strong>de</strong> ayudarnosa enfocar el problema, a <strong>de</strong>terminar qué variables están involucradas y cuál pue<strong>de</strong> ser larelación entre ellas.77


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Recolección <strong>de</strong> datos estadísticos relevantes para el análisis. En el caso <strong><strong>de</strong>l</strong> gerente los datosestán disponibles en los balances <strong>de</strong> la propia empresa. Los resultados <strong><strong>de</strong>l</strong> análisis van a<strong>de</strong>pen<strong>de</strong>r en gran medida <strong>de</strong> la calidad <strong>de</strong> los datos. Sin embargo, no siempre es sencilloobtener los datos relevantes para el análisis. Po<strong>de</strong>mos encontrar problemas como la ausencia<strong>de</strong> algún dato, cambios en la <strong>de</strong>finición <strong>de</strong> una variable, fallos en el método <strong>de</strong> recogida, teneruna cantidad insuficiente <strong>de</strong> datos o no disponer <strong>de</strong> información relativa a una variable.• Formulación y estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. En esta fase hay que dar forma al problema inicialen términos <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o. Determinar la variable a explicar, en el ejemplo las ventas, y lasvariables explicativas, en el ejemplo el precio, el precio <strong>de</strong> la competencia y el ciclo económico;la forma funcional <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y la distribución probabilística <strong>de</strong> la perturbación aleatoria.El siguiente paso es la estimación <strong>de</strong> los parámetros <strong>de</strong>sconocidos <strong>de</strong> la distribución y que son<strong>de</strong> interés para el análisis. La estimación consiste en utilizar los datos y toda la informaciónrelevante para apren<strong>de</strong>r algo sobre los parámetros <strong>de</strong>sconocidos. En la interpretación <strong>de</strong> losresultados <strong>de</strong> estimación es importante tener en cuenta que no conocemos el valor <strong>de</strong> losparámetros, por lo que únicamente vamos a hacer afirmaciones <strong><strong>de</strong>l</strong> tipo “con un 95 % <strong>de</strong>confianza, el aumento <strong><strong>de</strong>l</strong> impuesto sobre carburantes no afecta al consumo <strong>de</strong> gasolina”.Existen muchos métodos <strong>de</strong> estimación. La elección entre uno u otro <strong>de</strong>pen<strong>de</strong> <strong>de</strong> las propieda<strong>de</strong>s<strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o econométrico seleccionado. Es <strong>de</strong>cir, una mala selección <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o tambiéninfluye en la vali<strong>de</strong>z <strong>de</strong> las estimaciones. Un curso introductorio <strong>de</strong> Econometría, como este,se suele centrar en el estudio <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal y su estimación mediante mínimoscuadrados ordinarios, que son instrumentos sencillos y muy útiles en la práctica.• Análisis <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Se trata <strong>de</strong> estudiar si el mo<strong><strong>de</strong>l</strong>o elegido es a<strong>de</strong>cuado para recoger elcomportamiento <strong>de</strong> los datos. Consiste en una serie <strong>de</strong> contrastes diagnósticos que valoran siel mo<strong><strong>de</strong>l</strong>o está correctamente especificado, es <strong>de</strong>cir, si los supuestos realizados son válidos. Sies necesario, se modifica el mo<strong><strong>de</strong>l</strong>o en base a los resultados obtenidos en los contrastes.• Aplicación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Una vez obtenido un mo<strong><strong>de</strong>l</strong>o correcto, se utiliza para respon<strong>de</strong>r a lascuestiones <strong>de</strong> interés y para la predicción. Un mo<strong><strong>de</strong>l</strong>o correctamente especificado y estimadoha <strong>de</strong> ser utilizado para pre<strong>de</strong>cir. Este concepto implica tanto <strong>de</strong>terminar los valores futuros<strong>de</strong> la variable endógena como contestar a preguntas <strong><strong>de</strong>l</strong> tipo ¿qué pasaría sí...?, en <strong>de</strong>finitiva<strong>de</strong>be servirnos para dar consejos <strong>de</strong> política económica.4.3. Tipología <strong>de</strong> datos y variables en EconometríaEl mo<strong><strong>de</strong>l</strong>o econométrico genérico completamente especificado tiene la siguiente forma:Y t = β 1 + β 2 X 2t + β 3 X 3t + . . . + β K X Kt + u t t = 1, 2, . . . , T (4.4)Don<strong>de</strong> Y es la variable a explicar o variable endógena, X 2 , X 3 , . . ., X K son las variables explicativas,o regresores, <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. El subíndice que las acompaña indica el número <strong>de</strong> variables explicativas<strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o, el mo<strong><strong>de</strong>l</strong>o anterior tiene K-variables explicativas. Los coeficientes β k k = 1, 2, . . . , Kson los parámetros a estimar, que se suponen constantes. A<strong>de</strong>más es <strong>de</strong> interés notar que el parámetroβ 1 acompaña a la variable explicativa X 1 constante e igual a la unidad en todo momento <strong><strong>de</strong>l</strong>78


Estadística Actuarial: Análisis <strong>de</strong> Regresióntiempo. El subíndice t hace referencia al tiempo y por tanto T indica el tamaño <strong>de</strong> la muestra <strong>de</strong>observaciones disponible.La diferencia entre un mo<strong><strong>de</strong>l</strong>o económico y un mo<strong><strong>de</strong>l</strong>o econométrico es la perturbación aleatoriaque incluimos en el mo<strong><strong>de</strong>l</strong>o econométrico. A partir <strong>de</strong> este elemento en el mo<strong><strong>de</strong>l</strong>o econométricopo<strong>de</strong>mos distinguir dos partes la parte sistemática <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y la parte aleatoria. La primeracorrespon<strong>de</strong> al comportamiento medio o estable <strong>de</strong> la relación y la segunda se correspon<strong>de</strong> con laperturbación aleatoria, u t .El objetivo sobre el mo<strong><strong>de</strong>l</strong>o genérico representado por la ecuación (4.4) es conocer los valores <strong>de</strong> losparámetros <strong>de</strong>sconocidos β k k = 1, 2, . . . , K. Para llevar a cabo este objetivo utilizaremos métodosestadísticos. Para ello al mo<strong><strong>de</strong>l</strong>o especificado <strong>de</strong>beremos <strong>de</strong> añadir hipótesis sobre el comportamientoprobabilístico <strong>de</strong> la perturbación aleatoria que caractericen su distribución. En general, supondremosque dicha perturbación tiene una distribución centrada en cero, o sea media cero, lo que implicaque el comportamiento medio <strong>de</strong> la variable a explicar está recogido en su totalidad por la partesistemática <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o:E(Y t ) = β 1 + β 2 X 2t + β 3 X 3t + . . . + β K X Kt t = 1, 2, . . . , T (4.5)A<strong>de</strong>más <strong>de</strong> la media <strong>de</strong>bemos caracterizar también la varianza, covarianzas y distribución <strong>de</strong> laperturbación.4.3.1. Conceptos básicosEn los puntos anteriores han surgido algunos conceptos que <strong>de</strong>berían quedar claros para po<strong>de</strong>rreferirnos a ellos con propiedad. Revisaremos algunos <strong>de</strong> ellos.• Población y muestra:Población son todos los posibles valores que toma la variable objeto <strong>de</strong> estudio. La muestrasería la parte <strong>de</strong> la población que vamos a utilizar en el estudio para extraer conclusiones.Por tanto la muestra está contenida en la población y nosotros la utilizaremos para establecerconclusiones que puedan extrapolarse a la población.• Datos:Los datos son los valores numéricos que toman tanto la variable a explicar como las variablesexplicativas. Generalmente los obtenemos <strong>de</strong> series estadísticas cuyas fuentes pue<strong>de</strong>n ser oficialeso privadas. La importancia <strong>de</strong> los datos está <strong>de</strong>terminada por la unidad <strong>de</strong> medida. Lospo<strong>de</strong>mos clasificar en:1. Datos <strong>de</strong> serie temporal: Reflejan la evolución <strong>de</strong> una variable a lo largo <strong><strong>de</strong>l</strong> tiempo,según esto la variable estará or<strong>de</strong>nada cronológicamente con un or<strong>de</strong>n lógico. Las variablesmedidas en series temporales se <strong>de</strong>notan con el subíndice t y este pue<strong>de</strong> referirse aobservaciones temporales mensuales, trimestrales, diarias cuatrimestrales, anuales, etc.Ejemplo: el Producto Nacional Bruto (PNB) <strong>de</strong> 1965-2000. En este caso la poblaciónserían todos los posibles valores <strong><strong>de</strong>l</strong> PNB a lo largo <strong><strong>de</strong>l</strong> tiempo y la muestra el períodoque vamos a estudiar, <strong>de</strong> 1965 al 2000.79


Estadística Actuarial: Análisis <strong>de</strong> Regresión2. Datos <strong>de</strong> sección cruzada o corte transversal: Son datos atemporales dado que mi<strong>de</strong>nel comportamiento <strong>de</strong> una variable en diferentes unida<strong>de</strong>s y en el mismo momento <strong><strong>de</strong>l</strong>tiempo. Ejemplo: ventas <strong>de</strong> las empresas metalúrgicas en el País Vasco en el año 1999.Esta sería la muestra a utilizar y la población estaría constituida por todas las unida<strong>de</strong>s.3. Datos <strong>de</strong> panel: es la unión <strong>de</strong> datos <strong>de</strong> serie temporal y datos <strong>de</strong> sección cruzada. Estánfuera <strong><strong>de</strong>l</strong> objetivo <strong><strong>de</strong>l</strong> curso.• Variables:Una variable es un ente económico que toma diferentes valores. Po<strong>de</strong>mos distinguir entre variablesexógenas, aquellas que inci<strong>de</strong>n en el mo<strong><strong>de</strong>l</strong>o <strong>de</strong>s<strong>de</strong> el exterior y variables endógenas,aquellas que queremos explicar con el mo<strong><strong>de</strong>l</strong>o. A las variables exógenas también se las <strong>de</strong>nominavariables explicativas o in<strong>de</strong>pendientes y a la variable endógena también se le pue<strong>de</strong><strong>de</strong>nominar como variable a explicar o <strong>de</strong>pendiente. A<strong>de</strong>más <strong>de</strong>bemos tener en cuenta quepo<strong>de</strong>mos encontrarnos con relaciones simultáneas como:o comoY t = β 1 + β 2 Y t−1 + u tC t = β 1 + β 2 Y t + u tY t = C t + I tdon<strong>de</strong> las variables cambian su papel según miremos a una ecuación u otra. Po<strong>de</strong>mos distinguir,entre otros, los siguientes tipos <strong>de</strong> variables:1. - Fijas: aquellas que toman valores que el investigador pue<strong>de</strong> controlar.- Estocásticas: aquellas cuyo valor cambia según una ley <strong>de</strong> probabilidad.2. - Cuantitativas: aquellas que po<strong>de</strong>mos valorar numéricamente. Por ejemplo, la rentadisponible <strong>de</strong> una familia, el precio <strong>de</strong> un bien, la renta per cápita.- Cualitativas: aquellas que mi<strong>de</strong>n cualida<strong>de</strong>s y que por lo tanto no se mi<strong>de</strong>n con un valornumérico y será el investigador el que se lo asigne según un criterio. Por ejemplo, si unindividuo está o no casado, si trabaja en turno <strong>de</strong> noche o no, si tiene estudios superioreso no. En las variables cualitativas es el investigador el que establece el valor <strong>de</strong> la variablepara cada característica. Por ejemplo:{ 1 si el individuo i es hombreS 1i =0 en caso contrarioS 2i ={ 1 si el individuo i es mujer0 en caso contrario<strong>de</strong>finen dos variables cualitativas S 1i y S 2i que permiten recoger el sexo <strong><strong>de</strong>l</strong> individuo yver por ejemplo si existe discriminación salarial por sexo en un estudio sobre la función<strong>de</strong> salario.• Los parámetros:Los parámetros son los valores que permanecen <strong>de</strong>sconocidos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. En un mo<strong><strong>de</strong>l</strong>o econométricopo<strong>de</strong>mos distinguir dos tipos <strong>de</strong> parámetros:80


Estadística Actuarial: Análisis <strong>de</strong> Regresión1. Los parámetros <strong>de</strong> la relación económica: Son las pon<strong>de</strong>raciones que aplicadas a lasvariables exógenas nos permiten calcular la endógena.En el mo<strong><strong>de</strong>l</strong>o anterior β 1 , β 2 , β 3 y β 4 .V t = β 1 + β 2 p t + β 3 cp t + β 4 c t + u t (4.6)2. Los parámetros <strong>de</strong> la estructura probabilística: son los parámetros que <strong>de</strong>terminan laestructura <strong>de</strong> la parte aleatoria <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o, media y varianza <strong>de</strong> la perturbación aleatoriay <strong>de</strong> la variable endógena.• Mo<strong><strong>de</strong>l</strong>o:Hemos visto que un mo<strong><strong>de</strong>l</strong>o no es más que un conjunto <strong>de</strong> relaciones entre variables económicasy que representamos mediante relaciones matemáticas. Clasificación <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os:1. - Mo<strong><strong>de</strong>l</strong>os exactos: aquellos que <strong>de</strong>terminan exactamente el valor <strong>de</strong> una variable conocidoel valor <strong>de</strong> otra-s:Y = β 1 + β 2 X- Mo<strong><strong>de</strong>l</strong>os estocásticos: aquellos que incluyen alguna variable aleatoria:Y t = β 1 + β 2 X t + u tu ∼ (m(u), V (u))2. - Mo<strong><strong>de</strong>l</strong>os uniecuacionales: aquellos que se componen <strong>de</strong> una única ecuación:C t = β 1 + β 2 Y t + u t- Mo<strong><strong>de</strong>l</strong>os multiecuacionales: aquellos que se componen <strong>de</strong> más <strong>de</strong> una ecuación. Porejemplo cuando una variable influye en otra-s y a la vez es influida por éstas:C t = β 1 + β 2 Y t + u tY t = C t + I t3. - Mo<strong><strong>de</strong>l</strong>os estáticos: Cuando el tiempo no aparece <strong>de</strong> forma explícita en la ecuación ytodas las variables se mi<strong>de</strong>n en el mismo momento.- Mo<strong><strong>de</strong>l</strong>os dinámicos: Aquellos que tienen variables <strong>de</strong>finidas en diferentes momentos <strong><strong>de</strong>l</strong>tiempo o el tiempo aparece como variable explícita en la ecuación. Un ejemplo <strong>de</strong> losprimeros sería:C t = β 1 + β 2 Y t + β 3 C t−1 + u tmientras que un ejemplo <strong>de</strong> los segundos sería el siguiente mo<strong><strong>de</strong>l</strong>o no explícitamentedinámico, generalmente llamado estático históricoC t = β 1 + β 2 Y t + β 3 t + u tdon<strong>de</strong> el parámetro c recoge la ten<strong>de</strong>ncia <strong>de</strong> la variable endógena a lo largo <strong><strong>de</strong>l</strong> tiempo.4. - Mo<strong><strong>de</strong>l</strong>os basados en series temporales: pue<strong>de</strong>n ser dinámicos u estáticos.- Mo<strong><strong>de</strong>l</strong>os basado en datos <strong>de</strong> corte transversal: son siempre estáticos.81


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Parámetro, estimador y estimación:En el mo<strong><strong>de</strong>l</strong>o:Y t = β 1 + β 2 X t + u tt = 1, 2, . . . , Ttenemos diferentes parámetros <strong>de</strong>sconocidos. En la parte aleatoria aparecerían los que caracterizana la distribución probabilística <strong>de</strong> la perturbación aleatoria y en la parte sistemáticaaparecen β 1 y β 2 . Todos son parámetros <strong>de</strong>sconocidos. Los llamaremos parámetros poblacionalesya que lo que nosotros hemos especificado es un mo<strong><strong>de</strong>l</strong>o general que <strong>de</strong>bería recoger elcomportamiento medio <strong>de</strong> las variables en la población. Para obtener resultados <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>oanterior nosotros lo aplicamos a la muestra, <strong>de</strong> tamaño T. Nuestro objetivo es <strong>de</strong>terminar elvalor <strong>de</strong> estos parámetros poblacionales <strong>de</strong>sconocidos <strong>de</strong> la muestra. Para aproximarnos a esevalor utilizamos técnicas estadísticas, en concreto estimadores. Un estimador no es más queuna fórmula que nos dice como <strong>de</strong>bemos obtener los valores numéricos <strong>de</strong> β 1 y β 2 mediante lamuestra. Al valor finalmente obtenido en la muestra le llamamos estimación. En concreto lanotación matemática para estos conceptos, aplicada al parámetro β 2 sería:β 2 parámetro poblacionalˆβ 2 estimador0,5 estimacióndon<strong>de</strong> por ejemplo:ˆβ 2 =∑ Tt=1 (Y t − Ȳ )(X t − ¯X)∑ Tt=1 (X t − ¯X) 2 = 0, 5Los estimadores van a ser variables aleatorias con distribución a <strong>de</strong>terminar ya los que exigiremosciertas propieda<strong>de</strong>s que van a <strong>de</strong>terminar esta distribución.• Estructura:Cuando estudiamos la relación entre las variables económicas especificamos un mo<strong><strong>de</strong>l</strong>o econométrico.En la especificación elegimos la forma funcional <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y las variables explicativasa incluir así como las propieda<strong>de</strong>s <strong>de</strong> la perturbación. Una vez que el mo<strong><strong>de</strong>l</strong>o está totalmenteespecificado le estimaremos y tendremos unos valores para los parámetros. A la relaciónresultante le llamamos estructura. Un mo<strong><strong>de</strong>l</strong>o especificado sería:Y t = β 1 + β 2 X t + u tt = 1, 2, . . . , Tmientras que una estructura para ese mo<strong><strong>de</strong>l</strong>o dada una muestra <strong>de</strong> tamaño T podría ser:Ŷ t = 20 + 5X tNotar que un mo<strong><strong>de</strong>l</strong>o pue<strong>de</strong> tener diferentes estructuras según los valores que las variablesexógena y endógena tomen en la muestra.4.3.2. Fuentes <strong>de</strong> datosEncontrar y recopilar datos no es siempre sencillo. En ocasiones es muy costoso coleccionar los datosa<strong>de</strong>cuados a la situación y manejarlos. Sin embargo, esta tarea se ha visto favorecida en los últimos82


Estadística Actuarial: Análisis <strong>de</strong> Regresiónaños por la mejora en la recogida <strong>de</strong> datos y el hecho <strong>de</strong> que muchos organismos permiten acce<strong>de</strong>r asus bases <strong>de</strong> datos en la World Wi<strong>de</strong> Web. Algunos organismos que publican datos macroeconómicosson:• Instituto Vasco <strong>de</strong> Estadística (EUSTAT): http://www.eustat.es.• Banco <strong>de</strong> España: http://www.b<strong>de</strong>.es → Estadísticas. También publica el Boletín estadísticomensual y el Boletín <strong>de</strong> coyuntura mensual.• Instituto Nacional <strong>de</strong> Estadística (INE): http://www.ine.es → Inebase o Banco tempus. Estándisponibles, por ejemplo, los resultados <strong>de</strong> la encuesta <strong>de</strong> población activa, la ContabilidadNacional o el boletín estadístico mensual. A<strong>de</strong>más, en enlaces se encuentran otras páginasweb <strong>de</strong> servicios estadísticos.• EUROSTAT: Es la Oficina Estadística <strong>de</strong> la Unión Europea, se encarga <strong>de</strong> verificar y analizarlos datos nacionales recogidos por los Estados Miembros. El papel <strong>de</strong> Eurostat es consolidar losdatos y asegurarse <strong>de</strong> que son comparables utilizando una metodología homogénea. La informaciónen términos <strong>de</strong> tablas estadísticas, boletines estadísticos e informativos, incluso documentos<strong>de</strong> trabajo papers se pue<strong>de</strong> encontrar en la dirección: http://europa.eu.int/comm/eurostat.• Organización para la Cooperación y Desarrollo Económico (OCDE): http://www.oecd.org,Statistical portal, statistics. Están disponibles algunas series <strong>de</strong> las publicaciones Main EconomicIndicators (mensual) o Comercio internacional.• Fondo Monetario Internacional (FMI): http://www.imf.org. Para obtener datos sobre un amplioconjunto <strong>de</strong> países también se pue<strong>de</strong> consultar su publicación Estadísticas FinancierasInternacionales (mensual y anual).Muchos manuales <strong>de</strong> Econometría incluyen una base <strong>de</strong> datos que se analizan en el texto como ilustracióna la materia. En este curso utilizaremos principalmente los datos incluidos en Ramanathan(2002) y Wooldridge (2006) que están accesibles como archivos <strong>de</strong> muestra en gretl.83


Estadística Actuarial: Análisis <strong>de</strong> Regresión4.4. Bibliografía <strong><strong>de</strong>l</strong> temaReferencias bibliográficas básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editorial AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. OpenCourseWare. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[2] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[3] Esteban, M.V. (2007). Estadística Actuarial: Regresión. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[4] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08.Publicaciónon-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[5] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[6] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[7] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[8] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[9] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.84


Tema 5Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal General:especificación, estimación y contraste <strong>de</strong>hipótesisEste es el tema central <strong>de</strong> la signatura. En él nos ocuparemos <strong>de</strong> analizar las relaciones entre variablesy nuestro objetivo fundamental será explicar el comportamiento <strong>de</strong> una variable, que llamaremosvariable a explicar, mediante un conjunto <strong>de</strong> variables económicas, que llamaremos explicativas.Mo<strong><strong>de</strong>l</strong>izaremos la relación entre las variables mediante una ecuación matemática y daremos entradaen la misma a una variable aleatoria que nos permita recoger la aleatoriedad <strong><strong>de</strong>l</strong> fenómeno económico.Así, apren<strong>de</strong>remos a especificar y estimar el Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal General. El método <strong>de</strong>estimación que <strong>de</strong>sarrollaremos son los Mínimos Cuadrados Ordinarios, MCO, que bajo ciertashipótesis <strong>de</strong> comportamiento sobre los distintos elementos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o nos proporcionará estimadorescon buenas propieda<strong>de</strong>s, lineales, insesgados y <strong>de</strong> mínima varianza. Propieda<strong>de</strong>s que <strong>de</strong>sarrollamosen el Tema 2 y que en este tema buscaremos no solo para el estimador mínimo cuadrático sinotambién para otros estimadores alternativos.Nos ocuparemos en profundidad <strong>de</strong> que el mo<strong><strong>de</strong>l</strong>o esté correctamente especificado, es <strong>de</strong>cir <strong>de</strong> queincluyamos todas las variables necesarias para explicar el comportamiento <strong>de</strong> la variable objetivoy no incluyamos ninguna innecesaria. Veremos que consecuencias tiene en las propieda<strong>de</strong>s <strong>de</strong> losestimadores y en la inferencia la omisión <strong>de</strong> variables relevantes y la inclusión <strong>de</strong> variables irrelevantes.También analizaremos que problemas nos crea la existencia <strong>de</strong> combinaciones lineales exactasy/o aproximadas entre las variables a incluir como explicativas en el mo<strong><strong>de</strong>l</strong>o. Una vez el mo<strong><strong>de</strong>l</strong>oesté correctamente especificado podremos realizar inferencia.Con los conceptos aprendidos en el Tema 3 <strong>de</strong>sarrollaremos el contraste <strong>de</strong> restricciones lineales querecojan hipótesis relevantes <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista económico <strong>de</strong>ntro <strong><strong>de</strong>l</strong> Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión LinealGeneral. Apren<strong>de</strong>remos a contrastar si las variables son relevantes individual y conjuntamente paraexplicar el comportamiento <strong>de</strong> la variable objetivo y a hacer contraste <strong>de</strong> combinaciones lineales,entre otros contrastes <strong>de</strong> interés.Para finalizar el tema veremos como realizar análisis <strong>de</strong> regresión y contraste <strong>de</strong> hipótesis medianteel software gretl.85


Estadística Actuarial: Análisis <strong>de</strong> RegresiónCompetencias a trabajar en estas sesiones:1. Conocer distintos procedimientos <strong>de</strong> estimación <strong>de</strong> parámetros, así como sus propieda<strong>de</strong>s parapo<strong>de</strong>r seleccionar a<strong>de</strong>cuadamente la mejor alternativa <strong>de</strong> análisis.2. Aplicar la metodología estadística a<strong>de</strong>cuada para el diseño <strong>de</strong> contrastes <strong>de</strong> hipótesis para latoma <strong>de</strong> <strong>de</strong>cisiones en el ámbito profesional.3. Analizar <strong>de</strong> forma crítica los elementos básicos <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os econométricos para compren<strong>de</strong>rla lógica <strong>de</strong> la mo<strong><strong>de</strong>l</strong>ización econométrica y po<strong>de</strong>r especificar relaciones causales entre variableseconómicas.4. Aplicar la metodología econométrica básica para estimar y validar relaciones económicas enbase a la información estadística disponible sobre variables económicas y utilizando los instrumentosinformáticos apropiados.5. Obtener e interpretar los resultados <strong>de</strong> un análisis estadístico <strong>de</strong> datos económicos haciendouso <strong>de</strong> las fuentes <strong>de</strong> información apropiadas y <strong>de</strong> los instrumentos informáticos necesarios.6. Presentar <strong>de</strong> forma clara y concisa, tanto oralmente como por escrito, las conclusiones obtenidasen un caso <strong>de</strong> estudio particular.Al final <strong>de</strong> este tema <strong>de</strong>beríais ser capaces <strong>de</strong>:1. Explicar y enten<strong>de</strong>r el alcance <strong>de</strong> las hipótesis básicas sobre el comportamiento <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong>regresión lineal general.2. Interpretar los parámetros <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o.3. Aplicar el estimador <strong>de</strong> Mínimos Cuadrados Ordinarios, MCO.4. Distinguir entre la perturbación y el residuo u error <strong>de</strong> estimación. Conocer las distribucionesrespectivas.5. Conocer y saber <strong>de</strong>mostrar las propieda<strong>de</strong>s <strong><strong>de</strong>l</strong> estimador <strong>de</strong> MCO.6. Conocer las implicaciones <strong>de</strong> tener combinaciones lineales exactas entre las variables explicativas<strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.7. Conocer las implicaciones <strong>de</strong> tener combinaciones lineales aproximadas entre las variablesexplicativas <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.8. Conocer las consecuencias <strong>de</strong> una mala especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o omitiendo variables explicativasrelevantes.9. Conocer las consecuencias <strong>de</strong> una mala especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o incluyendo variables explicativasirrelevantes.10. Saber especificar correctamente mo<strong><strong>de</strong>l</strong>os que incluyan variables cualitativas.86


Estadística Actuarial: Análisis <strong>de</strong> Regresión11. Saber <strong>de</strong>rivar la distribución <strong><strong>de</strong>l</strong> estimador <strong>de</strong> MCO.12. Saber contrastar hipótesis relevantes para la relación económica <strong>de</strong> las variables.Bibliografía Recomendada:Al final <strong><strong>de</strong>l</strong> tema tenéis recogida la bibliografía correspondiente. En particular se os recomienda leerlos capítulos correspondientes a la bibliografía básica <strong>de</strong>tallados a continuación:• Gujarati, D. y Porter, D.C. (2010). En Parte I: Caps. 1, 2, 3, 4, 5, 7, 8 y 9. Parte II: Cap. 10.• Newbold, P., Carlson, W.L. y Thorne, B. (2008). Caps. 12, 13 y 14.• Ramanathan, R. (2002). Caps. 3, 4, 5 y 7.• Ruiz Maya, L. y Martín Pliego, F.J. (2005). Caps. 4, 5, 6, y 7.• Wooldridge, J.M. (2006). Caps. 2, 3, 4 y 787


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.1. Especificación <strong><strong>de</strong>l</strong> Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal General (MRLG):supuestos básicosEn Economía, en muchas situaciones, varias variables in<strong>de</strong>pendientes influyen conjuntamente enuna variable <strong>de</strong>pendiente. El mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión múltiple permite averiguar el efecto simultáneo<strong>de</strong> varias variables in<strong>de</strong>pendientes en una variable <strong>de</strong>pendiente. Por ejemplo:• El salario es una función <strong><strong>de</strong>l</strong> nivel <strong>de</strong> estudios, la experiencia, la edad y el puesto <strong>de</strong> trabajo.• El precio <strong>de</strong> un piso es función, entre otras características, <strong>de</strong> su superficie, número <strong>de</strong> habitacionesy baños, localización y la existencia o no <strong>de</strong> ascensor.• La cantidad vendida <strong>de</strong> un bien <strong>de</strong>pen<strong>de</strong> <strong>de</strong> su precio, <strong><strong>de</strong>l</strong> precio <strong>de</strong> la competencia y <strong><strong>de</strong>l</strong> cicloeconómico entre otras variables.• La producción <strong>de</strong> una empresa <strong>de</strong>pen<strong>de</strong> <strong>de</strong> los factores <strong>de</strong> producción, capital y fuerza <strong>de</strong>trabajo.La especificación <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o consiste en seleccionar las variables in<strong>de</strong>pendientes que explican a lavariable objeto <strong>de</strong> estudio y <strong>de</strong>terminar la forma funcional <strong><strong>de</strong>l</strong> mismo. Vamos a comenzar el análisis<strong>de</strong> regresión <strong>de</strong>terminando nuestro objetivo y los recursos disponibles para lograrlo.Objetivo: Cuantificar la relación existente entre una variable <strong>de</strong>pendiente a la que <strong>de</strong>notaremospor Y , y un conjunto <strong>de</strong> K variables in<strong>de</strong>pendientes, X 1 , X 2 , . . . , X K mediante la especificación <strong>de</strong>un mo<strong><strong>de</strong>l</strong>o lineal.Recursos disponibles: Se dispone <strong>de</strong> una muestra <strong>de</strong> observaciones <strong>de</strong> las variables Y, X 1 , X 2 , . . . , X K<strong>de</strong> tamaño N, que es el número <strong>de</strong> observaciones disponibles sobre todas las variables. Se <strong>de</strong>nota:Y i = observación i-ésima <strong>de</strong> YX ki = observación i-ésima <strong>de</strong> X k ∀k = 1, . . . , Kdon<strong>de</strong> X ki es una observación <strong>de</strong> las disponibles en la muestra i = 1, 2, . . . , N.Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión lineal General (MRLG). Mo<strong><strong>de</strong>l</strong>izaciónGeneral se escribe:El Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión LinealY i = β 1 X 1i + β 2 X 2i + . . . + β K X Ki + u ii = 1, 2, . . . , Ndon<strong>de</strong> habitualmente X 1i = 1 ∀i, <strong>de</strong> forma que β 1 es un término in<strong>de</strong>pendiente y entonces,Y i = β 1 + β 2 X 2i + . . . + β K X Ki + u i i = 1, 2, . . . , N.88


Estadística Actuarial: Análisis <strong>de</strong> RegresiónElementos <strong><strong>de</strong>l</strong> MRLG• Y es la variable a explicar, variable <strong>de</strong>pendiente o endógena.• X k• β kk = 1, . . . , K son las K variables explicativas, variables in<strong>de</strong>pendientes o exógenas.k = 1, . . . , K son los coeficientes <strong>de</strong> la regresión o parámetros (<strong>de</strong>sconocidos).• u es la perturbación aleatoria o término <strong>de</strong> error.• el subíndice i <strong>de</strong>nota la observación correspondiente. El subíndice i se utiliza cuando tenemosobservaciones <strong>de</strong> sección cruzada y el subíndice t cuando tenemos observaciones <strong>de</strong> serietemporal.• N es el tamaño muestral, el número <strong>de</strong> observaciones disponibles <strong>de</strong> las variables objeto <strong>de</strong>estudio. Cuando trabajamos con datos <strong>de</strong> serie temporal el tamaño muestral se <strong>de</strong>nota por T .La perturbación aleatoria u i es una variable aleatoria no observable que preten<strong>de</strong> recoger:• Variables no incluidas en el mo<strong><strong>de</strong>l</strong>o.• Comportamiento aleatorio <strong>de</strong> los agentes económicos.• Errores <strong>de</strong> medida.Representación <strong><strong>de</strong>l</strong> MRLG en forma matricial El mo<strong><strong>de</strong>l</strong>oY i = β 1 + β 2 X 2i + . . . + β K X Ki + u i i = 1, 2, . . . , N (5.1)pue<strong>de</strong> escribirse para todas las observaciones disponibles como el siguiente sistema <strong>de</strong> N ecuaciones:⎧⎪⎨⎪⎩Y 1 = β 1 + β 2 X 21 + β 3 X 31 + . . . + β K X K1 + u 1 i = 1Y 2 = β 1 + β 2 X 22 + β 3 X 32 + . . . + β K X K2 + u 2 i = 2..Y i = β 1 + β 2 X 2i + β 3 X 3i + . . . + β K X Ki + u i i = i..Y N = β 1 + β 2 X 2N + β 3 X 3N + . . . + β K X KN + u N i = No bien en forma matricial comoY = X(N × 1) (N × K)β(K × 1)+ u(N × 1)don<strong>de</strong>Y =(N × 1)⎡⎢⎣Y 1Y 2.Y i.Y N⎤⎥⎦X =(N × K)⎡⎢⎣⎤1 X 21 X 31 · · · X K11 X 22 X 32 · · · X K2....1 X 2i X 3i · · · X Ki..⎥..⎦1 X 2N X 3N · · · X KNβ =(K × 1)⎡⎢⎣β 1β 2β 3.β K⎤⎥⎦u =(N × 1)⎡⎢⎣u 1u 2.u i.u N⎤⎥⎦89


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.1.1. Hipótesis básicas.El mo<strong><strong>de</strong>l</strong>o <strong>de</strong>be completarse con la especificación <strong>de</strong> las propieda<strong>de</strong>s estocásticas <strong>de</strong> la variable <strong>de</strong>interés Y . A partir <strong>de</strong> las propieda<strong>de</strong>s <strong>de</strong> Y es posible conocer las propieda<strong>de</strong>s <strong>de</strong> los distintosmétodos <strong>de</strong> estimación, elegir el mejor estimador en el mo<strong><strong>de</strong>l</strong>o, realizar contrastes, etc. Las condicionesbajo las cuales vamos a trabajar en un principio se <strong>de</strong>nominan hipótesis básicas. Bajoestas hipótesis estimaremos y analizaremos el mo<strong><strong>de</strong>l</strong>o para, finalmente, pre<strong>de</strong>cir Y . En una segundaetapa, po<strong>de</strong>mos consi<strong>de</strong>rar otras situaciones, relajando algunas <strong>de</strong> estas hipótesis, analizando si losprocedimientos <strong>de</strong> estimación y contraste anteriores siguen siendo válidos. Las hipótesis básicas serefieren a los distintos elementos <strong>de</strong> la regresión.1. Hipótesis sobre la perturbación aleatoria• La perturbación u i tiene media cero para todo i, E(u i ) = 0 ∀i. La perturbación mi<strong><strong>de</strong>l</strong>as diferencias con respecto a un promedio, u i = Y i − E(Y i ) y a priori no tenemos razonespara suponer que todas las <strong>de</strong>sviaciones están por encima o por <strong>de</strong>bajo <strong>de</strong> ese promedio,por ello parece lógico pensar que en media las <strong>de</strong>sviaciones son cero.Para la perturbación en i lo escribimos como E(u i ) = 0 ∀i, cuando miramos al mo<strong><strong>de</strong>l</strong>oen forma matricial escribimos esta hipótesis como E(u) = ⃗0:⎡E(u) = E ⎢⎣u 1u 2.u N⎤ ⎡⎥⎦ = ⎢⎣E(u 1 )E(u 2 ).E(u N )⎤ ⎡⎥⎦ = ⎢⎣00.0⎤⎥⎦ = ⃗0• E(u 2 i ) = σ2 u ∀i es <strong>de</strong>cir la varianza <strong>de</strong> la perturbación es <strong>de</strong>sconocida e igual a σ 2para todas las observaciones. Estamos suponiendo igual dispersión o variabilidad. A estahipótesis se le conoce con el nombre <strong>de</strong> Homocedasticidad:V (u i ) = E(u i − E(u i )) 2 = E(u 2 i ) = σ 2E(u 2 1) = E(u 2 2) = E(u 2 3) = . . . = E(u 2 N) = σ 2El caso contrario, cuando la dispersión varía a lo largo <strong>de</strong> la muestra se <strong>de</strong>nomina Heterocedasticidad:E(u 2 i ) = σ2 i . La Figura 5.1 ilustra ambas situaciones:Hay que notar que generalmente σ 2 será <strong>de</strong>sconocida y por tanto en el mo<strong><strong>de</strong>l</strong>o tendremosque estimar (K + 1) incógnitas, los k-coeficientes poblacionales <strong>de</strong>sconocidos más lavarianza poblacional <strong>de</strong> la perturbación σ 2 .• E(u i u j ) = 0 ∀i, j i ≠ j. La covarianza entre perturbaciones <strong>de</strong> distintas observacioneses cero.Cov(u i , u j ) = E(u i − E(u i ))(u j − E(u j )) = E(u i u j ) = 0 ∀i, j i ≠ j90


f(u)XYf(u)XYEstadística Actuarial: Análisis <strong>de</strong> Regresión+βα+βX6Figura 5.1: Perturbaciones homocedásticas versus heterocedásticasX6E(u 1 u 2 ) = E(u 1 u 3 ) = E(u 4 u 20 ) = 0αX6 X6 X1 X2A esta hipótesis también se la llama hipótesis <strong>de</strong> No Autocorrelación. Uniendo la hipótesis<strong>de</strong> homocedasticidad y la hipótesis <strong>de</strong> no autocorrelación po<strong>de</strong>mos <strong>de</strong>scribir la matriz <strong>de</strong>varianzas y covarianzas <strong>de</strong> la perturbación.X2 X1E(uu ′ ) = σ 2 I N⎡E(uu ′ ) = E ⎢⎣u 1u 2.⎤[ ′⎥ u 1 u ′ 2 . . . u ′ N⎦⎡] = E ⎢⎣u 1 u ′ 1 u 1 u ′ 2 . . . u 1 u ′ Nu 2 u ′ 1 u 2 u ′ 2 . . . u 2 u ′ N.. . .. .⎤⎥⎦ =u Nu N u ′ 1 u N u ′ 2 . . . u N u ′ N⎡= E ⎢⎣u 2 1 u 1 u ′ 2 . . . u 1 u ′ Nu 2 u ′ 1 u 2 2 . . . u 2 u ′ N.. . .. .u N u ′ 1 u N u ′ 2 . . . u 2 N⎤ ⎡⎥⎦ = ⎢⎣E(u 2 1 ) E(u 1u ′ 2 ) . . . E(u 1u ′ N ) ⎤E(u 2 u ′ 1 ) E(u2 2 ) . . . E(u 2u ′ N ).. . ..⎥. ⎦ =E(u N u ′ 1 ) E(u Nu ′ 2 ) . . . E(u2 N )⎡= ⎢⎣σ 2 ⎤ ⎡0 0 . . . 00 σ 2 0 . . . 0.. . . ..⎥. ⎦ = σ2 ⎢⎣0 0 0 . . . σ 21 0 0 . . . 00 1 0 . . . 0. . .. .. .0 0 0 . . . 1⎤⎥⎦ = σ2 I NA la hipótesis que reconoce que las varianzas <strong>de</strong> la perturbación no son constantes enel tiempo o las observaciones se le conoce como hipótesis <strong>de</strong> Heterocedasticidad. A lahipótesis que reconoce que las covarianzas entre perturbaciones <strong>de</strong> distinto momento <strong><strong>de</strong>l</strong>tiempo, o entre distintas observaciones, son distintas <strong>de</strong> cero se le conoce con el nombre<strong>de</strong> Autocorrelación.91


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Las perturbaciones siguen una distribución normal. Si <strong>de</strong>finimos la perturbación aleatoriacomo la suma <strong>de</strong> errores in<strong>de</strong>pendientes entre sí, a través <strong><strong>de</strong>l</strong> Teorema Central <strong><strong>de</strong>l</strong>Límite podremos suponer una distribución normal y escribir esta hipótesis junto con lasanteriores como:u ∼ NID(0, σ 2 I N )don<strong>de</strong> estamos escribiendo la distribución <strong><strong>de</strong>l</strong> vector <strong>de</strong> perturbaciones u y <strong>de</strong>cimos quelas perturbaciones siguen una distribución normal, idéntica e in<strong>de</strong>pendientemente distribuidas,<strong>de</strong> media cero y varianza constante igual a σ 2 . Son in<strong>de</strong>pendientes dado quesu covarianza es cero y dado que todas tienen igual varianza y covarianza su distribuciónes idéntica, por ello para una perturbación en i escribimos su distribución comou i ∼ N(0, σ 2 ).Estas propieda<strong>de</strong>s pue<strong>de</strong>n también escribirse conjuntamente comou i ∼ NID(0, σ 2 u)∀i = 1, . . . , Nó en forma matricial,u(N × 1)2. Hipótesis sobre las variables exógenas X.∼ N ( 0 N(N × 1), σuI 2 N )(N × N)• Las variables explicativas son variables no aleatorias (no estocásticas o fijas). Esto quiere<strong>de</strong>cir que cuando digamos que cambiamos la muestra los valores <strong>de</strong> las variables exógenasno cambian y sólo cambian los valores <strong>de</strong> la variable endógena Y i .Como consecuencia <strong>de</strong> que las variables exógenas sean fijas tendremos que son incorrelacionadascon las perturbaciones:E(X ′ u) = X ′ E(u) = 0• La matriz X es <strong>de</strong> rango completo e igual a K con K < N, rg(X) = K, es <strong>de</strong>cir nohay ninguna combinación lineal exacta entre las columnas <strong>de</strong> X, son todas linealmentein<strong>de</strong>pendientes con lo que el rango <strong>de</strong> la matriz es igual al número <strong>de</strong> coeficientes <strong>de</strong>sconocidoya que en X tenemos una columna por parámetro. A esta hipótesis se le conocecon el nombre <strong>de</strong> No Multicolinealidad. El que a<strong>de</strong>más exijamos que K < N es porquenecesitamos tener más observaciones que coeficientes a estimar en el mo<strong><strong>de</strong>l</strong>o.3. Hipótesis sobre la forma funcional.• Linealidad en los coeficientes.• Mo<strong><strong>de</strong>l</strong>o correctamente especificado. Todas las variables X 1 , X 2 , . . . , X K explican Y y nohay ninguna otra <strong>de</strong> fuera <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o que explique a Y .4. Los coeficientes permanecen constantes a lo largo <strong>de</strong> toda la muestra.92


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.2. Forma funcional. Interpretación <strong>de</strong> los coeficientes.Dados los supuestos básicos <strong><strong>de</strong>l</strong> MRLG,E(Y i ) = E(β 1 + β 2 X 2i + . . . + β K X Ki + u i )= β 1 + β 2 X 2i + . . . + β K X Ki + E(u i ) =} {{ }=0= β 1 + β 2 X 2i + . . . + β K X Ki .A E(Y i ) se la <strong>de</strong>nomina Función <strong>de</strong> Regresión Poblacional (FRP) y sus coeficientes, pue<strong>de</strong>ninterpretarse como:• β 1 = E(Y i |X 2i = . . . = X Ki = 0). Valor medio o esperado <strong>de</strong> Y i cuando las variables explicativasson todas cero.• β k = ∂E(Y i)= ∆E(Y i)∂X ki ∆X∀k = 2, . . . , K. Incremento (o <strong>de</strong>cremento) en el valor esperado <strong>de</strong>kiY i cuando la variable explicativa X k se incrementa en una unidad, manteniéndose constantes elresto <strong>de</strong> las variables. Un aumento unitario en la variable explicativa X k conlleva un aumentomedio <strong>de</strong> β k unida<strong>de</strong>s en la variable endógena, ceteris paribus.Ejemplo 5.1Se propone la siguiente especificación <strong>de</strong> la función <strong>de</strong> consumo agregada para estudiarla relación en Estados Unidos en el periodo 1960-2005 entre el consumo personal, GCP,y el ingreso, PIB, ambos en miles <strong>de</strong> millones <strong>de</strong> dólares:GCP t = β 1 + β 2 P IB t + u tβ 2 recoge el incremento esperado en el consumo personal por unidad <strong>de</strong> incrementoen el P IB. A<strong>de</strong>más tiene interpretación económica ya que es la propensión marginal aconsumir que según la teoría keynesiana esta limitada entre 0 y 1. β 1 es el valor esperado<strong><strong>de</strong>l</strong> consumo cuando el valor <strong><strong>de</strong>l</strong> P IB es cero.Ejemplo 5.2Se dispone <strong>de</strong> una base <strong>de</strong> datos para 51 estados <strong>de</strong> E.E.U.U. sobre el gasto agregadoen transporte urbano (EXP T RAV ) y la renta disponible agregada (INCOME) correspondientesal año 1993 1 . Las variables que se consi<strong>de</strong>ran son:1 Fuente: Statistical Abstract of U.S. (1995), recogida en Ramanthan, Ramu (2002) Introductory econometrics withapplications. Fichero <strong>de</strong> datos data8-2.gdt.93


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEXPTRAV = Gasto agregado en transporte urbano, en billones <strong>de</strong> dólares, (Rango0,708 - 42,48).INCOME = Renta disponible agregada, en billones <strong>de</strong> dólares, (Rango 9,3 - 683,5).Un mo<strong><strong>de</strong>l</strong>o para analizar si la renta disponible agregada explica el gasto agregado entransporte urbano es el siguiente 2 :EXP T RAV i = β 1 + β 2 INCOME i + u i i = 1, . . . , 51 (5.2)El parámetro β 1 recoge el valor esperado <strong><strong>de</strong>l</strong> gasto en transporte cuando la renta es cero,β 1 = E(EXP T RAV |INCOME = 0). La pendiente β 2 recoge el incremento en el valoresperado <strong><strong>de</strong>l</strong> gasto en transporte cuando la renta se incrementa en una unidad, es estecaso cuando se incrementa en un billón <strong>de</strong> dólares, β 2 =signo positivo.∂E(EXP T RAV )∂INCOME. EsperaríamosEjemplo 5.3Estamos interesados en explicar el precio <strong>de</strong> una vivienda, en miles <strong>de</strong> dólares (PRICE),mediante las variables explicativas: el tamaño <strong>de</strong> la casa o el número <strong>de</strong> pies cuadrados<strong><strong>de</strong>l</strong> área habitable (SQFT), el número <strong>de</strong> habitaciones (BEDRMS) y el número <strong>de</strong> baños(BATHS). Formulamos el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal múltiple:P RICE i = β 1 + β 2 SQF T i + β 3 BEDRMS i + β 4 BAT HS i + u i i = 1, 2, . . . , N (5.3)Interpretación <strong>de</strong> los coeficientes:• El coeficiente β 1 = E(P RICE i |SQF T i = BEDRMS i = BAT HS i = 0) es el valormedio esperado <strong>de</strong> aquellas viviendas que no tienen ningún pie cuadrado <strong>de</strong> áreahabitable, ni habitaciones ni baños.• El coeficiente β 2 = ∂E(P RICE i)∂SQF T i, mi<strong>de</strong> el incremento en el valor esperado <strong><strong>de</strong>l</strong> precio <strong>de</strong>una vivienda cuando su superficie se incrementa en un pie cuadrado, manteniéndoseel resto <strong>de</strong> variables constante. Luego, consi<strong>de</strong>rando dos casas con el mismo número<strong>de</strong> habitaciones y <strong>de</strong> baños, para aquella casa que tenga un pie cuadrado más <strong>de</strong>área habitable se espera que cambie en media su precio <strong>de</strong> venta en β 2 miles <strong>de</strong>dólares.• El coeficiente β 3 = ∂E(P RICE i)∂BEDRMS i, mi<strong>de</strong> el incremento en el valor esperado <strong><strong>de</strong>l</strong> precio<strong>de</strong> una vivienda cuando el número <strong>de</strong> habitaciones <strong>de</strong> la misma se incrementa enuna unidad, manteniéndose el resto <strong>de</strong> variables constante. Consi<strong>de</strong>rando dos casascon el mismo número <strong>de</strong> pies cuadrados <strong>de</strong> área habitable y número <strong>de</strong> baños, paraaquella casa que tenga una habitación más se espera que cambie en media su precio<strong>de</strong> venta en β 3 miles <strong>de</strong> dólares.• El coeficiente β 4 = ∂E(P RICE i)∂BAT HS i, mi<strong>de</strong> el incremento en el valor esperado <strong><strong>de</strong>l</strong> precio<strong>de</strong> una vivienda cuando el número <strong>de</strong> habitaciones <strong>de</strong> la misma se incrementa en2 Son datos <strong>de</strong> sección cruzada luego utilizamos el subíndice i = 1, . . . , N.94


Estadística Actuarial: Análisis <strong>de</strong> Regresiónuna unidad, manteniéndose el resto <strong>de</strong> variables constante. Consi<strong>de</strong>rando dos casascon el mismo número <strong>de</strong> pies cuadrados <strong>de</strong> área habitable y número <strong>de</strong> habitaciones,para aquella casa que tenga un baño más se espera que cambie en media su precio<strong>de</strong> venta en β 4 miles <strong>de</strong> dólares.Ejemplo 5.4Se especifica la siguiente función <strong>de</strong> salarios en el año 2002:W i = β 1 + β 2 S 2i + u ii = 1, 2, . . . Ndon<strong>de</strong> W i es el salario anual <strong><strong>de</strong>l</strong> individuo i y S 2i es una variable ficticia que se <strong>de</strong>fine:S 2i ={ 1 si el individuo i es mujer0 en caso contrarioLa interpretación <strong>de</strong> los coeficientes <strong>de</strong> regresión <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o es la siguiente:• β 1 = E(W i |S 2i = 0) luego es el salario esperado cuando el individuo es hombre.Esperaríamos signo positivo.• E(W i |S 2i = 1) = β 1 + β 2 es el salario esperado <strong>de</strong> una mujer. Luego β 2 es elincremento o <strong>de</strong>cremento en el salario esperado para un individuo por el hecho <strong>de</strong> sermujer. Por tanto β 2 recoge el efecto diferencial en el salario esperado entre hombresy mujeres. Si es cierto que existe discriminación salarial por sexo esperaríamos quetuviera signo negativo. De la misma forma si no existiera discriminación salarialpor sexo, es <strong>de</strong>cir si hombres y mujeres tuvieran el mismo salario, su valor seríacero.Ejemplo 5.5Se especifica la siguiente función <strong>de</strong> salarios en el año 2002:W i = β 1 + β 2 S 2i + β 3 X i + u ii = 1, 2, . . . Ndon<strong>de</strong> W i es el salario anual <strong><strong>de</strong>l</strong> individuo i, X i son los años <strong>de</strong> experiencia <strong><strong>de</strong>l</strong> individuoi y S 2i es una variable ficticia que se <strong>de</strong>fine:S 2i ={ 1 si el individuo i es mujer0 en caso contrarioLa interpretación <strong>de</strong> los coeficientes <strong>de</strong> regresión <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o es la siguiente:• β 1 = E(W i |S 2i = X i = 0) luego es el salario esperado cuando el individuo eshombre y no tiene experiencia. Esperaríamos signo positivo.95


Estadística Actuarial: Análisis <strong>de</strong> Regresión• E(W i |S 2i = 1, X i = 0) = β 1 +β 2 luego β 2 es el incremento o <strong>de</strong>cremento en el salarioesperado para un individuo cuando no tiene experiencia por el hecho <strong>de</strong> ser mujer.Por tanto β 2 recoge el efecto diferencial en el salario esperado entre hombres ymujeres con igual experiencia laboral. Si es cierto que existe discriminación salarialpor sexo esperaríamos que tuviera signo negativo. De la misma forma, si no existieradiscriminación salarial por sexo su valor sería cero.• β 3 = ∂E(W i)∂X ies el incremento en el salario esperado <strong><strong>de</strong>l</strong> individuo i cuando laexperiencia se incrementa en un año. Es in<strong>de</strong>pendiente <strong><strong>de</strong>l</strong> sexo <strong><strong>de</strong>l</strong> individuo iluego es el mismo para hombres y mujeres. Esperaríamos signo positivo, a mayorexperiencia mayor remuneración.Ejemplo 5.6Se especifica la siguiente función <strong>de</strong> ventas <strong>de</strong> una empresa para el período <strong>de</strong> Enero <strong>de</strong>1978 a Diciembre <strong>de</strong> 2002:V t = β 1 + β 2 D 2t + β 3 D 3t + β 4 D 4t + u tt = 1, 2, . . . Tdon<strong>de</strong> V t son las ventas <strong>de</strong> la empresa en el momento t y las variables D jt son variablesficticias que se <strong>de</strong>finen:{ 1 si la observación t pertenece al trimestre j j = 2, 3, 4D jt =0 en caso contrarioLa interpretación <strong>de</strong> los coeficientes <strong>de</strong> regresión <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o es la siguiente:• E(V t |D 2t = D 3t = D 4t = 0) = β 1 es el valor esperado <strong>de</strong> las ventas en el primertrimestre.• E(V t |D 2t = 1; D 3t = D 4t = 0) = β 1 + β 2 es el valor esperado <strong>de</strong> las ventas enel segundo trimestre. Luego β 2 es el diferencial entre las ventas esperadas en elsegundo trimestre y el primer trimestre.• E(V t |D 3t = 1; D 2t = D 4t = 0) = β 1 + β 3 es el valor esperado <strong>de</strong> las ventas en eltercer trimestre. Luego β 3 es el diferencial entre las ventas esperadas en el tercertrimestre y el primer trimestre.• E(V t |D 2t = D 3t = 0; D 4t = 1) = β 1 + β 4 es el valor esperado <strong>de</strong> las ventas en elsegundo trimestre. Luego β 4 es el diferencial entre las ventas esperadas en el cuartotrimestre y el primer trimestre.Ejemplo 5.7En este ejemplo vamos a analizar los <strong>de</strong>terminantes <strong>de</strong> la oferta laboral <strong>de</strong> las mujerescasadas 3 . Para ello vamos a utilizar el archivo mroz87.gdt incluido en el programa gretl,3 Fichero mrox87.gdt, disponible en gretl pestaña Gretl. Fuente:“The Sensitivity of an Empirical Mo<strong><strong>de</strong>l</strong> of MarriedWomen’s Hours of Work to Economic and Statistical Assumptions”, Econometrica 55, 765-799.96


Estadística Actuarial: Análisis <strong>de</strong> Regresiónen la carpeta <strong>de</strong> archivos <strong>de</strong> muestra “Gretl”. En él se dispone <strong>de</strong> observaciones <strong>de</strong> lassiguientes variables, entre otras 4 :• LF P : Variable ficticia que toma valor 1 si la mujer ha trabajado en 1975 y cero enotro caso• HOURS: Número <strong>de</strong> horas trabajadas por la esposa en 1975, (W HRS).• KL6: Número <strong>de</strong> hijos menores <strong>de</strong> seis años, en la familia.• K618: Número <strong>de</strong> hijos entre seis y dieciocho años, en la familia.• AGE: Edad <strong>de</strong> la esposa, (W A).• EDUC: Años <strong>de</strong> educación recibidos por la esposa, (W E).• W AGE: Salario <strong>de</strong> la esposa en el momento <strong>de</strong> la encuesta, 1976, (RP W G).• F AMINC: Renta familiar en dólares <strong>de</strong> 1975.• EXP ER: Años <strong>de</strong> experiencia en la actualidad, (AX).Se trata <strong>de</strong> una muestra <strong>de</strong> sección cruzada con 428 observaciones <strong>de</strong> mujeres trabajadorasdon<strong>de</strong> el término trabajadoras implica que tienen un salario monetario.Con la muestra anterior creamos las siguientes variables:l W AGE i = ln(W AGE) i ,sq EXP ER i = EXP ER 2 i ,NW IF EINC i = F AMINC i − (W AGE i × HOURS i )Dado nuestro objetivo <strong>de</strong> estudiar los <strong>de</strong>terminantes <strong>de</strong> la oferta laboral <strong>de</strong> la poblaciónfemenina casada, la variable a estudiar es HOURS. Como <strong>de</strong>terminantes <strong>de</strong> la mismapo<strong>de</strong>mos pensar en incluir en el mo<strong><strong>de</strong>l</strong>o el salario en logaritmos, l W AGE, los años <strong>de</strong>educación recibidos, EDUC, la edad, AGE, el número <strong>de</strong> hijos <strong>de</strong> la familia, KL6 yK618, y la variable NW IF EINC, que <strong>de</strong> alguna manera mi<strong>de</strong> la importancia <strong>de</strong> lasrentas familiares que no <strong>de</strong>pen<strong>de</strong>n <strong>de</strong> los ingresos <strong>de</strong> la esposa. Así, el mo<strong><strong>de</strong>l</strong>o a estimarsería:HOURS i = β 1 + β 2 l W AGE i +β 3 EDUC i + β 4 AGE i + β 5 KL6 i + β 6 K618 i + β 7 NW IF EINC i + u i (5.4)A priori esperaríamos que los coeficientes <strong>de</strong> las variables l W AGE, EDUC y K618 fuesenpositivos, ceteris paribus. Es <strong>de</strong> esperar que si se tiene un sueldo alto la estimulacióna seguir trabajando sea mayor. También es lógico pensar que cuando la preparación (estudios)es mayor, se tenga un empleo mejor y mejor remunerado, luego es más probableque la mujer trabaje fuera <strong>de</strong> casa. Familias con mayor número <strong>de</strong> hijos necesitan <strong>de</strong> unamayor renta, por lo que es probable que la esposa <strong>de</strong>cida trabajar. Por otro lado, cuandohay niños pequeños po<strong>de</strong>mos pensar que la esposa se retire <strong><strong>de</strong>l</strong> mercado <strong>de</strong> trabajo para4 Algunas <strong>de</strong> las variables han sido renombradas para que el ejercicio resulte más cómodo. Entre paréntesis apareceel nombre original utilizado en el fichero para que las podáis reconocer fácilmente.97


Estadística Actuarial: Análisis <strong>de</strong> Regresióncuidarlos, por lo que esperaríamos un signo negativo en el coeficiente que acompaña aKL6 manteniendo el resto <strong>de</strong> factores constante. A mayor edad, también es posible queno se quiera trabajar fuera <strong>de</strong> casa, por lo que, esperamos signo negativo para la variableAGE ceteris paribus. Finalmente, manteniendo el resto <strong>de</strong> factores constantes tambiénesperaríamos signo negativo para el coeficiente <strong>de</strong> la variable NW IF EINC ya que, sila renta disponible que no <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la remuneración <strong>de</strong> la mujer es alta, es probableque eso <strong>de</strong>sincentive a trabajar fuera <strong>de</strong> casa a la esposa. Es importante tener en cuentala fecha <strong>de</strong> la recogida <strong>de</strong> datos, 1975, cuando todavía la participación en el mercado <strong>de</strong>trabajo <strong>de</strong> la mujer no estaba consolidada.Algunas consi<strong>de</strong>raciones sobre la linealidad en parámetros Cuando <strong>de</strong>cimos que el MRLG es unmo<strong><strong>de</strong>l</strong>o lineal queremos <strong>de</strong>cir que Y o alguna transformación <strong>de</strong> Y es lineal en las X o en algunatransformación lineal <strong>de</strong> las X. Hay dos tipos <strong>de</strong> linealidad, linealidad en variables y linealidad enparámetros. Nosotros estamos interesados en la linealidad en parámetros: es <strong>de</strong>cir las <strong>de</strong>rivadas conrespecto a los coeficientes <strong>de</strong>sconocidos son una función lineal sólo <strong>de</strong> las X.β k = ∂E(Y i)∂X kik = 1, 2, . . . , KEl mo<strong><strong>de</strong>l</strong>o lineal más sencillo es el Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal Simple don<strong>de</strong> la variable endógenaY queda explicada por una única variable exógena XY i = β 1 + β 2 X i + u ii = 1, 2, . . . , NDe igual forma es lineal el Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal General don<strong>de</strong> la variable endógena Y seexplica con un conjunto <strong>de</strong> k-variables explicativas (X 1i , X 2i , . . . , X Ki )Y i = β 1 + β 2 X 2i + β 3 X 3i + . . . + β K X Ki + u ii = 1, 2, . . . , NDado que estamos interesados sólo en la linealidad en parámetros también serán consi<strong>de</strong>rados linealeslos siguientes mo<strong><strong>de</strong>l</strong>os:Y i = β 1 + β 21Xi+ u i −→ Y i = β 1 + β 2 Z i + u i con Z i = 1/X iY i = β 1 + β 2 X 2 i + u i −→ Y i = β 1 + β 2 W i + u i con W i = X 2 ique son lineales en parámetros según lo dicho anteriormente aunque no lo sean en variables. Ahorabien, existen otras relaciones que aunque en principio no son lineales pue<strong>de</strong>n transformarse enlineales y por tanto son perfectamente estimables en nuestros términos. Por ejemplo:1. Sea el siguiente mo<strong><strong>de</strong>l</strong>o:X i = AB Y iu ipo<strong>de</strong>mos transformar el mo<strong><strong>de</strong>l</strong>o en lineal en parámetros tomado logaritmos y obtener:Y i = β 1 + β 2 LnX i + u i (5.5)don<strong>de</strong> β 2 = (LnB) −1 y β 1 = ( LnALnB )a esta transformación se le llama semilogarítmica.98


Estadística Actuarial: Análisis <strong>de</strong> Regresión2. Sea el mo<strong><strong>de</strong>l</strong>o:Y i = AX B i u i −→ LnY i = β 1 + β 2 LnX i + u i (5.6)don<strong>de</strong> β 1 = LnA, a esta transformación se le llama doblemente logarítmica.Ejemplo 5.8Un ejemplo específico <strong>de</strong> esta última transformación es la función Cobb-Douglas <strong>de</strong> lateoría <strong>de</strong> producción. La función <strong>de</strong> producción Cobb-Douglas, en su forma estocástica,se expresa como:Q t = A L β 2e u tt K β 3tDe la ecuación anterior se <strong>de</strong>duce que la relación entre la producción y los factorescapital y trabajo es claramente no lineal. Sin embargo, po<strong>de</strong>mos transformar el mo<strong><strong>de</strong>l</strong>otomando logaritmos y obtener la siguiente relación lineal en los parámetros β 1 , β 2 y β 3 :Q t = AL β 2t K β 3t e ut −→ LnQ t = β 1 + β 2 LnL t + β 3 LnK t + u t (5.7)siendo β 1 = LnA. Una ventaja <strong>de</strong> este tipo <strong>de</strong> mo<strong><strong>de</strong>l</strong>os como el recogido en la ecuación(5.7), en los que todas las variables están medidas en logaritmos, es que los parámetros<strong>de</strong> pendiente a<strong>de</strong>más <strong>de</strong> recibir la interpretación habitual pue<strong>de</strong>n interpretarse entérminos <strong>de</strong> elasticida<strong>de</strong>s:β 2 = ∂E(LnQ t)= ∂E(Q t)∂LnL t ∂L tL tQ tβ 3 = ∂E(LnQ t)= ∂E(Q t) K t∂LnK t ∂K t Q tEs <strong>de</strong>cir β k k = 2, 3, mi<strong>de</strong>n el cambio porcentual o elasticidad (parcial) generado en lavariable endógena como consecuencia <strong>de</strong> un cambio porcentual (un 1 %) en la variableexógena correspondiente, ceteris paribus. En el ejemplo anterior β 2 y β 3 representanlas elasticida<strong>de</strong>s <strong>de</strong> la función <strong>de</strong> producción con respecto a los factores <strong>de</strong> produccióntrabajo y capital respectivamente.Por otro lado la suma (β 2 +β 3 ) da información sobre los rendimientos a escala , es <strong>de</strong>cir,la respuesta <strong>de</strong> la producción a un cambio proporcional en los factores <strong>de</strong> producción.Si la suma es 1 existen rendimientos constantes a escala, al duplicar los factores <strong>de</strong>producción se duplica la producción. Si la suma es menor que 1 existen rendimientos<strong>de</strong>crecientes a escala, al duplicar los factores <strong>de</strong> producción ésta crece menos <strong><strong>de</strong>l</strong> doble. Sila suma es mayor que 1 existen rendimientos crecientes a escala, al duplicar los factores<strong>de</strong> producción ésta crece más <strong><strong>de</strong>l</strong> doble.Es importante notar que para la ecuación (5.5) la interpretación <strong>de</strong> los parámetros comoelasticida<strong>de</strong>s no es posible ya que al no estar la variable Y i en logaritmos:β = ∂E(Y i)= ∂E(Y i)∂LnX i ∂X i99X i


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.3. Estimación por Mínimos Cuadrados Ordinarios (MCO)• Nuestro objetivo es estimar los parámetros <strong>de</strong>sconocidos β k ,k = 1, . . . , K <strong>de</strong>Y i = β 1 + β 2 X 2i + . . . + β K X Ki + u ii = 1, 2, . . . , NY = Xβ + uen forma matricial.A los parámetros estimados los <strong>de</strong>notamos ˆβ k y la estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o esŶ t = ˆβ 1 + ˆβ 2 X 2i + . . . + ˆβ K X Kii = 1, 2, . . . , NŶ = X ˆβen forma matricial,a la cual <strong>de</strong>nominamos Función <strong>de</strong> Regresión Muestral (FRM).• Elementos adicionales• La perturbación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o recoge todo aquello que no ha sido explicado por la parte sistemática<strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y se obtiene como la diferencia entre la variable a explicar y la recta <strong>de</strong>regresión poblacional:u i = Y i − E(Y i ) i = 1, 2, . . . , Nu = Y − Xβen forma matricial.• El residuo mi<strong>de</strong> el error cometido al estimar la variable endógena y se <strong>de</strong>fine como la diferenciaentre la variable a explicar y la recta <strong>de</strong> regresión muestral 5 :û i = Y i − Ŷi = Y i − ˆβ 1 − ˆβ 2 X 2i − . . . − ˆβ K X Kii = 1, 2, . . . , Nû = Y − Ŷ = Y − X ˆβen forma matricial.Este error proviene <strong>de</strong> dos fuentes: la primera, por el hecho <strong>de</strong> no po<strong>de</strong>r obtener los valores <strong><strong>de</strong>l</strong>a perturbación (u i ) y la segunda se <strong>de</strong>be a que la estimación <strong>de</strong> los coeficientes <strong>de</strong>sconocidosβ k k = 1, . . . , K introduce un error adicional. Es importante, por tanto, diferenciar y noconfundir el residuo con la perturbación.• Representación gráfica: Cuando K = 2 el mo<strong><strong>de</strong>l</strong>o se escribeY i = β 1 + β 2 X i + u iy se <strong>de</strong>nomina Mo<strong><strong>de</strong>l</strong>o <strong>de</strong> Regresión Lineal Simple (MRLS). Entonces, la relación entre la FRM,FRP, residuos y perturbaciones pue<strong>de</strong> visualizarse en la Figura 5.2.En el Gráfico 5.2 la función <strong>de</strong> regresión poblacional está trazada en color negro así como loscoeficientes poblacionales, la or<strong>de</strong>nada (β 1 ) y la pendiente (β 2 ). Po<strong>de</strong>mos ver que el valor Y i se5 Los residuos son a la FRM lo que las perturbaciones a la FRP. Sin embargo, no son buenos estimadores <strong>de</strong> lasmismas (al menos, no si la muestra es pequeña) porque no tienen las mismas propieda<strong>de</strong>s, se pue<strong>de</strong> ver en el Anexo3 incluido en el Apéndice <strong><strong>de</strong>l</strong> Tema.100


Estadística Actuarial: Análisis <strong>de</strong> RegresiónY i✻(Y 1 , X 1 )Ŷ i = ˆβ 1 + ˆβ 2 X iY 1X 1E(Y i ) = β 1 + β 2 X iˆβ 1 + ˆβ 2 X 1 = Ŷ1✻û1❄✻❄u 1✻ β 1 + β 2 X 1β 1β 2ˆβ 1ˆβ2❄✲X iFigura 5.2: Función <strong>de</strong> regresión poblacional y función <strong>de</strong> regresión muestralobtiene como la suma <strong><strong>de</strong>l</strong> valor que toma la parte sistemática β 1 + β 2 X i (situada sobre la FRP) y<strong><strong>de</strong>l</strong> valor que toma la perturbación u i , esto es, Y i = β 1 + β 2 X i + u i .La función <strong>de</strong> regresión muestral y los coeficientes estimados ( ˆβ 1 y ˆβ 2 ) están representados en colorrojo. La diferencia entre la FRP y la FRM se <strong>de</strong>be a los errores que se cometen en la estimación<strong>de</strong> los coeficientes <strong>de</strong> la regresión ( ˆβ 1 ≠ β 1 , ˆβ 2 ≠ β 2 ). Basándonos en la FRM po<strong>de</strong>mos obtener elvalor <strong><strong>de</strong>l</strong> punto Y i como la suma <strong><strong>de</strong>l</strong> valor estimado <strong>de</strong> la parte sistemática Ŷi = ˆβ 1 + ˆβ 2 X i (situadosobre la FRM) y <strong><strong>de</strong>l</strong> valor que toma el residuo û i , esto es, Y i = Ŷi + û i .5.3.1. Método <strong>de</strong> estimación <strong>de</strong> Mínimos Cuadrados Ordinarios (MCO)El objetivo es obtener un vector <strong>de</strong> estimadores <strong>de</strong> los parámetros ó coeficientes β 1 , . . . , β K , parael cual buscamos K estimadores respectivamente. Un estimador es una fórmula que, aplicada a losdatos, da como resultado un valor numérico. Al valor numérico calculado a partir <strong>de</strong> un estimadory <strong>de</strong> una muestra dada, lo <strong>de</strong>nominamos estimación. A ambos los <strong>de</strong>notamos ˆβ, el cual pue<strong>de</strong> ser,consecuentemente, un vector <strong>de</strong> estimadores o <strong>de</strong> estimaciones, según nos estemos refiriendo a lafórmula o a los valores numéricos resultantes. Pero no son lo mismo.Necesitamos un criterio <strong>de</strong> estimación, que dados el mo<strong><strong>de</strong>l</strong>o y la muestra nos permita obtener lafunción <strong>de</strong> regresión muestral. Proponemos el criterio <strong>de</strong> estimación mínimo cuadrático ordinariopor su sencillez y buenas propieda<strong>de</strong>s, que <strong>de</strong>mostraremos más a<strong><strong>de</strong>l</strong>ante.El criterio <strong>de</strong> estimación Mínimo Cuadrático Ordinario (MCO) se expresa:mínˆβN∑i=1û 2 i = mínˆβN∑(Y i − Ŷi) 2A continuación buscaremos la expresión <strong>de</strong> los estimadores mínimo cuadráticos obtenidos comoresultado <strong>de</strong> aplicar el criterio MCO al mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal general.i=1101


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Estimador MCO <strong><strong>de</strong>l</strong> MRLGCriterio:mínˆβ 1 ,..., ˆβ Kmínˆβ 1 ,..., ˆβ KN ∑i=1N ∑i=1û 2 i =mínˆβ 1 ,..., ˆβ KN ∑i=1(Y i − Ŷi) 2 =Las K Condiciones <strong>de</strong> Primer Or<strong>de</strong>n (C.P.O.) <strong>de</strong> mínimo son<strong>de</strong> don<strong>de</strong> se obtienen las ecuaciones normales:−2−2−2(Y i − ˆβ 1 − ˆβ 2 X 2i − . . . − ˆβ K X Ki ) 2 (5.8)∂ ∑ Ni=1 û2 i∂ ˆβ 1= 0∂ ∑ Ni=1 û2 i∂ ˆβ 2= 0∂ ∑ Ni=1 û2 i∂ ˆβ 3= 0.∂ ∑ Ni=1 û2 i∂ ˆβ K=.0N∑(Y i − ˆβ 1 − ˆβ 2 X 2i − . . . − ˆβ K X Ki ) = 0i=1N∑(Y i − ˆβ 1 − ˆβ 2 X 2i − . . . − ˆβ K X Ki )X 2i = 0i=1..N∑(Y i − ˆβ 1 − ˆβ 2 X 2i − . . . − ˆβ K X Ki )X Ki = 0i=1que pue<strong>de</strong>n escribirse como:∑Yi =∑X2i Y i =.∑XKi Y i =N ˆβ 1 + ˆβ 2∑X2i + . . . + ˆβ K∑XKiˆβ 1∑X2i + ˆβ 2∑ X22i + . . . + ˆβ K∑X2i X Ki.ˆβ 1∑XKi + ˆβ 2∑XKi X 2i + . . . + ˆβ K∑ X2KiEn forma matricial, ∑ Ni=1 û2 i = û′ û(1 × 1)mínˆβdon<strong>de</strong> û es un vector N × 1 y el criterio pue<strong>de</strong> escribirseû ′ û = mín(Y − X ˆβ) ′ (Y − X ˆβ).ˆβ102


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLas K Condiciones <strong>de</strong> Primer Or<strong>de</strong>n (C.P.O.) <strong>de</strong> mínimo son∂û ′ û∂ ˆβ = 0 ⇒ −2X′ (Y − X ˆβ) = 0.Despejando, obtenemos las ecuaciones normales en forma matricial:<strong>de</strong> don<strong>de</strong> el estimador MCO (en forma matricial) es:X ′ Y = X ′ X ˆβ MCO . (5.9)ˆβ MCO = (X ′ X) −1 X ′ Y (5.10)en el que X ′ X es una matriz <strong>de</strong> or<strong>de</strong>n K × K, X ′ Y un vector <strong>de</strong> or<strong>de</strong>n K × 1 y ˆβ un vector <strong>de</strong>or<strong>de</strong>n K × 1, tales queX ′ X =(K × K)⎡⎢⎣∑ ∑ ∑∑N∑ X2i∑ X3i · · ·∑ XKiX2i X2∑ ∑ 2i ∑ X2i X 3i · · ·∑ X2i X KiX3i X3i X 2i X23i · · · X3i X Ki.. .. ..∑ ∑ ∑ ∑.XKi XKi X 2i XKi X 3i · · · X2Ki⎤⎥⎦X ′ Y =(K × 1)⎡⎢⎣∑ ⎤∑Yi∑X2i Y iX3i Y i⎥∑. ⎦XKi Y iˆβ =(K × 1)⎡⎢⎣ˆβ 1ˆβ 2ˆβ 3.ˆβ K⎤.⎥⎦El estimador MCO cumple también las condiciones <strong>de</strong> segundo or<strong>de</strong>n <strong>de</strong> mínimo, con lo cual es,efectivamente, la solución al problema <strong>de</strong> minimización <strong>de</strong> la suma <strong>de</strong> los residuos al cuadrado.Ejercicio 5.1Sea el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal simple don<strong>de</strong> se regresa Y t sobre X t , incluyendo untérmino in<strong>de</strong>pendiente.Y t = β 1 + β 2 X t + u tt = 1, . . . , TSin utilizar notación matricial:1. Escribe el sistema <strong>de</strong> ecuaciones correspondiente al mo<strong><strong>de</strong>l</strong>o propuesto.2. Escribe la función objetivo correspondiente a la estimación por MCO <strong>de</strong> los parámetros<strong>de</strong>sconocidos. Deriva las condiciones <strong>de</strong> primer or<strong>de</strong>n.103


Estadística Actuarial: Análisis <strong>de</strong> Regresión3. Obtén las ecuaciones normales correspondientes al mo<strong><strong>de</strong>l</strong>o.4. Obtén la expresión <strong>de</strong> ˆβ 1 y ˆβ 2 .Utilizando notación matricial:1. Escribe la expresión matricial <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.2. Escribe la función objetivo correspondiente a la estimación por MCO <strong>de</strong> los parámetros<strong>de</strong>sconocidos. Deriva las condiciones <strong>de</strong> primer or<strong>de</strong>n.3. Obtén las ecuaciones normales correspondientes al mo<strong><strong>de</strong>l</strong>o.4. Obtén la expresión <strong><strong>de</strong>l</strong> estimador <strong><strong>de</strong>l</strong> vector <strong>de</strong> parámetros <strong>de</strong>sconocidos ˆβ.Ejercicio 5.2Sea el siguiente mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal simple don<strong>de</strong> se regresa Y t sobre X t .Y t = βX t + u tt = 1, . . . , TSin utilizar notación matricial:1. Escribe el sistema <strong>de</strong> ecuaciones correspondiente al mo<strong><strong>de</strong>l</strong>o propuesto.2. Escribe la función objetivo correspondiente a la estimación por MCO <strong><strong>de</strong>l</strong> parámetro<strong>de</strong>sconocido. Deriva la condición <strong>de</strong> primer or<strong>de</strong>n.3. Obtén la ecuación normal <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.4. Obtén la expresión <strong>de</strong> ˆβ.Utilizando matrices escribe la expresión matricial <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y obtén la expresión <strong>de</strong> ˆβ.Algunas equivalencias <strong>de</strong> notaciónY i = β 1 + β 2 X 2i + . . . + β K X Ki + u i i = 1, 2, . . . , N ⇔ Y = Xβ + uE(Y i ) = β 1 + β 2 X 2i + . . . + β K X Ki i = 1, 2, . . . , N ⇔ E(Y ) = XβŶ i = ˆβ 1 + ˆβ 2 X 2i + . . . + ˆβ K X Ki i = 1, 2, . . . , N ⇔ Ŷ = X ˆβY i = ˆβ 1 + ˆβ 2 X 2i + . . . + ˆβ K X Ki + û i i = 1, 2, . . . , N ⇔ Y = X ˆβ + ûû i = Y i − Ŷi i = 1, 2, . . . , N ⇔ û = Y − Ŷ104


Estadística Actuarial: Análisis <strong>de</strong> RegresiónInterpretación <strong>de</strong> los coeficientes estimados por MCO• ˆβ 1 = Ê(Y i|X ki = 0, ∀k = 2, . . . , K). Valor esperado estimado <strong>de</strong> Y i cuando las variablesexplicativas son todas cero.• ˆβ k = ∂ E(Y ̂ i )∂X ki= ∆ E(Y ̂ i )∆X ki∀k = 2, . . . , K. Incremento esperado estimado (ó <strong>de</strong>cremento esperadoestimado) en Y i cuando la variable X k se incrementa en una unidad, manteniéndoseconstantes el resto <strong>de</strong> las variables explicativas.Ejemplo 5.9Supongamos que se dispone <strong>de</strong> datos para estimar la relación en Estados Unidos parael periodo 1960-2005 entre el consumo personal, GCP, y el ingreso, PIB, propuesta enel Ejemplo 5.1 y que la regresión estimada es la siguiente:̂ GCP t = −299, 5913 + 0, 721P IB tLa propensión marginal a consumir es 0, 72 lo que indica que cuando el ingreso realse incrementa en un dólar el consumo personal aumenta en 72 centavos. La or<strong>de</strong>nadaes −299, 5913 lo que indica que si el ingreso es cero el nivel promedio <strong><strong>de</strong>l</strong> consumo esnegativo e igual a 299, 59 dólares. No tiene interpretación económica.Si las unida<strong>de</strong>s <strong>de</strong> ambas variables fuese billones <strong>de</strong> $: por cada billón <strong>de</strong> dólares <strong>de</strong>incremento en el PIB el consumo se incrementaría en 0,721 billones, Luego por cada100 billones <strong>de</strong> incremento en PIB el consumo se incrementa en 72,1 billones <strong>de</strong> dólares.Cuando el PIB es cero el consumo es negativo e igual a 299591,3 billones <strong>de</strong> dólares.Ejemplo 5.10Vamos a retomar ahora el Ejemplo 5.3 don<strong>de</strong> se analizaban los <strong>de</strong>terminantes <strong><strong>de</strong>l</strong> precio<strong>de</strong> la vivienda. Se dispone <strong>de</strong> una base <strong>de</strong> datos sobre el precio <strong>de</strong> una vivienda y distintascaracterísticas <strong>de</strong> la misma para 14 viviendas vendidas en la comunidad universitaria<strong>de</strong> San Diego en 1980. Son datos <strong>de</strong> sección cruzada y la <strong>de</strong>scripción <strong>de</strong> las variablesdisponibles es 6 :PRICE = precio <strong>de</strong> venta <strong>de</strong> la vivienda en miles <strong>de</strong> dólares (Rango 199,9 - 505)SQFT = pies cuadrados <strong>de</strong> área habitable (Rango 1065 - 3000)BEDRMS= número <strong>de</strong> dormitorios (Rango 3 - 4)BATHS = número <strong>de</strong> baños (Rango 1,74 - 3)Para analizar si el tamaño, el número <strong>de</strong> habitaciones y el número <strong>de</strong> baños son factoresque explican o no el precio <strong>de</strong> la vivienda se especifica el siguiente mo<strong><strong>de</strong>l</strong>o:P RICE i = β 1 + β 2 SQF T i + β 3 BEDRMS i + β 4 BAT HS + u i i = 1, . . . , 14 (5.11)6 Fuente: Ramanathan, Ramu (2002) Introductory econometrics with applications. Conjunto <strong>de</strong> datos data4-1.gdt105


Estadística Actuarial: Análisis <strong>de</strong> RegresiónPara estimar el mo<strong><strong>de</strong>l</strong>o se utilizan las observaciones disponibles en el fichero data4-1.gdty que son las siguientes 7 :Obsv. P RICE SQF T BEDRMS BAT HS1 199,9 1065 3 1,752 228,0 1254 3 2,003 235,0 1300 3 2,004 285,0 1577 4 2,505 239,0 1600 3 2,006 293,0 1750 4 2,007 285,0 1800 4 2,758 365,0 1870 4 2,009 295,0 1935 4 2,5010 290,0 1948 4 2,0011 385,0 2254 4 3,0012 505,0 2600 3 2,5013 425,0 2800 4 3,0014 415,0 3000 4 3,00Tabla 5.1: Datos <strong>de</strong> características <strong>de</strong> viviendas. Fichero 4-1.gdt.Las estimaciones obtenidas resultan <strong>de</strong> aplicar el criterio MCO ˆβ = (X ′ X) −1 X ′ Y :⎡ ⎤ ⎡∑ ∑ ∑ ⎤ˆβ 1 ∑14∑ SQF Ti BEDRMSi BAT HSi⎢ˆβ 2⎥⎣ ˆβ 3⎦ = ⎢ SQF Ti SQF T2∑ ∑i SQF TiBEDRMS i SQF TiBAT HS i∑ ∑ ∑⎣ BEDRMSi BEDRMSi SQF T i BEDRMS2∑ ⎥∑i BEDRMSi BAT HS i⎦∑ ∑ ∑ˆβ 4BAT HSi BAT HSi SQF T i BAT HSi BEDRMS i BAT HS2i⎡⎢⎣∑ P RICEi∑ SQF Ti P RICE i∑ BEDRMSiP RICE i∑ BAT HSi P RICE i⎤ ⎡⎥⎦ = ⎢⎣14 26753 51 3326753 55462515 99193 65699, 7551 99193 189 121, 7533 65699, 75 121, 75 80, 375⎤⎥⎦−1 ⎡⎢⎣4444, 99095985, 516372, 710821, 075⎤ ⎡⎥⎦ = ⎢⎣−1129, 0620, 1548−21, 5875−12, 1928⎤×⎥⎦• La función <strong>de</strong> regresión muestral obtenida es:̂ P RICE i = 129, 062 + 0, 1548 SQF T i − 21, 5875 BEDRMS i − 12, 1928 BAT HS i• Interpretación <strong>de</strong> los signos obtenidos:Los signos obtenidos son los a<strong>de</strong>cuados. Para la variable SQF T el signo es positivoya que manteniendo el resto <strong>de</strong> variables constantes lógicamente si aumenta el áreahabitable aumentará el precio <strong><strong>de</strong>l</strong> piso. Si manteniendo el resto <strong>de</strong> variables constantela superficie habitada aumenta en un pie cuadrado el precio medio estimado <strong>de</strong> unavivienda aumentará en 154,8 dólares. También son a<strong>de</strong>cuados los signos para BEDRMSy BAT HS ya que en ambos casos se mantiene constante la superficie habitable por loque se aumenta el número <strong>de</strong> habitaciones (o baños) a costa <strong>de</strong> una menor superficie7 Pue<strong>de</strong>s acce<strong>de</strong>r a estos datos ejecutando gretl → En Archivo → Abrir datos → Archivo <strong>de</strong> muestra → EligeRamanathan, el fichero data4-1.gdt.106


Estadística Actuarial: Análisis <strong>de</strong> Regresión<strong>de</strong> éstas, lo cual es lógico que se valore negativamente por el comprador medio. Así,si se aumenta el número <strong>de</strong> habitaciones, manteniendo constante el número <strong>de</strong> bañosy la superficie <strong>de</strong> la vivienda, el precio medio se estima disminuirá en 21.588 dólares.Manteniéndose constante la superficie habitable y el número <strong>de</strong> habitaciones el hecho<strong>de</strong> tener un baño más redunda en habitaciones más pequeñas por lo que se estima queel precio medio se reducirá en 12.193 dólares.Mediante las estimaciones obtenidas po<strong>de</strong>mos estimar el incremento medio en el precio<strong>de</strong> la vivienda ante cambios en las variables explicativas. Por ejemplo, si mantenemosel número <strong>de</strong> baños, tenemos una habitación más y aumenta el área habitable en 500pies cuadrados, el cambio en el precio medio estimado <strong>de</strong> una vivienda será <strong>de</strong> 55,812dólares:̂ △ P RICE i = 0, 1548△ SQF T i − 21, 588△ BEDRMS i − 12, 192△ BAT HS i == (0, 1548 × 500) − 21, 588 × 1 − 12, 192 × 0) = 77, 4000 − 21, 588 = 55, 8125.3.2. Propieda<strong>de</strong>s <strong>de</strong> la Función <strong>de</strong> Regresión Muestral, FRM1. Los residuos son ortogonales a las variables explicativas: X ′ û = 0 (û ′ X = 0).por las ecuaciones normales.X ′ û = X ′ (Y − Ŷ ) = X′ (Y − X ˆβ) = 02. Los residuos son ortogonales a las estimaciones <strong>de</strong> la variable endógena: Ŷ ′ û = 0 (û ′ Ŷ = 0).Ŷ ′ û = (X ˆβ) ′ û = ˆβ ′ }{{} X ′ û = 0=0Si el mo<strong><strong>de</strong>l</strong>o tiene término in<strong>de</strong>pendiente, es <strong>de</strong>cir, si X 1i = 1, entonces la primera fila <strong>de</strong> X ′ û esigual a ∑ û i y tenemos que3. La suma <strong>de</strong> los residuos es cero: ∑ Ni=1 ûi = 0.⎡X ′ û = 0 ⇔⎢⎣∑ ⎤N1 ûi⎥. ⎦∑ N1 X Kiû i∑ N1 X 2iû i∑ N1 X 3iû i⎡=⎢⎣000.0⎤⇒⎥⎦N∑û i = 0i=14. La media muestral <strong>de</strong> Y es igual a la media muestral <strong>de</strong> las estimaciones <strong>de</strong> Y : Ȳ = ¯Ŷ .û i = Y i − Ŷi ⇐⇒ Y i = Ŷt + û i∑Yi = ∑ Ŷ i + ∑ û i} {{ }1N∑Yi = 1 N107=0∑Ŷi =⇒ Ȳ = ¯Ŷ


Estadística Actuarial: Análisis <strong>de</strong> Regresión5. La FRM pasa por el vector <strong>de</strong> medias: Ȳ = ˆβ 1 + ˆβ 2 ¯X2 + . . . + ˆβ K ¯XK .N∑û i = 0 ⇔ ∑ (Y i − ˆβ 1 − ˆβ 2 X 2i − . . . − ˆβ K X Ki ) = 0i=1∑Yi − N ˆβ 1 − ˆβ 2∑X2i − . . . − ˆβ K∑XKi = 0∑Yi = N ˆβ 1 + ˆβ 2∑X2i + . . . + ˆβ K∑XKi1 ∑Yi =Nˆβ 1 + ˆβ 12NȲ = ˆβ 1 + ˆβ 2 ¯X2 + . . . + ˆβ K ¯XK∑X2i + . . . + ˆβ 1 ∑K XKiNNota: Las propieda<strong>de</strong>s 1 y 2 se cumplen siempre, mientras que las 3, 4 y 5 se cumplen sólo si elmo<strong><strong>de</strong>l</strong>o tiene un término in<strong>de</strong>pendiente.5.3.3. Medidas <strong>de</strong> bondad <strong><strong>de</strong>l</strong> ajusteDefinimos la variación <strong>de</strong> la variable Y como la distancia <strong>de</strong> los valores observados <strong>de</strong> la variable asu media muestral. La suma <strong>de</strong> esas variaciones al cuadrado es la variación que se quiere explicarcon la variación <strong>de</strong> las variables explicativas. Se le <strong>de</strong>nota como SCT y se lee Suma <strong>de</strong> CuadradosTotal. Lógicamente, el ajuste realizado será mejor cuanto mayor sea la proporción explicada <strong>de</strong> esavariación.SCT = ∑ (Y i − Ȳ )2 = ∑ Y 2i − NȲ 2 = Y ′ Y − NȲ 2Cuando el mo<strong><strong>de</strong>l</strong>o tenga término in<strong>de</strong>pendiente podremos dividir la variación total en dos partes,variación explicada y variación sin explicar.Dado que Y = Ŷ + û, tenemos:Restando en ambos lados NȲ 2 ,Y ′ Y = (Ŷ + û)′ (Ŷ + û) == Ŷ ′ Ŷ + }{{} Ŷ ′ û + }{{} û ′ Ŷ +û ′ û = Ŷ ′ Ŷ + û ′ û=0 =0Y ′ Y − NȲ 2 = Ŷ ′ Ŷ − NȲ 2 + û ′ ûSi el mo<strong><strong>de</strong>l</strong>o tiene término in<strong>de</strong>pendiente, Ȳ = ¯Ŷ <strong>de</strong> don<strong>de</strong>,Y ′ Y − NȲ 2 = Ŷ ′ Ŷ − N ¯Ŷ 2 + û ′ û∑ 2 Yi − NȲ 2 = ∑ Ŷi2 − N ¯Ŷ 2 + ∑ û 2 i∑(Yi −} {{ Ȳ )2 = ∑ (Ŷi − ¯Ŷ ) 2 + ∑ û 2 i} } {{ } } {{ }SCTSCE SCR108


Estadística Actuarial: Análisis <strong>de</strong> Regresiónsiendo 8 :SCT = SCE + SCRSCT: Suma <strong>de</strong> Cuadrados Total, mi<strong>de</strong> la variación total.SCE: Suma <strong>de</strong> Cuadrados Explicada, mi<strong>de</strong> la variación explicada.SCR: Suma <strong>de</strong> Cuadrados Residual, mi<strong>de</strong> la variación sin explicar.SCT = ∑ (Y i − Ȳ )2 = Y ′ Y − NȲ 2SCE = ∑ (Ŷi − ¯Ŷ ) 2 = Ŷ ′ Ŷ − NȲ 2SCR = ∑ û 2 i = Y ′ Y − Ŷ ′ Ŷ = Y ′ Y − ˆβ ′ X ′ YCoeficiente <strong>de</strong> <strong>de</strong>terminación, R 2 R 2 = SCESCT = 1 − SCRSCT• Si existe término in<strong>de</strong>pendiente en el mo<strong><strong>de</strong>l</strong>o el R 2 estará entre los valores 0 y 1. Por la mismarazón si no existe término in<strong>de</strong>pendiente el R 2 no tiene sentido.• El coeficiente <strong>de</strong> <strong>de</strong>terminación mi<strong>de</strong> la bondad <strong><strong>de</strong>l</strong> ajuste o lo que es lo mismo la variabilidad<strong>de</strong> la variable endógena explicada con la variabilidad <strong>de</strong> las variables exógenas. Es unporcentaje.• A mayor R 2 mejor ajuste. Po<strong>de</strong>mos tener la tentación <strong>de</strong> mejorar el ajuste incluyendo variablesexógenas y este proce<strong>de</strong>r es un error. El problema que presenta el coeficiente <strong>de</strong> <strong>de</strong>terminaciónes que aumenta o se mantiene constante con la inclusión <strong>de</strong> nuevas variables explicativas en elmo<strong><strong>de</strong>l</strong>o, aunque éstas no contribuyan a explicar la variable endógena. Debido a este problema,se <strong>de</strong>fine otra medida <strong>de</strong> bondad <strong>de</strong> ajuste, el coeficiente <strong>de</strong> <strong>de</strong>terminación corregido, ¯R 2 .Coeficiente <strong>de</strong> <strong>de</strong>terminación corregido, ¯R 2 .¯R 2 = 1 −SCR(N−K)SCT(N−1)= 1 −= 1 −(N − 1) SCR(N − K) SCT(N − 1)(N − K) (1 − R2 )8 En el Anexo 1 incluido en el Apéndice <strong><strong>de</strong>l</strong> tema aparecen distintas expresiones <strong>de</strong> la SCT, SCE y SCR que pue<strong>de</strong>nresultar útiles.109


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Cualquiera que sea el número <strong>de</strong> variables incluidas en un mo<strong><strong>de</strong>l</strong>o la SCT será constante ypor tanto si incluimos una nueva variable la SCR será menor y la SCE será mayor.• Dado que ¯R 2 se <strong>de</strong>fine como una pon<strong>de</strong>ración <strong><strong>de</strong>l</strong> R 2 por los grados <strong>de</strong> libertad tendrá encuenta estos últimos.• Este coeficiente, penaliza la inclusión <strong>de</strong> nuevas variables explicativas. Si la nueva variableincluida explica a la variable endógena compensando la pérdida <strong>de</strong> grados <strong>de</strong> libertad, es<strong>de</strong>cir compensando el hecho <strong>de</strong> estimar un coeficiente más, el ¯R 2 aumenta. Sin embargo si lanueva variable incluida no explica a la variable endógena compensando la pérdida <strong>de</strong> grados<strong>de</strong> libertad el ¯R 2 disminuye.• Si K = 1, R 2 = ¯R 2 .• Si K > 1, ¯R 2 ≤ R 2 .El R 2 y el ¯R2 son sólo dos estadísticos y no <strong>de</strong>ben ser utilizados para comparar la especificación<strong>de</strong> mo<strong><strong>de</strong>l</strong>os entre sí, sólo los contrastes <strong>de</strong> hipótesis que se verán más a<strong><strong>de</strong>l</strong>ante son la herramientaa<strong>de</strong>cuada.Existen otros criterios <strong>de</strong> selección <strong>de</strong> mo<strong><strong>de</strong>l</strong>os: el criterio <strong>de</strong> información <strong>de</strong> Akaike (AIC) o loscriterios Bayesiano <strong>de</strong> Schwarz (BIC) y <strong>de</strong> Hannan-Quinn (HQC). Estos criterios se calculan enfunción <strong>de</strong> la suma <strong>de</strong> cuadrados residual y <strong>de</strong> algún factor que penalice por la pérdida <strong>de</strong> grados<strong>de</strong> libertad. Un mo<strong><strong>de</strong>l</strong>o más complejo, con más variables explicativas, reducirá la suma <strong>de</strong> cuadradosresidual pero aumentará el factor <strong>de</strong> penalización. Utilizando estos criterios se escogería aquelmo<strong><strong>de</strong>l</strong>o con un menor valor <strong>de</strong> AIC, BIC o HQC. Normalmente no suelen dar la misma elección,siendo el criterio AIC el que elige un mo<strong><strong>de</strong>l</strong>o con mayor número <strong>de</strong> parámetros. El cálculo <strong>de</strong> estoscriterios es algo complejo sin embargo el programa gretl los muestra automáticamente en el output<strong>de</strong> regresión. Únicamente los veremos con dicho programa.Coeficientes <strong>de</strong> correlación El coeficiente <strong>de</strong> correlación lineal simple mi<strong>de</strong> el grado <strong>de</strong> asociaciónlineal entre dos variables. Para X e Y se <strong>de</strong>fine∑ (Xi − ¯X)(Y i −Ȳ )∑NXi Yrxy = √ ∑(Xi √ i − N− ¯X) ∑(Yi = √ ¯XȲ2 −Ȳ ∑ )2 X2i− N ¯X√ ∑ 2 Y2i− NȲ 2NNEl coeficiente <strong>de</strong> correlación simple toma valores entre -1 y 1 y su interpretación podéis recordarlarevisando el Tema 1. En el MRLG tendremos una matriz <strong>de</strong> coeficientes <strong>de</strong> correlación habitualmente<strong>de</strong>notada por R:⎡⎤r 11 r 12 . . . r 1Kr 21 r 22 . . . r 2KR = ⎢⎣.. . ..⎥. ⎦r K1 r K2 . . . r KKLa matriz <strong>de</strong> correlación R se <strong>de</strong>fine como aquella matriz cuyos elementos son el coeficiente <strong>de</strong>correlación simple entre dos variables i y j, tal que:110


Estadística Actuarial: Análisis <strong>de</strong> Regresión• r 1k representa la correlación entre Y y X kk = 1, 2, . . . K• r kk = 1, los elementos <strong>de</strong> la diagonal principal son todos unos. Muestran la correlación <strong>de</strong> unavariable consigo misma.• r kh , muestran la correlación <strong>de</strong> la variable exógena k con la variable exógena h.• A<strong>de</strong>más es una matriz simétrica.En el mo<strong><strong>de</strong>l</strong>o lineal general la correlación entre Y y X 2 no está a<strong>de</strong>cuadamente recogida por elcoeficiente <strong>de</strong> correlación simple ya que parte <strong>de</strong> la variación <strong>de</strong> Y será <strong>de</strong>bida al resto <strong>de</strong> variablesexógenas. Será necesario <strong>de</strong>scontar este efecto tanto <strong>de</strong> Y como <strong>de</strong> X 2 . Por ejemplo, en el mo<strong><strong>de</strong>l</strong>oY i = β 1 + β 2 X 2i + β 3 X 3i + u ipara estudiar la influencia <strong>de</strong> X 2 en Y utilizaremos el coeficiente <strong>de</strong> correlación parcial entre Y yX 2 que mi<strong>de</strong> la correlación que queda entre estas dos variables <strong>de</strong>spués <strong>de</strong> eliminar el efecto <strong>de</strong> X 3sobre Y y sobre X 2 .r 12·3 =r 12 − r 13 r 23√1 − r213√1 − r223Ejemplo 5.11Con los datos <strong>de</strong> la Tabla 5.1 y los resultados <strong>de</strong> la estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.11) calculamosel coeficiente <strong>de</strong> <strong>de</strong>terminación y el coeficiente <strong>de</strong> <strong>de</strong>terminación corregido:SCT = Y ′ Y − NȲ 2 = 1512980 − 14 × 317, 493 2 = 101754, 7293SCR = Y ′ Y − ˆβX ′ Y = 1512980 − 1496279, 9 = 16700, 1R 2 = 1 − SCRSCT = 1 − 16700, 1 = 0, 835976101754, 7293¯R 2 (N − 1)= 1 −(N − K) (1 − R2 ) = 1 − 14 − 1 (1 − 0, 835976) = 0, 78676914 − 4Luego el 83, 59 % <strong>de</strong> la variabilidad en el precio <strong>de</strong> la vivienda queda explicada por lavariabilidad <strong><strong>de</strong>l</strong> tamaño <strong>de</strong> la vivienda, el número <strong>de</strong> dormitorios y el número <strong>de</strong> baños.Es un ajuste bastante alto. El ¯R 2 se interpreta <strong>de</strong> igual manera.También po<strong>de</strong>mos calcular la matriz <strong>de</strong> correlaciones entre SQF T, BEDRMS y BAT HS:⎡1, 0 0, 4647⎤0, 7873R = ⎣ 1, 0 0, 5323 ⎦1, 0Luego las variables exógenas están correlacionadas positivamente entre sí. El coeficientemás alto es el coeficiente <strong>de</strong> correlación simple entre SQF T y BAT HS.111


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.4. Propieda<strong>de</strong>s <strong>de</strong> los estimadores MCOEl método <strong>de</strong> MCO es sólo uno <strong>de</strong> los posibles métodos <strong>de</strong> estimación, la pregunta es ¿cómopo<strong>de</strong>mos elegir entre estimadores? obviamente en base a sus propieda<strong>de</strong>s sobre su comportamientoen muestras repetidas. Estas propieda<strong>de</strong>s son insesga<strong>de</strong>z, varianza pequeña y error cuadrático medioy ya se trataron en el Tema 2.Insesga<strong>de</strong>z Un estimador es insesgado si su valor esperado coinci<strong>de</strong> con el verda<strong>de</strong>ro valor <strong><strong>de</strong>l</strong>parámetro. Sea ˆθ un estimador <strong><strong>de</strong>l</strong> parámetro θ, será insesgado si E(ˆθ) = θ.Varianza mínima Desearemos que la varianza <strong>de</strong> un estimador sea lo más pequeña posible ya quecuanto menor sea la varianza muestral mayor es la precisión <strong><strong>de</strong>l</strong> estimador.Si estamos comparando dos estimadores insesgados elegiremos aquel que tenga la menor varianza.Pero si estamos comparando dos estimadores sesgados o un estimador sesgado y uno insesgado estecriterio no nos sirve y <strong>de</strong>bemos introducir uno nuevo, el concepto <strong>de</strong> error cuadrático medio.Error cuadrático Medio (ECM) ECM(ˆθ) = E(ˆθ − θ) 2 = V (ˆθ) + Sesgo(ˆθ) 2 don<strong>de</strong> Sesgo(ˆθ) =E(ˆθ) − θ. En base a este criterio elegimos el estimador con menor ECM.5.4.1. Propieda<strong>de</strong>s <strong>de</strong> los estimadores MCOSea el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal generalY = Xβ + u u ∼ NID(0, σ 2 I N )don<strong>de</strong> se cumplen todas las hipótesis básicas. El estimador MCO <strong>de</strong> los coeficientestiene las siguientes propieda<strong>de</strong>s:• Es lineal en las perturbaciones.• Es insesgado.ˆβ = (X ′ X) −1 X ′ Y• Tiene varianza mínima entre todos los estimadores lineales e insesgadosDemostración:• Linealidad. Como las variables explicativas son no aleatorias, la única variable aleatoria <strong>de</strong>su expresión es la perturbación, luego el estimador MCO es una combinación lineal <strong>de</strong> lasperturbaciones.ˆβ = (X ′ X) −1 X ′ Y == (X ′ X) −1 X ′ (Xβ + u) == β + (X ′ X) −1 X ′ u112


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Insesga<strong>de</strong>z. Dado que:E(u) = 0y la matriz X es no aleatoria,ˆβ MCO es insesgado, es <strong>de</strong>cir, su valor esperado es igual al vector <strong>de</strong> coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.• Varianza mínima. Dado que:E(u) = 0E(uu ′ ) = σ 2 I Ny la matriz X es no aleatoria,E( ˆβ) = E(β + (X ′ X) −1 X ′ u) == E(β) + (X ′ X) −1 X ′ E(u) = β} {{ }=0V ( ˆβ) = E[( ˆβ − E( ˆβ))( ˆβ − E( ˆβ)) ′ ] == E[( ˆβ − β)( ˆβ − β) ′ ] =[ [(X= E ′ X) −1 X ′ u ] [ (X ′ X) −1 X ′ u ] ] ′== E[(X ′ X) −1 X ′ uu ′ X(X ′ X) −1 ] == (X ′ X) −1 X ′ E[uu ′ ] X(X ′ X) −1 == (X ′ X) −1 X ′ σ 2 I N X(X ′ X) −1 == σ 2 (X ′ X) −1 X ′ X(X ′ X) −1 == σ 2 (X ′ X) −1Esta matriz <strong>de</strong> varianzas y covarianzas es mínima y nos lo garantiza el Teorema <strong>de</strong> Gauss-Markov.⎡V ( ˆβ 1 ) Cov( ˆβ 1 , ˆβ 2 ) Cov( ˆβ 1 , ˆβ 3 ) · · · Cov( ˆβ 1 , ˆβ ⎤K )Cov(V ( ˆβ)ˆβ 2, ˆβ 1) V ( ˆβ 2) Cov( ˆβ 2, ˆβ 3) · · · Cov( ˆβ 2, ˆβ K)=Cov(⎢ˆβ 3 , ˆβ 1 ) Cov( ˆβ 3 , ˆβ 2 ) V ( ˆβ 3 ) · · · Cov( ˆβ 3 , ˆβ K )(K × K) ⎣.... ... ⎥ .. ⎦ =Cov( ˆβ K , ˆβ 1 ) Cov( ˆβ K , ˆβ 2 ) Cov( ˆβ K , ˆβ 3 ) · · · V ( ˆβ K )⎡= σ 2 ⎢⎣⎤a 11 a 12 a 13 · · · a 1Ka 21 a 22 a 23 · · · a 2Ka 31 a 32 a 33 · · · a 3K.. . . ..⎥. ⎦a K1 a K2 a K3 · · · a KK= σ 2 (X ′ X) −1don<strong>de</strong> a kk es el elemento (k, k) <strong>de</strong> (X ′ X) −1 . Como toda matriz <strong>de</strong> varianzas y covarianzas, essimétrica.113


Estadística Actuarial: Análisis <strong>de</strong> RegresiónTeorema <strong>de</strong> Gauss-Markov: Dados los supuestos básicos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal general,“<strong>de</strong>ntro <strong>de</strong> la clase <strong>de</strong> estimadores lineales e insesgados, ˆβ es el estimador eficiente, es <strong>de</strong>cir, ˆβ tienemínima varianza”.5.4.2. Estimación <strong>de</strong> la varianza <strong>de</strong> las perturbacionesEn la matriz <strong>de</strong> varianzas y covarianzas <strong><strong>de</strong>l</strong> estimador MCO aparece la varianza <strong>de</strong> las perturbaciones,lo habitual es que sea <strong>de</strong>sconocida y haya <strong>de</strong> ser estimada. Habitualmente se utiliza el siguienteestimador insesgado 9 <strong>de</strong> σ 2 :ˆσ 2 =û′ ûN − K =SCRN − K =∑û2 iN − Ky E(ˆσ 2 ) = σ 2Por tanto podremos utilizarlo como el estimador apropiado <strong>de</strong> la varianza <strong>de</strong> la perturbación. Paratrabajar con él es útil escribirlo en términos <strong>de</strong> las variables observables mediante las matrices Y ,X, así:ˆσ 2 =û ′ ûN − K = Y ′ Y − ˆβ ′ X ′ YN − K= Y ′ Y − ˆβX ′ X ˆβN − KBajo las hipótesis básicas, un estimador insesgado <strong>de</strong> la matriz <strong>de</strong> varianzas y covarianzas,<strong>de</strong> ˆβ MCO eŝV ( ˆβ MCO ) = ˆσ 2 (X ′ X) −1Ejemplo 5.12Con los datos <strong>de</strong> la Tabla 5.1 y los resultados <strong>de</strong> la estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.11) secalcula la siguiente matriz <strong>de</strong> varianzas y covarianzas estimada:ˆσ 2 = Y ′ Y − ˆβ ′ X ′ YN − K=1513039, 0100 − 1496338, 941414 − 4= 1670, 0069̂V ( ˆβ MCO ) = 1670, 0069 × ⎢⎣=⎡⎢⎣⎡14 26753 51 3326753 55462515 99193 65699, 7551 99193 189 121, 7533 65699, 75 121, 75 80, 3757797, 47 0, 670891 −1677, 13 −1209, 370, 670891 0, 00102019 −0, 0754606 −0, 995066−1677, 13 −0, 0754606 730, 585 −356, 4−1209, 37 −0, 995066 −356, 4 1870, 56⎤⎥⎦⎤⎥⎦−1=9 En el Anexo 2 incluido en el Apéndice <strong><strong>de</strong>l</strong> Tema aparece <strong>de</strong>mostrada la insesga<strong>de</strong>z <strong>de</strong> ˆσ 2 .114


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.3Supongamos que en la regresión mínimo cuadrática ordinaria <strong>de</strong> Y sobre X el coeficienteestimado <strong>de</strong> X es 1.2. Di si son ciertas o falsas las siguientes afirmaciones, razonando lasrespuestas:1. Tomando distintas muestras para la variable Y pue<strong>de</strong>n obtenerse otras estimaciones.2. La distribución <strong>de</strong> estas estimaciones <strong>de</strong>be estar centrada en torno al verda<strong>de</strong>rovalor 1.2.Ejercicio 5.4Obtener la esperanza matemática y varianza <strong><strong>de</strong>l</strong> siguiente estimador <strong><strong>de</strong>l</strong> parámetro <strong>de</strong>pendiente en el MLS cuando se cumplen todas las hipótesis básicas:don<strong>de</strong> c es una constante arbitraria.˜β = ˆβ MCO + c NEjercicio 5.5Se quiere estimar un mo<strong><strong>de</strong>l</strong>o que explique el ahorro generado, S, en función <strong><strong>de</strong>l</strong> tipo <strong>de</strong>interés, r, <strong>de</strong> la forma:S t = α + βr t + u t1. Para estimar con mayor precisión β, si pudieras elegir la muestra en diferentesperíodos, ¿la elegirías durante un período <strong>de</strong> tiempo en el cual los tipos <strong>de</strong> interésfueran fluctuantes o durante un período en el cual los tipos <strong>de</strong> interés fueranrelativamente constantes?2. ¿Qué ocurriría con los estimadores MCO <strong>de</strong> los coeficientes <strong>de</strong> la regresión si elahorro ha fluctuado muy poco en torno a un valor constante durante el períodomuestral?Ejercicio 5.6Supongamos que la relación entre las variables X e Y es la siguiente Y t = βX t + u tdon<strong>de</strong> X es una variable no estocástica y u t ∼ NID(0, σ 2 ). Se <strong>de</strong>finen dos estimadorespara el parámetro <strong>de</strong>sconocido β:β ∗ =∑ Yt ∑ Xtˆβ =∑ Xt Y t ∑ X 2t1. Demuestra que ambos estimadores son insesgados.2. ¿Cuál <strong>de</strong> los dos estimadores elegirías? ¿Por qué?115


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.7Para el vector <strong>de</strong> perturbaciones u <strong>de</strong> or<strong>de</strong>n (T × 1), indica el significado <strong>de</strong> cada una<strong>de</strong> las siguientes expresiones y establece su relación con σ 2 :1.1T u′ u2.1T û′ û3. E(û ′ û)4. E(ûû ′ )5.4.3. Consecuencias <strong><strong>de</strong>l</strong> incumplimiento <strong>de</strong> algunos supuestos: colinealidadA la hora <strong>de</strong> estimar un mo<strong><strong>de</strong>l</strong>o económico, los datos disponibles sobre las variables explicativas oregresores pue<strong>de</strong>n presentar un alto grado <strong>de</strong> correlación, especialmente en un contexto <strong>de</strong> seriestemporales y con series macroeconómicas.Cuando dos o más variables explicativas <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o están altamente correlacionadas en la muestra,es muy difícil separar el efecto parcial <strong>de</strong> cada una <strong>de</strong> estas variables sobre la variable <strong>de</strong>pendiente.La información muestral que incorpora una <strong>de</strong> estas variables es casi la misma que el resto <strong>de</strong> lascorrelacionadas con ella. En este tema analizaremos las implicaciones que este fenómeno muestraltiene en la estimación por el método <strong>de</strong> Mínimos Cuadrados Ordinarios.• El problema <strong>de</strong> multicolinealidad es un problema relacionado con la matriz <strong>de</strong> variables exógenasX .• Se refiere no tanto a si existe o no relación lineal entre las variables exógenas <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong>regresión, que existirá, como al grado <strong>de</strong> correlación lineal entre las variables explicativas <strong><strong>de</strong>l</strong>mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal.• En todo momento nosotros vamos a suponer que tenemos un mo<strong><strong>de</strong>l</strong>o correctamente especificadoy que al estimarlo <strong>de</strong>tectamos los problemas en la matriz <strong>de</strong> datos X. Así, estamosenfocando el problema como un problema muestral.• Po<strong>de</strong>mos distinguir dos casos:• Multicolinealidad exacta: se produce cuando existe una relación lineal exacta.• Alta colinealidad: cuando la correlación entre las variables exógenas es muy alta pero noexacta.Multicolinealidad exactaPara verlo más claramente vamos a seguir un ejemplo. Sea el mo<strong><strong>de</strong>l</strong>o:Y i = β 1 + β 2 X 2i + β 3 X 3i + u i i = 1, . . . , N (5.12)116


Estadística Actuarial: Análisis <strong>de</strong> Regresióny supongamos que X 3i = 2X 2i . Las ecuaciones normales que se obtienen <strong><strong>de</strong>l</strong> criterio <strong>de</strong> estimaciónMCO forman un sistema <strong>de</strong> tres ecuaciones pero solo dos son linealmente in<strong>de</strong>pendientes:∑Yi = N ˆβ 1 + ˆβ 2∑X2i + ˆβ 3∑X3i∑Yi X 2i = ˆβ 1∑X2i + ˆβ 2∑ X22i + ˆβ 3∑X3i X 2i∑Yi X 3i = ˆβ 1∑X3i + ˆβ 2∑X2i X 3i + ˆβ 3∑ X23iya que si sustituimos en estas ecuaciones la relación lineal exacta X 3i = 2X 2i y reorganizamos,obtenemos:∑Yi = N ˆβ 1 + ( ˆβ 2 + 2 ˆβ 3 ) ∑ X 2i∑Yi X 2i = ˆβ 1∑X2i + ( ˆβ 2 + 2 ˆβ 3 ) ∑ X 2 2i2 ( ∑ Y i X 2i ) = 2(ˆβ1∑X2i + ( ˆβ 2 + 2 ˆβ 3 ) ∑ X 2 2i)Se pue<strong>de</strong> observar que la tercera ecuación es la misma que la segunda excepto por un factor <strong>de</strong> escalaigual a 2. Por lo tanto, hay tres incógnitas ˆβ 1 , ˆβ 2 y ˆβ 3 pero solamente dos ecuaciones linealmentein<strong>de</strong>pendientes. Dado que X 3i y X 2i son combinación lineal exacta rg(X) = K − 1 = 3 − 1 = 2,luego X no es <strong>de</strong> rango completo y no se cumple una <strong>de</strong> las hipótesis básicas, la hipótesis <strong>de</strong> NoMulticolinealidad. Consecuentemente, no es posible estimar <strong>de</strong> forma única todos los coeficientes <strong><strong>de</strong>l</strong>mo<strong><strong>de</strong>l</strong>o. Ahora bien, las dos primeras ecuaciones si po<strong>de</strong>mos resolverlas para ˆβ 1 y la combinaciónlineal ( ˆβ 2 + 2 ˆβ 3 ).Esto mismo se pue<strong>de</strong> comprobar sustituyendo X 3i = 2X 2i en el mo<strong><strong>de</strong>l</strong>o (5.12).Y i = β 1 + (β 2 + 2β 3 )X 2i + u i i = 1, 2, . . . , N (5.13)don<strong>de</strong> po<strong>de</strong>mos estimar <strong>de</strong> forma separada y única el coeficiente β 1 y la combinación lineal ( ˆβ 2 +2 ˆβ 3 )pero no cada uno <strong>de</strong> sus parámetros <strong>de</strong> forma individual. A<strong>de</strong>más no importa la solución arbitraria<strong>de</strong> las ecuaciones normales, esta combinación lineal tiene siempre un único valor y siempre el mismo.• Consecuencias <strong>de</strong> la multicolinealidad exacta:• Los efectos directos <strong>de</strong> la correlación exacta entre regresores es que el valor <strong><strong>de</strong>l</strong> <strong>de</strong>terminante|X ′ X| = 0, por tanto no po<strong>de</strong>mos encontrar (X ′ X) −1 y por tanto, no po<strong>de</strong>mos estimar elmo<strong><strong>de</strong>l</strong>o por MCO ya que el estimador se <strong>de</strong>fine como ˆβ MCO = (X ′ X) −1 X ′ Y .• En este caso lo que ocurre es que tenemos combinaciones lineales en las columnas <strong>de</strong> la matrizX con lo que rg(X) ≠ K por lo que (X ′ X) es una matriz singular.• Relajamos la hipótesis básica:rg(X) ≠ K tal que rg(X) ≠ K ⇒ |X ′ X| = 0 ⇏ ∃(X ′ X) −1117


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Cuando la correlación entre regresores es perfecta el problema <strong>de</strong> multicolinealidad exactase convierte en un problema <strong>de</strong> especificación ya que no po<strong>de</strong>mos estimar todos losparámetros <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> forma individual. Podremos estimar:• individualmente: aquellos parámetros cuyas variables exógenas no están afectadas <strong>de</strong>correlación exacta con otras variables exógenas <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y• combinaciones lineales <strong>de</strong> los parámetros cuyas variables exógenas están implicadas enlas relaciones lineales exactas.• Detección: basta con ver que |X ′ X| = 0.Alta colinealidadEn este caso el valor <strong><strong>de</strong>l</strong> |X ′ X| está muy próximo a cero, pero será distinto <strong>de</strong> cero, por tanto∃(X ′ X) −1 y podremos calcular los estimadores MCO. A<strong>de</strong>más estos estimadores serán lineales,insesgados y <strong>de</strong> varianza mínima. Sin embargo la existencia <strong>de</strong> alta colinealidad entre variablesproduce efectos importantes que <strong>de</strong>ben ser tenidos en cuenta y que son los siguientes:• Varianzas y covarianzas cuantitativamente muy gran<strong>de</strong>s:Dado que (X ′ X) es casi singular, el valor <strong>de</strong> |X ′ X| será muy pequeño, por lo que, (X ′ X) −1tendrá elementos muy gran<strong>de</strong>s. Así, encontraremos varianzas y covarianzas muy gran<strong>de</strong>s,pero estos valores serán los más pequeños que po<strong>de</strong>mos encontrar en estas circunstancias.Cualquier otro estimador tendrá varianza mayor y por tanto el estimador MCO seguirá siendo<strong>de</strong> varianza mínima. Aunque como consecuencia <strong><strong>de</strong>l</strong> tamaño <strong>de</strong> (X ′ X) −1 , las estimaciones seanmuy imprecisas 10 .• Como consecuencia <strong>de</strong> lo anterior, podremos encontrar R 2 gran<strong>de</strong>s, que indican que las variablesexógenas conjuntamente explican mucho <strong>de</strong> la variabilidad <strong>de</strong> la variable endógena,unidos a variables explicativas que aportan poco a explicar esta variabilidad.• Pequeños cambios en los datos producen cambios importantes en las estimaciones <strong>de</strong> losparámetros.¿Cómo po<strong>de</strong>mos analizar si existe un problema <strong>de</strong> alta colinealidad?• Una primera aproximación consiste en obtener los coeficientes <strong>de</strong> correlación muestral simplespara cada par <strong>de</strong> variables explicativas y ver si el grado <strong>de</strong> correlación entre estas variables esalto.• El valor <strong><strong>de</strong>l</strong> <strong>de</strong>terminante <strong>de</strong>crece cuando aumenta la colinealidad, tendiendo a cero cuandoesta se hace exacta. Este hecho po<strong>de</strong>mos interpretarlo como un aviso pero no tenemos unamedida que nos permita afirmar cuando es grave o muy grave.10 Como veremos en la sección <strong>de</strong> Contraste <strong>de</strong> hipótesis el mayor tamaño <strong>de</strong> las varianzas hará que aumentela probabilidad <strong>de</strong> no rechazar la hipótesis nula <strong>de</strong> significatividad individual, cuando en realidad la variable seasignificativa, sólo que los datos no permiten <strong>de</strong>tectar esta significatividad.118


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Valores altos <strong><strong>de</strong>l</strong> R 2 y en (X ′ X) −1 , especialmente en su diagonal.• Otra forma <strong>de</strong> <strong>de</strong>tectar la multicolinealidad consiste en realizar la regresión <strong>de</strong> cada una<strong>de</strong> las variables explicativas sobre el resto 11 y analizar los coeficientes <strong>de</strong> <strong>de</strong>terminación <strong>de</strong>cada regresión. Si alguno o algunos <strong>de</strong> estos coeficientes <strong>de</strong> <strong>de</strong>terminación (Rj 2 ) son altos,estaría señalando la posible existencia <strong>de</strong> un problema <strong>de</strong> multicolinealidad.• Belsley, Kuh y Welsch (1980) consi<strong>de</strong>ran una serie <strong>de</strong> indicadores para analizar el grado <strong>de</strong>multicolinealidad entre los regresores <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o, como por ejemplo los llamados Tolerancia(TOL) y Factor <strong>de</strong> Inflación <strong>de</strong> la Varianza (VIF) que se <strong>de</strong>finen:V IF j =1( ) T OL j = 11 − Rj2 V IF jsiendo R 2 j el coeficiente <strong>de</strong> <strong>de</strong>terminación <strong>de</strong> la regresión auxiliar <strong>de</strong> la variable X j sobre elresto <strong>de</strong> las variables explicativas y 1 ≤ V IF j ≤ ∞.La varianza <strong>de</strong> cada uno <strong>de</strong> los coeficientes <strong>de</strong> la regresión MCO ( ˆβ j ) <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresiónlineal general se pue<strong>de</strong> expresar como:var( ˆβ j ) =σ 2 1∑ (Xji − ¯X) 2( ) =j 1 − Rj2σ 2∑ (Xji − ¯X j) 2V IF jdon<strong>de</strong> β j , es el coeficiente que acompaña a la variable X j y Rj 2 es el coeficiente <strong>de</strong> <strong>de</strong>terminación<strong>de</strong> la regresión auxiliar <strong>de</strong> la variable X j en función <strong><strong>de</strong>l</strong> resto <strong>de</strong> las variables explicativas. Comovemos existe una relación inmediata entre el valor V IF j y la varianza <strong><strong>de</strong>l</strong> coeficiente estimado.Cuanto más se acerque Rj 2 a la unidad, es <strong>de</strong>cir, cuanto mayor sea la colinealidad <strong>de</strong> la variableX j con el resto, mayor es el valor <strong>de</strong> V IF j y mayor es la varianza <strong><strong>de</strong>l</strong> coeficiente estimado,porque tal y como hemos dicho, la multicolinealidad “infla” la varianza. Según estos autores,si V IF j > 10, entonces concluiremos que la colinealidad <strong>de</strong> X j con las <strong>de</strong>más variables es alta.La utilización <strong>de</strong> los coeficientes T OL y V IF para <strong>de</strong>tectar la presencia <strong>de</strong> la multicolinealidadha recibido múltiples críticas, porque la conclusión obtenida con estos valores no siempre recogea<strong>de</strong>cuadamente la información y problema <strong>de</strong> los datos. Tal y como hemos visto anteriormente,las varianzas <strong>de</strong> los estimadores <strong>de</strong>pen<strong>de</strong>n <strong><strong>de</strong>l</strong> V IF j , σ 2 y ∑ ( X ji − ¯X j) 2, por lo que un altoV IF j no es condición suficiente ni necesaria para que dichas varianzas sean elevadas ya quees posible que σ 2 sea pequeño o ∑ ( X ji − ¯X j) 2 gran<strong>de</strong> y se compensen.En la literatura se han propuesto muchas soluciones al posible problema <strong>de</strong> alta colinealidad yninguna <strong>de</strong> ellas es totalmente satisfactoria, por ello parece sensato apren<strong>de</strong>r a convivir con elproblema y tener cuidado <strong>de</strong> no omitir aquellas variables que escon<strong>de</strong>n su significatividad bajo unproblema <strong>de</strong> colinealidad y no incurrir así en un problema <strong>de</strong> mala especificación. Aunque no esfácil, se pue<strong>de</strong>n consi<strong>de</strong>rar las siguientes “soluciones” para intentar resolver el problema:• Si realmente es un problema muestral, una posibilidad es cambiar <strong>de</strong> muestra porque pue<strong>de</strong>ser que con nuevos datos el problema se resuelva, aunque esto no siempre ocurre. La i<strong>de</strong>a11 En cada regresión se incluye el término constante como regresor pero no como variable <strong>de</strong>pendiente.119


Estadística Actuarial: Análisis <strong>de</strong> Regresiónconsiste en conseguir datos menos correlacionados que los anteriores, bien cambiando toda lamuestra o simplemente incorporando más datos en la muestra inicial. De todas formas, nosiempre resulta fácil obtener mejores datos por lo que muy probablemente <strong>de</strong>bamos convivircon el problema teniendo cuidado con la inferencia realizada y las conclusiones <strong>de</strong> la misma.• En ocasiones, si se incorpora información a priori sobre los coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong>sapareceel problema. Aún así, sería conveniente tener en cuenta dicha información antes <strong>de</strong> la <strong>de</strong>tección<strong><strong>de</strong>l</strong> problema <strong>de</strong> multicolinealidad y no posteriormente, ya que así estimaremos el mo<strong><strong>de</strong>l</strong>o máseficientemente.Ejercicio 5.8Comenta la siguiente afirmación:“Si al estimar un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal la matriz <strong>de</strong> datos presenta un alto grado<strong>de</strong> multicolinealidad, la varianza <strong>de</strong> los estimadores MCO será muy gran<strong>de</strong> y, por tanto,serán ineficientes.”Ejercicio 5.9Supón que se formula el siguiente mo<strong><strong>de</strong>l</strong>o:Y t = β 1 X 1t + β 2 X 2t + β 3 (X 1t + X 2t ) + β 4 X 2 1t + u t u t ∼ N(0, σ 2 ) (5.14)1. Indica qué parámetros son estimables y cuáles no.2. Supón que conocemos el valor que toma el parámetro β 3 , por ejemplo β 3 = β 30 .Indica si esta información adicional varía la conclusión anterior.Ejercicio 5.10Supón que se formula el siguiente mo<strong><strong>de</strong>l</strong>o:Y t = α 0 + α 1 X 1t + α 2 (7X 1t ) + α 3 X1t 2 + u t (5.15)1. Indica qué parámetros son estimables y cuáles no.2. Explica intuitivamente porqué no po<strong>de</strong>mos estimar todos los coeficientes.5.4.4. Consecuencias <strong><strong>de</strong>l</strong> incumplimiento <strong>de</strong> algunos supuestos: omisión <strong>de</strong> variablesrelevantes e inclusión <strong>de</strong> variables irrelevantesDentro <strong>de</strong> las hipótesis básicas hemos supuesto que el mo<strong><strong>de</strong>l</strong>o estaba correctamente especificado,esto en ocasiones no es así bien porque faltan variables (omisión <strong>de</strong> variables relevantes) o porquehay más <strong>de</strong> las necesarias (inclusión <strong>de</strong> variables irrelevantes). Estas situaciones influyen en laspropieda<strong>de</strong>s <strong><strong>de</strong>l</strong> estimador MCO y es necesario tenerlo en cuenta.120


Estadística Actuarial: Análisis <strong>de</strong> RegresiónOmisión <strong>de</strong> variables relevantesSuponemos que el mo<strong><strong>de</strong>l</strong>o correctamente especificado es:Y = Xβ + u = [ X 1 X 2 ][β1β 2]+ u = X 1 β 1 + X 2 β 2 + u (5.16)don<strong>de</strong> X 1 es una submatriz <strong>de</strong> or<strong>de</strong>n (N × K 1 ) y X 2 es una submatriz <strong>de</strong> or<strong>de</strong>n (N × K 2 ) y portanto β 1 es un subvector <strong>de</strong> or<strong>de</strong>n (K 1 × 1) y β 2 es un subvector <strong>de</strong> or<strong>de</strong>n (K 2 × 1). Pero nosotrosestimamos el siguiente mo<strong><strong>de</strong>l</strong>o incorrectamente especificado:Y = X 1 β 1 + v don<strong>de</strong> v = X 2 β 2 + u (5.17)El mo<strong><strong>de</strong>l</strong>o (5.17) incurre en un error <strong>de</strong> especificación ya que se omiten las variables relevantesrecogidas en X 2 . Esto es lo mismo que imponer la restricción vectorial β 2 = 0 cuando no es cierta.El estimador MCO <strong>de</strong> β 1 es ˆβ 1 = (X ′ 1 X 1) −1 X ′ 1 Y , y ˆv = Y − X 1 ˆβ 1 . Consecuencias:• En general los estimadores son sesgados:E( ˆβ 1 ) = E((X ′ 1X 1 ) −1 X ′ 1Y ) = β 1 + (X ′ 1X 1 ) −1 X ′ 1X 2 β 2Sesgo( ˆβ 1 ) = (X 1 ′ X 1) −1 X 1 ′ X 2β 2 y se anulara si X 1 ′ X 2 = 0, es <strong>de</strong>cir, si las variables omitidasson ortogonales a las no omitidas. Notar que el sesgo se anula también para β 2 = 0 pero estaes una solución trivial dado que al ser X 2 regresores relevantes necesariamente β 2 ≠ 0.• Las matriz <strong>de</strong> varianzas y covarianzas es V ( ˆβ 1 ) = σ 2 (X ′ 1 X 1) −1• El estimador <strong>de</strong> la varianza <strong>de</strong> la perturbación es sesgado, y lo es siempre incluso cuando losregresores son ortogonales:ˆσ 2 =ˆv′ˆv −→ E(ˆσ 2 ) = E(ˆv′ˆv) ≠ σ 2N − K 1 N − K 1Inclusión <strong>de</strong> variables irrelevantesEste caso formalmente es justo el inverso <strong><strong>de</strong>l</strong> anterior. El mo<strong><strong>de</strong>l</strong>o correctamente especificado es:y el mo<strong><strong>de</strong>l</strong>o estimado es:Y = X 1 β 1 + u u ∼ N(0, σ 2 I) (5.18)Y = X 1 β 1 + X 2 β 2 + v (5.19)don<strong>de</strong> aparecen las variables irrelevantes en la matriz X 2 <strong>de</strong> or<strong>de</strong>n (N × K 2 ) con unos coeficientes,β 2 , <strong>de</strong> or<strong>de</strong>n (K 2 × 1), que son cero, poblacionalmente. Consecuencias:• Los estimadores <strong>de</strong> los coeficientes son insesgados. Po<strong>de</strong>mos escribir el mo<strong><strong>de</strong>l</strong>o correcto como:Y = X 1 β 1 + X 2 0 + u (5.20)121


Estadística Actuarial: Análisis <strong>de</strong> Regresión[ ] ˆβ1Eˆβ 2( [β1= E0[ ]β1= +0] [ X′+ 1 X 1 X 1 ′ X 2X 2 ′ X 1 X 2 ′ X 2[ X′1 X 1 X ′ 1 X 2X ′ 2 X 1 X ′ 2 X 2] −1 [ X′1 uX ′ 2 u ] ) =] −1 [ ] X′1 E(u)X 2 ′ } {{ E(u) =}0[β10]ya que X es fija y E(u) = 0. Por lo tanto, el estimador <strong>de</strong> (5.19) sigue siendo insesgadoaunque se incluyan variables irrelevantes.• Las matriz <strong>de</strong> varianzas y covarianzas es V( ˆβ) = σ 2 (X ′ X) −1• El estimador <strong>de</strong> la varianza <strong>de</strong> las perturbaciones <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.19) es un estimador insesgado<strong>de</strong> σ 2 ˆσ 2 ˆv ′ˆv=N − (K 1 + K 2 )5.5. Utilización <strong>de</strong> variables explicativas cualitativasA lo largo <strong><strong>de</strong>l</strong> curso se han especificado mayoritariamente mo<strong><strong>de</strong>l</strong>os con variables <strong>de</strong> naturalezacuantitativa, es <strong>de</strong>cir, aquéllas que toman valores numéricos. Sin embargo, las variables tambiénpue<strong>de</strong>n ser cualitativas, es <strong>de</strong>cir, pue<strong>de</strong>n tomar valores no numéricos como categorías, clases oatributos. Por ejemplo, son variables cualitativas el género <strong>de</strong> las personas, el estado civil, la raza,el pertenecer a diferentes zonas geográficas, momentos históricos, estaciones <strong><strong>de</strong>l</strong> año, etc. De estaforma, el salario <strong>de</strong> los trabajadores pue<strong>de</strong> <strong>de</strong>pen<strong>de</strong>r <strong><strong>de</strong>l</strong> género <strong>de</strong> los mismos; la tasa <strong>de</strong> criminalidadpue<strong>de</strong> venir <strong>de</strong>terminada por la zona geográfica <strong>de</strong> resi<strong>de</strong>ncia <strong>de</strong> los individuos; el PIB <strong>de</strong> los paísespue<strong>de</strong> estar influenciado por <strong>de</strong>terminados acontecimientos históricos como las guerras; las ventas<strong>de</strong> un <strong>de</strong>terminado producto pue<strong>de</strong>n ser significativamente distintas en función <strong>de</strong> la época <strong><strong>de</strong>l</strong> año,etc. En esta sección, aunque seguimos manteniendo que la variable <strong>de</strong>pendiente es cuantitativa,vamos a consi<strong>de</strong>rar que ésta pue<strong>de</strong> venir explicada por variables cualitativas y/o cuantitativas yveremos como trabajar con ellas incluyéndolas como regresores en el MRLG.Dado que las categorías <strong>de</strong> las variables no son directamente cuantificables, las vamos a cuantificarconstruyendo unas variables artificiales llamadas ficticias, binarias o dummies, que son numéricas.Estas variables toman arbitrariamente el valor 1 si la categoría está presente en el individuo y 0 encaso contrario 12 .{ 1 si la categoría está presenteD i =0 en caso contrarioPor ejemplo si queremos estudiar la <strong>de</strong>pen<strong>de</strong>ncia <strong><strong>de</strong>l</strong> salario (W i ) con respecto al sexo <strong><strong>de</strong>l</strong> individuo<strong>de</strong>finiremos dos variables ficticias:12 Las variables ficticias pue<strong>de</strong>n tomar dos valores cualesquiera, sin embargo, la interpretación <strong>de</strong> los coeficientes esmás sencilla si se consi<strong>de</strong>ran los valores 0 y 1.122


Estadística Actuarial: Análisis <strong>de</strong> Regresión{ 1 si el individuo i es hombreS 1i =0 en caso contrarioS 2i ={ 1 si el individuo i es mujer0 en caso contrariola variable sexo tiene dos categorías o estados <strong>de</strong> la naturaleza: hombre y mujer, para recogerlosutilizamos dos variables ficticias que divi<strong>de</strong>n la muestra en dos clases hombres y mujeres, y asignamosun valor arbitrario a cada clase 13 .En este tema ya hemos trabajado con ellas, el Ejemplo 5.4 especificamos la función <strong>de</strong> salario enfunción <strong><strong>de</strong>l</strong> regresor cualitativo sexo e interpretamos sus parámetros. En el Ejemplo 5.5 a<strong>de</strong>másse añadió un regresor cuantitativo, la experiencia y se interpretaron los parámetros. Si se retomandichos ejercicios se pue<strong>de</strong> ver que trabajar con variables cualitativas o con variables cuantitativas ala hora <strong>de</strong> interpretar los coeficientes <strong>de</strong> la regresión y estimarlos es indiferente sin embargo hay quetener en cuenta algunas reglas a la hora <strong>de</strong> especificar el mo<strong><strong>de</strong>l</strong>o. A conocer éstas vamos a <strong>de</strong>dicarlas secciones siguientes.5.5.1. Mo<strong><strong>de</strong>l</strong>o que recoge sólo efectos cualitativos: comparando medias. Sólo un conjunto<strong>de</strong> variables ficticias.Supongamos que tenemos datos <strong>de</strong> salarios <strong>de</strong> hombres y mujeres, W i y creemos que, en media,existen diferencias salariales entre estos dos grupos. Para contrastar que esto es cierto po<strong>de</strong>mosrecoger el efecto cualitativo sexo sobre el salario utilizando las variables ficticias:{ 1 si el individuo i es hombreS 1i =0 en caso contrarioS 2i ={ 1 si el individuo i es mujer0 en caso contrarioy po<strong>de</strong>mos especificar el siguiente mo<strong><strong>de</strong>l</strong>o como ya se hizo en el Ejemplo 5.4:W i = β 1 + β 2 S 2i + u i i = 1, . . . , N H + N M u i ∼ NID(0, σ 2 ) (5.21)β 1 es el salario esperado cuando el individuo eshombre, β 1 +β 2 es el salario esperado <strong>de</strong> una mujery β 2 recoge el efecto diferencial en el salarioesperado entre hombres y mujeres. Si no existieradiscriminación salarial por sexo, es <strong>de</strong>cir sihombres y mujeres tuvieran el mismo salario, suvalor sería cero. En el gráfico po<strong>de</strong>mos observarestos efectos don<strong>de</strong> se supone que β 2 es positivopor razones didácticas.• Estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.21):W i = β 1 + β 2 S 2i + u iWβ 1β 1 + β 2i = 1, . . . , N H + N Mi13 Elegir{los valores (0,1) es muy cómodo pero{podríamos elegir otros, por ejemplo:1 si el individuo i es hombre2 si el individuo i es mujerS 1i =S0 en caso contrario2i =0 en caso contrario123


Estadística Actuarial: Análisis <strong>de</strong> Regresión[WH]=W M[ ] [ ] [ ]iH 0 β1 uH+ ⇒ Y = Xβ + ui M i M β 2 u MNotación utilizada: N H es el número <strong>de</strong> individuos varones y N M el número <strong>de</strong> mujeres. W H , W Mson vectores columna que recogen los salarios <strong>de</strong> hombres y mujeres, por tanto <strong>de</strong> or<strong>de</strong>n N H × 1 yN M ×1, respectivamente. i H , i M son vectores <strong>de</strong> unos <strong>de</strong> tamaño N H ×1 y N M ×1 respectivamente.ˆβ MCO = (X ′ X) −1 X ′ Y[ ] [[ ˆβ1 i′= Hi ′ Mˆβ 2 0 i ′ M=] [iH 0i M i M]] −1 [ i′Hi ′ M0 i ′ M[NH + N M N MN M N M] −1 [ ∑WH + ∑ W M∑WM]=] [ ]WH=W M[ ¯WH¯W M − ¯W H]que sería el equivalente a estimar cada ecuación por separado, en las dos ecuaciones a las que dalugar el mo<strong><strong>de</strong>l</strong>o (5.21):W i = β 1 + u i i = 1, . . . , N H para los hombresW i = β 1 + β 2 + u i i = 1, . . . , N M para las mujeres• Alternativa <strong>de</strong> especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.21):W i = α 1 S 1i + α 2 S 2i + u i i = 1, . . . , N H + N M (5.22)<strong>de</strong> don<strong>de</strong> suponiendo u i ∼ NID(0, σ 2 )α 1 = E(W i |S 1i = 1; S 2i = 0) es el salario esperado <strong>de</strong> un hombreα 2 = E(W i |S 1i = 0; S 2i = 1) es el salario esperado <strong>de</strong> una mujerpor tanto estos coeficientes recogen el salario medio <strong>de</strong>ntro <strong><strong>de</strong>l</strong> grupo.• Estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.22):W i = α 1 S 1i + α 2 S 2i + u ii = 1, . . . , N H + N M[WH]=W M[ ] [ ] [ ]iH 0 α1 uH+ ⇒ Y = Xβ + u0 i M α 2 u Mˆβ MCO = (X ′ X) −1 X ′ Y[ ] [[ ˆα1 i′= H0ˆα 2 0 i ′ M] [iH 0]] −1 [ i′H00 i M 0 i ′ M124] [ ]WH=W M


Estadística Actuarial: Análisis <strong>de</strong> Regresión=[ ] −1 [ ∑ ] [ ∑ ] [ ]NH 0 ∑ WH= ∑ WH /N H ¯WH=0 N M WM WM /N M¯W MŴ i = ˆα 1 S 1i + ˆα 2 S 2i = ¯W H S 1i + ¯W M S 2iLos mismos resultados se obtendrían si hubiésemos estimados las ecuaciones por separado en lasdos ecuaciones a que da lugar el mo<strong><strong>de</strong>l</strong>o (5.22):W i = α 1 + u i i = 1, . . . , N H y W i = α 2 + u i i = 1, . . . , N HA<strong>de</strong>más la relación entre los parámetros <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.21) y los <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.22) es la siguiente:β 1 = α 1 β 1 + β 2 = α 2 luego β 2 = α 2 − α 1Ejercicio 5.11Interpreta los coeficientes <strong>de</strong> la siguiente regresión:W i = β 1 S 1i + β 2 + u i i = 1, . . . , N H + N M u i ∼ NID(0, σ 2 )don<strong>de</strong> W i es el salario <strong><strong>de</strong>l</strong> individuo i y{ 1 si el individuo i es hombreS 1i =0 en caso contrarioS 2i ={ 1 si el individuo i es mujer0 en caso contrario¿Qué diferencia hay entre ésta especificación y la especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.21)?Ejercicio 5.12Interpreta los coeficientes <strong>de</strong> la regresión:W i = α 0 + α 1 S 1i + α 2 S 2i + u ii = 1, . . . , N H + N Mdon<strong>de</strong> W i es el salario <strong><strong>de</strong>l</strong> individuo i y{ 1 si el individuo i es hombreS 1i =0 en caso contrarioS 2i ={ 1 si el individuo i es mujer0 en caso contrario¿Pue<strong>de</strong>s estimarlos todos? ¿Qué problema existe en el mo<strong><strong>de</strong>l</strong>o anterior? ¿Se cumplentodas las hipótesis básicas?125


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.5.2. Dos o más conjuntos <strong>de</strong> variables ficticiasSupongamos que pensamos que en el nivel <strong>de</strong> salarios influye a<strong>de</strong>más <strong><strong>de</strong>l</strong> sexo el nivel <strong>de</strong> educación.Para recoger estos efectos po<strong>de</strong>mos <strong>de</strong>finir dos conjuntos <strong>de</strong> variables ficticias, sexo y educación, laprimera con dos categorías o estados <strong>de</strong> la naturaleza y la segunda con tres, y recoger cada categoríao estado <strong>de</strong> la naturaleza con un variable ficticia. Así, <strong>de</strong>finimos:{ 1 si el individuo i es hombreS 1i ={0 en caso contrario1 si el individuo i es mujerS 2i =0 en caso contrario{ 1 si i tiene hasta estudios primariosE 1i ={0 en caso contrario1 si i tiene hasta estudios secundariosE 2i ={0 en caso contrario1 si i tiene hasta estudios universitariosE 3i =0 en caso contrariosiendo E ij sucesos excluyentes. La especificación correspondiente es:W i = µ + α 2 S 2i + β 2 E 2i + β 3 E 3i + u i i = 1, . . . , N H + N M (5.23)don<strong>de</strong> para evitar problemas <strong>de</strong> multicolinealidad exacta hemos excluido una categoría <strong>de</strong> cadafactor cualitativo. Po<strong>de</strong>mos obtener el salario esperado <strong>de</strong> los diferentes individuos <strong>de</strong> la muestra:E(W i /S 2i = E 2i = E 3i = 0) = µ, salario esperado <strong>de</strong> un hombre con estudios primarios.E(W i /E 2i = 1; S 2i = E 3i = 0) = µ + β 2 , salario esperado <strong>de</strong> un hombre con estudios secundarios.E(W i /E 3i = 1; S 2i = E 2i = 0) = µ + β 3 , salario esperado <strong>de</strong> un hombre con estudios universitarios.E(W i /S 2i = 1; E 2i = E 3i = 0) = µ + α 2 , salario esperado <strong>de</strong> una mujer con estudios primariosE(W i /S 2i = E 2i = 1; E 3i = 0) = µ + α 2 + β 2 , salario esperado <strong>de</strong> una mujer con estudios secundarios.E(W i /S 2i = E 3i = 1; E 2i = 0) = µ + α 2 + β 3 , salario esperado <strong>de</strong> una mujer con estudios universitarios.Esta información po<strong>de</strong>mos resumirla en la siguiente tabla:E(W i ) E 1i E 2i E 3iS 1i µ µ + β 2 µ + β 3S 2i µ + α 2 µ + α 2 + β 2 µ + α 2 + β 3y po<strong>de</strong>mos interpretar los parámetros como sigue:µ Base <strong>de</strong> comparación.α 2 Efecto diferencial en el salario medio <strong>de</strong>bido al factor sexo. Por tanto es el diferencial enel salario medio entre hombres y mujeres in<strong>de</strong>pendientemente <strong>de</strong> su nivel <strong>de</strong> educación.β 2 Efecto diferencial en el salario medio <strong>de</strong>bido a tener un nivel <strong>de</strong> estudios secundarios.Por tanto es el diferencial en el salario medio, para hombres y mujeres, entre tener unnivel <strong>de</strong> estudios primarios y tener secundaria.β 3 Efecto diferencial en el salario medio <strong>de</strong>bido a tener un nivel <strong>de</strong> estudios universitarios.Por tanto es el diferencial en el salario medio, para hombres y mujeres, entre tener unnivel <strong>de</strong> estudios primarios y tener estudios universitarios.126


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLa matriz <strong>de</strong> regresores <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o sería:⎡X =⎢⎣⎤i N1 0 0 0i N2 0 i N2 0i N3 0 0 i N3i N4 i N4 0 0⎥i N5 i N5 i N5 0 ⎦i N6 i N6 i N6 i N6don<strong>de</strong> i Nj es un vector <strong>de</strong> unos <strong>de</strong> tamaño el número <strong>de</strong> individuos que cumplen las condiciones,por ejemplo i N6 es un vector <strong>de</strong> unos <strong>de</strong> tamaño el número <strong>de</strong> mujeres con estudios universitarios.Cuando existen dos o más conjuntos <strong>de</strong> variables ficticias lo que no <strong>de</strong>bemos hacer es incluir todaslas variables ficticias y un término in<strong>de</strong>pendiente. En el caso anterior tenemos dos conjuntos condos y tres estados <strong>de</strong> la naturaleza respectivamente, si proponemos la especificación:W i = µ ∗ + α ∗ 1S 1i + α ∗ 2S 2i + β ∗ 1E 1i + β ∗ 2E 2i + β ∗ 3E 3i + u i i = 1, . . . , N H + N M (5.24)existiría multicolinealidad exacta en la matriz <strong>de</strong> regresores y no podríamos estimar separadamenteninguno <strong>de</strong> los coeficientes. La matriz <strong>de</strong> regresores <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.24) es:⎡X =⎢⎣⎤i N1 i N1 0 i N1 0 0i N2 i N2 0 0 i N2 0i N3 i N3 0 0 0 i N3i N4 0 i N4 i N4 0 0⎥i N5 0 i N5 0 i N5 0 ⎦i N6 0 i N6 0 0 i N6⇒ rg(X) < K5.5.3. Inclusión <strong>de</strong> variables cuantitativasEn cualquiera <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os anteriores pue<strong>de</strong> incluirse una-s variable-s cuantitativas, por ejemplosi creemos que el salario <strong>de</strong>pen<strong>de</strong> no solo <strong>de</strong> sexo sino también <strong><strong>de</strong>l</strong> número <strong>de</strong> horas trabajadas,variable que <strong>de</strong>notamos como X i propondremos:W i = α 1 S 1i + α 2 S 2i + βX i + u i i = 1, . . . , N H + N M (5.25)Don<strong>de</strong> el coeficiente β se interpreta <strong>de</strong> la forma habitual, β = E(W i)∂X i. En forma matricial el mo<strong><strong>de</strong>l</strong>osería:[ ] [ ] ⎡ ⎤αWH iH 0 X 1[ ]=H ⎣ αW M 0 i M X 2⎦ uH+ ⇒ Y = Xβ + uM uβM127


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLa especificación alternativa correspondientesería:W i = α ∗ 1 + α ∗ 2S 2i + βX i + u i (5.26)i = 1, . . . , N H + N MDon<strong>de</strong> el coeficiente β se interpreta <strong>de</strong> la formahabitual. En forma matricial el mo<strong><strong>de</strong>l</strong>o sería:[WH]=W M[iH 0 X Hi M i M X M] ⎡ ⎣α ∗ 1α ∗ 2β⎤⎦+[uHu M]Wα ∗ 1 + α ∗ 2α ∗ 1α ∗ 1 + α ∗ 2 + βX Mα ∗ 1 + βX HX⇒ Y = Xβ + u5.5.4. Comportamiento estacionalLas variables ficticias permiten recoger fácilmente comportamientos estacionales, como se hizo enel Ejemplo 5.6. Por ejemplo, que las ventas <strong>de</strong> una empresa sean sistemáticamente superiores enalguno <strong>de</strong> los trimestres <strong><strong>de</strong>l</strong> año y que ese comportamiento se repita sistemáticamente año tras añoes un clásico patrón <strong>de</strong> comportamiento sistemático estacional. Este comportamiento se produce endatos <strong>de</strong> series temporales <strong>de</strong> periodo inferior al anual y pue<strong>de</strong> ser estudiado fácilmente mediantevariables ficticias.Por ejemplo para recoger el comportamiento estacional <strong>de</strong> una variable Y t muestreada trimestralmentepo<strong>de</strong>mos proponer el mo<strong><strong>de</strong>l</strong>o:Y t = β 1 + β 2 D 2t + β 3 D 3t + β 4 D 4t + u tt = 1, 2, . . . Tdon<strong>de</strong> t es el tiempo y las variables D jt son variables ficticias estacionales que se <strong>de</strong>finen:{ 1 si la observación t pertenece al trimestre j j = 2, 3, 4D jt =0 en caso contrarioLa especificación alternativa sería:Y t = β 1 D 1t + β 2 D 2t + β 3 D 3t + β 4 D 4t + u tt = 1, 2, . . . T5.5.5. Efectos <strong>de</strong> interacciónEntre factores cualitativos y cuantitativos En las ecuaciones (5.25) y (5.26) se recogen cambiosen or<strong>de</strong>nada pero no en pendiente, sin embargo po<strong>de</strong>mos pensar que el número <strong>de</strong> horas trabajadascambia según el sexo <strong><strong>de</strong>l</strong> individuo con lo cual <strong>de</strong>bemos recoger cambios en pendiente. Este efectopo<strong>de</strong>mos analizarlo asociando las variables ficticias a la variable cuantitativa. Así proponemos elsiguiente mo<strong><strong>de</strong>l</strong>o:W i = α 1 S 1i + α 2 S 2i + β 1 (S 1i × X i ) + β 2 (S 2i × X i ) + u i i = 1, . . . , N H + N M (5.27)128


Estadística Actuarial: Análisis <strong>de</strong> RegresiónE(W i /S 1i = 1; S 2i = 0) = α 1 + β 1 X iE(W i /S 1i = 0; S 2i = 1) = α 2 + β 2 X idon<strong>de</strong> β 1 y β 2 recogen el incremento en el salario medio ante un aumento unitario en las horastrabajadas, para los hombres y para las mujeres respectivamente.Una especificación alternativa sería:Wα ∗ 1 + α ∗ 2 + (β ∗ 1 + β ∗ 2)X MW i = α ∗ 1 + α ∗ 2S 2i + β ∗ 1X i + β ∗ 2(S 2i × X i ) + u iα ∗ 1 + β ∗ 1X Hi = 1, . . . , N H + N M (5.28)siendo α2 ∗ el incremento salarial en media por elhecho <strong>de</strong> ser mujer y β2 ∗ el incremento en el salariomedio <strong>de</strong> una mujer con respecto a un hombreante un aumento <strong>de</strong> una hora en el número<strong>de</strong> horas trabajado.α ∗ 1 + α ∗ 2α ∗ 1XEntre factores cualitativos En el mo<strong><strong>de</strong>l</strong>o (5.23) se supone que el efecto <strong>de</strong> cada factor es constantepara todos los niveles <strong>de</strong> los <strong>de</strong>más factores. Sin embargo si suponemos que el efecto diferencial <strong><strong>de</strong>l</strong>sexo variase con el nivel <strong>de</strong> educación existiría un efecto interacción entre las variables ficticias sexoy educación, que po<strong>de</strong>mos recoger así:W i = µ + α 2 S 2i + β 2 E 2i + β 3 E 3i + γ 2 (S 2i × E 2i ) + γ 3 (S 2i × E 3i ) + u i i = 1, . . . , N H + N M (5.29)don<strong>de</strong> la tabla que resume el comportamiento <strong>de</strong> la recta <strong>de</strong> regresión poblacional sería:E(W i ) E 1i E 2i E 3iS 1i µ µ + β 2 µ + β 3S 2i µ + α 2 µ + α 2 + β 2 + γ 2 µ + α 2 + β 3 + γ 3y po<strong>de</strong>mos interpretar los parámetros como sigue:µ base <strong>de</strong> comparación.β 2 Efecto diferencial en el salario medio <strong>de</strong>bido a tener un nivel <strong>de</strong> estudios secundarios,con respecto a tener estudios primarios, para los hombres.β 3 Efecto diferencial en el salario medio <strong>de</strong>bido a tener un nivel <strong>de</strong> estudios universitarios,con respecto a tener estudios primarios, para los hombres.α 2 Efecto diferencial en el salario medio entre los hombres y las mujeres para un nivel <strong>de</strong>educación primaria.α 2 + γ 2 Efecto diferencial en el salario medio, entre hombres y mujeres, para un nivel <strong>de</strong> educaciónsecundaria.α 2 + γ 3 Efecto diferencial en el salario medio, entre hombres y mujeres, para un nivel <strong>de</strong> educaciónuniversitaria.β 2 + γ 2 Efecto diferencial en el salario medio <strong>de</strong>bido a tener un nivel <strong>de</strong> estudios secundarios,con respecto a tener estudios primarios, para las mujeres.β 3 + γ 3 Efecto diferencial en el salario medio <strong>de</strong>bido a tener un nivel <strong>de</strong> estudios universitarios,con respecto a tener estudios primarios, para las mujeres.129


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.6. Distribución <strong><strong>de</strong>l</strong> estimador MCO. Estimación por intervalo5.6.1. Distribución <strong><strong>de</strong>l</strong> estimador <strong>de</strong> MCO bajo NormalidadSi Y = Xβ +u, don<strong>de</strong> u ∼ N(0, σ 2 I N ), el estimador MCO, dado que es lineal en las perturbaciones,también seguirá una distribución Normal Multivariante, con vector <strong>de</strong> medias E( ˆβ) = β y matriz<strong>de</strong> varianzas y covarianzas V ( ˆβ) = σ 2 (X ′ X) −1 . Es <strong>de</strong>cir,ˆβ ∼ N(β, σ 2 (X ′ X) −1 )Para el k-ésimo coeficiente,ˆβ k ∼ N(β k , σ 2 a kk )don<strong>de</strong> a kk es el elemento (k, k) <strong>de</strong> la matriz (X ′ X) −1 .5.6.2. Estimación por intervaloPara el k-ésimo coeficiente,ˆβ k ∼ N(β k , σ 2 a kk )Una vez estimada la varianza <strong>de</strong> la perturbación con el estimador insesgado ˆσ 2 se pue<strong>de</strong> <strong>de</strong>mostrarque:ˆβ k − β kˆσ √ a kk∼t (N−K)don<strong>de</strong> t (N−K) <strong>de</strong>nota la distribución t-Stu<strong>de</strong>nt con (N − K) grados <strong>de</strong> libertad, y ˆσ √ a kk es la <strong>de</strong>sviaciónestimada <strong><strong>de</strong>l</strong> coeficiente estimado. (Notación ˆσ √ a kk = ˆσ ˆβk).El intervalo <strong>de</strong> confianza asociado es 14 :P r[ˆβk − t α2 (N−K)ˆσ ˆβk< β k < ˆβ k + t α2 (N−K)ˆσ ˆβk]= 1 − αCon lo que po<strong>de</strong>mos escribir el intervalo <strong>de</strong> confianza <strong><strong>de</strong>l</strong> (1 − α) por ciento para un coeficientecualquiera β k como:( )IC(β k ) 1−α = ˆβk ± t α2 (N−K) ˆσ ˆβkEste es un estimador por intervalo porque en los extremos inferior y superior <strong><strong>de</strong>l</strong> intervalo aparecenˆβ k y ˆσ ˆβk, que son estimadores. Este intervalo es aleatorio, porque para cada muestra se obtiene unvalor numérico distinto <strong>de</strong> ˆβ k y ˆσ ˆβk. Cuando usamos una muestra para obtener las estimaciones,tendremos [un número ≤ β k ≤ otro número] y se <strong>de</strong>nomina estimación por intervalo <strong>de</strong> β k ó intervalo<strong>de</strong> confianza (1 − α) para β k . Un intervalo <strong>de</strong> confianza nos dice que, con probabilidad (1 − α)se estima que el parámetro β k estará <strong>de</strong>ntro <strong>de</strong> ese rango <strong>de</strong> valores.14 Ver el Tema 2 para recordar cómo construir intervalos <strong>de</strong> confianza.130


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLas propieda<strong>de</strong>s <strong>de</strong> la variable aleatoria IC(β k ) se basan en la noción <strong><strong>de</strong>l</strong> muestreo repetido: siobtuviéramos infinitas muestras <strong>de</strong> tamaño N <strong>de</strong> una misma población, y para cada una <strong>de</strong> ellasconstruyésemos el intervalo, entonces (1−α)×100 % <strong>de</strong> todos los intervalos construidos contendríanel verda<strong>de</strong>ro valor (<strong>de</strong>sconocido) <strong>de</strong> β k .¿Para qué sirven las estimaciones por intervalo? La respuesta es que nos dan una informaciónmuy valiosa sobre la precisión <strong>de</strong> las estimaciones por punto, esto es, nos dicen hasta qué puntonos po<strong>de</strong>mos fiar <strong>de</strong> ellas. Si un intervalo <strong>de</strong> confianza es ancho (<strong>de</strong>bido a una ̂V ( ˆβ k ) gran<strong>de</strong>) nosestá diciendo que no hay mucha información en la muestra sobre β k . A<strong>de</strong>más, como veremos mása<strong><strong>de</strong>l</strong>ante, los intervalos sirven para realizar contraste <strong>de</strong> hipótesis.5.7. Contraste <strong>de</strong> hipótesis sobre los coeficientes <strong>de</strong> la regresiónUn problema fundamental <strong>de</strong> la Econometría es aportar un conocimiento <strong>de</strong>scriptivo <strong>de</strong> una economíareal, los economistas <strong>de</strong>sarrollan teorías sobre el comportamiento económico y las evalúan.Los contrastes <strong>de</strong> hipótesis son los procedimientos que se usan para evaluar estas teorías. Para ellovamos a utilizar el mo<strong><strong>de</strong>l</strong>o Y = Xβ + u don<strong>de</strong> consi<strong>de</strong>ramos que se cumplen las hipótesis básicas ya<strong>de</strong>más la perturbación es normal. La normalidad no es necesaria para estimar por MCO ni para<strong>de</strong>terminar las propieda<strong>de</strong>s <strong><strong>de</strong>l</strong> estimador pero si lo es para realizar inferencia dado que al ser ˆβ MCOlineal en u tendrá su misma distribución y podremos <strong>de</strong>rivar estadísticos <strong>de</strong> contraste basándonosen ella.Por ejemplo, dado queu i ∼ N(0, σ 2 ) −→ ˆβ k ∼ N(β k , σ 2 a kk )si conocemos todos los elementos incluido σ 2 podríamos contrastar hipótesis <strong>de</strong> la forma H 0 : β k = ccon el siguiente estadístico:ˆβ k − cσ √ H ∼0N(0, 1)a kkEn general nosotros lo que queremos es contrastar conjuntos lineales <strong>de</strong> hipótesis. Po<strong>de</strong>mos realizarcontrastes sobre los coeficientes individuales y sobre conjuntos <strong>de</strong> coeficientes, incluso sobre todoslos coeficientes a la vez. Los contrastes más importantes en Econometría son los contrastes <strong>de</strong>significatividad <strong>de</strong> los regresores individuales y el contraste <strong>de</strong> significatividad conjunta. En ellostratamos <strong>de</strong> analizar si cada uno <strong>de</strong> los regresores <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> forma individual o conjuntamenteson útiles para explicar el comportamiento <strong>de</strong> la variable endógena. Los veremos a continuaciónjunto con otros <strong>de</strong> interés.5.7.1. Contraste <strong>de</strong> restricciones sobre los coeficientes <strong>de</strong> regresión individualesEn los contrastes sobre los coeficientes individuales se contrasta la hipótesis nula H 0 : β k = c,don<strong>de</strong> la constante c pue<strong>de</strong> tomar diversos valores. Contrastamos una única restricción. La hipótesisalternativa pue<strong>de</strong> ser a una cola por ejemplo H a : β k > 0 o a dos colas H a : β k ≠ c. Para realizarel contraste hemos <strong>de</strong> <strong>de</strong>rivar el estadístico <strong>de</strong> contraste y su distribución bajo la hipótesis nula,131


Estadística Actuarial: Análisis <strong>de</strong> Regresiónevaluar el estadístico en la muestra y aplicar la regla <strong>de</strong> <strong>de</strong>cisión 15 . Para contrastar:H 0 : β k = c frente a H a : β k ≠ cBajo las hipótesis básicas y normalidad <strong>de</strong> las perturbaciones la distribución <strong><strong>de</strong>l</strong> estimador ˆβ k es lasiguiente:ˆβ k ∼ N(β k , σ 2 a kk )Si σ 2 es conocida todo es conocido en la distribución <strong>de</strong> β k y el estadístico <strong>de</strong> contraste sería:ˆβ k − cσ ˆβkH 0∼ N(0, 1)En el resto <strong>de</strong> ejemplos consi<strong>de</strong>ramos el caso más habitual σ 2 <strong>de</strong>sconocida, para el cual po<strong>de</strong>mos<strong>de</strong>rivar el siguiente estadístico <strong>de</strong> contraste 16 y distribución asociada cuando σ 2 es estimada con elestimador insesgado ˆσ 2 =û′ ûN−K :ˆβk − cˆσ ˆβkH 0∼ t(N−K)La regla <strong>de</strong> <strong>de</strong>cisión es rechazar H 0 si ˆβ k −cˆσ ˆβk> t (N−K)|α . En este caso contrario no se rechaza.2Si la alternativa es a una cola, por ejemplo:H 0 : β k = c frente a H a : β k > cLa regla <strong>de</strong> <strong>de</strong>cisión es rechazar H 0 si ˆβ k −cˆσ ˆβk> t (N−K)| α .Contraste <strong>de</strong> significatividad individualCuando c = 0 al contraste se le <strong>de</strong>nomina <strong>de</strong> significatividad individual. En este caso:H 0 : β k = 0H a : β k ≠ 015 Ver Tema 3 para recordar el mecanismo <strong>de</strong> contraste.16 Si σ 2 es <strong>de</strong>sconocida habría <strong>de</strong> ser estimada, bajo la normalidad <strong>de</strong> las perturbacionesu i ∼ N(0, σ 2 ) −→(N − K)ˆσ2σ 2y <strong>de</strong>rivar el correspondiente estadístico <strong>de</strong> contraste, que sería:∼ χ 2 (N−K)ˆβ k −cσ √ a kk√ ∑ û2i/σ 2N−KH 0∼ t(N−K)si simplificamosˆβ k − cˆσ √ a kkH 0∼ t(N−K)132


Estadística Actuarial: Análisis <strong>de</strong> RegresiónPo<strong>de</strong>mos <strong>de</strong>rivar el siguiente estadístico <strong>de</strong> contraste y distribución:ˆβ kˆσ ˆβkH 0∼ t(N−K)Si el estadístico calculado para la muestra es mayor que el estadístico en tablas,ˆσ> t (N−K)|αˆβk2para un α dado, se rechaza la hipótesis nula. En este caso β k ≠ 0 y la variable explicativa asociadaX k es significativa para explicar el comportamiento <strong>de</strong> la variable endógena. Por tanto este contrastesirve para <strong>de</strong>cidir si la variable X k <strong>de</strong>be mantenerse en el mo<strong><strong>de</strong>l</strong>o. Si el estadístico calculado paraˆβla muestra es menor que el estadístico en tablas, kˆσ< t (N−K)|α para un α dado, no se rechazaˆβk2la hipótesis nula. En este caso β k = 0 y la variable explicativa asociada X k no es significativa paraexplicar el comportamiento <strong>de</strong> la variable endógena.ˆβ kUtilización <strong><strong>de</strong>l</strong> intervalo <strong>de</strong> confianza para hacer contraste <strong>de</strong> hipótesis En secciones anterioreshablamos <strong>de</strong> la estimación por intervalo y se mencionó que también podíamos realizar inferenciautilizando intervalos <strong>de</strong> confianza. Pues bien si recordamos el intervalo <strong>de</strong> confianza asociado a β k :[P r ˆβk − t α(N−K)ˆσ 2 ˆβk< β k < ˆβ]k + t α(N−K)ˆσ 2 ˆβk= 1 − α( )IC(β k ) 1−α : ˆβk ± t α2 (N−K) ˆσ ˆβky la regla <strong>de</strong> <strong>de</strong>cisión es que si la constante c (en este caso c = 0) pertenece al intervalo, norechazamos H 0 con un nivel <strong>de</strong> significación α y si no pertenece al intervalo, rechazamos H 0 con unnivel <strong>de</strong> significación α. Claramente se obtienen exactamente los mismos resultados utilizando losestadísticos <strong>de</strong> contraste individuales que utilizando los intervalos <strong>de</strong> confianza.5.7.2. Contraste <strong>de</strong> restricciones sobre los coeficientes <strong>de</strong> regresiónEn ocasiones interesa averiguar cuál es el efecto <strong>de</strong> la combinación <strong>de</strong> varias variables, por ejemplonos interesará saber si la combinación <strong>de</strong> todas las variables es un útil predictor <strong>de</strong> la variable<strong>de</strong>pendiente.Contraste <strong>de</strong> significatividad conjuntoH 0 : β 2 = β 3 = · · · = β K = 0H a : alguna igualdad no se daEn este caso po<strong>de</strong>mos <strong>de</strong>rivar el siguiente estadístico <strong>de</strong> contraste y distribución asociada:R 2 /K − 11 − R 2 /N − K133H 0∼ F(K−1,N−K)


Estadística Actuarial: Análisis <strong>de</strong> RegresiónRSi2 /K−11−R 2 /N−K > F (q,N−K)|α el estadístico calculado para la muestra es mayor que el estadístico entablas, para un α dado, se rechaza la hipótesis nula y se concluye que las variables son conjuntamentesignificativas para explicar el comportamiento <strong>de</strong> la variable endógena.Ejemplo 5.13Vamos a mostrar un ejemplo sobre los contrastes <strong>de</strong> significatividad individual y conjuntocon los resultados <strong>de</strong> la estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.11). Primero vamos a escribir losresultados <strong>de</strong> la estimación <strong>de</strong> la forma habitual en que se muestran en la literatura:̂ P RICE(ˆσ ˆβk)= 129, 062 + 0, 154800 SQF T − 21, 5875 BEDRMS − 12, 1928 BAT HS(88,30) (0,03)(27,02)(43,25)N = 14 R 2 = 0, 8359 ¯R2 = 0, 7868Como pue<strong>de</strong> apreciarse en la ecuación anterior, se indica que bajo cada coeficiente estimadoaparece su correspondiente <strong>de</strong>sviación típica estimada 17 .Contrastes <strong>de</strong> significatividad individual, contrastamos:H 0 : β k = 0H a : β k ≠ 0• Para la variable SQF T obtenemos:}con el estadístico y distribución0, 15480, 0319 = 4, 8465 > 2, 22814 = t (10) |0,025ˆβ kˆσ ˆβkH 0∼ t(14−4)luego rechazamos H 0 para α = 5 % y la variable SQF T es significativa.• Para la variable BEDRMS obtenemos:−21, 587∣ 27, 0293 ∣ = | − 0, 7987| < 2, 22814 = t (10) |0,025luego no rechazamos H 0 para α = 5 % y la variable BEDRMS no es significativa.• Para la variable BAT HS obtenemos:−12, 192∣ 43, 25 ∣ = | − 0, 2819| < 2, 22814 = t (10) |0,025luego no rechazamos H 0 para α = 5 % y la variable BAT HS no es significativa.En el contraste <strong>de</strong> significatividad conjunta, contrastamos:H 0 : β 2 = β 3 = β 4 = 0H a : alguna igualdad no se da}conR 2 /K − 11 − R 2 /N − KH 0∼ F(K−1,N−K)17 Una alternativa a presentar las <strong>de</strong>sviaciones típicas estimadas <strong>de</strong> los coeficientes es presentar el valor muestral <strong><strong>de</strong>l</strong>estadístico <strong>de</strong> significatividad individual para el coeficiente <strong>de</strong> regresión correspondiente o los valores p.134


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEvaluado el estadístico en la muestra obtenemos:0, 8359/3(1 − 0, 8359)/10 = 16, 989 > 3, 70826 = F (3,10) |0,05rechazamos H 0 para α = 5 %. Concluimos que las variables exógenas SQF T, BEDRMSy BAT HS son conjuntamente significativas.Ejemplo 5.14Utilizamos la función <strong>de</strong> salarios especificada para el año 2002 que se propuso en elEjemplo 5.5:W i = β 1 + β 2 S 2i + β 3 X i + u i i = 1, 2, . . . Ndon<strong>de</strong> W i es el salario anual <strong><strong>de</strong>l</strong> individuo i, X i son los años <strong>de</strong> experiencia <strong><strong>de</strong>l</strong> individuoi y S 2i es una variable ficticia que se <strong>de</strong>fine:{ 1 si el individuo i es mujerS 2i =0 en caso contrarioEn este mo<strong><strong>de</strong>l</strong>o po<strong>de</strong>mos contrastar:• Si la experiencia es <strong>de</strong>terminante <strong><strong>de</strong>l</strong> salario: H 0 : β 3 = 0, si esta hipótesis no serechaza para un nivel <strong>de</strong> significatividad dado el salario no <strong>de</strong>pen<strong>de</strong> <strong>de</strong> los años <strong>de</strong>experiencia <strong><strong>de</strong>l</strong> individuo. Contrastamos:H 0 : β 3 = 0H a : β 3 ≠ 0}con el estadístico y distribuciónˆβ 3ˆσ ˆβ3H 0∼ t(N−3)• Si existe discriminación salarial por sexo: H 0 : β 2 = 0, si esta hipótesis no se rechazapara un nivel <strong>de</strong> significatividad dado no existe discriminación salarial por sexo.Por ejemplo si la experiencia es cero y β 2 = 0, el salario esperado es β 1 ∀i luego elsalario esperado es el mismo para hombres y mujeres.H 0 : β 2 = 0H a : β 2 ≠ 0}con el estadístico y distribuciónˆβ 2ˆσ ˆβ2H 0∼ t(N−3)Contraste <strong>de</strong> combinaciones linealesPor ejemplo contrastamos la hipótesis:H 0 : β 2 + β 3 = 1H a : β 2 + β 3 ≠ 1Renombrando ŵ = ˆβ 2 + ˆβ 3 y c = 1 se pue<strong>de</strong> expresar la hipótesis nula y alternativa así como elestadístico <strong>de</strong> contraste y su distribución asociada como:H 0 : w = cH a : w ≠ c135


Estadística Actuarial: Análisis <strong>de</strong> Regresiónŵ − cˆσŵH 0∼ t(N−K)si H 0 es ciertaLa distribución <strong><strong>de</strong>l</strong> estadístico ŵ ∼ N(µ w , σ 2 w) dado que:ŵ = ˆβ 2 + ˆβ 3ˆβ 2 ∼ N(β 2 , σ 2 a 22 )ˆβ 3 ∼ N(β 3 , σ 2 a 33 )esµ w = E(ŵ) = E( ˆβ 2 + ˆβ 3 ) = β 2 + β 3σ 2 w = V (ŵ) = E[ŵ − E(ŵ)] 2 = E[( ˆβ 2 + ˆβ 3 ) − (β 2 + β 3 )] 2 = V ( ˆβ 2 ) + V ( ˆβ 3 ) + 2Cov( ˆβ 2 , ˆβ 3 )= σ 2 (a 22 + a 33 + 2a 23 )Por tantoˆβ 2 + ˆβ 3 ∼ N(β 2 + β 3 , σ 2 (a 22 + a 33 + 2a 23 ))Luego en términos <strong>de</strong> los coeficientes estimados originales el estadístico <strong>de</strong> contraste y distribuciónes:ˆβ 2 + ˆβ 3 − 1o lo que es igual:√ˆV ( ˆβ 2 ) + ˆV ( ˆβ 3 ) + 2 ˆ Cov( ˆβ 2 , ˆβ 3 )H 0∼ t(N−K)Con la regla <strong>de</strong> <strong>de</strong>cisión habitual.ˆβ 2 + ˆβ 3 − 1ˆσ √ a 22 + a 33 + 2a 23H 0∼ t(N−K)Ejemplo 5.15Para contrastar:H 0 : β 2 = β 3 H a : β 2 ≠ β 3es equivalente a escribir:H 0 : β 2 − β 3 = 0 H a : β 2 − β 3 ≠ 0que po<strong>de</strong>mos contrastar con el estadístico y distribución:Con la regla <strong>de</strong> <strong>de</strong>cisión habitual.ˆβ 2 − ˆβ 3ˆσ √ a 22 + a 33 − 2a 23H 0∼ t(N−K)136


Estadística Actuarial: Análisis <strong>de</strong> RegresiónContraste <strong>de</strong> un subconjunto <strong>de</strong> coeficientesSupongamos el siguiente mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión:Y i = β 1 + β 2 X 2i + . . . + β k X ki + α 1 Z 1i + α 2 Z 2i + . . . + α r Z ri + u ii = 1, 2, . . . , Ny queremos contrastar si el subconjunto <strong>de</strong> regresores Z 1i , Z 2i , . . . , Z ri son conjuntamente significativospara explicar el comportamiento <strong>de</strong> la variable endógena. La hipótesis <strong>de</strong> contraste es:El estadístico <strong>de</strong> contraste y distribución son:don<strong>de</strong>:H 0 : α 1 = α 2 = . . . = α r = 0H a : alguna igualdad no se <strong>de</strong>û ′ rû r − û ′ û/r H ∼0F(r,N−K)û ′ (5.30)û/(N − K)• û ′ rû r es la suma <strong>de</strong> cuadrados residual <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o restringido estimado por MCO, siendo elmo<strong><strong>de</strong>l</strong>o restringido aquel que cumple la hipótesis nula. Luego el mo<strong><strong>de</strong>l</strong>o restringido es:Y i = β 1 + β 2 X 2i + . . . + β k X ki + u rii = 1, 2, . . . , N• û ′ û es la suma <strong>de</strong> cuadrados residual <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o no restringido o lo que es igual el mo<strong><strong>de</strong>l</strong>o <strong>de</strong>interés estimado por MCO:Y i = β 1 + β 2 X 2i + . . . + β k X ki + α 1 Z 1i + α 2 Z 2i + . . . + α r Z ri + u ii = 1, 2, . . . , N• r es el número <strong>de</strong> restricciones que se contrastan, en este caso el número <strong>de</strong> coeficientes α r .La regla <strong>de</strong> <strong>de</strong>cisión es la habitual, se rechaza la hipótesis nula si:û ′ rû r − û ′ û/rû ′ û/(N − K) > F (r,N−K)| αen cuyo caso las variables exógenas Z ri contribuyen a explicar el comportamiento <strong>de</strong> la variableûendógena, en cuyo caso <strong>de</strong>bemos especificar el mo<strong><strong>de</strong>l</strong>o no restringido. Si′ rû r−û ′ û/rû ′ û/(N−K) < F (r,N−K)| αno rechazamos H 0 en cuyo caso las variables Z ri no contribuyen a explicar a la variable endógenay <strong>de</strong>bemos especificar el mo<strong><strong>de</strong>l</strong>o restringido.5.7.3. Contrastes basados en sumas <strong>de</strong> cuadrados <strong>de</strong> residuosAl estadístico:û ′ rû r − û ′ û/q H ∼0F(q,N−K)û ′ û/(N − K)137


Estadística Actuarial: Análisis <strong>de</strong> Regresióngeneralmente se le conoce con el nombre <strong>de</strong> estadístico <strong>de</strong> diferencias en las sumas residuales<strong>de</strong> cuadrados. Pue<strong>de</strong> ser utilizado para contrastar hipótesis lineales con solo especificar correctamentelos mo<strong><strong>de</strong>l</strong>os restringido y no restringido, q es el número <strong>de</strong> restricciones que se contrastan.Para su aplicación sólo es necesario obtener la SCR <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o restringido y no restringido. Vamosa estudiarlo en <strong>de</strong>talle en el ejemplo siguiente.Estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o restringido y cálculo <strong>de</strong> la SCR r El mo<strong><strong>de</strong>l</strong>o restringido (MR) es aquelque cumple la hipótesis nula mientras que el mo<strong><strong>de</strong>l</strong>o no restringido (MNR) es el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> interés.Por ejemplo sea el MRLG,MNR:Y i = β 1 + β 2 X 2i + β 3 X 3i + u idon<strong>de</strong> queremos contrastar la hipótesis nula H 0 : β 2 + β 3 = 1 sustituyendo la restricción en elmo<strong><strong>de</strong>l</strong>o encontramos el mo<strong><strong>de</strong>l</strong>o restringido:MR:Y i = β 1 + β 2 X 2i + (1 − β 2 )X 3i + u riY i − X} {{ 3i = β}1 r + β2(X r 2i − X 3i ) + u} {{ } ri=Yi⋆=Xi⋆Y ⋆i= β r 1 + β r 2X ⋆ i + u riLa aplicación <strong>de</strong> MCO en el mo<strong><strong>de</strong>l</strong>o resultante son los llamados estimadores <strong>de</strong> Mínimos CuadradosRestringidos, MCR. Los <strong>de</strong>más ˆβ r se obtienen con las restricciones. En el ejemplo en el mo<strong><strong>de</strong>l</strong>orestringido se calculan ˆβ r 1 y ˆβ r 2 y finalmente se calcula ˆβ r 3 = 1 − ˆβ r 2 .En este mo<strong><strong>de</strong>l</strong>o restringido estimado por MCO se calcula la SCR = û ′ rû r . Si escribimos el MR entérminos matricialesY ⋆ = X ⋆ β r + u rentoncesû ′ rû r = Y ⋆′ Y ⋆ − ˆβ r′ X ⋆′ Y ⋆don<strong>de</strong>Y ⋆ y X ⋆ son las variables que quedan en el mo<strong><strong>de</strong>l</strong>o restringido y[ ˆβr 1ˆβ r 2] [ ∑ N X⋆= ∑ ∑ iX⋆i X⋆2i] −1 [ ∑ Y⋆i ∑Y⋆i X ⋆ i]=[ ∑ ] −1 [ ∑ N∑ ∑ (X2i − X 3i ) (Yi − X 3i )(X2i − X 3i ) (X2i − X 3i ) 2 ∑ (Yi − X 3i )(X 2i − X 3i )]138


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjemplo 5.16Contraste <strong>de</strong> significatividad conjunta: H 0 : β 2 = β 3 = . . . = β K = 0. Para esta hipótesisel mo<strong><strong>de</strong>l</strong>o restringido esY i = β 1 + u isi estimamos el MR por MCO obtenemos:Min ˆβ1∑û2 i = Min ˆβ1∑(Yi − ˆβ 1 ) 2<strong>de</strong> don<strong>de</strong>∂ ∑ û 2 i∂ ˆβ 1= −2 ∑ (Y i − ˆβ 1 ) = 0 −→ ˆβ r 1 = Ȳû ′ rû r = ∑ (Y i − Ŷi) 2 == ∑ (Y i − ˆβ r 1) 2 = ∑ (Y i − Ȳ )2 = SCTAsíû ′ rû r − û ′ û/q (SCT − SCR)/qû ′ = û/(N − K) SCR/N − Kdividiendo el numerador y el <strong>de</strong>nominador <strong>de</strong> entre SCT obtenemos.F = (û′ rû r − û ′ û)/qû ′ û/N − K = R 2 /K − 1(1 − R 2 )/N − KH 0∼ F(K−1,N−K)estadístico que coinci<strong>de</strong> con el obtenido para el contraste <strong>de</strong> significatividad conjunta.Ejercicio 5.13Sean las variables X t , coste medio <strong>de</strong> las reclamaciones por siniestros realizados en ty Y t los beneficios <strong>de</strong> la empresa en t, ambos en miles <strong>de</strong> millones. Disponemos <strong>de</strong> lasiguiente muestra:X 2 3 1 5 9Y 4 7 3 9 17Para el mo<strong><strong>de</strong>l</strong>o: Y t = β 1 + β 2 X t + u t t = 1, . . . , 5 u t ∼ N(0, σ 2 )1. Interpreta los coeficientes β 1 y β 2 .2. Escribe la matriz <strong>de</strong> regresores y el vector <strong>de</strong> valores <strong>de</strong> la variable endógena.3. Calcula la recta <strong>de</strong> regresión muestral MCO.4. Interpreta las estimaciones <strong>de</strong> los parámetros.139


Estadística Actuarial: Análisis <strong>de</strong> Regresión5. Calcular los valores <strong>de</strong> Ŷt y û t .6. Estima la varianza <strong>de</strong> la perturbación.7. Calcula el coeficiente <strong>de</strong> <strong>de</strong>terminación, R 2 e interpreta su significado.8. Calcula el coeficiente <strong>de</strong> correlación simple, ¿qué relación hay entre r XY y R 2 eneste mo<strong><strong>de</strong>l</strong>o?9. Contrasta la significatividad <strong>de</strong> la variable coste medio <strong>de</strong> las reclamaciones.10. Considérense los siguientes dos estimadores <strong>de</strong> la pendiente <strong>de</strong> la regresión:a) Calcular los dos estimadores.ˆβ 2,MCO˜β2 = Y 5 − Y 3X 5 − X 3b) Razonar cuál <strong>de</strong> los dos estimadores es “mejor”.Ejercicio 5.14Se han calculado las siguientes cantida<strong>de</strong>s en una muestra <strong>de</strong> tamaño T = 100:∑Xt = 11, 34∑X2t = 12, 16∑Yt = 20, 72∑Y2t = 84, 96Estimar las siguientes regresiones:∑Xt Y t = 22, 131. Y t = β 1 + β 2 X t + u t2. X t = α 1 + α 2 Y t + ɛ t3. ¿Son los estimadores <strong>de</strong> β 1 y β 2 iguales a los <strong>de</strong> α 1 y α 2 ? ¿En qué caso coincidirán?Ejercicio 5.15Supongamos que la variable Y se relaciona con las variables X 1 , X 2 , X 3 mediante laecuación:Y t = β 1 X 1t + β 2 X 2t + β 3 X 3t + u t (5.31)Don<strong>de</strong> u t ∼ iid(0, σ 2 I T ), los siguientes datos vienen dados por la tabla:X 1 1 1 1 1 1 1 1 1 1 1X 2 1 0 -1 1 0 -1 1 0 -1 0X 3 1 1 1 0 0 0 -1 -1 -1 0Y 3 6 10 5 10 12 5 10 10 81. Interpreta los parámetros <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.2. Escribe la matriz <strong>de</strong> regresores.140


Estadística Actuarial: Análisis <strong>de</strong> Regresión3. Estima la función <strong>de</strong> regresión muestral.4. Estima la varianza <strong>de</strong> las perturbaciones.5. Estima la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> los parámetros estimados.6. Calcula e interpreta el R 2 .7. ¿Se cumple en este mo<strong><strong>de</strong>l</strong>o la igualdad rXY 2 = R2 ?8. Calcular el intervalo <strong>de</strong> confianza para el parámetro β 2 y α = 5 %.9. Contrasta la significatividad individual y conjunta <strong>de</strong> los regresores.Ejercicio 5.16Se ha estimado el siguiente mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión simple, utilizando el criterio <strong>de</strong> MCO:ˆV t = 1767,61 + 7,48W t R 2 = 0,80 (5.32)Los estadísticos t para el contraste <strong>de</strong> que el parámetro correspondiente es igual a ceroresultan ser iguales a 1,4 para el término constante y 18,5 para la variable W . Dado queel valor <strong><strong>de</strong>l</strong> estadístico para el contraste <strong>de</strong> significación <strong><strong>de</strong>l</strong> término constante nos llevaa no rechazar la hipótesis nula, se formula y estima el siguiente mo<strong><strong>de</strong>l</strong>o:ˆV t = 11,71W t R 2 = 0,91 (5.33)Como el mayor coeficiente <strong>de</strong> <strong>de</strong>terminación correspon<strong>de</strong> a la segunda regresión, se optapor elegir el mo<strong><strong>de</strong>l</strong>o (5.33). ¿Te parece a<strong>de</strong>cuada esta <strong>de</strong>cisión?Ejercicio 5.17Para un conjunto <strong>de</strong> 21 individuos se quiere estudiar la relación entre el precio mensual<strong>de</strong> la póliza <strong>de</strong> un bien asegurado Y i y el valor asegurado <strong><strong>de</strong>l</strong> bien, X 2i ambas expresadasen unida<strong>de</strong>s monetarias. Para ello se propone el siguiente mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal:Y i = β 1 + β 2 X 2i + u i i = 1, 2, . . . , 21 (5.34)1. Estima los coeficientes <strong>de</strong> la regresión y sus varianzas respectivas a partir <strong>de</strong> lossiguientes datos:∑ ∑ ∑ ∑X2i Y i = 35, 98 X22i = 641, 5 Y2i = 2, 02 X2i = 110, 1∑Yi = 6, 16∑(X2i − ¯X 2 ) 2 = 64, 26∑(Yi − Ȳ )2 = 0, 2132. Contrasta la significación <strong>de</strong> la regresión (5.34) para un α = 5 %.3. A continuación el investigador introduce una nueva variable en el mo<strong><strong>de</strong>l</strong>o que recogeel coste medio mensual <strong>de</strong> las reclamaciones presentadas, X 3i . Estimamos <strong>de</strong>nuevo el mo<strong><strong>de</strong>l</strong>o (5.34), introduciendo una variable explicativa X 3 . Los resultadosobtenidos han sido los siguientes:Y i = −0, 017 + 0, 05X 2i + 0, 07X 3i + û i R 2 = 0, 9985Contrasta la significación <strong>de</strong> la variable explicativa X 3 para un α = 5 %.141


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.18La función <strong>de</strong> producción Cobb-Douglas tiene la forma Y = AK β 1L β 2. Dada una muestra<strong>de</strong> tamaño N,1. ¿Es el mo<strong><strong>de</strong>l</strong>o lineal? ¿Qué método se podría usar para estimar los parámetros?2. Interpreta los coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.3. ¿Cómo contrastarías si la empresa tiene rendimientos constantes a escala?4. Si H 0 es cierta, ¿qué método mejora la estimación <strong>de</strong> los parámetros? ¿por qué?Ejercicio 5.19Supón que el verda<strong>de</strong>ro mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión es:Y t = β 1 + β 2 X 2t + u t (5.35)pero nosotros añadimos la variable X 3 y estimamos el siguiente mo<strong><strong>de</strong>l</strong>o:Y t = β 1 + β 2 X 2t + β 3 X 3t + u t (5.36)Discute si el coeficiente <strong>de</strong> <strong>de</strong>terminación R 2 y el corregido ¯R 2 serán mayores en elmo<strong><strong>de</strong>l</strong>o (5.35) que en el (5.36).Ejercicio 5.20Se han estimado, mediante MCO, los siguientes mo<strong><strong>de</strong>l</strong>os para la inversión para unamuestra <strong>de</strong> 1968 a 1980:Î t = 0,6656 + 0,0424 X t + 0,0610 K t−1 R 2 = 0,9383( <strong>de</strong>s( ˆ i ))(0.0125) (0.0049)Î t = 0,7199 + 0,0290 X t + 0,0012 X t−1 + 0,0258 X t−2 + 0,0631 K t−1 R 2 = 0,9468( <strong>de</strong>s( ˆ i))(0.0136) (0.012) (0.0136) (0.0051)1. Contrasta la significatividad individual <strong>de</strong> los parámetros <strong>de</strong> ambos mo<strong><strong>de</strong>l</strong>os e interpretalos resultados.2. ¿Alguna <strong>de</strong> las variables es más importante que el resto para la <strong>de</strong>terminación <strong><strong>de</strong>l</strong>a inversión?3. ¿Cuál <strong>de</strong> los dos mo<strong><strong>de</strong>l</strong>os elegirías? Razona tu respuesta.142


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.21Comenta con claridad las siguientes afirmaciones:1. El estimador insesgado ˆβ con varianza V 1 proporciona siempre mejores estimacionesque el estimador sesgado β ∗ con varianza V 2 don<strong>de</strong> V 1 > V 2 .2. En el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal general la matriz <strong>de</strong> covarianzas estimada <strong><strong>de</strong>l</strong>estimador MCO <strong>de</strong> ˆβ es la misma para cualquier muestra que tomemos.3. Las ecuaciones normales <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal general implican que elvector <strong>de</strong> residuos MCO es ortogonal al vector <strong>de</strong> valores estimados Ŷ .4. Si Y t y X 2t son variables que no están correlacionadas, es <strong>de</strong>cir, ∑ (Y t − Ȳ )(X 2t −¯X 2 ) = 0, entonces la estimación MCO <strong><strong>de</strong>l</strong> coeficiente β 2 en el mo<strong><strong>de</strong>l</strong>o:Y t = β 1 + β 2 X 2t + · · · + β k X kt + u tt = 1, 2, . . . , Tes cero.5. En el MRLG, el supuesto <strong>de</strong> normalidad <strong>de</strong> las perturbaciones es necesario parapo<strong>de</strong>r estimar los parámetros <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.6. Bajo los supuestos clásicos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal general, el estimadorMCO <strong>de</strong> β sigue una distribución normal multivariante centrada en el verda<strong>de</strong>rovalor <strong>de</strong> los parámetros β.7. Dada una muestra <strong>de</strong> N observaciones, la ecuación <strong>de</strong> regresión poblacional pasapor el punto <strong>de</strong> medias (Ȳ , ¯X 1 , . . . , ¯X k ).8. En un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal simple don<strong>de</strong> u t ∼ iid(0, σ 2 ), si se pudiera elegirentre dos muestras <strong>de</strong> valores para la variable X, una <strong>de</strong> ellas con ∑ (X t − ¯X) 2 = 100y la otra con ∑ (X t − ¯X) 2 = 1000, se elegiría la segunda muestra porque la precisiónal estimar los parámetros sería mayor.9. Los residuos mínimo-cuadrático ordinarios <strong>de</strong> una regresión <strong>de</strong> Y sobre la variableexplicativa X son ortogonales a X, pero no lo son a Y.10. En un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal simple no existe ninguna relación entre el estimadorMCO <strong>de</strong> la pendiente <strong>de</strong> la regresión ˆβ y el coeficiente <strong>de</strong> correlación simpleentre la variable <strong>de</strong>pendiente Y y la variable in<strong>de</strong>pendiente X, r XY .11. Si existe la siguiente relación entre las variables X, Y, Z:r 2 XY = 0,8 r2 XZ = 0,001 r2 Y Z = 0,001po<strong>de</strong>mos concluir que el coeficiente rXY 2 es una mala medida <strong>de</strong> la correlación entrelas variables X e Y y se <strong>de</strong>bería utilizar rXY.Z 2 .12. La inexistencia <strong>de</strong> normalidad en las perturbaciones aleatorias no afecta a los contrastes<strong>de</strong> hipótesis.143


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.22Un economista estima el siguiente mo<strong><strong>de</strong>l</strong>o:Y t = β 1 + β 2 X 2t + β 3 X 3t + u t t = 1, . . . , 36 u t ∼ N(0, σ 2 ) (5.37)Obteniendo los siguientes resultados:Ŷ t = 0, 98 + 1, 33 X 2t + 0, 78 X 3t R 2 = 0, 989(estadístico t)(0,27) (0,98)1. ¿Te parece que el mo<strong><strong>de</strong>l</strong>o pue<strong>de</strong> tener algún problema? ¿Cuál? ¿En qué basas tusrespuestas?2. ¿Cómo cambiarían tus conclusiones si en la estimación anterior el coeficiente <strong>de</strong><strong>de</strong>terminación hubiera sido R 2 = 0, 12?Ejercicio 5.23Sea el mo<strong><strong>de</strong>l</strong>o:Y t = β 1 + β 2 X 2t + β 3 X 3t + u t u t ∼ NID(0, 1) (5.38)<strong>de</strong> la regresión auxiliar <strong>de</strong> X 2 sobre X 3 se obtiene:ˆX 2t = 0, 5 + 1, 1875X 3t (5.39)y a<strong>de</strong>más sabemos que ∑ (X 2t − ¯X 2 ) 2 = 25, ∑ (X 3t − ¯X 3 ) 2 = 16.1. Expresa la varianza <strong><strong>de</strong>l</strong> estimador MCO <strong>de</strong> β 2 en función <strong><strong>de</strong>l</strong> coeficiente <strong>de</strong> correlaciónmuestral entre las variables X 2 y X 3 .2. Calcula el coeficiente <strong>de</strong> correlación muestral entre X 2 y X 3 .3. ¿Pue<strong>de</strong> surgir algún problema en la estimación por mínimos cuadrados ordinarios<strong>de</strong> los parámetros β 1 , β 2 y β 3 ? Razona tu respuesta.4. ¿Cómo cambia tu respuesta al apartado 3) si <strong>de</strong> la regresión auxiliar se obtuvieraˆX 2t = 0, 5 + 0, 125X 3t ?Ejercicio 5.24En el mo<strong><strong>de</strong>l</strong>o:Y t = α + βX t + γZ t + u t u t ∼ N(0, σ 2 ) (5.40)surgen los mismos problemas si X t + Z t = 5 que si β + γ = 5, ¿cierto o falso? ¿Por qué?144


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.25Sea Y t = β 0 + β 1 X 1t + β 2 X 2t + β 3 X 3t + u t con X 1t = X 2t − 1.1. Propón un mo<strong><strong>de</strong>l</strong>o estimable si a<strong>de</strong>más se conoce que β 1 = 1.2. ¿Y si se conoce que X 1t = 1 ∀t?Ejercicio 5.26Sea el mo<strong><strong>de</strong>l</strong>o correcto <strong>de</strong> regresión lineal:Y t = β 1 + β 2 X 2t + β 3 X 3t + u t u t ∼ N(0, σ 2 ) (5.41)mientras que se estima el mo<strong><strong>de</strong>l</strong>o:Y t = β1 ⋆ + β2X ⋆ 2t + v t (5.42)1. ¿es ˆβ⋆2 insesgado?2. ¿es ˆσ v 2 insesgado?3. ¿es válido el estadístico t para contrastar la hipótesis H 0 : β2 ⋆ = 0?Ejercicio 5.27Si el verda<strong>de</strong>ro mo<strong><strong>de</strong>l</strong>o es:Y t = β 1 + β 2 X 2t + u t u t ∼ N(0, σ 2 ) (5.43)y se estima:Y t = β1 ⋆ + β2X ⋆ 2t + β3X ⋆ 3t + v t v t ∼ N(0, σ 2 ) (5.44)1. Comenta la siguiente afirmación: “ ˆβ 3 ⋆ es siempre cero in<strong>de</strong>pendientemente <strong>de</strong> lamuestra utilizada”.2. ¿es ˆβ⋆3 insesgado?3. ¿es ˆσ v 2 insesgado?4. ¿es válido el estadístico t para contrastar la hipótesis H 0 : β3 ⋆ = 0?145


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.28En un estudio sobre el número <strong>de</strong> siniestros automovilísticos <strong>de</strong>clarados se han obtenidolos siguientes resultados estimando por MCO:Y ahora proponemos el mo<strong><strong>de</strong>l</strong>o alternativo:don<strong>de</strong>Ŷ i = 40, 5 + 10, 5D 1i + 0, 4X i (5.45)Y i = αD 2i + α ⋆ D 1i + βX i + u i (5.46){ 1 si usa el automóvil para trabajarD 1i ={0 en caso contrario1 si no usa el automóvil para trabajarD 2i =0 en caso contrarioExplica y halla los valores numéricos <strong>de</strong> α, α ⋆ y β en (5.46) con la información facilitadapor (5.45).Ejercicio 5.29Supongamos que queremos analizar los salarios <strong>de</strong> una famosa empresa auditora y paraello hemos tomado una muestra <strong>de</strong> 500 empleados, <strong>de</strong> los cuales 300 son licenciados enCiencias Actuariales. Se postula el siguiente mo<strong><strong>de</strong>l</strong>o:W i = α + βD i + u i i = 1, 2, . . . , 500don<strong>de</strong> W i es el salario <strong><strong>de</strong>l</strong> empleado i-ésimo y D i es una variable ficticia que toma elvalor 1 si el empleado es licenciado y 0 en el caso contrario.Si el salario medio muestral <strong>de</strong> los licenciados es <strong>de</strong> 250.000 pts. al mes, y el salariomedio muestral <strong>de</strong> los que no son licenciados es 150.000 pts.:1. Calcula ˆα MCO y ˆβ MCO .2. ¿Cómo contrastarías si existe diferencia salarial entre los licenciados y los que nolo son?3. Si a<strong>de</strong>más en esta muestra dispones <strong>de</strong> información sobre el sexo <strong><strong>de</strong>l</strong> empleado i-ésimo¿cómo contrastarías la hipótesis <strong>de</strong> que no existe en esta empresa discriminaciónsalarial por razones <strong>de</strong> sexo?146


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEuropaResto <strong><strong>de</strong>l</strong> MundoPrima pagada Renta Prima pagada Renta150 8.000 130 5.000180 11.000 100 3.000120 9.000 110 6.000160 12.000 140 10.000Tabla 5.2: observaciones muestrales <strong>de</strong> la prima pagada y rentaEjercicio 5.30En una muestra <strong>de</strong> 8 observaciones se quiere estudiar la <strong>de</strong>pen<strong>de</strong>ncia <strong><strong>de</strong>l</strong> precio <strong>de</strong> unaprima <strong>de</strong> seguro obligatorio <strong>de</strong> automóvil respecto <strong>de</strong> la renta <strong><strong>de</strong>l</strong> propietario y su país<strong>de</strong> matriculación, distinguiendo entre vehículos matriculados en Europa o el resto <strong><strong>de</strong>l</strong>mundo. Las observaciones se muestran en la Tabla 5.2.1. Estima el mo<strong><strong>de</strong>l</strong>o que exprese dicha <strong>de</strong>pen<strong>de</strong>ncia. Interpreta los coeficientes <strong><strong>de</strong>l</strong>mo<strong><strong>de</strong>l</strong>o.2. Contrasta las siguientes hipótesis:a) La renta no es una variable significativa.b) El país <strong>de</strong> matriculación no es una variable significativa.Ejercicio 5.31Un investigador quiere analizar la inversión (I i ) realizada en planes <strong>de</strong> pensiones en laComunidad Autónoma Vasca en función <strong><strong>de</strong>l</strong> salario percibido (W i ) y el sector, privado opúblico, en el que se trabaja. Con una muestra <strong>de</strong> 500 individuos, <strong>de</strong> los cuales la mitadtrabaja en el sector público, se ha estimado por MCO el siguiente mo<strong><strong>de</strong>l</strong>o:Î i(t − est)= 2, 7 + 0, 31P U i + 0, 47W i R 2 = 0, 71 (5.47)(0, 22)(3, 7)don<strong>de</strong> P U i toma valor 1 si el individuo i-ésimo trabaja en el sector público y cero encaso contrario.1. Deriva los estimadores utilizados en la estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.47).2. Interpreta los coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.3. Contrasta la significatividad individual <strong>de</strong> las variables explicativas.4. Dados los resultados <strong>de</strong> los contrastes, ¿qué propieda<strong>de</strong>s tienen los estimadores <strong><strong>de</strong>l</strong>os coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.47)? ¿por qué?147


Estadística Actuarial: Análisis <strong>de</strong> RegresiónMás tar<strong>de</strong>, el investigador sospecha que la variable sexo pue<strong>de</strong> afectar al incremento <strong><strong>de</strong>l</strong>a inversión media ante aumentos unitarios en el salario. Con este objetivo estima lossiguientes mo<strong><strong>de</strong>l</strong>os:Î i(t − est)= 3, 87 + 2, 28P U i + 0, 63W i + 0, 21W i S i R 2 = 0, 82 (5.48)(13, 8)(7, 26)(17, 4)Î i(t − est)= 4, 7 + 0, 32W i + 0, 15W i S i R 2 = 0, 75 (5.49)(5, 82)(1, 87)don<strong>de</strong> S i toma valor 1 si el individuo i-ésimo es hombre y cero en caso contrario.5. Dadas las regresiones (5.47), (5.48) y (5.49), selecciona la especificación más a<strong>de</strong>cuadapara analizar la inversión en los planes <strong>de</strong> pensiones. Razona <strong>de</strong>talladamentetu proceso <strong>de</strong> selección.6. ¿Qué suce<strong>de</strong>ría en la estimación <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os (5.48) y (5.49) si la muestra estuvieracompuesta sólo por hombres?7. Suponiendo que eliges el mo<strong><strong>de</strong>l</strong>o (5.49) ¿qué propieda<strong>de</strong>s tienen los estimadores?Ejercicio 5.32Para analizar la relación entre los gastos <strong>de</strong> consumo, C, el ingreso disponible, Y, y elsexo <strong><strong>de</strong>l</strong> cabeza <strong>de</strong> familia se han estimado, con T=12, cuatro mo<strong><strong>de</strong>l</strong>os cuyos resultadoshan sido:a) Ĉ t = 1663, 6 + 0, 75 Y t R 2 = 0, 978(21,12)b) Ĉ t = 186, 12 + 0, 82 Y t + 832, 09D t R 2 = 0, 984(16,56) (1,82)c) Ĉ t = 709, 18 + 0, 79 Y t + 0, 05 Y t D t R 2 = 0, 983(18,11) (1,51)d) Ĉ t = −184, 7 + 0, 83 Y t + 1757, 99D t − 0, 06 Y t D t R 2 = 0, 985(13,65) (1,03) (-0,57)don<strong>de</strong> D t es una variable ficticia que toma el valor 1 si el cabeza <strong>de</strong> familia es mujer y0 en caso contrario. Entre paréntesis aparecen los estadísticos t muestrales:1. Interpreta los coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o d).2. Contrasta si el término constante es diferente según sea el sexo <strong><strong>de</strong>l</strong> cabeza <strong>de</strong> familia.3. Contrasta si el coeficiente asociado a Y es diferente según sea el sexo <strong><strong>de</strong>l</strong> cabeza <strong>de</strong>familia.4. Contrasta si tanto el coeficiente asociado a Y como el término constante son diferentessegún sea el sexo <strong><strong>de</strong>l</strong> cabeza <strong>de</strong> familia.5. ¿Cuál es el mo<strong><strong>de</strong>l</strong>o que mejor se ajusta a los datos?148


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.33Se quiere estudiar cómo influye el nivel <strong>de</strong> educación en los salarios (Y ) percibidos porlos trabajadores <strong>de</strong> una empresa. En la empresa hay 100 empleados, <strong>de</strong> los cuales 6 notienen estudios, 38 tienen únicamente estudios primarios, 15 tienen estudios universitariosy el resto se incorporó a la empresa tras finalizar sus estudios secundarios. Paraintroducir el nivel <strong>de</strong> estudios en el mo<strong><strong>de</strong>l</strong>o se <strong>de</strong>finen las siguientes variables ficticias:{ 1 si i tiene al menos estudios primariosP i =0 en caso contrario{ 1 si i tiene al menos estudios secundariosS i =0 en caso contrario{ 1 si i tiene al menos estudios universitariosU i =0 en caso contrarioDe modo que para un empleado que, por ejemplo, no haya realizado estudios primariosP i = 0,S i = 0 y U i = 0 y para un universitario P i = 1, S i = 1 y U i = 1.1. ¿Es estimable el mo<strong><strong>de</strong>l</strong>o Y i = β 1 + β 2 P i + β 3 S i + β 4 U i + V i , con V i ∼ NID(0, σ 2 )?Razona la respuesta. En caso <strong>de</strong> que no sea estimable, propón uno similar que sí losea.2. Interpreta los parámetros β 1 y β 4 en el mo<strong><strong>de</strong>l</strong>o anterior, o en el mo<strong><strong>de</strong>l</strong>o estimablepropuesto.3. Plantea un contraste para la hipótesis <strong>de</strong> que tener estudios primarios no afecta alsalario que se cobra. Escribe la hipótesis nula, el estadístico <strong>de</strong> contraste y la regla<strong>de</strong> <strong>de</strong>cisión.Ejercicio 5.34Plantea el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> <strong>de</strong>terminación <strong><strong>de</strong>l</strong> salario <strong><strong>de</strong>l</strong> trabajador <strong>de</strong> la empresa A en función<strong>de</strong> sus años <strong>de</strong> experiencia, categoría profesional (empleado, técnico, directivo) y sexo(masculino, femenino).1. Escribe la función <strong>de</strong> salarios <strong>de</strong> una técnica.2. Interpreta los coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.3. Suponiendo que la empresa tiene 40 trabajadores, los cuales tienen la siguientedistribución por categorías 5 técnicas y 2 directivas, 4 directivos, 2 técnicos y elresto son empleados. Escribe la matriz <strong>de</strong> regresores.149


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 5.35Un empleado <strong>de</strong> BBK Peña opina que los pisos <strong>de</strong> Avenida Mazarredo alcanzan en lassubastas un precio consi<strong>de</strong>rablemente superior al <strong>de</strong> cualquier otra zona <strong>de</strong> Bilbao. Uncolega suyo <strong>de</strong> Lagunaro no está <strong>de</strong> acuerdo con esta afirmación, por lo que analizanlas ventas <strong>de</strong> pisos <strong>de</strong> dicha calle realizadas por sus empresas en los últimos años. Elnúmero total <strong>de</strong> pisos subastados fue <strong>de</strong> 10, <strong>de</strong> los que 4 estaban enclavados en la calleMazarredo. Ambos creen que el tamaño <strong><strong>de</strong>l</strong> piso y el precio inicial fijado en la subastason también variables <strong>de</strong>terminantes <strong><strong>de</strong>l</strong> precio finalmente alcanzado en la venta.1. Especifica un mo<strong><strong>de</strong>l</strong>o que exprese el precio final <strong>de</strong> venta <strong>de</strong> los pisos en función <strong><strong>de</strong>l</strong>os factores citados y que permita contrastar la hipótesis <strong><strong>de</strong>l</strong> empleado <strong>de</strong> BBK.2. Escribe la matriz <strong>de</strong> regresores <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o que has propuesto.3. ¿Cómo llevarías a cabo el contraste? Escribe la hipótesis nula, la hipótesis alternativa,el estadístico <strong>de</strong> contraste, su distribución y la regla <strong>de</strong> <strong>de</strong>cisión.Ejercicio 5.36Se quiere estudiar la relación entre el número <strong>de</strong> incendios forestales y la temperaturaen una comarca catalana. Para ello se utilizan datos diarios <strong>de</strong> ambas variables para elaño 1999 y se estiman los siguientes mo<strong><strong>de</strong>l</strong>os:(1) Y t = 105 + 400D t + 4, 7X t + 8, 3D t X t + û 1t ˆσ 1 2 = 14, 71(2) Y t = 205 + 43, 5X t + 9, 0D t X t + û 2t ˆσ 2 2 = 20, 15(3) Y t = 124 + 557D t + 7, 3X t + û 3t ˆσ 3 2 = 15, 14(4) Y t = 350 + 7, 7X t + û 4t ˆσ 4 2 = 27, 05{ 1 si t∈ Julio, Agosto o Septiembresiendo D t =0 en caso contrario1. Interpreta los coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (1).2. El contraste <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (3) contra el (4) nos ha llevado a rechazar el mo<strong><strong>de</strong>l</strong>o (4).Efectúa los contrastes necesarios para <strong>de</strong>cidir cuál es el mo<strong><strong>de</strong>l</strong>o al que mejor seajustan los datos.Ejercicio 5.37Se han utilizado datos trimestrales para estimar la función:C t = α + β 1 D 1t + β 2 D 2t + β 3 D 3t + β 4 D 4t + u t (5.50){ 1 si t pertenece al i-ésimo trimestredon<strong>de</strong>: D it =0 en caso contrario150


Estadística Actuarial: Análisis <strong>de</strong> Regresión1. Indica qué parámetros son estimables y cuáles no, razonando la respuesta. ¿Y si seimpone la restricción ∑ β i = 0?2. Un investigador impone la restricción α = 0 y otro impone la restricción β 4 = 0.¿Serán las estimaciones <strong>de</strong> β i diferentes en ambos casos? ¿por qué?Ejercicio 5.38Para estudiar las ventas <strong>de</strong> un <strong>de</strong>terminado mo<strong><strong>de</strong>l</strong>o <strong>de</strong> moto se especifica el siguientemo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal:Y t = β 0 + β 1 S 1t + β 2 S 2t + β 3 S 3t + β 4 X t + u t (5.51){ 1 si t ∈ trimestre i-ésimodon<strong>de</strong> S it =0 en caso contrario1. Explica qué tipo <strong>de</strong> comportamiento refleja esta regresión e interpreta cada uno <strong><strong>de</strong>l</strong>os coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.2. ¿Existe alguna forma alternativa <strong>de</strong> especificar el comportamiento reflejado por elmo<strong><strong>de</strong>l</strong>o anterior? Escribe la ecuación correspondiente e interpreta sus parámetros.3. Encuentra la relación entre los parámetros <strong>de</strong> la ecuación (5.51) y los <strong>de</strong> la ecuaciónpropuesta en el apartado anterior.4. Los resultados obtenidos <strong>de</strong> estimar el mo<strong><strong>de</strong>l</strong>o (5.51) con 16 observaciones trimestraleshan sido:Ŷ t = 0, 07 + 0, 43 S 1t + 6, 55 S 2t − 2, 83 S 3t − 0, 9 X t R 2 = 0, 68 (5.52)(3,7) (3,37) (3,4) (-3,37) (-0,27)A la vista <strong>de</strong> los resultados ¿se pue<strong>de</strong> concluir que la variable Y t presenta un comportamientoestacional?Ejercicio 5.39El dueño <strong>de</strong> una ca<strong>de</strong>na <strong>de</strong> cines en una ciudad costera preten<strong>de</strong> saber cómo influyenen el número <strong>de</strong> espectadores <strong>de</strong> sus salas , N (miles), dos factores: el empleo existenteen la ciudad, E (cientos <strong>de</strong> miles), y el número <strong>de</strong> otros espectáculos que se programen,O (miles). Propone el siguiente mo<strong><strong>de</strong>l</strong>oN t = α 0 + α 1 E t + α 2 O t + u t u t ∼ NID(0, σ 2 ) (5.53)Dispone <strong>de</strong> información trimestral relativa a las tres variables que va <strong>de</strong>s<strong>de</strong> el primertrimestre <strong>de</strong> 1985 hasta el primer trimestre <strong>de</strong> 2002, ambos inclusive. El resumen <strong>de</strong>dicha información aparece a continuación:⎡(X ′ X) −1 = ⎣1,5334 −0,2122 0,007340,0320 −0,003790,00329⎤⎦∑Nt = 2279, 4∑Nt E t = 16838,6∑Nt O t = 14193,8∑ (Nt − ¯N) 2 = 2435151


Estadística Actuarial: Análisis <strong>de</strong> Regresióna) Estima el mo<strong><strong>de</strong>l</strong>o propuesto por el método <strong>de</strong> mínimos cuadrados ordinarios.b) Calcula una medida <strong>de</strong> la bondad <strong><strong>de</strong>l</strong> ajuste e interprétala.c) Estima la matriz <strong>de</strong> varianzas y covarianzas <strong><strong>de</strong>l</strong> estimador <strong>de</strong> los coeficientes.d) ¿Son las variables explicativas conjuntamente significativas?e) Contrasta al nivel <strong>de</strong> significación <strong><strong>de</strong>l</strong> 5 % que la programación <strong>de</strong> otros espectáculostiene influencia sobre el número <strong>de</strong> espectadores en las salas <strong>de</strong> cine.f) Para po<strong>de</strong>r planificar la próxima campaña, el dueño hace el supuesto <strong>de</strong> que va atener 34.500 espectadores, dado que el número <strong>de</strong> empleos será <strong>de</strong> 754.000 y queestán previstos otros 8.800 espectáculos. Compruébalo.Analizando los resultados con un amigo suyo, observan una pauta <strong>de</strong> comportamientodiferente en los distintos trimestres. Por ello, piensan que no ha tenido en cuenta quela época <strong><strong>de</strong>l</strong> año marca también la asistencia al cine, <strong>de</strong>bido a que se va menos cuandohace mejor tiempo. Nuestro hombre <strong>de</strong>ci<strong>de</strong> incluir este factor.g) Define las variables que creas necesarias para tener en cuenta este factor y propónun mo<strong><strong>de</strong>l</strong>o que incluya el posible efecto <strong>de</strong> la época <strong><strong>de</strong>l</strong> año.h) Interpreta los coeficientes <strong>de</strong> tu mo<strong><strong>de</strong>l</strong>o. ¿Cuántas <strong>de</strong> las variables que has <strong>de</strong>finidoincluyes en el mismo? ¿Por qué?A los pocos días, su amigo le plantea la siguiente duda: a su ciudad acu<strong>de</strong>n muchosturistas en verano, lo que aumenta el empleo temporal que suele cubrirse con gentejoven, en general más aficionada al cine. Si esto es cierto, la composición <strong><strong>de</strong>l</strong> empleo enverano pue<strong>de</strong> tener influencia sobre la asistencia al cine.i) ¿Cómo <strong>de</strong>finirías una variable para tener en cuenta esta interrelación? ¿Cómo laincluirías en el mo<strong><strong>de</strong>l</strong>o?En línea con lo planteado, el empresario escoge y estima tres mo<strong><strong>de</strong>l</strong>os diferentes <strong>de</strong> entretodos los posibles, con los siguientes resultados:ˆN t(ˆσ ˆβi)=ˆβ 1{ }} {23,78(2,92)ˆβ 2{ }} { { }} { { }} {+ 1,371E t − 0,317O t + 4,571D3t,(0,421)ˆβ 3(0,135)ˆβ 4(0, 658)∑69t=1û 2 t = 359,89 (5.54)ˆN t(ˆσ ˆβi)=ˆδ 0{}}{25,0(2,895)ˆδ 1{ }} { { }} { { }} {+ 1,204E t − 0,316O t + 0,624EM3 t ,(0,418)ˆδ 2(0,134)ˆδ 4(0, 088)∑69i=1û 2 t = 355,23 (5.55)ˆN t(ˆσ ˆβi)=ˆµ 0{ }} {25,43(3,404)ˆµ 1{ }} { { }} { { }} { { }} {+ 1,146E t − 0,316O t − 1,613D3 t + 0, 841EM3 t ,(0,483)ˆµ 2(0,135)ˆµ 3(6,552)ˆµ 4(0, 887)69∑i=1û 2 t = 354,90 (5.56)don<strong>de</strong>152


Estadística Actuarial: Análisis <strong>de</strong> Regresión• D3 t es una variable ficticia que toma el valor 1 en el tercer trimestre (verano) ycero en los <strong>de</strong>más casos.• EM3 t es una variable que incorpora el efecto estacional <strong><strong>de</strong>l</strong> empleo que se hadiscutido en el apartado anterior (y tendrá la interpretación que le hayas atribuidoanteriormente).j) Dados los resultados anteriores, ¿hay evi<strong>de</strong>ncia <strong>de</strong> que existe efecto estacional? Siel efecto estacional existe ¿qué forma toma?, ¿cuál <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os propuestos teparece óptimo para recogerlo?, ¿por qué? Lleva a cabo los contrastes precisos.k) A la vista <strong>de</strong> los resultados obtenidos hasta el momento ¿es correcto utilizar losvalores <strong>de</strong> los coeficientes que has obtenido en (5.53)?, ¿por qué?, ¿qué propieda<strong>de</strong>stienen?l) ¿Cómo explicas los resultados <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (5.56) a la vista <strong><strong>de</strong>l</strong> (5.54) y el (5.55)?¿Te parece lógico obtener este resultado?, ¿cuál pue<strong>de</strong> ser su causa?153


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.8. Estimación <strong><strong>de</strong>l</strong> MRLG con gretl: principales resultados, contraste<strong>de</strong> hipótesis• Estimación por Mínimos Cuadrados Ordinarios, MCO:Una vez abierto el fichero <strong>de</strong> datos con el que vamos a trabajar, vamos aMo<strong><strong>de</strong>l</strong>o → Mínimos Cuadrados OrdinariosAparecerá una ventana para especificar la parte sistemática <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o don<strong>de</strong> <strong>de</strong>bemos:Seleccionar la variable <strong>de</strong>pendiente pinchando a la izquierda sobre ella y a continuación pinchar enla <strong>de</strong>recha → la flecha azulSeleccionar las variables in<strong>de</strong>pendientes pinchando a la izquierda sobre ella-s y a continuación pincharen la <strong>de</strong>recha → la flecha ver<strong>de</strong>Para obtener los resultados <strong>de</strong> la estimación MCO pinchar en Aceptar. No pinchar en la indicaciónDesviaciones Típicas Robustas.En esta ventana aparecerán los resultados básicos <strong>de</strong> la estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Los po<strong>de</strong>mos guardarcomo texto plano <strong>de</strong> la manera habitual o como icono con Archivo → Guardar como icono.Los resultados que gretl nos <strong>de</strong>vuelve muestran entre otros estadísticos la estimación <strong>de</strong> los parámetros<strong>de</strong> la recta <strong>de</strong> ajuste, sus <strong>de</strong>sviaciones típicas y estadísticos <strong>de</strong> significatividad individual.Ejemplo 5.17Vamos a utilizar como ejemplo la estimación realizada en el Ejemplo 5.10 sobre el precio<strong>de</strong> la vivienda y los contrastes <strong>de</strong>sarrollados en el Ejemplo 5.13:P RICE i = β 1 + β 2 SQF T i + β 3 BEDRMS i + β 4 BAT HS + u i i = 1, . . . , 14Los resultados <strong>de</strong> la estimación MCO mostrados por gretl son los siguientes:Mo<strong><strong>de</strong>l</strong>o 1: MCO, usando las observaciones 1–14Variable <strong>de</strong>pendiente: priceCoeficiente Desv. Típica Estadístico t Valor pconst 129,062 88,3033 1,4616 0,1746sqft 0,154800 0,0319404 4,8465 0,0007bedrms −21,5875 27,0293 −0,7987 0,4430baths −12,1928 43,2500 −0,2819 0,7838Media <strong>de</strong> la vble. <strong>de</strong>p. 317,4929 D.T. <strong>de</strong> la vble. <strong>de</strong>p. 88,49816Suma <strong>de</strong> cuad. residuos 16700,07 D.T. <strong>de</strong> la regresión 40,86572R 2 0,835976 R 2 corregido 0,786769F (3, 10) 16,98894 Valor p (<strong>de</strong> F ) 0,000299Log-verosimilitud −69,45391 Criterio <strong>de</strong> Akaike 146,9078Criterio <strong>de</strong> Schwarz 149,4641 Hannan–Quinn 146,6712154


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEn la columna con encabezamiento Coeficiente aparece la estimación <strong><strong>de</strong>l</strong> coeficientre queacompaña a la correspondiente variable. A continuación aparece su Desviación Típica yel estadístico t <strong>de</strong> significatividad individual para el contraste H 0 : β k = 0 así como sucorrespondiente valor p.A continuación aparecen estadísticos <strong>de</strong> interés como pue<strong>de</strong>n ser la media <strong>de</strong> la variable<strong>de</strong>pendiente, R 2 o ¯R 2 entre otros. La fila: F (3, 10) = 16,98894; Valor p (<strong>de</strong> F ) = 0,000299se correspon<strong>de</strong> con el valor muestral <strong><strong>de</strong>l</strong> estadístico F para el contraste <strong>de</strong> significatividadconjunto y su correspondiente valor-p. A continuación aparecen los estadísticos <strong>de</strong>Akaike, Schwarz y Hannan-Quinn para la selección <strong>de</strong> mo<strong><strong>de</strong>l</strong>os.En la pestaña Contrastes que aparece en la pantalla <strong>de</strong> resultados <strong>de</strong> la regresión po<strong>de</strong>mos Omitir uañadir variables, sumar los coeficientes y contrastar combinaciones lineales o restricciones linealesa<strong>de</strong>más podremos realizar contrastes sobre los residuos, <strong>de</strong> los cuales nos ocuparemos en el últimotema <strong><strong>de</strong>l</strong> curso.Ejemplo 5.18Por ejemplo para contrastar:H 0 : β 3 = β 4 versus H a : β 3 ≠ β 4cuyo estadístico <strong>de</strong> contraste y distribución asociada son:ˆβ 3 −√ˆβ 4ˆσ 2ˆβ3 + ˆσ 2ˆβ4 − 2 × Ĉov( ˆβ 3 , ˆβ∼ t N−44 )en la pestaña Contrastes seleccionamos Restricciones lineales y escribimos b3-b4=0 ygretl nos <strong>de</strong>vuelve el siguiente resultado:Restricción:b[bedrms] - b[baths] = 0Estadístico <strong>de</strong> contraste: F(1, 10) = 0,0266334, con valor p = 0,873614 luego no serechaza la hipótesis nula para α %.A<strong>de</strong>más nos proporciona las estimaciones restringidas:Coeficiente Desv. Típica Estadístico t Valor pconst 127,736 83,9482 1,522 0,1563sqft 0,157407 0,0264067 5,961 9,44e-05 ***bedrms -18,5060 18,4649 -1,002 0,3378baths -18,5060 18,4649 -1,002 0,3378Desviación típica <strong>de</strong> la regresión = 39,0158155


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEl mo<strong><strong>de</strong>l</strong>o restringido es:y su FRM esP RICE i = β 1 + β 2 SQF T i + β 3 (BEDRMS i + BAT HS) + u i i = 1, . . . , 14̂ P RICEi = 127, 736 + 0, 1574 SQF T i − 18, 5060 (BEDRMS i + BAT HS i )En la pantalla <strong>de</strong> resultados <strong>de</strong> la estimación aparecen en la barra <strong>de</strong> menú otros estadísticos oresultados que pue<strong>de</strong>n ser <strong>de</strong> interés, por ejemplo:• Po<strong>de</strong>mos hacer gráficos <strong>de</strong> interés: En la opción Gráficos po<strong>de</strong>mos hacer gráficos que nosayudan a interpretar los resultados <strong>de</strong> la estimación, por ejemploGráficos → Gráfico <strong>de</strong> la variable estimada y observadaGráficos → Gráfico <strong>de</strong> residuos → contra alguna <strong>de</strong> las variables explicativas <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o• En la pestaña Guardar po<strong>de</strong>mos guardar variables como los residuos, los residuos al cuadrado,la suma <strong>de</strong> cuadrados residual y el coeficiente <strong>de</strong> <strong>de</strong>terminación entre otros.• En la pestaña Análisis nos muestra las estimaciones <strong>de</strong> la variable endógena, los intervalos<strong>de</strong> confianza <strong>de</strong> los coeficientes y la matriz <strong>de</strong> varianzas y covarianzas entre otros resultados.Para ver y guardar los valores <strong>de</strong> Ŷ , û y otros resultados <strong>de</strong> utilidad:- Ver los valores: Pinchar en Análisis → Mostrar variable y seleccionar observada, estimadao residuos según nuestro interés.- Guardar los valores: Pinchar en Guardar → seleccionar la variable <strong>de</strong> interés.Gretl utiliza por <strong>de</strong>fecto la <strong>de</strong>nominación yhat, uhat para <strong>de</strong>signar a la variable endógenaestimada y a los residuos, respectivamente y en la <strong>de</strong>scripción <strong>de</strong> la variable indicará porejemplo para uhat: residuos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o 1, don<strong>de</strong> el valor 1 indica que correspon<strong>de</strong> con el primermo<strong><strong>de</strong>l</strong>o estimado, esto resulta muy útil pues en general trabajaremos con varios mo<strong><strong>de</strong>l</strong>os a lavez y hay que distinguir claramente las variables <strong>de</strong> cada uno.Ejemplo 5.19La matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> los coeficientes estimados es:Matriz <strong>de</strong> covarianzas <strong>de</strong> los coeficientesconst sqft bedrms baths7797,5 0,67089 −1677,1 −1209,4 const0,0010202 −0,075461 −0,99507 sqft730,58 −356,40 bedrms1870,6 bathsLos intervalos <strong>de</strong> confianza <strong>de</strong> los coeficientes son:t(10, 0, 025) = 2, 228156


Estadística Actuarial: Análisis <strong>de</strong> RegresiónVariable Coeficiente Intervalo <strong>de</strong> confianza 95 %const 129,062 −67,6903 325,814sqft 0,154800 0,0836321 0,225968bedrms −21,5875 −81,8126 38,6376baths −12,1928 −108,560 84,17425.8.1. Tratamiento <strong>de</strong> las variables ficticias en gretl.Gretl permite trabajar tanto con variables ficticias cuantitativas como cualitativas y su tratamientono difiere, solo <strong>de</strong>bemos <strong>de</strong> ocuparnos <strong>de</strong> especificar correctamente el mo<strong><strong>de</strong>l</strong>o. En el caso <strong>de</strong> que lavariable ficticia no esté construida gretl permite hacerlo. En la pantalla inicial en Añadir po<strong>de</strong>mosañadir Variables ficticias periódicas que se ajustarán lógicamente a la periodicidad muestral <strong><strong>de</strong>l</strong>conjunto <strong>de</strong> datos, Variables ficticias para las variables discretas seleccionadas don<strong>de</strong> por ejemplo sitenemos una variable que toma valores 1, 2 y 3 podremos construir tres variables ficticias tal como{ 1 si la variable toma valor 1D 1 =0 en caso contrario{ 1 si la variable toma valor 2D 2 =0 en caso contrario{ 1 si la variable toma valor 3D 3 =0 en caso contrarioPor supuesto también podremos introducirlas con el editor tal y como se aprendió en el Tema 4.Veamos un ejemplo aplicado. Abrimos el fichero <strong>de</strong> datos data7-3 <strong>de</strong> Ramanathan, que contienedatos para 14 viviendas sobre el precio <strong>de</strong> venta <strong>de</strong> la vivienda (PRICE), pies cuadrados habitables(SQFT), número <strong>de</strong> habitaciones (BEDRMS) y número <strong>de</strong> baños (BATHS), y una variable ficticiaque toma el valor 1 si la vivienda tiene piscina y 0 en caso contrario (POOL), una variable ficticiaque toma el valor 1 si la vivienda tiene sala <strong>de</strong> estar y 0 en caso contrario (FAMROOM) y unavariable ficticia que toma el valor 1 si la vivienda tiene chimenea y 0 en caso contrario (FIREPL).Seleccionamos las variables PRICE y POOL y observamos los valores <strong>de</strong> estas dos variables:Obs price pool1 199,9 12 228,0 03 235,0 14 285,0 05 239,0 06 293,0 07 285,0 08 365,0 19 295,0 010 290,0 011 385,0 1157


Estadística Actuarial: Análisis <strong>de</strong> Regresión12 505,0 113 425,0 014 415,0 0Por ejemplo, la primera vivienda <strong>de</strong> la muestra tiene un precio <strong>de</strong> 199.900 dólares y tiene piscina(ya que la variable POOL toma el valor 1), mientras que la segunda no tiene piscina (la variablePOOL toma el valor 0) y su precio <strong>de</strong> venta es <strong>de</strong> 228.000 dólares, etc.Con los datos anteriores po<strong>de</strong>mos obtener fácilmente que el precio medio <strong>de</strong> la vivienda es 317.493dólares:Estadísticos principales, usando las observaciones 1 - 14para la variable price (14 observaciones válidas)Media Mediana Mínimo Máximo317, 49 291, 50 199, 90 505, 00Desv. Típ. C.V. Asimetría Exc. <strong>de</strong> curtosis88, 498 0, 27874 0, 65346 −0, 52983Sin embargo, también es posible obtener el precio medio para las viviendas que tienen piscina, porun lado, y para las que no la tienen, por otro. Para ello, en primer, lugar se selecciona el precio paraaquellas viviendas con piscina. Seleccionamos la variable PRICE, pinchamos en Muestra → Definira partir <strong>de</strong> v. ficticia..., seleccionamos la variable POOL y aceptamos.De esta forma hemos seleccionado el precio para aquellas viviendas que tienen piscina 18 . A continuación,se obtienen los estadísticos principales:Estadísticos principales, usando las observaciones 1 - 5para la variable price (5 observaciones válidas)Media Mediana Mínimo Máximo337, 98 365, 00 199, 90 505, 00Desv. Típ. C.V. Asimetría Exc. <strong>de</strong> curtosis122, 99 0, 36390 0, 15896 −1, 2798Para seleccionar el precio <strong>de</strong> las viviendas que no tienen piscina, pinchamos en Muestra → Restringira partir <strong>de</strong> criterio, introducimos la condición P OOL = 0 y aceptamos. Los estadísticos principalesson los siguientes:Estadísticos principales, usando las observaciones 1 - 9para la variable price (9 observaciones válidas)18 Para restablecer el tamaño muestral inicial pinchar en Muestra → Recuperar el rango completo.158


Estadística Actuarial: Análisis <strong>de</strong> RegresiónMedia Mediana Mínimo Máximo306, 11 290, 00 228, 00 425, 00Desv. Típ. C.V. Asimetría Exc. <strong>de</strong> curtosis68, 959 0, 225275 0, 87575 −0, 52255Por tanto, el precio medio <strong>de</strong> las viviendas con piscina es <strong>de</strong> 337.980 dólares frente a los 306.111 <strong><strong>de</strong>l</strong>as viviendas sin piscina. Dado el mo<strong><strong>de</strong>l</strong>o una vivienda con piscina es en promedio 31.869 dólares máscara que la que no tiene piscina. Notar que no se están teniendo en cuenta otros factores que pue<strong>de</strong>nafectar al precio <strong>de</strong> la vivienda (número <strong>de</strong> pies cuadrados habitables, número <strong>de</strong> habitaciones, etc.).El sencillo análisis anterior po<strong>de</strong>mos realizarlo mediante un análisis <strong>de</strong> regresión. Po<strong>de</strong>mos especificarun mo<strong><strong>de</strong>l</strong>o econométrico utilizando la variable ficticia POOL como regresor, estimarlo, hacerinferencia e ir incorporando otras características que pue<strong>de</strong>n afectar a los precios <strong>de</strong> las viviendas.Para comenzar, consi<strong>de</strong>ramos el siguiente mo<strong><strong>de</strong>l</strong>o:P RICE i = α 1 + α 2 P OOL i + u i i = 1, . . . , 14 (5.57)don<strong>de</strong>• α 1 : precio medio <strong>de</strong> una vivienda sin piscina.• α 1 + α 2 : precio medio <strong>de</strong> una vivienda con piscina.• α 2 : diferencia en el precio medio <strong>de</strong> una vivienda con piscina con respecto a una que no latiene.Los resultados <strong>de</strong> estimar el mo<strong><strong>de</strong>l</strong>o por Mínimos Cuadrados Ordinarios utilizando gretl obtenemosque las estimaciones <strong>de</strong> los coeficientes son las siguientes:Mo<strong><strong>de</strong>l</strong>o 1: estimaciones MCO utilizando las 14 observaciones 1–14Variable <strong>de</strong>pendiente: priceVariable Coeficiente Desv. típica Estadístico t valor pconst 306,111 30,2077 10,1335 0,0000pool 31,8689 50,5471 0,6305 0,5402Media <strong>de</strong> la var. <strong>de</strong>pendiente 317,493D.T. <strong>de</strong> la variable <strong>de</strong>pendiente 88,4982Suma <strong>de</strong> cuadrados <strong>de</strong> los residuos 98550,5Desviación típica <strong>de</strong> los residuos (ˆσ) 90,6231R 2 0,0320632¯R 2 corregido −0,0485982Grados <strong>de</strong> libertad 12Log-verosimilitud −81,880Criterio <strong>de</strong> información <strong>de</strong> Akaike 167,760Criterio <strong>de</strong> información Bayesiano <strong>de</strong> Schwarz 169,038159


Estadística Actuarial: Análisis <strong>de</strong> Regresión̂ P RICE i = 306, 111(10,13)+ 31, 869P OOL i i = 1, . . . , 14(0,63)Para contrastar en el mo<strong><strong>de</strong>l</strong>o (5.57) si hay diferencias significativas en el precio medio <strong>de</strong> la viviendaentre aquéllas que tienen piscina y las que no, la hipótesis <strong>de</strong> contraste es H 0 : α 2 = 0. Estecontraste se pue<strong>de</strong> realizar utilizando el estadístico t habitual cuyo p-valor es 0,5405, por lo que nose rechaza la hipótesis nula para un nivel <strong>de</strong> significación <strong><strong>de</strong>l</strong> 5 %, es <strong>de</strong>cir, el precio medio <strong>de</strong> lavivienda no es significativamente diferente por el hecho <strong>de</strong> tener piscina. Alternativamente, se pue<strong>de</strong>realizar el contraste utilizando el estadístico F basado en las sumas <strong>de</strong> cuadrados <strong>de</strong> los residuossiendo en este caso el mo<strong><strong>de</strong>l</strong>o (5.57) el mo<strong><strong>de</strong>l</strong>o no restringido mientras que el mo<strong><strong>de</strong>l</strong>o restringido esP RICE i = α 1 + u i i = 1, . . . , 14.Supongamos que ampliamos el mo<strong><strong>de</strong>l</strong>o (5.57) incorporando regresores que podrían explicar el precio<strong>de</strong> la vivienda como: el hecho <strong>de</strong> que la vivienda tenga sala <strong>de</strong> estar o no, el hecho que tengachimenea o no, su superficie, el número <strong>de</strong> habitaciones y el número <strong>de</strong> baños. Las dos primeras sonvariables ficticias que pue<strong>de</strong>n <strong>de</strong>finirse así:{ 1 si la vivienda i-ésima tiene chimeneaF IREP L i ={0 en caso contrario1 si la vivienda i-ésima tiene sala <strong>de</strong> estarF AMROOM i =0 en caso contrarioMientras que la superficie, el número <strong>de</strong> baños y el número <strong>de</strong> habitaciones se <strong>de</strong>finen como en lostemas anteriores:SQF T i tamaño <strong>de</strong> la vivienda i-ésima en pies cuadradosBEDRMS número <strong>de</strong> habitaciones <strong>de</strong> la vivienda i-ésimaBAT HS número <strong>de</strong> cuartos <strong>de</strong> baño <strong>de</strong> la vivienda i-ésimaCon todas ellas po<strong>de</strong>mos especificar el siguiente mo<strong><strong>de</strong>l</strong>o para explicar el precio <strong>de</strong> la vivienda:P RICE i = γ 1 + γ 2 P OOL i + γ 3 F AMROOM i + γ 4 F IREP L i+β 1 SQF T i + β 2 BEDRMS i + β 3 BAT HS i + u i i = 1, . . . , 14 (5.58)Don<strong>de</strong> lo primero a notar es que en el mo<strong><strong>de</strong>l</strong>o (5.58), afectando a la or<strong>de</strong>nada, conviven tres conjuntos<strong>de</strong> variables ficticias con dos categorías cada una, el hecho <strong>de</strong> tener o no piscina, el hecho <strong>de</strong> tenero no chimenea y el hecho <strong>de</strong> tener o no sala <strong>de</strong> estar, <strong>de</strong> las cuales sólo se incluye una <strong>de</strong> cadaconjunto y se mantiene el término in<strong>de</strong>pendiente. Esta forma <strong>de</strong> <strong>de</strong>finir el mo<strong><strong>de</strong>l</strong>o es muy cómodaya que sigue manteniendo los resultados <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os con término in<strong>de</strong>pendiente y permite unafácil interpretación <strong>de</strong> los coeficientes que acompañan a las variables ficticias. Así, γ i i = 2, 3, 4recogen el diferencial en el valor esperado <strong>de</strong> una vivienda por el hecho <strong>de</strong> poseer la característicacorrespondiente manteniéndose constante el resto <strong>de</strong> variables. El resultado <strong>de</strong> la estimación es:160


Estadística Actuarial: Análisis <strong>de</strong> RegresiónMo<strong><strong>de</strong>l</strong>o 1: estimaciones MCO utilizando las 14 observaciones 1–14Variable <strong>de</strong>pendiente: priceVariable Coeficiente Desv. típica Estadístico t valor pconst 39,0571 89,5397 0,4362 0,6758pool 53,1958 22,0635 2,4110 0,0467famroom −21,344 42,8734 −0,4979 0,6338firepl 26,1880 53,8454 0,4864 0,6416sqft 0,146551 0,0301014 4,8686 0,0018bedrms −7,0455 28,7363 −0,2452 0,8134baths −0,263691 41,4547 −0,0064 0,9951Media <strong>de</strong> la var. <strong>de</strong>pendiente 317,493D.T. <strong>de</strong> la variable <strong>de</strong>pendiente 88,4982Suma <strong>de</strong> cuadrados <strong>de</strong> los residuos 9010,24Desviación típica <strong>de</strong> los residuos (ˆσ) 35,8773R 2 0,911504¯R 2 corregido 0,835650F (6, 7) 12,0166valor p para F () 0,00221290Log-verosimilitud −65,134Criterio <strong>de</strong> información <strong>de</strong> Akaike 144,269Criterio <strong>de</strong> información Bayesiano <strong>de</strong> Schwarz 148,743La interpretación <strong>de</strong> los coeficientes estimados es la siguiente:• ˆγ 1 = 39, 057: el precio medio estimado <strong>de</strong> las viviendas sin piscina, baños, habitaciones, sala<strong>de</strong> estar ni chimenea y con 0 pies cuadrados habitables es <strong>de</strong> 39.057 dólares.• ˆγ 2 = 53, 1958: la diferencia estimada en el precio medio <strong>de</strong> las viviendas con piscina conrespecto a las que no la tienen, siendo iguales en el resto <strong>de</strong> características (pies cuadradoshabitables, habitaciones, baños, sala <strong>de</strong> estar y chimenea) es <strong>de</strong> 53.196 dólares.• ˆγ 3 = −21, 34: el precio medio estimado <strong>de</strong> una vivienda con sala <strong>de</strong> estar es 21.340 dólaresinferior al <strong>de</strong> una sin sala <strong>de</strong> estar, siendo idénticas en el resto <strong>de</strong> características. Esto se<strong>de</strong>be a que, al mantener constante el número <strong>de</strong> pies cuadrados <strong>de</strong> la vivienda y el número <strong>de</strong>habitaciones y baños, incluir una sala <strong>de</strong> estar hará que el resto <strong>de</strong> habitaciones o baños sean<strong>de</strong> menor tamaño.• ˆγ 4 = 26, 188: el precio medio estimado <strong>de</strong> una vivienda con chimenea es 26.188 dólares máscaro que el <strong>de</strong> una sin chimenea, siendo idénticas en el resto <strong>de</strong> características.• ˆβ 1 = 0, 147: el precio medio estimado <strong>de</strong> una vivienda se incrementa en 147.000 dólares alaumentar en 1 pie cuadrado habitable su superficie, permaneciendo constantes el número <strong>de</strong>baños y habitaciones.161


Estadística Actuarial: Análisis <strong>de</strong> Regresión• ˆβ 2 = −7, 046: el precio medio estimado <strong>de</strong> una vivienda disminuye en 7.046 dólares al aumentaren 1 el número <strong>de</strong> habitaciones, permaneciendo constantes el número <strong>de</strong> baños y los piescuadrados habitaciones. Esto se <strong>de</strong>be a que las habitaciones serán <strong>de</strong> menor tamaño.• ˆβ 3 = −0, 264: el precio medio estimado <strong>de</strong> una vivienda disminuye en 264 dólares al aumentaren 1 el número <strong>de</strong> baños, permaneciendo constantes el número <strong>de</strong> habitaciones y los piescuadrados habitables. De nuevo, las habitaciones serán <strong>de</strong> menor tamaño.Contraste <strong>de</strong> hipótesisPara contrastar, por ejemplo, que no existen diferencias significativas en el precio medio <strong>de</strong> lavivienda por el hecho <strong>de</strong> tener chimenea, se realiza un contraste <strong>de</strong> significatividad individual <strong><strong>de</strong>l</strong>a variable FIREPL. En este caso, observando el p-valor correspondiente, 0,6416, se pue<strong>de</strong> concluirque a un nivel <strong>de</strong> significación <strong><strong>de</strong>l</strong> 5 %, no existen diferencias significativas en el precio medio <strong>de</strong>una vivienda por el hecho <strong>de</strong> tener chimenea.Si comparamos los mo<strong><strong>de</strong>l</strong>os (5.57) y (5.58), ninguna <strong>de</strong> las variables añadidas en el último essignificativa individualmente 19 . A<strong>de</strong>más, el ¯R 2 es inferior. El contraste <strong>de</strong> significatividad conjuntapara las variables añadidas se pue<strong>de</strong> realizar con el estadístico F basado en las sumas <strong>de</strong> cuadradosresiduales <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os restringido (mo<strong><strong>de</strong>l</strong>o (5.57)) y no restringido (mo<strong><strong>de</strong>l</strong>o (5.58)). En este caso,el resultado es:Contraste <strong>de</strong> omisión <strong>de</strong> variables –Hipótesis nula: los parámetros son cero para las variablesbedrmsbathsfamroomfireplEstadístico <strong>de</strong> contraste: F (4, 7) = 0,0864517con valor p = P (F (4, 7) > 0,0864517) = 0,983881por lo que no se rechaza la hipótesis nula <strong>de</strong> que las variables añadidas al mo<strong><strong>de</strong>l</strong>o (5.58) son conjuntamenteno significativas. Al omitir dichas variables el mo<strong><strong>de</strong>l</strong>o mejora en cuanto a la significación<strong>de</strong> sus coeficientes y el ¯R2 . Por tanto, manteniendo las variables POOL y SQFT, la inclusión <strong><strong>de</strong>l</strong>resto (FIREPL, FAMROOM, BATHS, BEDRMS) no aña<strong>de</strong> capacidad explicativa al mo<strong><strong>de</strong>l</strong>o.19 Un problema añadido es que tenemos un bajo tamaño muestral, T=14, y hemos aumentado significativamente elnúmero <strong>de</strong> parámetros a estimar, K=7, por lo que tenemos muy pocos grados <strong>de</strong> libertad.162


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.9. Apéndice5.9.1. Anexo 1. Distintas expresiones <strong>de</strong> SCT, SCE y SCRSCT = ∑ (Y i − Ȳ )2 == ∑ Y 2i − NȲ 2 = Y ′ Y − NȲ 2SCE = ∑ (Ŷi − ¯Ŷ ) 2 == ∑ Ŷ 2i − N ¯Ŷ 2 == Ŷ ′ Ŷ − N ¯Ŷ 2 == (X ˆβ) ′ (X ˆβ) − N ¯Ŷ 2 == ˆβ ′ X ′ X} {{ ˆβ −NȲ 2 =}=X ′ Y= ˆβ ′ X ′ Y − N ¯Ŷ 2SCR = ∑ û 2 i = û ′ û == (Y − Ŷ )′ (Y − Ŷ ) = (Y − X ˆβ) ′ (Y − X ˆβ) == Y ′ Y − ˆβ ′ X ′ Y − Y ′ X ˆβ + ˆβ ′ X ′ X ˆβ == Y ′ Y − ˆβ ′ X ′ X ˆβ == Y ′ Y − ˆβ ′ X ′ Y5.9.2. Anexo 2. Demostración <strong>de</strong> la insesga<strong>de</strong>z <strong>de</strong> ˆσ 21. Propieda<strong>de</strong>s <strong>de</strong> los residuos MCOLos residuos MCO se pue<strong>de</strong>n escribir en función <strong>de</strong> las perturbaciones:û = Y − Ŷ == Y − X ˆβ == Y − X(X ′ X) −1 X ′ Y == [I N − X(X ′ X) −1 X ′ ]Y =Las características <strong>de</strong> la matriz M son:= [I N − X(X ′ X) −1 X ′ ](Xβ + u) == Xβ − X(X ′ X) −1 X ′ Xβ + [I N − X(X ′ X) −1 X ′ ]u == [I N − X(X ′ X) −1 X ′ ] u = Mu} {{ }=M163


• Es simétrica: M = M ′ M ′ = [I N − X(X ′ X) −1 X ′ ] ′Estadística Actuarial: Análisis <strong>de</strong> Regresión• Es i<strong>de</strong>mpotente: MM = M• rg(M)= tr(M)= N − K• M es ortogonal a X: MX = 02. Demostración: E(ˆσ 2 ) = σ 2= I ′ N − (X(X ′ X) −1 X ′ ) ′= I N − (X ′ ) ′ [(X ′ X) −1 ] ′ X ′= I N − X(X ′ X) −1 X ′= MMM = [I N − X(X ′ X) −1 X ′ ][I N − X(X ′ X) −1 X ′ ] == I N − X(X ′ X) −1 X ′ − X(X ′ X) −1 X ′ +X (X ′ X) −1 X ′ X} {{ }=I K(X ′ X) −1 X ′ == I N − X(X ′ X) −1 X ′ = Mtr(M) = tr[I N − X(X ′ X) −1 X ′ ]= tr(I N ) − tr[X(X ′ X) −1 X ′ ]= tr(I N ) − tr[(X ′ X) −1 X ′ X]= tr(I N ) − tr(I K )= N − KMX = [I N − X(X ′ X) −1 X ′ ]X= X − X(X ′ X) −1 X ′ X = 0ComoE(û ′ û) = E(u ′ Mu) == E(tr(u ′ Mu)) = E(tr(Muu ′ )) == tr(E(Muu ′ )) = tr(ME(uu ′ )) == tr(Mσ 2 I N ) == σ 2 tr(M) = σ 2 (N − K)se pue<strong>de</strong> <strong>de</strong>mostrar fácilmente que ˆσ 2 es un estimador insesgado:( ) û′ûE(ˆσ 2 ) = E= E(û′ û)N − K N − K = σ2 (N − K)N − K= σ2Y por tanto podremos utilizarlo como el estimador apropiado <strong>de</strong> la varianza <strong>de</strong> la perturbación.164


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.9.3. Anexo 3. Distribuciones que nos interesan• Distribución <strong>de</strong> la variable endógena o regresando:Y = Xβ + uE(Y ) = XβV (Y ) = E[(Y − E(Y ))(Y − E(Y )) ′ ] = E(uu ′ ) = σ 2 I NDadou ∼ N(0, σ 2 I N ) −→ Y ∼ N(Xβ, σ 2 I N )• Distribución <strong><strong>de</strong>l</strong> vector <strong>de</strong> estimadores MCO:ˆβ = (X ′ X) −1 X ′ Y = β + (X ′ X) −1 X ′ uE( ˆβ) = βV ( ˆβ) = σ 2 (X ′ X) −1Dadou ∼ N(0, σ 2 I N ) −→ ˆβ ∼ N(β, σ 2 (X ′ X) −1 )• Distribución <strong>de</strong> los residuos:û = MuE(û) = E(Mu) = ME(u) = 0V (û) = E[ûû ′ ] = E(Muu ′ M ′ ] = ME(uu ′ )M = σ 2 MDado• Distribución <strong>de</strong> la SCR:SCR = û ′ û = u ′ MuUtilizando el resultado 3 <strong><strong>de</strong>l</strong> Anexo 4 dado−→ ˆβ k ∼ N(β k , σ 2 a kk )u ∼ N(0, σ 2 I N ) −→ û ∼ N(0, σ 2 M)u ∼ N(0, σ 2 I N ) −→ u′ Muσ 2∼ χ 2 (N−K) −→ û′ ûσ 2∼ χ2 (N−K)ya que: û ∼ N(0, σ 2 M)tenemosû ′ M −1 ûσ 2= u′ MM −1 Muσ 2= u′ Muσ 2∼ χ 2 (N−k)165


Estadística Actuarial: Análisis <strong>de</strong> Regresión5.10. Bibliografía <strong><strong>de</strong>l</strong> temaReferencias bibliográficas básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editorial AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. Open Course Ware. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[2] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[3] Esteban, M.V. (2007). Estadística Actuarial: Regresión. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[4] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08. Publicaciónon-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[5] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[6] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[7] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[8] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[9] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.166


Tema 6ValidaciónEn este tema vamos a ocuparnos <strong>de</strong> validar el mo<strong><strong>de</strong>l</strong>o. Una vez especificado y estimado el mo<strong><strong>de</strong>l</strong>o<strong>de</strong> regresión lineal general y realizados los contrastes <strong>de</strong> interés el mo<strong><strong>de</strong>l</strong>o pue<strong>de</strong> ser utilizado parala predicción. Esta será más fiable cuanto mejor especificado y estimado esté el mo<strong><strong>de</strong>l</strong>o. En elTema 5 nos hemos ocupado <strong>de</strong> ver las consecuencias <strong>de</strong> omitir variables relevante e incluir variablesirrelevantes y para evitarlo utilizamos los contrastes <strong>de</strong> significatividad individual y conjunto. Eneste tema nos ocuparemos <strong>de</strong> analizar si los coeficientes <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o son constantes durante todo elperiodo muestral.Por otro lado cuando especificamos las hipótesis básicas <strong>de</strong> comportamiento, sobre la perturbaciónsupusimos que es homocedástica y no autocorrelada, en este tema estudiaremos como contrastarque efectivamente la perturbación tiene varianza constante y covarianzas cero.Para finalizar el tema veremos cómo realizar la predicción por punto y por intervalo <strong><strong>de</strong>l</strong> verda<strong>de</strong>rovalor <strong>de</strong> la variable endógena.Competencias a trabajar en estas sesiones:1. Conocer distintos procedimientos <strong>de</strong> estimación <strong>de</strong> parámetros, así como sus propieda<strong>de</strong>s parapo<strong>de</strong>r seleccionar a<strong>de</strong>cuadamente la mejor alternativa <strong>de</strong> análisis.2. Aplicar la metodología estadística a<strong>de</strong>cuada para el diseño <strong>de</strong> contrastes <strong>de</strong> hipótesis para latoma <strong>de</strong> <strong>de</strong>cisiones en el ámbito profesional.3. Analizar <strong>de</strong> forma crítica los elementos básicos <strong>de</strong> los mo<strong><strong>de</strong>l</strong>os econométricos para compren<strong>de</strong>rla lógica <strong>de</strong> la mo<strong><strong>de</strong>l</strong>ización econométrica y po<strong>de</strong>r especificar relaciones causales entre variableseconómicas.4. Aplicar la metodología econométrica básica para estimar y validar relaciones económicas enbase a la información estadística disponible sobre variables económicas y utilizando los instrumentosinformáticos apropiados.5. Obtener e interpretar los resultados <strong>de</strong> un análisis estadístico <strong>de</strong> datos económicos haciendouso <strong>de</strong> las fuentes <strong>de</strong> información apropiadas y <strong>de</strong> los instrumentos informáticos necesarios.167


Estadística Actuarial: Análisis <strong>de</strong> Regresión6. Presentar <strong>de</strong> forma clara y concisa, tanto oralmente como por escrito, las conclusiones obtenidasen un caso <strong>de</strong> estudio particular.Al final <strong>de</strong> este tema <strong>de</strong>beríais ser capaces <strong>de</strong>:1. Conocer cuando un mo<strong><strong>de</strong>l</strong>o es lineal en parámetros y/o en variables.2. Transformar un mo<strong><strong>de</strong>l</strong>o no lineal en parámetros en un mo<strong><strong>de</strong>l</strong>o estimable por MCO.3. Aplicar el contraste <strong>de</strong> Ramsey en el contexto a<strong>de</strong>cuado.4. Explicar que se entien<strong>de</strong> por un cambio estructural en un mo<strong><strong>de</strong>l</strong>o econométrico.5. Contrastar la constancia <strong>de</strong> los coeficientes <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal general.6. Explicar que se entien<strong>de</strong> por un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal con heterocedasticidad, cómomo<strong><strong>de</strong>l</strong>izar esta característica en el término <strong>de</strong> perturbación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y sus implicaciones ensu matriz <strong>de</strong> varianzas y covarianzas.7. Analizar gráficamente la posible existencia <strong>de</strong> heterocedasticidad y saber contrastarla utilizandoel estadístico <strong>de</strong> White.8. Describir las propieda<strong>de</strong>s <strong><strong>de</strong>l</strong> estimador MCO bajo heterocedasticidad.9. Explicar que se entien<strong>de</strong> por un mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal con autocorrelación, cómo mo<strong><strong>de</strong>l</strong>izaresta característica en el término <strong>de</strong> perturbación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o y sus implicaciones en su matriz<strong>de</strong> varianzas y covarianzas.10. Analizar gráficamente la posible existencia <strong>de</strong> autocorrelación y saber contrastarla utilizandoel estadístico <strong>de</strong> Durbin Watson.11. Describir las propieda<strong>de</strong>s <strong><strong>de</strong>l</strong> estimador MCO bajo autocorrelación.12. Pre<strong>de</strong>cir por punto y por intervalo el valor <strong>de</strong> la variable endógena dados los valores <strong>de</strong> lasvariables exógenas en el periodo <strong>de</strong> predicción.Bibliografía Recomendada:Al final <strong><strong>de</strong>l</strong> tema tenéis recogida la bibliografía correspondiente. En particular se os recomienda leerlos capítulos correspondientes a la bibliografía básica <strong>de</strong>tallados a continuación:• Gujarati, D. y Porter, D.C. (2010). Parte I : cap. 6;Parte II: Caps 11 y 12.• Newbold, P., Carlson, W.L. y Thorne, B. (2008). Cap. 14.• Ramanathan, R. (2002). Caps. 6, 8 y 9.• Ruiz Maya, L. y Martín Pliego, F.J. (2005). Cap. 8.• Wooldridge, J.M. (2006). Cap. 6.168


Estadística Actuarial: Análisis <strong>de</strong> Regresión6.1. Forma funcionalLa elección <strong>de</strong> la forma funcional que recoge la relación existente entre la variable <strong>de</strong>pendiente y lasvariables explicativas es un aspecto <strong>de</strong> la especificación <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o muy importante en el análisiseconómico. De hecho, la teoría económica no siempre propone relaciones lineales entre variables <strong>de</strong>interés. Es el caso, por ejemplo, <strong>de</strong> la función <strong>de</strong> consumo <strong>de</strong> un bien que aumenta con la rentapero no <strong>de</strong> forma in<strong>de</strong>finida ni a ritmo constante sino, en general, a una tasa <strong>de</strong>creciente, o <strong>de</strong> lasfunciones <strong>de</strong> costes marginales que suelen tener forma <strong>de</strong> U, veáse la Figura 6.1.ConsumoCostesFigura 6.1: Relaciones económicas no linealesEn el Tema 5 se hizo enfásis en el hecho <strong>de</strong> que el supuesto <strong>de</strong> linealidad <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresiónno implica una relación lineal entre las variables sino un mo<strong><strong>de</strong>l</strong>o en el que los parámetros entran<strong>de</strong> forma lineal. Por “lineal en los parámetros” se entien<strong>de</strong> que los parámetros no se multiplicanentre sí, no están elevados a potencias, etc. Sin embargo, como se vió en dicho tema las variables,tanto regresando como regresores, sí se pue<strong>de</strong>n transformar para obtener al final un mo<strong><strong>de</strong>l</strong>o <strong>de</strong>regresión lineal que satisfaga los supuestos clásicos. Este hecho hace que el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresiónlineal sea bastante flexible y se pueda utilizar para mo<strong><strong>de</strong>l</strong>ar relaciones entre variables económicasno lineales. Así, tanto la función <strong>de</strong> consumo como la función <strong>de</strong> costes marginales <strong>de</strong> la Figura 6.1se pue<strong>de</strong>n mo<strong><strong>de</strong>l</strong>izar utilizando formas funcionales sencillas no lineales en las variables. En el caso<strong>de</strong> la función <strong>de</strong> consumo, el supuesto <strong>de</strong> rendimientos <strong>de</strong>crecientes se pue<strong>de</strong> representar mediantemo<strong><strong>de</strong>l</strong>os logarítmicos o semilogarítmicos <strong><strong>de</strong>l</strong> tipo:ln C = α + β ln R + u (6.1)C = α + β ln R + u (6.2)y las funciones <strong>de</strong> costes totales se pue<strong>de</strong>n representar mediantes funciones polinómicas:CM = β 1 + β 2 Q + β 3 Q 2 + u (6.3)Los mo<strong><strong>de</strong>l</strong>os (6.1), (6.2) y (6.3) cumplen el supuesto <strong>de</strong> linealidad porque son lineales en los parámetrosy se pue<strong>de</strong>n analizar <strong>de</strong>ntro <strong><strong>de</strong>l</strong> marco <strong><strong>de</strong>l</strong> MRLG. Ahora bien, como no son mo<strong><strong>de</strong>l</strong>os lineales enlas variables, el efecto marginal <strong><strong>de</strong>l</strong> regresor sobre la variable <strong>de</strong>pendiente no va a ser constante. Por169


Estadística Actuarial: Análisis <strong>de</strong> Regresiónejemplo, en el mo<strong><strong>de</strong>l</strong>o (6.3), el efecto marginal <strong>de</strong> un incremento unitario <strong>de</strong> la producción sobre loscostes marginales viene dado por:∂E(CT )∂Q= β 2 + 2 β 3 QEste resultado implica que la pendiente <strong>de</strong> la función <strong>de</strong> costes marginales no es constante sino quees una función lineal <strong>de</strong> Q que involucra a los parámetros β 2 y β 3 .Otra forma <strong>de</strong> mo<strong><strong>de</strong>l</strong>ar relaciones no lineales entre las variables explicativas y el regresando es incluirtérminos <strong>de</strong> interacción, es <strong>de</strong>cir, el producto <strong>de</strong> varios regresores <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Consi<strong>de</strong>remos, porejemplo, el siguiente mo<strong><strong>de</strong>l</strong>o:Y = β 1 + β 2 X 2 + β 3 X 3 + β 4 (X 2 × X 3 ) + uEste mo<strong><strong>de</strong>l</strong>o es lineal en los parámetros, por lo que cumple el supuesto <strong>de</strong> linealidad. El efectomarginal <strong>de</strong> X 2 sobre Y es:∂E(Y )∂X 2= β 2 + β 4 X 3<strong>de</strong> forma que el incremento esperado en Y ante un incremento unitario en X 2 no es constante sinoque <strong>de</strong>pen<strong>de</strong> <strong><strong>de</strong>l</strong> valor <strong>de</strong> X 3 .Los mo<strong><strong>de</strong>l</strong>os que no cumplen el supuesto <strong>de</strong> linealidad se pue<strong>de</strong>n clasificar en dos grupos. En elprimer grupo se encuentran los mo<strong><strong>de</strong>l</strong>os que no son lineales en los parámetros pero que se pue<strong>de</strong>nlinealizar mediante alguna transformación. En este grupo entra por ejemplo la función <strong>de</strong> producciónCobb-Douglas que no es lineal ni en las variables ni en los parámetros, pero tomando logaritmos seobtiene una función que no es lineal en las variables pero sí es lineal en los parámetros. El segundogrupo lo forman los mo<strong><strong>de</strong>l</strong>os que no son lineales en los parámetros y que no se pue<strong>de</strong>n linealizarmediante ninguna transformación, por ejemplo,Y = β 1 + X β 2β 31 + X β 22 + uEste tipo <strong>de</strong> mo<strong><strong>de</strong>l</strong>os se estima por mínimos cuadrados no lineales.Contraste <strong>de</strong> RamseyEl contraste <strong>de</strong> Ramsey (1969) está diseñado para <strong>de</strong>tectar si la forma funcional está correctamenteespecificada o no. Una forma sencilla <strong>de</strong> <strong>de</strong>tectar que la forma funcional <strong>de</strong> este mo<strong><strong>de</strong>l</strong>o está malespecificada y la relación no es lineal entre las variables, sería incluir términos no lineales en elmo<strong><strong>de</strong>l</strong>o anterior y contrastar su significatividad. Ramsey propone añadir términos no lineales <strong><strong>de</strong>l</strong>t , ... , don<strong>de</strong> Ŷt son los valores ajustados por la recta <strong>de</strong> regresión muestral MCO. Detipo Ŷ 2t , Ŷ 3forma que los términos Ŷ 2t , Ŷ 3t , ... , son funciones no lineales <strong>de</strong> todos los regresores. La lógica <strong><strong>de</strong>l</strong>contraste se basa en que, si el mo<strong><strong>de</strong>l</strong>o no está bien especificado, la introducción <strong>de</strong> estos términosno lineales mejoraría el ajuste <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.Los pasos para implementar el contraste <strong>de</strong> Ramsey son los siguientes. En primer lugar, se estimael mo<strong><strong>de</strong>l</strong>o que incluye tantos términos no lineales como se <strong>de</strong>see, habitualmente, dos:Y t = β 1 + β 2 X 2t + β 3 X 3t + γ 1 Ŷ 2t + γ 2 Ŷ 3t + u t (6.4)170


Estadística Actuarial: Análisis <strong>de</strong> RegresiónLa hipótesis nula <strong>de</strong> correcta especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o se expresaría en función <strong>de</strong> los parámetros<strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o (6.4) comoH 0 : γ 1 = γ 2 = 0γ 1 ≠ 0 y/o γ 2 ≠ 0Si no se rechaza la hipótesis nula, significa que no se ha <strong>de</strong>tectado mala especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.Si, por el contrario, se rechaza, el mo<strong><strong>de</strong>l</strong>o no es a<strong>de</strong>cuado y se pue<strong>de</strong> mejorar. Ahora bien, una<strong>de</strong> las limitaciones <strong>de</strong> este contraste es que no da indicaciones sobre cuál sería la forma funcionalapropiada para el mo<strong><strong>de</strong>l</strong>o. Gretl permite obtener el contraste <strong>de</strong> Ramsey automáticamente.6.2. Sobre constancia <strong>de</strong> los coeficientes: contraste <strong>de</strong> cambio estructuralEn ocasiones pue<strong>de</strong> ocurrir que la relación entre la variable <strong>de</strong>pendiente y los regresores cambie a lolargo <strong><strong>de</strong>l</strong> periodo muestral, es <strong>de</strong>cir, pue<strong>de</strong> que exista un cambio estructural. Por ejemplo, si estamosanalizando el consumo <strong>de</strong> tabaco y durante el período muestral se ha producido una campaña <strong>de</strong>salud pública informando sobre los peligros que conlleva el consumo <strong>de</strong> tabaco, po<strong>de</strong>mos pensarque tras dicha campaña el comportamiento <strong>de</strong> la <strong>de</strong>manda <strong>de</strong> tabaco haya cambiado, reduciéndosesignificativamente. Si esto ocurre no po<strong>de</strong>mos especificar una única función <strong>de</strong> <strong>de</strong>manda para todo elperíodo muestral si no que <strong>de</strong>beríamos especificar dos funciones, una hasta la campaña antitabacoy otra para el período siguiente. Por tanto ante sospechas <strong>de</strong> que exista un cambio estructural<strong>de</strong>bemos <strong>de</strong> contrastar la estabilidad <strong>de</strong> los parámetros <strong>de</strong> nuestra relación.El contraste <strong>de</strong> cambio estructural, llamado habitualmente contraste <strong>de</strong> Chow pue<strong>de</strong> realizarse <strong>de</strong>manera sencilla mediante el estadístico <strong>de</strong> sumas <strong>de</strong> cuadrados <strong>de</strong> los residuos sin más que especificara<strong>de</strong>cuadamente el mo<strong><strong>de</strong>l</strong>o restringido y el no restringido. También po<strong>de</strong>mos llevarlo a cabo utilizandovariables ficticias. Hay cambio estructural cuando el mo<strong><strong>de</strong>l</strong>oy el mo<strong><strong>de</strong>l</strong>ose verifica sólo <strong>de</strong>s<strong>de</strong> el momento t 1 hasta T.Y t = α 1 + β 1 X t + u t t = 1, 2, . . . , t 1 < T (6.5)Y t = α 2 + β 2 X t + u t t = t 1 , t 2 , . . . , T (6.6)En este caso no po<strong>de</strong>mos escribir una única ecuación <strong><strong>de</strong>l</strong> tipo:Y t = α + βX t + u t t = 1, 2, . . . , T (6.7)ya que no se verifica durante todo el periodo muestral y nuestro mo<strong><strong>de</strong>l</strong>o estaría formado por las ecuaciones(6.5) y (6.6). Si existe cambio estructural rechazaríamos H 0 : α 1 = α 2 , β 1 = β 2 don<strong>de</strong> q = 2.Este contraste po<strong>de</strong>mos llevarlo a cabo utilizando el estadístico F basado en las sumas <strong>de</strong> cuadrados<strong>de</strong> los residuos siendo en este caso el mo<strong><strong>de</strong>l</strong>o restringido el recogido en la ecuación (6.7) mientras171


Estadística Actuarial: Análisis <strong>de</strong> Regresiónque el mo<strong><strong>de</strong>l</strong>o no restringido está constituido por las ecuaciones (6.5) y (6.6). Matricialmente:Mo<strong><strong>de</strong>l</strong>o no restringido ⇔⎡] [ ]i1 X=1 0 0⎢Y 2 0 0 i 2 X 2⎣[Y1α 1β 1α 2β 2⎤[ ]⎥⎦ + u1⇒ û ′ û = û ′u 1û 1 + û ′ 2û 22Mo<strong><strong>de</strong>l</strong>o restringido ⇔[Y1] [ ] [i1 X=1 αY 2 X 2 βi 2] [ ]u1+ ⇒ û ′u rû r2bajo el supuesto u 1 ∼ N(0, σ1 2), u 2 ∼ N(0, σ2 2 ) el estadístico <strong>de</strong> contraste y distribución es:û ′ rû r − û ′ û/2 H ∼0û ′ F(2,T1 +T û/T 1 + T 2 − 42 −4)Notar que para la vali<strong>de</strong>z <strong><strong>de</strong>l</strong> contraste a<strong>de</strong>más <strong>de</strong> suponer normalidad en las perturbaciones sesupone también que σ 2 1 = σ2 2 .6.3. Sobre las perturbaciones: contrastes <strong>de</strong> heterocedasticidad y ausencia<strong>de</strong> correlación6.3.1. Contraste <strong>de</strong> heterocedasticidadHasta el momento uno <strong>de</strong> los supuestos básicos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal es que la varianza<strong>de</strong> cada término <strong>de</strong> perturbación u i condicionada a los valores <strong>de</strong> las variables explicativas, esconstante e igual a σ 2 . Llamábamos a este supuesto homocedasticidad y lo <strong>de</strong>notábamos: V (u i ) =σ 2 ó lo que es igual E(u 2 i ) = σ2 ∀i. La varianza σ 2 es una medida <strong>de</strong> dispersión <strong>de</strong> u i alre<strong>de</strong>dor<strong>de</strong> su media , E(u i ) = 0, o equivalentemente, una medida <strong>de</strong> dispersión <strong>de</strong> la variable <strong>de</strong>pendienteY i alre<strong>de</strong>dor <strong>de</strong> su media β 1 + β 2 X 2i + . . . + β k X ki . Así, homocedasticidad significa que la dispersiónes la misma a través <strong>de</strong> todas las observaciones.Supongamos que disponemos <strong>de</strong> observaciones sobre consumo y renta para un conjunto <strong>de</strong> familias,en un año <strong>de</strong>terminado. Las familias con rentas bajas no tienen mucha flexibilidad en sus gastos, engeneral el grueso <strong>de</strong> la misma se gastará en cosas básicas, por ello la forma <strong>de</strong> consumo entre familias<strong>de</strong> renta baja no variará <strong>de</strong>masiado. Sin embargo, las familias <strong>de</strong> rentas altas tienen más posibilida<strong>de</strong>s<strong>de</strong> consumo, ser gran<strong>de</strong>s consumidores o ahorradores o llevar un gasto equilibrado. En cualquier casosu consumo pue<strong>de</strong> ser muy distinto entre sí por lo que pue<strong>de</strong>n tener una gran dispersión alre<strong>de</strong>dor<strong>de</strong> su consumo medio mientras que las familias con rentas bajas no. En esta situación suponer queexiste homocedasticidad no es sensato, <strong>de</strong>beríamos suponer que existe heterocedasticidad.Llamamos heterocedasticidad al caso en que la varianza <strong><strong>de</strong>l</strong> término <strong>de</strong> error varía a través <strong><strong>de</strong>l</strong>tiempo si miramos a series temporales, V (u t ) = σt 2 , o cambia <strong>de</strong> una observación a otra si miramosdatos <strong>de</strong> sección cruzada, (familias, países, etc.), V ar(u i ) = σi 2 . Seguimos suponiendo que no existeautocorrelación entre perturbaciones por lo que sólo consi<strong>de</strong>ramos la existencia <strong>de</strong> heterocedasticidad.La existencia <strong>de</strong> heterocedasticidad es más habitual en datos <strong>de</strong> sección cruzada.172


f(u)XYf(u)XYEstadística Actuarial: Análisis <strong>de</strong> RegresiónEn la Figura 5.1 se pue<strong>de</strong> apreciar la diferencia entre el comportamiento <strong>de</strong> las perturbacioneshomocedásticas, a la izquierda y heterocedásticas, a la <strong>de</strong>recha. En la figura <strong>de</strong> la izquierda sepue<strong>de</strong> observar que la varianza condicional <strong>de</strong> Y i a las X i permanece igual sin importar los valoresque tome la variable X. Recordar que la varianza condicional <strong>de</strong> Y i es la misma que la <strong>de</strong> u i , portanto, en el gráfico estamos observando cómo la varianza <strong>de</strong> la perturbación permanece constantein<strong>de</strong>pendientemente <strong><strong>de</strong>l</strong> valor que tome el regresor. En la figura <strong>de</strong> la <strong>de</strong>recha se pue<strong>de</strong> observar quela varianza <strong>de</strong> Y i aumenta a medida que X i aumenta y por tanto hay heterocedasticidad:E(u 2 i ) = σ 2 i+βαX6 X6 X1 X2 X6α+βX6Figura 6.2: Perturbaciones homocedásticas versus heterocedásticasX2 X1La existencia <strong>de</strong> heterocedasticidad pue<strong>de</strong> aparecer en numerosas aplicaciones económicas sin embargo,es más habitual en datos <strong>de</strong> sección cruzada. A continuación veremos algunas situaciones enlas cuales las varianzas <strong>de</strong> u i pue<strong>de</strong>n no ser constantes.• En datos <strong>de</strong> sección cruzada.Ejemplo 6.1 Supongamos que tenemos datos para diferentes comunida<strong>de</strong>s autónomas españolasen el año 2005 sobre gasto sanitario agregado, GS, renta personal disponible, R, elporcentaje <strong>de</strong> población que supera los 65 años, SEN y población, P OP , con los que estimarel siguiente mo<strong><strong>de</strong>l</strong>o:GS i = β 1 + β 2 R i + β 3 SEN i + β 4 P OP i + u i i = 1, . . . , N (6.8)Las comunida<strong>de</strong>s con más población y/o mayor porcentaje <strong>de</strong> población con edad superiora 65 años tendrán mayor gasto sanitario que aquellas con menor población o más joven.En esta situación suponer que la dispersión <strong>de</strong> los gastos sanitarios es la misma para todaslas comunida<strong>de</strong>s con distinto nivel <strong>de</strong> población y composición <strong>de</strong> la misma no es realista,y se <strong>de</strong>bería proponer que la varianza <strong>de</strong> la perturbación sea heterocedástica V ar(u i ) =σ 2 i , permitiendo por ejemplo que varíe en función creciente con la población, es <strong>de</strong>cir, σ2 i =σ 2 P OP i . Incluso po<strong>de</strong>mos pensar que varíe en función creciente con el porcentaje <strong>de</strong> poblaciónmayor <strong>de</strong> 65 años, en cuyo caso propondríamos V ar(u i ) = σ 2 SEN i o con ambas variables,por lo que la forma funcional pudiera ser V ar(u i ) = σ 2 (a P OP i + b SEN i ).173


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjemplo 6.2 Un ejemplo recurrente para mostrar la heterocedasticidad es el estudio <strong>de</strong> larelación entre consumo y renta. Supongamos que tenemos datos sobre renta, R, y gasto enconsumo, C, para N familias, con los que estimar el mo<strong><strong>de</strong>l</strong>o:C i = β 1 + β 2 R i + u i i = 1, . . . , N (6.9)Las familias con mayor renta, una vez satisfechas sus necesida<strong>de</strong>s primordiales tienen mayoresposibilida<strong>de</strong>s <strong>de</strong> <strong>de</strong>cidir cuánto ahorrar y cuánto consumir, por lo que es habitual encontraruna mayor variabilidad en el gasto realizado por familias <strong>de</strong> renta alta que por familias <strong>de</strong>renta baja. En esta situación suponer que la dispersión <strong>de</strong> los gastos <strong>de</strong> consumo es la mismapara todas las familias con distinto nivel <strong>de</strong> renta no es realista y se <strong>de</strong>bería proponer que lavarianza <strong>de</strong> la perturbación sea heterocedástica V ar(u i ) = σi 2 , permitiendo por ejemplo quevaríe en función creciente con la renta <strong>de</strong> las familias, es <strong>de</strong>cir, σi 2 = σ2 R i .Ejemplo 6.3 Un fenómeno parecido ocurre con las empresas que <strong>de</strong>ben <strong>de</strong>cidir qué porcentaje<strong>de</strong> sus beneficios, B, <strong>de</strong>ben repartir como divi<strong>de</strong>ndos, D. Las empresas con mayoresbeneficios tienen un margen <strong>de</strong> <strong>de</strong>cisión muy superior al fijar su política <strong>de</strong> divi<strong>de</strong>ndos. Alestimar el mo<strong><strong>de</strong>l</strong>o:D i = β 1 + β 2 B i + u i i = 1, . . . , N (6.10)cabría esperar que la varianza <strong>de</strong> u i <strong>de</strong>penda <strong><strong>de</strong>l</strong> nivel <strong>de</strong> beneficios <strong>de</strong> la empresa i-ésima ypodríamos proponer que por ejemplo, E(u 2 i ) = σ2 i = σ2 B i .• La heterocedasticidad también pue<strong>de</strong> aparecer como consecuencia <strong>de</strong> la agregación <strong>de</strong>datos. En este caso la varianza pue<strong>de</strong> <strong>de</strong>pen<strong>de</strong>r <strong><strong>de</strong>l</strong> número <strong>de</strong> observaciones <strong><strong>de</strong>l</strong> grupo.Ejemplo 6.4mo<strong><strong>de</strong>l</strong>o:Supongamos un investigador que <strong>de</strong>sea estimar los coeficientes <strong><strong>de</strong>l</strong> siguienteY j = β 1 + β 2 X j + u j j = 1, . . . , N (6.11)don<strong>de</strong> u j ∼ N(0, σ 2 ), es <strong>de</strong>cir, la varianza <strong>de</strong> la perturbación es homocedástica. Supongamosque el número <strong>de</strong> observaciones N es tal que aconseja agrupar las observaciones en m-grupos<strong>de</strong> n i observaciones cada uno. Supongamos que como observación <strong><strong>de</strong>l</strong> grupo i-ésimo se tomala media aritmética <strong>de</strong>ntro <strong><strong>de</strong>l</strong> grupo. El mo<strong><strong>de</strong>l</strong>o a estimar sería:Ȳ i = β 1 + β 2 ¯Xi + ū i i = 1, . . . , m (6.12)y la nueva perturbación ū i seguirá teniendo media cero, pero su varianza no será constanteya que <strong>de</strong>pen<strong>de</strong>rá <strong><strong>de</strong>l</strong> número <strong>de</strong> observaciones <strong>de</strong>ntro <strong><strong>de</strong>l</strong> grupo,V ar(ū i ) = σ2n ii = 1, . . . , m.Si el número <strong>de</strong> observaciones <strong>de</strong>ntro <strong><strong>de</strong>l</strong> grupo es el mismo en todos los grupos la varianza<strong>de</strong> la perturbación ū i es homocedástica.• Otro caso sería la existencia <strong>de</strong> un cambio estructural en varianza recogido por unavariable ficticia en la varianza <strong>de</strong> la perturbación.174


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjemplo 6.5 Supongamos que se <strong>de</strong>sea estudiar la relación entre producción, Y , y mano <strong>de</strong>obra, X, para un conjunto <strong>de</strong> 20 trabajadores <strong>de</strong> los cuales 10 son mujeres y el resto hombres.Si suponemos que la variabilidad <strong>de</strong> la producción es distinta para los hombres que para lasmujeres nuestro mo<strong><strong>de</strong>l</strong>o a estimar sería:Y i = β 1 + β 2 X i + u i i = 1, . . . , 20 (6.13)don<strong>de</strong> u i ∼ (0, α 1 + α 2 D i ) siendo D i una variable ficticia que toma valor la unidad si laobservación correspon<strong>de</strong> a una mujer y cero en el caso contrario. En este caso:V ar(u i ) = α 1 + α 2V ar(u i ) = α 1para las observaciones correspondientes a las mujerespara las observaciones correspondientes a los hombresSuponiendo que las primeras diez observaciones correspon<strong>de</strong>n a mujeres, la matriz <strong>de</strong> varianzasy covarianzas <strong><strong>de</strong>l</strong> vector <strong>de</strong> perturbaciones sería la siguiente:[ ]E(uu ′ (α1 + α) =2 )I 10 00 α 1 I 10Consecuencias <strong>de</strong> ignorar la heterocedasticidadVamos a analizar las consecuencias <strong>de</strong> utilizar el estimador MCO en presencia <strong>de</strong> heterocedasticidad:• En las propieda<strong>de</strong>s <strong><strong>de</strong>l</strong> estimador MCO: El estimador MCO bajo heterocedasticidadsigue siendo una combinación lineal <strong>de</strong> las perturbaciones. También sigue siendo insesgado yaque la media <strong>de</strong> la perturbación es cero. Sin embargo, no va a ser <strong>de</strong> varianza mínima ya quela matriz <strong>de</strong> varianzas y covarianzas σ 2 (X ′ X) −1 obtenida en el Tema 5 es mínima bajo lashipótesis básicas. Ahora, sin embargo, éstas no se cumplen: estamos consi<strong>de</strong>rando el supuesto<strong>de</strong> heterocedasticidad por tanto E(u 2 i ) ≠ σ2 , el Teorema <strong>de</strong> Gauss-Markov no se cumple yel estimador no es <strong>de</strong> varianza mínima. Ahora la matriz <strong>de</strong> varianzas y covarianzas <strong>de</strong> loscoeficientes obtenida bajo este supuesto no vendrá dada por la expresión σ 2 (X ′ X) −1 y portanto no será mínima. El estimador no es eficiente.• En los contrastes <strong>de</strong> hipótesis: Una forma sencilla <strong>de</strong> pensar en las consecuencias sobrelos contrastes <strong>de</strong> hipótesis es pensar que dado que el estimador no es el mejor <strong>de</strong> los posiblesla inferencia realizada con el mismo no será fiable.Formalmente lo que está ocurriendo es que el estimador <strong>de</strong> σ 2 propuesto en el Tema 5 ahorano es insesgado por lo que los estadísticos <strong>de</strong> contraste habituales no tendrán las distribucionest y F habituales. Por tanto, los contrastes no son válidos.La existencia <strong>de</strong> heterocedasticidad en u i tiene consecuencias en los estimadores MCO, en concretoya no son los estimadores <strong>de</strong> menor varianza entre los estimadores lineales e insesgados. Existe otroestimador, el estimador <strong>de</strong> Mínimos Cuadrados Generalizados que es el <strong>de</strong> menor varianza entrelos lineales e insesgados y para el cual la inferencia es válida. Las consecuencias y soluciones <strong><strong>de</strong>l</strong>175


Estadística Actuarial: Análisis <strong>de</strong> Regresiónproblema no forman parte <strong><strong>de</strong>l</strong> contenido <strong>de</strong> este curso. Sin embargo, en la siguiente sección vamosa apren<strong>de</strong>r a <strong>de</strong>tectar la existencia <strong>de</strong> heterocedasticidad con un estadístico <strong>de</strong> contraste sencillo yque aparece por <strong>de</strong>fecto en los resultados <strong>de</strong> estimación MCO <strong>de</strong> gretl. En cursos más avanzadosapren<strong>de</strong>réis a solucionar el problema.Detección <strong>de</strong> la heterocedasticidadSabemos que en presencia <strong>de</strong> heterocedasticidad el estimador MCO es ineficiente, y los contrastes <strong>de</strong>hipótesis no son válidos por ello es importante <strong>de</strong>tectar la posible existencia <strong>de</strong> heterocedasticidad.La <strong>de</strong>terminación <strong>de</strong> la existencia <strong>de</strong> heterocedasticidad sólo podremos conseguirla aplicando untest <strong>de</strong> contraste para heterocedasticidad, sin embargo po<strong>de</strong>mos aproximarnos gráficamente al problemarealizando un estudio visual <strong>de</strong> los residuos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Los residuos MCO son un estimadorinsesgado <strong>de</strong> u i aún en presencia <strong>de</strong> heterocedasticidad. Usaremos el residuo al cuadrado como aproximaciónal comportamiento <strong>de</strong> la varianza <strong>de</strong> la perturbación. Para ver si pue<strong>de</strong> existir un problema<strong>de</strong> heterocedasticidad po<strong>de</strong>mos empezar por dibujar el cuadrado <strong>de</strong> los residuos MCO contra la variable<strong>de</strong> la cual sospechamos que <strong>de</strong>pen<strong>de</strong> σ 2 , es <strong>de</strong>cir, que sospechamos causa la heterocedasticidadNuestro objetivo es claro: Detectar la existencia <strong>de</strong> heterocedasticidad en las perturbaciones<strong>de</strong> un mo<strong><strong>de</strong>l</strong>o. La primera aproximación al objetivo es el estudio <strong>de</strong> los gráficos <strong>de</strong> residuosy <strong>de</strong> las variables <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.6.3.2. Detección gráfica.La aplicación <strong><strong>de</strong>l</strong> estimador <strong>de</strong> MCG y algunos contrastes <strong>de</strong> heterocedasticidad requieren conocerla forma funcional <strong>de</strong> la varianza <strong>de</strong> la perturbación. Si suponemos que la varianza <strong>de</strong> la perturbación<strong>de</strong>pen<strong>de</strong> <strong>de</strong> uno o más regresores, u otras variables conocidas, un instrumento a<strong>de</strong>cuado paraaproximarnos a la misma sería llevar a cabo un análisis <strong>de</strong> los residuos MCO don<strong>de</strong> no hemos tenidoen cuenta la existencia <strong>de</strong> heterocedasticidad. Aunque û MCO,i no es lo mismo que u i la <strong>de</strong>tección<strong>de</strong> patrones sistemáticos en la variabilidad <strong>de</strong> los residuos MCO nos indicará la posible existencia<strong>de</strong> heterocedasticidad en las perturbaciones. A<strong>de</strong>más, pue<strong>de</strong> indicarnos una posible forma funcional<strong>de</strong> la misma.Consi<strong>de</strong>ramos el mo<strong><strong>de</strong>l</strong>o (6.8) recogido en el Ejemplo 6.1:GS i = β 1 + β 2 R i + β 3 SEN i + β 4 P OP i + u ii = 1, . . . , Ndon<strong>de</strong> suponemos E(u i ) = 0 ∀i y E(u i u j ) = 0 ∀i, j i ≠ j. Si sospechamos que u i es heterocedástica<strong>de</strong>bido a la variable P OP , po<strong>de</strong>mos intentar <strong>de</strong>tectar la existencia <strong>de</strong> heterocedasticida<strong>de</strong>n las perturbaciones <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o ayudándonos <strong><strong>de</strong>l</strong> gráfico <strong>de</strong> los residuos MCO, (û MCO,i ), frente ala variable P OP i .Si el gráfico es como el recogido en la Figura 6.3 pensaremos que la variabilidad <strong>de</strong> los residuosû MCO,i se incrementan con P OP i y que el incremento es directamente proporcional. Así, podríamos176


Estadística Actuarial: Análisis <strong>de</strong> Regresión5Residuos <strong>de</strong> la regresión (= GS observada − estimada)432residuos MCO10−1−2−3−40 5 10 15 20 25 30POPFigura 6.3: Residuos MCO versus P OPproponer, por ejemplo:E(u 2 i ) = σ 2 P OP ii = 1, 2, . . . , NSi el gráfico <strong>de</strong> los residuos MCO frente a P OP hubiera sido como el recogido en la Figura 6.4supondríamos que el aumento en la varianza <strong>de</strong> u i es inversamente proporcional a P OP i y propondríamos:E(u 2 i ) = σ 2 P OPi−1 i = 1, 2, . . . , N5432residuos MCO10-1-2-3-40 0.5 1 1.5 2POPFigura 6.4: Residuos MCO versus P OPTambién po<strong>de</strong>mos optar por dibujar la serie <strong>de</strong> los residuos al cuadrados MCO frente a la variableque creemos causa la heterocedasticidad como se muestra en la Figura 6.5. En el gráfico <strong>de</strong> laizquierda se muestran los pares (SEN i , û MCO,i ), en el gráfico <strong>de</strong> la <strong>de</strong>recha se muestran los pares(SEN i , û 2 MCO,i). Ambos gráficos muestran la misma información, muestran que la variabilidad <strong>de</strong> losresiduos se incrementa con SEN y podríamos proponer, por ejemplo V ar(u i ) = E(u 2 i ) = σ2 SEN i .177


Estadística Actuarial: Análisis <strong>de</strong> Regresión54Residuos <strong>de</strong> la regresión (= GS observada − estimada)201816residuos MCO3210−1Cuadrado <strong>de</strong> los Residuos MCO14121086−24−32−46 8 10 12 14 16 18SEN06 8 10 12 14 16 18SENFigura 6.5: Residuos MCO y sus cuadrados versus SENEn general a priori no se conocerá cuál <strong>de</strong> las variables exógenas genera la heterocedasticidad porlo que resulta aconsejable estudiar los gráficos <strong>de</strong> los residuos <strong>de</strong> MCO, contraponiéndolos a cadauna <strong>de</strong> las variables exógenas <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o, como estamos haciendo al estudiar los residuos frente aP OP i y frente a SEN i . Notar que ambas variables parecen afectar a la varianza <strong>de</strong> la perturbación,por ello estaría justificado proponer V ar(u i ) = (a P OP i + b SEN i ), don<strong>de</strong> a y b son <strong>de</strong>sconocidos yel factor <strong>de</strong> escala es la unidad, σ 2 = 1.21.510.5Residuos MCO0-0.5-1-1.5-2-2.50 5 10 15 20 25 30POPFigura 6.6: Perturbaciones homocedásticasSi la gráfica entre û MCO,i y P OP i hubiera resultado como la <strong>de</strong> la Figura 6.6, concluiríamos quela varianza <strong>de</strong> la perturbación no <strong>de</strong>pen<strong>de</strong> <strong>de</strong> P OP i ya que no se aprecia ningún patrón <strong>de</strong> comportamientoy parece que hay una distribución aleatoria <strong>de</strong> los pares (P OP i , û i ). En esta situaciónproce<strong>de</strong> analizar los residuos frente al resto <strong>de</strong> regresores <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o.Las formas anteriores no son las únicas. Si recordamos, en el Ejemplo 3.6 se suponía una situacióndon<strong>de</strong> hombres y mujeres en una empresa tenían diferente productividad y se suponía que V ar(u i ) =α 1 + α 2 D i siendo D i una variable ficticia que toma valor uno si la observación correspon<strong>de</strong> a unamujer y cero en caso contrario. En esta situación esperaríamos un gráfico como el recogido en la178


Estadística Actuarial: Análisis <strong>de</strong> RegresiónFigura 6.7 don<strong>de</strong> claramente la dispersión <strong>de</strong> los residuos para las mujeres es mucho mayor que paralos hombres.800600400Residuos MCO2000-200-400-600-8000 1D_iFigura 6.7: Residuos MCO frente a una variable ficticiaComo conclusión diremos que al analizar los gráficos <strong>de</strong> la relación residuos MCO, o sus cuadrados,con cada uno <strong>de</strong> los regresores lo que intentaremos <strong>de</strong>tectar visualmente es un crecimiento o<strong>de</strong>crecimiento en la variabilidad <strong>de</strong> los residuos con respecto a la variable en cuestión.Sin embargo el estudio gráfico <strong>de</strong> los residuos no es <strong>de</strong>terminativo. Para <strong>de</strong>terminar si existe o noheterocedasticidad tendremos que realizar un contraste <strong>de</strong> existencia <strong>de</strong> heterocedasticidad con unestadístico a<strong>de</strong>cuado. Estadísticos <strong>de</strong> contraste <strong>de</strong> existencia <strong>de</strong> heterocedasticidad hay muchos yunos se a<strong>de</strong>cúan más a unas situaciones que otros y en general necesitan suponer una forma funcionalpara σi 2. El análisis gráfico no es una pérdida <strong>de</strong> tiempo ya que la relación entre X ki y û MCO,i nosindicará una posible forma funcional (<strong>de</strong> heterocedasticidad) para la varianza <strong>de</strong> la perturbación ypue<strong>de</strong> indicarnos cuál es el test <strong>de</strong> contraste más a<strong>de</strong>cuado. En este tema vamos a estudiar un únicotest <strong>de</strong> heterocedasticidad que tiene carácter general y no exige supuestos sobre el comportamiento<strong>de</strong> σi 2 . A<strong>de</strong>más gretl lo proporciona directamente.6.3.3. Contraste <strong>de</strong> WhiteEl contraste <strong>de</strong> heterocedasticidad propuesto por White en 1980 es un contraste paramétrico, <strong>de</strong>carácter general, que no precisa especificar la forma que pue<strong>de</strong> adoptar la heterocedasticidad. Eneste sentido pue<strong>de</strong> calificarse <strong>de</strong> robusto. Antes <strong>de</strong> aplicar el contraste con gretl vamos a <strong>de</strong>sarrollarpaso a paso el contraste para enten<strong>de</strong>r su mecanismo. Para la ilustración vamos a suponer quequeremos contrastar la existencia <strong>de</strong> heterocedasticidad en el mo<strong><strong>de</strong>l</strong>o:Se proce<strong>de</strong> <strong>de</strong> la forma siguiente:Y i = β 1 + β 2 X 2i + β 3 X 3i + u i (6.14)1. Estimamos por MCO el mo<strong><strong>de</strong>l</strong>o original y calculamos los residuos <strong>de</strong> MCO, û MCO,i .179


Estadística Actuarial: Análisis <strong>de</strong> Regresión2. Estimamos la regresión auxiliar: el cuadrado <strong>de</strong> los residuos mínimo-cuadráticos <strong>de</strong> la regresiónanterior, sobre una constante, los regresores <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o original, sus cuadrados y productoscruzados <strong>de</strong> segundo or<strong>de</strong>n, evitando los redundantes:û 2 i = α 1 + α 2 X 2i + α 3 X 3i + α 4 X 2 2i + α 5 X 2 3i + α 6 X 2t X 3i + ω i (6.15)Contrastar la hipótesis nula <strong>de</strong> homocedasticidad es equivalente a contrastar que todos loscoeficientes <strong>de</strong> esta regresión, exceptuando el término in<strong>de</strong>pendiente son cero. Es <strong>de</strong>cir:H 0 : α 2 = α 3 = . . . = α 6 = 03. El estadístico <strong>de</strong> contraste es λ = NR 2 don<strong>de</strong> R 2 es el coeficiente <strong>de</strong> <strong>de</strong>terminación <strong>de</strong> laregresión auxiliar (6.15). Rechazamos H 0 si NR 2 > χ (p)|α siendo p el número <strong>de</strong> coeficientesen la regresión auxiliar sin incluir el término in<strong>de</strong>pendiente, en el ejemplo p = 5.Observaciones:1. Este contraste es muy flexible ya que no especifica la forma funcional <strong>de</strong> heterocedasticidad,pero por otro lado, si se rechaza la hipótesis nula <strong>de</strong> homocedasticidad no indica cuál pue<strong>de</strong>ser la dirección a seguir.2. A la hora <strong>de</strong> incluir los regresores <strong>de</strong> la regresión auxiliar <strong>de</strong>bemos ser muy cuidadosos parano incurrir en multicolinealidad exacta, por ejemplo en el caso <strong>de</strong> las variables ficticias convalores 0 y 1, en este caso el cuadrado <strong>de</strong> la variable coinci<strong>de</strong> con ella misma.3. También pue<strong>de</strong>n surgir problemas en mo<strong><strong>de</strong>l</strong>os con un alto número <strong>de</strong> regresores que pue<strong>de</strong>conllevar que en la regresión auxiliar el número <strong>de</strong> variables sea tal que no supere al número<strong>de</strong> observaciones y nos que<strong>de</strong>mos sin grados <strong>de</strong> libertad. Si éste es el caso po<strong>de</strong>mos optar porregresar el cuadrado <strong>de</strong> los residuos MCO sobre Ŷi y Ŷ i2 ya que Ŷi es el ajuste <strong>de</strong> Y i usandoel estimador MCO con todos los regresores originales.4. El contraste <strong>de</strong> White pue<strong>de</strong> recoger otro tipo <strong>de</strong> problemas <strong>de</strong> mala especificación <strong>de</strong> laparte sistemática, omisión <strong>de</strong> variables relevantes, mala forma funcional etc. Esto es positivosi se i<strong>de</strong>ntifica cuál es el problema, en caso contrario, la solución que se tome pue<strong>de</strong> estarequivocada. Si la <strong>de</strong>tección <strong>de</strong> heterocedasticidad se <strong>de</strong>be a un problema <strong>de</strong> mala especificaciónla solución pasa por especificar correctamente el mo<strong><strong>de</strong>l</strong>o.6.3.4. Contraste <strong>de</strong> ausencia <strong>de</strong> correlación temporalEn el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión, el término <strong>de</strong> perturbación engloba aquellos factores que <strong>de</strong>terminando lavariable endógena, no están recogidos en la parte sistemática <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Estos factores pue<strong>de</strong>n serinnovaciones, errores <strong>de</strong> medida en la variable endógena, variables omitidas, etc. Hasta el momentouno <strong>de</strong> los supuestos básicos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión lineal es que la covarianza entre perturbaciones<strong>de</strong> distintos periodos es cero. Sin embargo, si estos factores están correlacionados en el tiempo oen el espacio, entonces no se satisface la hipótesis <strong>de</strong> NO autocorrelación que escribíamos como180


Estadística Actuarial: Análisis <strong>de</strong> RegresiónE(u t u s ) = 0 ∀t, s t ≠ s. Este fenómeno se conoce con el nombre <strong>de</strong> autocorrelación: correlaciónserial, en el caso <strong>de</strong> series temporales y correlación espacial en el caso <strong>de</strong> datos <strong>de</strong> seccióncruzada. En general es más habitual en datos <strong>de</strong> serie temporal.Concepto <strong>de</strong> autocorrelación:Existe autocorrelación cuando el término <strong>de</strong> error <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o econométrico está correlacionadoconsigo mismo. Es <strong>de</strong>cir, la covarianza entre las perturbaciones es distinta <strong>de</strong> cero para diferentesmomentos <strong><strong>de</strong>l</strong> tiempo (o entre distintos individuos) 1 :E(u t u s ) ≠ 0 ∀t, s t ≠ sEsta dinámica, aunque no sea relevante en media, refleja un patrón sistemático que tenemos queconsi<strong>de</strong>rar a la hora <strong>de</strong> estimar el mo<strong><strong>de</strong>l</strong>o.La existencia <strong>de</strong> autocorrelación supone el incumplimiento <strong>de</strong> una <strong>de</strong> las hipótesis básicas sobrela perturbación <strong>de</strong> forma similar a la existencia <strong>de</strong> heterocedasticidad. Esta afecta a las varianzasmientras que la autocorrelación afecta a las covarianzas. En cualquier caso, las consecuencias sobreel estimador MCO son las mismas: el estimador no es <strong>de</strong> varianza mínima, aunque sigue siendo lineale insesgado. Los contrastes <strong>de</strong> hipótesis no son válidos por las mismas razones que en el supuesto <strong>de</strong>heterocedasticidad. Si sospechamos que en un mo<strong><strong>de</strong>l</strong>o la perturbación está autocorrelada, primero<strong>de</strong>beríamos cerciorarnos realizando un contraste y en el caso <strong>de</strong> que ésta exista es importanteestimar el mo<strong><strong>de</strong>l</strong>o bajo estos nuevos supuestos con un estimador alternativo a MCO que sea <strong>de</strong>varianza mínima y válido para hacer inferencia. Este estimador queda fuera <strong><strong>de</strong>l</strong> contenido <strong>de</strong> estetema, sin embargo, apren<strong>de</strong>remos a <strong>de</strong>tectar el problema mediante un contraste y estudiaremos unproceso sencillo para recoger el comportamiento <strong>de</strong> la perturbación bajo autocorrelación: el procesoautorregresivo <strong>de</strong> primer or<strong>de</strong>n.Causas <strong>de</strong> autocorrelaciónComo <strong>de</strong>cíamos al iniciar este capítulo el término <strong>de</strong> perturbación <strong>de</strong> un mo<strong><strong>de</strong>l</strong>o engloba aquellosfactores que, <strong>de</strong>terminando la variable endógena, no están recogidos en la parte sistemática <strong><strong>de</strong>l</strong>mo<strong><strong>de</strong>l</strong>o. Factores como variables omitidas, mala especificación <strong>de</strong> la forma funcional o errores <strong>de</strong>medida, entre otros, son causa <strong>de</strong> autocorrelación. Repasaremos algunos <strong>de</strong> ellos:• Shocks aleatorios prolongadosSea el mo<strong><strong>de</strong>l</strong>o:R t = β 1 + β 2 RM t + u tt = 1, 2, . . . , Tdon<strong>de</strong> R t es la rentabilidad <strong>de</strong> un activo en el periodo t y RM t es la rentabilidad <strong><strong>de</strong>l</strong> mercadoen dicho periodo t. Si en un momento dado se produce una caída <strong><strong>de</strong>l</strong> mercado, la rentabilidad1 No es preciso que u t esté correlacionada consigo misma en cada dos instantes distintos <strong><strong>de</strong>l</strong> tiempo, sino que bastaque la correlación se extienda a algunos periodos.181


Estadística Actuarial: Análisis <strong>de</strong> Regresión<strong><strong>de</strong>l</strong> activo se verá afectada a la baja y como consecuencia la rentabilidad obtenida será menorque la esperada. Este efecto se prolongará en el tiempo hasta que poco a poco los inversoresrecuperen la confianza y el mercado vuelva a estabilizarse. El shock se recogerá en el término<strong>de</strong> perturbación. Si por ejemplo, la caída se produce en (t − 1), lo que estamos diciendo es quela perturbación en t <strong>de</strong>pen<strong>de</strong>rá <strong>de</strong> lo ocurrido en (t − 1) vía u t−1 .• Existencia <strong>de</strong> ciclos y ten<strong>de</strong>nciasSi estamos analizando un mo<strong><strong>de</strong>l</strong>o econométrico cuya variable endógena presenta ciclos y/oten<strong>de</strong>ncias que no se explican a través <strong>de</strong> las variables exógenas, la perturbación recoge dichasestructuras, presentando un comportamiento <strong>de</strong> autocorrelación. En este caso, los residuospresentan agrupaciones <strong>de</strong> <strong>de</strong>sviaciones por encima <strong><strong>de</strong>l</strong> promedio (en la parte alta <strong><strong>de</strong>l</strong> ciclo) yagrupaciones <strong>de</strong> <strong>de</strong>sviaciones por <strong>de</strong>bajo <strong><strong>de</strong>l</strong> promedio (parte baja <strong><strong>de</strong>l</strong> ciclo).• Relaciones no linealesSupongamos que la verda<strong>de</strong>ra relación entre los tipos <strong>de</strong> interés, r t , y el stock <strong>de</strong> DeudaPública, D t , es cuadrática:r t = β 1 + β 2 D t + β 3 D 2 t + u t t = 1, 2, . . . , T β 2 > 0, β 3 < 0Este mo<strong><strong>de</strong>l</strong>o implica que los tipos <strong>de</strong> interés aumentan al crecer el stock <strong>de</strong> <strong>de</strong>uda pública,aunque menos que proporcionalmente, puesto que se tiene:∂r t∂D t= β 2 + 2β 3 D t < β 2tanto menor cuanto mayor es D t . Pero sin embargo se especifica y se estima un mo<strong><strong>de</strong>l</strong>o lineal:r t = β 1 + β 2 D t + u tt = 1, 2, . . . , TEn este caso la curvatura <strong>de</strong> la parte sistemática pasa a ser recogida por la perturbación.Los residuos presentarán una racha <strong>de</strong> residuos negativos seguida <strong>de</strong> otra racha <strong>de</strong> residuospositivos para seguir con otra negativa.• Variables omitidas relevantes correlacionadasSi el mo<strong><strong>de</strong>l</strong>o realmente se especifica como:Pero estimamos:Y t = β 1 + β 2 X 2t + β 3 X 3t + u t t = 1, 2, . . . , Tu t = Y t − β 1 − β 2 X 2t − β 3 X 3tû t = Y t − ˆβ 1 − ˆβ 2 X 2t − ˆβ 3 X 3tY t = β 1 + β 2 X 2t + v t t = 1, 2, . . . , Tv t = Y t − β 1 − β 2 X 2t = u t + β 3 X 3tˆv t = Y t − ˜β 1 − ˜β 2 X 2t = û t − ( ˜β 1 − ˆβ 1 ) − ( ˜β 2 − ˆβ 2 )X 2t + ˆβ 3 X 3tEn este contexto <strong>de</strong> omisión recor<strong>de</strong>mos que los estimadores MCO son sesgados en general.En consecuencia, tras un análisis <strong>de</strong> los residuos ˆv t tanto gráfico como mediante tests, esmuy probable que si la variable omitida está correlacionada o presenta ciclos o ten<strong>de</strong>ncias elinvestigador llegue a la conclusión <strong>de</strong> que: Cov(v t , v s ) ≠ 0. De todas formas hay que tener encuenta que no siempre que se omite una variable relevante se causa autocorrelación.182


Estadística Actuarial: Análisis <strong>de</strong> RegresiónProceso autorregresivo <strong>de</strong> primer or<strong>de</strong>n, AR(1)Existen numerosos procesos capaces <strong>de</strong> reproducir estructuras <strong>de</strong> autocorrelación en la perturbación,sin embargo el proceso autorregresivo <strong>de</strong> primer or<strong>de</strong>n es el proceso <strong>de</strong> autocorrelación más sencilloy uno <strong>de</strong> los que mejor se suele ajustar a datos económicos 2 . Se especifica como:u t = ρu t−1 + ɛ tt = 1, 2, . . . , T<strong>de</strong> forma que la perturbación en el periodo t <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la perturbación <strong><strong>de</strong>l</strong> periodo anterior (t − 1)más un término aleatorio (o innovación) ɛ t cuyas características son:E(ɛ t ) = 0 ∀tE(ɛ 2 t ) = σɛ2 ∀tE(ɛ t ɛ s ) = 0 ∀t, s t ≠ sɛ t ∼ iid(0, σ 2 ɛ )y que habitualmente se le llama ruido blanco 3 . La especificación completa <strong><strong>de</strong>l</strong> MRLG cuando laperturbaciones presentan autocorrelación es:Y t = β 1 + β 2 X 2t + β 3 X 3t + . . . + β K X Kt + u tt = 1, 2, . . . , Tu t = ρu t−1 + ɛ t ɛ t ∼ iid(0, σ 2 ɛ ) |ρ| < 1El coeficiente ρ mi<strong>de</strong> la correlación entre u t y u t−1 y <strong>de</strong>be cumplir que |ρ| < 1 para que el procesono sea explosivo. Se le <strong>de</strong>nomina coeficiente <strong>de</strong> autocorrelación <strong>de</strong> or<strong>de</strong>n uno (o primer or<strong>de</strong>n) yaque uno es el número <strong>de</strong> periodos entre u t y u t−1 :ρ =Cov(u t , u t−1 )√V ar(ut ) √ V ar(u t−1 )− 1 < ρ < 1Si la covarianza es positiva se le <strong>de</strong>nomina correlación positiva y si es negativa, correlación negativa.Dado que u t = Y t − E(Y t |{X it } K i=1 ) la perturbación representa la diferencia entre el comportamientoobservado y el comportamiento promedio. Dados los posibles valores <strong>de</strong> ρ tenemos que:i) Si ρ > 0 entonces un valor elevado <strong>de</strong> u t genera un valor <strong>de</strong> Y t por encima <strong><strong>de</strong>l</strong> promedio ytendrá mayor probabilidad <strong>de</strong> ir seguido por un valor elevado <strong>de</strong> u t+1 y así sucesivamente.ii) Si ρ < 0 un valor alto <strong>de</strong> u t irá seguido por un valor bajo <strong>de</strong> u t+1 y éste por uno alto <strong>de</strong> u t+2y así sucesivamente.La relación entre la perturbación u t y la innovación ɛ t se recoge en el diagrama siguiente:u t−2 −→ u t−1 −→ u t −→ u t+1↑ ↑ ↑ ↑ɛ t−2 ɛ t−1 ɛ t ɛ t+12 El proceso autorregresivo <strong>de</strong> or<strong>de</strong>n uno no es el único proceso que recoge dinámica en la perturbación. El procesoautorregresivo más general <strong>de</strong> todos es el proceso autorregresivo <strong>de</strong> or<strong>de</strong>n p, AR(p):u t = ρ 1 u t−1 + ρ 2 u t−2 + . . . + ρ p u t−p + ɛ tA<strong>de</strong>más existen otros procesos alternativos a los autorregresivos.3 Si nos fijamos, ɛ t cumple las hipótesis básicas sobre la perturbación, es por tanto homocedástica y no autocorrelada.183


uttuttEstadística Actuarial: Análisis <strong>de</strong> Regresiónpor lo que cada innovación influye sobre la perturbación en el mismo periodo o períodos posteriores,pero nunca sobre los valores anteriores, es <strong>de</strong>cir: E(ɛ t u t−s ) = 0 s > 0. A<strong>de</strong>más en el diagrama sepue<strong>de</strong> observar que u t no <strong>de</strong>pen<strong>de</strong> directamente <strong>de</strong> u t−2 pero sí lo hace a través <strong>de</strong> u t−1 , por tantou t está correlado con todos las perturbaciones pasadas.Figura 6.8: Proceso autorregresivo <strong>de</strong> or<strong>de</strong>n unoEn la izquierda <strong>de</strong> la Figura 6.8 se observa un proceso autorregresivo <strong>de</strong> primer or<strong>de</strong>n con parámetroρ positivo. En ella po<strong>de</strong>mos observar una racha <strong>de</strong> residuos positivos seguidos <strong>de</strong> una racha <strong>de</strong>residuos negativos y así sucesivamente. En cambio, cuando el parámetro <strong><strong>de</strong>l</strong> proceso autorregresivoes negativo, los signos <strong>de</strong> los residuos se alternan como po<strong>de</strong>mos ver en la figura <strong>de</strong> la <strong>de</strong>recha <strong><strong>de</strong>l</strong>mismo gráfico.Detección <strong>de</strong> la autocorrelaciónEn la práctica no se conoce a priori si existe autocorrelación ni cuál es el proceso más a<strong>de</strong>cuadopara mo<strong><strong>de</strong>l</strong>arla. Para <strong>de</strong>terminar su existencia es necesario contrastar dicha hipótesis mediante unestadístico <strong>de</strong> contraste.Si embargo, ningún contraste <strong>de</strong> autocorrelación <strong>de</strong>be excluir un examen riguroso <strong>de</strong> los residuosgenerados en la estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. El gráfico <strong>de</strong> los mismos pue<strong>de</strong> indicarnos la existencia <strong>de</strong>autocorrelación. Dado que los residuos son una aproximación a la perturbación, la existencia <strong>de</strong>patrones o comportamientos sistemáticos en los mismos indicaría la posible existencia <strong>de</strong> autocorrelaciónen u t . Por ejemplo, po<strong>de</strong>mos esperar que el gráfico <strong>de</strong> la evolución temporal <strong>de</strong> û t,MCO secomporte <strong>de</strong> forma similar a lo mostrado por la Figura 6.8. Sin embargo, también po<strong>de</strong>mos dibujarla evolución temporal <strong>de</strong> û t,MCO contra la <strong>de</strong> û s,MCO para s = t − 1. Si encontramos que la mayoría<strong>de</strong> los puntos en dicho gráfico se hallan en el primer o tercer cuadrante, izquierda <strong>de</strong> la Figura 6.9,ello es un indicio <strong>de</strong> autocorrelación positiva. Si se hallan en el segundo y cuarto cuadrante, <strong>de</strong>recha<strong>de</strong> la Figura 6.9, indicará autocorrelación negativa.Tras el análisis gráfico, si sospechamos que existe autocorrelación <strong>de</strong>bemos contrastarla con unestadístico <strong>de</strong> contraste. Existen varios estadísticos <strong>de</strong> contraste pero en este tema vamos a estudiarsólo uno, el estadístico <strong>de</strong> Durbin Watson, específico para contrastar la existencia <strong>de</strong> un procesoautorregresivo <strong>de</strong> primer or<strong>de</strong>n.184


utusutusEstadística Actuarial: Análisis <strong>de</strong> RegresiónContraste <strong>de</strong> Durbin WatsonFigura 6.9: Perturbaciones AR(1) positivo versus AR(1) negativoDurbin y Watson propusieron en 1951 un estadístico para contrastar la existencia <strong>de</strong> un procesoAR(1) en el término <strong>de</strong> perturbación. La hipótesis nula es la no existencia <strong>de</strong> autocorrelación:frente a la alternativay se contrasta mediante el estadístico:H 0 : ρ = 0H a : ρ ≠ 0 en u t = ρu t−1 + ɛ t ɛ t ∼ (0, σ 2 ɛ )DW =∑ Tt=2 (û t − û t−1 ) 2∑ Tt=1 û2 tdon<strong>de</strong> û t son los residuos mínimo-cuadráticos ordinarios <strong>de</strong> estimar el mo<strong><strong>de</strong>l</strong>o original sin tener encuenta la existencia <strong>de</strong> autocorrelación en las perturbaciones. Gretl proporciona el valor <strong>de</strong> esteestadístico entre los resultados <strong>de</strong> la estimación MCO. Sin embargo antes <strong>de</strong> utilizarlo vamos aestudiar su interpretación y manejo sin recurrir a gretl.• Interpretación <strong><strong>de</strong>l</strong> estadístico DW:Si el tamaño muestral es suficientemente gran<strong>de</strong> 4 po<strong>de</strong>mos emplear la relación DW ≃ 2(1 − ˆρ) enbase a la cual po<strong>de</strong>mos establecer el siguiente comportamiento en los residuos:• Si existe autocorrelación positiva <strong>de</strong> primer or<strong>de</strong>n, valores positivos <strong><strong>de</strong>l</strong> término <strong>de</strong> error u ttiendan a ir seguidos <strong>de</strong> valores positivos y asimismo, valores negativos tiendan a ir seguidos4 Teniendo en cuenta las aproximaciones:con lo queT∑û 2 t ≃t=2DW ≃ 2 ∑ Tt=2 û2 t − 2 ∑ T∑ Tt=1 û2 tT∑û 2 t−1 ≃t=2t=2 ûtût−1T∑t=1û 2 t∑ Tt=2≃ 2 − 2 ∑ ûtût−1T≃ 2(1 − ˆρ)t=2 û2 t−1don<strong>de</strong> ˆρ es el estimador <strong>de</strong> ρ por MCO∑en el mo<strong><strong>de</strong>l</strong>o u t = ρu t−1 + ɛ t , empleando como aproximación <strong>de</strong> u t el residuoût ûMCO, es <strong>de</strong>cir, û t = ρû t−1 + ɛ t y ˆρ = t−1∑ û2 t−1.185


Estadística Actuarial: Análisis <strong>de</strong> Regresión<strong>de</strong> valores negativos. Dado que la aproximación a la perturbación es el residuo, los patronesen la perturbación serán <strong>de</strong>tectados en el residuo. Así, observaremos agrupaciones <strong>de</strong> residuospositivos seguidas <strong>de</strong> agrupaciones <strong>de</strong> residuos negativos. En estas circunstancias, generalmente|û t − û t−1 | < |û t | ⇒ (û t − û t−1 ) 2 < û 2 t y el numerador <strong><strong>de</strong>l</strong> estadístico “será pequeño” enrelación al <strong>de</strong>nominador, con lo que el estadístico “será pequeño”. En consecuencia cuantomás cercano esté el parámetro ρ a la unidad más próximo a cero estará el DW. En el extremopositivo tenemos que ρ −→ 1 ⇒ DW −→ 0.• Si existe autocorrelación negativa <strong>de</strong> primer or<strong>de</strong>n, valores positivos <strong>de</strong> û t tien<strong>de</strong>n a ir seguidos<strong>de</strong> valores negativos, en este caso |û t −û t−1 | > |û t | ⇒ (û t −û t−1 ) 2 > û 2 t con lo que el estadísticoDW ten<strong>de</strong>rá a tomar valores gran<strong>de</strong>s. En el extremo negativo tenemos que ρ −→ −1 ⇒DW −→ 4.A partir <strong>de</strong> la relación DW ≃ 2(1 − ˆρ) se pue<strong>de</strong> establecer el rango <strong>de</strong> valores que pue<strong>de</strong> tomar elestadístico DW.0 < ˆρ < 1 DW ∈ (0, 2)ˆρ = 0 DW ≃ 2−1 < ˆρ < 0 DW ∈ (2, 4)La distribución <strong><strong>de</strong>l</strong> estadístico DW bajo H 0 <strong>de</strong>pen<strong>de</strong> <strong>de</strong> la matriz <strong>de</strong> regresores X por lo quelos valores críticos <strong><strong>de</strong>l</strong> contraste también serán diferentes para cada posible X. Durbin y Watsontabularon los valores máximo (d U ) y mínimo (d L ) que pue<strong>de</strong> tomar el estadístico in<strong>de</strong>pendientemente<strong>de</strong> cuál sea X, y tal que d L < DW < d U . La distribución <strong>de</strong> d L y d U <strong>de</strong>pen<strong>de</strong> <strong><strong>de</strong>l</strong> tamaño <strong>de</strong> lamuestra, T, y <strong>de</strong> K ′ que <strong>de</strong>nota el número <strong>de</strong> variables explicativas <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o exceptuando eltérmino in<strong>de</strong>pendiente.• Contraste <strong>de</strong> existencia <strong>de</strong> autocorrelación positiva:H 0 : ρ = 0H a : ρ > 0 en u t = ρu t−1 + ɛ t |ρ| < 1 ɛ t ∼ iid(0, σ 2 ɛ )1. Si DW < d L se rechaza la H 0 para un nivel <strong>de</strong> significatividad α dado, por tanto existeautocorrelación positiva.2. Si DW > d U no se rechaza la H 0 para un nivel <strong>de</strong> significatividad α dado, por tanto no existeautocorrelación positiva.3. Si d L < DW < d U estamos en una zona <strong>de</strong> incertidumbre y no po<strong>de</strong>mos concluir si existe ono autocorrelación positiva <strong>de</strong> primer or<strong>de</strong>n.• Contraste <strong>de</strong> existencia <strong>de</strong> autocorrelación negativa:H 0 : ρ = 0H a : ρ < 0 en u t = ρu t−1 + ɛ t |ρ| < 1 ɛ t ∼ iid(0, σ 2 ɛ )1. Si DW < 4 − d U no se rechaza la H 0 para un nivel <strong>de</strong> significatividad α dado, por tanto noexiste autocorrelación negativa.186


Estadística Actuarial: Análisis <strong>de</strong> Regresión2. Si DW > 4 − d L se rechaza la H 0 para un nivel <strong>de</strong> significatividad α dado, por tanto existeautocorrelación negativa.3. Si 4 − d U < DW < 4 − d L estamos en una zona <strong>de</strong> incertidumbre y como en el caso anterior,no po<strong>de</strong>mos concluir si existe o no autocorrelación negativa <strong>de</strong> primer or<strong>de</strong>n.Gráficamente:H 0 : ρ = 0Autocorrelación positivaAutocorrelación negativa←− − − − − H a : ρ > 0 − − − −− −→ ←− − − − − − − −H a : ρ < 0 − − − −− −→| | | | |Rechazar | | Aceptar ρ = 0 | | Rechazarρ = 0 | Duda | | | Duda | ρ = 0| | | | |0 d L d U 2 4 − d U 4 − d L 4Si el resultado <strong><strong>de</strong>l</strong> contraste es que existe autocorrelación y ésta no es <strong>de</strong>bida a una mala especificación<strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o, éste no <strong>de</strong>be ser estimado por MCO ya que este estimador es ineficiente. Si laautocorrelación es originada por una mala especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o primero se ha <strong>de</strong> corregir estaespecificación y una vez el mo<strong><strong>de</strong>l</strong>o esté correctamente especificado analizar las propieda<strong>de</strong>s <strong>de</strong> laperturbación y actuar en consecuencia.• Observaciones sobre el contraste <strong>de</strong> Durbin Watson:1. El contraste <strong>de</strong> Durbin Watson también se pue<strong>de</strong> consi<strong>de</strong>rar un contraste <strong>de</strong> mala especificación<strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. La omisión <strong>de</strong> variables relevantes correlacionadas, una forma funcionalina<strong>de</strong>cuada, cambios estructurales no incluidos en el mo<strong><strong>de</strong>l</strong>o, etc., pue<strong>de</strong>n originar un estadísticoDW significativo. Esto nos pue<strong>de</strong> llevar a errores si consi<strong>de</strong>ramos que hay evi<strong>de</strong>ncia<strong>de</strong> autocorrelación y se mo<strong><strong>de</strong>l</strong>a un proceso AR(1). Por otro lado, si u t sigue un proceso distinto<strong>de</strong> un AR(1), es probable que el estadístico DW lo <strong>de</strong>tecte. Por lo tanto, el estadístico<strong>de</strong> Durbin Watson es útil porque nos indica la existencia <strong>de</strong> problemas en el mo<strong><strong>de</strong>l</strong>o, pero aveces no nos ayuda a establecer cuál es la estructura real. En caso <strong>de</strong> no rechazar la H 0 , po<strong>de</strong>mosafirmar que no tenemos un AR(1), pero no sabemos si tenemos alguna otra estructuraalternativa.2. Por otro lado el estadístico DW sólo <strong>de</strong>be aplicarse cuando los regresores son no estocásticos,en presencia <strong>de</strong> regresores aleatorios como la variable endógena retardada no tiene vali<strong>de</strong>z.3. Cuando el estadístico DW cae en zona <strong>de</strong> duda, y si no po<strong>de</strong>mos llevar a cabo un contrastealternativo, no <strong>de</strong>bemos concluir que no existe autocorrelación. El procedimiento conservadoraconseja rechazar la hipótesis nula y estimar por un estimador alternativo a MCO ya que lasconsecuencias <strong>de</strong> ignorar su existencia cuando sí la hay son más graves que las correspondientesal caso contrario.187


Estadística Actuarial: Análisis <strong>de</strong> Regresión6.4. PredicciónAunque pueda consi<strong>de</strong>rarse que la obtención <strong>de</strong> un buen conjunto <strong>de</strong> estimaciones es el objetivoprincipal <strong>de</strong> la Econometría, a menudo también tiene gran importancia el logro <strong>de</strong> unas prediccionesprecisas. Supongamos que con N observaciones se ha estimado el mo<strong><strong>de</strong>l</strong>o:Y i = β 1 + β 2 X 2i + . . . + β K X Ki + u i .Dada una nueva observación <strong>de</strong> las variables explicativas,X ′ p = [ 1 X 2p · · · X Kp]p ∉ {1, 2, . . . , N}se pue<strong>de</strong> utilizar el mo<strong><strong>de</strong>l</strong>o estimado por MCO para pre<strong>de</strong>cir el valor que tendrá la variable endógena(<strong>de</strong>sconocido en ese momento). Dado el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión, la ecuación para Y p es:Y p = β 1 + β 2 X 2p + . . . + β K X Kp + u pPara abreviar, utilizaremos la expresión vectorial:Y p = X ′ pβ + u pDada la información muestral disponible (no conocemos β ni u p ) la predicción por punto <strong>de</strong> Y pes:Ŷ p = X ′ p ˆβ MCOO lo que es lo mismo:Ŷ p = ˆβ 1 + ˆβ 2 X 2p + . . . + ˆβ K X Kp .Hay cuatro fuentes potenciales <strong>de</strong> error al realizar una predicción:1. El error <strong>de</strong> especificación. El mo<strong><strong>de</strong>l</strong>o <strong>de</strong> regresión en que nos basamos pue<strong>de</strong> ser incorrecto:pue<strong>de</strong>n faltar variables explicativas que afectan <strong>de</strong> manera clave a Y , pue<strong>de</strong> que la formafuncional propuesta no sea correcta, pue<strong>de</strong> que se no se cumpla alguna hipótesis básica, etc.2. Error en los valores <strong>de</strong> X p . La predicción se hace para unos valores dados <strong>de</strong> X p , pero estospue<strong>de</strong>n ser <strong>de</strong>sconocidos en el momento en que se hace la predicción.3. El error muestral. No hay más remedio que usar ˆβ en vez <strong>de</strong> los valores verda<strong>de</strong>ros β parahacer la predicción.4. El error aleatorio. Y p <strong>de</strong>pen<strong>de</strong>rá <strong>de</strong> u p , la perturbación aleatoria (<strong>de</strong>sconocida) correspondientea esa observación. Cuanto más diferente sea <strong>de</strong> cero, mayor será este error.Dadas todas estas fuentes <strong>de</strong> incertidumbre a la hora <strong>de</strong> pre<strong>de</strong>cir Y , es muy recomendable que lapredicción puntual <strong>de</strong> Y se acompañe con una medida <strong>de</strong> lo precisa que esperamos que sea esapredicción. En esto consiste la predicción por intervalo.188


Estadística Actuarial: Análisis <strong>de</strong> Regresión• Predicción por intervalo <strong><strong>de</strong>l</strong> valor <strong>de</strong> la variable endógenaEs muy difícil que el valor predicho para Y p , Ŷp coincida con el valor real. Si la predicción por puntose hace para el mes siguiente, o para el año siguiente, llegará un momento en que conoceremos elerror cometido. Este error se <strong>de</strong>nomina error <strong>de</strong> predicción y es igual ae p = Y p − ŶpEn el momento en que hacemos la predicción, tenemos cierta información sobre e p , ya que es unavariable aleatoria con una distribución conocida. En concreto,e p ∼ N(0, σ 2 ( 1 + X ′ p(X ′ X ) −1 Xp ))Demostración:e p = Y p − Ŷp = X ′ p β + u p − X ′ p ˆβ == u p − X ′ p ( ˆβ−β) (6.16)Buscamos su distribución. Si u p es normal el estimador MCO dado que es lineal en la perturbacióntambién lo será y por tanto el error <strong>de</strong> predicción también lo es. En cuanto a su media y varianza:[E(e p ) = E u p − X p ′ ( ˆβ−β)]= 0 − X p ′ (β − β) = 0V (e p ) = E [e p − E(e p )] [e p − E(e p )] ′ == E ( e p e ′ p)=[ (= E u p − X p ′ ( ˆβ−β)) (u p − X p ′ ( ˆβ−β)) ] ′== E [ u p u ′ ]p + E[X p ′ ( ˆβ−β) ( ˆβ−β)] [′ X p − 2X p ′ E ( ˆβ−β)]u ′ p == E ( [u 2 p)+ X′p E ( ˆβ−β) ( ˆβ−β) ′] [ (X p − 2X p ′ E X ′ X ) ]−1 X ′ u u p= σ 2 + σ 2 X p ′ (X ′ X ) −1 Xp ( − 0 == σ 2 1 + X p′ (X ′ X ) )−1 Xp=Por tanto:( e p ∼ N(0, σ 2 1 + X p′ (X ′ X ) )−1 Xp )Tipificando el error <strong>de</strong> predicción queda:e p − 0√ ∼ N(0, 1)σ 1 + X p ′ ( X ′ X ) −1 X pEl problema es que σ 2 es <strong>de</strong>sconocida. Utilizando que e p y ˆσ 2 obtenemose p√ ∼ t (N−K)ˆσ 1 + X p ′ ( X ′ X ) −1 X p189


Estadística Actuarial: Análisis <strong>de</strong> RegresiónDe hecho el <strong>de</strong>nominador final es ˆσ ep (la <strong>de</strong>sviación estimada <strong><strong>de</strong>l</strong> error <strong>de</strong> predicción). Tras sustituire p = Y p − Ŷp , se pue<strong>de</strong> utilizar dicha distribución para obtener el siguiente intervalo <strong>de</strong> predicciónpara la variable endógena:[]P r − t α2 (N−K) ≤ Y p − Ŷp ≤ t αˆσ 2 (N−K) = 1 − αepP r[Ŷp − t α2 (N−K) · ˆσ ep ≤ Y p ≤ Ŷp + t α2 (N−K) · ˆσ ep]= 1 − αIC 1−α (Y p ) =(Ŷp − t α2 (N−K) ˆσ ep , Ŷ p + t α2 (N−K) ˆσ ep)Ejercicio 6.1Una gestoría comercializa 100 pólizas <strong>de</strong> seguro. Para tener información acerca <strong><strong>de</strong>l</strong> tipo<strong>de</strong> póliza más solicitada utiliza el siguiente mo<strong><strong>de</strong>l</strong>o:don<strong>de</strong>N i = β 1 H i + β 2 V i + β 3 M i + β 4 A i + u i i = 1, . . . , 100• N i es el número <strong>de</strong> pólizas suscritas <strong><strong>de</strong>l</strong> producto i-ésimo.{ 1 si la póliza pertenece a seguros <strong><strong>de</strong>l</strong> hogar• H i =0 en caso caso contrario{ 1 si la póliza pertenece al ramo <strong>de</strong> seguros <strong>de</strong> vida• V i =0 en caso caso contrario{ 1 si la póliza pertenece al ramo <strong>de</strong> seguros médicos• M i =0 en caso caso contrario{ 1 si la póliza pertenece a seguros automovilísticos• A i =0 en caso caso contrarioLas ventas para el año 1994 se resumen en:∑∑N i = 380 N i = 150i∈Hogari=100∑i=1i∈V idaN 2 i = 20000∑i∈MédicosN i = 70∑i∈Automóviles∑100∑100∑100∑100H i = V i = M i = A i = 25i=1i=11. Interpreta los parámetros <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o propuesto.2. Estima los parámetros por MCO.i=1i=1N i = 5003. Contrasta si hay diferencias significativas en el número <strong>de</strong> suscripciones según elramo <strong>de</strong> seguros al que pertenecen.4. Halla un intervalo <strong>de</strong> confianza <strong><strong>de</strong>l</strong> 95 % para el número <strong>de</strong> suscripciones <strong>de</strong> pólizasmédicas.190


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEjercicio 6.2Supón que se quieren explicar los rendimientos <strong>de</strong> los índices bursátiles, R t , <strong>de</strong> variospaíses a través <strong>de</strong> su localización geográfica y <strong>de</strong> los tipos <strong>de</strong> interés reales, I t , consi<strong>de</strong>randopara estos últimos que es suficiente con especificar si los tipos son positivos onegativos. Los datos aparecen en la Tabla 6.1.1. Especifica un mo<strong><strong>de</strong>l</strong>o para el comportamiento <strong>de</strong> R t con la información que se da.2. Supón ahora que sólo se consi<strong>de</strong>ra importante en cuanto a la localización si el paísestá o no en Europa (i.e. Europa v.s. Resto <strong><strong>de</strong>l</strong> Mundo) y reespecifica el mo<strong><strong>de</strong>l</strong>o.3. Estima el mo<strong><strong>de</strong>l</strong>o que has propuesto en el apartado anterior.4. Supón que, para Portugal, el tipo <strong>de</strong> interés es positivo y el rendimiento <strong>de</strong> su índicebursátil <strong><strong>de</strong>l</strong> 35 %. ¿Consi<strong>de</strong>ras que el mercado bursátil en Portugal tiene el mismocomportamiento que en los otros países europeos?RendimientoR tt/iEuropaAlemania 10 % positivoFrancia 20 % positivoReino Unido 15 % positivoItalia 40 % positivoAméricaEEUU 20 % negativoCanadá 22 % negativoSu<strong>de</strong>ste AsiáticoJapón -5 % positivoHong Kong 30 % positivoSingapur 35 % negativoTaiwán 22 % negativoI tTabla 6.1: Observaciones sobre rendimiento y t/i por país6.5. Validación en gretl6.5.1. Contraste <strong>de</strong> Ramsey con gretlEl contraste <strong>de</strong> Ramsey es uno <strong>de</strong> los contrastes que pue<strong>de</strong>n realiarse una vez estimado en gretl unmo<strong><strong>de</strong>l</strong>o. En la pantalla <strong>de</strong> resultados <strong>de</strong> la estimación Mínimo Cuadrática Ordinaria pincharContrastes −→ Contraste RESET <strong>de</strong> Ramseyy elegir las variables que queremos introducir en la especificación para el contraste:191


Estadística Actuarial: Análisis <strong>de</strong> Regresión• cuadrados y cubos• solo cuadrados• solo cubos• todas las variantesPara mostrar cómo contrastar la ausencia <strong>de</strong> correlación utilizaremos el archivo <strong>de</strong> datos Ramanathandata3-3.gdt. En este archivo <strong>de</strong> datos se dispone <strong>de</strong> 34 observaciones para el periodo 1960-1993(serie temporal por tanto) sobre el número <strong>de</strong> resultados <strong>de</strong> patentes en miles, P AT ENT ES, ysobre el gasto en I + D, en billones <strong>de</strong> dólares. La relación a estudiar es:P AT ENT ES t = α + β(I + D) t + u t (6.17)Los resultados <strong>de</strong> la estimación MCO son los siguientes:Mo<strong><strong>de</strong>l</strong>o 1: MCO, usando las observaciones 1960–1993 (T = 34)Variable <strong>de</strong>pendiente: PATENTSCoeficiente Desv. Típica Estadístico t Valor pconst 34,5711 6,35787 5,4375 0,0000I+D 0,791935 0,0567036 13,9662 0,0000Media <strong>de</strong> la vble. <strong>de</strong>p. 119,2382 D.T. <strong>de</strong> la vble. <strong>de</strong>p. 29,30583Suma <strong>de</strong> cuad. residuos 3994,300 D.T. <strong>de</strong> la regresión 11,17237R 2 0,859065 R 2 corregido 0,854661F (1, 32) 195,0551 Valor p (<strong>de</strong> F ) 3,64e–15Log-verosimilitud −129,2704 Criterio <strong>de</strong> Akaike 262,5408Criterio <strong>de</strong> Schwarz 265,5935 Hannan–Quinn 263,5818ˆρ 0,945182 Durbin–Watson 0,233951Contraste <strong>de</strong> especificación RESET (cuadrados y cubos) Estadístico <strong>de</strong> contraste: F = 47, 161051,con valor-p= P (F (2, 30) > 47, 1611) = 5, 48e − 010.Contraste <strong>de</strong> especificación RESET (cuadrados sólo) Estadístico <strong>de</strong> contraste: F = 14, 824629, convalor-p= P (F (1, 31) > 14, 8246) = 0, 000553.Contraste <strong>de</strong> especificación RESET (cubos sólo) Estadístico <strong>de</strong> contraste: F = 18, 475400, con valorp=P (F (1, 31) > 18, 4754) = 0, 000158. En cualquiera <strong>de</strong> las posibilida<strong>de</strong>s se rechaza la hipótesisnula luego la especicificación lineal no es a<strong>de</strong>cuada, comopue<strong>de</strong> apreciarse en la Figura 6.15 don<strong>de</strong>se muestra la nube <strong>de</strong> puntos correspondiente.192


Estadística Actuarial: Análisis <strong>de</strong> RegresiónPATENTS con respecto a R D (con ajuste mínimo−cuadrático)200Y = 34,6 + 0,792X180160PATENTS140120100806060 80 100 120 140 160R DFigura 6.10: Variable endógena versus exógena6.5.2. Contraste <strong>de</strong> cambio estructural o Chow con gretlUtilizando gretl una vez abierto el fichero <strong>de</strong> datos y estimado el mo<strong><strong>de</strong>l</strong>o correspondiente por MCO,en la ventana <strong>de</strong> resultados <strong>de</strong> la estimación haríamos:Contrastes −→ Contraste <strong>de</strong> ChowA la pregunta Observación en la cual dividir la muestra contestaríamos fecha correspondiente a T 1y automáticamente gretl realiza el contraste y nos muestra el resultado.Por ejemplo el fichero data7-19 <strong><strong>de</strong>l</strong> libro <strong>de</strong> Ramanathan contiene datos para 1960-1988 sobre la<strong>de</strong>manda <strong>de</strong> tabaco y sus <strong>de</strong>terminantes en Turquía. Las variables <strong>de</strong> interés para el ejemplo sonlas siguientes:Q: consumo <strong>de</strong> tabaco por adulto (en kg).Y : PNB real per cápita en liras turcas <strong>de</strong> 1968.P : precio real <strong><strong>de</strong>l</strong> kilogramo <strong>de</strong> tabaco, en liras turcas.D82: variable ficticia que toma valor 1 a partir <strong>de</strong> 1982.A mediados <strong>de</strong> 1981 el gobierno turco lanza una campaña <strong>de</strong> salud pública advirtiendo <strong>de</strong> los peligros<strong>de</strong> salud que conlleva el consumo <strong>de</strong> tabaco. Nuestro objetivo es <strong>de</strong>terminar si existen cambios enla <strong>de</strong>manda <strong>de</strong> tabaco tras la campaña institucional en cuyo caso la especificación:LnQ t = α + βLnY t + γLnP t + u t t = 1960, . . . , 1988 (6.18)no es correcta para todo el período muestral y <strong>de</strong>beríamos especificar dos ecuaciones:LnQ t = α 1 + β 1 LnY t + γ 1 LnP t + u 1t t = 1960, . . . , 1981 (6.19)LnQ t = α 2 + β 2 LnY t + γ 2 LnP t + u 2t t = 1982, . . . , 1988 (6.20)Si existe cambio estructural rechazaríamos H 0 : α 1 = α 2 , β 1 = β 2 y γ 1 = γ 2En este caso la contestación a la pregunta Observación en la cual dividir la muestra contestaríamos1982 y el output <strong>de</strong> gretl muestra lo siguiente:193


Estadística Actuarial: Análisis <strong>de</strong> RegresiónMo<strong><strong>de</strong>l</strong>o 1: estimaciones MCO utilizando las 29 observaciones 1960-1988Variable <strong>de</strong>pendiente: lnQVariable Coeficiente Desv. típica Estadístico t valor pconst −4,58987 0,724913 −6,332 0,00001∗∗∗lnY 0,688498 0,0947276 7,268 0,00001∗∗∗lnP 0,485683 0,101394 −4,790 0,00006∗∗∗Media <strong>de</strong> la var. <strong>de</strong>pendiente = 0,784827Desviación típica <strong>de</strong> la var. <strong>de</strong>pendiente. = 0,108499Suma <strong>de</strong> cuadrados <strong>de</strong> los residuos = 0,0949108Desviación típica <strong>de</strong> los residuos = 0,0604187R-cuadrado = 0,712058R-cuadrado corregido = 0,689908Estadístico F (2, 26) = 32,148 (valor p < 0,00001)Estadístico <strong>de</strong> Durbin-Watson = 1,00057Coef. <strong>de</strong> autocorr. <strong>de</strong> primer or<strong>de</strong>n. = 0,489867Log-verosimilitud = 41,8214Criterio <strong>de</strong> información <strong>de</strong> Akaike (AIC) = -77,6429Criterio <strong>de</strong> información Bayesiano <strong>de</strong> Schwarz (BIC) = -73,541Criterio <strong>de</strong> Hannan-Quinn (HQC) = -76,3582Contraste <strong>de</strong> Chow <strong>de</strong> cambio estructural en la observación 1982 -Hipótesis nula: no hay cambio estructuralEstadístico <strong>de</strong> contraste: F(3, 23) = 20,1355con valor p = P(F(3, 23) > 20,1355) = 1,25619e-006El estadístico calculado es F = 20, 135 > F 0,05 (3, 23) por lo que rechazamos H 0 para un nivel <strong>de</strong>significatividad <strong><strong>de</strong>l</strong> 5 %, es <strong>de</strong>cir existe cambio estructural, la campaña institucional ha tenido efectoy la <strong>de</strong>manda <strong>de</strong> tabaco en Turquía <strong>de</strong> 1960 a 1988 queda especificada por las ecuaciones (6.19) y(6.20). Los resultados <strong>de</strong> la estimación mínimo cuadrática <strong>de</strong> estas ecuaciones son los siguientes:LnQ ̂ t = −5, 024(-10,614)+ 0, 735 LnY t − 0, 381 LnP t t = 1960, . . . , 1981 SCR 1 = 0, 01654(11,587) (-4,227)LnQ ̂ t = 8, 837 + −0, 953 LnY t + 0, 108 LnP t t = 1982, . . . , 1988 SCR 2 = 0, 00965(2,170) (-1,941) (0,654)Cambio estructural utilizando variables ficticiasAlternativamente, el contraste anterior podríamos haberlo realizado mediante la variable ficticiaD82 especificando el mo<strong><strong>de</strong>l</strong>o:LnQ t = β 1 + β 2 LnY t + β 3 LnP t + β ⋆ 1D82 t + β ⋆ 2D82 t · LnY t + β ⋆ 3D82 t · LnP t + u t t = 60, . . . , 88(6.21)194


Estadística Actuarial: Análisis <strong>de</strong> RegresiónEn el cual, si existe cambio estructural rechazaríamos H 0 : β1 ⋆ = β⋆ 2 = β⋆ 3 = 0. De nuevo el contrastepue<strong>de</strong> realizarse con el estadístico F habitual <strong>de</strong> sumas residuales don<strong>de</strong> el mo<strong><strong>de</strong>l</strong>o no restringidoes el (6.21) y el mo<strong><strong>de</strong>l</strong>o restringido esLnQ t = β 1 + β 2 LnY t + β 3 LnP t + u t (6.22)Utilizando gretl el proceso <strong>de</strong>spués <strong>de</strong> abierto el fichero <strong>de</strong> datos, tomado logaritmos y construidolas variables D82 · LnY y D82 · LnP sería: estimaríamos el mo<strong><strong>de</strong>l</strong>o (6.21) por MCO y en la ventana<strong>de</strong> resultados <strong>de</strong> la estimación haríamosContrastes −→ Omitir variableselegiríamos D82, D82 · LnY y D82 · LnP y obtendríamos el siguiente resultado:Mo<strong><strong>de</strong>l</strong>o 1: estimaciones MCO utilizando las 29 observaciones 1960-1988Variable <strong>de</strong>pendiente: lnQVariable Coeficiente Desv. típica Estadístico t valor pconst −4,58987 0,724913 −6,332 0,00001∗∗∗lnY 0,688498 0,0947276 7,268 0,00001∗∗∗lnP 0,485683 0,101394 −4,790 0,00006∗∗∗Media <strong>de</strong> la var. <strong>de</strong>pendiente = 0,784827Desviación típica <strong>de</strong> la var. <strong>de</strong>pendiente. = 0,108499Suma <strong>de</strong> cuadrados <strong>de</strong> los residuos = 0,0949108Desviación típica <strong>de</strong> los residuos = 0,0604187R-cuadrado = 0,712058R-cuadrado corregido = 0,689908Estadístico F (2, 26) = 32,148 (valor p < 0,00001)Estadístico <strong>de</strong> Durbin-Watson = 1,00057Coef. <strong>de</strong> autocorr. <strong>de</strong> primer or<strong>de</strong>n. = 0,489867Log-verosimilitud = 41,8214Criterio <strong>de</strong> información <strong>de</strong> Akaike (AIC) = -77,6429Criterio <strong>de</strong> información Bayesiano <strong>de</strong> Schwarz (BIC) = -73,541Criterio <strong>de</strong> Hannan-Quinn (HQC) = -76,3582Comparación entre el mo<strong><strong>de</strong>l</strong>o 10 y el mo<strong><strong>de</strong>l</strong>o 11:Hipótesis nula: los parámetros <strong>de</strong> regresión son cero para las variablesD82D82YD82PEstadístico <strong>de</strong> contraste: F(3, 23) = 20,1355, con valor p = 1,25619e-006De los 3 estadísticos <strong>de</strong> selección <strong>de</strong> mo<strong><strong>de</strong>l</strong>os, 0 han mejorado.Dado el p-value rechazamos la hipótesis nula para un nivel <strong>de</strong> significatividad <strong><strong>de</strong>l</strong> 5 % y existe cambioestructural. La <strong>de</strong>manda <strong>de</strong> tabaco en Turquía <strong>de</strong> 1960 a 1988 queda especificada por las ecuaciones(6.19) y (6.20).195


Estadística Actuarial: Análisis <strong>de</strong> Regresión6.5.3. Contraste <strong>de</strong> heterocedasticidad con gretlPara ilustrar esta sección y lo que queda <strong><strong>de</strong>l</strong> tema vamos a utilizar el conjunto <strong>de</strong> datos Data 3.2<strong><strong>de</strong>l</strong> Ramanathan. En este conjunto <strong>de</strong> datos se dispone <strong>de</strong> 51 observaciones sobre renta personal,INCOME, y gasto sanitarios, EXP LT H ambos en billones <strong>de</strong> dólares para el estado <strong>de</strong> WashingtonD.C. en 1993. Se trata por tanto <strong>de</strong> una muestra <strong>de</strong> sección cruzada. Queremos analizar la evolución<strong><strong>de</strong>l</strong> gasto en función <strong>de</strong> la renta, así especificamos el mo<strong><strong>de</strong>l</strong>o:EXP LT H i = α + βINCOME i + u i i = 1, . . . , 51 (6.23)suponemos que se cumplen las hipótesis básicas y estimamos el mo<strong><strong>de</strong>l</strong>o por MCO con los resultadossiguientes 5 :Mo<strong><strong>de</strong>l</strong>o 2: estimaciones MCO utilizando las 51 observaciones 1-51Variable <strong>de</strong>pendiente: exphlthVARIABLE COEFICIENTE DESV.TÍP. ESTAD.T 2Prob(t > |T|)0) const 0,325608 0,319742 1,018 0,3135152) income 0,142099 0,00196623 72,270 < 0,00001 ***Media <strong>de</strong> la var. <strong>de</strong>pendiente = 15,2649D.T. <strong>de</strong> la var. <strong>de</strong>pendiente = 17,8877Suma <strong>de</strong> cuadrados <strong>de</strong> los residuos = 148,699Desviación típica <strong>de</strong> los residuos = 1,74203R-cuadrado = 0,990705R-cuadrado corregido = 0,990516Grados <strong>de</strong> libertad = 49Criterio <strong>de</strong> información <strong>de</strong> Akaike (AIC) = 203,307Criterio <strong>de</strong> información Bayesiano <strong>de</strong> Schwarz (BIC) = 207,17Para un nivel <strong>de</strong> significatividad <strong><strong>de</strong>l</strong> 5 % la variable INCOME es significativa, pero el términoin<strong>de</strong>pendiente no es significativamente distinto <strong>de</strong> cero. El ajuste es muy alto, 99,07 %. Gráficamentepo<strong>de</strong>mos ver si la forma funcional lineal elegida resulta a<strong>de</strong>cuada para la relación gasto sanitariorenta.Para ello vamos a dibujar la relación gasto sanitario real y ajustado y a<strong>de</strong>más el ajuste MCO.Para ello <strong>de</strong>ntro <strong>de</strong> la venta gretl: Mo<strong><strong>de</strong>l</strong>o1 pinchamos la secuencia:Gráficos −→ Gráfico <strong>de</strong> ajustada-obervada −→ por número <strong>de</strong> observaciónGráficos −→ Gráfico <strong>de</strong> ajustada-observada −→ contra incomeLas figuras obtenidas aparecen a la izquierda y <strong>de</strong>recha, respectivamente, en la Figura 6.11.5 Recordatorio <strong>de</strong> la secuencia <strong>de</strong> ór<strong>de</strong>nes para obtener la estimación:Archivo −→ Abrir datos −→ Archivo <strong>de</strong> muestra −→ Data3.2Mo<strong><strong>de</strong>l</strong>o −→ Mínimos Cuadrados −→ seleccionar la variable endógena y exógenasLos resultados se muestran en una ventana llamada gretl: mo<strong><strong>de</strong>l</strong>o1196


Estadística Actuarial: Análisis <strong>de</strong> Regresión10090ajustadoactualexphlth observada y ajustada100exphlth con respecto a income (con ajuste m nimo-cuadrÆtico)8080706060exphlth50exphlth404030202001000 10 20 30 40 50in<strong>de</strong>x-200 100 200 300 400 500 600 700incomeFigura 6.11: Gasto sanitario real y ajustadoAparentemente el mo<strong><strong>de</strong>l</strong>o está correctamente especificado y la forma lineal especificada es a<strong>de</strong>cuada.Antes <strong>de</strong> seguir vamos a guardar los valores ajustados <strong><strong>de</strong>l</strong> gasto sanitario los residuos y suscuadrados añadiéndolos al conjunto <strong>de</strong> datos para luego po<strong>de</strong>r trabajar con ellos si es necesario. Lasecuencia <strong>de</strong> ór<strong>de</strong>nes a realizar en la ventana gretl: Mo<strong><strong>de</strong>l</strong>o1 es:Datos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o −→ Añadir al conjunto <strong>de</strong> datos −→ valores ajustadosDatos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o −→ Añadir al conjunto <strong>de</strong> datos −→ residuosDatos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o −→ Añadir al conjunto <strong>de</strong> datos −→ residuos al cuadradogretl los va a añadir al conjunto <strong>de</strong> datos con el que trabajamos y los <strong>de</strong>nota respectivamente poryhat1, uhat1 e usq1 respectivamente. A<strong>de</strong>más aña<strong>de</strong> una leyenda explicativa <strong>de</strong> la variable. Unavez hecho esto seguimos con el ejercicio.A pesar <strong><strong>de</strong>l</strong> buen ajuste encontrado, no resulta <strong>de</strong>scabellado pensar que la varianza <strong><strong>de</strong>l</strong> gasto sanitario,EXP HLT H, probablemente <strong>de</strong>pen<strong>de</strong>rá <strong>de</strong> la renta INCOME. Hemos visto que estudiarel gráfico <strong>de</strong> residuos frente a INCOME es un instrumento válido para ver indicios <strong><strong>de</strong>l</strong> problema.Para obtener el gráfico en la ventana gretl: Mo<strong><strong>de</strong>l</strong>o 1 pinchamos:Gráficos −→ Gráfico <strong>de</strong> residuos −→ contra incomeLa figura obtenida se recoge en la Figura 6.12:En el se aprecia que la dispersión <strong>de</strong> los residuos aumenta a medida que aumenta INCOME. Pareceque la varianza <strong>de</strong> EXP HLT H aumenta con INCOMEPara confirmarlo realizamos el contraste <strong>de</strong> White y los resultados <strong><strong>de</strong>l</strong> mismo son:197


Estadística Actuarial: Análisis <strong>de</strong> Regresión5Residuos verus income4321residuo0-1-2-3-4-50 100 200 300 400 500 600 700incomeFigura 6.12: Residuos MCO versus RENTAContraste <strong>de</strong> heterocedasticidad <strong>de</strong> White estimaciones MCOutilizando las 51 observaciones 1-51 Variable <strong>de</strong>pendiente: uhat^2VARIABLE COEFICIENTE DESV.TÍP. ESTAD.T 2Prob(t > |T|)0) const -1,40227 0,986956 -1,421 0,1618392) income 0,0558410 0,0121349 4,602 0,000031 ***4) sq_incom -5,87208E-05 2,10114E-05 -2,795 0,007445 ***R-cuadrado = 0,421177Estadístico <strong>de</strong> contraste: TR^2 = 21,480039, con valor p =P(Chi-cuadrado(2) > 21,480039) = 0,000022Los resultados confirman que efectivamente existe heterocedasticidad en la perturbaciones <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o(6.23). El estimador MCO obtenido no es <strong>de</strong> varianza mínima y la inferencia realizada <strong>de</strong>acuerdo a él no es válida.Esta introducción al problema <strong>de</strong> heterocedasticidad preten<strong>de</strong> que hayáis aprendido que nunca se dauna especificación por correcta sin un análisis <strong>de</strong> residuos. Que a pesar <strong>de</strong> que durante todo el cursohemos trabajado suponiendo que se cumplen unas hipótesis básicas lo habitual es que no sea así yque estas situaciones hay que saber reconocerlas. Ampliaciones sobre este tema podéis encontrar enel Capítulo 8 <strong><strong>de</strong>l</strong> Ramanathan <strong><strong>de</strong>l</strong> que nosotros solo hemos hecho un esbozo <strong>de</strong> su introducción.6.5.4. Contraste <strong>de</strong> ausencia <strong>de</strong> correlación con gretlPara mostrar cómo contrastar la ausencia <strong>de</strong> correlación utilizaremos el archivo <strong>de</strong> datos RamanathanData3-3. En este archivo <strong>de</strong> datos se dispone <strong>de</strong> 34 observaciones para el periodo 1960-1993(serie temporal por tanto) sobre el número <strong>de</strong> resultados <strong>de</strong> patentes en miles, P AT ENT ES, ysobre el gasto en I + D, en billones <strong>de</strong> dólares. La relación a estudiar es:198


Estadística Actuarial: Análisis <strong>de</strong> RegresiónP AT ENT ES t = α + β(I + D) t + u t (6.24)Los resultados <strong>de</strong> la estimación MCO son los siguientes:Mo<strong><strong>de</strong>l</strong>o 1: MCO, usando las observaciones 1960–1993 (T = 34)Variable <strong>de</strong>pendiente: PATENTSCoeficiente Desv. Típica Estadístico t Valor pconst 34,5711 6,35787 5,4375 0,0000I+D 0,791935 0,0567036 13,9662 0,0000Media <strong>de</strong> la vble. <strong>de</strong>p. 119,2382 D.T. <strong>de</strong> la vble. <strong>de</strong>p. 29,30583Suma <strong>de</strong> cuad. residuos 3994,300 D.T. <strong>de</strong> la regresión 11,17237R 2 0,859065 R 2 corregido 0,854661F (1, 32) 195,0551 Valor p (<strong>de</strong> F ) 3,64e–15Log-verosimilitud −129,2704 Criterio <strong>de</strong> Akaike 262,5408Criterio <strong>de</strong> Schwarz 265,5935 Hannan–Quinn 263,5818ˆρ 0,945182 Durbin–Watson 0,233951Los resultados muestran que para un nivel <strong>de</strong> significatividad <strong><strong>de</strong>l</strong> 5 % el término in<strong>de</strong>pendiente essignificativamente distinto <strong>de</strong> cero y el gasto en I+D es una variable significativa para explicar lasaplicaciones <strong>de</strong> las patentes. A<strong>de</strong>más existe un buen ajuste en términos <strong><strong>de</strong>l</strong> R 2 (85, 9 %). Si analizamoslos residuos MCO dibujándolos contra el tiempo obtenemos la Figura 6.13. En él po<strong>de</strong>mosver un primer grupo <strong>de</strong> residuos positivos que va seguido <strong>de</strong> un grupo <strong>de</strong> residuos negativos, otrorapositivos y a continuación negativos. Este comportamiento pue<strong>de</strong> indicar la posible existencia <strong>de</strong>un proceso autorregresivo <strong>de</strong> primer or<strong>de</strong>n y signo positivo.25Residuos <strong>de</strong> la regresi n (= PATENTES observada - ajustada)2015105residuo0-5-10-15-20-251960 1965 1970 1975 1980 1985 1990Figura 6.13: Residuos versus tiempo199


Estadística Actuarial: Análisis <strong>de</strong> RegresiónTambién podíamos haber dibujado los pares (u t−1 , u t ), ver Figura 6.14, en este caso los puntos losencontramos en el primer y tercer cuadrante indicando autocorrelación <strong>de</strong> primer or<strong>de</strong>n <strong>de</strong> signopositivo 6 .252015105uhat10-5-10-15-20-25-20 -15 -10 -5 0 5 10 15 20uhat1_1Figura 6.14: Residuos en t versus residuos en t-1Una vez analizados los gráficos <strong>de</strong>bemos realizar un contraste para cerciorarnos <strong>de</strong> la existencia <strong><strong>de</strong>l</strong>problema. Entre los resultados <strong>de</strong> la regresión se nos muestra:Estadístico <strong>de</strong> Durbin-Watson = 0,233951que utilizaremos para contrastar la existencia <strong>de</strong> un proceso autocorregresivo <strong>de</strong> primer or<strong>de</strong>n ysigno positivo en la perturbación, ya que DW ∈ (0, 2).H 0 : ρ = 0H a : ρ > 0 en u t = ρu t−1 + ɛ t ɛ t ∼ (0, σ 2 ɛ )Para ello sólo necesitamos comparar el valor <strong><strong>de</strong>l</strong> estadístico con d L y d U obtenidos en las tablascorrespondientes. Gretl nos proporciona estas tablas en la opción Herramientas que aparece en laprimera pantalla una vez se abre el programa. La secuencia a pinchar es:Herramientas −→ tablas estadísticas −→ señalar la tabla <strong>de</strong>seadaGretl proporciona las tablas estadísticas <strong>de</strong> la normal, t ( t-stu<strong>de</strong>nt), chi-cuadrado, F (F-sne<strong>de</strong>rcor)y DW (Durbin-Watson). En nuestro caso pinchamos en esta última y se nos <strong>de</strong>spliega una ventanaque nos solicita el tamaño <strong>de</strong> muestra y número <strong>de</strong> regresores. Se lo damos y pinchamos Aceptar.Como resultado gretl nos <strong>de</strong>vuelve una ventana con el valor <strong>de</strong> d L y d U para el tamaño <strong>de</strong> muestradado y diferentes valores <strong>de</strong> K ′ . Para nuestro ejemplo obtenemos:6 Para guardar los residuos en la ventana <strong>de</strong> resultados <strong>de</strong> la estimación pinchamosDatos <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o −→ Añadir al conjunto <strong>de</strong> datos −→ residuosy para obtener su retardo u t−1 seleccionamos la variable residuos y pinchamos la secuenciaDatos −→ Añadir al conjunto <strong>de</strong> datos −→ retardos <strong>de</strong> las variables seleccionadas.200


Estadística Actuarial: Análisis <strong>de</strong> RegresiónValores críticos al 5% <strong><strong>de</strong>l</strong> estadístico <strong>de</strong> Durbin-Watson, n = 134, k = 1dL = 1,7028dU = 1,7329Por tanto para nuestro ejemplo d L (T = 34, K ′ = 1) = 1, 39 y d U (T = 34, K ′ = 1) = 1, 51. ComoDW = 0, 233 < d L se rechaza la H 0 y por tanto existe autocorrelación positiva <strong>de</strong> primer or<strong>de</strong>n obien pue<strong>de</strong> <strong>de</strong>berse a una mala especificación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Antes <strong>de</strong> buscar un estimador alternativoa MCO <strong>de</strong>bemos explorar esta posibilidad e intentar especificar bien el mo<strong><strong>de</strong>l</strong>o y volver a realizar unestudio <strong>de</strong> existencia <strong>de</strong> autocorrelación para el mo<strong><strong>de</strong>l</strong>o correctamente especificado. Si analizamosla relación entre las variables exógena y endógena, Figura 6.15 vemos que esta no parece ser linealsi no cuadrática al menos en los dos últimos tercios <strong>de</strong> la muestra, por lo que vamos a proponer lasiguiente relación cuadrática:P AT ENT ES t = α + β(I + D) t + γ(I + D) 2 t + u t (6.25)200180ajustadoactualPATENTES con respecto a I+D, observada y ajustada160Patentes1401201008060 80 100 120 140 160I+DFigura 6.15: Variable endógena versus exógenaLos resultados <strong>de</strong> su estimación MCO son:̂ P AT ENT ES t(t-estad)= 121, 57 − 0, 85 (I + D) t + 0, 007 (I + D) 2 t R 2 = 0, 90 DW = 0, 28 (6.26)(5,23) (-1,98)(3,85)Las variables son significativas para un nivel <strong>de</strong> significatividad <strong><strong>de</strong>l</strong> 5 % y el ajuste es bueno, 90 %.Sin embargo, para el mo<strong><strong>de</strong>l</strong>o (6.26) sigue existiendo autocorrelación positiva <strong>de</strong> primer or<strong>de</strong>n ya queDW = 0, 28 < d L (T = 34, K ′ = 2) = 1, 33. Si miramos el gráfico <strong>de</strong> residuos <strong>de</strong> esta relación, Figura6.16, encontramos las misma evolución cíclica <strong>de</strong> grupos <strong>de</strong> residuos positivos-negativos-positivos.Por tanto una vez especificado correctamente el mo<strong><strong>de</strong>l</strong>o se sigue manteniendo la autocorrelación enlas perturbaciones. El mo<strong><strong>de</strong>l</strong>o (6.25) <strong>de</strong>be ser estimado por un estimador alternativo a MCO quesea <strong>de</strong> varianza mínima y permita realizar inferencia válida.201


Estadística Actuarial: Análisis <strong>de</strong> Regresión20Residuos <strong>de</strong> la regresi n (= PATENTS observada - ajustada)15105residuo0-5-10-15-201960 1965 1970 1975 1980 1985 1990Figura 6.16: Residuos mo<strong><strong>de</strong>l</strong>o (6.20) versus tiempo6.5.5. Predicción en gretlPara hacer predicción con gretl <strong>de</strong>bemos incorporar los nuevos datos (X p ) a la base <strong>de</strong> datos medianteA continuación, pincharemos la opciónDatos → Seleccionar todosDatos → Añadir Observacionesindicando el número <strong>de</strong> observaciones que queremos añadir, en este caso 1. En la fila correspondienteincluimos los valores <strong>de</strong> las variables explicativas en el periodo <strong>de</strong> predicción, en este caso laobservación N + 1, incorporando cada observación en la casilla correspondiente. Si no incorporamosel valor para la variable Y i que es la que vamos a pre<strong>de</strong>cir, gretl nos mostrará un aviso (Atención:había observaciones perdidas). Po<strong>de</strong>mos simplemente ignorarlo y darle a aceptar.Posteriormente, estimaremos el mo<strong><strong>de</strong>l</strong>o sin consi<strong>de</strong>rar esta nueva observación. Para ello, tenemosque especificar el rango muestral, es <strong>de</strong>cir, en la opciónMuestra → Establecer rangoespecificaremos <strong><strong>de</strong>l</strong> rango <strong>de</strong> observaciones <strong>de</strong> la muestra para estimar el mo<strong><strong>de</strong>l</strong>o, en nuestro caso<strong>de</strong> la 1 a la N y elegimos Aceptar.Estimaremos el mo<strong><strong>de</strong>l</strong>o por MCO y en la ventana <strong>de</strong> los resultados elegimosAnálisis → PrediccionesEn la nueva ventana po<strong>de</strong>mos <strong>de</strong>terminar el dominio <strong>de</strong> predicción, es <strong>de</strong>cir el Inicio y Fin que eneste caso es en ambos la observación número N + 1, y también cuantas observaciones se quierenrepresentar antes <strong>de</strong> la prediccion.Utilizando los resultados obtenidos en el Ejemplo 5.10 se va a pre<strong>de</strong>cir la variable P RICE. Losresultados que muestra Gretl son los siguientes:202


Estadística Actuarial: Análisis <strong>de</strong> RegresiónPara intervalos <strong>de</strong> confianza 95 %, t(10, ,0, 025) = 2, 228Observaciones price predicción Desv. Típica Intervalo <strong>de</strong> 95 %15 500,00 479,91 55,390 356,49 603,32Estadísticos <strong>de</strong> evaluación <strong>de</strong> la predicciónError medio 20,095Error cuadrático medio 403,79Raíz <strong><strong>de</strong>l</strong> Error cuadrático medio 20,095Error absoluto medio 20,095Porcentaje <strong>de</strong> error medio 4,0189Porcentaje <strong>de</strong> error absoluto medio 4,0189U <strong>de</strong> Theil 0650600pricepredicciónIntervalo <strong>de</strong> confianza 95 por ciento5505004504003503002502001501 2 3 4 5 6 7 8 9 10 11 12 13 14 15El gráfico que se obtiene junto a los resultados muestra la serie <strong>de</strong> precios (P) observada en colorrojo y estimada con el mo<strong><strong>de</strong>l</strong>o para las 14 observaciones anteriores a la predicción y la predicciónen color azul, junto con su intervalo <strong>de</strong> confianza en color ver<strong>de</strong>.La predicción por punto <strong><strong>de</strong>l</strong> precio <strong>de</strong> una vivienda con estas características es <strong>de</strong> 479, 905 miles <strong>de</strong>euros, mientras que la predicción por intervalo con un nivel <strong>de</strong> confianza <strong><strong>de</strong>l</strong> 95 % es (356, 5; 603, 3)en miles <strong>de</strong> euros, por lo que el precio que nos pi<strong>de</strong>n, que era <strong>de</strong> 500 miles <strong>de</strong> euros por la vivienda,está <strong>de</strong>ntro <strong><strong>de</strong>l</strong> intervalo. Este precio para una vivienda <strong>de</strong> esas características se aceptaría comorazonable dado nuestro mo<strong><strong>de</strong>l</strong>o y la información muestral utilizada para su estimación, con un nivel<strong>de</strong> confianza <strong><strong>de</strong>l</strong> 95 %.203


Estadística Actuarial: Análisis <strong>de</strong> Regresión6.6. Bibliografía <strong><strong>de</strong>l</strong> temaReferencias bibliográficas básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editorial AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. Open Course Ware. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[2] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[3] Esteban, M.V. (2007). Estadística Actuarial: Regresión. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[4] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08. Publicaciónon-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[5] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.[6] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[7] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[8] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[9] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.204


Tema 7Guía para el <strong>de</strong>sarrollo <strong>de</strong> un proyectoempírico7.1. Características básicas <strong><strong>de</strong>l</strong> proyectoEsta sección <strong>de</strong>sarrolla una guía básica para estructurar la realización <strong>de</strong> un proyecto. Es <strong><strong>de</strong>l</strong> todorecomendable la lectura <strong><strong>de</strong>l</strong> Capítulo 19 <strong><strong>de</strong>l</strong> libro Introdución a la Econometría, <strong>de</strong> Wooldridge, J. M.(2003), que aparece en las referencias bibliográficas. Los seminarios y tutorías personalizadas <strong>de</strong> losequipos individuales servirán para marcar el ritmo en la evolución <strong><strong>de</strong>l</strong> proyecto y para que el profesortutorice tanto al equipo como individualmente a cada uno <strong>de</strong> los integrantes en su aprendizaje. Nohay que per<strong>de</strong>r <strong>de</strong> vista que el proyecto <strong>de</strong>be <strong>de</strong> contribuir a obtener las competencias específicas<strong>de</strong> la asignatura en su totalidad aunque se incida en la cuarta en cuanto a su evaluación.• Estructura básica <strong><strong>de</strong>l</strong> trabajo:1. Portada: Título <strong><strong>de</strong>l</strong> trabajo y nombres y apellidos <strong><strong>de</strong>l</strong> autor/autores.2. Introducción: Presenta la motivación principal <strong><strong>de</strong>l</strong> trabajo, el problema a analizar yposibles referentes en la literatura económica. Por ejemplo, pue<strong>de</strong> ayudar plantearse unapregunta, muy concreta, sobre un fenómeno económico. Por ejemplo, ¿como afecta a laoferta laboral femenina y casada el nivel salarial, la educación y/o el número <strong>de</strong> hijos?3. Revisión <strong>de</strong> la bibliografía: En muchas ocasiones existe literatura en el tema elegido.Si es así <strong>de</strong>be <strong>de</strong> ser incluida, en un resumen breve.4. Datos: Se <strong>de</strong>scriben los datos que componen la muestra a utilizar y las fuentes <strong>de</strong>don<strong>de</strong> han sido obtenidos. Se <strong>de</strong>scriben las variables a utilizar en el mo<strong><strong>de</strong>l</strong>o junto con lasunida<strong>de</strong>s <strong>de</strong> medida. Finalmente se realiza un análisis <strong>de</strong>scriptivo básico.5. Mo<strong><strong>de</strong>l</strong>o: Se introduce el mo<strong><strong>de</strong>l</strong>o <strong>de</strong> partida propuesto, las variables que entran en elmo<strong><strong>de</strong>l</strong>o, el signo esperado <strong>de</strong> los coeficientes. También si hay diferentes alternativas a laespecificación propuesta que se quieran contrastar o analizar.Es claro que el mo<strong><strong>de</strong>l</strong>o inicial evolucionará a lo largo <strong><strong>de</strong>l</strong> trabajo. Por lo tanto en eltrabajo y la exposición se <strong>de</strong>be mostrar los puntos más importantes <strong>de</strong> esta evolución,sin ser exhaustivos en la repetición <strong>de</strong> interpretación <strong>de</strong> signos y coeficientes.205


Estadística Actuarial: Análisis <strong>de</strong> Regresión6. Resultados empíricos: Se muestran y explican razonadamente los resultados obtenidosaplicando las técnicas vistas en clase que se crean oportunas: análisis <strong>de</strong> residuos,contrastes sobre las hipótesis básicas, elección <strong>de</strong> métodos alternativos <strong>de</strong> estimación yrealización <strong>de</strong> contrastes sobre los parámetros <strong>de</strong> interés <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o. Al final <strong><strong>de</strong>l</strong> trabajose crea un apéndice en el que incluyen todos los outputs <strong>de</strong> gretl y gráficos que se hayanobtenido a lo largo <strong>de</strong> todo el trabajo.7. Conclusiones: Por último, al final <strong><strong>de</strong>l</strong> trabajo, se redactan las conclusiones <strong><strong>de</strong>l</strong> trabajo,teniendo en cuenta su objetivo y la especificación y estimación <strong><strong>de</strong>l</strong> mo<strong><strong>de</strong>l</strong>o <strong>de</strong>spués <strong><strong>de</strong>l</strong>análisis econométrico. En esta sección se explica lo realizado en conjunto y se razona sies el caso sobre la especificación final elegida. Este apartado es imprescindible.8. Bibliografía: Recoge las referencias completas citadas a lo largo <strong><strong>de</strong>l</strong> texto. Fuentes <strong>de</strong>consultas bibliográficas y <strong>de</strong> datos, así como referencias a páginas web si es que se utilizan.• Cronología: El proyecto <strong>de</strong>be evolucionar a lo largo <strong><strong>de</strong>l</strong> curso, no <strong>de</strong>be ser un trabajo realizadoen los últimos diez días antes <strong>de</strong> su exposición pública por ello es importante que los equipos semarquen una cronología <strong>de</strong> acuerdo a las directrices marcadas en lo seminarios que se lleven acabo en el aula. Como ya se ha indicado los seminarios y tutorías personalizadas <strong>de</strong> los equiposservirán para marcar el ritmo en la evolución <strong><strong>de</strong>l</strong> proyecto y para que el profesor tutorice tantoal equipo como individualmente a cada uno <strong>de</strong> los integrantes en su aprendizaje. No hay queper<strong>de</strong>r <strong>de</strong> vista que el proyecto <strong>de</strong>be <strong>de</strong> contribuir a obtener las competencias específicas <strong><strong>de</strong>l</strong>a asignatura en su totalidad aunque se incida en la cuarta en cuanto a su evaluación.• Exposición: En general el formato <strong>de</strong> la exposición pue<strong>de</strong> ser elegido libremente, transparencias,power point etc. Habrá <strong>de</strong> tenerse en cuenta que todos los alumnos intervienen enla exposición y que el profesor realizará preguntas a los miembros <strong><strong>de</strong>l</strong> grupo sobre el trabajorealizado.• Datos a utilizar: Los que se quieran, siempre y cuando se refiera la referencia en el trabajo<strong>de</strong> la fuente utilizada.1. Se pue<strong>de</strong>n utilizar datos <strong>de</strong> los ficheros disponibles en Gretl siempre y cuando el trabajono sea replicar un ejercicio que ya esté en estos libros.2. Bases <strong>de</strong> datos disponibles en Gretl sobre servidorArchivo ⇒ Bases <strong>de</strong> datos ⇒ sobre servidor3. Bases <strong>de</strong> datos disponibles en Biblioteca.4. Otras direcciones <strong>de</strong> interés y bases <strong>de</strong> datos:Eurostat: http://epp.eurostat.cec.eu.int/Banco Mundial: http://<strong>de</strong>vdata.worldbank.org/Fondo Monetario Internacional: http://www.imf.org/OCDE: http://www.oecd.org/Banco Central Europeo: http://www.ecb.int/Economic and Social Data Services: Guía a Recursos internacionales <strong>de</strong> datos <strong>de</strong> libreacceso, http://www.esds.ac.uk/international/access/access.asp206


Estadística Actuarial: Análisis <strong>de</strong> RegresiónBanco <strong>de</strong> España: http://www.b<strong>de</strong>.es/Instituto Nacional <strong>de</strong> Estadística: http://www.ine.es/Eustat: http://www.eustat.es/• Algunos consejos para la preparación <strong><strong>de</strong>l</strong> trabajo:1. Primero es importante pensar en el mo<strong><strong>de</strong>l</strong>o o relación básica que se quiere analizar juntocon los datos a emplear. Es aconsejable estudiar previamente los datos <strong>de</strong> las variablesque entran en el mo<strong><strong>de</strong>l</strong>o, sus estadísticos <strong>de</strong>scriptivos, gráficos etc.2. También es importante la forma <strong>de</strong> presentar los resultados. Una vez realizados los diversosanálisis, estimaciones etc., se pone en común todos los resultados y se seleccionalo importante. Una vez elegido lo más relevante <strong>de</strong> todo lo realizado esta información sepresenta <strong>de</strong> forma que sea fácil comparar y valorar los resultados obtenidos.3. No mezclar diferentes fuentes y tipos <strong>de</strong> letra en el texto.4. No utilizar abreviaciones coloquiales, tipo SMS.5. Todas las figuras y tablas <strong>de</strong>ben estar numeradas. Añadir una pequeña leyenda tanto alos gráficos como a las tablas explicando que recogen (por ejemplo, Figura 2: Gráfico <strong><strong>de</strong>l</strong>os residuos contra el tiempo). Se pue<strong>de</strong> poner arriba o abajo <strong>de</strong> la figura pero siemprehacerlo <strong>de</strong> la misma forma.6. Las figuras y tablas también pue<strong>de</strong>n ir en un apéndice y hacer referencia en el texto conla numeración utilizada.7. Numerar todas las páginas.8. Es recomendable que se revisen las distintas versiones <strong><strong>de</strong>l</strong> trabajo antes <strong>de</strong> su presentación,cuidando que no haya errores gramaticales.• Cómo presentar y comparar resultados:A continuación se va a mostrar la presentación <strong>de</strong> resultados <strong>de</strong> tres especificaciones alternativasy tres métodos <strong>de</strong> estimación como guía <strong>de</strong> presentación <strong>de</strong> resultados.Vamos a estimar las siguientes especificaciones o mo<strong><strong>de</strong>l</strong>os alternativos para explicar el precio<strong>de</strong> la vivienda:Mo<strong><strong>de</strong>l</strong>o AMo<strong><strong>de</strong>l</strong>o BMo<strong><strong>de</strong>l</strong>o CP RICE i = β 1 + β 2 SQF T i + u iP RICE i = β 1 + β 2 SQF T i + β 3 BEDRMS i + u iP RICE i = β 1 + β 3 BEDRMS i + β 4 BAT HS i + u iEstos tres mo<strong><strong>de</strong>l</strong>os difieren en las variables explicativas incluidas.La Tabla 7.1 muestra los coeficientes estimados por MCO y distintos estadísticos asociadosa la cuatro especificaciones o mo<strong><strong>de</strong>l</strong>os alternativos anteriores. Esta forma <strong>de</strong> presentar losresultados pue<strong>de</strong> estar más indicada cuando, como ahora, se presentan distintas especificacionescon la misma variable <strong>de</strong>pendiente. En la parte <strong>de</strong> abajo <strong>de</strong> la tabla, también para cadauna <strong>de</strong> las especificaciones, podéis incluir los valores muestrales <strong>de</strong> los estadísticos <strong>de</strong> diversos207


Estadística Actuarial: Análisis <strong>de</strong> RegresiónTabla 7.1: Mo<strong><strong>de</strong>l</strong>os estimados para el precio <strong>de</strong> la vivienda P RICEVariable <strong>de</strong>pendiente: P RICEVariable Mo<strong><strong>de</strong>l</strong>o A Mo<strong><strong>de</strong>l</strong>o B Mo<strong><strong>de</strong>l</strong>o CCONSTANT 52,351 121,179 27,2633(1,404) (1,511) (0,182)SQFT 0,13875 0,14831(7,407) (6,993)BEDRMS -23,911 -10,1374(-0,970) (-0,216)BATHS 138,795(2,652)Suma <strong>de</strong> cuadrados residual 18273,6 16832,8 55926,4R 2 0,821 0,835 0,450706¯R 2 0,806 0,805 0,350834F <strong>de</strong> significación conjunta 54,861 27,767 4,51285Grados <strong>de</strong> libertad 12 11 11Los valores entre paréntesis son los correspondientes estadísticos t <strong>de</strong> significatividad individual sin tener en cuentala posible heterocedasticidad y o autocorrelación.contrastes bien <strong>de</strong> heterocedasticidad, autocorrelación, selección <strong>de</strong> mo<strong><strong>de</strong>l</strong>os etc. si los habéisrealizado para cada mo<strong><strong>de</strong>l</strong>o estimado.Si se consi<strong>de</strong>ra estimar por distintos métodos la misma especificación, pue<strong>de</strong> ayudar presentarlos resultados como en la Tabla 7.2:Tabla 7.2: Función <strong>de</strong> SalariosVariable <strong>de</strong>pendiente: Salarios Privados W pExplicativas MCO Cochrane-Orcutt Hildreth-Luconst 1, 497 1, 5 1, 53 ∗(1, 27) (1, 27) (1, 32)X t 0, 439 ∗ 0, 439 ∗ 0, 434 ∗(0, 032) (0, 039) (0, 075)X t−1 0, 146 ∗ 0, 147 ∗ 0, 151 ∗(0, 037) (0, 043) (0, 074)A t 0, 13 ∗ 0, 13 ∗ 0, 132 ∗(0, 032) (0, 032) (0, 035)Entre paréntesis se muestran las <strong>de</strong>sviaciones típicas estimadas. En el caso <strong>de</strong> MCO son robustas a autocorrelación.El símbolo ∗ <strong>de</strong>nota que es significativo al 5 %. El tamaño muestral es T = 80 datos trimestrales.De esta forma es más fácil comparar los resultados a la vez que mostrarlos en una transparenciaa la hora <strong>de</strong> la presentación.208


BibliografíaReferencias Bibliográficas Básicas:• Teórica:[1] Gujarati, D. y Porter, D.C. (2010). Econometría. Editorial McGraw-Hill, Madrid. 5 a edición.[2] Newbold, P., Carlson, W.L. y Thorne, B. (2008). Estadística para administración y economía.Prentice Hall. Madrid.[3] Wooldridge, J.M. (2006). Introducción a la Econometría. Ed. Thomson Learning, 2 a edición.[4] Ruiz Maya, L. y Martín Pliego, F.J. (2005). Fundamentos <strong>de</strong> inferencia estadística, 3 a edición,Editoral AC, Madrid.• Ejercicios con gretl:[1] Ramanathan, R. (2002), Instructor’s Manual to accompany, <strong><strong>de</strong>l</strong> libro Introductory Econometricswith applications, ed. South-Western, 5th edition, Harcourt College Publishers.[2] Wooldridge, J. M. (2003), Stu<strong>de</strong>nt Solutions Manual, <strong><strong>de</strong>l</strong> libro Introductory Econometrics: Amo<strong>de</strong>rn Approach, ed. South-Western, 2nd edition.Referencias Bibliográficas Complementarias:[1] Alonso, A., Fernán<strong>de</strong>z, J. y Gallastegui, I. (2005), Econometría, ed. Pearson: Prentice Hall.[2] Dougherty, Ch. (2006), Introduction to Econometrics, 3rd. Ed., Oxford University Press.[3] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). Análisis <strong>de</strong>regresión con gretl. Open Course Ware. UPV-EHU. (http : //ocw.ehu.es/ciencias − sociales − y −juridicas/analisis − <strong>de</strong> − regresion − con − greti/Course l isting).[4] Esteban, M.V.; Moral, M.P.; Orbe, S.; Regúlez, M.; Zarraga, A. y Zubia, M. (2009). EconometríaBásica <strong>Aplicada</strong> con Gretl. Sarriko On Line 8/09. http://www.sarriko-online.com. Publicación online<strong>de</strong> la Facultad <strong>de</strong> C.C. Económicas y Empresariales.[5] Esteban, M.V. (2007). Estadística Actuarial: Regresión. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.Web <strong>de</strong> la asignatura.[6] Esteban, MV (2008). Estadística Actuarial: Regresión Lineal, Sarriko On Line 3/08. Publica-209


Estadística Actuarial: Análisis <strong>de</strong> Regresiónción on-line <strong>de</strong> la Facultad <strong>de</strong> CC. Económicas y Empresariales, UPV/EHU. http://www.sarrikoonline.com.[7] Esteban, M.V. (2007). Colección <strong>de</strong> ejercicios y exámenes. <strong>Material</strong> docente. Servicio <strong>de</strong> Publicaciones.Web <strong>de</strong> la asignatura.[8] Fernán<strong>de</strong>z, A., P. González, M. Regúlez, P. Moral, V. Esteban (2005). Ejercicios <strong>de</strong> Econometría.Editorial McGraw-Hill.[9] Greene, W. (1998), Análisis Econométrico, Ed. Prentice Hall, 3 a edición.[10] Gujarati, D. (2004), Econometría, ed. McGraw-Hill, 4 a edición.[11] Ramanathan, R. (2002), Introductory Econometrics with applications, Ed. South-Western, 5th.edition.[12] Verbeek, M. (2004). A Gui<strong>de</strong> to Mo<strong>de</strong>rn Econometrics. Wiley.210

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!