libro_GCZ2009
libro_GCZ2009
libro_GCZ2009
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Capítulo 17<br />
Regresión lineal<br />
17.1. Regresión lineal simple<br />
“Afirmaciones extraordinarias requieren pruebas extraordinarias.”<br />
David Hume (1711-1776)<br />
Dentro del estudio de las variables estadísticas bidimensionales vamos a abordar el análisis de la existencia<br />
de relaciones o dependencias entre las dos variables x e y que forman la variable bidimensional. Básicamente,<br />
la relación entre las dos variables podrá ser de dos tipos: funcional, cuando exista una relación matemática<br />
exacta que ligue ambas variables (ej. el radio y el área de un círculo), o aleatoria, cuando, aunque no exista<br />
entre las variables una relación exacta, se puede observar (aunque no siempre es el caso) una cierta tendencia<br />
entre los comportamientos de ambas (ej. el peso y la altura de un individuo).<br />
El primer paso para el estudio de la relación entre las variables consiste en la construcción y observación<br />
de un diagrama de dispersión (Figura 17.1). El problema de la regresión se concreta entonces en ajustar una<br />
función a la nube de puntos representada en dicho diagrama. Esta función permitirá entonces obtener, al<br />
menos de forma aproximada, una estimación del valor de una de las variables a partir del valor que tome<br />
la otra. Cuando la función sea del tipo y = f(x), hablaremos de regresión de y sobre x (a partir de los<br />
valores de x se pueden estimar los de y). Al contrario, la regresión de x sobre y se basará en una función<br />
del tipo x = f(y).<br />
Se conoce como línea de regresión a la representación gráfica de la función que se ajusta a la nube<br />
de puntos del diagrama de dispersión. Un primer problema para el estudio de la regresión es la elección del<br />
tipo de línea de regresión. Efectivamente, ésta podrá adoptar diferentes formas funcionales, y el tipo de línea<br />
se elegirá a partir de la forma de la nube de puntos. Cuando dicha nube se distribuya aproximadamente a<br />
lo largo de una línea recta ajustaremos una recta de regresión. Será el caso particular de la regresión<br />
lineal. En este caso importante, la regresión de y sobre x vendrá dada entonces por<br />
y = a + bx, (17.1)<br />
donde a y b son dos parámetros que habremos de determinar. Gráficamente a será la ordenada de la recta<br />
en el origen (es decir el valor de y para x =0)yb la pendiente de ésta.<br />
Aunque aquí nos concentraremos, por simplicidad, en la regresión lineal, la línea de regresión puede<br />
responder a otras formas funcionales como, por ejemplo, es el caso de la regresión parabólica (y = a+bx+cx 2 )<br />
y exponencial (y = ab x ).<br />
185