16.01.2020 Views

Estadística. Serie Schaum- 4ta edición - Murray R. Spiegel.pdf (1)

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

PROBLEMAS EN LOS QUE INTERVIENEN MÁS DE DOS VARIABLES 321

Para recordar las ecuaciones (23), obsérvese que se pueden obtener formalmente multiplicando la ecuación (22)

por 1, X y X 2 , respectivamente, y sumando a ambos lados de las ecuaciones resultantes. Esta técnica puede extenderse

a las ecuaciones normales de curvas cúbicas de mínimos cuadrados, ecuaciones cuárticas de mínimos cuadrados y, en

general, a cualquiera de las curvas de mínimos cuadrados correspondientes a la ecuación (5).

Como en el caso de la recta de mínimos cuadrados, las ecuaciones (23) se simplifican si las X se escogen de manera

que P X ¼ 0. Estas ecuaciones también se simplifican empleando las nuevas variables x ¼ X X y y ¼ Y Y.

REGRESIÓN

Con frecuencia se desea estimar el valor de la variable Y que corresponde a un valor dado de la variable X, basándose

en los datos muestrales. Esto se hace estimando el valor de Y a partir de la curva de mínimos cuadrados ajustada a los

datos muestrales. A la curva de mínimos cuadrados se le llama curva de regresión de Y en X, debido a que Y se estima

a partir de X.

Si lo que se desea es estimar un valor de X a partir de un valor dado de Y, se emplea la curva de regresión de X en

Y, que es lo mismo que intercambiar las variables en el diagrama de dispersión, de manera que X sea la variable dependiente

y Y sea la variable independiente. En este caso se sustituyen las desviaciones verticales, de la definición de la

curva de mínimos cuadrados de la página 284, por desviaciones horizontales.

En general, la recta o la curva de regresión de Y en X no es igual a la recta o a la curva de regresión de X en Y.

APLICACIONES A SERIES DE TIEMPO

Si la variable independiente X representa tiempo, los datos dan el valor de Y en distintos momentos. A los datos ordenados

de acuerdo con el tiempo se les llama serie de tiempo. En este caso, a la recta o a la curva de regresión de Y en

X se le llama recta o curva de tendencia y se emplea para hacer estimaciones, predicciones o pronósticos.

PROBLEMAS EN LOS QUE INTERVIENEN MÁS DE DOS VARIABLES

Los problemas en los que intervienen más de dos variables se tratan de manera análoga a los problemas de dos variables.

Por ejemplo, entre las tres variables X, Y y Z puede haber una relación que pueda ser descrita mediante la ecuación

Z ¼ a 0 þ a 1 X þ a 2 Y (24)

a la que se le llama ecuación lineal en las variables X, Y y Z.

En un sistema de coordenadas rectangulares, esta ecuación representa un plano y los puntos muestrales (X 1 , Y 1 , Z 1 ),

(X 2 , Y 2 , Z 2 ), . . . , (X N , Y N , Z N ) estarán “dispersos” no demasiado lejos de este plano, al que se le llama plano de aproximación.

Por extensión del método de mínimos cuadrados, se puede hablar de un plano de mínimos cuadrados que se aproxime

a los datos. Si Z se aproxima a partir de los valores de X y Y, a este plano se le llamará plano de regresión de Z en

X y Y. Las ecuaciones normales correspondientes al plano de mínimos cuadrados (24) son

P Z ¼ a0 N þ a 1

P X þ a2

P Y

P XZ ¼ a0

P X þ a1

P X 2

þ a 2

P XY

P YZ ¼ a0

P Y þ a1

P XY þ a2

P Y

2

(25)

y para recordarlas se puede pensar que se obtienen a partir de la ecuación (24) multiplicando ésta por 1, X y Y y sumando

después.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!