16.01.2020 Views

Estadística. Serie Schaum- 4ta edición - Murray R. Spiegel.pdf (1)

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

348 CAPÍTULO 14 TEORÍA DE LA CORRELACIÓN

Empleando la recta de regresión (4), el error estándar de estimación análogo, de X sobre Y, es

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

P ðX Xest Þ 2

s X:Y ¼

N

(9)

En general, s Y.X ≠ s X.Y .

La ecuación (8) también puede expresarse en la forma

P Y

s 2 2

Y:X ¼

P

a 0 Y

N

a1

P XY

(10)

que puede ser más apropiada para hacer los cálculos (ver problema 14.3). Para la ecuación (9) existe una expresión

similar.

El error estándar de estimación tiene propiedades análogas a la desviación estándar. Por ejemplo, si se trazan rectas

paralelas a la recta de regresión de Y sobre X a las distancias verticales s Y.X , 2s Y.X y 3s Y.X , se hallará, si N es suficientemente

grande, que entre estas rectas se encuentra 68%, 95% y 99.7% de los puntos muestrales, respectivamente.

Así como la desviación estándar modificada, que es

rffiffiffiffiffiffiffiffiffiffiffiffi

N

^s ¼ s

N 1

se emplea para muestras pequeñas, también el error estándar de estimación modificado está dado por

rffiffiffiffiffiffiffiffiffiffiffiffi

N

^s Y:X ¼

N 2

A esto se debe que algunos especialistas en estadística prefieran definir las ecuaciones (8) y (9) empleando N − 2 en

el denominador en lugar de N.

s Y:X

VARIACIÓN EXPLICADA Y NO EXPLICADA

La variación total de Y se define como P ðY YÞ 2 ; es decir, la suma de los cuadrados de las desviaciones de Y respecto

a la media Y. Como se muestra en el problema 14.7, esta expresión se puede expresar como

P ðY YÞ 2 ¼ P ðY Y est Þ 2 þ P ðY est

YÞ 2 (11)

En la ecuación (11), al primer término del lado derecho se le llama variación no explicada, en tanto que al segundo

término se le llama variación explicada; se les llama así debido a que las desviaciones Y est

Y tienen un patrón

definido; en cambio, las desviaciones Y − Y est son aleatorias o impredecibles. Para la variable X existe una fórmula

similar.

COEFICIENTE DE CORRELACIÓN

Al cociente de la variación explicada entre la variación total se le llama coeficiente de determinación. Si hay cero

variación explicada (es decir, si la variación total es sólo variación no explicada), este cociente es 0. Si hay 0 variación

no explicada (es decir, si la variación total es sólo variación explicada), este cociente es 1. En los demás casos, este

cociente se encuentra entre 0 y 1; como siempre es no negativo, se denota r 2 . A la cantidad r se le llama coeficiente de

correlación; está dado por

rffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

P

explained variación explicada variation ðYest YÞ 2

r ¼

¼ P

total variación variation total

ðY YÞ 2

(12)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!