16.01.2020 Views

Estadística. Serie Schaum- 4ta edición - Murray R. Spiegel.pdf (1)

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

OBSERVACIONES ACERCA DEL COEFICIENTE DE CORRELACIÓN 349

y varía entre −1 y +1. Los signos + y − se usan para correlación lineal positiva y correlación lineal negativa, respectivamente.

Obsérvese que r es una cantidad adimensional; es decir, no depende de las unidades que se empleen.

Utilizando las ecuaciones (8) y (11) y el hecho de que la desviación estándar de Y es

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

P ðY YÞ 2

s Y ¼

N

(13)

se encuentra que la ecuación (12) puede expresarse, sin hacer caso del signo, como

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

s 2 Y:X

r ¼ 1

s 2 Y

pffiffiffiffiffiffiffiffiffiffiffiffi

o bien s Y:X ¼ s Y 1 r 2

(14)

Si se intercambian X y Y se obtienen ecuaciones similares.

En el caso de la correlación lineal, la cantidad r es la misma, ya sea que se considere a X o a Y como la variable

independiente. Por lo tanto r es una muy buena medida de la correlación lineal entre dos variables.

OBSERVACIONES ACERCA DEL COEFICIENTE DE CORRELACIÓN

Las definiciones del coeficiente de correlación dadas en las ecuaciones (12) y (14) son muy generales y pueden emplearse

tanto para relaciones no lineales como para relaciones lineales; la única diferencia es que Y est se calcula a partir de

una ecuación de regresión no lineal y no a partir de una ecuación de regresión lineal, y que los signos + y − se omiten.

En estos casos la ecuación (8), que define el error estándar de estimación, es perfectamente general. Sin embargo, la

ecuación (10) que se emplea únicamente para regresión lineal, debe ser modificada. Si, por ejemplo, la ecuación de

estimación es

la ecuación (10) se reemplaza por

Y ¼ a 0 þ a 1 X þ a 2 X 2 þþa n 1 X n 1 (15)

P Y

s 2 2

Y:X ¼

P

a 0 Y

P

a1 XY an

P

1 X

n 1 Y

N

(16)

En este caso, el error estándar de estimación modificado (antes visto en este capítulo) es

rffiffiffiffiffiffiffiffiffiffiffiffi

N

^s Y:X ¼

N n

en donde a la cantidad N − n se le conoce como número de grados de libertad.

Hay que subrayar que en todos los casos, el valor calculado para r mide el grado de relación respecto al tipo de

ecuación que se emplee. Así, si se utiliza una ecuación lineal y con la ecuación (12) o (14) dan un valor de r cercano

a cero, esto significa que entre las variables casi no hay correlación lineal. Pero esto no significa que no haya correlación

alguna, pues entre estas variables puede haber una fuerte correlación no lineal. En otras palabras, el coeficiente

de correlación mide la bondad de ajuste entre: 1) la ecuación empleada y 2) los datos. A menos que se especifique otra

cosa, el término coeficiente de correlación se emplea con el significado de coeficiente de correlación lineal.

Hay que hacer notar también que un coeficiente de correlación elevado (es decir, cercano a 1 o a −1) no necesariamente

indica que haya dependencia directa entre las variables. Así, por ejemplo, puede haber correlación elevada

entre la cantidad de libros publicados anualmente y cantidades número de tormentas eléctricas por año. A los ejemplos

de este tipo o se le conoce como correlaciones sin sentido o espurias.

s Y:X

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!