16.01.2020 Views

Estadística. Serie Schaum- 4ta edición - Murray R. Spiegel.pdf (1)

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

350 CAPÍTULO 14 TEORÍA DE LA CORRELACIÓN

FÓRMULA PRODUCTO-MOMENTO PARA EL COEFICIENTE

DE CORRELACIÓN LINEAL

Si se supone que entre dos variables existe una relación lineal, la ecuación (12) se convierte en

P xy

r ¼ p ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

ð P x 2 Þð P (17)

y 2 Þ

donde x ¼ X X y y ¼ Y Y (ver el problema 14.10). Esta fórmula, que automáticamente da el signo adecuado de

r se conoce como fórmula del producto-momento y permite ver claramente la simetría entre X y Y.

Si se escribe

sffiffiffiffiffiffiffiffiffiffiffi

sffiffiffiffiffiffiffiffiffiffiffi

P P P xy

x

2

y

2

s XY ¼ s

N X ¼

s

N Y ¼

(18)

N

entonces s X y s Y se reconocerán como las desviaciones estándar de X y de Y, respectivamente, y s 2 X y s 2 Y son las varianzas.

La nueva cantidad s XY es la covarianza de X y Y. En términos de la fórmula (18), la fórmula (17) puede expresarse

como

r ¼ s XY

(19)

s X s Y

Obsérvese que r no sólo es independiente de las unidades de X y de Y, sino también de la elección del origen.

FÓRMULAS SIMPLIFICADAS PARA EL CÁLCULO

La fórmula (17) puede expresarse de la siguiente manera equivalente

N P XY ð P XÞð P YÞ

r ¼ q ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

½n P X 2 ð P XÞ 2 Š½N P Y 2 ð P (20)

YÞ 2 Š

con frecuencia empleada para el cálculo de r.

Para datos agrupados como los de una tabla de frecuencias bivariadas o distribución de frecuencias bivariadas

(ver problema 14.17), conviene emplear un método de compilación como los de capítulos anteriores. En ese caso, la

fórmula (20) puede expresarse

N P fu

r ¼

X u Y ð P f X u X Þð P f Y u Y Þ

q ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

½N P f X u 2 X ð P f X u X Þ 2 Š½N P f Y u 2 Y ð P (21)

f Y u Y Þ 2 Š

(ver problema 14.18). Cuando se emplea esta fórmula, para facilitar los cálculos se emplea una tabla de correlación

(ver problema 14.19).

En el caso de datos agrupados, las fórmulas (18) se pueden expresar como

P P P

fuX u

s XY ¼ c X c Y fX u X fY u Y

Y

(22)

N N N

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

P

fX u 2 P

X fX u 2

s X ¼ c X

X

(23)

N N

sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi

P

fY u 2 P

Y fY u 2

s Y ¼ c Y

Y

(24)

N N

donde c X y c Y son las amplitudes de los intervalos de clase (que se suponen constantes) correspondientes a las variables

X y Y, respectivamente. Obsérvese que las fórmulas (23) y (24) son equivalentes a la fórmula (11) del capítulo 4.

Empleando las fórmulas (22) y (24), la fórmula (19) parece ser equivalente a la fórmula (21).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!