16.01.2020 Views

Estadística. Serie Schaum- 4ta edición - Murray R. Spiegel.pdf (1)

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

296 CAPÍTULO 12 LA PRUEBA JI CUADRADA

Si en las celdas B1:L2 de una hoja de cálculo de EXCEL se introducen las frecuencias observadas y las frecuencias

esperadas, en la celda B4 se introduce la expresión =(B1-B2)^2/B2, se hace clic y se arrastra desde B4 hasta L4 y las cantidades

en B4:L4 se suman, se obtiene 10.34 como el valor de 2 ¼ P j ððo j e j Þ 2 =e j Þ.

El valor p que corresponde a 10.34 se obtiene mediante la expresión de EXCEL =CHIDIST(10.34,10). Este valor p es

0.411 y dado que es grande, no hay razón para pensar que el dado esté cargado.

TABLAS DE CONTINGENCIA

A tablas como la 12.1 en las que las frecuencias observadas ocupan un solo renglón se les llama tablas de clasificación

en un solo sentido. Como el número de columnas es k, se les llama también tablas 1 × k (que se lee “1 por k”). Por

extensión de estas ideas, se obtienen tablas de clasificación en dos sentidos, o tablas h × k, en las que las frecuencias

observadas ocupan h renglones y k columnas. A estas tablas se les suele llamar tablas de contingencia.

En una tabla de contingencia h × k, para cada frecuencia observada hay una frecuencia esperada (o teórica), que

se calcula basándose en alguna hipótesis y sujetándose a las reglas de probabilidad. A las frecuencias que ocupan las

celdas de una tabla de contingencia se les llama frecuencias de celda. Al total de las frecuencias de un renglón o de

una columna se le llama frecuencia marginal.

Para investigar el grado de coincidencia entre las frecuencias observadas y las frecuencias esperadas se calcula el

estadístico

2 ¼ X j

ðo j e j Þ 2

(5)

e j

donde la suma se realiza sobre todas las celdas de la tabla de contingencia y donde los símbolos o j y e j representan

frecuencias, observada y esperada, en la celda j. Esta suma, que es análoga a la de la ecuación (1), contiene hk términos.

La suma de todas las frecuencias observadas, que se denota N, es igual a la suma de todas las frecuencias esperadas

[ver la ecuación (2)].

Como antes, el estadístico (5) tiene una distribución muestral que está dada, con una aproximación muy buena, por

(4), siempre y cuando las frecuencias esperadas no sean demasiado pequeñas. El número de grados de libertad, ν, de

esta distribución ji cuadrada es, para h > 1 y k > 1,

1. ν = (h − 1)(k − 1) si las frecuencias esperadas pueden calcularse sin necesidad de estimar parámetros poblacionales

mediante estadísticos muestrales. Una demostración de esto se da en el problema 12.18.

2. ν = (h − 1)(k − 1) − m si las frecuencias esperadas sólo pueden calcularse estimando m parámetros poblacionales

mediante estadísticos muestrales.

Las pruebas de significancia para tablas h × k son similares a las pruebas de significancia para tablas 1 × k. Las

frecuencias esperadas se establecen basándose en la hipótesis H 0 de que se trate; una de las hipótesis más empleadas

es que las dos clasificaciones son independientes una de otra.

Las tablas de contingencia pueden extenderse a dimensiones mayores. Así, se pueden tener, por ejemplo, tablas

h × k × 1, en las que hay tres clasificaciones.

EJEMPLO 2 En la tabla 12.5 se presenta la manera en que las personas hacen sus declaraciones de impuestos y su nivel de

estudios. La hipótesis nula es que la manera en que las personas hacen sus declaraciones de impuestos (usando software o sólo lápiz

y papel) es independiente de su nivel de estudios. La tabla 12.5 es una tabla de contingencia.

Tabla 12.5

Nivel de estudios

Manera Preparatoria Licenciatura Maestría

Computadora

Papel y lápiz

23

45

35

30

42

25

Empleando MINITAB para analizar estos datos se obtienen los resultados siguientes.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!