12.07.2015 Views

Formulario tema 4

Formulario tema 4

Formulario tema 4

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Estadística Descriptiva y Análisis de DatosDiplomatura en Estadística. Curso 2007/2008.<strong>Formulario</strong> Tema 4.Sea (X, Y ) una variable bidimensional que puede tomar k×r pares de valoresdiferentes (x i , y j ), i = 1, . . .,k, j = 1, . . .,r, sobre los n individuos de unamuestra. Supondremos que tenemos los datos ordenados de manera quex 1 < x 2 < . . . < x k , y 1 < y 2 < . . . < y r . Es práctico presentar los datos enforma de tabla:Table 1: Tabla de doble entrada y tabla de contingenciasX \ Y y 1 y 2 . . . y j . . . y r n Xx 1 n 11 n 12 . . . n 1j . . . n 1r n 1•x 2 n 21 n 22 . . . n 2j . . . n 2r n 2•. . . . . . . .x i n i1 n i2 . . . n ij . . . n ir n i•. . . . . . . .x k n k1 n k2 . . . n kj . . . n kr n k•n Y n •1 n •2 . . . n •j . . . n •r n• La frecuencia absoluta n ij es el número de veces que aparece el par(x i , y j ) en los n individuos de la muestra.Se cumple que ∑ ki=1∑ rj=1 n ij = n.• La frecuencia relativa es la proporción de individuos para los cualesse ha observado el par (x i , y j ), es decir, f ij = n ij /n.• La frecuencia absoluta marginal del valor x i de la variable X esn i• = ∑ rj=1 n ij.• La frecuencia relativa marginal del valor x i de la variable X esf i• = n i• /n.• La frecuencia absoluta marginal del valor y j de la variable Y esn •j = ∑ ki=1 n ij.• La frecuencia relativa marginal del valor y j de la variable Y esf •j = n •j /n.• La distribución de X condicionada a que Y tome el valor y j ,X |Y =yj , se obtiene de la columna j-ésima de la tabla 1.• La distribución de Y condicionada a que X tome el valor x i , Y |X=xi ,se obtiene de la fila i-ésima de la tabla 1.1


Características numéricas marginales.• Medias marginales:x = 1 n• Varianzas marginales:k∑x i n i• ,i=1y = 1 nr∑y j n •jj=1s 2 X = 1 nk∑(x i −x) 2 n i• = x 2 −x 2 , s 2 Y = 1 ni=1• Desviaciones típicas marginales: s X =r∑(y j −y) 2 n •j = y 2 −y 2j=1√ √s 2 X , s Y = s 2 Y .Características numéricas conjuntas para tablas de doble entrada.• Covarianza:s XY = 1 nk∑ r∑(x i −x)(y j −y)n ij = 1 ni=1 j=1k∑ r∑x i y j n ij −xy = x y−xyi=1 j=1• Coeficiente de correlación lineal de Pearson:r XY = s XYs X s YMedidas de associación para tablas de contingencias.• Estadístico χ 2 :Q =k∑i=1 j=1r∑ (n ij − n i• n •j /n) 2,n i• n •j /n• Estadístico χ 2 con la correción de Yates:Q =k∑ r∑ (|n ij − n i• n •j /n| − 0.5) 2i=1 j=1n i• n •j /n• Coeficiente de contingencia de Pearson:√Q/nC =1 + Q/n• V de Cramer:√Q/nV =min{k − 1, r − 1}2


• λ de Goodman-Kruskal:λ =P(error sin información de X) − P(error, dado X)P(error sin información de X)Sean C el número de pares concordantes en la tabla 1 y D el número depares discordantes en la tabla 1.• γ de Goodman-Kruskal:• D de Sommer:D =• τ B y τ C de Kendall:τ B =γ = C − DC + DC − Dn(n − 1)/2 − T X, donde T X =k∑i=1C − D√(n(n − 1)/2 − TX )(n(n − 1)/2 − T Y ) , τ C =donde T X = ∑ k n i• (n i• −1)i=1 2. T Y = ∑ r n •j (n •j −1)j=1 2.Medidas especiales.• Coeficiente de correlación de Spearman:r S = 1 − 6 ∑ ki=1 d2 ik(k 2 − 1) ,n i• (n i• − 1).2min{k, r}(C − D)min{k − 1, r − 1} n 2,donde d i = x i − y i representa la diferencia entre los rangos asignadosal i-ésimo elemento de un colectivo de k elementos.3

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!