13.07.2015 Views

VARIABLE ESTADÍSTICA BIDIMENSIONALES

VARIABLE ESTADÍSTICA BIDIMENSIONALES

VARIABLE ESTADÍSTICA BIDIMENSIONALES

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Apuntes de A. CabañóMatemáticas aplicadas a cc.ss.CONTENIDOS:<strong>VARIABLE</strong>S ESTADÍSTICAS <strong>BIDIMENSIONALES</strong>.• Organización de datos: tablas de frecuencias de doble entrada. Frecuenciasmarginales.• Diagrama de dispersión.• Regresión lineal: rectas de regresión. Coeficiente de correlación lineal.Interpretación.• Predicción lineal.Organización de datos.Las variables estadísticas bidimensionales las representaremos por el par (X,Y), donde X esuna variable unidimensional que toma los valores x 1 ,x 2 ,....x n e Y es otra variable unidimensionalque toma los valores y 1 ,y 2 ,...y n . Si representamos estos pares (x 1 ,y 1 ), (x 2 ,y 2 )......en un sistemade ejes cartesianos se obtiene un conjunto de puntos sobre el plano que se denominadiagrama de dispersión o nube de puntos.Los datos pueden ser presentados en dos tipos de tablas: tabla simple y tabla de dobleentrada. Esta última tabla se puede transformar en una tabla simple.Cálculo de parámetro.Consideremos una variable estadística bidimensional (X,Y) y recordemos las definiciones demedia y varianza para distribuciones de variable estadística unidimensional:MEDIAVariable XVariable Yp∑xiniyini=x = 1 i=y = 1nnp∑i∑2nixi2VARIANZA 2 i=1sx= − xns2y=∑i=1n yni2i− y2A la raíz cuadrada positiva de las varianzas se la llama desviación típica y se representa pors x y por s y .Se llama covarianza de una variable bidimensional (X,Y) a la media aritmética de losproductos de las desviaciones de cada variable respecto a sus medias respectivas.La covarianza se representa por s xysxy=p∑i=1n xiiyi− x ynCorrelación.Se llama correlación a la teoría que trata de estudiar la relación o dependencia que existe entrelas dos variables que intervienen en una distribución bidimensional.• La correlación es lineal o curvilínea según que el diagrama de puntos se condense entorno a una línea recta o a una curva.• La correlación es positiva o directa cuando a medida que crece una variable la otratambién crece.• La correlación es negativa o inversa cuando a medida que crece una variable la otradecrece.1Variables estadísticas Bidimensionales


Apuntes de A. CabañóMatemáticas aplicadas a cc.ss.• La correlación es nula cuando no existe ninguna relación entre ambas variables; en estecaso los puntos del diagrama están esparcidos al azar, sin formar ninguna línea, y se diceque las variables no están correlacionadas.• La correlación es de tipo funcional si existe una función que satisface todos los valoresde la distribución.El procedimiento más frecuente utilizado para asignar valores a las distintas correlaciones es apartir del coeficiente de correlación de Pearson. Dicho coeficiente se define mediante lasiguiente expresión:sxyr =s sEl signo del coeficiente r viene dado por el signo de la covarianza, ya que las desviacionestípicas son siempre positivas. El signo de la covarianza decide el comportamiento de lacorrelación:• Si la covarianza es positiva, la correlación es directa.• Si la covarianza es negativa, la correlación es inversa.• Si la covarianza es nula, no existe correlación.Veamos que tipo de dependencia existe entre las variables X e Y según el valor de r1. Si r=-1, todos los valores de la variable (X,Y) se encuentran situados sobre una recta; enconsecuencia, satisfacen la ecuación de una recta. Entonces se dice que entre lasvariables X e Y existe una dependencia funcional.2. Si –1


Apuntes de A. CabañóMatemáticas aplicadas a cc.ss.EjemploSe han realizado unas pruebas de habilidad (puntúan de 0 a 5) en un grupo de alumnos. Lassiguientes puntuaciones corresponden a las obtenidas por seis alumnos en dos de ellas:Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las variables?• Medias:23x = = 3,83620y = = 3,336• Desviaciones típicas:95 2σx= − 3,83 =61,16 = 1,0870 2σy= − 3,33 =60,58 = 0,76• Covarianza:77σ xy= − 3,83 ⋅ 3,33 = 0,079 → σxy6= 0,079• Coeficiente de correlación:0,079r = = 0,0961,08 ⋅ 0,76→ r = 0,096• La relación entre las variables es prácticamente nula.Ejemplo-En seis institutos de la misma zona se ha estudiado la nota media de los estudiantes de 1º debachillerato en Matemáticas y en Inglés, obteniéndose la información que se recoge en lasiguiente tabla:a) Halla la recta de regresión de y sobre x.b) Calcula yˆ5,5 . ¿Es fiable esta estimación? (Sabemos que r =( ) 0,87).3Variables estadísticas Bidimensionales


Apuntes de A. CabañóMatemáticas aplicadas a cc.ss.a)• Medias:15x = = 2,5618y = = 36• Desviaciones típicas:σx=43− 2,5662 2σ y = − 36• Covarianza:44σ xy = − 2,5 ⋅62==0,92 = 0,961,33 = 1,153 = −0,17• Coeficientes de regresión:−0,17y sobre x → m yx = = −0,180,92−0,17x sobre y → m xy = = −0,131,33• Rectas de regresión:y sobre x → y = 3 − 0,18 x − 2,5 → y = −0,18x+ 3,x sobre y→x = 2,5 − 0,13x = −0 ,13y+ 2,890,13y = 2, 89 − x( ) 45( y − 3)−x+ 2,89y =0,13→ y = −7,69x+ 22,23• Representación:b) La correlación es prácticamente nula; las rectas son casi perpendiculares.5Variables estadísticas Bidimensionales


Apuntes de A. CabañóMatemáticas aplicadas a cc.ss.c) Ecuación de la recta de regresión Y sobre X.8. Los valores de dos variables X e Y se distribuyen según la tabla siguiente. Determinar elcoeficiente de correlación y la recta de regresión Y sobre X. Comentar lo fiables que sonlas predicciones basadas en esa recta.X0 2 4Y1 2 1 32 1 4 23 2 5 09. Las puntuaciones obtenidas por un grupo de alumnos de COU en una batería de test quemide la habilidad verbal X y el razonamiento abstracto Y son las siguientes:X20 30 40 50(25,35) 6 4 - -Y(35,45) 3 6 1 -(45,55) - 2 5 3(55,65) - 1 2 7Se pide:a) ¿Existe correlación entre ambas variables?b) Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?.10. Los valores de dos variables aleatorias X e Y se distribuyen según la tabla:X 1 1 1 2 3 3 3Y 0 2 4 2 2 2 3n i 2 1 3 4 2 5 3a) Determina el coeficiente de correlación y la recta de regresión de Y sobre Xb) Comenta la fiabilidad de las predicciones basadas en esa recta.7Variables estadísticas Bidimensionales

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!