Las estadísticas como herramienta de investigación.

math.uprag.edu
  • No tags were found...

Las estadísticas como herramienta de investigación.

Las estadísticas como

herramientas de

investigación.

Prof. José Neville Díaz Caraballo

6 de abril de 2010

Universidad de Puerto Rico en Aguadilla

Departamento de Matemáticas


Introducción a las Estadísticas

Cuando nos mencionan la palabra

Estadísticas, ¿en qué pensamos?

Muchos piensan en …

– Números sin sentido o sin gran rigor

matemático

– Tal vez un poco de ansiedad

matemática

– Política, etc.


Sin embargo, la realidad es que el

análisis estadístico es indispensable

para la toma de decisiones sobre...

control de calidad

“reliability” de productos

asignación de fondos $$$, construcción de

escuelas,...(i.e. censo federal)

evaluar la efectividad de un programa o

propuesta...

efectividad de una nueva medicina

detección temprana del desarrollo de una

posible epidemia

etc.


Uno de los objetivos de esta

presentación sobre estadística

será:

Convertirlos en consumidores hábiles

de la Estadística


Algunas definiciones …

Estadística: Conjunto de

procedimientos y principios para

obtener y procesar información

para poder tomar unas decisiones

cuando nos enfrentamos a la

incertidumbre.

• Población: _________

• Muestra:

• Censo:

• Variable:


_________

_________

_________


El principal reto de las estadísticas

es...

El llegar a unas conclusiones válidas

sobre la población, cuando lo que se

tiene es el análisis de la información

muestral. (O sea solo disponemos

de una información parcial).

Pa r a e s t o e s pr im o r d ia l e l po d e r

r e c o pila r una inf o r m a c ió n (d a t a )

c o nf ia b le !


Fuentes para obtener los datos

Fuentes internas

– expediente médico

– expediente del empleado, etc.

Fuentes externas

- Revistas profesionales

- Internet (censo!)

Diseñar mecanismos para nosotros generarla

(cuestionarios)


Suponga que queremos realizar

un estudio

Necesitamos obtener una muestra

– representativa, y al azar

– suficientemente grande

Decidir el tipo de estudio que

queremos realizar

– Estudio Descriptivo

– Estudio Experimental


Lo ideal cuando tratamos de establecer

la relación entre la variable explicativa

y la variable respuesta sería...

manipular la variable explicativa (todo lo

demás permanece constante) y ver cómo

cambia la variable respuesta como

consecuencia! Lo más cercano a esto es

un experimento.

En el experimento nosotros:

– “creamos” diferencias en la variable

explicativa y examinamos los resultados.

– hay una intervención y asignamos las

unidades experimentales al azar


En el estudio observacional

nosotros

En un estudio observacional

observamos unas diferencias en la

variable explicativa y vemos si éstas

están relacionadas o no con algún

cambio en la variable respuesta.

En un estudio descriptivo podemos

determinar que existe alguna

asociación, pero no podemos atribuir

causa.


Algunas consideraciones cuando

planificamos un estudio o leemos un informe

estadístico

la fuente de la investigación y el auspicio

$$$

quién contactó a los participantes y cómo

fueron estos participantes seleccionados

el medioambiente en que se realizó el

estudio

las unidades en que se midió la variable

respuesta y la magnitud de los alegados

efectos

E. experimental vs E. observacional


Veamos algunas situaciones

Encuestas políticas por radio...

Un informe de una agencia federal

colocaba a NJ como el estado #22 en la

lista de estados con mayor cantidad de

desperdicios tóxicos (lbs)

(cuando se ajustó por tamaño( lbs/milla^2), era el

segundo!)

La avena es muy buena!!

“Smoking may lower kids’s IQs” revista

Pediatrics,vol.93(2), Feb. 1994, pgs.

221-227


Estadística Descriptiva

Visitar mi página

http://math.uprag.edu/diaz.html

Conjunto de datos clase enero 2009


Sobre las preguntas de

investigación y la estadística

inferencial


La idea detrás de una prueba de

Hipótesis…

Cuantificar qué sería una “diferencia

significativa”

Digamos que se asume que el

promedio en el Examen Final para

todos los estudiantes de Mate 3171

es 68.

Usted cree que en la actualidad ese

promedio es menor

¿Qué hacemos?


Tomamos una muestra aleatoria y

calculamos x_barra:=promedio muestral

Supongamos:

x_barra =71

o

x_barra =67

o

x_barra =52

Así que la pregunta es: ¿Cuándo la

diferencia observada en mi muestra es lo

suficientemente contundente como para

concluir que :μ


Procedimiento para realizar una

Prueba de Hipótesis

1) Establecer Ho y H1:=preg. de inv.

2) Establecer las “reglas de juego”

a) Definir la prueba estadística

b) Establecer el nivel de significancia

c) Establecer la Región de Rechazo

3) Calcular el valor observado de la prueba

estadística

4) Decisión: Rechazar Ho o No podemos rechazar

Ho

Nota: el “p_value” (Si el “p_value” es menor que

el nivel de significancia que estamos dispuestos

a aceptar, rechazamos Ho)


Tipos de errores!

Decisión

Realidad

Ho es cierta

Ho es falsa

Rechazar Ho

Error Tipo I

P(ETipo I) =α

OK

No rechazar

Ho

OK

Error Tipo II

P(ETipo II) =

β


Algunas pruebas estadísticas…

I) Prueba de

Independencia u

Homogeneidad

(chi-cuadrado)

Data categórica

“Sólo contamos”

i.e. cuestionarios

concentración

Premédica

Otra

Conocimiento de

cierta enfermedad

Buena

31

19

Pobre

91

359


El análisis estadístico …

Ho: carac1 es ind. de la carac.2

H1: carac1 es dep. de la carac.2


Otras Pruebas estadísticas...

Si la variable respuesta es cuantitativa y

queremos comparar el promedio de dos

grupos de interés entonces:

Prueba Z, Prueba t o Prueba t pareada

Si la variable respuesta es cuantitativa y

queremos comparar el promedio de más

de dos grupos de interés

entonces:ANOVA

ANOVA one way vs. two way


One Sample t

Verificar si este grupo de pacientes

tiene un nivel de colesterol deseable

(220).

Verificar si el tiempo de

sobrevivencia promedio de los

pacientes que se somenten a una

operacion del corazon es 5 años.


Algunos comentarios sobre los

cuestionarios...







Al azar no es a lo loco

Es el tipo de dato más débil (contar) y por

consiguiente se requiere n “bastante grande

(Esto es, en promedio tal que se espere obtener

más de 5 observaciones en cada celda de

clasificación)

No preguntas innecesarias, verificar que una

vez recopiles la información, en efecto, puedas

contestar la pregunta de investigación.

Preguntas redactadas en forma clara,

consistente, no ambiguas (apb)

Se recomienda un pequeño estudio piloto o “pre

sampling” para afinar la redacción del

cuestionario.

Cuidado con el r.r. (Response ratio)


Ejemplo de la importancia de

que los estadísticos realicen los

experimentos.


NASA

Space Shuttle Challenger: January 28, 1986


Noche antes del despegue

O-

Rings

Información

•Pronóstico temperatura ambiental del día

siguiente 31°F

•O-Rings no sellan apropiadamente en

temperaturas frías

•Datos del comportamiento de O-Rings en

vuelos anteriores


Durante el Despegue

Video del desastre del challenger


Datos de todos los vuelos anteriores

Temperature vs Damage

52

56

60

64

68

Temp

72

76

80

D am ag e

1

0


Método Estadístico: Regresión Logística


Reacción del

NASA Kennedy Space Center

• "January 28, 1986,11:38:00 a.m. EST. First

Shuttle liftoff scheduled from Pad B.

Launch set for 3:43 p.m. EST, Jan. 22,

slipped to Jan. 23, then Jan. 24, due to

delays in mission 61-C. Launch reset for

Jan. 25 because of bad weather at

transoceanic abort landing (TAL) site in

Dakar, Senegal.... Explosion 73 seconds

after liftoff claimed crew and vehicle.

Cause of explosion was an O-ring failure

in right SRB. Cold weather was a

contributing factor."


Minitab como herramienta de

investigación

En el ejemplo anterior observamos

como utilizar una prueba incorrecta

puede ser desastroso. En este

ejemplo vamos a ver como debemos

cumplir con las presunciones del

modelo.

Estudiaremos la relación entre

turnos al bate (bats attents) y

sencillos (hits).


Para usar minitab 15 oprima en el

icono

Minitab luce asi.


Para acceder al desde un navegador escriba

math.uprag.edu/baseball-regression.MPJ

El análisis de residuales permite cotejar si las

suposiciones del modelo de regresión se cumplen.

Se puede detectar:

a) Si efectivamente la relación entre las variables

X e Y es lineal.

b) Si hay normalidad de los errores.

c) Si hay valores anormales en la distribución de

errores.

d) Si hay varianza constante (propiedad de

Homocedasticidad) y

e) Si hay independencia de los errores.


Natural selection is a mechanism for

generating an exceedingly high degree of

improbability.

Sir Ronald Fisher

The theory of probability as mathematical

discipline can and should be developed from

axioms in exactly the same way as Geometry

and Algebra.

Andrey Kolmogorov


Gracias por su atención

José Neville Díaz Caraballo

josenevillediaz@netscape.net

890-2681 Ext 416

More magazines by this user
Similar magazines