µ - Métodos de Investigación Interdisciplinaria

SEMINARIO MÉTODOS INTERDISCIPLINARIOS 

DOCTORADO INTER-INSTITUCIONAL EN 

CIENCIAS AMBIENTALES 

Coordinadores: 

Carlos E. López, UTP 

Elkin Salcedo, Univalle 

Silvio Carvajal, Unicauca 

2011 

1

METODOS DE INVESTIGACION CUANTITATIVA 

CONTINUACIÓN PARTE III 

PRUEBA DE HIPÓTESIS O ESTUDIOS 

COMPARATIVOS 

SILVIO M. CARVAJAL V. 

PROFESOR 

UNIVERSIDAD DEL CAUCA 

FACULTAD DE CIENCIAS NATURALES, EXACTAS Y DE LA EDUCACIÓN 

GRUPO DE INVESTIGACIÓN EN TOXICOLOGÍA GENÉTICA Y 

CITOGENÉTICA 

2011 2

EXPERIMENTOS CON TRES Y MÁS MUESTRAS 

(Aplicación del ANÁLISIS DE VARIANZA ) 

1. DISEÑO COMPLETAMENTE ALEATORIO: 

•Problema monofactorial 

•Problema factorial. 

2. DISEÑO CON AGRUPAMIENTO: 

•Bloques 

•Cuadrado Latino 

3

5. DISEÑO CON TRES O MÁS TRATAMIENTOS (Tres o más Muestras): (Análisis 

bivariante) 

El factor o variable cualitativa tiene tres ó más niveles o categorías 

¿Cuál de las concentraciones de una droga (Alta, media, 

baja, sin) inducen daños en el material genético de los 

linfocitos cultivados in vitro. 

FACTOR: Concentraciones de una droga. 

NIVELES DEL FACTOR O TRTAMIENTOS: - Alta 

- Media 

- Baja 

- Sin droga (Solvente puro = Control) 

VARIABLEDEPENDIENTE: Daños 

en los cromosomas (QUIEBRES). 

4

DISEÑO DEL EXPERIMENTO: 

HIPÓTESIS DE TRABAJO: La droga, por ser un xenobiote, puede inducir daños en 

el matrerial gnético, en forma dpendiente de su concentración. 

HIPÓTESIS ESTADÍSTICAS: 

H0: µ Sin = µ Baja = µ Media = µ Alta 

H1: Al menos un µ es diferente 

TRATAMIENTOS: Concentración de la droga 

- Alta 

- Media 

- Baja 

- Sin droga (Solvente puro = Control) 

TAMAÑO DE MUESTRA (Repeticiones): 

5

EXPERIMENTO: Diseño completamente aleatorio 

U.E 

Muy Homogéneas 

DATO: Número de alteraciones cromosómicas en 100 células por persona. (AC/100 cel.) 

ANÁLISIS ESTADÍSTICO: 

• Descriptivo: 

• Inferencial: - Estimación del No.promedio de AC/100 cel. en cada población mediante 

el IC del 95% 

- Comparativo: ANÁLISIS DE VARIANZA MONOFACTORIAL (Prueba Paramétrica) o 

mediante Kruskal-Wallis (No Paramétrica). 

6

BASE DE DATOS: No. de AC, correspondientes a cuatro muestras independientes 

7

5.1. PRINCIPIO TEÓRICO DEL ANOVA Las técnicas iniciales del analisis de varianza 

fueron desarrolladas por el estadístico y genetista R. A. Fisher en los años 1920 y 1930 y es algunas veces conocido como Anova 

de Fisher o analisis de varianza de Fisher, debido al uso de la distribución F de Fisher como parte del contraste de hipótesis. 

Cuando en un experimento intervienen tres o más muestras, el análisis mediante 

prueba t de “Student” incrementa la probabilidad de error tipo I. 

Ej. Con tres muestras (3 Ttos), tres comparaciones . 

La probabilidad Total de error es: 

P = 1 – (0,95) C = 1 – (0,95) 3 = 0,143 

C = Número de comparaciones 

¡LA PROBABILIDD DE ERROR 

ES 14,3% ! 

El análisis debe hacerse mediante 

Análisis de varianza, complementada con 

una prueba de comparaciones múltiples 

8

PRINCIPIO TREÓRICO DELANOVA 

En todo conjunto de datos, correspondiente a dos o más muestras, hay dos 

fuentes de Variabilidad 

9

Si las muestras provienen de la MISMA POBLACIÓN, entonces la variabilidad 

ENTRE no es más que una consecuencia de la variabilidad DENTRO 

MUESTRAS REPRESENTATIVAS DE 

LA MISMA POBLACIÓN 

Por lo tanto: 

VAR. ENTRE = VAR. DENTRO 

Se acepta la H0: µ Sin = µ Baja = µ Media = µ Alta 

Se concluye que no hay diferencia significativa entre los promedios. 10

Si las muestras proviene de POBLACIONES DIFERENTES (Diferentes tratamientos), 

entonces la variabilidad “ENTRE“ es una consecuencia de la variabilidad “DENTRO” 

MÁS EL EFECTO DE TRATAMIENTOS. 

DIFERENTES TRATAMIENTOS 

MUETRAS PERTENECIENTES A 

POBLACIONES DIFRENTES 

Por lo tanto: 

Var. ENTRE = Var. DENTRO + EFECTO DE 

TRATAMIENTO 

Se rechaza la H0: µ Sin = µ Baja = µ Media = µ Alta 

Se concluye que: Al menos un µ es diferente (H1) 

11

¿Cómo medir la variabilidad de una serie de datos (xi). 

VARIANZA (S 2 ): Desviación cuadrática promedio, de los datos de una muestra, 

respecto de su media aritmética.. 

Ej. Serie de datos: 

Tamaño de muestra: 

Media aritmética: 

PROMEDIAR LASDIFRENCIAS AL CUADRADO: 

SIMBÓLICAMENTE: 

12

TABLA DE ANOVA 

Fuente de 

Variación 

FACTOR A 

(Entre Con.) 

ERROR 

(Dentro) 

TOTAL 

Suma de 

Cuadrados 

120,844 

50,875 

171,719 

gl 

3 

28 

31 

Cuadrado 

Medio 

(Varianza) 

40,281 

1,817 

F 

Sig. 

22,170 0,000 

SE RECHAZA LA H 0 : Se concluye que al menos un promedio es diferente. 

¿Qué promedios son diferentes: PRUEBA DE COMPARACIONES MÚLTIPLES 

DE Tukey (Para Varianzas homogéneas). 

CONCLUSIÓN: 

A las concentraciones Media y Alta, que no 

difieren significativamente entre si (p>0,05), 

les corresponde los mayores promedios de 

daño cromosómico. Alta y Media difieren 

significativamente (p < 0,05)de Baja y Control 

con los menores promedios de AC/100 cel. 

14

PRUEBA NO PARAMÉTRICA DE KRUSKAL - WALLIS 

SE RECHAZA LA H 0 : Se concluye que al menos un promedio es diferente. 

En este caso, las comparaciones por parejas se puede hacer con la prueba U de 

Mann-Whitney 

15

REQUISITOS PARA APLICAR LA PRUEBA T Y EL ANOVA: 

1 Ajuste a la Distribución Normal, en especial si la muestra es pequeña (n

PROBLEMA FACTORIAL O MULTIFACTORIAL 

(ANÁLSIS MULTIVARIANTE) 

17

5.2. PROBLEMA FACTORIAL O MULTIFACTORIAL (ANÁLISIS 

MULTIVARIANTE) 

DOS O MÁS FACTORES o Variables cualitativas independientes. 

TRATAMIENTOS: Resultan de combinar los niveles de los factores. 

SU PRINCIPAL APLICACIÓN ES IDENTIFICAR INTERACCIÓN 

ENTRE FACTORES 

PROBLEMA CON DISEÑO COMPLETAMENTE ALEATORIO 

¿ Cuál de dos drogas (A, B) y por qué vía (Boca , intramuscular) es mejor para 

controlar la concentración de colesterol (mg) en la sangre de los ratones. 

EFECTOS PRINCIPALES: Drogas (A, B) 

Vía (Boca, Intramuscular) 

TRATAMIENTOS: A-Boca, A-Intramuscular , B-Boca, B-Intramuscular. 

18

EXPERIMENTO, Con diseño completamente Aleatorio. 

TRATAMIENTOS: 

A-Boca A-Intramuscular B-Boca B-Intramuscular. 

ALEATORIZACIÓN 

La concentración del 

colesterol (mg) en la sangre, 

se cuantifica ANTES y 

DESPUÉS de aplicar el Tto. 

20 RATONES 

DATO: Diferencia [A] – [D] 

U.E. Cada ratón 

4 MUESTRAS: n A-Boc = n A-Int = n B-Boc = n B-Int = 5 

19

BASE DE DATOS 

HIPÓTESIS: 

Efectos Principales: DROGA: H 0 : µ A = µ B 

VENENO: H 0 : µ IN = µ BO 

H 1 : µ A ≠ µ B 

H 1 : µ IN ≠ µ BO 

Interacción: H 0 : No hay interacción. H 1 : Si hay interacción. 

Tratamientos H 0 : µ A-IN = µ A-BO = µ B-IN = µ B-BO 

20 

H 1 : Al menos un µ es diferente

TIPO DE DROGA 

A 8,53 

20,53 

12,53 

14,00 

10,80 

∑ X :66,39 

∑ X2 : 963,8825 

VÍA DE ENTRADA 

INTRAMUSCULAR BOCA 

17,53 

21,07 

20,80 

17,33 

20,07 

∑ X :96,8 

∑ X2 :1887,0195 

TOTALES 

∑ X : 163,19 

B 39,14 

26,20 

31,33 

45,80 

40,20 

∑ X :182,67 

∑ X2 :6913,6285 

32,00 

23,80 

28,87 

25,06 

29,33 

∑ X :139,06 

∑ X2 :3912,1695 

∑ X : 321,73 

TOTALES ∑ X : 249,06 ∑ X : 235,86 Gran Total 

∑ X : 484,92 

∑ X2 : 13676,7 

21

FUENTE 

VARIACIÓN 

SUMA DE 

CUADRADOS 

gl 

CUADRADO 

MEDIO 

F 

Sig. 

ENTRE: 

Tratamientos 

Drogas 

Entradas 

Droga x Entrada 

DENTRO: 

Error 

1539,407 

1256,747 

8,712 

273,948 

379,923 

3 

1 

1 

1 

16 

513,136 

1256,747 

8,712 

273,948 

23,745 

21,610 

52,926 

0,367 

11,537 

0,000 

0,000 

0,553 

0,004 

TOTAL 

1919,33 

19 

El ANOVA es significativo (p < 0,05), para las DROGAS y para LA INTERACCIÓN. 

Se concluye que hay diferencia significativa entre las drogas, pero DEPENDIENDO de 

la VIA DE ENTRADA. 

La interacción “DROGA x VÍA DE ENTRADA” fue significativa. Se concluye que la 

influencia de la DROGA es DEPENDIENTE del factor Vía. Se deben analizar los 

Tratamientos. 22

INTERACCIÓN 

Cuando HAY INTERACCIÓN entre dos factores, el efecto de 

uno de los factores sobre la variable dependiente, se halla 

influenciado por el otro factor. 

Cuando la interacción es significativa, no 

se justifica analizar a cada Factor por 

separado. Se deben analizar los Ttos. 

(Combinación de niveles), mediante 

prueba de comparaciones múltiples. 

CONCLUSIÓN: El mejor tratamiento es cuando la droga B se 

administra por vía INTRAMUSCULAR. Se obtiene la mayor 

diferencia en la reducción del colesterol 23

La gráfica muestra la NO INTERACCIÓN entre los dos factores. 

En este caso, se concluiría que la droga B es mejor, sin importar 

la vía de entrada. 

24

5.3 DISEÑO CON AGRUPAMIENTO. 

5.3.1 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS 

(DBCA): 

El DBCA, permite identificar y aislar una variable que surge 

en el momento de realizar el experimento y que no permite 

hacer unidades experimentales homogeneas. 

FACTOR DE BLOQUEO: Es la variable cualitativa o categórica que impide hacer UE 

homogeneas. 

BLOQUE: Grupo de UE homogéneas. Cada bloque se constituye en una repetición del 

Experimento. 

25

PROBLEMA. ¿Con cuál de los siguientes abonos: A, B, C, D; se logra 

una mejor producción de las plantas de tomate de una determinada 

variedad. Indicador de producción: Peso en Kg de los tomates de cada 

parcela. 

El experimento se hará en el campo en un terreno en PENDIENTE. 

OBJETIVO. Identificar los mejores abonos para la producción de tomates. 

BLOQUES COMPLETOS ALEATORIZADOS: 

La PENDIENTE es un factor restrictivo que impide 

formar UE (Parcelas) homogéneas. 

Por lo tanto, la forma adecuada para identificar y 

aislar la VARIABILIDAD QUE SE PUEDA 

ORIGINAR EN EL FACTOR PENDIENTE DEL 

TERRENO, es mediante un DISEÑO DE 

BLOQUES COMPLETOS ALEATORIZADOS. 

VENTAJAS: 

Reduce el error y por lo tanto la prueba 

adquiere mayor potencia. 

Permite identificar y aislar una variable que 

impide hacer UE homogéneas. 

Menos UE para realizar un experimento. 

26

EFECTOS PRINCIPALES: 

Tipo de abono (A, B, C) 

Pendiente (Alto, medios, bajo). Variable de bloqueo. 

HIPÓTESIS: 

Para Abonos (Efecto principal) 

H 0 : µ A = µ B = µ C = µ D H 1 : Al menos un µ es diferente 

Para Pendiente (Efecto de bloqueo) 

H 0 : µ Alta = µ Medios = µ Baja H 1 : Al menos un µ es diferente 

27

Kg de tomate/parcela. 

BLOQUES 

ABONOS 

A B C D 

1 89 60 100 60 

2 85 62 120 62 

Un DATO por 

UE; no es 

posible evaluar 

INTERACCIÓN 

. 

3 82 64 110 89 

4 75 40 80 85 

5 65 35 75 75 

En este caso solo se ha registrado un dato por UE y por lo 

tanto NO se puede evaluar INTERACCIÓN. 

ANÁLISIS DE VARIANZA PARA BLOQUES 

28

La prueba solo es significativa para ABONOS. Se rechaza la H 0 para abonos, y se 

concluye que al menos la producción de un ABONO difiere de otro u otros. 

La prueba de COMPARACIONES MÚLTIPLES (Tukey), indica que los abonos D, A y C 

no difieren entre si. El abono B difiere de A y C, y es el de menor producción. 

29

5.3.2 DISEÑO CUADRADO LATINO (DCL): 

El DCL, permite identificar y aislar dos variable que surgen 

en el momento de realizar el experimento y que no permiten 

hacer unidades experimentales homogeneas. Es una 

generalizacion del DBCA. 

C 

A 

D 

B 

B 

A 

D 

A 

D 

C 

C 

PENDIENTE: 

Filas 

B 

Si por parcela (UE), se 

registran dos o más 

datos se puede analizar 

como un experiemnto 

factorial (La filas y 

columnas serian dos 

nuevos factores). 

B 

C 

D 

A 

RIO: Gradiente de humedad: COLUMNAS 

30

Kg de tomate/parcela. 

FILAS 

COLUMNAS 

1 C = 10,5 A = 13,2 B = 12,0 D = 7,7 

2 D = 7,5 B = 11,1 A = 12,0 C = 10,3 

3 A = 11,2 D = 5,8 C = 12,2 B = 13,7 

4 B = 12,3 C = 10,2 D = 5,9 A = 11,6 

31

Fuente de 

Variación 

ANOVA (Cuadrado Latino) 

Suma de 

Cuadrados 

gl 

Cuadrado 

Medio 

(Varianza) 

ABONOS 78,925 3 26,308 18,9 < 0,005 

PENDIENTE 1,170 3 0,390 0,28 > 0,1 

(Filas) 

HUMEDAD 1,955 3 0,652 0,47 > 0,1 

(Columnas) 

ERROR 8,35 6 1,39 

TOTAL 90,400 15 

F 

Sig. 

Hay diferencia 

significativa entre 

abonos. 

Se debe identificar 

el mejor mediante 

prueba de 

Comparaciones 

Múltiples. 

32

METODOS DE INVESTIGACION CUANTITATIVA 

PARTE IV 

ANÁLISIS DE VARIABLES CUANTITATIVA, 

CUALITATIVAS Y ANÁLISIS MULTIVARIADO 

SILVIO M. CARVAJAL V. 

PROFESOR 

UNIVERSIDAD DEL CAUCA 

FACULTAD DE CIENCIAS NATURALES EXACTAS Y DE LA EDUCACIÓN 

GRUPO DE INVESTIGACIÓN EN TOXICOLOGÍA GENÉTICA Y 

CITOGENÉTICA 

2011 

33

6. ANALISIS DE VARIABLES CUANTITAVAS. 

6.1 Análisis de Correlación 

6.2 Análisis de Regresión simple. 

6.3 Análisis Regresión Lineal múltiple. 

6.4 Análisis de Covarianza. 

7. ANALISIS DE VARIABLES CUALITATIVAS. 

7.1 Pruebas de asociación entre dos variables cualitativas: Prueba de Chi 

Cuadrado y test exacto de Fisher. 

7.2 Regresión Logística Binaria. 

8. ANÁLISIS MEDIANTE PRUEBAS MULTIVARIANTES (Descriptivas). 

Análisis de Componentes Principales. 

Análisis de Cluster o Árbol. 

34

6. ANALISIS DE VARIABLES 

CUANTITATIVAS 

CORRELACIÓN Y REGRESIÓN SIMPLE 

(ANÁLSIS BIVARIANTE) 

35

ANÁLISIS DE VARIABLES CUANTITATIVAS 

6.1 CORRELACIÓN SIMPLE. Grado (o fuerza) de asociación 

estadística entre dos variables cuantitativas, sin importar 

cual es la causa y cual es el efecto. 

Se trata de responder la pregunta: ¿La variabilidad 

observada en una de las variables se asocia con la 

variabilidad de la otra variable. 

Para este análisis es requisito que las dos variables se 

ajusten a la distribución normal. 

Ejemplos: BIVARIANTE: EXISTE ASOCIACIÓN O DEPENDENCIA ENTRE: ¿Estatura 

(cm) y peso (Kg). ¿Temperatura del agua (°C) y concentración de oxígeno (ppm). 

¿Estatura (cm) y coeficiente intelectual (IQ). ¿Peso de las personas (Kg) y distancia 

de salto (m). 

MULTIVARIANTE: ¿Es la concentración de colesterol en la sangre (mg/dL) 

dependiente de la estatura (cm), del peso (Kg), y de la edad (Años). 

¿Es la concentración de proteínas (%)en las hojas de una variedad de planta 

dependiente de la altura de la planta (m), edad de la planta (años), y 

concentración de Nitrógeno en el suelo (ppm). 

36

CORRELACIÓN SIMPLE. 

Observando la asociación: Diagrama de Dispersión. 

Asociación lineal positiva Asociación lineal negativa No asociación 

Asociación no lineal o curva 

37

CORRELACIÓN LINEAL SIMPLE. ¿EXISTE ASOCIACIÓN LINEAL ENTRE: Estatura (cm) y peso 

(kg) de las personas. 

CUANTIFICANDO LA CORRELACIÓN LINEAL: 

Covariación “peso - estatura” de la persona A: 

cm-Kg 

Covariación promedio de n personas: COVARIANZA = 

COVARIANZA ESTANDARIZADA 

O COEFICIENTE DE CORRELACIÓN: r 

r = 

38

COEFICIENTE DE DETERMINACION: R 2 

¿LA VARIABILIDAD OBSERVADA EN UNA DE LAS VARIABLES (Y) EN 

QUE PORCENTAGE DEPENDE DE LA VARIABILIDAD DE LA OTRA 

VARIABLE (X): Coeficiente de Determinación: r 2 . 

39

ESTATURA (cm) PESO (Kg) 

172 76 

150 45 

155 55 

155 52 

170 75 

154 53 

178 79 

160 58 

160 63 

166 69 

HIPÓTESIS: H0: R = 0 H1: R ≠ 0 

LA VARIABILIDAD OBSERVADA EN EL PESO, DEPENDE EN UN 79,2%, 

DE LA VARIABILIDAD EN LA ESTATURA 

40

¿EXISTE ASOCIACIÓN O DEPENDENCIA ENTRE: Temperatura del agua 

(°C) y concentración de oxígeno (ppm). 

[ O 2 ] T 0 C 

8 

CONCENTRACIÓN DE OXIGENO 

1 60 

3 50 

4 40 

5 30 

6 20 

1 50 

3 40 

4 30 

5 20 

6 10 

7 

6 

5 

4 

3 

2 

1 

0 

0 

10 

20 

30 

40 

TEMPERATURA 

50 

60 

70 

Observada 

Lineal 

HIPÓTESIS: H0: R = 0 H1: R ≠ 0 

Existe asociación negativa significativa estadísticamente : La variabilidad en el 

oxígeno depende en un 74,8% de la variabilidad en la temperatura. 

41

Karl Pearson (Londres 27 de marzo de 1857- Londres, 27 de abril de 1936) fue un prominente científico, matemático y pensador 

británico, que estableció la disciplina de la estadística matemática. Desarrolló una intensa investigación sobre la aplicación de los 

métodos estadísticos en la biología y fue el fundador de la bioestadística. Fue un positivista radical. 

Charles Edward Spearman (Londres, 10 de septiembre de 1863 - Londres, 7 de septiembre de 1945). Psicólogo inglés. Realizó 

importantes aportes a la psicología y a la estadística, desarrollando el Análisis Factorial. 

TIPOS DE ANÁLSIS DE CORRELACIÓN SIMPLE: 

1. ANALSIS DE CORRELACION LINEAL DE PEARSON (Paramétrica): permite 

identificar ASOCIACIÓN LINEAL entre dos variables cuantitativas. 

2. ANALSIS DE CORRELACION DE SPEARMAN (No Paramétrica): permite 

identificar ASOCIACIÓN GENERAL O DE CUALQUIER TIPO (Incluida la lineal) 

entre dos variables cuantitativas. 

Cuando se identifica asociación general entre dos variables, se debe identificar la 

curva que explica mejo dicha asociación. 

Se debe hacer ESTIMACION CURVILINEA. 

42

6.2 ANALISIS DE REGRESIÓN SIMPLE 

Identificar relación de DEPENDENCIA entre una variable cuantitativa 

independiente X, y una variable cuantitativa dependiente Y. La variable 

independiente también puede ser cualitativa. Solo exige que la variable 

dependiente se ajuste a la distribución normal. 

El objetivo es identificar la fórmula que exprese la relación de 

dependencia. 

Si esa relación se expresa mediante una función lineal del tipo y = b0 + b1X, 

su gráfica corresponde a una línea recta. 

LÍNEA DE REGRESIÓN DE MEJOR AJUSTE: Método de mínimos cuadrados: 

43

FÓRMULA DE REGRESIÓN LINEAL: Se debe cuantificar la PENDIENTE (b 1 ) y el 

intercepto en Y (b 0 ). 

¿Cómo calcular b1: 

¿Cómo calcular b0: 

b 1 = PENDIENTE o COEFICIENTE DE REGRESIÓN: 

Es la VARIABILIDAD de Y, por cada Unidad de 

incremento en X. 

Se despeja de la fórmula con 

base en los valores promedio: 

44

HIPÓTESIS DE LA REGRESIÓN: H0: B = 0 

H0: B ≠ 0 

8 

7 

CONCENTRACIÓN DE OXIGENO 

b 0 = 7,5 ppm 

P = 0,000 

6 

5 

4 

3 

2 

1 

Observada 

0 

0 

10 

20 

30 

40 

50 

60 

70 

Lineal 

TEMPERATURA 

b0: A 0 0 C le corresponde 7,5 ppm de oxigeno. 

b1: Por cada grado centígrado de incremento en la temperatura, la concentración de 

O 2 disminuye 0,1067 ppm. 

¿Qué concentración de O 2 le corresponde a 25 0 C de temperatura. 

45

Base de datos correspondiente a una investigación para identificar relaciones entre 

componentes de tejidos vegetales y componentes del suelo. 

¿La concentración de grasa (%)en las hojas de una variedad de planta, se asocia 

con la concentración de Nitrógeno (%) y con la concentración de Ca (meq/100 g) en 

el suelo donde crece. ¿Cuál es la fórmula que describe la asociación de 

Dependencia 

46

Mediante análisis de correlación de Pearson se identifica una asociación lineal 

negativa, significativa estadísticamente , entre el contenido de grasa (%) en los tejidos 

vegetales y el contenido de N (%) en el suelo (R= -0,70; p

Asociación lineal negativa 

No asociación lineal 

48

Mediante análisis de correlación de Spearman se identifica 

asociación positiva, significativa estadísticamente, entre el 

contenido de grasa (%) en los tejidos vegetales y el contenido de 

Ca (meq/100g) en el suelo (Rho = 0,547; p

ANÁLISIS DE CURVA DE MEJOR AJUSTE: 

50

Mediante estimación curvilínea, se logra establecer que la curva de mejor ajuste es 

la cuadrática. En consecuencia, la asociación entre GRASA y CALCIO se puede 

describir mediante la ecuación: 

GRASA (%) = - 4,78 + 4,2 (Ca) – 0,656 (Ca) 2 51

ESTIMACIÓN CURVILINEA 

FÓRMULA CORRESPONDIENTE A LÍNEA RECTA 

Lineal: 

Y = B 0 + B 1 X 

Logarítmica: Y = B 0 + B1lnX 

Potencial: Y = B 0 X B1 

Exponencial: Y = B 0 e B1X 

ó lnY = lnB 0 + B 1 lnX 

ó lnY = lnB 0 + B 1 X 

Compuesta: Y = B 0 B1 X ó lnY = lnB 0 + XlnB 1 

Curva-S: Y = e B0 + B1/X ó lnY = B 0 + B 1 /X 

Cuadrática o Parábola: Y = B 0 + B 1 X + B 1 X 2 

Cúbica: Y = B 0 + B 1 X + B 1 X 2 + B 1 X 3 

Crecimiento: Y = e 

(B0 + B1X) 

ó 

lnY = B 0 + B 1 X 

Inversa: Y = B 0 + B 1 /X 

52

6.3 ANALISIS DE REGRESION LINEAL MULTIPLE (Análisis multivariante) 

Y = b 0 + b 1 X 1 + b 2 X 2 ………+b n Xn 

Identificar la relación de DEPENDENCIA entre una variable DEPENDIENTE 

CUANTITATIVA (Y) y varias variables INDEPENDIENTES (X). Como variables 

independientes, también se pueden incluir variables Cualitativas dicotómicas. 

PROBLEMA: ¿Cuáles de los componentes del suelo influyen 

en el contenido de bacterias. 

HIPOTESIS: 

H0: B = 0, La variable Xi no influye, condicionado a las variables predictivas en el modelo. 

H1: B ≠ 0, la variable Xi Si influye, condicionado a las variables predictivas en el modelo. 

SI: H1: B > 0 La variable Xi influye positivamente. 

B < 0 La variable Xi influye negativamente. 

53

Base de datos correspondiente a una investigación para identificar la relaciones entre 

minerales y microorganismos del suelo. 

INDEPENDIENTES 

DEPENDIENTE 

54

ANÁLISIS DE CORRELACIÓN DE 

PEARSON: 

Se identificó ASOCIACIÓN LINEAL 

POSITIVA , significativa estadísticamente 

(p< 0,05), entre el CONTENIDO DE 

BACTERIAS y cada una de las siguientes 

variables: 

Fosforo y calcio . 

ASOCIACIÓN LINEAL NEGATVA, con 

Nitrogeno y aluminio 

55

REGRESIÓN LINEAL MÚLTIPLE: 

Como se identificó ASOCIACIÓN LINEAL , significativa estadísticamente (p

Al parecer, sobre el recuento de BACTERIAS influyen: Calcio, Aluminio y Nitrógeno 

(p< 0,05). 

Sin embargo, es necesario hacer un análisis por etapas, INCLUYENDO O QUITANDO 

VARIABLES PREDICTORAS O INDEPENDIENTES, para Identificar posibles factores 

de confusión, entre las variables que aparentemente no influyen. 

57

Al parecer, el magnesio se comporta 

como un factor de confusión para el 

calcio. 

Sin la presencia del magnesio, el 

calcio deja de ser significativo (p = 

0,09). 

En presencia del Mg, el calcio, no 

solo es significativo, sino que su 

coeficiente de regresión cambia en 

más del 10%. De 0,126 pasa a 0,321 

En consecuencia, es conveniente 

que el Mg este en la ecuación, para 

que se manifieste el efecto del calcio. 

Este análisis por etapas, suele 

hacerlo en forma automática el 

programa SPSS, pero deja solo las 

variables significativas, con la 

posibilidad de fallar sobre los 

58 

Bacterias = 5,79 – 0,15Al – 6,68N + 0,32 Ca – 0,307 factores Mg de confusión.

COLINEALIDAD: Cuando dos variables independientes dan la 

misma información (dicen lo mismo), o cuando su coeficiente de 

correlación es muy alto (R > 0,9), el efecto de una de ellas puede 

inhibir el efecto de la otra, y viceversa. Esto se debe a que la H1 

en regresión múltiple es condicional (La H0, también lo es). 

En consecuencia, si la primera variable afecta a la variable 

dependiente, entonces, introducir otra variable que “dice lo 

mismo” que la primera, no afectará significativamente a la 

dependiente. Nada aporta, más allá del aporte de la primera y los 

efectos se pueden anular, dando la idea de una “confusión” 

errada. 

Cuando esto ocurre, se debe suprimir una de las variables, o 

incluir en el modelo de regresión, el promedio de las dos 

variables. 

59

PROBELMA: ¿Es la concentración del oxígeno 

(ppm) del agua de un río, dependiente de la 

temperatura (°C). Se analizó el agua de 

diferentes sitios, seleccionados aleatoriamente 

a lo largo del río, registrando el oxigeno y la 

temperatura a nivel de superficie y a 50 cm de 

profundidad. 

60

ANÁLISIS BIVARIANTE: 

Tanto la temperatura a nivel de 

superficie como la temperatura a 50 

cm de profundidad, influyen 

significativamente (p = 0,000) en la 

concentración de oxígeno. 

ANÁLISIS MULTIVARIANTE: 

Las temperaturas no influyen 

significativamente en la concentración 

de oxígeno. 

Las temperaturas son altamente 

correlacionadas (r = 0,996) y es evidente 

que dan la misma información. 

Cada temperatura ajusta su influencia, con 

base en la influencia de la otra temperatura, 

y decide, en consecuencia, que ya nada tiene 

que aportar, anulándose mutuamente. 

61

DISEÑO DE EXPERIMENTOS PARA EL ANÁLSIS DE CORRELACIÓN Y 

REGRESIÓN 

PROBLEMA: ¿Es la concentración de oxígeno del agua dependiente de la temperatura 

de la misma. 

1. EXPERIMENTO REAL: 

EL INVESTIGADOR DEBE: 

•Determinar variables que se consideren independientes y dependientes. 

Var. Independiente: Temperatura del agua (°C) 

Var. Dependiente: Con. de Oxígeno (ppm). 

•Determinar el Rango o Intervalo de la variable independiente que se evaluará. 

Intervalo a evaluar: 10 0 C a 50 0 C 

•Determinar los niveles o valores de la variable independiente que se evaluarán. 

Niveles o valores: 10, 20, 30, 40 y 50 0 C 

•Determinar el número de repeticiones por cada nivel o valor de la variable 

independiente: Seis por nivel. 62

EXPERIMENTO 

Agua de la misma calidad (Destilada y aireada) y a 

temperatura ambiente, será distribuida en 6 recipientes 

iguales (20 ml cada/uno). Se comenzará a disminuir 

(nevera) o incrementar la temperatura (Incubadora) 

según convenga, y cada vez que se llegue a la 

temperatura pertinente se medirá de inmediato la 

concentración de oxígeno con un medidor automático. 

Este procedimiento se repetirá seis veces en iguales 

condiciones. 

63

2. EXPERIMENTO OBSERVACIONAL O POST – FACTO. 

EL INVESTIGADOR DEBE: 

• Identificar el sitio en donde se hará la toma de los datos (registro de variables). Río, 

lago, estanque, laguna, etc.: Se hará en un río. 

Inicialmente no es necesario especificar cual de las variables es independiente o cual 

es dependiente. Solo para el caso de la Regresión es necesario hacer dicha 

clasificación y por lógica parece ser que la temperatura es independiente. 

• Diseñar la técnica de muestreo: 

Población objeto: Agua del río 

Marco Muestral: Agua del río entre las estaciones A y B distantes entre si 5 Km. 

Tipo de muestreo aleatorio: Muestreo aleatorio sistemático. 

Repeticiones o tamaño de la muestra: n = 50 porciones de agua 

• Registrar las variables en los diferentes puntos del muestreo en forma semejante. Los 

mismo equipos y operarios. 

En cada sitio identificado con la técnica de muestreo aleatorio, se hará una muestra 

compuesta con agua del centro y de las dos orillas y de inmediato se medirá la 64 

temperatura y la concentración de oxígeno.

REQUISITOS PARA APLICAR REGRESIÓN: 

1 Ajuste a la Distribución Normal, DE LOS RESIDUOS (Simple o ajustado). 

2. Homogeneidad de Varianzas. Ver gráfico de residuos (Tipificado vs.esperado) 

3. No colinealidad. Hay colinealidad cuando la tolerancia es menor al10%, o cuando 

el Índice de Condición es alto (> 15 posible colinealidad. > 30 colinealidad segura, 

pero solo si las proporciones de varianza son altas al menos para dos variables). 

4. Tamaño de muestra: Al menos 20 datos por variable Independiente. 

65

6.4 ANÁLISIS DE COVARIANZA (ANCOVA) 

(MULTIVARIANTE) 

Fusión del ANOVA y la regresión lineal múltiple. Procedimiento 

estadístico que permite eliminar la diferencia que pueda existir 

entre las categorías de la variable independiente, respecto de 

una o más variables cuantitativas (covariables) que acompañan a 

la variable dependiente en las UM, y que pueden influir sobre 

esta. 

La inclusión de covariables puede aumentar la potencia 

estadística porque a menudo reduce la variabilidad. 

COVARIABLE O COVARIADA: Variable cuantitativa que se 

registra en la misma UE en donde se registra la variable 

dependiente, y que puede tener influencia sobre esta. 

66

PROBLEMA: 

La concentración de colesterol en la sangre, es un 

factor de riesgo asociado con enfermedades del 

aparato circulatorio. 

Se ha planeado una investigación para determinar el 

contenido de colesterol en hombres y mujeres y 

determinar si difieren en cuanto a riesgo de 

enfermedades circulatorias. 

Se ha planteado el siguiente interrogante: 

¿Es la concentración de colesterol, diferente entre 

hombre y mujeres. 

67

Se conoce, además, que el contenido de colesterol en la sangre, también es 

dependiente del contenido de grasa en el cuerpo, por tal razón, se considera 

necesario incluir al Índice de Masa (IM) como covariable, siempre y cuando 

este factor no haya sido corregido al tomar la muestra, es decir que 

hombres y mujeres defieran en su IM. 

68

ANÁLISIS BIVARIANTE: Sexo vs. Concentración de Colesterol. 

Comparación HOMBRES vs. MUJERES respecto a la concentración de colesterol. 

Prueba T, para muestras independientes. 

Sin la covariable, la diferencia de colesterol entre hombres y 

mujeres es significativa estadísticamente y se concluye que 

los hombres se hallan en mayor riesgo. 

69

ANÁLISI BIVARIANTE: Índice de Masa vs. Concentración de Colesterol. 

ÁNÁLISIS DE DEPENDENCIA ENTRE INDICE DE MASA (x) Y CONCENTRACIÓN DE 

COLESTEROL (y). 

Se identificó asociación Lineal significativa 

estadísticamente (p < 0,001) entre el colesterol y el 

Índice de Masa, que se describe con la siguiente 

ecuación: 

Colesterol (mg/dl) = -20,25 + 8,52 (Índice de Masa). 

El coeficiente de determinación (r 2 ) permite concluir 

que la variabilidad en la concentración del 

colesterol, depende en un 69% de la variación en el 

Índice de Masa. 

¿De las dos variables independientes (Sexo e Índiced de Masa), realmente cual influye 

en la concentración del colesterol, o influyen las dos: Se debe hacer ANÁLISIS DE 

COVARIANZA. 

70

Utilizando el análisis de la covarianza se "corrige" o "ajusta“ la 

diferencia en el Índice de Masa ENTRE LOS SEXOS, con el fin 

de hacerlos comparables respecto del Colesterol. 

Con la covariable, la diferencia de colesterol entre hombres y mujeres 

es NO SIGNIFICATVA estadísticamente (p > 0,05). 

La concentración de colesterol se asocia significativamente con el IM. 

Se concluye que los individuos con mayor IM se hallan en mayor riesgo 

71 

de enfermedades circulatorias

Media = 28,9 Kg/cm 2 

Media = 21,9 Kg/cm 2 

I.M. 

Semejante 

En realidad, hombres y mujeres son diferentes en sus índices de masa (I.M.). En 

ANCOVA, se ajusta el valor del IM entre las categorías del sexo (Hombre, Mujer) 

igualándolos, y luego se los compara respecto de la concentración de colesterol. 

72

7. ANALISIS DE VARIABLES CUALITATIVAS 

(Investigación Observacional – Falso Experimento – Diseñar la toma de la muestra) 

7.1 ANÁLISIS BIVARIANTE: 

OBJETIVO: 

• IDENTIFICAR ASOCIACION O DEPENDENCIA ENTRE DOS VARIABLES 

CUALITATIVAS (O CATEGÓRICAS) 

Aplicación de las pruebas: 

• Chi cuadrado de Pearson para tablas de contingencia 2 x n 

y n x n. 

Karl Pearson (Londres 27 de marzo de 1857- Londres, 27 de abril de 1936) fue 

un prominente científico, matemático y pensador británico, que estableció la 

disciplina de la estadística matemática. Desarrolló una intensa investigación 

sobre la aplicación de los métodos estadísticos en la biología y fue el fundador 

de la bioestadística. Fue un positivista radical y en 1901, junto con Galton y 

Walter Frank Raphael Weldon, fundó la revista Biometrika 

73

PROBLEMA: Se quiere estudiar la posible asociación entre el hecho de que una 

gestante fume durante el embarazo y que el niño presente bajo peso al nacer. 

¿El peso del niño al nacer (Var. Cuantitativa categorizada) , 

depende o se asocia con el hábito de fumar de la gestante 

VARIABLES: 

• Peso del niño (Bajo – normal). Aunque es una variable cuantitativa, al 

categorizarse, adopta la forma de cualitativa. (Variable DEPENDIENTE) 

• Habito de Fumar (Si – No). (Variable Independiente) 

74

Mirando la asociación: 

33,8% 

61,2% 

Hay un 61,2% de 

niños con BAJO 

PESO entre las 

mujeres que fuman, 

frente al 33,8% de 

bajo peso, entre las 

que No Fuman. 

75

PROBANDO LA ASOCIACIÓN: 

1. PRUEBA DE CHI CUADRADO: 

HIPÓTESIS: H 0 : O = E En la distribución aleatoria (NO ASOCIACIÓN); 

H 1 : O ≠ E En la distribución aleatoria ( ASOCIACIÓN). 

O = Frecuencia absoluta Observada. 

E = Frecuencia absoluta Esperada en la distribución aleatoria (No asociación). 

¿Cómo calcular el valor esperado 

Con base en la proporción de: 

-PESO BAJO en el Total: 87/174 

-PESO NORMAL en el Total: 87/174 

¿Cuál es la frecuencia ESPERADA de “BAJO” en SI FUMA: 103 x 87/174 = 51,5 

¿Cuál es la frecuencia ESPERADA de “BAJO” en NO FUMA: 71 x 87/174 = 35,5 

Hacer el mismo cálculo, para PESO NORMAL. 

76

P < 0,005 

12,59 

Con 1 gl., se identifica asociación significativa estadísticamente (p < 0,005), entre el 

hábito de fumar y el peso bajo de los niños, al nacer. 

Grados de libertad (gl.) en una tabla de contingencia: (C – 1) (F – 1). 

77

PROBANDO LA ASOCIACIÓN: 

2. PRUEBA Odds Ratio: Relación de Ventajas 

Ventaja de “BAJO” a “NORMAL”: 

HIPÓTESIS: 

H0: OR = 1 

OR ≠ 1 

H1: OR > 1 (Riesgo) 

OR < 1 (Protección) 

La relación PESO “BAJO a NORMAL”, en Fumadoras es 3,08 veces mayor, que la 

misma relación en no Fumadoras. Es decir : FUMAR es un factor de riego para 

BAJO PESO de los niños al nacer. 

78

NOTA. Para que el análisis de las 

variables cualitativas sea confiable, el 

tamaño de la muestra debe ser lo 

suficientemente grande, para 

asegurar que en las tablas de 

contingencia hayan al menos 5 datos 

esperados por celda. 

79

DISEÑO DEL EXPERIMENTO PARA IDENTIFICAR ASOCIACIÓN ENTRE 

VARIABLES CUALITATIVAS: 

INVESTIGACIÓN CON EXPERIMENTO OBSERAVCIONAL: 

1. TRANSVERSAL O TRANSSECCIONAL: De la población objeto (o de su Marco 

Muestral), se toma una muestra aleatoria. 

Ej. De entre los nacimientos de varones en los diferentes centros de salud, durante 

mínimo seis meses, se toma una muestra de recién nacidos (Qué tamaño de muestra) 

y se clasifican en niños de PESO NORMAL y NIÑOS DE PESO BAJO. 

Mediante encuesta directa se dividen a las madres en fumadoras y no fumadoras. Las 

fumadoras deben haberlo hecho desde al menos seis meses antes del embarazo y 

durante el embarazo. 

Este diseño solo es recomendable, si las categorías de la variable independiente 

(Fumar: Si, No) y de la dependiente (Peso: Bajo, Normal), son relativamente altas y 

próximas, de lo contrario, los grupos serán muy desiguales en tamaño. 

80

2. LONGITUDINAL TIPO CASOS Y CONTROLES: De entre los nacimientos de 

varones en los diferentes centros de salud, se identifican niños de bajo peso e igual 

número de niños de peso normal, de características semejantes (Grupo étnico, 

procedencia, etc.), (Qué tamaño de muestra). 

Luego se les hará seguimiento retrospectivo a sus respectivas madres, para 

determinar si han fumado en el pasado, con el fin de clasificarlas en FUMADORAS Y 

NO FUMADORAS. 

Se registrarán, además, otras variables de interés en el estudio. 

La ventaja del diseño: CASOS Y CONTROLES, es que las dos categoría de la 

variable DEPENDIENTE (PESO: BAJO, NORMAL), son iguales. 

81

7.2 ANÁLISIS MULTIVARIANTE: REGRESIÓN LOGÍSTICA. La 

variable DEPENDIENTE es cualitativa dicotómica. 

Identificar FACTORES asociados con una VARIABLE CUALITATIVA BINOMIAL O 

DICOTÓMICA. 

IDENTIFICAR FACTORES DE RIESGO 

La variables cualitativa es un atributo “MALO”, por ejemplo: UNA ENFERMEDAD 

(Enfermo, Sano) 

¿Cuáles son los factores de riesgo asociados con el BAJO PESO DE LOS 

NIÑOS AL NACER. 

¿Cuáles son los factores de riesgo asociados con el CÁNCER DE 

PULMÓN. 

IDENTIFICAR FACTORES FAVORECEDORES 

La variables cualitativa es un atributo “BUENO”, por ejemplo: AGUA POTABLE (SI. NO) 

¿Qué factores favorecen la POTABILIDAD DEL AGUA 

82

En este análisis se busca identificar una ecuación del tipo: 

Ln (Odds) = ln (Ventajas) = ln (BAJO / NORMAL) = b0 + b1X1 ……bkXk 

b0: Constante. b1: Coeficiente de regresión logística. X: Variable cualitativa o 

cuantitativa. 

Odds = Ventaja = BAJO / NORMAL 

Odds Ratio: es una medida relativa de asociación. 

Cuando OR = 1, No es factor de riesgo, ni preventivo. 

Cuando OR > 1. Factor de riesgo (Enfermedad) o Favorecedor (Rasgo bueno). 

Cuando OR < 1. Factor preventivo (Enfermedad) o NO Favorecedor (Rasgo bueno). 

83

VARIABLE DEPENDIENTE (Y) 

VARIABLES INDEPENDIENTES (Xi) 

84

CODIFICACIÓN EN LA BASE DE DATOS 

Para este análisis, el nivel o GRUPO de referencia en cada variable, debe tener el 

código mas bajo (0) 

Ejemplos: 

PESO DE LOS NIÑOS: NORMAL= 0 (Grupo referente), BAJO = 1 

FUMAR: NO = 0 (Grupo referente) 

SI = 1 

GEN GSTM1: NORMAL = 0 (Grupo referente) MUTADO = 1 

GEN GSTT1: NORMAL = 0 (Grupo referente) MUTADO = 1 

85

Regresión Logística Binaria 

Coeficiente de regresión log. 

OR 

BIVARIANTE: 

Modelo sin ajustar 

OR = 3,08 

MULTIVARIANTE: 

Modelo ajustado con base 

en todas las variables. 

OR = 2,9 

Modelo ajustado con base solo en las 

variables significativas. OR = 3,04 

La relación “PESO BAJO a NORMAL”, 

en Fumadoras es 3,04 veces mayor, que 

la misma relación en no Fumadoras y 

2,2 veces mayor en el genotipo mutado 

que en el normal . 

86 

Al parecer, NO hay factores de confusión para FUMAR, puesto que su B, no cambia. Se aproxima a 1,1

8. ANÁLISIS MULTIVARIANTE 

DESCRIPTIVO 

ANÁLISIS DE COMPONENTES PRINCIPALES 

ANÁLISIS DE CONGLOMERADOS (CLUSTER) 

87

8.1 ANALISIS DE COMPONENTES PRINCIPALES (ACP). 

METODO REDUCCIONAL: Método descriptivo reduccional, cuyo 

fin es identificar alguna estructura subyacente en la población, 

que se manifieste en la asociación lineal de algunas variables. 

El objetivo es, por lo tanto, identificar grupos de variables 

que correlacionen entre si (Factores) y que las variables de 

grupos o factores diferentes, sean independientes (No 

asociadas o correlacionadas). 

Técnica estadística de síntesis de la información, o reducción de la 

dimensión (número de variables). 

Los nuevos componentes principales o factores serán una 

combinación lineal de las variables originales, y además, serán 

independientes entre sí. 

88

Base de datos correspondiente a una investigación para identificar variables fisicoquímicas 

de diferentes sitios de un río. 

89

• Análisis de Componentes Principales: Para este análisis, lo primero que se hace 

es un análisis de Correlación lineal simple de Pearson. 

Se observa alta correlación positiva entre variables como: Conductividad, sólidos 

disueltos, salinidad, turbidez, OD. Estas variables también correlacionan con 

temperatura y pH pero en forma negativa. 90

Varianza de cada variable en unidades tipificada (Z). 

La varianza total de la población es la sumatoria de las 

varianzas de las variables. En este caso es = 11. 

R2: Coeficiente de determinación múltiple. 

Se escogen como 

componentes principales, 

aquellos cuya varianza 

(autovalor) sea 1 o mayor. Es 

decir que incluya UNA o MÁS 

variables. 

En este caso, se han identificado 4 Componentes principales, que, en total, explican 

el 79,62% de la varianza total. 

Para explicar el 100% de la variabilidad, se necesitan 11 componentes (Todas las 

variables). 

91

Se han identificado CUATRO 

componentes principales. 

En la tabla se muestran los coeficientes 

de correlacion de cada variable con cada 

componente. 

Ej. La variable que mejor correlaciona con 

el componente 1 es la conductividad y la 

peor es el Potencial Oxido-Redox. 

¿Qué variables correlacionan mejor con cada componente: 

Análisis de Factores. 

92

FACTORES: Para determinar con mayor precisión los factores o grupos que incluyen a 

las variables, se hace una ROTACION ORTOGONAL (u Oblicua o no ortogonal). Las 

variables de un mismo factor, se asume que tienen información relacionada o “hablan 

de lo mismo”. 

Se han identificado 4 grupos o factores, asi: 

FACTOR 1: Incluye: Conductividad, 

Salinidad, SDT y Turbidez, asociadas 

positivamente. pH y Temperatura asociadas 

negativamente con el factor. 

FACTOR 2: Con Fosfatos y DQO, ambos 

asociados positivamente. 

FACTOR 3: Incluye al Potencial Oxido- 

Redox (Positivo) y OD (Negativo). 

FACTOR 4: Solo con la variable NITRITOS. 

Aunque no hay regla fija, una variable se incluye en un COMPONENTE, cuando 

su correlación es ≥ 0,50. Si una variable carga o entra en dos o más 

componentes, lo mejor es excluirla del análisis. 

93

8.2 ANÁLSIS DE “CLUSTER” (Árbol o dendograma): METODO CLASIFICATORIO 

Es un método descriptivo clasificatorio de los casos, unidades de muestreo o unidades 

experimentales (Filas). 

En este ejemplo, se clasificarán los TEJIDOS VEGETALES, desde el punto de vista de 

sus componentes químicos y determinar si la clasificación o “cluster” concuerda con la 

planta de origen. 

POBLACIÓN OBJETO DE ESTUDIO: TEJIDOS VEGETALES DE DIFERENTES PLANTAS . 

VARIABLES: Composición Química 

CASOS: 

Tejidos 

vegetales 

94

Los tejidos 1, 2 y 3 

son semejantes 

respecto de variables 

como: Ca, Mg, K, Fe, 

Cu, Mn, Zn y Al. 

Deben pertenecer al 

mismo “cluster” o 

grupo. 

OBJETIVO: Formar grupos homogéneos. Agrupar a las unidades de muestreo 

con base en su cercania respecto de una serie de variables cuantitativas. 

Los casos de cada grupo se parecen, pero difieren de las unidades de otros 

grupos. 

Cuando las variables utilizadas para formar los grupos se expresan en unidaes 

distintas (gramos, metros, ppm, etc), los datos deben tipificarse (valores Z) 

para que queden en la misma unidad de medida. 

Las unidades de muestreo (Casos), pueden ser simples individuos (Personas, 

plantas, animales) o ciertos conjuntos como: instituciones, ciudades, especies 

de animales, especies vegetales, grupos sociales, etc. 

95

Los casos fueron 

dispuestos en cuatro 

grupos. 

Al parecer, las 

variables 

seleccionadas para el 

agrupamiento 

(Composición 

química), permitieron 

formar tantos grupos 

como las fuentes de 

tejido utilizadas para 

extraer las muestras 

que se sometieron a 

análisis químico. 

96

NOTA: Para estos análisis se recomienda un tamaño de muestra: 

Entre 10 a 20 UE o UM por variable 

97

µ - Métodos de Investigación Interdisciplinaria

Create successful ePaper yourself

Delete template?

Save as template?