01.03.2015 Views

Livro CI 2008

Livro CI 2008

Livro CI 2008

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

V Curso de Inverno<br />

grupos e nos dá base para inferências científicas. Quando usamos estatística, normalmente<br />

temos que entender um pouco sobre distribuições. Na concepção frequentista de estatística<br />

o que fazemos é utilizar um modelo de distribuição de dados para, de certa forma, simplificar<br />

nossas análises utilizando parâmetros de distribuição, calculados a partir dos dados, e não<br />

os dados em si. O que estamos comparando, no final, não são os dados brutos coletados e<br />

sim modelos de distribuição destes dados dentro de uma lógica de tendência central de<br />

valores (média) à qual está associada a uma<br />

dispersão própria (variância). Quando falamos de<br />

dados biométricos (ou seja, dados biológicos<br />

mensuráveis) normalmente falamos de<br />

informações contínuas que possuem um certo<br />

padrão que nos permite inferir uma distribuição<br />

normal, que é bem representada por apenas dois<br />

parâmetros descritores, a média e a variância<br />

(Figura 2). Tais parâmetros não são puramente<br />

abstratos e podem ser facilmente compreendidos<br />

em termos biológicos. A média (µ) de uma<br />

população de dados, em uma distribuição normal,<br />

pode ser interpretada como o fenótipo mais<br />

freqüente, ou em outras palavras, aquele que<br />

você espera encontrar com maior freqüência em<br />

seu grupo. Já variância (σ²) pode ser entendida como uma medida de dispersão dos dados<br />

ao redor desta média, ou seja, o quanto os pontos obtidos desviam da média. As causas<br />

desta dispersão podem ser muitas, desde variação populacional real até erro de<br />

amostragem, mas raramente a natureza exata destas causas é relevante (a não ser que<br />

algum fator de variação seja exatamente o objeto de estudo).<br />

Figura 3 - Exemplo de 5 grupos com variâncias<br />

intra-grupos iguais (σ²=25) e médias distintas.<br />

Discutiremos brevemente, a seguir, duas das principais técnicas estatísticas<br />

utilizadas em biologia: a analise de variância e a regressão linear. Ambos os métodos<br />

pertencem a uma família de análises chamada de modelos lineares gerais (General Linear<br />

Models). São assim chamados, pois partem do pressuposto que as variáveis em estudo<br />

variam de maneira linear, ou seja, aditiva em função dos fatores causais (ou seja, o efeito de<br />

cada fator pode ser somado para a obtenção do efeito geral). Estes modelos são os mais<br />

simples e serão explicados em sua forma univariada (ou seja, com apenas uma variável).<br />

Consulte Sokal & Rohlf (1995) e Zar (2007) para mais informações com enfoque biológico.<br />

ANOVA: A análise de variância univariada foi um método concebido por Fisher nas<br />

décadas de 1920 e 30 para avaliar simultaneamente as médias de uma dada variável entre<br />

diferentes grupos, sem incorrer no acúmulo de Erro tipo I (rejeitar a hipótese nula quando<br />

ela é verdadeira) ao realizamos comparações de diversos grupos par-a-par. O princípio é<br />

320

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!