Aula 2 - Instituto de Biologia da UFRJ
Aula 2 - Instituto de Biologia da UFRJ
Aula 2 - Instituto de Biologia da UFRJ
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
DISTRIBUIÇÕES
Distribuições <strong>de</strong> observações(= populacionais)DISCRETAS Binomial PoissonCONTÍNUAS Normal (=Gauss) Gama
Distribuições amostraisTeorema do limite centralDistribuição populacionalDistribuição populacionalDistribução <strong>da</strong>samostrasDistribução <strong>da</strong>samostras
Distribuições amostraisDe médias t (Stu<strong>de</strong>nt) Z (Normal)De variâncias X 2 (Qui-quadrado) F
Distribuições amostraisTipos <strong>de</strong> erros Mensuração= viés (‘bias’)associado a acurácia <strong>da</strong> medi<strong>da</strong> Observação= erro amostral ou resíduoassociado a precisão <strong>da</strong> medi<strong>da</strong>probabili<strong>da</strong><strong>de</strong> <strong>de</strong> erro expressa pela distribuição
Curva normal como aproximação <strong>da</strong> distribuição<strong>de</strong> amostras-1s µ +1s
Parâmetros <strong>da</strong> Curva NormalTENDÊNCIA CENTRAL Média Mo<strong>da</strong> MedianaDISPERSÃO Variância Desvio Padrão Quartis
MoMdMédiaMo<strong>da</strong>, Média e MedianaMo<strong>da</strong>MédiaMediana
Variância e Desvio padrão-1s µ +1sDesvio padrão = sVariância = s 2
Variância e Desvio padrãoXDesvio padrão = sVariância = s 2
QuartisQ 25 Q 50 = Md Q 7575%50%25%Q 25 Q 50 Q 75
Características <strong>da</strong> Curva Normal Número <strong>de</strong> Mo<strong>da</strong>s Assimetria Curtose
Distribuição bimo<strong>da</strong>lmo<strong>da</strong>s
Distribuição bimo<strong>da</strong>l
AssimetriaMedi<strong>da</strong> <strong>de</strong> assimetriag 1Assimetria positivag 1 > 0Simetriag 1 = 0Assimetria positivag 1 < 0Mo < MdMo = MdMo < Md
CurtoseMedi<strong>da</strong> <strong>de</strong> Curtoseg 2Leptocúrticag 2 > 0Mesocúrticag 2 = 0Platicúrticag 2 < 0
Distribuições amostraisDe médias t (Stu<strong>de</strong>nt) Z (Normal)De variâncias X 2 (Qui-quadrado) F
Distribuição tn = 2n = 20n = 5
Distribuição X 20.6 0.8GL = 20.0 0.2 0.4GL = 4GL = 200 5 10 15 20χ 2
Distribuição FRazão entre variâncias para avaliar se são diferentesVer se S 1 /S 2 = 1 (mesma população)Densi<strong>da</strong><strong>de</strong>0.6 0.8 1.00.0 0.2 0.4GL= 2:40GL = 5:40GL = 20:400 2 4 6 8F
Distribuição Binomial n=100p = 0,6p = 0,5p = 0,850 20 40 60 80 100Número <strong>de</strong> Sucessos
Distribuição <strong>de</strong> Poissonm = 10 m = 30m = 210 20 30 40 50
Distribuição <strong>de</strong> PoissonMédia = variânciaX = s 2Dados <strong>de</strong> contagem• Animais em uma trilha por intervalo <strong>de</strong> tempo• Mutações por uni<strong>da</strong><strong>de</strong> <strong>de</strong> tempo• Medi<strong>da</strong> <strong>de</strong> in<strong>de</strong>pendência (distribuição aleatória)
A TCDistribuição Gamaα = 0,1α = 20α = 1α = 50 0,5 1 1,5 2 2,5 3Taxa <strong>de</strong> substituiçãoProporção <strong>de</strong> sítios0 0,51,0 1,5
Distribuição Gamaα = 0,1α = 20ATCCGAProporção <strong>de</strong> sítios1,0 1,50 0,5α = 1α = 50 0,5 1 1,5 2 2,5 3ATCCCTAAGCCCAAGCTGAATGTATaxa <strong>de</strong> substituição
INTERVALODECONFIANÇA
Probabili<strong>da</strong><strong>de</strong> e teste <strong>de</strong> hipóteses-2s Y -1s Y X +1s Y +2s Y95 % <strong>da</strong> área = IC 95
Probabili<strong>da</strong><strong>de</strong> e teste <strong>de</strong> hipóteses-2s Y -1s Y X +1s Y +2s Y95 % <strong>da</strong> área = IC 95IC 95 = 2 s Y = 2s/√nExemploX = 5 s= 10 n = 40IC 95 = ± 2 . 10/ √40IC 95 = ± 2 . 10/6,32IC 95 = ± 3,161,84 8, 16
TESTESDEHIPÓTESES
Probabili<strong>da</strong><strong>de</strong> e teste <strong>de</strong> hipóteses Distribuição (e.g. Curva Normal) =distribuição amostral Probabili<strong>da</strong><strong>de</strong> = área sob a curva Probabili<strong>da</strong><strong>de</strong> <strong>de</strong> uma população Freqüência <strong>de</strong> ocorrência <strong>de</strong> evento Probabili<strong>da</strong><strong>de</strong> <strong>de</strong> uma amostra Distribuição inferi<strong>da</strong> pela amostra Abor<strong>da</strong>gem freqüentista
Teste <strong>de</strong> HipóteseHIPÓTESE NULAACEITA REJEITADAHIPÓTESEVERDADEIRADECISÃO CORRETA ERRO TIPO INULA FALSA ERRO TIPO II DECISÃO CORRETA
Desvio Padrão e Erro Padrão-s -s Y µ s Y +s
Teste <strong>de</strong> HipóteseIndivíduo na populaçãoIC <strong>da</strong> população (baseado no <strong>de</strong>svio padrão)ACEITO H oREJEITO H o10 20 30 40 50 60COMPRIMENTO DA CABEÇA (mm)
Teste <strong>de</strong> HipóteseMédiasComparação entre populaçõesIC <strong>da</strong>s médias (baseado no erro padrão)H ACEITO H oREJEITO H o10 20 30 40 50 60 70 80 90 100COMPRIMENTO DA CABEÇA (mm)
PODER ESTATÍSTICODensi<strong>da</strong><strong>de</strong> <strong>de</strong> Akodon lindberghiVerãoInverno30VerãoInverno30 25 19M = 27,5M = 2123252015105Teste t para n = 2 p = 0,18 02 medi<strong>da</strong>s
PODER ESTATÍSTICOTemperatura em um lagoVerãoInverno30VerãoInverno30 25 19M = 21M = 27,524M = 26,5M = 21,223212520152722105Teste t para n = 2 p = 0,18Teste t para n = 4 p = 0,0202 medi<strong>da</strong>s 4 medi<strong>da</strong>s
PODER ESTATÍSTICO• 1 – β• Po<strong>de</strong>r <strong>de</strong> rejeitar H 0 (reconhecer diferença) quando H 0 é falsaα (Probabili<strong>da</strong><strong>de</strong> do Erro do Tipo I ) β (Probabili<strong>da</strong><strong>de</strong> do Erro do Tipo II )H 0 H a
H 0 H a1-σ1-ββσNível críticoDECISÃO E RESULTADOSREALIDADEH0 é ver<strong>da</strong><strong>de</strong>iraH0 é falsaNão rejeitou H0Correto(1- α)Erro do Tipo II(β)Rejeitou H0Erro do Tipo I (α)Correto(1- β)
PODER ESTATÍSTICOPo<strong>de</strong>r <strong>de</strong>pen<strong>de</strong> <strong>de</strong>:1. Número <strong>de</strong> réplicas2. Variabili<strong>da</strong><strong>de</strong>3. Magnitu<strong>de</strong> do Efeito4. Nível <strong>de</strong> significância (α)Como aumentar o po<strong>de</strong>r:1. Aumentando a replicagem2. Alterando α (Erro do Tipo I)3. Alterando a magnitu<strong>de</strong> do efeito ?
PODER ESTATÍSTICOAlterando α
PODER ESTATÍSTICOIncrementando areplicagem (> n)
PODER ESTATÍSTICOMagnitu<strong>de</strong> do Efeito
PODER ESTATÍSTICOMagnitu<strong>de</strong> do Efeitopo<strong>de</strong>r1,00,80,60,40,20M.E. = 0,36M.E. = 0,23M.E. = 0,09 ?5 10 15 20 25 30N o . <strong>de</strong> Réplicas
PODER ESTATÍSTICOMagnitu<strong>de</strong> do Efeito & Aumento <strong>da</strong> ReplicagemO problema <strong>da</strong>s gran<strong>de</strong>s amostrasMagnitu<strong>de</strong>do EfeitoN = 20N = 500
PODER ESTATÍSTICOMagnitu<strong>de</strong> do Efeito & Aumento <strong>da</strong> ReplicagemO problema <strong>da</strong>s gran<strong>de</strong>s amostrasMagnitu<strong>de</strong>do EfeitoN = 20N = 500
PODER ESTATÍSTICOMagnitu<strong>de</strong> do Efeito & Aumento <strong>da</strong> ReplicagemO problema <strong>da</strong>s gran<strong>de</strong>s amostrasErro <strong>de</strong> observação <strong>de</strong>sprezívelErro <strong>de</strong> mensuração significativoouPrecisão >>> acurácia
PODER ESTATÍSTICOE SIGNIFICADO BIOLÓGICO(magnitu<strong>de</strong> biológica)DIFERENÇASESTATÍSTICAS• COM PODER (A)• SEM PODER (B)• EXCESSODEPODER (C)CBASIGNIFICADOBIOLÓGICO
PODER ESTATÍSTICO• Po<strong>de</strong>r prospectivo – antes do estudo• Po<strong>de</strong>r retrospectivo – após o estudo• Cálculo do po<strong>de</strong>r Conhecimento <strong>da</strong> variância ou estimativa Estabelecimento <strong>da</strong> magnitu<strong>de</strong> do efeito Esforço amostral (n)
A ditadura do α = 0,05α ou p ?• Ciências Biomédicas• Ciências AmbientaisQual erro é mais grave ?
PODER & ERRO DO TIPO IErro do Tipo I em múltiplas comparações• Erros individuais• Propagação dos Erros (Erro Total)• Correções: Bonferroni Bonferroni Sequencial FDR (False Discovery Rate)
Valor <strong>de</strong> por<strong>de</strong>nadoCORREÇÕESBonferroniBonferronisequencialBenjamini &Hochberg(FDR)1 α / m α / m α / m2 α / m α / (m-1) 2α / m3 α / m α / (m-2) 3α / m
Valor <strong>de</strong> por<strong>de</strong>nadoBonferroniBonferroniSequencialBenjamini &Hochberg(FDR)p = 0,05 0,006 0,006 0,006p = 0,04 0,006 0,007 0,012p = 0,03 0,006 0,008 0,018p = 0,02 0,006 0,010 0,025p = 0,01 0,006 0,012 0,031p = 0,005 0,006 0,016 0,037p = 0,002 0,006 0,025 0,043p = 0,001 0,006 0,050 0,050
MÚLTIPLAS COMPARAÇÕESO que fazer ?• Não corrigir ?• Escolher uma correção menos conservativa ?• Eliminar variáveis pouco explicativas ?• Priorizar testes múltiplos (regressão múltipla, MANOVA,ANOVA com vários fatores etc...) que avaliam um erroúnico ?• Diferenças <strong>da</strong> aplicação <strong>de</strong> correções entre Ecologia,Zoologia e Genética