A ESCOLHA DO MÉTODO ESTATÍSTICO - SBPqO

sbpqo.org.br

A ESCOLHA DO MÉTODO ESTATÍSTICO - SBPqO

Universidade Estadual de Campinas

Faculdade de Odontologia de Piracicaba

A escolha do método

estatístico

Profa. Dra. Livia M. A. Tenuta

litenuta@fop.unicamp.br

Universidade Estadual de Campinas

Faculdade de Odontologia de Piracicaba

A escolha do método

estatístico

- Probabilidades, hipóteses e

delineamentos -

1


“A notícia boa é que a estatística

está se tornando mais fácil e

acessível.

A notícia ruim é que a estatística

está se tornando mais fácil e

acessível.”

Hofacker, 1983

Para muitos, estatística é...

2


Figueira CV, 2006

Para outros...

“Estatística é a arte de torturar

os dados até que eles digam o

que se quer ouvir”

Mills, 1993,

Susin & Rösing, 1999

3


Jim Borgman, New York Times, 27 April 1997

4


Testes estatísticos mais comuns

Número e tipo de grupos Paramétrico Não paramétrico

2 grupos

Independentes

(não pareados)

Dependentes

(pareados)

Teste t para

amostras

independentes

Teste t para

amostras

dependentes

Teste de Mann-

Whitney

Teste de Wilcoxon

3 ou mais grupos

Independentes

(não pareados)

Dependentes

(pareados)

ANOVA

ANOVA medidas

repetidas

Teste de Kruskal-

Wallis

Teste de Friedman

Susin C. Basic statistical analysis for dental research.

In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009

Métodos de regressão mais comuns

Tipo de observações Dados contínuos Dados categóricos

Independentes

Dependentes

Regressão linear

Regressão linear com erro

padrão ajustado para o

agrupamento das

observações

Regressão logística

dicotômica, multinomial e

ordenada

Regressão logística

condicional e extensões

Susin C. Basic statistical analysis for dental research.

In: Rode SM, Dias KRHC, França CM. Handbook of scientific methodology. IADR latinoamericana, 2009

5


Estudo cruzado duplo-cego

• Controle negativo: H 2 O

• Controle positivo: 1.5% Sacarose

• Controle ativo: 1.5% Lactose

• Experimental: Zero Cal R

• Controle negativo: sem dentifrício

• Controle ativo: MFP/SiO 2

• Experimental: MFP/CaCO 3

Pesquisa científica

Pergunta (???) – curiosidade científica!

Delineamento experimental adequado

para testar a pergunta

Variáveis resposta que ajudem a

explicar o fenômeno

6


Estatística experimental

Desmineralização dental (% perda de dureza)

Tratamento A:

21,5%

23,6%

39,7%

29,5%

32,7%

Média 29,4%

Tratamento B:

18,9%

24,4%

26,7%

19,4%

17,8%

Média 21,4%

Diferença estimada entre A e B: 8%

Estatística experimental

Existe uma real diferença entre os

tratamentos A e B?

Para descobrir, o experimento deveria

ser repetido infinitas vezes!

7


Estatística experimental

Inferência estatística: determina a

probabilidade de estimar se uma real

diferença entre tratamentos existe

Nível de significância (p): probabilidade

de erro ao afirmar que há diferença entre

os tratamentos

Estatística experimental

Desmineralização dental (% perda de dureza)

Tratamento A:

21,5%

23,6%

39,7%

29,5%

32,7%

Média 29,4%

DP 7,3%

Tratamento B:

18,9%

24,4%

26,7%

19,4%

17,8%

Média 21,4%

DP 3,9%

8


Variação do acaso: toda variação devido a fatores

não controláveis. Pode ser medida através do

desvio em relação a média

ANOVA

Análise da variância

Quanto da variabilidade observada

é devido ao acaso ou a um real

efeito do tratamento

9


Efeito de 2 dentifrícios na concentração de

F no fluido do biofilme

(µM F, média, n=56)

Dentifrício A

Dentifrício B

5,5 11,4

Efeito de 2 dentifrícios na concentração de

F no fluido do biofilme

(µM F, média ± DP, n=56)

Dentifrício A

Dentifrício B

5,5 ± 4,5 11,4 ± 21,0

10


Concentração de F no fluido do

biofilme dental exposto a 2 dentifrícios

11


Eliminando o outlier…

12


Transformação sugerida pelo pacote

estatístico: inversa

13


Delineamento inteiramente aleatorizado

Esquema da análise de variância:

Fonte de

variação

Graus de

liberdade

Soma de Quadrados Quadrado médio F

Tratamento I – 1

Variabilidade devido

ao tratamento

Resíduo I (J – 1) Por diferença

SQ tratamento

GL trat.

SQ resíduo

GL resíduo

QM tratamento

QM resíduo

Total IJ – 1 Variabilidade total - -

-

I = número de níveis do tratamento

J = número de repetições

Delineamento inteiramente aleatorizado

Modelo matemático:

Y ij = µ + t i + e ij

Onde:

Y ij = valor da variável testada sob o i-ésimo nível de tratamento

µ = média geral do experimento para a variável

t i = efeito do i-ésimo nível de tratamento

e ij = erro aleatório

14


Controle

70 ppm F

140 ppm F

280 ppm F

Estatística experimental

Teste de hipóteses: regra de decisão para

rejeitar ou não uma hipótese estatística

com base nos elementos amostrais

H 0 (hipótese nula): hipótese que será testada

estatisticamente

H a (hipótese alternativa): suposição que o

pesquisador quer estudar

15


Delineamento inteiramente aleatorizado

Hipóteses:

H 0 = t 1 = t 2 = ... = t I = 0

H a = t i ≠ 0

Estatística experimental

Ao rejeitar H 0 , com nível de significância

de 5%, por exemplo, o pesquisador

automaticamente aceita sua hipótese

alternativa

16


“In relation to any experiment we may speak of…

the “null hypothesis,” and it should be noted that

the null hypothesis is never proved or established,

but is possibly disproved, in the course of

experimentation. Every experiment may be said to

exist only in order to give the facts a chance of

disproving the null hypothesis. ”

Fisher RA

Estatística experimental

Desmineralização dental (% perda de dureza)

Tratamento A:

21,5%

23,6%

39,7%

29,5%

32,7%

Média 29,4%

Tratamento B:

18,9%

24,4%

26,7%

19,4%

17,8%

Média 21,4%

Diferem ao

nível de

significância

de 5%

Erro tipo I (α): probabilidade de erro ao se rejeitar a

hipótese de nulidade quando ela é verdadeira, ou

seja, probabilidade de apontar um falso positivo

17


Trabalhando com probabilidades...

Nível de significância de 5% significa que

aceitamos errar em 1 a cada 20 casos

Correlação entre variáveis: se eu tiver 10 variáveis

e for estudar a correlação entre elas, tenho 45

comparações (10*(10-1)/2 = 45)

Em 5% delas, posso ver uma correlação

significativa por mero acaso! 0,05* 45 = 2,25!

Hofacker CS, 1983

Erro tipo II (β): probabilidade de erro ao não

rejeitar a hipótese de nulidade quando ela é de

fato falsa, ou seja, probabilidade de apontar um

falso negativo

É função do:

a) número de repetições

b) variabilidade dos dados

c) real diferença entre os grupos

18


Repetição

Proporciona uma estimativa do erro

experimental (variabilidade), permitindo a

estimativa do efeito dos tratamentos.

Repetição

n=3

Tratamento A:

20

24

25

Média 23

Tratamento B:

17

22

24

Média 21

Teste t comparando A e B: p=0,48

19


Repetição

n=30

Tratamento A:

20, 24, 25, 21, 23,

25, 20, 23, 26, 20,

24, 25, 20, 24, 25,

22, 24, 23, 21, 23,

26, 19, 24, 25, 20,

24, 25, 19, 25, 25

Média 23

Tratamento B:

15, 22, 26, 16, 23,

24, 15, 24, 24, 17,

22, 24, 17, 22, 24,

17, 16, 22, 24, 23,

24, 17, 22, 24, 17,

22, 24, 14, 24, 25

Média 21

Teste t comparando A e B: p=0,0137

Repetição

n=3

Tratamento A:

20

24

25

Média 23

Tratamento B:

10

13

16

Média 13

Diferença entre A e B = 10

Teste t comparando A e B: p=0,0123

20


Repetição

n=3

Tratamento A:

20

24

25

Média 23

DP 2,6

Tratamento B:

10

13

16

Média 13

DP 3,0

Repetição

n=3

Tratamento A:

13

21

35

Média 23

DP 11,1

Tratamento B:

5

10

24

Média 13

DP 9,9

Teste t comparando A e B: p=0,31

21


Poder estatístico

Erro tipo II (β): probabilidade de erro ao não

rejeitar a hipótese de nulidade quando ela é de

fato falsa, ou seja, probabilidade de apontar um

falso negativo

Poder do teste estatístico: Capacidade do teste em

apontar diferenças quando elas realmente existem

Erro tipo II (β) = 10%

Poder = 1 – β = 90%

22


Delineamento inteiramente aleatorizado

Esquema da análise de variância:

Fonte de

variação

Graus de

liberdade

Soma de Quadrados Quadrado médio F

Tratamento I – 1

Variabilidade devido

ao tratamento

Resíduo I (J – 1) Por diferença

SQ tratamento

GL trat.

SQ resíduo

GL resíduo

QM tratamento

QM resíduo

-

Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento

J = número de repetições

Poder estatístico

Reviewer: What were criteria for sample size selection? Was

it to reach estimated power (80%)?

The sample size selection was based on a pilot study, made with 3 volunteers,

who ingested the 550 µg F/g dentifrice, on fasting, after breakfast or after

lunch, and we used the AUC of salivary F concentration as the response

variable. In fact, we intended to determine the number of volunteers necessary

to detect differences between the gastric content

situations using the low F

dentifrice, with 80% power. From this pilot study, a low standard deviation was

observed between volunteers for each gastric content condition. Using the

SAS System 8.01, considering the differences obtained from the mean of these

treatments, we could reach 80% power if we used nine volunteers. For 11

volunteers, the power would increase to 90%. Considering that volunteers

could be lost during the 9-phase study, we opted to select 11 volunteers.

Actually, we could significantly reject H 0 in the experiment, and therefore we

haven’t

worried in mention this in the text, but we added the power

information in the text.

23


Princípios básicos da

experimentação

1. Repetição


2. Aleatorização

3. Cegamento

4. Controle local (blocos estatísticos)

Aleatorização

Proporciona a todos os tratamentos a

mesma probabilidade de serem

designados a qualquer das unidades

experimentais

24


Aleatorização = sorteio!

Aleatorização no Excel

Exemplo:

Dividir 16 espécimes em 4 tratamentos

(cada um com 4 espécimes)

25


Classificar pela coluna

“Aleatório”

ATENÇÃO: Para que o sorteio seja

feito corretamente, apenas as

colunas “Tratamento” e

“Aleatório” devem ser

selecionadas!

26


Ao classificar por um

número aleatório,

automaticamente o

tratamento ficará

aleatorizado!

Portanto, os espécimes

1, 6, 7 e 8 devem receber

o tratamento 1, e assim

sucessivamente...

27


Aleatorização com restrição

A distribuição dos espécimes entre os

tratamentos é feita de modo restrito, para

evitar que algum tratamento seja

favorecido pela aleatorização.

Exemplo: quando se conhece a dureza inicial de blocos

dentais, é possível sorteá-los aos tratamentos de acordo

com sua dureza

E a média de dureza entre

os grupos apresenta-se

homogênea.

28


Realizando-se a

aleatorização sem restrição,

as diferenças entre durezas

dos espécimes distribuídos

aos 4 níveis de tratamento

são mais evidentes.

Cegamento

Estudo cego: o pesquisador não tem acesso

à identificação de qual nível de tratamento se

trata.

29


Vieira, S. Estatística experimental. 2.ed. 1999

Cegamento

Estudo cego: o pesquisador não tem acesso

à identificação de qual nível de tratamento se

trata.

Quando voluntários estão envolvidos, estes

também não devem saber de qual tratamento

estão participando – estudo duplo cego

30


Delineamento aleatorizado em

blocos

Utiliza os princípios da repetição,

aleatorização e controle local

Exemplo: avaliar o efeito do dentifrício fluoretado,

em 2 níveis, na concentração de F na saliva,

utilizando 14 voluntários como blocos estatísticos

Delineamento aleatorizado em blocos

Modelo matemático:

Onde:

Y ij = µ + t i + b j + e ijk

Y ij = valor da variável testada sob o i-ésimo nível de tratamento e

no j-ésimo bloco

µ = média geral do experimento para a variável

t i = efeito do i-ésimo nível de tratamento

b j = efeito do j-ésimo nível de voluntário

e ij = erro aleatório

31


Delineamento aleatorizado em blocos

Hipóteses:

H 0 = t 1 = t 2 = ... = t I = 0

H a = t i ≠ 0

Delineamento aleatorizado em blocos

Esquema da análise de variância:

Fonte de

variação

Graus de

liberdade

Soma de Quadrados Quadrado médio F

Tratamento I – 1

Blocos J – 1

Variabilidade devido

ao tratamento

Variabilidade devido

aos blocos

Resíduo (I – 1)(J – 1) Por diferença

SQ tratamento

GL trat.

SQ blocos

GL blocos

SQ resíduo

GL resíduo

QM tratamento

QM resíduo

QM blocos

QM resíduo

Total IJ – 1 Variabilidade total - -

I = número de níveis do tratamento

J = número de blocos

-

32


Delineamento aleatorizado em blocos

A variabilidade devido aos blocos

(voluntários, p.ex.) pode ser estimada,

diminuindo a variabilidade devido ao

acaso (erro experimental)

33


Delineamento cruzado

Fase 1

Fase 2 Fase 3

Voluntários

grupo 1

Voluntários

grupo 2

Voluntários

grupo 3

Tratamento A

Tratamento B

Tratamento C

Delineamentos de tratamentos

1. Fatorial

2. Parcelas subdivididas

34


Experimentos fatoriais

Derivam do interesse em testar o efeito de

dois ou mais tipos de tratamentos no

mesmo experimento. Cada tipo de

tratamento é referido como um fator.

Experimentos fatoriais

Exemplo: avaliar o efeito do dentifrício

fluoretado, em 2 níveis, e da freqüência de

exposição do biofilme dental a sacarose,

em 4 níveis, na desmineralização dental.

Fatorial 2 x 4

35


Experimentos fatoriais

A combinação de tratamentos resultantes é o resultado

da interação dos fatores a serem testados. No exemplo,

há 8 combinações possíveis de tratamentos:

500 ppm F, exposição ao açúcar 2x/dia

500 ppm F, exposição ao açúcar 4x/dia

500 ppm F, exposição ao açúcar 6x/dia

500 ppm F, exposição ao açúcar 8x/dia

1100 ppm F, exposição ao açúcar 2x/dia

1100 ppm F, exposição ao açúcar 4x/dia

1100 ppm F, exposição ao açúcar 6x/dia

1100 ppm F, exposição ao açúcar 8x/dia

Delineamento fatorial

Modelo matemático:

Onde:

Y ij = µ + A i + B j + A i *B j + e ijk

Y ij = valor da variável testada sob o i-ésimo nível do fator A e j-

ésimo nível do fator B

µ = média geral do experimento para a variável

A i = efeito do i-ésimo nível do fator A

B j = efeito do j-ésimo nível do fator B

A i *B j = efeito da interação A e B

e ij = erro aleatório

36


Delineamento fatorial

Hipóteses:

(1) H 0 = A 1 = A 2 = ... = A I = 0

H a = A i ≠ 0

(2) H 0 = B 1 = B 2 = ... = B J = 0

H a = B j ≠ 0

(3) H 0 = (A*B) ij = 0

H a = (A*B) ij ≠ 0

Delineamento fatorial

Esquema da análise de variância:

Fonte de

variação

Graus de

liberdade

Soma de Quadrados Quadrado médio F

A I – 1

B J – 1

A*B (I – 1)(J – 1)

Variabilidade devido

ao fator A

Variabilidade devido

ao fator B

Variabilidade devido

a interação A*B

Resíduo IJ (K– 1) Por diferença

SQ trat. A

GL trat. A

SQ trat. B

GL trat. B

SQ (A*B)

GL (A*B)

SQ resíduo

GL resíduo

QM trat. A

QM resíduo

QM trat. B

QM resíduo

QM trat. A*B

QM resíduo

Total IJ – 1 Variabilidade total - -

I = número de níveis do fator A

J = número de níveis do fator B

K = número de repetições

-

37


Variável resposta

B1

B2

Não há efeito significativo

de A (A1 = A2)

Não há efeito significativo

de B (B1 = B2)

A1

A2

Não há efeito da interação

Variável resposta

B1

B2

Há efeito significativo de A

(A2 > A1)

Não há efeito significativo

de B (B1 = B2)

Não há efeito da interação

A1

A2

Variável resposta

B1

B2

Não há efeito significativo

de A (A1 = A2)

Há efeito significativo de B

(B1 > B2)

A1

A2

Não há efeito da interação

Variável resposta

B1

B2

Há efeito significativo de A

(A2 > A1)

Há efeito significativo de B

(B1 > B2)

Não há efeito da interação

A1

A2

38


Variável resposta

B1

B2

Interação devido a

diferença na grandeza da

resposta

A1

A2

Variável resposta

B1

B2

Interação devido a

diferença na direção da

resposta

A1

A2

39


Efeito de 2 dentifrícios na concentração de F no

fluido do biofilme em função da freqüência de

Frequência

exposição do

biofilme à sacarose

exposição a sacarose

(µM F, média ± DP, n=14)

Dentifrício A

Dentifrício B

2 x 5,6 ± 4,7 7,2 ± 4,8

4 x 4,4 ± 1,3 10,1 ± 12,8

6 x 5,1 ± 2,3 8,2 ± 6,2

8 x 6,8 ± 7,2 8,0 ± 6,4

Houve efeito significativo do fator dentifrício na concentração de F no

fluido do biofilme dental (p


Experimentos em parcelas

subdivididas

Ocorrem quando os tratamentos não são distribuídos

nas unidades experimentais da mesma forma,

caracterizando tratamentos primários (parcelas) e

secundários (subparcelas).

Após o sorteio do tratamento principal às unidades

experimentais de forma usual, o tratamento secundário

é sorteado dentro de cada tratamento primário.

Baseline surface microhardness

41


Delineamento em parcelas subdivididas

Modelo matemático:

Onde:

Y ij = µ + A i + b j + B k + A i *B k + e ijkl

Y ij = valor da variável testada sob o i-ésimo nível do fator A, j-

ésimo bloco e k-ésimo nível do fator B

µ = média geral do experimento para a variável

A i = efeito do i-ésimo nível do fator A

b j = efeito do j-ésimo bloco estatístico

B j = efeito do k-ésimo nível do fator B

A i *B k = efeito da interação A e B

e ij = erro aleatório

Delineamento fatorial

Hipóteses:

(1) H 0 = A 1 = A 2 = ... = A I = 0

H a = A i ≠ 0

(2) H 0 = B 1 = B 2 = ... = B J = 0

H a = B j ≠ 0

(3) H 0 = (A*B) ij = 0

H a = (A*B) ij ≠ 0

42


Delineamento fatorial

Esquema da análise de variância:

Fonte de

variação

Graus de

liberdade

Soma de Quadrados Quadrado médio F

A I – 1

Blocos J – 1

Resíduo a

(A*bloco)

(I – 1)(J – 1)

Variabilidade devido

ao fator A

Variabilidade devido

aos blocos

Variabilidade da

parcela

SQ trat. A

GL trat. A

SQ blocos

GL blocos

SQ resíduo a

GL resíduo a

QM trat. A

QM resíduo a

QM blocos

QM resíduo a

Delineamento fatorial

Esquema da análise de variância:

Fonte de

variação

Graus de

liberdade

Soma de Quadrados Quadrado médio F

A I – 1

Blocos J – 1

Resíduo a

(A*bloco)

(I – 1)(J – 1)

B K – 1

A*B (I – 1)(K – 1)

Variabilidade devido

ao fator A

Variabilidade devido

aos blocos

Variabilidade da

parcela

Variabilidade devido

ao fator B

Variabilidade devido

a interação A*B

Resíduo b I(J – 1)(K– 1) Por diferença

SQ trat. A

GL trat. A

SQ blocos

GL blocos

SQ resíduo a

GL resíduo a

SQ trat. B

GL trat. B

SQ (A*B)

GL (A*B)

SQ resíduo b

GL resíduo b

QM trat. A

QM resíduo a

QM blocos

QM resíduo a

QM trat. B

QM resíduo b

QM trat. A*B

QM resíduo b

Total IJK – 1 Variabilidade total - -

-

43


“We have discussed the practice of using different data

transformations within a 2-way ANOVA with our statistical adviser and

he stated that this is not valid, since the comparisons are not then

between data of the same type. Transformation is performed to deal

with 1 or more of 3 problems: non-normality, non-homogeneity of

variance and non-additivity. To my understanding, in a 2-way analysis,

'individualized' transformations, while solving the first two problems,

would work against the third requirement of ANOVA, that treatment

effects are additive. For instance, data in which treatment effect was

multiplicative rather than additive are appropriately transformed to

logs, since the treatment effects then become additive. But these

could not then be compared with data that had not been transformed

because they already fulfilled the ANOVA requirements. You would be

comparing oranges and bananas.”

“Sorry about the confusion induced by my last set of comments on

the statistics. I think there might be still some sort of problem there, in

that your comparison of the 30-min plaque solid data is on a

somewhat different basis from the other comparisons. But I will

discuss it when I next see our statistical advisor. I suspect that I put

the question to him in a misleading way, combined with a misinterpretation

of your analysis.”

46


Obrigada

pela atenção!!!

litenuta@fop.unicamp.br

47

More magazines by this user
Similar magazines