15.04.2013 Views

Teste de hipótese sobre proporções - AEDBEst

Teste de hipótese sobre proporções - AEDBEst

Teste de hipótese sobre proporções - AEDBEst

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Aula 12 – <strong>Teste</strong> <strong>de</strong> <strong>hipótese</strong> <strong>sobre</strong> <strong>proporções</strong> – amostras gran<strong>de</strong>s<br />

Objetivos<br />

Na aula anterior, você apren<strong>de</strong>u a construir testes <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong> a média <strong>de</strong> uma população normal<br />

com variância σ 2 conhecida. O procedimento baseou-se na distribuição amostral da média amostral que, com as<br />

<strong>hipótese</strong>s <strong>de</strong> normalida<strong>de</strong> e conhecimento da variância populacional, sabemos ser normal com a mesma média e<br />

variância σ 2 /n. Nesta aula, iremos fazer uso do Teorema Central do Limite para construir testes <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong><br />

<strong>proporções</strong> com base em amostras gran<strong>de</strong>s. Vimos que, para amostras gran<strong>de</strong>s, a distribuição amostral da<br />

proporção amostral po<strong>de</strong> ser aproximada por uma distribuição normal e, assim, o procedimento <strong>de</strong> teste <strong>de</strong><br />

<strong>hipótese</strong> será idêntico ao estudado na aula anterior.<br />

Estimação <strong>de</strong> uma proporção populacional<br />

O contexto <strong>de</strong> interesse é o seguinte: temos uma população em que cada elemento é classificado <strong>de</strong> acordo<br />

com a presença ou ausência <strong>de</strong> <strong>de</strong>terminada característica. Em termos <strong>de</strong> variável aleatória, essa população é<br />

representada por uma v.a. <strong>de</strong> Bernoulli, isto é:<br />

X = 1 se elemento possui a característica <strong>de</strong> interesse;<br />

X= 0 se elemento não possui a característica <strong>de</strong> interesse<br />

Então, Pr(X = 1) = p, E(X) = p e Var(X) = p(1−p). O parâmetro p é também a proporção <strong>de</strong> elementos da<br />

população que possuem a característica <strong>de</strong> interesse. Em geral, esse parâmetro é <strong>de</strong>sconhecido e queremos testar<br />

<strong>hipótese</strong>s feitas <strong>sobre</strong> seu possível valor.<br />

Suponha, então, que <strong>de</strong>ssa população seja extraída uma amostra aleatória simples X1,X2, . . . ,Xn com<br />

reposição. Vimos que a proporção P <strong>de</strong> elementos na amostra que possuem a característica <strong>de</strong> interesse, <strong>de</strong>finida<br />

por<br />

é um estimador não-viesado para p com variância p(1−p)/n . Mais precisamente,<br />

Como a proporção amostral é uma média <strong>de</strong> uma amostra aleatória simples <strong>de</strong> uma população com<br />

distribuição <strong>de</strong> Bernoulli com parâmetro p, o Teorema Central do Limite nos diz, então, que a distribuição <strong>de</strong> P se<br />

aproxima <strong>de</strong> uma normal com média p e variância p(1−p)/n . Como visto, a aproximação <strong>de</strong>ve ser feita se np ≥ 5 e<br />

n(1−p) ≥ 5 e, em geral, essas condições são satisfeitas se n ≥ 30. Note que, com n = 30, np ≥ 5 sempre que p ≥ 0,<br />

1667; logo, essa indicação n ≥ 30 em geral funciona, <strong>de</strong>s<strong>de</strong> que a característica <strong>de</strong> interesse não seja extremamente<br />

rarefeita na população (em estatística, usa-se o termo populações raras nos casos em que p é muito pequeno). Caso<br />

haja suspeitas <strong>de</strong> que p seja muito pequeno, <strong>de</strong>ve-se aumentar o tamanho da amostra.<br />

Resumindo, temos o seguinte resultado:<br />

Vamos ver, agora, como usar esse resultado para construir testes <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong> a verda<strong>de</strong>ira proporção<br />

populacional p.<br />

<strong>Teste</strong> <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong> <strong>proporções</strong><br />

A <strong>hipótese</strong> nula que consi<strong>de</strong>raremos será uma <strong>hipótese</strong> simples: H0 : p = p0<br />

As <strong>hipótese</strong>s alternativas possíveis são:<br />

Bilateral: H1 : p ≠ p0<br />

Unilateral à Direita: H1 : p > p0<br />

Página 1 <strong>de</strong> 6


Unilateral à Esquerda: H1 : p < p0<br />

Como no caso da média, a escolha das <strong>hipótese</strong>s nula e alternativa <strong>de</strong>ve ser feita levando-se em conta que a<br />

<strong>hipótese</strong> nula <strong>de</strong>ve ser uma <strong>hipótese</strong> simples. Assim, você <strong>de</strong>ve “traduzir” a situação <strong>de</strong> interesse do problema em<br />

uma <strong>de</strong>sigualda<strong>de</strong> envolvendo a proporção p. Em seguida, <strong>de</strong>termine a <strong>de</strong>sigualda<strong>de</strong> que nega a <strong>de</strong>sigualda<strong>de</strong><br />

anterior. A <strong>hipótese</strong> alternativa envolve a <strong>de</strong>sigualda<strong>de</strong> que não inclui o sinal <strong>de</strong> =.<br />

A estatística <strong>de</strong> teste é<br />

Dado um nível <strong>de</strong> significância α, a região crítica é <strong>de</strong>finida como o conjunto <strong>de</strong> valores que têm<br />

probabilida<strong>de</strong> pequena <strong>de</strong> ocorrerem sob a veracida<strong>de</strong> da <strong>hipótese</strong> nula, ou seja, é o conjunto <strong>de</strong> valores “muito<br />

afastados” <strong>de</strong> p0.<br />

Bilateral: RC : P > p0 + k ou P < p0 − k<br />

Unilateral à Direita: RC : P > p0 + k<br />

Unilateral à Esquerda: RC : P < p0 − k<br />

O valor k é encontrado impondo-se a condição <strong>de</strong> a probabilida<strong>de</strong> do erro tipo I ser igual a α :<br />

Pr ( p ∈ RC|H0 verda<strong>de</strong>ira) = α<br />

Como essa probabilida<strong>de</strong> é calculada sob a <strong>hipótese</strong> <strong>de</strong> veracida<strong>de</strong> <strong>de</strong> H0, a variância <strong>de</strong> P é estimada por<br />

<strong>Teste</strong> bilateral<br />

Com nível <strong>de</strong> significância α = Pr(erro I), temos <strong>de</strong> ter:<br />

Ou seja, a região crítica para o teste bilateral é<br />

<strong>Teste</strong>s unilaterais<br />

Com <strong>de</strong>senvolvimento análogo, obtemos as seguintes regiões críticas:<br />

Página 2 <strong>de</strong> 6


<strong>Teste</strong> Unilateral à Direita :<br />

<strong>Teste</strong> Unilateral à Esquerda :<br />

Exemplo 12.1<br />

Uma amostra <strong>de</strong> 64 elementos é usada para testar<br />

H0 : p = 0, 35<br />

H1 : p ≠ 0, 35<br />

Estabeleça a região crítica para o nível <strong>de</strong> significância <strong>de</strong> 1%.<br />

Solução<br />

A região crítica é<br />

Logo, a região crítica é<br />

Exemplo 12.2<br />

Um fabricante afirma que no máximo 10% dos seus produtos são <strong>de</strong>feituosos. Um órgão <strong>de</strong> <strong>de</strong>fesa do<br />

consumidor testa uma amostra <strong>de</strong> 81 <strong>de</strong>sses itens, <strong>de</strong>tectando 13,8% <strong>de</strong> <strong>de</strong>feituosos.<br />

1. Encontre a região crítica para um nível <strong>de</strong> significância <strong>de</strong> 5%.<br />

2. Calcule o valor P.<br />

Solução<br />

A afirmativa <strong>de</strong> interesse para o fabricante é p ≤ 0, 10. A negação <strong>de</strong> tal afirmativa (questionamento do<br />

órgão <strong>de</strong> <strong>de</strong>fesa do consumidor) é p > 0, 10. Logo, nossas <strong>hipótese</strong>s são:<br />

H0 : p = 0, 10<br />

H1 : p > 0, 10<br />

Note que todas as <strong>proporções</strong> estão na forma <strong>de</strong>cimal. Não trabalhe com percentagens! A região crítica é<br />

Com α = 0, 05, temos:<br />

Página 3 <strong>de</strong> 6


A região crítica é P > 0, 155 ou 15,5%. Como p = 13, 8% não está na região crítica, não po<strong>de</strong>mos rejeitar a<br />

<strong>hipótese</strong> nula. Ou seja, nossos dados não fornecem evidência contra o fabricante.<br />

2.<br />

Logo, rejeitamos H0 apenas para níveis <strong>de</strong> significância maiores que 12,7%. Assim, aos níveis <strong>de</strong> significância<br />

usuais, não <strong>de</strong>vemos rejeitar H0, o que é uma evidência <strong>de</strong> que o fabricante está dizendo a verda<strong>de</strong>.<br />

Exercícios<br />

1. Em uma pesquisa com 800 estudantes universitários, 385 afirmaram possuir computador. <strong>Teste</strong> a <strong>hipótese</strong> <strong>de</strong> que<br />

pelo menos 50% dos estudantes universitários possuem computador. Use α = 0, 10.<br />

2. Uma pesquisa entre 700 trabalhadores revela que 15,8 obtiveram seus empregos por meio <strong>de</strong> indicações <strong>de</strong><br />

amigos ou parentes. <strong>Teste</strong> a <strong>hipótese</strong> <strong>de</strong> que mais <strong>de</strong> 10% dos trabalhadores conseguem seus empregos por<br />

indicação <strong>de</strong> amigos ou parentes, utilizando 5% como nível <strong>de</strong> significância.<br />

3. O nível <strong>de</strong> aprovação da qualida<strong>de</strong> das refeições servidas em um restaurante universitário era 20%, quando houve<br />

uma movimentação geral dos estudantes que forçou a direção do restaurante a fazer mudanças. Feitas as mudanças,<br />

sorteou-se uma amostra <strong>de</strong> 64 estudantes usuários do restaurante e 25 aprovaram a qualida<strong>de</strong> da comida. Você<br />

diria, ao nível <strong>de</strong> significância <strong>de</strong> 5%, que as mudanças surtiram efeito?<br />

4. Deseja-se testar a honestida<strong>de</strong> <strong>de</strong> uma moeda. Para isso, lança-se a moeda 200 vezes, obtendo-se 115 caras. Qual<br />

é a sua conclusão <strong>sobre</strong> a honestida<strong>de</strong> da moeda? Para respon<strong>de</strong>r a essa questão, calcule e interprete o valor P.<br />

5. A direção <strong>de</strong> um gran<strong>de</strong> jornal nacional afirma que 25% dos seus leitores são da classe A. Se, em uma amostra <strong>de</strong><br />

740 leitores, encontramos 156 da classe A, qual é a conclusão que tiraríamos <strong>sobre</strong> a afirmativa da direção do jornal?<br />

Solução dos Exercícios<br />

Página 4 <strong>de</strong> 6


A afirmativa <strong>de</strong> interesse é “pelo menos 50% dos estudantes possuem computador”, ou seja, p ≥ 0, 5. Logo,<br />

as <strong>hipótese</strong>s são<br />

H0 : p = 0, 50<br />

H1 : p < 0, 50<br />

α = 0, 10 =⇒ z0,1 = 1, 28 e a região crítica é<br />

Como o valor observado não pertence à região crítica, não po<strong>de</strong>mos rejeitar a <strong>hipótese</strong> nula. Ou seja, os<br />

dados trazem evidência <strong>de</strong> que a proporção <strong>de</strong> estudantes que possuem computador é <strong>de</strong> pelo menos 50%.<br />

2. As <strong>hipótese</strong>s são<br />

H0 : p = 0, 10<br />

H1 : p > 0, 10<br />

α = 5% =⇒ z0,05 = 1, 64. Logo, a região crítica é<br />

Rejeita-se, assim, a <strong>hipótese</strong> nula <strong>de</strong> que 10% ou menos dos trabalhadores conseguem seus empregos por<br />

indicação <strong>de</strong> parentes ou amigos.<br />

3. O interesse é verificar se p > 0, 20. Logo,<br />

H0 : p = 0, 20<br />

H1 : p > 0, 20<br />

Como α = 5% e o teste é unilateral, resulta que z0,05 = 1, 64. Logo, a região crítica é<br />

Como o valor observado p = 25/64 = 0, 39063 está na região crítica, rejeita-se a <strong>hipótese</strong> nula, ou seja, as<br />

evidências amostrais indicam que houve melhora com as mudanças.<br />

4. As <strong>hipótese</strong>s são<br />

H0 : p = 0, 5<br />

H1 : p ≠ 0, 5<br />

Como o valor P é pequeno, a probabilida<strong>de</strong> <strong>de</strong> obtermos 115 caras em 200 lançamentos <strong>de</strong> uma moeda é<br />

pequena, o que nos leva a suspeitar da honestida<strong>de</strong> da moeda.<br />

5. Com as informações disponíveis, nossas <strong>hipótese</strong>s são:<br />

H0 : p = 0, 25<br />

H1 : p ≠ 0, 25<br />

Página 5 <strong>de</strong> 6


O valor obtido é p =156/740 = 0, 2108 < 0, 25. Nesse caso,<br />

Como o valor P é bastante pequeno, <strong>de</strong>vemos rejeitar a <strong>hipótese</strong> nula <strong>de</strong> que a proporção <strong>de</strong> leitores da<br />

classe A é igual a 25%.<br />

Bibliografia<br />

[1] ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística Aplicada à Administração e à<br />

Economia. São Paulo: Pioneira Thomson Learning, 2002<br />

[2] MOORE, David S.; McCabe, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A Prática da Estatística<br />

Empresarial – Como Usar Dados para Tomar Decisões. Rio <strong>de</strong> Janeiro: LTC Editora, 2006<br />

[3] MORETTIN, Pedro Alberto; BUSSAB, Wilton <strong>de</strong> Oliveira. Estatística Básica, 5a Edição. São Paulo: Saraiva, 2006<br />

[4] TRIOLA, Mario F. Introdução à Estatística, 9a. Edição. Rio <strong>de</strong> Janeiro: LTC Editora, 2005<br />

[5] FARIAS, Ana M.; Métodos Estatísticos I. Rio <strong>de</strong> Janeiro. Fundação CECIERJ, 2009.<br />

Página 6 <strong>de</strong> 6

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!