Teste de hipótese sobre proporções - AEDBEst
Teste de hipótese sobre proporções - AEDBEst
Teste de hipótese sobre proporções - AEDBEst
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Aula 12 – <strong>Teste</strong> <strong>de</strong> <strong>hipótese</strong> <strong>sobre</strong> <strong>proporções</strong> – amostras gran<strong>de</strong>s<br />
Objetivos<br />
Na aula anterior, você apren<strong>de</strong>u a construir testes <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong> a média <strong>de</strong> uma população normal<br />
com variância σ 2 conhecida. O procedimento baseou-se na distribuição amostral da média amostral que, com as<br />
<strong>hipótese</strong>s <strong>de</strong> normalida<strong>de</strong> e conhecimento da variância populacional, sabemos ser normal com a mesma média e<br />
variância σ 2 /n. Nesta aula, iremos fazer uso do Teorema Central do Limite para construir testes <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong><br />
<strong>proporções</strong> com base em amostras gran<strong>de</strong>s. Vimos que, para amostras gran<strong>de</strong>s, a distribuição amostral da<br />
proporção amostral po<strong>de</strong> ser aproximada por uma distribuição normal e, assim, o procedimento <strong>de</strong> teste <strong>de</strong><br />
<strong>hipótese</strong> será idêntico ao estudado na aula anterior.<br />
Estimação <strong>de</strong> uma proporção populacional<br />
O contexto <strong>de</strong> interesse é o seguinte: temos uma população em que cada elemento é classificado <strong>de</strong> acordo<br />
com a presença ou ausência <strong>de</strong> <strong>de</strong>terminada característica. Em termos <strong>de</strong> variável aleatória, essa população é<br />
representada por uma v.a. <strong>de</strong> Bernoulli, isto é:<br />
X = 1 se elemento possui a característica <strong>de</strong> interesse;<br />
X= 0 se elemento não possui a característica <strong>de</strong> interesse<br />
Então, Pr(X = 1) = p, E(X) = p e Var(X) = p(1−p). O parâmetro p é também a proporção <strong>de</strong> elementos da<br />
população que possuem a característica <strong>de</strong> interesse. Em geral, esse parâmetro é <strong>de</strong>sconhecido e queremos testar<br />
<strong>hipótese</strong>s feitas <strong>sobre</strong> seu possível valor.<br />
Suponha, então, que <strong>de</strong>ssa população seja extraída uma amostra aleatória simples X1,X2, . . . ,Xn com<br />
reposição. Vimos que a proporção P <strong>de</strong> elementos na amostra que possuem a característica <strong>de</strong> interesse, <strong>de</strong>finida<br />
por<br />
é um estimador não-viesado para p com variância p(1−p)/n . Mais precisamente,<br />
Como a proporção amostral é uma média <strong>de</strong> uma amostra aleatória simples <strong>de</strong> uma população com<br />
distribuição <strong>de</strong> Bernoulli com parâmetro p, o Teorema Central do Limite nos diz, então, que a distribuição <strong>de</strong> P se<br />
aproxima <strong>de</strong> uma normal com média p e variância p(1−p)/n . Como visto, a aproximação <strong>de</strong>ve ser feita se np ≥ 5 e<br />
n(1−p) ≥ 5 e, em geral, essas condições são satisfeitas se n ≥ 30. Note que, com n = 30, np ≥ 5 sempre que p ≥ 0,<br />
1667; logo, essa indicação n ≥ 30 em geral funciona, <strong>de</strong>s<strong>de</strong> que a característica <strong>de</strong> interesse não seja extremamente<br />
rarefeita na população (em estatística, usa-se o termo populações raras nos casos em que p é muito pequeno). Caso<br />
haja suspeitas <strong>de</strong> que p seja muito pequeno, <strong>de</strong>ve-se aumentar o tamanho da amostra.<br />
Resumindo, temos o seguinte resultado:<br />
Vamos ver, agora, como usar esse resultado para construir testes <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong> a verda<strong>de</strong>ira proporção<br />
populacional p.<br />
<strong>Teste</strong> <strong>de</strong> <strong>hipótese</strong>s <strong>sobre</strong> <strong>proporções</strong><br />
A <strong>hipótese</strong> nula que consi<strong>de</strong>raremos será uma <strong>hipótese</strong> simples: H0 : p = p0<br />
As <strong>hipótese</strong>s alternativas possíveis são:<br />
Bilateral: H1 : p ≠ p0<br />
Unilateral à Direita: H1 : p > p0<br />
Página 1 <strong>de</strong> 6
Unilateral à Esquerda: H1 : p < p0<br />
Como no caso da média, a escolha das <strong>hipótese</strong>s nula e alternativa <strong>de</strong>ve ser feita levando-se em conta que a<br />
<strong>hipótese</strong> nula <strong>de</strong>ve ser uma <strong>hipótese</strong> simples. Assim, você <strong>de</strong>ve “traduzir” a situação <strong>de</strong> interesse do problema em<br />
uma <strong>de</strong>sigualda<strong>de</strong> envolvendo a proporção p. Em seguida, <strong>de</strong>termine a <strong>de</strong>sigualda<strong>de</strong> que nega a <strong>de</strong>sigualda<strong>de</strong><br />
anterior. A <strong>hipótese</strong> alternativa envolve a <strong>de</strong>sigualda<strong>de</strong> que não inclui o sinal <strong>de</strong> =.<br />
A estatística <strong>de</strong> teste é<br />
Dado um nível <strong>de</strong> significância α, a região crítica é <strong>de</strong>finida como o conjunto <strong>de</strong> valores que têm<br />
probabilida<strong>de</strong> pequena <strong>de</strong> ocorrerem sob a veracida<strong>de</strong> da <strong>hipótese</strong> nula, ou seja, é o conjunto <strong>de</strong> valores “muito<br />
afastados” <strong>de</strong> p0.<br />
Bilateral: RC : P > p0 + k ou P < p0 − k<br />
Unilateral à Direita: RC : P > p0 + k<br />
Unilateral à Esquerda: RC : P < p0 − k<br />
O valor k é encontrado impondo-se a condição <strong>de</strong> a probabilida<strong>de</strong> do erro tipo I ser igual a α :<br />
Pr ( p ∈ RC|H0 verda<strong>de</strong>ira) = α<br />
Como essa probabilida<strong>de</strong> é calculada sob a <strong>hipótese</strong> <strong>de</strong> veracida<strong>de</strong> <strong>de</strong> H0, a variância <strong>de</strong> P é estimada por<br />
<strong>Teste</strong> bilateral<br />
Com nível <strong>de</strong> significância α = Pr(erro I), temos <strong>de</strong> ter:<br />
Ou seja, a região crítica para o teste bilateral é<br />
<strong>Teste</strong>s unilaterais<br />
Com <strong>de</strong>senvolvimento análogo, obtemos as seguintes regiões críticas:<br />
Página 2 <strong>de</strong> 6
<strong>Teste</strong> Unilateral à Direita :<br />
<strong>Teste</strong> Unilateral à Esquerda :<br />
Exemplo 12.1<br />
Uma amostra <strong>de</strong> 64 elementos é usada para testar<br />
H0 : p = 0, 35<br />
H1 : p ≠ 0, 35<br />
Estabeleça a região crítica para o nível <strong>de</strong> significância <strong>de</strong> 1%.<br />
Solução<br />
A região crítica é<br />
Logo, a região crítica é<br />
Exemplo 12.2<br />
Um fabricante afirma que no máximo 10% dos seus produtos são <strong>de</strong>feituosos. Um órgão <strong>de</strong> <strong>de</strong>fesa do<br />
consumidor testa uma amostra <strong>de</strong> 81 <strong>de</strong>sses itens, <strong>de</strong>tectando 13,8% <strong>de</strong> <strong>de</strong>feituosos.<br />
1. Encontre a região crítica para um nível <strong>de</strong> significância <strong>de</strong> 5%.<br />
2. Calcule o valor P.<br />
Solução<br />
A afirmativa <strong>de</strong> interesse para o fabricante é p ≤ 0, 10. A negação <strong>de</strong> tal afirmativa (questionamento do<br />
órgão <strong>de</strong> <strong>de</strong>fesa do consumidor) é p > 0, 10. Logo, nossas <strong>hipótese</strong>s são:<br />
H0 : p = 0, 10<br />
H1 : p > 0, 10<br />
Note que todas as <strong>proporções</strong> estão na forma <strong>de</strong>cimal. Não trabalhe com percentagens! A região crítica é<br />
Com α = 0, 05, temos:<br />
Página 3 <strong>de</strong> 6
A região crítica é P > 0, 155 ou 15,5%. Como p = 13, 8% não está na região crítica, não po<strong>de</strong>mos rejeitar a<br />
<strong>hipótese</strong> nula. Ou seja, nossos dados não fornecem evidência contra o fabricante.<br />
2.<br />
Logo, rejeitamos H0 apenas para níveis <strong>de</strong> significância maiores que 12,7%. Assim, aos níveis <strong>de</strong> significância<br />
usuais, não <strong>de</strong>vemos rejeitar H0, o que é uma evidência <strong>de</strong> que o fabricante está dizendo a verda<strong>de</strong>.<br />
Exercícios<br />
1. Em uma pesquisa com 800 estudantes universitários, 385 afirmaram possuir computador. <strong>Teste</strong> a <strong>hipótese</strong> <strong>de</strong> que<br />
pelo menos 50% dos estudantes universitários possuem computador. Use α = 0, 10.<br />
2. Uma pesquisa entre 700 trabalhadores revela que 15,8 obtiveram seus empregos por meio <strong>de</strong> indicações <strong>de</strong><br />
amigos ou parentes. <strong>Teste</strong> a <strong>hipótese</strong> <strong>de</strong> que mais <strong>de</strong> 10% dos trabalhadores conseguem seus empregos por<br />
indicação <strong>de</strong> amigos ou parentes, utilizando 5% como nível <strong>de</strong> significância.<br />
3. O nível <strong>de</strong> aprovação da qualida<strong>de</strong> das refeições servidas em um restaurante universitário era 20%, quando houve<br />
uma movimentação geral dos estudantes que forçou a direção do restaurante a fazer mudanças. Feitas as mudanças,<br />
sorteou-se uma amostra <strong>de</strong> 64 estudantes usuários do restaurante e 25 aprovaram a qualida<strong>de</strong> da comida. Você<br />
diria, ao nível <strong>de</strong> significância <strong>de</strong> 5%, que as mudanças surtiram efeito?<br />
4. Deseja-se testar a honestida<strong>de</strong> <strong>de</strong> uma moeda. Para isso, lança-se a moeda 200 vezes, obtendo-se 115 caras. Qual<br />
é a sua conclusão <strong>sobre</strong> a honestida<strong>de</strong> da moeda? Para respon<strong>de</strong>r a essa questão, calcule e interprete o valor P.<br />
5. A direção <strong>de</strong> um gran<strong>de</strong> jornal nacional afirma que 25% dos seus leitores são da classe A. Se, em uma amostra <strong>de</strong><br />
740 leitores, encontramos 156 da classe A, qual é a conclusão que tiraríamos <strong>sobre</strong> a afirmativa da direção do jornal?<br />
Solução dos Exercícios<br />
Página 4 <strong>de</strong> 6
A afirmativa <strong>de</strong> interesse é “pelo menos 50% dos estudantes possuem computador”, ou seja, p ≥ 0, 5. Logo,<br />
as <strong>hipótese</strong>s são<br />
H0 : p = 0, 50<br />
H1 : p < 0, 50<br />
α = 0, 10 =⇒ z0,1 = 1, 28 e a região crítica é<br />
Como o valor observado não pertence à região crítica, não po<strong>de</strong>mos rejeitar a <strong>hipótese</strong> nula. Ou seja, os<br />
dados trazem evidência <strong>de</strong> que a proporção <strong>de</strong> estudantes que possuem computador é <strong>de</strong> pelo menos 50%.<br />
2. As <strong>hipótese</strong>s são<br />
H0 : p = 0, 10<br />
H1 : p > 0, 10<br />
α = 5% =⇒ z0,05 = 1, 64. Logo, a região crítica é<br />
Rejeita-se, assim, a <strong>hipótese</strong> nula <strong>de</strong> que 10% ou menos dos trabalhadores conseguem seus empregos por<br />
indicação <strong>de</strong> parentes ou amigos.<br />
3. O interesse é verificar se p > 0, 20. Logo,<br />
H0 : p = 0, 20<br />
H1 : p > 0, 20<br />
Como α = 5% e o teste é unilateral, resulta que z0,05 = 1, 64. Logo, a região crítica é<br />
Como o valor observado p = 25/64 = 0, 39063 está na região crítica, rejeita-se a <strong>hipótese</strong> nula, ou seja, as<br />
evidências amostrais indicam que houve melhora com as mudanças.<br />
4. As <strong>hipótese</strong>s são<br />
H0 : p = 0, 5<br />
H1 : p ≠ 0, 5<br />
Como o valor P é pequeno, a probabilida<strong>de</strong> <strong>de</strong> obtermos 115 caras em 200 lançamentos <strong>de</strong> uma moeda é<br />
pequena, o que nos leva a suspeitar da honestida<strong>de</strong> da moeda.<br />
5. Com as informações disponíveis, nossas <strong>hipótese</strong>s são:<br />
H0 : p = 0, 25<br />
H1 : p ≠ 0, 25<br />
Página 5 <strong>de</strong> 6
O valor obtido é p =156/740 = 0, 2108 < 0, 25. Nesse caso,<br />
Como o valor P é bastante pequeno, <strong>de</strong>vemos rejeitar a <strong>hipótese</strong> nula <strong>de</strong> que a proporção <strong>de</strong> leitores da<br />
classe A é igual a 25%.<br />
Bibliografia<br />
[1] ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística Aplicada à Administração e à<br />
Economia. São Paulo: Pioneira Thomson Learning, 2002<br />
[2] MOORE, David S.; McCabe, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A Prática da Estatística<br />
Empresarial – Como Usar Dados para Tomar Decisões. Rio <strong>de</strong> Janeiro: LTC Editora, 2006<br />
[3] MORETTIN, Pedro Alberto; BUSSAB, Wilton <strong>de</strong> Oliveira. Estatística Básica, 5a Edição. São Paulo: Saraiva, 2006<br />
[4] TRIOLA, Mario F. Introdução à Estatística, 9a. Edição. Rio <strong>de</strong> Janeiro: LTC Editora, 2005<br />
[5] FARIAS, Ana M.; Métodos Estatísticos I. Rio <strong>de</strong> Janeiro. Fundação CECIERJ, 2009.<br />
Página 6 <strong>de</strong> 6