Artigo/Paper - UNESP

UM ESTUDO SOBRE O DESEMPENHO DE INTERVALOS DE 

CONFIANÇA BOOTSTRAP PARA A MÉDIA DE UMA DISTRIBUIÇÃO 

NORMAL USANDO AMOSTRAGEM POR CONJUNTOS ORDENADOS 

PERFEITAMENTE 

Luciana Cristina CESÁRIO 1 

Maria Cecília Mendes BARRETO 1 

RESUMO: O delineamento de amostras por conjuntos ordenados tem se mostrado eficiente na 

estimação de diversos parâmetros populacionais, entre eles a média, os parâmetros de um modelo de 

regressão linear simples e os quantis populacionais. Usando informação sobre o tipo de distribuição 

da variável resposta, mais recentemente, diversos autores propuseram, para o parâmetro de locação, 

estimadores diferentes da média da amostra de conjuntos ordenados, entre eles o estimador linear 

não viciado ótimo. Por outro lado, intervalos de confiança bootstrap são uma alternativa 

computacionalmente intensiva e eficiente, principalmente quando não se tem resultados exatos ou 

assintóticos que possam garantir seu desempenho. Neste trabalho são apresentadas propostas para a 

construção de intervalos bootstrap de confiança e estudos sobre seu desempenho para a média de 

populações com distribuição normal sob o delineamento por conjuntos ordenados perfeitamente. Foi 

verificado por simulação que o intervalo de confiança t-bootstrap possui o melhor desempenho. 

Esses resultados tornam-se relevantes à medida que, em amostragem por conjuntos ordenados, são a 

única alternativa para a obtenção de intervalos de confiança. 

PALAVRAS-CHAVE: Amostragem por conjuntos ordenados; intervalos de confiança bootstrap; 

estimação intervalar da média; distribuição normal. 

1 Introdução 

A busca de métodos e técnicas estatísticas eficientes, principalmente relacionadas com 

estudos do meio ambiente, têm sido discutidas recentemente, dando-se grande ênfase àquelas 

em que a obtenção de dados pode envolver altos custos de mensuração ou mesmo restrições 

ao acesso de resultados (Barnett, 1999; Barreto, 2001). 

A amostragem por conjuntos ordenados (ranked-set sampling – RSS), introduzida por 

McIntyre (1952), usa o fato de ser possível fazer uma ordenação entre os elementos da 

amostra, antes de sua efetiva mensuração. A média da amostra de conjuntos ordenados, 

apresentada nesse trabalho pioneiro, é um estimador não viciado da média populacional que 

apresenta variância menor ou igual à média de uma amostra aleatória simples. Esta 

desigualdade está relacionada ao processo da obtenção da amostra de conjuntos ordenados. 

1 Departamento de Estatística, Universidade Federal de São Carlos – UFSCar, CEP: 13565-905, São Carlos, SP, 

Brasil. E-mail: cbarreto@power.ufscar.br. 

Rev. Mat. Estat., São Paulo, v.21, n.3, p.7-20, 2003 7

A técnica de RSS tem sido desenvolvida, ultimamente, buscando aumentar sua 

eficiência e aplicabilidade para as diferentes distribuições das variáveis de interesse. Por 

exemplo, diversos autores consideram os estimadores lineares não viciados ótimos (best 

linear unbiased linear estimators – BLUEs), verificando seus ganhos de eficiência sobre 

outros estimadores. Em particular, considerando a amostragem por conjuntos ordenados em 

distribuições na família locação-escala, Stokes (1995) obteve o BLUE do parâmetro de 

locação, µ, com o parâmetro de escala σ conhecido, e também o BLUE de σ, com µ 

conhecido. Sinha et al. (1996) estudaram o BLUE da média populacional para as 

distribuições normal e exponencial. Nestes trabalhos, as propriedades dos estimadores 

obtidos foram estudadas no caso em que a ordenação é perfeita, isto é, a ordenação antes da 

mensuração é feita sem erros. 

Barnett e Moore (1997) obtiveram a forma geral dos BLUEs de µ e σ para distribuições 

pertencentes a família locação-escala, considerando ordenação perfeita e imperfeita. Seus 

resultados mostram o ganho de eficiência do BLUE de µ sobre a média da amostra por 

conjuntos ordenados. O estimador de µ obtido por Barnett e Moore (1997) coincide com o 

obtido por Sinha et al. (1996) para distribuições normal e exponencial. 

Existem poucos trabalhos que estudam intervalos de confiança na amostragem por 

conjuntos ordenados. Chen (2000) faz um estudo assintótico sobre os quantis na amostra de 

conjuntos ordenados e apresenta suas propriedades. Com isso o autor desenvolve métodos de 

inferência para os quantis populacionais, entre eles intervalos de confiança. 

Neste trabalho, apresenta-se a construção de intervalos de confiança bootstrap para a 

média de uma distribuição normal considerando o delineamento de amostras por conjuntos 

ordenados perfeitamente. Com o objetivo de validá-los, faz-se também um estudo, via 

simulação, das respectivas probabilidades de cobertura. 

2 Amostra de conjuntos ordenados e alguns estimadores para a média 

populacional 

O delineamento por amostras de conjuntos ordenados pode ser obtido em três passos: 

no primeiro, selecionam-se n amostras com n objetos cada (pessoas, animais, plantas, entre 

outros); no segundo passo, por algum julgamento profissional, por alguma variável 

concomitante ou por outro método não dispendioso, ordenam-se os objetos em cada amostra 

sem que de fato tenham sido observados quanto à variável de interesse; no terceiro passo, 

após a ordenação, mensura-se um objeto de cada amostra quanto à variável de interesse, X i(i) , 

(i =1,2, ..., n), ou seja, mede-se aquele que foi ordenado como tendo o i-ésimo menor valor 

da variável de interesse na i-ésima amostra. 

Desse modo, uma amostra por conjuntos ordenados é definida como 

X 1(1) 

, X 2(2) ,..., X n ( n) 

. 

Observe que cada elemento amostral provém de uma amostra independentemente 

escolhida, ou seja, eles são não-correlacionados. 

Diz-se que a ordenação é perfeita quando a amostra é ordenada corretamente, ou seja, 

quando X i(i) é realmente o i-ésimo valor ordenado na i-ésima amostra, caso contrário, tem-se 

a ordenação imperfeita. Existem dois modelos (Nahhas et al., 2002) que levam em conta 

erros de ordenação (ranking error models). O modelo de ordenação visual, proposto por Dell 

e Clutter (1972), considera que a ordenação é feita com uma perturbação quantificada na 

8 

Rev. Mat. Estat., São Paulo, v.21, n.3, p.7-20, 2003

forma de uma adição ao verdadeiro valor de uma variável aleatória normal com média zero e 

variância proporcionalmente inversa à habilidade do especialista. Quanto maior a habilidade 

mais próxima de zero é a variância. O modelo de ordenação baseado em variável 

concomitante, proposto por Stokes (1977), leva em consideração a correlação existente entre 

a variável de interesse e a variável concomitante. 

Como estimador não viciado da média populacional, µ x , McIntyre (1952) sugeriu a 

média dos elementos da amostra por conjuntos ordenados dada por 

1 

X = 

n 

n 

X i ( i) 

, 

i= 

1 

comentando que sua variância é menor ou igual à variância da média de uma amostra 

aleatória simples. Só em 1968, entretanto, Takahasi e Wakimoto (1968) mostraram 

matematicamente as idéias de McIntyre para diferentes tamanhos de amostras e 

distribuições. Isto é, sendo X (i) a i-ésima estatística de ordem numa amostra por conjuntos 

ordenados então, 

= 1 n 

Var( 

X ) = 

2 

n i= 

1 

Var( 

1 n 

n 

≤ Var( 

X ( i) 

) + 2 Cov 

2 

n 

i= 

1 

i= 1 j > i 

X i ( i) 

) 

 

( j) 

 

( X , X ) 

 

( i) 

(1) 

= Var( _ X ) , 

pois Cov (X i(i), X j(j) )= 0 uma vez que os elementos provêm de amostras independentemente 

selecionadas. Essas propriedades são válidas mesmo no caso em que existem erros de 

ordenação. 

Em seu trabalho de 1980, Stokes sugeriu como estimador da variância populacional, 

σ 2 x, a variância da amostra de conjuntos ordenados dada por 

n 

2 1 

ˆ σ x = ( Xi 

i − 2 

( ) X ) , (2) 

n −1 

e mostrou que ela é assintóticamente não viciada, mesmo na presença de erros de 

mensuração, e também mais eficiente que seu análogo na amostra aleatória simples. 

No caso específico da distribuição da variável de interesse, X, pertencer à família 

locação-escala, onde µ é o parâmetro de locação e σ o parâmetro de escala, a i-ésima 

estatística de ordem padronizada, U (i) = (X (i) - µ)/σ, tem valores esperados η i e variâncias τ i . 

Dada a relação existente entre estatísticas de ordem e os elementos da amostra de conjuntos 

ordenados, a variância de X pode ser escrita na forma 

2 

n 

σ 

Var( X ) = τ 

2 i . (3) 

n 

i= 

1 


Quando a variável de interesse, X, tem distribuição pertencente a família locaçãoescala, 

Barnett e Moore (1997) obtiveram o estimador linear ótimo, θ * , do vetor de 

parâmetros, θ 1 = (µ, σ). No caso da variável de interesse ter distribuição normal, µ x = µ e 

σ 2 x=σ 2 , os componentes de θ * podem ser escritos por 

e 

com 

n 

i= 

1 ( X i ( i) 

/ τi) 

µ * = 

(4) 

n 

i= 

1(1/ 

τi) 

n 

i= 

1 ( ηi ( ) / ) 

* = 

X i i τi 

σ (5) 

n 2 

i= 

1( 

ηi 

/ τi) 

2 

σ 

Var( 

µ *) = 

n 

(6) 

i = 1(1/ 

τ i ) 

e 

2 

σ 

Var( 

σ *) = 

n 2 

i = 1( 

ηi 

/ τi) 

e a covariância entre µ* e σ* nula. Também foi mostrado que µ* é mais eficiente que X no 

caso de distribuição normal. 

Os valores de η i e τ i só dependem da distribuição subjacente de n e da posição i. Para a 

distribuição normal eles foram tabulados, entre outros, por Pearson e Hartley (1976). 

Usando algumas propriedades das estatísticas de ordem (por exemplo, David, 1981), as 

quantidades η i e τ i podem ser computacionalmente obtidas para qualquer distribuição de 

interesse. Assim, a média e a variância das estatísticas de ordem padronizadas são dadas por: 

n 

−1 

i−1 

n−i 

η i = ufi 

( u) 

du = n 

u[ P( 

u) 

] [ 1− 

P( 

u) 

] p( 

u) 

du e 

i −1 

n 

−1 

τ i = n 

u 

i −1 

2 

i 1 

[ P( 

u) 

] [ 1− 

P( 

u) 

] 

− n−i 

2 

p( 

u) 

du − ( ηi 

) 

onde n é o tamanho da amostra, i é a ordem, P(u) é a distribuição acumulada da variável 

reduzida e p(u), a respectiva função densidade. Um programa para o cálculo dessas 

constantes usando SPLUS (Venables e Riplye, 1997) encontra-se em Cesário (2001). 

Na maioria das vezes, apenas uma estimativa pontual a partir de uma amostra não é 

informação suficiente para se fazer inferências sobre o parâmetro de interesse. Também é 

interessante que se tenha idéia da precisão ou possível erro dessa estimativa e os intervalos 

de confiança possuem essas características. 

3 Intervalos de confiança bootstrap 

Como não existem estudos sobre intervalos de confiança exatos ou mesmo intervalos de 

confiança assintóticos para a média de uma distribuição normal sob o delineamento de 

10 


amostras de conjuntos ordenados, a construção de intervalos de confiança foi baseada em 

métodos bootstrap. Inicialmente, são apresentados os fundamentos da construção de 

intervalos de confiança bootstrap considerando a amostragem aleatória simples, baseadas 

principalmente nos trabalhos de Efron e Tibshirani (1993) e Davison e Hinkley (1997). A 

seguir, introduz-se intervalos de confiança bootstrap e sua utilização em amostras por 

conjuntos ordenados. 

3.1 Método bootstrap em amostragem aleatória simples 

Elaborado por Efron (1979), o método de simulação de dados bootstrap é baseado nas 

idéias tradicionais da inferência estatística com o mínimo de suposições matemáticas 

possíveis. Computacionalmente intensivo, sua utilização em trabalhos recentes evidenciam 

sua grande versatilidade. Efron e Tibshirani (1993) e Davison e Hinkley (1997) apresentam 

uma ampla discussão e aplicação de métodos bootstrap nas mais variadas técnicas 

estatísticas de análise de dados. 

Considerando que a amostra original é aleatória simples de tamanho n, as amostras 

bootstrap são obtidas por amostragem aleatória simples de tamanho n com reposição da 

amostra original. Isto é, a amostragem é feita a partir de Fˆ , a distribuição empírica dos 

dados, que atribui probabilidade 1/n a cada um dos valores observados, x 1 , x 2 , ...,x n . Essa 

geração de amostras bootstrap é conhecida como não-paramétrica. Quando a reamostragem é 

feita a partir de uma distribuição conhecida, Fˆ 

par , cujos parâmetros são estimativas obtidas 

na amostra original, o processo de reamostragem bootstrap é conhecido como paramétrico. 

Sendo δˆ um estimador do parâmetro de interesse δ e se (δˆ ) o seu erro padrão 

estimado na amostra original, definem-se B como o número de replicações bootstrap de 

tamanho n da amostra original e ˆ • 

δ ( b) 

, a estimativa bootstrap em cada uma das B amostras, 

com b = 1,2,..., B. 

com 

A estimativa bootstrap do erro padrão de δˆ , se boot (δˆ ), é dada por: 

Supondo que 

( ˆ) = B 

se 

b= 

1 

boot δ 

[ ˆ• 

δ ( b) 

− s( 

⋅) 

] 

B −1 

B 

ˆ• 

b 

s ⋅ = b = 1 

δ ( ) 

( ) 

B 

ˆ δ −δ 

Z = ~ N(0,1), 

seboot ( δ ) 

um intervalo de confiança bootstrap padrão para δ com probabilidade de cobertura de 

aproximadamente (1 - 2α) é dado por: 

ˆ δ ± zα seboot 

( ˆ) δ 

2 


onde z α é o α-ésimo quantil da distribuição normal padrão. O método boostrap padrão é 

acurado de primeira ordem (Efron e Tibshirani, 1993). 

Baseado no procedimento para a construção de intervalos de confiança quando Z tem 

distribuição t-Student, o intervalo de confiança t-bootstrap pressupõe o cálculo da estatística 

Z em cada amostra e obtém-se tˆ 

(1−α 

) e t ( 

ˆα ) através da estimação da distribuição de Z. Assim, 

para cada uma das B amostras bootstrap geradas calcula-se 

ˆ• 

δ ( b) 

− ˆ δ 

Z ( b) 

= , 

• 

se b ( ˆ) δ 

onde seb 

• (δˆ ) é o erro padrão estimado em cada amostra bootstrap e estima-se o 100α-ésimo 

percentil de Z através de t ( 

ˆα ) de modo que 

# 

{ Z ( b) 

≤ tˆ 

} ( α ) 

= α 

Analogamente, estima-se o 100 (1 - α)-ésimo percentil de Z através de por tˆ( 1−α 

) 

B 

{ Z( 

b) 

tˆ 

} 

# ) 

≤ (1 − α 

= 1−α 

. 

B 

Assim o intervalo de confiança t-bootstrap para δ com probabilidade de cobertura de 

aproximadamente (1 - 2α) é dado por 

( ˆ δ tˆ 

se( 

ˆ), δ ˆ δ − tˆ 

se( 

ˆ) ) 

− ( 1 − α) 

( α) 

δ . 

O intervalo t-bootstrap é acurado de segunda ordem. 

• 

A partir da distribuição empírica acumulada de δˆ constrói-se o intervalo de confiança 

( α ) 

bootstrap percentil. Sendo ˆ • 

δ • (1 α ) 

B e ˆ• • − 

δ B , respectivamente, o (100-α)-ésimo e o 100(1 - 

α)-ésimo percentis da distribuição empírica de ˆ• 

δ (.) , o intervalo de confiança bootstrap 

percentil para δ é dado por 

( ˆ δ 

• ) (1 ) 

) 

( α 

, ˆ δ 

• −α 

B 

com probabilidade de cobertura aproximada de (1 - 2α). O intervalo bootstrap percentil é 

acurado de primeira ordem. 

O intervalo bootstrap com vício corrigido acelerado (bias corrected and accelerated - 

BC α ) corresponde a uma modificação no método de obtenção do intervalo bootstrap 

percentil. O BC α utiliza a distribuição empírica bootstrap modificada que depende das 

quantidades ẑ0 

e αˆ , chamadas respectivamente de correção do vício e aceleração. Em sua 

obtenção é usado um método de reamostragem (jackknife ou bootstrap). O método BC α é 

acurado de segunda ordem e requer um esforço computacional maior. 

O método ABC (approximate bootstrap confidence interval) corresponde a uma 

aproximação analítica por expansão de Taylor da segunda reamostragem no método BC α . 

Ele também é acurado de segunda ordem. 

B 

. 

12 


Neste trabalho considera-se a extensão do método bootstrap paramétrico em 

amostragem por conjuntos ordenados para os intervalos bootstrap padrão, percentil e t- 

bootstrap. 

3.2 Método bootstrap sob o delineamento de amostras por conjuntos 

ordenados 

Efron e Tibshirani (1993) e Davison e Hinkley (1997), ao abordarem o método 

bootstrap não paramétrico, consideram uma amostra de tamanho n cujos elementos são 

independentes e identicamente distribuídos. 

Na amostragem por conjuntos ordenados sabe-se que os elementos que compõem a 

amostra são estatísticas de ordem vindos de amostras independentemente escolhidas, e 

portanto, são independentes. Porém, como suas distribuições dependem das suas respectivas 

ordens, eles não são identicamente distribuídos. Assim, ao se aplicar diretamente o método 

bootstrap não-paramétrico na reamostragem, pode-se estar deixando de levar em 

consideração a ordem do seu elemento perdendo na análise essa informação adicional de ser 

uma amostra de conjuntos ordenados, especialmente quando a ordenação é perfeita. 

Além disso, considera-se que o procedimento de amostragem apresentado na Seção 2, é 

realizado apenas uma única vez. Dessa forma, não se tem replicações das estatísticas de 

ordem que compõem a amostra de conjuntos ordenados. Por esses motivos o método 

bootstrap paramétrico é a opção para a construção de intervalos de confiança. 

Dada a amostra de conjuntos ordenados original, as amostras bootstrap são obtidas a 

partir da geração de variáveis pseudo-aleatórias da distribuição normal com parâmetros 

iguais às estimativas obtidas na amostra original. Isto é, quando a variância é conhecida, 

usando o estimador média amostral, X , dado em (1) ou o estimador linear ótimo, µ*, dado 

em (4), as amostras bootstrap são obtidas a partir da simulação de n conjuntos, cada um com 

n elementos, oriundos de uma população com distribuição normal com média igual a 

estimativa escolhida. Em cada um desses conjuntos, seus elementos são ordenados e da 

primeira amostra é selecionado o menor elemento, da segunda, o segundo menor elemento, e 

assim por diante até que da n-ésima amostra é selecionado o maior elemento. 

No caso em que a variância é desconhecida, usam-se também os estimadores 

apresentados em (2) ou (5), para a obtenção das reamostras. 

4 Estimação intervalar via método bootstrap para o parâmetro de locação sob 

RSS 

A partir da amostra de conjuntos ordenados bootstrap, esta proposta de intervalo de 

confiança bootstrap para a média populacional de uma distribuição normal utiliza o 

estimador média amostral, X dado em (1), com seu respectivo erro padrão, se (X ) , que 

corresponde a raiz quadrada de (2) ou o estimador linear ótimo, µ*, dado em (4), cujo erro 

padrão, se (µ*) 

, corresponde a raiz quadrada de (6). 

Se o interesse é a obtenção de intervalos de confiança bootstrap padrão para µ, 

utilizando, µ*, então, inicialmente, para cada uma das B reamostras calcula-se µ*(b), ou seja, 

a estimativa linear ótima da b-ésima amostra bootstrap de conjuntos ordenados, seu erro 

padrão, seb 

( µ *), e Z( 

b) 

= [ µ *( b) 

− µ *]/ 

seb 

( µ *) onde b = 1,...,B. 


A seguir, para se obter o intervalo de confiança bootstrap percentil, ordenam-se os 

µ*(b) e tomam-se G -1 (α) e G -1 (1 - α), o 100α-ésimo e o 100(1 - α)-ésimo percentis, 

respectivamente, da distribuição de µ*(b). 

Ao estimar o erro padrão bootstrap, 

B 

[ µ *( b) 

− *( b) 

] 

seboot 

( µ *) = 

µ /( B −1) 

, 

b= 

1 

B 

com µ *( 

b) 

= b = 1 

µ *( b) 

/ B , calcula-se µ* ± z α se boot (µ*) para se obter o intervalo de 

confiança bootstrap padrão, onde z α é o quantil (1 - 2α) da distribuição normal padrão. 

Por fim, ao se calcular t ( 

ˆα ) tal que {# Z ( b) 

≤ tˆ 

( α ) }/ 

B = α e t ˆ 

(1−α 

) , tal que 

{# Z ( b) 

≤ t ˆ ( 1−α 

) }/ 

B = 1−α 

, e substituir os respectivos valores na expressão 

( µ * −tˆ 

( *), * ˆ 

( 1 − α ) se µ µ −t( 

α) 

se( 

µ *)), tem-se o intervalo de confiança t-bootstrap para µ. 

O procedimento de obtenção de intervalos de confiança bootstrap para µ utilizando o 

estimador X é realizado de modo análogo. 

Como o interesse é estimar a média populacional, uma observação a ser feita é a 

respeito da variância, σ 2 . Esse parâmetro pode ser conhecido, como no trabalho de Stokes 

(1995), ou, se desconhecido, precisa ser estimado. 

Uma primeira sugestão é, através da amostra original, calcular σ 2 , o estimador linear 

ótimo de σ dado em (5), e usá-lo como parâmetro de escala da distribuição no processo de 

reamostragem paramétrica. Nesse caso, a sugestão 1 considera “fixa” a estimativa de σ 

obtida durante todo o procedimento de estimação intervalar. 

Ao aplicar o método t-bootstrap, uma estimativa do erro padrão do estimador de µ, 

baseada em (3) ou (6), é calculada em cada amostra bootstrap, que dependem de σ. Assim, 

uma outra alternativa (sugestão 2), para este cálculo, é utilizar as respectivas estimativas de 

σ, 

* 

σ b ou 

2 ˆ b 

σ 

em cada amostra bootstrap. 

5 Resultados do estudo por simulação 

A Arabidopsis thaliana é uma planta muito usada em estudos genéticos e moleculares, 

principalmente quando são necessários métodos de detecção de diferenças fenotípicas entre 

plantas que poderiam estar ligadas a mudanças genéticas. Comumente, essas diferenças são 

pequenas. Para aumentar a precisão da estimação, há a necessidade de amostras de tamanho 

grande. O problema é que se a variável de interesse é o peso da raiz, sua mensuração pode 

consumir um longo tempo. Uma alternativa é ordenar o possível peso pelas dimensões da 

copa da planta por inspeção visual. 

Em Barnett e Moore (1997) são apresentados diversos conjuntos de dados sobre o 

crescimento da raiz da planta Arabidopsis thaliana. Neste trabalho considerou-se apenas o 

conjunto referente a pesos de raízes que cresceram em potes grandes mantidos à alta 

temperatura, cuja média foi 8,4 g e a variância 9,8 g 2 . Outra suposição é que a ordenação por 

inspeção visual é perfeita, ou seja, não existem erros de ordenação. 

O estudo de simulação foi baseado em uma amostra de conjuntos ordenados de 

tamanho 5, gerada de uma distribuição normal com média 8,4 e variância 9,8. Ou seja, a 

2 

14 


partir da geração de 5 conjuntos de tamanho 5, ordenaram-se os elementos (pesos simulados) 

em cada conjunto e tomou-se apenas o i-ésimo elemento ordenado no i-ésimo conjunto para 

compor a amostra, da qual se obteve parametricamente as amostras bootstrap de conjuntos 

ordenados perfeitamente. 

* 

Em cada uma das B = 1000 amostras bootstrap calcularam-se µ b , X b e demais 

estatísticas a fim de se encontrar os intervalos bootstrap de confiança para a média 

populacional. 

A Tabela 1 apresenta os valores estimados de µ utilizando * µ e X , seus respectivos 

erros padrão, erros padrão bootstrap e intervalos de confiança (95%) bootstrap para µ 

considerando os métodos bootstrap percentil, padrão e t-bootstrap e o parâmetro de escala 

conhecido. Sua análise revela que para essa amostra, as estatísticas relacionadas com o 

estimador linear tiveram um melhor desempenho, por exemplo, seu erro padrão e o erro 

padrão bootstrap foram ligeiramente menores que os do estimador média da amostra de 

conjuntos ordenados. O mesmo comportamento pode-se notar quanto aos intervalos de 

confiança bootstrap. 

Tabela 1 - Estimativas de µ e respectivos erro padrão, erro padrão bootstrap e intervalos de 

confiança bootstrap considerando σ conhecido 

Estatísticas 

Estimadores 

µ* X 

Estimativa 7,38 7,43 

Erro padrão 0,83 0,84 

Erro padrão bootstrap 0,79 0,80 

IC bootstrap padrão (5,84 ; 8,93) (5,86 ; 8,99) 

Amplitude 3,09 3,13 

IC bootstrap percentil (5,86 ; 8,95) (5,82 ; 9,12) 


IC t-bootstrap (5,81 ; 8,91) (5,73 ; 9,03) 


Para a situação em que σ é desconhecido, os erros padrão de 

* 

µ e X , dados como a 

raiz quadrada de (6) e (3), respectivamente, foram calculados usando as estimativas σ* e 

2 ˆ σ de σ. 

Os resultados para o cálculo dos intervalos bootstrap com σ desconhecido aparecem na 

Tabela 2. Sua análise revela que os erros padrão de µ* são maiores que os de X e, 

conseqüentemente, também os intervalos baseados em µ* tem amplitude maior que os 

baseados em X . Pode ser que esses resultados estejam relacionados com as propriedades do 

2 

estimador ˆ σ ainda não estudadas na literatura. 

Percebe-se, entretanto, que os resultados das Tabelas 1 e 2 são muito próximos para os 

métodos considerados, com exceção da amplitude do intervalo t-bootstrap (sugestão 2) que é 

maior comparada com os demais intervalos de confiança bootstrap considerados. Nesse 


caso, ao estimar σ em cada amostra bootstrap, a variação dos erros padrão de µ* e X 

aumenta em relação à situação em que considera a estimativa de σ utilizando a amostra 

original. 

Tabela 2 - Estimativas de µ e respectivos erro padrão, erro padrão bootstrap e intervalos de 

confiança bootstrap utilizando µ*, com σ estimado por σ*, e X , com σ estimado 

por 

2 ˆ σ 

Estatísticas 

Estimadores 

µ* X 

Estimativa 7,38 7,43 

Erro padrão 0,88 0,74 

Erro padrão bootstrap 0,84 0,69 

IC bootstrap padrão (5,76 ; 9,06) (6,02 ; 8,91) 


IC bootstrap percentil (5,74 ; 9,03) (6,06 ; 8,80) 


IC t-bootstrap (sugestão 1) (5,71 ; 9,01) (5,94 ; 8,83) 


IC t-bootstrap (sugestão 1) (5,23; 9,58) (5,67; 9,16) 


Como uma amostra obtida em um experimento é uma possibilidade de ocorrência 

dentre infinitas, é interessante analisar o desempenho dos métodos bootstrap propostos não 

apenas através dos resultados apresentados deste exemplo. Por esse motivo, calculou-se, por 

simulação, a probabilidade de cobertura desses intervalos considerando as situações 

apresentadas no exemplo. 

6 Verificação da probabilidade de cobertura dos intervalos de confiança 

bootstrap 

O estudo sobre a probabilidade de cobertura dos intervalos de confiança bootstrap foi 

feito através de simulação, utilizando as mesmas condições do experimento do exemplo 

descrito anteriormente, repetido 1.000 vezes. O elemento usado na análise é o número de 

intervalos que contém o verdadeiro valor do parâmetro. 

A Tabela 3 apresenta os resultados da simulação dos intervalos de confiança bootstrap 

para o parâmetro de locação considerando o parâmetro de escala conhecido, utilizando, 

respectivamente, o estimador linear e o estimador média da amostra de conjuntos ordenados. 

Quando o parâmetro de escala é conhecido, cada um dos intervalos de confiança 

bootstrap baseados, respectivamente, em µ* e X têm desempenho similar, mesmo existindo 

uma pequena diferença quanto ao número de intervalos que contém o verdadeiro valor, que 

não deve ser considerada significativa. Por exemplo, para o caso de 90% de confiança, dos 

1.000 intervalos bootstrap percentil obtidos, 877 contiveram o verdadeiro valor, ao usar µ* 

como estimador, e 878 contiveram o verdadeiro valor ao usar X como estimador. 

16 


A Tabela 4 mostra os resultados da simulação da probabilidade de cobertura quando σ é 

desconhecido. Observa-se que os intervalos de confiança t-bootstrap da sugestão 2 são os 

mais adequados, uma vez que o número de intervalos que contém o verdadeiro valor é 

sempre o mais próximo do valor esperado em cada confiança. 

Tabela 3 - Número de intervalos de confiança, entre os 1000 gerados, que contém o valor 

verdadeiro do parâmetro considerando σ conhecido 

Confiança 

90% 

95% 

99% 

Intervalos 

bootstrap percentil 

bootstrap padrão 

t-bootstrap 



t-bootstrap 



t-bootstrap 

Estimadores 

µ* 

877 

880 

879 

934 

937 

934 

988 

990 

988 

X 

878 

880 

872 

939 

941 

937 

992 

992 

992 

Tabela 4 - Número de intervalos de confiança, entre os 1.000 gerados, que contém o valor 

verdadeiro do parâmetro utilizando µ*, com σ estimado por σ*, e X , com σ 

estimado por 

2 ˆ σ 

Confiança 

90% 

95% 

99% 

Intervalos 



t-bootstrap sugestão 1 










Estimadores 

µ* 

X 

829 827 

832 826 

825 824 

885 886 

882 

883 

876 

947 

945 

947 

945 

985 

889 

890 

882 

933 

940 

941 

937 

987 

Não existe diferença significativa entre os demais métodos propostos, mostrando-se, 

inclusive, não indicados para a estimação intervalar. 

Dessa forma, pode-se dizer que a precisão de intervalos de confiança bootstrap está 

diretamente relacionada com a qualidade do estimador de σ, principalmente no método t- 

bootstrap. No procedimento de estimação intervalar para a média populacional de uma 


distribuição normal, utilizando métodos bootstrap percentil e padrão, caso σ seja 

desconhecido, sua estimativa só é necessária no processo de reamostragem paramétrica. Já 

no caso da utilização do método t-bootstrap para a mesma finalidade, o processo envolve o 

erro padrão de cada amostra bootstrap e, conseqüentemente, a estimativa de σ. Assim, ao 

considerar a sugestão 1, as estimativas do erro padrão em cada amostra bootstrap estão 

vinculadas ao valor de σ estimado a partir da amostra original. E, dependendo dessa 

estimativa, a probabilidade de cobertura pode ficar comprometida. 

Verifica-se ainda que quando σ é estimado em cada uma das amostras bootstrap 

(intervalo t-bootstrap – sugestão 2) os intervalos em cada situação tornam-se mais precisos, 

2 

mostrando que as duas formas de estimação de σ ( σˆ ou σ*) são adequadas e 

equivalentemente eficientes, pois produzem intervalos de confiança com probabilidade de 

cobertura simulada muito próxima da probabilidade de cobertura exata. 

Um fato importante a relatar, não sendo entretanto objeto deste estudo, é que o 

estimador σ* algumas vezes pode ser negativo. Quando isso ocorreu foi adotado o 

procedimento de retirar outra amostra bootstrap. 

Conclusão 

Intervalos de confiança bootstrap para a média de uma população normal utilizando o 

delineamento por conjuntos ordenados é uma alternativa atraente, uma vez que não existem 

métodos assintóticos ou mesmo exato para a estimação intervalar. A opção por um 

procedimento bootstrap paramétrico deve-se ao fato de que as estatísticas de ordem que 

compõem a amostra não são identicamente distribuídas. 

O presente estudo mostrou que a probabilidade de cobertura simulada dos diferentes 

intervalos de confiança bootstrap é bem próxima da exata na situação em que a variância é 

conhecida, sendo similares os intervalos utilizando o estimador linear ótimo e a medida 

amostral. Por outro lado, quando a variância é desconhecida, o método t-bootstrap com a 

opção de estimar σ em cada amostra bootstrap é o mais indicado. 

Agradecimentos. À CAPES pela bolsa concedida (março de 2000 a novembro de 2001) 

para o desenvolvimento deste trabalho. 

CESÁRIO, L. C.; BARRETO, M.C.M. A study on the performance of bootstrap confidence 

intervals for the mean of normal distribution using perfect ranked set sampling. Rev. Mat. 

Estat., São Paulo, v.21, n.3, p. 7-20, 2003. 

ABSTRACT: The design of ranked set sampling is an efficient estimation procedure for several 

parameters such as the population mean, the parameters of the simple linear regression model and 

the populational quantil. More recently, several authors have proposed more general estimators for 

the location parameter, for instance, the best linear unbiased estimator, using the additional 

information of the underlying distribution. On the other hand, boostrap confidence intervals are a 

computer-intensive and efficient statistical technique mainly when exact or asymptotic methods do 

not exist. In this article, we propose bootstrap confidence intervals for the mean of normal 

18 


distribution using perfect ranked set sampling. The simulation study has shown that the t-bootstrap 

confidence interval has the best performance. These results are relevant because they are the only 

actual alternative for confidence interval estimation of the location parameter using perfect ranked 

set sampling. 

KEYWORDS: Ranked set sampling; bootstrap confidence intervals; interval estimation of the 

location parameter; normal distribution. 

Referências 

BARNETT, V. Ranked set sample design for environmental investigations. Environ. Ecol. 

Stat., London, v.6, p.58-74, 1999. 

BARNETT, V.; MOORE, K. Best linear unbiased estimates in ranked-set sampling with 

particular reference to imperfect ordering. J. Appl. Stat., Abingdom, v.24, n.6, p.697-710, 

1997. 

BARRETO, M.C.M. Planejamentos eficientes em pesquisa do Meio Ambiente usando 

amostragem em conjuntos ordenados. Rev. Mat. Estat., São Paulo, v.19, p.71-84, 2001. 

CESÁRIO, L.C. Intervalos de confiança bootstrap em amostragem por conjuntos 

ordenados. 2001. 103f. Dissertação (Mestrado em Estatística) – Centro de Ciências Exatas e 

Tecnológicas, Universidade Federal de São Carlos, São Carlos, 2001. 

CHEN, Z. On ranked-set sample quantiles and their applications. J. Stat. Plan. Inf., 

Amsterdam, v.83, p.125-135, 2000. 

DAVID, H.A. Order Statistics. 2.ed. New York: John Wiley & Sons, 1981. 360p. 

DAVISON, A.C.; HINKLEY, D.V. Bootstrap methods and their application. New York: 

Cambridge University Press, 1997. 582p. 

DELL, T.R.; CUTTLER, J.L. Ranked set sampling theory whit order statistics background. 

Biometrics, Washington, v.28, p.545-555, 1972. 

EFRON, B. Bootstrap methods: another look at the jackknife. Ann. Stat., Beachood, v.7, p. 

1-26, 1979. 

EFRON, B.; TIBSHIRANI, R.J. An Introduction to the Bootstrap. New York: Chapman & 

Hall, 1993. 436p. 

McINTYRE, G.A. A method of unbiased selective sampling using ranked sets. Aust. J. 

Agric. Res., Victoria, v.3, p.385-390, 1952. 

NAHHAS, R.W.; WOLFE, D.A.; CHEN, H. Ranked set sampling: cost and optimal set size. 


PEARSON, E.S.; HARTLEY, H.O. Biometrika tables for statisticans. London: Griffin, 

1976. v.2. 

SINHA, B.K.; SINHA, B.K.; PURKAYASTHA, S. On some aspects of ranked-set sampling 

for estimation of normal and exponential parameters. Stat. Decis., München, v.14, p.223- 

240, 1996. 


STOKES, S.L. Ranked set sampling with concomitant variables. Commun. Stat.: Theory 

Meth., New York, v.36, p.35-42, 1977. 

STOKES, S.L. Estimation of variance using judgment ordered ranked set sampling. 


STOKES, S.L. Estimation of variance using judgment ordered ranked set samples. 

Biometrics, Washington , v.47, p.465-482, 1995. 

TAKAHASI, K.; WAKIMOTO, K. On unbiased estimates of the population mean based on 

the sample stratified by means of ordering. Ann. Inst. Math., Tokyo, v.20, p.1-31, 1968. 

VENABLES, W.N.; RIPLEY, B.D. Modern applied statistics with SPLUS 2. Nova York: 

Springer, 1997. 548p. 

Recebido em 05.05.2002. 

Aprovado após revisão em 23.04.2003. 

20

Artigo/Paper - UNESP

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?