12.04.2013 Views

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

à coleta restrita dos domí nios .gov.<strong>br</strong>. A partir dessa primeira experiência,<<strong>br</strong> />

testaram-se alguns procedimentos para estimativa do tamanho populacional<<strong>br</strong> />

<strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong> sob os domínios .gov.<strong>br</strong>.<<strong>br</strong> />

Nesse primeiro momento, o objetivo restringe-se à tentativa de aplicação,<<strong>br</strong> />

avaliação e vali<strong>da</strong>ção dos procedimentos metodológicos pré-definidos. A<<strong>br</strong> />

seguir, descreve-se seu “passo-a-passo”:<<strong>br</strong> />

Definição <strong>da</strong> pergunta e os <strong>da</strong>dos<<strong>br</strong> />

para respondê-la<<strong>br</strong> />

Primeiro, o objetivo é definir <strong>um</strong>a estimativa para o tamanho <strong>da</strong> parte <strong>da</strong><<strong>br</strong> />

<strong>Web</strong> .<strong>br</strong> sob o domínio .gov.<strong>br</strong>. Para tal, utilizaram-se as informações so<strong>br</strong>e o<<strong>br</strong> />

número de sítios (.gov.<strong>br</strong>) coletados em dois momentos distintos, bem como<<strong>br</strong> />

o número de páginas referi<strong>da</strong>s ao conjunto de sítios coletados.<<strong>br</strong> />

Portanto, há duas variáveis básicas: 1) número de sítios .gov.<strong>br</strong>, e 2) número<<strong>br</strong> />

de páginas vincula<strong>da</strong>s aos sítios coletados.<<strong>br</strong> />

Em segundo lugar, como a coleta do .gov.<strong>br</strong> foi feita em dois momentos distintos<<strong>br</strong> />

(T1 e T2), a que o número de sítios e páginas diz respeito. Como forma<<strong>br</strong> />

de se garantir a aplicação do método de “captura-recaptura” para estimar<<strong>br</strong> />

o tama nho <strong>da</strong> <strong>Web</strong> .gov.<strong>br</strong>, as duas coletas feitas em T1 e T2 satisfazem os<<strong>br</strong> />

requisitos necessários (independência <strong>da</strong>s coletas, e garantia do lançamento<<strong>br</strong> />

aleatório <strong>da</strong>s sementes).<<strong>br</strong> />

Breve descrição <strong>da</strong> metodologia<<strong>br</strong> />

O método conhecido como Dual System Estimation (DSE) – aqui tratado<<strong>br</strong> />

como método de “captura-recaptura” – é com<strong>um</strong>ente utilizado pelos institutos<<strong>br</strong> />

nacionais de estatísticas de população, especialmente para conferência<<strong>br</strong> />

(checagem) <strong>da</strong> quali<strong>da</strong>de censitária [7, 1].<<strong>br</strong> />

As estimativas so<strong>br</strong>e o tamanho <strong>da</strong> população derivam de relações matemáticas<<strong>br</strong> />

e de esta tísticas elementares, desde que alguns pressupostos fun<strong>da</strong>mentais<<strong>br</strong> />

sejam observados: inde pendência <strong>da</strong>s coletas, distribuição aleatória dos<<strong>br</strong> />

objetos na população e a mesma chance aleatória de o objeto ser coletado<<strong>br</strong> />

em to<strong>da</strong>s as coletas. Claramente, alguns desses pressupostos não são ob-<<strong>br</strong> />

capítulo 2<<strong>br</strong> />

metoDologia<<strong>br</strong> />

<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />

35

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!