Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
deve-se garantir a independência em relação ao lan çamento <strong>da</strong>s sementes<<strong>br</strong> />
e do batedor (ferramenta de contagem), a partir de <strong>um</strong>a mesma lista de domínios.<<strong>br</strong> />
Nesse momento, desenvolve-se <strong>um</strong>a nova metodologia para vali<strong>da</strong>r<<strong>br</strong> />
os <strong>da</strong>dos <strong>da</strong> coleta, visando <strong>um</strong>a estimativa <strong>da</strong> cobertura censitária, considerando<<strong>br</strong> />
informações relaciona<strong>da</strong>s às quanti<strong>da</strong>des de domínios registrados<<strong>br</strong> />
(nesse caso, especificamente, aqueles re gistrados com domínios do “gov.<<strong>br</strong> />
<strong>br</strong>”), erros retornados no procedimento de coleta de <strong>da</strong>dos e indicadores<<strong>br</strong> />
relacionados ao contexto <strong>da</strong> <strong>Web</strong>, como crescimento do vol<strong>um</strong>e de domínios<<strong>br</strong> />
registrados, modificação do tamanho de objetos informacionais, dentre<<strong>br</strong> />
outros. Esses resul tados poderão ser acompanhados mais adiante, na seção<<strong>br</strong> />
de apresentação de resultados e desdo<strong>br</strong>amentos.<<strong>br</strong> />
Como se trata de algo novo, a proposta é a evolução <strong>da</strong> metodologia a ser<<strong>br</strong> />
adota<strong>da</strong> com o tempo, a partir de novas coletas realiza<strong>da</strong>s e novas técnicas<<strong>br</strong> />
propostas para tratar <strong>um</strong> censo de objetos <strong>da</strong> <strong>Web</strong>.<<strong>br</strong> />
A seguir, descrever-se-á <strong>br</strong>evemente o método de estimação <strong>da</strong> cobertura<<strong>br</strong> />
censitária e do seu grau de acui<strong>da</strong>de. O método utilizado para cálculo<<strong>br</strong> />
dos indicadores de “omissão” (erro de cobertura) será o Dual System Estimation,<<strong>br</strong> />
que se baseia nas técnicas de “captura-recaptura”. Sua utilização<<strong>br</strong> />
requer independência na coleta <strong>da</strong>s duas pesquisas (coletas em T1 e T2) e<<strong>br</strong> />
pressupõe o confronto <strong>da</strong>s informações <strong>da</strong> seguinte maneira (ilustra<strong>da</strong> na<<strong>br</strong> />
Tabela 2.1), onde:<<strong>br</strong> />
a é o número de uni<strong>da</strong>des incluí<strong>da</strong>s em T1 e T2;<<strong>br</strong> />
b é o número de uni<strong>da</strong>des incluí<strong>da</strong>s apenas em T1;<<strong>br</strong> />
c é o número de uni<strong>da</strong>des incluí<strong>da</strong>s apenas em T2;<<strong>br</strong> />
d é o número de uni<strong>da</strong>des desconheci<strong>da</strong>s que não foram<<strong>br</strong> />
incluí<strong>da</strong>s nem em T1 nem em T2 (desconhecido) e;<<strong>br</strong> />
t é o total de uni<strong>da</strong>des <strong>da</strong> população.<<strong>br</strong> />
COlETA T1<<strong>br</strong> />
TOTAl<<strong>br</strong> />
COlETA T2<<strong>br</strong> />
UNIdAdEs<<strong>br</strong> />
INClUídAs<<strong>br</strong> />
UNIdAdEs<<strong>br</strong> />
NãO INClUídAs<<strong>br</strong> />
TOTAl t a + c b + d<<strong>br</strong> />
UNIdAdEs<<strong>br</strong> />
INClUídAs<<strong>br</strong> />
UNIdAdEs<<strong>br</strong> />
NãO INClUídAs<<strong>br</strong> />
a + b a b<<strong>br</strong> />
c + d c d<<strong>br</strong> />
Tabela 2.1: Tabela de informações “Captura-Recaptura”<<strong>br</strong> />
capítulo 2<<strong>br</strong> />
metoDologia<<strong>br</strong> />
<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />
33