Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
34<<strong>br</strong> />
capítulo 2<<strong>br</strong> />
metoDologia<<strong>br</strong> />
<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />
Apenas d é, de fato, <strong>um</strong> <strong>da</strong>do desconhecido, pois é o provável número de<<strong>br</strong> />
sítios não coletado nas amostras em T1 e T2 [4]. Quando se compara a primeira<<strong>br</strong> />
“captura” em T1 com o resultado <strong>da</strong> “recaptura” em T2, observa-se<<strong>br</strong> />
que o erro de cobertura (d) pode ser corrigido a partir <strong>da</strong>s probabili<strong>da</strong>des<<strong>br</strong> />
conheci<strong>da</strong>s para a, b e c, ou seja, P(T1)=a+b e P(T2)=a+c, visto que a são os<<strong>br</strong> />
sítios incluídos em ambas coletas; b é composto pelos sítios coletados em<<strong>br</strong> />
T1, mas que não foram recapturados; e c são os sítios não capturados em T1,<<strong>br</strong> />
mas capturados em T2.<<strong>br</strong> />
Finalmente, a partir <strong>da</strong>s coletas sucessivas (que podem ser amplia<strong>da</strong>s para<<strong>br</strong> />
<strong>um</strong>a série temporal maior), poderemos:<<strong>br</strong> />
• Calcular o tamanho do erro de cobertura (d); como output serão<<strong>br</strong> />
defini<strong>da</strong>s “taxas de omissão”;<<strong>br</strong> />
• Estimar o tamanho <strong>da</strong> <strong>Web</strong> .<strong>br</strong> e do número de páginas vincula<strong>da</strong>s,<<strong>br</strong> />
em <strong>um</strong>a <strong>da</strong>ta específica;<<strong>br</strong> />
• Estimar tamanhos em diferentes pontos no tempo para avaliação<<strong>br</strong> />
<strong>da</strong> evolução <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong> (por exemplo, crescimento e<<strong>br</strong> />
dinâmica <strong>da</strong> estrutura e composição <strong>da</strong> <strong>Web</strong>);<<strong>br</strong> />
• Estabelecer indicadores variados, segundo as diversas <strong>características</strong><<strong>br</strong> />
de composição dos sítios e páginas <strong>da</strong> <strong>Web</strong> .<strong>br</strong>.<<strong>br</strong> />
Aplicação<<strong>br</strong> />
Em res<strong>um</strong>o, até esse momento discutiram-se as possibili<strong>da</strong>des reais para<<strong>br</strong> />
replicação de <strong>um</strong> censo demográfico so<strong>br</strong>e a população de domínios .<strong>br</strong>.<<strong>br</strong> />
Como já se ressaltou, a realização efetiva de <strong>um</strong>a contagem/en<strong>um</strong>eração populacional<<strong>br</strong> />
que permita estimar o tamanho e composição <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />
implica <strong>um</strong>a metodologia não trivial, e que ain<strong>da</strong> está em desenvolvimento<<strong>br</strong> />
para consoli<strong>da</strong>ção.<<strong>br</strong> />
Nesse primeiro esforço, desenvolvem-se as aplicações necessárias para determinação<<strong>br</strong> />
do quadro populacional a ser trabalhado (domínios .<strong>br</strong> e seus<<strong>br</strong> />
objetos vinculados), as técnicas apropria<strong>da</strong>s de coleta e vali<strong>da</strong>ção dos procedimentos<<strong>br</strong> />
e informações coleta<strong>da</strong>s, bem como a metodologia adequa<strong>da</strong><<strong>br</strong> />
para análise e aferição do tamanho <strong>da</strong> <strong>Web</strong> .<strong>br</strong>.<<strong>br</strong> />
Para se atingirem os objetivos traçados inicialmente, foi preciso redefinir<<strong>br</strong> />
os procedimentos e orientações do <strong>estudo</strong>, experimentalmente aplicados