12.04.2013 Views

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

34<<strong>br</strong> />

capítulo 2<<strong>br</strong> />

metoDologia<<strong>br</strong> />

<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />

Apenas d é, de fato, <strong>um</strong> <strong>da</strong>do desconhecido, pois é o provável número de<<strong>br</strong> />

sítios não coletado nas amostras em T1 e T2 [4]. Quando se compara a primeira<<strong>br</strong> />

“captura” em T1 com o resultado <strong>da</strong> “recaptura” em T2, observa-se<<strong>br</strong> />

que o erro de cobertura (d) pode ser corrigido a partir <strong>da</strong>s probabili<strong>da</strong>des<<strong>br</strong> />

conheci<strong>da</strong>s para a, b e c, ou seja, P(T1)=a+b e P(T2)=a+c, visto que a são os<<strong>br</strong> />

sítios incluídos em ambas coletas; b é composto pelos sítios coletados em<<strong>br</strong> />

T1, mas que não foram recapturados; e c são os sítios não capturados em T1,<<strong>br</strong> />

mas capturados em T2.<<strong>br</strong> />

Finalmente, a partir <strong>da</strong>s coletas sucessivas (que podem ser amplia<strong>da</strong>s para<<strong>br</strong> />

<strong>um</strong>a série temporal maior), poderemos:<<strong>br</strong> />

• Calcular o tamanho do erro de cobertura (d); como output serão<<strong>br</strong> />

defini<strong>da</strong>s “taxas de omissão”;<<strong>br</strong> />

• Estimar o tamanho <strong>da</strong> <strong>Web</strong> .<strong>br</strong> e do número de páginas vincula<strong>da</strong>s,<<strong>br</strong> />

em <strong>um</strong>a <strong>da</strong>ta específica;<<strong>br</strong> />

• Estimar tamanhos em diferentes pontos no tempo para avaliação<<strong>br</strong> />

<strong>da</strong> evolução <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong> (por exemplo, crescimento e<<strong>br</strong> />

dinâmica <strong>da</strong> estrutura e composição <strong>da</strong> <strong>Web</strong>);<<strong>br</strong> />

• Estabelecer indicadores variados, segundo as diversas <strong>características</strong><<strong>br</strong> />

de composição dos sítios e páginas <strong>da</strong> <strong>Web</strong> .<strong>br</strong>.<<strong>br</strong> />

Aplicação<<strong>br</strong> />

Em res<strong>um</strong>o, até esse momento discutiram-se as possibili<strong>da</strong>des reais para<<strong>br</strong> />

replicação de <strong>um</strong> censo demográfico so<strong>br</strong>e a população de domínios .<strong>br</strong>.<<strong>br</strong> />

Como já se ressaltou, a realização efetiva de <strong>um</strong>a contagem/en<strong>um</strong>eração populacional<<strong>br</strong> />

que permita estimar o tamanho e composição <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />

implica <strong>um</strong>a metodologia não trivial, e que ain<strong>da</strong> está em desenvolvimento<<strong>br</strong> />

para consoli<strong>da</strong>ção.<<strong>br</strong> />

Nesse primeiro esforço, desenvolvem-se as aplicações necessárias para determinação<<strong>br</strong> />

do quadro populacional a ser trabalhado (domínios .<strong>br</strong> e seus<<strong>br</strong> />

objetos vinculados), as técnicas apropria<strong>da</strong>s de coleta e vali<strong>da</strong>ção dos procedimentos<<strong>br</strong> />

e informações coleta<strong>da</strong>s, bem como a metodologia adequa<strong>da</strong><<strong>br</strong> />

para análise e aferição do tamanho <strong>da</strong> <strong>Web</strong> .<strong>br</strong>.<<strong>br</strong> />

Para se atingirem os objetivos traçados inicialmente, foi preciso redefinir<<strong>br</strong> />

os procedimentos e orientações do <strong>estudo</strong>, experimentalmente aplicados

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!