Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
A1: Tamanho total <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />
- número de sítios e páginas <strong>da</strong> <strong>Web</strong><<strong>br</strong> />
Definição do indicador<<strong>br</strong> />
Total de sítios coletados sob o domínio .gov.<strong>br</strong> e de suas respectivas páginas,<<strong>br</strong> />
incluindo aquelas páginas fora do domínio .gov.<strong>br</strong>, redireciona<strong>da</strong>s a partir<<strong>br</strong> />
de <strong>um</strong> domínio .gov.<strong>br</strong>.<<strong>br</strong> />
Propósito<<strong>br</strong> />
identificar o número total de sítios e de páginas <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong> para os diferentes<<strong>br</strong> />
universos de <strong>da</strong>dos, ou seja, considerando o valor quantitativo de sítios<<strong>br</strong> />
e de páginas obtidos e aqueles que responderam de forma váli<strong>da</strong> à requisição<<strong>br</strong> />
HTTP realiza<strong>da</strong> (ou seja, tiveram <strong>um</strong> código de retorno igual a 2XX).<<strong>br</strong> />
Metodologia<<strong>br</strong> />
Execução de <strong>um</strong> crawler que percorre as páginas que satisfazem a definição<<strong>br</strong> />
anterior, a partir de <strong>um</strong> conjunto inicial de sementes forneci<strong>da</strong>s manualmente.<<strong>br</strong> />
Apresentação dos resultados<<strong>br</strong> />
As Tabelas 4.1, 4.2 e 4.3 apresentam os resultados obtidos para esse indicador,<<strong>br</strong> />
utilizando recortes incrementalmente restritos. Enquanto a Tabela 4.1<<strong>br</strong> />
considera objetos quaisquer encontrados pelo coletor durante o processo,<<strong>br</strong> />
a Tabela 4.2 limita-se ao conjunto de páginas HTML e os servidores que as<<strong>br</strong> />
contêm. Em segui<strong>da</strong>, a Tabela 4.3 restringe esse conjunto aos sítios dentro<<strong>br</strong> />
do subdomínio .gov.<strong>br</strong>.<<strong>br</strong> />
NÚMERO dE síTIOs WEB<<strong>br</strong> />
NÚMERO dE OBjETOs E síTIOs dA <strong>Web</strong><<strong>br</strong> />
NÚMERO TOTAl<<strong>br</strong> />
dE OBjETOs dA WEB<<strong>br</strong> />
NÚMERO MédIO<<strong>br</strong> />
dE OBjETOs POR síTIO<<strong>br</strong> />
18.796 7.947.607 422,84<<strong>br</strong> />
Tabela 4.1: indicador A1 - Número de objetos e sítios <strong>da</strong> <strong>Web</strong>,<<strong>br</strong> />
considerando todos os objetos encontrados pelo coletor.<<strong>br</strong> />
capítulo 4<<strong>br</strong> />
inDicaDores e universo De DaDos<<strong>br</strong> />
<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />
65