12.04.2013 Views

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

A1: Tamanho total <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />

- número de sítios e páginas <strong>da</strong> <strong>Web</strong><<strong>br</strong> />

Definição do indicador<<strong>br</strong> />

Total de sítios coletados sob o domínio .gov.<strong>br</strong> e de suas respectivas páginas,<<strong>br</strong> />

incluindo aquelas páginas fora do domínio .gov.<strong>br</strong>, redireciona<strong>da</strong>s a partir<<strong>br</strong> />

de <strong>um</strong> domínio .gov.<strong>br</strong>.<<strong>br</strong> />

Propósito<<strong>br</strong> />

identificar o número total de sítios e de páginas <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong> para os diferentes<<strong>br</strong> />

universos de <strong>da</strong>dos, ou seja, considerando o valor quantitativo de sítios<<strong>br</strong> />

e de páginas obtidos e aqueles que responderam de forma váli<strong>da</strong> à requisição<<strong>br</strong> />

HTTP realiza<strong>da</strong> (ou seja, tiveram <strong>um</strong> código de retorno igual a 2XX).<<strong>br</strong> />

Metodologia<<strong>br</strong> />

Execução de <strong>um</strong> crawler que percorre as páginas que satisfazem a definição<<strong>br</strong> />

anterior, a partir de <strong>um</strong> conjunto inicial de sementes forneci<strong>da</strong>s manualmente.<<strong>br</strong> />

Apresentação dos resultados<<strong>br</strong> />

As Tabelas 4.1, 4.2 e 4.3 apresentam os resultados obtidos para esse indicador,<<strong>br</strong> />

utilizando recortes incrementalmente restritos. Enquanto a Tabela 4.1<<strong>br</strong> />

considera objetos quaisquer encontrados pelo coletor durante o processo,<<strong>br</strong> />

a Tabela 4.2 limita-se ao conjunto de páginas HTML e os servidores que as<<strong>br</strong> />

contêm. Em segui<strong>da</strong>, a Tabela 4.3 restringe esse conjunto aos sítios dentro<<strong>br</strong> />

do subdomínio .gov.<strong>br</strong>.<<strong>br</strong> />

NÚMERO dE síTIOs WEB<<strong>br</strong> />

NÚMERO dE OBjETOs E síTIOs dA <strong>Web</strong><<strong>br</strong> />

NÚMERO TOTAl<<strong>br</strong> />

dE OBjETOs dA WEB<<strong>br</strong> />

NÚMERO MédIO<<strong>br</strong> />

dE OBjETOs POR síTIO<<strong>br</strong> />

18.796 7.947.607 422,84<<strong>br</strong> />

Tabela 4.1: indicador A1 - Número de objetos e sítios <strong>da</strong> <strong>Web</strong>,<<strong>br</strong> />

considerando todos os objetos encontrados pelo coletor.<<strong>br</strong> />

capítulo 4<<strong>br</strong> />

inDicaDores e universo De DaDos<<strong>br</strong> />

<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />

65

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!