12.04.2013 Views

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

64<<strong>br</strong> />

capítulo 4<<strong>br</strong> />

inDicaDores e universo De DaDos<<strong>br</strong> />

<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />

H1: i<strong>da</strong>de (ultima atualização) média <strong>da</strong>s páginas <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />

H2: Proporção de páginas dinâmicas na <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />

I1: informação so<strong>br</strong>e sincronização de tempo dos servidores <strong>da</strong> <strong>Web</strong> <strong>br</strong>a-<<strong>br</strong> />

sileira<<strong>br</strong> />

I2: informação so<strong>br</strong>e tempo de resposta médio dos servidores <strong>da</strong> <strong>Web</strong> <strong>br</strong>a-<<strong>br</strong> />

sileira<<strong>br</strong> />

Nesse projeto, são variáveis vincula<strong>da</strong>s à grandeza a ser medi<strong>da</strong> (domínio):<<strong>br</strong> />

• URL (Uniform Resource Locator): URL é <strong>um</strong> string com pacto, definido<<strong>br</strong> />

por padrões do W3C que indica a localização de <strong>um</strong> recurso disponível<<strong>br</strong> />

na internet. Todos os arquivos disponíveis na <strong>Web</strong> e doc<strong>um</strong>entos gerados<<strong>br</strong> />

dinamica mente são capturados via <strong>um</strong>a URL. Os doc<strong>um</strong>entos <strong>da</strong> <strong>Web</strong> são<<strong>br</strong> />

identificados pelo substring http:// no início <strong>da</strong> URL.<<strong>br</strong> />

• Página <strong>da</strong> <strong>Web</strong> (Doc<strong>um</strong>ento HTML): <strong>um</strong>a página <strong>da</strong> <strong>Web</strong> é <strong>um</strong> recurso<<strong>br</strong> />

escrito na linguagem HTML. Uma página pode conter links para outros<<strong>br</strong> />

tipos de recursos, tais como arquivos pdf, arquivos de imagens e recursos<<strong>br</strong> />

que disparam a execução de programas com parâmetros específicos e<<strong>br</strong> />

que geram páginas dinâmicas.<<strong>br</strong> />

• Sítio <strong>Web</strong>: é o conjunto de <strong>um</strong>a ou mais URLs associa<strong>da</strong>s a <strong>um</strong> determinado<<strong>br</strong> />

domínio.<<strong>br</strong> />

Temos os seguintes universos de <strong>da</strong>dos nesse projeto:<<strong>br</strong> />

• Universo de sítios <strong>da</strong> <strong>Web</strong>: todos os sítios encontrados na coleta de <strong>da</strong>dos,<<strong>br</strong> />

independente de terem ou não <strong>um</strong>a ou mais páginas HTML váli<strong>da</strong>s.<<strong>br</strong> />

• Universo de sítios <strong>da</strong> <strong>Web</strong> com páginas HTML váli<strong>da</strong>s: existe pelo menos<<strong>br</strong> />

<strong>um</strong>a página <strong>da</strong> <strong>Web</strong> váli<strong>da</strong>, ou seja, obti<strong>da</strong> com sucesso (código httpstatus<<strong>br</strong> />

igual a 2XX).<<strong>br</strong> />

• Universo de Páginas HTML váli<strong>da</strong>s: universo de páginas HTML requisita<strong>da</strong>s<<strong>br</strong> />

e obti<strong>da</strong>s com sucesso (código http-status igual a 2XX).<<strong>br</strong> />

Existem indicadores relacionados a apenas <strong>um</strong> universo; outros, a mais de<<strong>br</strong> />

<strong>um</strong>. No caso dos indicadores gerais de tamanho <strong>da</strong> <strong>Web</strong>, são gerais, sem vínculo<<strong>br</strong> />

a <strong>um</strong> ou outro universo. Os indicadores serão apresentados divididos<<strong>br</strong> />

de acordo com o universo ao qual pertencem.<<strong>br</strong> />

As subseções a seguir apresentam a avaliação de ca<strong>da</strong> <strong>um</strong> dos indicadores<<strong>br</strong> />

para a coleta de domínios .gov.<strong>br</strong>.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!