Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
64<<strong>br</strong> />
capítulo 4<<strong>br</strong> />
inDicaDores e universo De DaDos<<strong>br</strong> />
<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />
H1: i<strong>da</strong>de (ultima atualização) média <strong>da</strong>s páginas <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />
H2: Proporção de páginas dinâmicas na <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />
I1: informação so<strong>br</strong>e sincronização de tempo dos servidores <strong>da</strong> <strong>Web</strong> <strong>br</strong>a-<<strong>br</strong> />
sileira<<strong>br</strong> />
I2: informação so<strong>br</strong>e tempo de resposta médio dos servidores <strong>da</strong> <strong>Web</strong> <strong>br</strong>a-<<strong>br</strong> />
sileira<<strong>br</strong> />
Nesse projeto, são variáveis vincula<strong>da</strong>s à grandeza a ser medi<strong>da</strong> (domínio):<<strong>br</strong> />
• URL (Uniform Resource Locator): URL é <strong>um</strong> string com pacto, definido<<strong>br</strong> />
por padrões do W3C que indica a localização de <strong>um</strong> recurso disponível<<strong>br</strong> />
na internet. Todos os arquivos disponíveis na <strong>Web</strong> e doc<strong>um</strong>entos gerados<<strong>br</strong> />
dinamica mente são capturados via <strong>um</strong>a URL. Os doc<strong>um</strong>entos <strong>da</strong> <strong>Web</strong> são<<strong>br</strong> />
identificados pelo substring http:// no início <strong>da</strong> URL.<<strong>br</strong> />
• Página <strong>da</strong> <strong>Web</strong> (Doc<strong>um</strong>ento HTML): <strong>um</strong>a página <strong>da</strong> <strong>Web</strong> é <strong>um</strong> recurso<<strong>br</strong> />
escrito na linguagem HTML. Uma página pode conter links para outros<<strong>br</strong> />
tipos de recursos, tais como arquivos pdf, arquivos de imagens e recursos<<strong>br</strong> />
que disparam a execução de programas com parâmetros específicos e<<strong>br</strong> />
que geram páginas dinâmicas.<<strong>br</strong> />
• Sítio <strong>Web</strong>: é o conjunto de <strong>um</strong>a ou mais URLs associa<strong>da</strong>s a <strong>um</strong> determinado<<strong>br</strong> />
domínio.<<strong>br</strong> />
Temos os seguintes universos de <strong>da</strong>dos nesse projeto:<<strong>br</strong> />
• Universo de sítios <strong>da</strong> <strong>Web</strong>: todos os sítios encontrados na coleta de <strong>da</strong>dos,<<strong>br</strong> />
independente de terem ou não <strong>um</strong>a ou mais páginas HTML váli<strong>da</strong>s.<<strong>br</strong> />
• Universo de sítios <strong>da</strong> <strong>Web</strong> com páginas HTML váli<strong>da</strong>s: existe pelo menos<<strong>br</strong> />
<strong>um</strong>a página <strong>da</strong> <strong>Web</strong> váli<strong>da</strong>, ou seja, obti<strong>da</strong> com sucesso (código httpstatus<<strong>br</strong> />
igual a 2XX).<<strong>br</strong> />
• Universo de Páginas HTML váli<strong>da</strong>s: universo de páginas HTML requisita<strong>da</strong>s<<strong>br</strong> />
e obti<strong>da</strong>s com sucesso (código http-status igual a 2XX).<<strong>br</strong> />
Existem indicadores relacionados a apenas <strong>um</strong> universo; outros, a mais de<<strong>br</strong> />
<strong>um</strong>. No caso dos indicadores gerais de tamanho <strong>da</strong> <strong>Web</strong>, são gerais, sem vínculo<<strong>br</strong> />
a <strong>um</strong> ou outro universo. Os indicadores serão apresentados divididos<<strong>br</strong> />
de acordo com o universo ao qual pertencem.<<strong>br</strong> />
As subseções a seguir apresentam a avaliação de ca<strong>da</strong> <strong>um</strong> dos indicadores<<strong>br</strong> />
para a coleta de domínios .gov.<strong>br</strong>.