Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
80<<strong>br</strong> />
capítulo 4<<strong>br</strong> />
inDicaDores e universo De DaDos<<strong>br</strong> />
<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />
G2: Proporção de tipos de tecnologias<<strong>br</strong> />
usa<strong>da</strong>s nas páginas <strong>da</strong> <strong>Web</strong> - percentual<<strong>br</strong> />
por tipo de tecnologia<<strong>br</strong> />
Definição do indicador<<strong>br</strong> />
Valor percentual dos tipos de tecnologias usa<strong>da</strong>s nas páginas <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />
“.<strong>br</strong>”.<<strong>br</strong> />
Propósito<<strong>br</strong> />
Obter <strong>um</strong>a distribuição dos tipos de linguagens usa<strong>da</strong>s nas páginas <strong>da</strong> <strong>Web</strong><<strong>br</strong> />
<strong><strong>br</strong>asileira</strong> “.<strong>br</strong>”, de acordo com <strong>um</strong>a lista de valores pré-determinados (PHP,<<strong>br</strong> />
ASP, ASPX, JSF, JSP, etc.).<<strong>br</strong> />
Metodologia<<strong>br</strong> />
A determinação de tecnologias usa<strong>da</strong>s é <strong>um</strong> desafio, porque <strong>um</strong>a página<<strong>br</strong> />
coleta<strong>da</strong> não pos sui o<strong>br</strong>igatoriamente informações so<strong>br</strong>e a tecnologia que a<<strong>br</strong> />
gerou. Uma opção adota<strong>da</strong> foi se basear nas eventuais extensões de arquivo<<strong>br</strong> />
presentes na URL.<<strong>br</strong> />
Para determinar as tecnologias, partiu-se de <strong>um</strong> dicionário de 406 extensões<<strong>br</strong> />
de arquivos e processamos o arquivo de páginas váli<strong>da</strong>s (OK), verificando<<strong>br</strong> />
em ca<strong>da</strong> URL lista<strong>da</strong> naquele arquivo a ocorrência de <strong>um</strong>a extensão váli<strong>da</strong>.<<strong>br</strong> />
Uma extensão váli<strong>da</strong> deve ocorrer antes <strong>da</strong> primeira “?” <strong>da</strong> URL e a partir <strong>da</strong><<strong>br</strong> />
ultima “/” que antecede essa “?”´ . O processo verifica então, por casamento<<strong>br</strong> />
de padrões, a ocorrência <strong>da</strong>s extensões na cadeia delimita<strong>da</strong> por “/” e “?”<<strong>br</strong> />
<strong>da</strong> URL. Para extensões que tenham o mesmo radical (p.ex., asp e aspx),<<strong>br</strong> />
considera-se a mais longa.<<strong>br</strong> />
O ponto de parti<strong>da</strong> <strong>da</strong> metodologia foi apurar quais as possíveis extensões,<<strong>br</strong> />
como medi<strong>da</strong> <strong>da</strong>s tecnologias utiliza<strong>da</strong>s. Nesse caso, buscou-se <strong>um</strong>a lista de<<strong>br</strong> />
406 extensões de arquivos, a partir do sítio http://www.file-extensions.org.<<strong>br</strong> />
Com base nessas extensões, analisou-se a URL de ca<strong>da</strong> página coleta<strong>da</strong>, de<<strong>br</strong> />
forma a identificar quais extensões ocorriam na URL.<<strong>br</strong> />
Feita a identificação de extensões, há três casos possíveis. O primeiro caso:<<strong>br</strong> />
nenh<strong>um</strong>a extensão encontra<strong>da</strong> na URL, o que impede estimar qual a tecnologia<<strong>br</strong> />
utiliza<strong>da</strong>. O segundo caso: há exatamente <strong>um</strong>a extensão, caso no qual<<strong>br</strong> />
a tecnologia, se for o caso, é associa<strong>da</strong> diretamente. O terceiro caso: mais