12.04.2013 Views

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

80<<strong>br</strong> />

capítulo 4<<strong>br</strong> />

inDicaDores e universo De DaDos<<strong>br</strong> />

<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />

G2: Proporção de tipos de tecnologias<<strong>br</strong> />

usa<strong>da</strong>s nas páginas <strong>da</strong> <strong>Web</strong> - percentual<<strong>br</strong> />

por tipo de tecnologia<<strong>br</strong> />

Definição do indicador<<strong>br</strong> />

Valor percentual dos tipos de tecnologias usa<strong>da</strong>s nas páginas <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong><<strong>br</strong> />

“.<strong>br</strong>”.<<strong>br</strong> />

Propósito<<strong>br</strong> />

Obter <strong>um</strong>a distribuição dos tipos de linguagens usa<strong>da</strong>s nas páginas <strong>da</strong> <strong>Web</strong><<strong>br</strong> />

<strong><strong>br</strong>asileira</strong> “.<strong>br</strong>”, de acordo com <strong>um</strong>a lista de valores pré-determinados (PHP,<<strong>br</strong> />

ASP, ASPX, JSF, JSP, etc.).<<strong>br</strong> />

Metodologia<<strong>br</strong> />

A determinação de tecnologias usa<strong>da</strong>s é <strong>um</strong> desafio, porque <strong>um</strong>a página<<strong>br</strong> />

coleta<strong>da</strong> não pos sui o<strong>br</strong>igatoriamente informações so<strong>br</strong>e a tecnologia que a<<strong>br</strong> />

gerou. Uma opção adota<strong>da</strong> foi se basear nas eventuais extensões de arquivo<<strong>br</strong> />

presentes na URL.<<strong>br</strong> />

Para determinar as tecnologias, partiu-se de <strong>um</strong> dicionário de 406 extensões<<strong>br</strong> />

de arquivos e processamos o arquivo de páginas váli<strong>da</strong>s (OK), verificando<<strong>br</strong> />

em ca<strong>da</strong> URL lista<strong>da</strong> naquele arquivo a ocorrência de <strong>um</strong>a extensão váli<strong>da</strong>.<<strong>br</strong> />

Uma extensão váli<strong>da</strong> deve ocorrer antes <strong>da</strong> primeira “?” <strong>da</strong> URL e a partir <strong>da</strong><<strong>br</strong> />

ultima “/” que antecede essa “?”´ . O processo verifica então, por casamento<<strong>br</strong> />

de padrões, a ocorrência <strong>da</strong>s extensões na cadeia delimita<strong>da</strong> por “/” e “?”<<strong>br</strong> />

<strong>da</strong> URL. Para extensões que tenham o mesmo radical (p.ex., asp e aspx),<<strong>br</strong> />

considera-se a mais longa.<<strong>br</strong> />

O ponto de parti<strong>da</strong> <strong>da</strong> metodologia foi apurar quais as possíveis extensões,<<strong>br</strong> />

como medi<strong>da</strong> <strong>da</strong>s tecnologias utiliza<strong>da</strong>s. Nesse caso, buscou-se <strong>um</strong>a lista de<<strong>br</strong> />

406 extensões de arquivos, a partir do sítio http://www.file-extensions.org.<<strong>br</strong> />

Com base nessas extensões, analisou-se a URL de ca<strong>da</strong> página coleta<strong>da</strong>, de<<strong>br</strong> />

forma a identificar quais extensões ocorriam na URL.<<strong>br</strong> />

Feita a identificação de extensões, há três casos possíveis. O primeiro caso:<<strong>br</strong> />

nenh<strong>um</strong>a extensão encontra<strong>da</strong> na URL, o que impede estimar qual a tecnologia<<strong>br</strong> />

utiliza<strong>da</strong>. O segundo caso: há exatamente <strong>um</strong>a extensão, caso no qual<<strong>br</strong> />

a tecnologia, se for o caso, é associa<strong>da</strong> diretamente. O terceiro caso: mais

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!