12.04.2013 Views

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

Dimensões e características da Web brasileira: um estudo ... - CGI.br

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

48<<strong>br</strong> />

capítulo 3<<strong>br</strong> />

análise Dos resultaDos<<strong>br</strong> />

<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />

em bytes em relação aos seus sítios. De outro, o Estado de Paraná (PR), que<<strong>br</strong> />

apresenta maior quanti<strong>da</strong>de de sítios em números absolutos e relativos à<<strong>br</strong> />

participação no total <strong>da</strong> <strong>Web</strong> governamental <strong><strong>br</strong>asileira</strong>. investigar as razões<<strong>br</strong> />

pode mais do que demonstrar existir quanti<strong>da</strong>de de domínios governamentais<<strong>br</strong> />

na <strong>Web</strong> sem conteúdos significativos, ou ain<strong>da</strong> domínios governamentais<<strong>br</strong> />

com conteúdo excessivo, revelando <strong>um</strong>a dificul<strong>da</strong>de no acesso à informação<<strong>br</strong> />

relevante e pública.<<strong>br</strong> />

Outros idiomas na <strong>Web</strong> governamental<<strong>br</strong> />

Das 3.182.202 páginas que puderam ter seu idioma identificado através de<<strong>br</strong> />

análise automatiza<strong>da</strong>, 97% estão em português. O software utilizado para<<strong>br</strong> />

identificar a linguagem compara o texto contido nas páginas com dicionários<<strong>br</strong> />

com palavras-chave dos idiomas português, inglês, espanhol e francês,<<strong>br</strong> />

contabilizando as palavras que aparecem n<strong>um</strong> determinado doc<strong>um</strong>ento.<<strong>br</strong> />

Caso o número de palavras-chave de <strong>um</strong> dos idiomas testados ultrapasse<<strong>br</strong> />

<strong>um</strong> determinado limite inferior, e não haja ambigui<strong>da</strong>de (mais de <strong>um</strong> idioma<<strong>br</strong> />

com palavras-chave suficientes), ele é considerado identificado. Os resultados<<strong>br</strong> />

para os idiomas estrangeiros estão ilustrados na Figura 3.3.<<strong>br</strong> />

Figura 3.3 – Outros idiomas encontrados na <strong>Web</strong> governamental<<strong>br</strong> />

É importante lem<strong>br</strong>ar ain<strong>da</strong> que em 47% <strong>da</strong>s 6,3 milhões de páginas em<<strong>br</strong> />

HTML coleta<strong>da</strong>s o idioma não pode ser identificado por meio do procedimento<<strong>br</strong> />

utilizado. A amostra é significativa e pode revelar que essencialmente<<strong>br</strong> />

os conteúdos <strong>da</strong> <strong>Web</strong> governamental <strong><strong>br</strong>asileira</strong> visam atender ao público<<strong>br</strong> />

interno, tendo pouca quanti<strong>da</strong>de de informação em outros idiomas.<<strong>br</strong> />

Por outro lado, sem <strong>um</strong>a abor<strong>da</strong>gem semântica não é possível verificar<<strong>br</strong> />

se informações relevantes em outros idiomas são oportunas, sejam, por<<strong>br</strong> />

exemplo, para conteúdo de relações exteriores ou para os fins de turismo.<<strong>br</strong> />

identificar qual informação pôde e convém estar em outro idioma não foi<<strong>br</strong> />

ain<strong>da</strong> objeto de análise.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!