Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Dimensões e características da Web brasileira: um estudo ... - CGI.br
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
48<<strong>br</strong> />
capítulo 3<<strong>br</strong> />
análise Dos resultaDos<<strong>br</strong> />
<strong>Dimensões</strong> e <strong>características</strong> <strong>da</strong> <strong>Web</strong> <strong><strong>br</strong>asileira</strong>: <strong>um</strong> <strong>estudo</strong> do .gov.<strong>br</strong><<strong>br</strong> />
em bytes em relação aos seus sítios. De outro, o Estado de Paraná (PR), que<<strong>br</strong> />
apresenta maior quanti<strong>da</strong>de de sítios em números absolutos e relativos à<<strong>br</strong> />
participação no total <strong>da</strong> <strong>Web</strong> governamental <strong><strong>br</strong>asileira</strong>. investigar as razões<<strong>br</strong> />
pode mais do que demonstrar existir quanti<strong>da</strong>de de domínios governamentais<<strong>br</strong> />
na <strong>Web</strong> sem conteúdos significativos, ou ain<strong>da</strong> domínios governamentais<<strong>br</strong> />
com conteúdo excessivo, revelando <strong>um</strong>a dificul<strong>da</strong>de no acesso à informação<<strong>br</strong> />
relevante e pública.<<strong>br</strong> />
Outros idiomas na <strong>Web</strong> governamental<<strong>br</strong> />
Das 3.182.202 páginas que puderam ter seu idioma identificado através de<<strong>br</strong> />
análise automatiza<strong>da</strong>, 97% estão em português. O software utilizado para<<strong>br</strong> />
identificar a linguagem compara o texto contido nas páginas com dicionários<<strong>br</strong> />
com palavras-chave dos idiomas português, inglês, espanhol e francês,<<strong>br</strong> />
contabilizando as palavras que aparecem n<strong>um</strong> determinado doc<strong>um</strong>ento.<<strong>br</strong> />
Caso o número de palavras-chave de <strong>um</strong> dos idiomas testados ultrapasse<<strong>br</strong> />
<strong>um</strong> determinado limite inferior, e não haja ambigui<strong>da</strong>de (mais de <strong>um</strong> idioma<<strong>br</strong> />
com palavras-chave suficientes), ele é considerado identificado. Os resultados<<strong>br</strong> />
para os idiomas estrangeiros estão ilustrados na Figura 3.3.<<strong>br</strong> />
Figura 3.3 – Outros idiomas encontrados na <strong>Web</strong> governamental<<strong>br</strong> />
É importante lem<strong>br</strong>ar ain<strong>da</strong> que em 47% <strong>da</strong>s 6,3 milhões de páginas em<<strong>br</strong> />
HTML coleta<strong>da</strong>s o idioma não pode ser identificado por meio do procedimento<<strong>br</strong> />
utilizado. A amostra é significativa e pode revelar que essencialmente<<strong>br</strong> />
os conteúdos <strong>da</strong> <strong>Web</strong> governamental <strong><strong>br</strong>asileira</strong> visam atender ao público<<strong>br</strong> />
interno, tendo pouca quanti<strong>da</strong>de de informação em outros idiomas.<<strong>br</strong> />
Por outro lado, sem <strong>um</strong>a abor<strong>da</strong>gem semântica não é possível verificar<<strong>br</strong> />
se informações relevantes em outros idiomas são oportunas, sejam, por<<strong>br</strong> />
exemplo, para conteúdo de relações exteriores ou para os fins de turismo.<<strong>br</strong> />
identificar qual informação pôde e convém estar em outro idioma não foi<<strong>br</strong> />
ain<strong>da</strong> objeto de análise.