30.12.2012 Views

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ISBN: 978–972–8924–45-4 © 2007 IADIS<br />

perfil, das características e das tecnologias envolvidas nestes portais municipais, para corrigir distorções e<br />

disponibilizar informações para a população.<br />

Neste contexto, no presente trabalho foram especificadas, <strong>de</strong>senvolvidas e utilizadas ferramentas<br />

computacionais para coletar e analisar os resultados, criando assim um repositório nacional dos portais e-Gov<br />

dos municípios integrada ao portal CISM (Central <strong>de</strong> Indicadores e Serviços Municipais –<br />

http://cism.le<strong>de</strong>s.net) (Sanches, 2007). Assim, o texto está organizado em quatro seções: na seção dois é<br />

apresentado o panorama do governo eletrônico municipal por meio (i) da coleta <strong>automática</strong> <strong>de</strong> diversos dados<br />

dos portais municipais (web crawler) materializando-os em um repositório multidimensional (web<br />

warehouse) e (ii) a verificação do agrupamento <strong>de</strong>sses dados segundo algum grau <strong>de</strong> semelhança (mineração<br />

<strong>de</strong> dados através do algoritmo <strong>de</strong> clustering). Na seção três discute-se a abordagem metodológica utilizada, e<br />

por último são apresentados os resultados e contribuições para a comunida<strong>de</strong>.<br />

2. PERFIL DOS PORTAIS MUNICIPAIS<br />

A abordagem metodológica utilizada neste trabalho envolveu quatro ativida<strong>de</strong>s ilustradas na Figura 1:<br />

a) Definição da fonte dos dados: portais municipais do Brasil que estiverem no subdomínio oficial<br />

.gov.br;<br />

b) Coleta e integração dos dados: realizada <strong>de</strong> forma <strong>automática</strong> por meio <strong>de</strong> um web crawler;<br />

c) Armazenamento: realizado por meio <strong>de</strong> um web warehouse com tecnologia Web; e<br />

d) Consultas nos dados: consultas <strong>de</strong> busca e web mining (WM).<br />

a) b)<br />

d<br />

Internet<br />

e-Gov<br />

Web Crawler<br />

hypertexto<br />

Figura 1. Abordagem utilizada: a) fonte dos dados; b) processo <strong>de</strong> coleta e integração dos dados; c) armazenamento das<br />

informações e d) consultas nos dados.<br />

2.1 Definição da Fonte dos Dados<br />

Web<br />

c)<br />

Web<br />

Mining,<br />

e consultas<br />

De acordo com a legislação brasileira, os municípios <strong>de</strong>vem construir seus portais Web no subdomínio<br />

.gov.br da sua Unida<strong>de</strong> Fe<strong>de</strong>rativa (UF). Assim, os en<strong>de</strong>reços <strong>de</strong> gestões municipais brasileiras na Internet<br />

<strong>de</strong>vem ser formados pela seguinte gramática simplificada e adaptada (Resolução nº 7, 2002) (Bittar, 2006):<br />

URL ::= [“www.”] + município + estado + “.gov.br”<br />

município ::= <br />

estado ::= <br />

On<strong>de</strong>: [ ] significa opcional;<br />

significa um campo <strong>de</strong> mesclagem a ser consultado em bando <strong>de</strong> dados.<br />

Para <strong>de</strong>finição da fonte <strong>de</strong> dados, esta gramática foi aplicada a todos os municípios brasileiros, que<br />

segundo o Instituto Brasileiro <strong>de</strong> Geografia e Estatística totalizam 5.564 municípios (IBGE, 2007).<br />

76

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!