30.12.2012 Views

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

geração (semi)automática de metadados - Universidad Autónoma ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ISBN: 978–972–8924–45-4 © 2007 IADIS<br />

agentes <strong>de</strong> software utilizar as informações disponíveis na web <strong>de</strong> forma mais eficiente do que os sistemas <strong>de</strong><br />

busca actuais.<br />

Este artigo está organizado da seguinte forma. A secção 2 faz uma contextualização do trabalho,<br />

apresentando um exemplo <strong>de</strong> aplicação da web semântica no contexto turístico. A secção 3 apresenta o<br />

mo<strong>de</strong>lo semântico para o turismo e os principais fundamentos que estiveram na base da construção das<br />

ontologias propostas. A secção 4 apresenta uma breve discussão sobre as principais contribuições <strong>de</strong>ste<br />

trabalho relativamente a outros trabalhos relacionados. Finalmente, a secção 5 apresenta as conclusões do<br />

trabalho.<br />

2. TURISMO NO CONTEXTO DA WEB SEMÂNTICA<br />

Sendo a web semântica uma das áreas emergentes que procura, segundo Tim Berners-Lee, James Hendler e<br />

Ora Lassila (Berners-Lee, Hendler and Lassila, 2001) e Nigel Shadbolt, Tim Berners-Lee e Wendy Hall<br />

(Shadbolt, Berners-Lee and Hall, 2006), tornar a web mais usável, interoperável e consistente, como extensão<br />

da web sintáctica (actual), em que a informação é disponibilizada associada a <strong>metadados</strong> que explicitam a sua<br />

semântica promovendo a interoperabilida<strong>de</strong> entre agentes <strong>de</strong> software (machine-to-machine interoperability)<br />

sem, contudo, repercutir negativamente na facilida<strong>de</strong> <strong>de</strong> exploração e utilização por agentes humanos<br />

(human-to-human cooperation). Actualmente, po<strong>de</strong>mos consi<strong>de</strong>rar a web sintáctica como englobando um<br />

enorme inventário <strong>de</strong> objectos turísticos (praias, habitats naturais, potencialida<strong>de</strong>s <strong>de</strong> fruição e lazer,<br />

festivida<strong>de</strong>s, artesanato, museus, entre outros) distribuídos por todo espaço que constitui a Web, sem<br />

qualquer forma <strong>de</strong> organização. Alguns objectos turísticos são mais facilmente acessíveis pelos motores <strong>de</strong><br />

busca convencionais (camada superficial da Web, <strong>de</strong>signada por surface web (Bergman, 2001) ou, ainda,<br />

in<strong>de</strong>xable web (Baeza-Yates, 2004)) enquanto que outros existirão armazenados em bases <strong>de</strong> dados e serão<br />

<strong>de</strong> acesso mais limitado <strong>de</strong>vido à dificulda<strong>de</strong> em in<strong>de</strong>xá-los (camada <strong>de</strong>ep web (Bergman, 2001) ou hid<strong>de</strong>n<br />

web (Baeza-Yates, 2004)). Quando procuramos, através dos motores <strong>de</strong> pesquisa, os nossos objectos<br />

turísticos predilectos, temos <strong>de</strong> usar a nossa estratégia humana para analisar e interpretar os documentos-web<br />

(web-pages), iteração a iteração, com vista a <strong>de</strong>scobrir, a extrair e a classificar os documentos-web mais<br />

relevantes sobre os objectos turísticos <strong>de</strong>sejados. Neste caso, as informações sobre os objectos turísticos estão<br />

escondidos nos referidos documentos-web, sendo os conteúdos estruturados por mecanismos <strong>de</strong> formatação e<br />

<strong>de</strong> visualização no formato HTML. Imaginemos o seguinte documento-web em HTML (Figura 1):<br />

Figura 1. Descrição sintáctica <strong>de</strong> uma página (HTML)<br />

O browser apresentará o texto com as especialida<strong>de</strong>s do restaurante em negrito, “Bacalhau à Margarida<br />

da Praça” e “Bacalhau à Sogra”, que é totalmente ina<strong>de</strong>quado para os agentes <strong>de</strong> software, uma vez que não<br />

existem informações adicionais capazes <strong>de</strong> ajudá-los a interpretar o sentido do texto ou das especialida<strong>de</strong>s em<br />

negrito; só, os agentes humanos dispõem da capacida<strong>de</strong> <strong>de</strong> ler e interpretar o conteúdo do documento-web.<br />

No cenário da web semântica, teremos um inventário estruturado <strong>de</strong> objectos turísticos em que cada<br />

objecto turístico está organizado <strong>de</strong> acordo com o seu enquadramento temático (museu, restaurante, romaria,<br />

praia, artesanato, entre outros temas), a sua <strong>de</strong>scritibilida<strong>de</strong> (características particulares dos objectos<br />

turísticos, por exemplo, para o restaurante temos o tipo <strong>de</strong> cozinha, as especialida<strong>de</strong>s gastronómicas, as<br />

facilida<strong>de</strong>s disponíveis para os turistas incapacitantes), a sua espacialida<strong>de</strong> (a localização geográfica do<br />

objecto turístico, a tipologia do lugar, entre outros aspectos relacionados com o espaço), a sua temporalida<strong>de</strong><br />

(horários <strong>de</strong> funcionamento, os dias da semana em que os serviços estão encerrados, entre outros aspectos<br />

temporais) e outros elementos organizacionais. Ou seja, a cada objecto turístico (documento-web) será<br />

vinculado a si um conjunto <strong>de</strong> informações adicionais não como novo conteúdo mas sim sobre o próprio<br />

conteúdo (os <strong>de</strong>nominados <strong>metadados</strong>). Para que os agentes <strong>de</strong> software, ao processar o documento-web,<br />

100

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!