08.05.2013 Views

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

características como positivas ou negativas, em função dessa idéia. O problema é,<br />

novamente, identificar qual é a idéia central do texto a ser sumarizado, a fim de<br />

preservá-la no(s) sumário(s) correspondente(s). Esse problema está relacionado tanto à<br />

forma (ou estrutura), quanto ao conteúdo do texto, como veremos a seguir.<br />

2.3. A Estrutura Textual<br />

Para conseguir produzir um bom sumário, é necessário antes que o sumarizador<br />

consiga reconhecer e reproduzir as idéias principais do texto. De forma semelhante, um<br />

sistema de sumarização automática precisa, de alguma forma, entender o que está sendo<br />

apresentado. A compreensão do discurso, por sua vez, envolve o reconhecimento das<br />

estruturas do texto. Assim, antes da sumarização propriamente dita, faz–se necessário<br />

investigar a estrutura do discurso.<br />

Seguindo a idéia de micro e super-estrutura de van Dijk (1979), Hutchins (1987)<br />

estabelece uma distinção entre a micro-estrutura e a macro-estrutura de textos. A microestrutura<br />

representa as relações entre seqüências de sentenças no texto; a macroestrutura<br />

representa relações entre blocos de sentenças e a organização global dos<br />

textos.<br />

No nível micro-estrutural, o entendimento de textos requer a recuperação da<br />

progressão temática das sentenças e cláusulas, para a recuperação adequada do<br />

significado textual. Desse modo, esse nível é associado ao inter-relacionamento<br />

semântico entre os componentes textuais (palavras, frases ou blocos textuais). No nível<br />

macro-estrutural, a recuperação do significado requer a construção de padrões<br />

organizacionais. Segundo Hutchins, evidências sugerem que o que o leitor de um texto<br />

lembra do conteúdo se assemelha à rede semântica de sua macro-estrutura. Ou seja, ele<br />

se lembra da seqüência de episódios e dos participantes principais, em textos narrativos,<br />

e da idéia principal de um argumento ou de suas características positivas e negativas,<br />

em textos expositivos. Os detalhes micro-estruturais, neste caso, dificilmente seriam<br />

retidos. Portanto, sumários expressariam a macro-estrutura de um texto segundo a<br />

interpretação de um indivíduo, com base no seu conhecimento previamente adquirido<br />

(Hutchins, 1987). Para recuperar os padrões organizacionais, Hutchins sugere quatro<br />

macro-regras que podem ser utilizadas para generalizar e condensar um texto: Delição,<br />

Generalização, Construção (todas originalmente propostas por van Dijk), além de uma<br />

regra de composição, conforme segue:<br />

1) Delição: exclusão de propriedades e atributos, ou até de cláusulas completas,<br />

considerados irrelevantes.<br />

Exemplo: “A menina ganhou um gatinho branco” pode ser sumarizada pela delição<br />

do qualificativo “branco”, resultando em “A menina ganhou um gatinho”.<br />

2) Generalização: substituição de hipônimos por seus hiperônimos ou de detalhes por<br />

uma idéia ou frase mais abstrata, que envolva os detalhes, deixando-os implícitos.<br />

Exemplo (Hutchins, 1987): “Pedro viu aves.” pode ser a generalização da seqüência<br />

“Pedro viu um falcão. Pedro viu um urubu.” ou, ainda, da sentença “Pedro viu um<br />

falcão e um urubu.”.<br />

3) Construção: esta regra, semelhante à de generalização, age como seu complemento<br />

sintagmático: enquanto a generalização é basicamente pragmática, a construção<br />

depende da micro-estrutura textual. Neste caso, a macro-proposição construída é<br />

resultante de uma seqüência de micro-proposições.<br />

6

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!