08.05.2013 Views

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

pode ser caracterizado como uma subclasse do gênero, pelo fato dele envolver aspectos<br />

comunicativos, além de estruturais e informacionais. Exemplos de gênero e tipo de<br />

textos incluem (Rino, 1996):<br />

Gênero: poesia, prosa, ficção, novelas, estórias, instruções, artigos científicos,<br />

relatórios, anúncios, piadas, seminários, informativos, receitas, etc;<br />

Tipo: persuasivo, expositivo, analítico, descritivo, dissertativo, narrativo,<br />

argumentativo, etc.<br />

A consideração do gênero e tipo de textos na sumarização automática pode ser<br />

de grande valia para ajudar a reconhecer a estrutura textual e a especificar um modelo<br />

de processamento automático correspondente. Tal metodologia é utilizada, por exemplo,<br />

para a especificação de esquemas (McKeown, 1985) e heurísticas de condensação que<br />

podem ser tipificadas para um determinado domínio de textos (por exemplo, no discurso<br />

científico no domínio da Física, como sugerem Rino e Scott (1994)).<br />

Essas características devem, portanto, ser consideradas para a geração de<br />

sumários bons, coerentes e coesos, que reflitam adequadamente o texto original.<br />

Uma das abordagens profundas, para a sumarização automática, está em<br />

distinguir o que é relativo a decisões de ordem estrutural – e, portanto, de coerência – e<br />

o que é relativo a decisões de ordem superficial – e, portanto, de coesão. Sob esse ponto<br />

de vista, coerência e coesão são propriedades complementares, cada uma delas<br />

remetendo a um nível distinto de representação textual (ou discursiva) e ambos<br />

contribuindo para a transmissão da mensagem que o autor pretende veicular com seu<br />

texto.<br />

Propriedades coesivas servem, por exemplo, para evidenciar relações estruturais,<br />

definidas no nível profundo, no nível superficial. Sua forma de expressão,<br />

freqüentemente, é refletida por marcadores do discurso. Por exemplo, para a relação de<br />

Causa-Efeito entre as proposições relativas a ‘Choveu forte’ (causa) e ‘eu fechei a<br />

janela’ (efeito), a realização superficial pode ser dada pela junção de duas sentenças,<br />

como segue:<br />

“Choveu forte. Portanto, eu fechei a janela.”<br />

ou<br />

“Fechei a janela porque choveu forte.”<br />

cujos marcadores discursivos são, respectivamente, portanto e porque.<br />

Essa mesma relação pode ser expressa sem os marcadores explícitos, como em<br />

“Choveu forte. Eu fechei a janela.”<br />

Ainda assim, o sentido próprio da relação de Causa-Efeito é recuperável, desde<br />

que leitor e escritor partilhem o mesmo conhecimento de mundo, que permita ao leitor<br />

inferir a relação discursiva pretendida pelo escritor. O marcador da relação causal, neste<br />

caso, serve como elemento coesivo fatual explícito.<br />

Vê-se, pela discussão acima, que são vários os fatores que interferem nas<br />

escolhas estruturais e superficiais durante a produção textual, tanto humana quanto<br />

automática. Ao se considerar a abordagem profunda, o inter-relacionamento entre<br />

medidas nebulosas como clareza, abstração, informatividade, coerência e coesão,<br />

conceitos intuitivos para os seres humanos, é de difícil incorporação e manipulação em<br />

um sistema computacional, pois remetem ao nível profundo, de estruturação e garantia<br />

23

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!