INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP
INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP
INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
pode ser caracterizado como uma subclasse do gênero, pelo fato dele envolver aspectos<br />
comunicativos, além de estruturais e informacionais. Exemplos de gênero e tipo de<br />
textos incluem (Rino, 1996):<br />
Gênero: poesia, prosa, ficção, novelas, estórias, instruções, artigos científicos,<br />
relatórios, anúncios, piadas, seminários, informativos, receitas, etc;<br />
Tipo: persuasivo, expositivo, analítico, descritivo, dissertativo, narrativo,<br />
argumentativo, etc.<br />
A consideração do gênero e tipo de textos na sumarização automática pode ser<br />
de grande valia para ajudar a reconhecer a estrutura textual e a especificar um modelo<br />
de processamento automático correspondente. Tal metodologia é utilizada, por exemplo,<br />
para a especificação de esquemas (McKeown, 1985) e heurísticas de condensação que<br />
podem ser tipificadas para um determinado domínio de textos (por exemplo, no discurso<br />
científico no domínio da Física, como sugerem Rino e Scott (1994)).<br />
Essas características devem, portanto, ser consideradas para a geração de<br />
sumários bons, coerentes e coesos, que reflitam adequadamente o texto original.<br />
Uma das abordagens profundas, para a sumarização automática, está em<br />
distinguir o que é relativo a decisões de ordem estrutural – e, portanto, de coerência – e<br />
o que é relativo a decisões de ordem superficial – e, portanto, de coesão. Sob esse ponto<br />
de vista, coerência e coesão são propriedades complementares, cada uma delas<br />
remetendo a um nível distinto de representação textual (ou discursiva) e ambos<br />
contribuindo para a transmissão da mensagem que o autor pretende veicular com seu<br />
texto.<br />
Propriedades coesivas servem, por exemplo, para evidenciar relações estruturais,<br />
definidas no nível profundo, no nível superficial. Sua forma de expressão,<br />
freqüentemente, é refletida por marcadores do discurso. Por exemplo, para a relação de<br />
Causa-Efeito entre as proposições relativas a ‘Choveu forte’ (causa) e ‘eu fechei a<br />
janela’ (efeito), a realização superficial pode ser dada pela junção de duas sentenças,<br />
como segue:<br />
“Choveu forte. Portanto, eu fechei a janela.”<br />
ou<br />
“Fechei a janela porque choveu forte.”<br />
cujos marcadores discursivos são, respectivamente, portanto e porque.<br />
Essa mesma relação pode ser expressa sem os marcadores explícitos, como em<br />
“Choveu forte. Eu fechei a janela.”<br />
Ainda assim, o sentido próprio da relação de Causa-Efeito é recuperável, desde<br />
que leitor e escritor partilhem o mesmo conhecimento de mundo, que permita ao leitor<br />
inferir a relação discursiva pretendida pelo escritor. O marcador da relação causal, neste<br />
caso, serve como elemento coesivo fatual explícito.<br />
Vê-se, pela discussão acima, que são vários os fatores que interferem nas<br />
escolhas estruturais e superficiais durante a produção textual, tanto humana quanto<br />
automática. Ao se considerar a abordagem profunda, o inter-relacionamento entre<br />
medidas nebulosas como clareza, abstração, informatividade, coerência e coesão,<br />
conceitos intuitivos para os seres humanos, é de difícil incorporação e manipulação em<br />
um sistema computacional, pois remetem ao nível profundo, de estruturação e garantia<br />
23