08.05.2013 Views

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

INTRODUÇÃO À SUMARIZAÇÃO AUTOMÁTICA - ICMC - USP

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

indicador da proposição central do discurso, de modo a expressar a escala de relevância<br />

em relação a essa proposição central e (b) consistirá em b.1) identificar a intenção<br />

subjacente a cada segmento e b.2) o modo como cada intenção de cada segmento pode<br />

contribuir para a satisfação do objetivo comunicativo central do discurso em elaboração.<br />

É possível, assim, identificar as partes relevantes para compor o sumário, levando em<br />

consideração as intenções subjacentes ao discurso em relação à proposição central e ao<br />

seu objetivo comunicativo. Desse modo, em relação à arquitetura de um sumarizador<br />

automático conforme descrita pela Figura 1, as informações essenciais e<br />

complementares da mensagem-fonte que serão consideradas na mensagem-fonte do<br />

sumário, assim como as informações supérfluas, que deverão ser descartadas, serão<br />

identificadas com base em regras intencionais, definidas a partir da GSDT.<br />

No modelo de Rino, as regras intencionais são especificadas com base nas<br />

relações de dominância (DOM) ou precedência (SAT-PREC) existentes entre segmentos<br />

informativos, a partir do domínio em foco, isto é, da base de conhecimento que compõe<br />

a mensagem-fonte do sumarizador. Para uma certa mensagem-fonte (lembrando que<br />

esta é resultado de um processo interpretativo, fora do foco do sumarizador ilustrado),<br />

uma vez observada a distribuição intencional entre seus constituintes, faz-se possível<br />

um mapeamento entre essa estrutura intencional e a estrutura de discurso, que nada mais<br />

é do que uma árvore RST. Por exemplo, caso se verifique a relação Y DOM XeXSAT-<br />

PREC Y entre dois segmentos quaisquer X e Y de um texto, pode-se gerar a relação<br />

retórica MEANS na estrutura de discurso resultante. Neste caso, o segmento X poderia<br />

estar descrevendo um problema no texto-fonte, enquanto que Y uma possível solução<br />

para esse problema.<br />

5.4.APragmáticaeaSumarizaçãoAutomática<br />

Na metodologia profunda, vários aspectos podem ainda influenciar o tamanho e<br />

o conteúdo do sumário. Algumas características pragmáticas usadas na geração<br />

automática de textos podem ser aplicadas também para a sumarização, acarretando<br />

mudanças no sumário produzido de acordo com o modelo do usuário, a relação entre o<br />

falante e ouvinte e os objetivos do falante. Entre as características de estilo, Hovy<br />

(1988) explora, por exemplo, o tempo despendido para a preparação do discurso (haste<br />

– que pode ser classificado como escasso, pouco, suficiente ou ilimitado) e formalidade<br />

(formality – coloquial, normal ou formal), que são particularmente interessantes para se<br />

traçar a estrutura e conteúdo de um sumário.<br />

Segundo Hovy, enquanto textos formais normalmente possuem sentenças<br />

longas, aqueles com baixa formalidade, ou coloquiais, apresentam sentenças mais<br />

curtas. Dessa forma, na sumarização, poderiam ser utilizadas algumas de suas regras<br />

para diminuir a formalidade e, conseqüentemente, o tamanho do sumário, controlando o<br />

seu grau de compressão.<br />

Já as regras de tempo despendido para a preparação textual podem determinar<br />

quantos tópicos serão incluídos no sumário. Quanto menor o tempo, menos se deve<br />

incluir no sumário, seja devido à limitação de espaço ou devido ao nível de<br />

conhecimento do usuário ao qual o sumário é destinado. Por exemplo, se o usuário for<br />

especialista no assunto, pode ser atribuído o valor mínimo ao tempo (escasso) deforma<br />

a forçar a exclusão de detalhes no sumário a ser gerado. Essas regras envolvem ainda<br />

conceitos como distância e subordinação social entre falante e ouvinte, que influenciam<br />

também o número de detalhes e o nível de parcialidade do texto produzido, interferindo,<br />

conseqüentemente, no critério de sumarização também.<br />

32

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!