10.04.2015 Views

2008(№7) - Санкт-Петербургский государственный ...

2008(№7) - Санкт-Петербургский государственный ...

2008(№7) - Санкт-Петербургский государственный ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

где rhet_rel(R, S, N) обозначает риторическое отношение R между ЭТЕ S и N, причем S –<br />

сателлит, а N – ядро. Примером дизъюнктивного исключающего множества риторических<br />

отношений являются первый и третий элементы множества RR.<br />

Тогда задача построения структуры текста формулируется следующим образом: дана<br />

последовательность ЭТЕ U = u 1 , u 2 , …, u n и множество RR простых риторических отношений<br />

и дизъюнктивных исключающих отношений, которые лежат между элементами<br />

из U. Требуется найти все корректные структуры из линейной последовательности U.<br />

Данный подход предполагает построение дерева снизу вверх. Идея алгоритма состоит в<br />

следующем. Изначально каждая ЭТЕ i ассоциирована с элементарным деревом, которое имеет<br />

статус NUCLEUS (ядро) либо SATELLITE (сателлит), тип LEAF (лист) и множество наиболее<br />

важных ЭТЕ-потомков {i}. Вначале любое отношение из множества RR может быть<br />

использовано при связи двух элементов в более сложные деревья. После построения всех<br />

элементарных деревьев риторическая структура может быть получена соединением смежных<br />

деревьев в бóльшие при условии, что на каждом шаге получается корректная древовидная<br />

структура. С каждым шагом связано множество риторических отношений, которые могут<br />

быть использованы на следующих шагах. В самом начале элементарное дерево может быть<br />

преобразовано в большее с использованием всего набора RR. Но как только одно из отношений<br />

было использовано, оно становится недоступным для дальнейших преобразований.<br />

Параметрами алгоритма построения риторической структуры являются:<br />

• множество ЭТЕ U = u 1 , u 2 , …, u n ;<br />

• множество констант NUCLEUS, SATELLITE, LEAF, NULL;<br />

• имена всех риторических отношений;<br />

• объекты типа tree (status, type, promotion, left, right) – будут описаны далее.<br />

Объекты, имеющие форму tree (status, type, promotion, left, right), обеспечивают<br />

функциональное представление корректных деревьев. Переменная status может иметь значения<br />

NUCLEUS или SATELLITE; type содержит имя риторического отношения; promotion<br />

представляет собой подмножество элементов из U; left и right могут быть либо NULL,<br />

либо рекурсивным определением через объект tree. Например, отношение rhet_rel (JUSTI-<br />

FICATION, A 1 , B 1 ) может быть представлено следующим образом:<br />

30<br />

tree(NUCLEUS, JUSTIFICATION, {B 1 },<br />

tree(SATELLITE, LEAF, {A 1 }, NULL, NULL),<br />

tree(SATELLITE, LEAF, {B 1 }, NULL, NULL))<br />

Объект tree(status, type, promotion, left, right) соответствует корректной текстовой<br />

структуре тогда и только тогда, когда аргументы status, type, promotion имеют такие же<br />

значения, как у корня текстовой структуры, и если аргументы left и right соответствуют<br />

левому и правому поддеревьям корректной структуры соответственно.<br />

Определим следующие предикаты:<br />

• position (u i , j) равен истине, если u i стоит на j-й позиции в U = u 1 , u 2 , ..., u n ;<br />

• hold (rr) равен истине для данного текста тогда и только тогда, когда риторические<br />

отношения в rr лежат между ЭТЕ текста.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!