2008(â7) - СанкÑ-ÐеÑеÑбÑÑгÑкий гоÑÑдаÑÑÑвеннÑй ...
2008(â7) - СанкÑ-ÐеÑеÑбÑÑгÑкий гоÑÑдаÑÑÑвеннÑй ...
2008(â7) - СанкÑ-ÐеÑеÑбÑÑгÑкий гоÑÑдаÑÑÑвеннÑй ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
где rhet_rel(R, S, N) обозначает риторическое отношение R между ЭТЕ S и N, причем S –<br />
сателлит, а N – ядро. Примером дизъюнктивного исключающего множества риторических<br />
отношений являются первый и третий элементы множества RR.<br />
Тогда задача построения структуры текста формулируется следующим образом: дана<br />
последовательность ЭТЕ U = u 1 , u 2 , …, u n и множество RR простых риторических отношений<br />
и дизъюнктивных исключающих отношений, которые лежат между элементами<br />
из U. Требуется найти все корректные структуры из линейной последовательности U.<br />
Данный подход предполагает построение дерева снизу вверх. Идея алгоритма состоит в<br />
следующем. Изначально каждая ЭТЕ i ассоциирована с элементарным деревом, которое имеет<br />
статус NUCLEUS (ядро) либо SATELLITE (сателлит), тип LEAF (лист) и множество наиболее<br />
важных ЭТЕ-потомков {i}. Вначале любое отношение из множества RR может быть<br />
использовано при связи двух элементов в более сложные деревья. После построения всех<br />
элементарных деревьев риторическая структура может быть получена соединением смежных<br />
деревьев в бóльшие при условии, что на каждом шаге получается корректная древовидная<br />
структура. С каждым шагом связано множество риторических отношений, которые могут<br />
быть использованы на следующих шагах. В самом начале элементарное дерево может быть<br />
преобразовано в большее с использованием всего набора RR. Но как только одно из отношений<br />
было использовано, оно становится недоступным для дальнейших преобразований.<br />
Параметрами алгоритма построения риторической структуры являются:<br />
• множество ЭТЕ U = u 1 , u 2 , …, u n ;<br />
• множество констант NUCLEUS, SATELLITE, LEAF, NULL;<br />
• имена всех риторических отношений;<br />
• объекты типа tree (status, type, promotion, left, right) – будут описаны далее.<br />
Объекты, имеющие форму tree (status, type, promotion, left, right), обеспечивают<br />
функциональное представление корректных деревьев. Переменная status может иметь значения<br />
NUCLEUS или SATELLITE; type содержит имя риторического отношения; promotion<br />
представляет собой подмножество элементов из U; left и right могут быть либо NULL,<br />
либо рекурсивным определением через объект tree. Например, отношение rhet_rel (JUSTI-<br />
FICATION, A 1 , B 1 ) может быть представлено следующим образом:<br />
30<br />
tree(NUCLEUS, JUSTIFICATION, {B 1 },<br />
tree(SATELLITE, LEAF, {A 1 }, NULL, NULL),<br />
tree(SATELLITE, LEAF, {B 1 }, NULL, NULL))<br />
Объект tree(status, type, promotion, left, right) соответствует корректной текстовой<br />
структуре тогда и только тогда, когда аргументы status, type, promotion имеют такие же<br />
значения, как у корня текстовой структуры, и если аргументы left и right соответствуют<br />
левому и правому поддеревьям корректной структуры соответственно.<br />
Определим следующие предикаты:<br />
• position (u i , j) равен истине, если u i стоит на j-й позиции в U = u 1 , u 2 , ..., u n ;<br />
• hold (rr) равен истине для данного текста тогда и только тогда, когда риторические<br />
отношения в rr лежат между ЭТЕ текста.