Search for synonyms in Wikipedia - Science Library
Search for synonyms in Wikipedia - Science Library
Search for synonyms in Wikipedia - Science Library
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
- 44 -<br />
которой «аннотация представляется в формате, где явно специфицированы<br />
тип выделенного объекта (отношения) и его атрибуты, а также расположение<br />
аннотации в тексте относительно его начала (Offsets)». С одной стороны,<br />
указание типа объекта и положения подстроки в тексте (Offsets) сужает<br />
понятие объекта (именно объектами оперируют метрики точность, полнота и<br />
качество). С другой стороны, новые метрики подходят для оценки качества<br />
функционирования IE систем, построенных на основе GATE, поскольку тип<br />
объекта и положения подстроки в тексте включены в аннотации GATE.<br />
Небольшой обзор систем, подобных GATE, а именно: KIM,<br />
TEXTRACT, Textpresso, Ogmios, представлен в работе [109].<br />
Проект Диалинг<br />
В данном подразделе дано краткое описание модулей автоматической<br />
обработки текста и морфологических словарей, разработанных рабочей<br />
группой Aot.ru [60]. Изначальный проект, посвящённый разработке русскоанглийского<br />
машинного перевода, назывался Диалинг. Разработанный<br />
процессор Диалинг включает графематический, морфологический и<br />
синтаксическим модули. Программная реализация процессора выполнена на<br />
языке C++. «Неоспоримым достоинством процессора Диалинг является его<br />
завершённость: программная реализация доведена до уровня промышленного<br />
использования, – система характеризуется приемлемой скоростью анализа и<br />
устойчивостью на открытом пространстве реальных текстов» (цит. по [47]).<br />
Морфологический словарь, или лексикон, содержит все словоформы<br />
одного из языков: английский, немецкий или русский. Словарь<br />
предоставляется в двух вариантах: с возможностью редактирования и в<br />
бинарном варианте. Оболочка редактирования словаря позволяет выполнять:<br />
(i) поиск в словаре по лемме, словоформе, морфологической интерпретации,<br />
(ii) редактирование словаря. Словарь в бинарном формате предоставляет<br />
возможность выполнять: (1) морфологический анализ (получение по<br />
словоформе леммы, её свойств, уникального ID леммы, морфологических<br />
характеристик входной словоформы 1 и (2) морфологический синтез<br />
1 Каждая словоформа представляется множеством морфологических омонимов [47].