03.11.2014 Views

Search for synonyms in Wikipedia - Science Library

Search for synonyms in Wikipedia - Science Library

Search for synonyms in Wikipedia - Science Library

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

- 46 -<br />

синсеты 1 (от англ. synonym set, synset). WordNet содержит синсеты, краткие<br />

общие определения к синсетам (глоссы), примеры употреблений и несколько<br />

типов семантических отношений между синсетами. Авторы преследовали<br />

двоякую цель: объединить возможности тезауруса и наглядность словаря, а<br />

также создать ресурс для автоматической обработки текстов на естественном<br />

языке. База данных и программа выпущены на условиях BSD лицензии.<br />

Возможен онлайн доступ к содержимому базы данных.<br />

WordNet был разработан в 1985 г. Работа над ним ведётся<br />

сотрудниками Лаборатории когнитологии Принстонского Университета<br />

(США) под руководством профессора психологии Дж. Миллера. К 2005 г.<br />

WordNet содержал около 150 тыс. слов, организованных в более чем 115 тыс.<br />

синсетов, всего 203 тыс. пар слово-значение. Словарь состоит из 4 файлов,<br />

соответствующих таким частям речи, как: существительное, глагол,<br />

прилагательное и наречие.<br />

Семантические отношения связывают большинство синсетов.<br />

Представлены такие семантические отношения, как: гипонимия<br />

(родовидовое), меронимия (часть-целое), лексический вывод (каузация, пресуппозиция)<br />

и др.<br />

Гипонимия позволяет организовывать синсеты в иерархические<br />

структуры (деревья). Гипонимия связывает слова, «между содержанием<br />

понятий которых существует отношение семантического включения, то есть<br />

значение гиперонима полностью включено в значение гипонима» [1].<br />

Например, значение слова бояться включено в значение слов опасаться,<br />

остерегаться.<br />

Разработаны способы вычисления семантического расстояния между<br />

концептами либо словами с помощью тезауруса WordNet, например: мера<br />

Leacock-Chodorow [99], 2 меры на основе частотности концептов в корпусе<br />

(мера Резника [151], [152], мера Jiang-Conrath [120], мера L<strong>in</strong> [128]), мера<br />

1 С точки зрения теории графов системе WordNet соответствует направленный граф, вершины которого<br />

представлены концептами (наборы синонимов, синсеты), дуги представлены семантическими<br />

отношениями.<br />

2 См. описание меры Leacock-Chodorow и других в табл. 1.2, стр. 37.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!