Search for synonyms in Wikipedia - Science Library
Search for synonyms in Wikipedia - Science Library
Search for synonyms in Wikipedia - Science Library
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
- 46 -<br />
синсеты 1 (от англ. synonym set, synset). WordNet содержит синсеты, краткие<br />
общие определения к синсетам (глоссы), примеры употреблений и несколько<br />
типов семантических отношений между синсетами. Авторы преследовали<br />
двоякую цель: объединить возможности тезауруса и наглядность словаря, а<br />
также создать ресурс для автоматической обработки текстов на естественном<br />
языке. База данных и программа выпущены на условиях BSD лицензии.<br />
Возможен онлайн доступ к содержимому базы данных.<br />
WordNet был разработан в 1985 г. Работа над ним ведётся<br />
сотрудниками Лаборатории когнитологии Принстонского Университета<br />
(США) под руководством профессора психологии Дж. Миллера. К 2005 г.<br />
WordNet содержал около 150 тыс. слов, организованных в более чем 115 тыс.<br />
синсетов, всего 203 тыс. пар слово-значение. Словарь состоит из 4 файлов,<br />
соответствующих таким частям речи, как: существительное, глагол,<br />
прилагательное и наречие.<br />
Семантические отношения связывают большинство синсетов.<br />
Представлены такие семантические отношения, как: гипонимия<br />
(родовидовое), меронимия (часть-целое), лексический вывод (каузация, пресуппозиция)<br />
и др.<br />
Гипонимия позволяет организовывать синсеты в иерархические<br />
структуры (деревья). Гипонимия связывает слова, «между содержанием<br />
понятий которых существует отношение семантического включения, то есть<br />
значение гиперонима полностью включено в значение гипонима» [1].<br />
Например, значение слова бояться включено в значение слов опасаться,<br />
остерегаться.<br />
Разработаны способы вычисления семантического расстояния между<br />
концептами либо словами с помощью тезауруса WordNet, например: мера<br />
Leacock-Chodorow [99], 2 меры на основе частотности концептов в корпусе<br />
(мера Резника [151], [152], мера Jiang-Conrath [120], мера L<strong>in</strong> [128]), мера<br />
1 С точки зрения теории графов системе WordNet соответствует направленный граф, вершины которого<br />
представлены концептами (наборы синонимов, синсеты), дуги представлены семантическими<br />
отношениями.<br />
2 См. описание меры Leacock-Chodorow и других в табл. 1.2, стр. 37.