Search for synonyms in Wikipedia - Science Library

More documents

Recommendations

Info

- 40 - Lin [128] определил сходство объектов А и B как отношение количества информации, необходимой для описания сходства А и B, к количеству информации, полностью описывающей А и B. Для измерения сходства между словами Lin учитывает частотное распределение слов в корпусе текстов (аналогично мере Резника): 2⋅log P c lin c 1, c 2 = 0 log P c 1 log P c 2 , где c 0 – ближайший общий супер-класс в иерархии для обоих концептов c 1 и c 2 . P – вероятность концепта, вычисляемая на основе частоты появления концепта в корпусе. Отличается от формулы res способом нормализации, корректным вычислением lin (x, x) (не зависит от положения концепта х в иерархии), учитывает наличие и общих, и различающихся свойств у объектов [152]. В работе [173] мера lesk, основанная на вычислении степени пересечения глосс концептов WordNet, была адаптирована к ВП (за глоссу авторы взяли первый абзац в статье ВП). Итак, сходство двух текстов t 1 , t 2 вычисляется с двойной нормализацией (по длине текста и с помощью гиперболического тангенса) так: relate gloss /text t 1, t 2 =tanh overlap t 1, t 2 length t 1 length t 2 , overlap t 1, t 2 =∑ m 2 , где пересекаются n фраз, m слов 1 . n В работе [139] (стр. 4) приведённая в таблице 1.2 формула lin была адаптирована к поиску в структуре GermaNet. В данной работе приведены две TF-IDF схемы для вычисления сходства между запросом и текстом документа. Глава о метриках была бы неполной без упоминания того, что кроме сходства, метрики позволяют вычислять степень различия объектов. Так например, в задачах кластеризации используются функции, определяющие степень различия 2 между документами. Если P – множество объектов, 1 Закон Ципфа утверждает, что чем длиннее фраза, тем реже она встречается в корпусе. На основании этого, было предложено наличие общих фраз длиной в n слов (в глоссах сравниваемых слов) оценивать как n 2 [75]. 2 Любая функция оценки степени различия между документами D может быть преобразована в функцию, определяющую степень соответствия S следующим образом: S =1D −1 .
- 41 - предназначенных для кластеризации, то функция D определения степени различия документов удовлетворяет следующим условиям [53]: 1. D X ,Y ≥0 для ∀ X ,Y ∈P 2. D X , X =0 для ∀ X ∈P 3. D X ,Y =D Y , X для ∀ X ,Y ∈P 4. D X ,Y ≤D X ,Z D Z , Y для ∀ X ,Y ,Z ∈P При анализе свойств Интернет сетей 1 , при оценке свойств графов, созданных с помощью генератора случайных чисел, используют такие метрики [130]: 1. Распределение расстояний d(x) – число пар вершин на расстоянии х, делённое на общее число пар n 2 (включая пары типа (a,a)); 2. betweeness – мера центральности – взвешенная сумма числа кратчайших путей, включающих данную вершину (ребро); 3. вероятностное распределение вершин P(k) – число вершин степени k в графе; 4. правдоподобие (likelihood) – сумма произведений степеней смежных вершин; 5. кластеризация 2 С(k) – отношение среднего числа ссылок между соседями вершины степени k к максимально возможному числу таких ссылок C 2 k . 1 Виды сетей, их топологические свойства и приложения см. в обзорных работах [70], [96], [142]. 2 В работе [77] эта метрика называется коэффициент кластеризации вершины и вычисляется по формуле E i C i = k i k i −1/2 , где k i – степень вершины i, E i – число ссылок между k i соседями. Усреднение C(i) по всем вершинам даёт коэффициент кластеризации графа.
Page 1 and 2: Учреждение Российс
Page 3 and 4: 2.4 ВЫЧИСЛЕНИЕ МЕРЫ
Page 5 and 6: - 5 - Введение Некото
Page 7 and 8: - 7 - лингвосемантич
Page 9 and 10: - 9 - указывать - во с
Page 11 and 12: - 11 - Ещё одна актуал
Page 13 and 14: - 13 - 5. Впервые предл
Page 15 and 16: - 15 - визуализацией
Page 17 and 18: - 17 - 4. Разработана и
Page 19 and 20: - 19 - Положения, выно
Page 21 and 22: - 21 - противопоставл
Page 23 and 24: - 23 - лексико-семант
Page 25 and 26: - 25 - 1. Каждому текст
Page 27 and 28: - 27 - ii. идентификато
Page 29 and 30: - 29 - Countries and Cities) 1 бы
Page 31 and 32: - 31 - многозначных с
Page 33 and 34: - 33 - Алгоритм извле
Page 35 and 36: - 35 - LSA [100], WikiRelate! [173]
Page 37 and 38: - 37 - ∣X ∩Y ∣ min ∣X ∣,
Page 39: - 39 - В работе [186] пре
Page 43 and 44: - 43 - коллекциями до
Page 45 and 46: - 45 - (получение по у
Page 47 and 48: - 47 - Hirst-St.Onge, мера пе
Page 49 and 50: - 49 - засвидетельств
Page 51 and 52: - 51 - семантические
Page 53 and 54: - 53 - Данные этих про
Page 55 and 56: - 55 - В [162] выделяют т
Page 57 and 58: - 57 - связей предмет
Page 59 and 60: - 59 - Рис. 2. Указание
Page 61 and 62: - 61 - Рис. 4. Визуальн
Page 63 and 64: - 63 - поиска) для пос
Page 65 and 66: - 65 - Таким образом,
Page 67 and 68: - 67 - результатов по
Page 69 and 70: - 69 - Причиной испол
Page 71 and 72: - 71 - Детальное опис
Page 73 and 74: - 73 - вес вершины, чт
Page 75 and 76: - 75 - • многозначные
Page 77 and 78: - 77 - Адаптированный
Page 79 and 80: - 79 - множества А явл
Page 81 and 82: while (E > ε) { } - 81 - Для к
Page 83 and 84: - 83 - • c weight - вес кла
Page 85 and 86: - 85 - Варианты объед
Page 87 and 88: - 87 - Необходимо най
Page 89 and 90: - 89 - В шагах 13, 14, 19 р
Page 91 and 92:
- 91 - 2.5 Показатели ч
Page 93 and 94:
- 93 - (мера основана
Page 95 and 96:
- 95 - соседей совпад
Page 97 and 98:
- 97 - указаны на рис.
Page 99 and 100:
- 99 - Модуль визуали
Page 101 and 102:
- 101 - На рис. 13 показ
Page 103 and 104:
- 103 - Рис. 14. Задание
Page 105 and 106:
- 105 - 3. Глобализация
Page 107 and 108:
- 107 - • имя компьюте
Page 109 and 110:
- 109 - индексировани
Page 111 and 112:
- 111 - DB» из модуля «TF
Page 113 and 114:
- 113 - полей БД позво
Page 115 and 116:
- 115 - Выводы по глав
Page 117 and 118:
- 117 - 4. Эксперименты
Page 119 and 120:
- 119 - Replicant, Sentience, Parah
Page 121 and 122:
- 121 - близких по зна
Page 123 and 124:
- 123 - позволяет отсе
Page 125 and 126:
- 125 - 3. Точность пои
Page 127 and 128:
- 127 - P, % 30 25 20 15 10 Сам
Page 129 and 130:
- 129 - получить из ра
Page 131 and 132:
- 131 - Пример оценки
Page 133 and 134:
- 133 - 0.01. Усреднённы
Page 135 and 136:
- 135 - 4.2 Сессия норма
Page 137 and 138:
- 137 - Рис. 28. Определ
Page 139 and 140:
- 139 - Таблица 4.10 N Во
Page 141 and 142:
- 141 - Данный преобра
Page 143 and 144:
- 143 - Эксперименты п
Page 145 and 146:
- 145 - Проверка выпол
Page 147 and 148:
- 147 - - «ruwiki 08 corpus» (л
Page 149 and 150:
- 149 - сохраняется тр
Page 151 and 152:
- 151 - Рис. 34. Фрагмен
Page 153 and 154:
- 153 - Выводы по глав
Page 155 and 156:
- 155 - Заключение Одн
Page 157 and 158:
- 157 - Список источни
Page 159 and 160:
- 159 - [22]. Гулин А., Ма
Page 161 and 162:
- 161 - [45]. Нечепуренк
Page 163 and 164:
- 163 - [68]. Шилдт Г. Java 2
Page 165 and 166:
- 165 - [89]. Calado P., Ribeiro-Ne
Page 167 and 168:
- 167 - Intelligence (IJCAI-07). In
Page 169 and 170:
- 169 - [132]. Melnik S., Garcia-Mo
Page 171 and 172:
- 171 - Technology Conference of th
Page 173 and 174:
- 173 - [169]. Smirnov A., Levashov
Page 175 and 176:
- 175 - [189]. Zesch T., Mueller C.
Page 177 and 178:
Приложение 2. Акты в
Page 179 and 180:
- 179 -
Page 181 and 182:
- 181 - Махолёт|Экрано
Page 183 and 184:
- 183 - Приложение 5. В
Page 185 and 186:
- 185 - «Информатика»
Page 187 and 188:
- 187 - • В одну катег
show all

Search for synonyms in Wikipedia - Science Library

Create successful ePaper yourself

Delete template?

Save as template?