ÐбÑÑник наÑÐºÐ¾Ð²Ð¸Ñ Ð¿ÑаÑÑ. СеÑÑÑ - ÐаÑково-ÑÐµÑ Ð½ÑÑна бÑблÑоÑека ÐТУ ...
ÐбÑÑник наÑÐºÐ¾Ð²Ð¸Ñ Ð¿ÑаÑÑ. СеÑÑÑ - ÐаÑково-ÑÐµÑ Ð½ÑÑна бÑблÑоÑека ÐТУ ...
ÐбÑÑник наÑÐºÐ¾Ð²Ð¸Ñ Ð¿ÑаÑÑ. СеÑÑÑ - ÐаÑково-ÑÐµÑ Ð½ÑÑна бÑблÑоÑека ÐТУ ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
УДК 004.93'11<br />
Е.В. ВОЛЧЕНКО, канд. техн. наук, доц., Институт информатики и<br />
искусственного интеллекта ГВУЗ "Донецкий национальный<br />
технический университет", Донецк<br />
О СПОСОБЕ ОПРЕДЕЛЕНИЯ БЛИЗОСТИ ОБЪЕКТОВ<br />
ВЗВЕШЕННЫХ ОБУЧАЮЩИХ ВЫБОРОК<br />
В работе предложена метрика для определения расстояния между объектами<br />
обучающих выборок, имеющими вес. Выполнено расширение алгоритма k-ближайших<br />
соседей на взвешенные выборки w-объектов с вычислением расстояния на основе<br />
предложенной метрики. Проведены экспериментальные исследования, подтвердившие<br />
эффективность предложенного подхода. Библиогр.: 9 назв.<br />
Ключевые слова: w-объект, обучающая выборка, алгоритм k-ближайших соседей,<br />
метрика.<br />
Постановка проблемы и анализ литературы. Классификация<br />
объектов в обучающихся системах распознавания заключается в<br />
определении их близости к объектам обучающей выборки на основе<br />
выбранной метрики (функции расстояния).<br />
Метрикой называют неотрицательную вещественную функцию<br />
d ( X i , X j ) , удовлетворяющую следующим условиям [1]:<br />
1) d ( X i , X j ) ≥ 0 для всех объектов X i и X j обучающей выборки<br />
X ;<br />
2) d ( X i , X j ) = 0 тогда и только тогда, когда X i = Xj<br />
(аксиома<br />
тождества);<br />
3) d X , X ) = d(<br />
X , X ) (аксиома симметрии);<br />
( i j j i<br />
4) d ( X i , X j ) £ d(<br />
X i,<br />
X s ) + d(<br />
X s , X j ) , где X i , X j и X s – три<br />
любые объекта выборки X (аксиома треугольника).<br />
Особенности расположения объектов обучающей выборки в<br />
признаковом пространстве, недостаточный (избыточный) объем данных,<br />
наличие шума и неполных данных существенно повышают важность<br />
выбора метрики, позволяющей выполнять классификацию объектов с<br />
наибольшей эффективностью [2]. На сегодняшний день разработано<br />
значительное количество метрик, перечень которых можно найти,<br />
например, в [3], обеспечивающих высокую эффективность<br />
классификации, однако для некоторых видов систем распознавания этот<br />
вопрос остается открытым.<br />
ISSN 2079-0031 Вестник НТУ "ХПИ", 2012, № 38<br />
38