28.11.2014 Views

Збірник наукових праць. Серія - Науково-технічна бібліотека НТУ ...

Збірник наукових праць. Серія - Науково-технічна бібліотека НТУ ...

Збірник наукових праць. Серія - Науково-технічна бібліотека НТУ ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

УДК 004.93'11<br />

Е.В. ВОЛЧЕНКО, канд. техн. наук, доц., Институт информатики и<br />

искусственного интеллекта ГВУЗ "Донецкий национальный<br />

технический университет", Донецк<br />

О СПОСОБЕ ОПРЕДЕЛЕНИЯ БЛИЗОСТИ ОБЪЕКТОВ<br />

ВЗВЕШЕННЫХ ОБУЧАЮЩИХ ВЫБОРОК<br />

В работе предложена метрика для определения расстояния между объектами<br />

обучающих выборок, имеющими вес. Выполнено расширение алгоритма k-ближайших<br />

соседей на взвешенные выборки w-объектов с вычислением расстояния на основе<br />

предложенной метрики. Проведены экспериментальные исследования, подтвердившие<br />

эффективность предложенного подхода. Библиогр.: 9 назв.<br />

Ключевые слова: w-объект, обучающая выборка, алгоритм k-ближайших соседей,<br />

метрика.<br />

Постановка проблемы и анализ литературы. Классификация<br />

объектов в обучающихся системах распознавания заключается в<br />

определении их близости к объектам обучающей выборки на основе<br />

выбранной метрики (функции расстояния).<br />

Метрикой называют неотрицательную вещественную функцию<br />

d ( X i , X j ) , удовлетворяющую следующим условиям [1]:<br />

1) d ( X i , X j ) ≥ 0 для всех объектов X i и X j обучающей выборки<br />

X ;<br />

2) d ( X i , X j ) = 0 тогда и только тогда, когда X i = Xj<br />

(аксиома<br />

тождества);<br />

3) d X , X ) = d(<br />

X , X ) (аксиома симметрии);<br />

( i j j i<br />

4) d ( X i , X j ) £ d(<br />

X i,<br />

X s ) + d(<br />

X s , X j ) , где X i , X j и X s – три<br />

любые объекта выборки X (аксиома треугольника).<br />

Особенности расположения объектов обучающей выборки в<br />

признаковом пространстве, недостаточный (избыточный) объем данных,<br />

наличие шума и неполных данных существенно повышают важность<br />

выбора метрики, позволяющей выполнять классификацию объектов с<br />

наибольшей эффективностью [2]. На сегодняшний день разработано<br />

значительное количество метрик, перечень которых можно найти,<br />

например, в [3], обеспечивающих высокую эффективность<br />

классификации, однако для некоторых видов систем распознавания этот<br />

вопрос остается открытым.<br />

ISSN 2079-0031 Вестник НТУ "ХПИ", 2012, № 38<br />

38

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!