11.07.2015 Views

ВІСНИК - ХПІ - Національний технічний університет

ВІСНИК - ХПІ - Національний технічний університет

ВІСНИК - ХПІ - Національний технічний університет

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Для анализа корректности иерархической классификации был примененметод k -средних, который относится к итеративным методам эталонного типа.Сущность этого метода заключается в том, что процесс классификацииначинается с задания некоторых начальных условий (количество образуемыхкластеров, порог завершения процесса классификации и т.д.).Существует две модификации метода k -средних.1) первая предполагает пересчет центра тяжести кластера после каждогоизменения его состава;2) вторая предполагает пересчет центра тяжести кластера лишь после того,как будет завершен просмотр всех данных.В обоих случаях итеративный алгоритм этого метода минимизируетдисперсию внутри каждого кластера. Для дальнейших исследований выбранапервая его модификация, на основании которой получаем меньшее значениесреднеквадратического внутриклассового отклонения и большую плотностьточек X i в кластере.Оценку проведения кластеризации производили с помощью определенияфункционалов качества. Наилучшим по выбранному функционалу следуетсчитать такое разбиение, при котором достигается экстремум (min или max)значения целевой функции. В большинстве случаев алгоритмы кластеризации икритерии качества связаны между собой, т.е. определенный алгоритмобеспечивает получение экстремума значения соответствующего функционалакачества. Известные функционалы качества были проанализированы дляприменения при оценке качества классификации частных коэффициентоваварийности [12].1. Сумма квадратов расстояний до центров кластеров.p2F1d xixkk1iS ( , ) , (2)lгде k - номер кластера ( k =1, 2, …, p );xk- центр l - го кластера;xi- вектор значений переменных для i -го элемента совокупности (K i ),входящего в l - й кластер;d( xi, xk)- расстояние между i -м элементом совокупности (K i ) и центром l -го кластера.При применении этого критерия необходимо получить такое разбиениесовокупности элементов (K i ) на k -кластеров, при котором значение F1стремитсяк минимуму.2. Сумма внутри кластерных расстояний между элементами совокупности(K i ).Fp22 dij. (3)kjSВ этом случае наилучшим принимается такое разбиение, при которомдостигается минимальное значение F2, т.е. получены кластеры большейплотности.1 lISSN 2079.3944. Вісник НТУ “ХПІ». 2012. №44(950)47

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!