информация, язык, интеллект № 3 (77) 2011
информация, язык, интеллект № 3 (77) 2011
информация, язык, интеллект № 3 (77) 2011
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
ИНФОРМАЦИЯ, ЯЗЫК, ИНТЕЛЛЕКТ<br />
ISSN 0555-2656<br />
<strong>№</strong> 3 (<strong>77</strong>) <strong>2011</strong><br />
НАУЧНО-ТЕХНИЧЕСКИЙ ЖУРНАЛ<br />
Основан в октябре 1967 г.<br />
Учредитель и издатель<br />
Харьковский национальный университет радиоэлектроники<br />
Периодичность издания – 3 раза в год<br />
Харьков • ХНУРЭ • <strong>2011</strong>
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>) хНурэ<br />
2<br />
СОДЕРЖАНИЕ<br />
ТеореТические основы информаТики и кибернеТики. Теория инТеллекТа<br />
Бондаренко М.Ф., Шабанов-Кушнаренко Ю.П. Об алгебре конечных предикатов ........................................................... 3<br />
Бондаренко М.Ф., Шабанов-Кушнаренко Ю.П. Нормальные формы формул алгебры конечных предикатов.............. 14<br />
Бондаренко М.Ф., Шабанов-Кушнаренко Ю.П. Уравнения теории <strong>интеллект</strong>а .............................................................. 30<br />
Голян Н.В., Шабанов-Кушнаренко Ю.П. Предикатные модели неявных связей<br />
между процедурами бизнес-процесса ........................................................................................................................ 46<br />
Русакова Н.Е. О методе расслоения конечного предиката ............................................................................................. 50<br />
маТемаТическое моделирование. сисТемный анализ. ПриняТие решений<br />
Bespalov Yu., Gorodnyanskiy I., Zholtkevych G., Zaretskaya I., Nosov K., Bondarenko T., Kalinovskaya K.,<br />
Carrero Y. Discrete Dynamical Modeling of System Characteristics of a Turtle’s Walk in Ordinary<br />
Situations and After Slight Stress .................................................................................................................................... 54<br />
Петров Э.Г., Губаренко Е.В. Роль, задачи и методы государственного управления<br />
при реализации концепции устойчивого развития ................................................................................................... 60<br />
Кузьменко С.В. Теоретические основы идеографического метода ................................................................................. 65<br />
Калита Н.И., Гурина А.В. Синтез модели многофакторного оценивания эффективности команды проекта ............. 70<br />
Писклакова О.А., Шмидт Д.Е., Алексенко В.С. Модель выбора оптимального партнера предприятия<br />
в условиях многокритериальности и неопределенности .......................................................................................... 74<br />
Писклакова В.П., Писклакова О.А., Пряничникова А.А. Создание регионального мониторинга как средства<br />
реализации концепции устойчивого развития социально-экономических систем ................................................ 78<br />
инТеллекТуальная обрабоТка информации. расПознавание образов<br />
Гороховатский В.А., Полякова Т.В. Оптимальные методы сопоставления структурных описаний видеообъектов ..... 85<br />
Зацеркляний М.М., Єрохін А.Л., Бабій А.С., Турута О.П. Розробка методу виявлення сезонних коливань<br />
з застосуванням нечіткого згладжування на базі f-перетворення ............................................................................ 89<br />
Шкловец А.В., Аксак Н.Г. Построение четырёхугольных карт Кохонена на основе триангуляции Делоне<br />
для визуализации многомерных данных .................................................................................................................... 94<br />
Мартиненко С.С., Джулгам Саад. Стиснення та розпізнавання медичної відеоінформації ......................................... 98<br />
Кораблев Н.М., Фомичев А.А. Кластеризация данных методом k-means с использованием<br />
искусственных иммунных систем .............................................................................................................................102<br />
Барило К.В. Оптимізація рівня селекції координат еталонних векторів при розпізнаванні електронограм ...............107<br />
Бенаддия Абдельлатиф, Михаль О.Ф. Локально-параллельный стековый алгоритм<br />
бинарного клеточного автомата ................................................................................................................................112<br />
Мохамад Али, Михаль О.Ф. Локально-параллельная сортировка ограниченных малых наборов данных ..................119<br />
информационные Технологии и Программно-Технические комПлексы<br />
Гофман Е.А., Олейник А.А., Субботин С.А. Индукция лингвистических правил<br />
с использованием деревьев решений ....................................................................................................................... 126<br />
Зайцев С.А., Субботин С.А. Модель отрицательного отбора с использованием маскированных детекторов<br />
и метод её обучения для решения задач диагностирования .....................................................................................131<br />
Танянский С.С., Мальков Ю.А. Отображение элементов реляционной модели данных<br />
в элементы дедуктивной модели .............................................................................................................................. 136<br />
Почанский О.М. Извлечение частично-структурированной (значимой) информации<br />
из динамических web-документов ............................................................................................................................ 143<br />
сТрукТурная, Прикладная и маТемаТическая лингвисТика<br />
Бондаренко М.Ф., Коноплянко З.Д., Четвериков Г.Г. Концепції уніфікації інформаційно-інтелектуальних<br />
технологій в системах мовлення ................................................................................................................................150<br />
Павлишенко Б.М. Квантовий алгоритм пошуку ключових слів у масивах текстових даних .........................................157<br />
Об авторах ....................................................................................................................................................................... 162<br />
Правила оформлення рукописів для авторів науково-технічного журналу «Біоніка інтелекту» ................................ 165
ТеореТические основы информаТики и кибернеТики. Теория инТеллекТа<br />
УДК 519.7<br />
Введение<br />
Теория <strong>интеллект</strong>а обслуживает технику <strong>интеллект</strong>а<br />
(то есть компьютеризацию и информатизацию),<br />
является ее математическим и физическим<br />
фундаментом. В соответствии с этим она делится<br />
на математику и физику <strong>интеллект</strong>а. Иногда говорят<br />
о теории искусственного <strong>интеллект</strong>а. Нам<br />
представляется это не вполне оправданным. Хотя<br />
<strong>интеллект</strong> невозможен без материального носителя,<br />
однако он может быть реализован как на<br />
естественной (человек), так и на искусственной<br />
(машина) физической основе. Механизмы разума<br />
можно изучать с общих позиций в рамках единой<br />
теории <strong>интеллект</strong>а, не привязываясь при этом к<br />
конкретному способу материальной реализации<br />
<strong>интеллект</strong>уальной системы.<br />
Компьютер – машина математическая, он может<br />
воспроизвести лишь те структуры и функции,<br />
которые описаны в строго формализованном виде.<br />
Чтобы иметь возможность получать такие описания,<br />
необходимы математический <strong>язык</strong> описания<br />
и неформализованный материал о строении<br />
и функциях систем естественного <strong>интеллект</strong>а,<br />
прежде всего <strong>интеллект</strong>а человеческого. Теория<br />
<strong>интеллект</strong>а имеет многовековую предысторию.<br />
Существенный вклад в нее внесли многие выдающиеся<br />
мыслители. Особо следует отметить вклад<br />
Пифагора, Парменида, Платона, Аристотеля, Декарта,<br />
Лейбница, Ньютона, Буля, Фреге, Гильберта<br />
и Рассела.<br />
Цифровая вычислительная техника в настоящее<br />
время стала одним из главных рычагов<br />
дальнейшего научно-технического прогресса,<br />
основой автоматизации процессов управления экономикой,<br />
производственных процессов, проектноконструкторских<br />
и научно-исследовательских<br />
работ, важным источником повышения производительности<br />
труда и роста благосостояния народа,<br />
необходимым звеном в системе обороны страны.<br />
Электронные цифровые вычислительные машины<br />
представляют собой универсальное средство переработки<br />
информации, с их помощью, в принципе,<br />
можно автоматизировать любые виды умственного<br />
и физического труда [1]. Однако огромные потен-<br />
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
ХНУРЭ, г. Харьков, Украина<br />
ОБ АЛГЕБРЕ КОНЕЧНЫХ ПРЕДИКАТОВ<br />
Рассмотрены проблемы построения эффективного математического <strong>язык</strong>а описания структур и<br />
функций систем естественного <strong>интеллект</strong>а. В качестве формального <strong>язык</strong>а, на котором можно было<br />
бы математически описывать структуры и функции естественного <strong>интеллект</strong>а, используется алгебра<br />
конечных предикатов.<br />
ТЕОРИЯ ИНТЕЛЛЕКТА, АЛФАВИТНЫЙ ОПЕРАТОР, ПРЕДИКАТ, АЛГЕБРА КОНЕЧНЫХ<br />
ПРЕДИКАТОВ<br />
циальные возможности вычислительных машин<br />
фактически используются далеко не в полной мере.<br />
Многие виды работ пока не поддаются автоматизации,<br />
а это серьезно сдерживает рост производительности<br />
труда, темпы прогресса. В чем причина<br />
такого парадоксального положения? Очевидно,<br />
в том, что многие работы, успешно выполняемые<br />
людьми, пока не под силу цифровой вычислительной<br />
машине: слишком еще слаб ее <strong>интеллект</strong>.<br />
Как же повысить уровень машинного <strong>интеллект</strong>а?<br />
Для облегчения решения этой проблемы имеет<br />
смысл попытаться получить подсказку у природы,<br />
то есть пойти по бионическому [2] пути и обратиться<br />
к изучению человеческого <strong>интеллект</strong>а: ведь<br />
он способен выполнять информационные работы,<br />
недоступные пока вычислительной машине. Можно<br />
изучать две стороны человеческого <strong>интеллект</strong>а:<br />
1) материальную сторону <strong>интеллект</strong>а – мозг,<br />
нервную систему, организм человека; 2) деятельность<br />
<strong>интеллект</strong>а, его функции, выражающиеся в<br />
поведении и действиях человека. Научная область,<br />
нацеленная на разработку описаний структуры и<br />
функций человеческого <strong>интеллект</strong>а, которые можно<br />
было бы использовать в деле совершенствования<br />
цифровых вычислительных машин, называется<br />
теорией <strong>интеллект</strong>а. При таком определении<br />
теории <strong>интеллект</strong>а ее успехи будут оцениваться не<br />
столько тем, как далеко эта теория продвинулась в<br />
познании <strong>интеллект</strong>а человеческого, но, главным<br />
образом, тем, какой уровень совершенства <strong>интеллект</strong>а<br />
машинного она смогла обеспечить.<br />
Какие структуры и функции человеческого<br />
<strong>интеллект</strong>а должна изучать теория <strong>интеллект</strong>а?<br />
Очевидно, те и только те, которые, в принципе,<br />
доступны <strong>интеллект</strong>у машинному. Машинный же<br />
<strong>интеллект</strong>, то есть цифровая вычислительная машина,<br />
может действовать только механически, он<br />
способен воспроизводить лишь детерминированные,<br />
дискретные и конечные информационные<br />
процессы. Детерминированные процессы – это процессы<br />
с однозначным исходом, в них отсутствует<br />
фактор случайности. Дискретные процессы – это<br />
процессы, в которых <strong>информация</strong> имеет вид отдельных<br />
порций или квантов – цифр, букв, слов,<br />
3
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 3–13 хНурэ<br />
формул и т.д., в них отсутствует фактор непрерывности.<br />
Конечные процессы – это такие процессы, в<br />
которых может участвовать лишь конечное число<br />
единиц информации, в них отсутствует фактор<br />
бесконечности. Таким образом, теория <strong>интеллект</strong>а<br />
представляет собой науку о математическом<br />
описании детерминированных, дискретных и конечных<br />
<strong>интеллект</strong>уальных процессов, воспроизводимых<br />
человеческим разумом, и структур, обеспечивающих<br />
реализацию таких процессов, которая<br />
ориентирована на совершенствование цифровой<br />
вычислительной техники и ее практическое использование.<br />
1. Алфавитные операторы<br />
Для того чтобы иметь возможность развивать<br />
теорию <strong>интеллект</strong>а, прежде всего необходимо располагать<br />
формальным <strong>язык</strong>ом, на котором можно<br />
было бы математически описывать интересующие<br />
нас структуры и функции человеческого <strong>интеллект</strong>а.<br />
В качестве такого <strong>язык</strong>а мы используем алгебру<br />
конечных предикатов, описание которой начнем<br />
с введения понятия конечного алфавитного оператора.<br />
К этому понятию естественным образом<br />
приводит ознакомление с принципом действия<br />
цифровой вычислительной машины. Любая вычислительная<br />
система, будь то машина в целом или<br />
ее отдельный блок, представляет собой устройство,<br />
осуществляющее преобразование информации.<br />
Эта система имеет вход, через который в нее поступает<br />
<strong>информация</strong>, подлежащая обработке, и выход,<br />
через который выдается выходная <strong>информация</strong>,<br />
сформированная вычислительной системой в ответ<br />
на поступившую в нее входную информацию.<br />
Как входная, так и выходная <strong>информация</strong> имеет<br />
вид знаковой последовательности, называемой<br />
словом. Знаки, из которых составлено слово, называются<br />
буквами.<br />
Любая вычислительная система подвержена<br />
следующим ограничениям: 1) алфавит букв, из которых<br />
строятся слова для любой конкретной вычислительной<br />
системы, всегда конечен; 2) длина<br />
слов, которые способна воспринимать и формировать<br />
эта система, ограничена некоторым конечным<br />
наперед заданным числом букв, определяемым<br />
конструкцией системы, ее быстродействием и сроком<br />
службы; 3) реакции вычислительной системы<br />
строго детерминированы: повторное предъявление<br />
входного слова всегда приводит к формированию<br />
системой того же самого выходного слова.<br />
Принципиально важно то, что человеческий<br />
<strong>интеллект</strong> в функциональном отношении весьма<br />
сходен с цифровой вычислительной машиной и<br />
подвержен тем же ограничениям, что и любая вычислительная<br />
система. Так же, как и вычислительная<br />
машина, человеческий <strong>интеллект</strong> способен<br />
воспринимать, преобразовывать и формировать<br />
4<br />
информацию. Информация, которой оперирует<br />
человеческий <strong>интеллект</strong>, имеет вид слов, в роли<br />
которых выступают тексты, звучащая речь, чувственные<br />
образы предметов. Роль входа информации<br />
у человека выполняют органы чувств, роль выхода<br />
информации – органы движения и речи. Эти<br />
органы обладают конечной чувствительностью<br />
и конечной разрешающей способностью, поэтому<br />
в каждый момент времени человек может воспринимать<br />
сигналы (буквы) только из конечного<br />
множества (алфавита). Органы чувств, движения<br />
и речи обладают конечной полосой пропускания<br />
[1], поэтому они могут передать к <strong>интеллект</strong>у и от<br />
него лишь конечное число букв в единицу времени.<br />
Срок человеческой жизни ограничен, поэтому<br />
ограничена длина слов, которые могут обрабатываться<br />
<strong>интеллект</strong>ом человека. Весьма вероятно,<br />
что реакции человека, формируемые его органами<br />
движения и речи, всецело определяются внешними<br />
воздействиями на этого человека, имевшими место<br />
в течение его предшествующей жизни. К числу<br />
этих воздействий на человека следует относить не<br />
только информацию, поступившую через органы<br />
чувств, но также и генетическую информацию,<br />
переданную его родителями. Важно отметить, что<br />
генетическая <strong>информация</strong> дискретна и конечна.<br />
Рассмотрим конечное множество A={a 1 , a 2 ,...,<br />
a k }, называемое алфавитом. Элементы a 1 , a 2 ,..., a k<br />
этого множества называются буквами алфавита A.<br />
Число букв k в алфавите может быть произвольным.<br />
Примерами алфавитов могут служить: 1) русский<br />
алфавит, состоящий из 33 букв а, б,..., ю, я; 2) множество<br />
{0, 1,..., 9} всех десятичных цифр; 3) множество<br />
всех различных символов, использованных в<br />
этой статье (русские, латинские и греческие буквы<br />
различных шрифтов, знаки препинания, интервал<br />
между словами, математические знаки и т. п.);<br />
4) множество символов, имеющихся на клавиатуре<br />
какой-либо вычислительной машины.<br />
Любая последовательность σ 1 σ 2 ...σ m букв σ 1 ,<br />
σ 2 ,..., σ m алфавита A называется словом в алфавите<br />
A. Число m букв в слове называется длиной слова.<br />
Длину слова ничем не ограничивают, поэтому m<br />
может быть любым натуральным числом. Заметим,<br />
что буквы в слове могут повторяться, так что на<br />
различных местах в слове могут встречаться одинаковые<br />
буквы. Последовательности, имеющие в<br />
своем составе только одну букву, и последовательности,<br />
не содержащие ни одной буквы, также считаются<br />
словами. В последнем случае говорят, что<br />
слово имеет нулевую длину. Такое слово называется<br />
пустым и обозначается нами символом *. Хотя<br />
введение пустого слова, быть может, выглядит неестественным,<br />
однако оно необходимо для логической<br />
завершенности понятия слова. Рассмотрим<br />
примеры слов: 1) русские слова мальчик, лампа и<br />
т. п. могут рассматриваться как слова в русском
алфавите (в только что определенном смысле);<br />
2) десятичная запись любого натурального числа<br />
есть слово в алфавите {0, 1,..., 9}; 3) любое предложение<br />
этой статьи есть слово в алфавите, состоящим<br />
из всех различных символов, встречающихся<br />
в этой статье; 4) весь текст данной статьи можно<br />
считать словом в том же алфавите.<br />
Пусть A – произвольно выбранный непустой<br />
алфавит. Рассмотрим множество М всех слов, составленных<br />
из букв алфавита A. Поскольку в этом<br />
множестве встречаются слова сколь угодно большой<br />
длины, то общее число слов в нем бесконечно.<br />
Формально множество М может быть представлено<br />
как объединение всех декартовых степеней алфавита<br />
A, таким образом, М=A 0 ∪A 1 ∪A 2 ∪... . Любое<br />
подмножество [3] L множества М всех слов алфавита<br />
A называется <strong>язык</strong>ом над алфавитом A. Язык L<br />
может быть как конечным, так и бесконечным. Примерами<br />
<strong>язык</strong>ов могут служить: 1) множество всех<br />
русских слов, представляющее собой конечный<br />
<strong>язык</strong> над русским алфавитом; 2) множество десятичных<br />
кодов всех натуральных чисел, представляющее<br />
собой бесконечный <strong>язык</strong> над алфавитом<br />
десятичных цифр; 3) совокупность всевозможных<br />
предложений, которые можно построить из знаков,<br />
фигурирующих в этой статье. Поскольку длина<br />
предложений, используемых в естественном<br />
<strong>язык</strong>е, ограничена, то в последнем случае мы имеем<br />
дело с конечным <strong>язык</strong>ом.<br />
Пусть A – произвольно выбранный непустой<br />
алфавит, а М – множество всех слов этого алфавита.<br />
Любая функция Y=FX, отображающая слова<br />
Х из множества М в слова Y множества М, называется<br />
алфавитным оператором, заданным в множестве<br />
М. Иными словами, алфавитным оператором<br />
называется всякое однозначное соответствие, которое<br />
сопоставляет словам какого-либо алфавита<br />
слова того же алфавита. Совокупность L 1 всех тех<br />
слов, для каждого из которых алфавитный оператор<br />
F ставит в соответствие некоторое вполне<br />
определенное слово, называется областью определения<br />
или входным <strong>язык</strong>ом алфавитного оператора<br />
F. Может случиться, что алфавитный оператор F<br />
некоторым словам множества М не ставит в соответствие<br />
никакого слова, так что входной <strong>язык</strong> не<br />
обязательно совпадает с множеством М. Множество<br />
L 2 всех слов, являющихся значениями алфавитного<br />
оператора F, называется его областью значений<br />
или выходным <strong>язык</strong>ом.<br />
Слова входного <strong>язык</strong>а называются входными<br />
словами алфавитного оператора, слова выходного<br />
<strong>язык</strong>а – его выходными словами. Алфавитный оператор,<br />
входной <strong>язык</strong> которого совпадает с множеством<br />
М, называется всюду определенным; если же<br />
входной <strong>язык</strong> является лишь частью множества М,<br />
то алфавитный оператор называется частичным.<br />
Примером всюду определенного алфавитного опе-<br />
ОБ АЛГЕБрЕ КОНЕЧНЫх ПрЕДИКАТОВ<br />
ратора может служить оператор, заданный на множестве<br />
десятичных кодов всех натуральных чисел,<br />
который десятичному коду каждого натурального<br />
числа ставит в соответствие десятичный код квадрата<br />
этого числа. Примером частичного алфавитного<br />
оператора может служить оператор, заданный<br />
на том же множестве, который десятичному коду<br />
натурального числа ставит в соответствие десятичный<br />
код квадратного корня этого числа, но только<br />
при условии, что этот корень оказывается натуральным<br />
числом.<br />
Описанное выше понятие алфавитного оператора<br />
неплохо подходит для того, чтобы служить<br />
средством математического описания деятельности<br />
<strong>интеллект</strong>а, то есть объективно наблюдаемых<br />
реакций <strong>интеллект</strong>а на внешние воздействия. Информация,<br />
воспринимаемая <strong>интеллект</strong>ом, соответствует<br />
входным словам некоторого алфавита;<br />
<strong>информация</strong> формируемая <strong>интеллект</strong>ом, соответствует<br />
выходным словам. Закономерности преобразования<br />
информации <strong>интеллект</strong>ом, то есть<br />
функции <strong>интеллект</strong>а, соответствуют тем или иным<br />
алфавитным операторам, преобразующим входные<br />
слова в выходные. Задача математического<br />
описания функций <strong>интеллект</strong>а заключается в том,<br />
чтобы указать соответствующие этим функциям<br />
алфавитные операторы.<br />
2. Конечные алфавитные операторы<br />
И все же понятие алфавитного оператора обладает<br />
одним существенным недостатком: его задают<br />
на бесконечном множестве слов, содержащем<br />
слова сколь угодно большой длины. Это обстоятельство<br />
приводит к потенциальному присутствию<br />
бесконечности в понятии алфавитного оператора<br />
[4], что создает определенные неудобства при<br />
математическом описании функций <strong>интеллект</strong>а<br />
и практическом их применении. Этих неудобств<br />
можно избежать, заменив понятие алфавитного<br />
оператора близким ему понятием конечного алфавитного<br />
оператора. Отличие конечного алфавитного<br />
оператора от только что описанного алфавитного<br />
оператора состоит лишь в том, что он задается<br />
не на бесконечном множестве A0∪A1∪A2∪… слов<br />
различной длины, а на конечном множестве Am слов одинаковой длины m, составленных из букв<br />
алфавита А.<br />
Понятие конечного алфавитного оператора<br />
очень удобно для того, чтобы служить средством<br />
математического описания функций <strong>интеллект</strong>а.<br />
Ограничение, наложенное на длину слов, не может<br />
служить препятствием для его использования в<br />
теории <strong>интеллект</strong>а, поскольку, как указано выше,<br />
<strong>интеллект</strong> человека подвержен такому же ограничению.<br />
В качестве числа m должно быть выбрано<br />
число, не меньшее максимальной длины слов, с<br />
которыми может оперировать изучаемый интел-<br />
5
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
лект. Возникает, правда, затруднение, вызванное<br />
тем, что <strong>интеллект</strong> обычно оперирует словами<br />
различной длины, тогда как в понятии конечного<br />
алфавитного оператора фигурируют слова только<br />
одинаковой длины.<br />
Затруднение это, однако, легко преодолевается<br />
за счет введения в алфавит А дополнительной буквы<br />
#, называемой знаком пробела или просто пробелом.<br />
Слово, имеющее длину, меньшую, чем m, при его<br />
математическом описании заменяется словом длины<br />
m, левая часть которого совпадает с исходным<br />
словом, а правая часть представляет собой последовательность<br />
пробелов (с тем же успехом можно<br />
было бы сделать и наоборот, поменяв местами левую<br />
и правую части). При чтении формальной записи<br />
слова знаки пробела, стоящие в слове правее<br />
всех остальных букв, не должны приниматься во<br />
внимание. Слово, составленное из одних пробелов,<br />
должно интерпретироваться как пустое слово.<br />
Например, если выбрано m=6, то слово лист будет<br />
формально представлено в виде слова лист##. Положение<br />
здесь такое же, как при машинной записи<br />
числовых кодов: длина всех кодов принята одинаковой,<br />
однако нули, стоящие в левой части кода,<br />
при его чтении во внимание не принимаются. Если<br />
бы мы определили понятие конечного алфавитного<br />
оператора таким образом, чтобы в его входной<br />
и выходной <strong>язык</strong>и вошли и слова меньшей длины,<br />
чем m, то это существенно усложнило бы математический<br />
<strong>язык</strong> для записи таких операторов.<br />
Множество М, на котором задан конечный алфавитный<br />
оператор, содержит c=k m слов, то есть<br />
ровно столько, сколько имеется всех различных<br />
m-разрядных k-ичных числовых кодов. Всего существует<br />
c c различных конечных алфавитных операторов,<br />
заданных на множестве М. Для каждой<br />
изучаемой функции <strong>интеллект</strong>а, в принципе, можно<br />
выбрать число k букв, алфавит А и предельную<br />
длину слов m такие, что в множестве всевозможных<br />
конечных алфавитных операторов, заданных<br />
на A m , всегда найдется такой конечный алфавитный<br />
оператор, который может быть принят в качестве<br />
адекватного математического описания этой<br />
функции <strong>интеллект</strong>а. Задача состоит в том, чтобы,<br />
сообразуясь с фактическими свойствами изучаемой<br />
функции <strong>интеллект</strong>а, суметь выделить этот<br />
оператор и записать его в виде формулы на некотором<br />
математическом <strong>язык</strong>е. Реализуя полученную<br />
формулу средствами цифровой вычислительной<br />
техники, можно будет изученную функцию <strong>интеллект</strong>а<br />
затем искусственно воспроизвести.<br />
3. Конечные предикаты<br />
Для того чтобы иметь возможность математически<br />
описывать функции <strong>интеллект</strong>а, нам необходим<br />
формальный <strong>язык</strong>, на котором можно было<br />
бы вести такое описание. Формальный <strong>язык</strong> должен<br />
6<br />
быть выбран с таким расчетом, чтобы на нем можно<br />
было в удобной форме записать любой конечный<br />
алфавитный оператор. Такой <strong>язык</strong> дает нам описываемая<br />
ниже алгебра конечных предикатов. Введем<br />
понятие конечного предиката. Пусть А – конечный<br />
алфавит, состоящий из k букв a1 , a2 ,…, ak , Σ – множество,<br />
состоящее из двух элементов, обозначаемых<br />
символами 0, 1 и называемых соответственно ложью<br />
и истиной. Переменную, заданную на множестве А,<br />
будем называть буквенной, переменную, заданную<br />
на множестве Σ, – логической. Конечным n-местным<br />
предикатом над алфавитом А называется любая<br />
функция f(x1 , x2 ,…, xn )=t от n буквенных аргументов<br />
x1 , x2 ,…, xn , заданных на множестве А, и принимающая<br />
логические значения t. Иногда будем называть<br />
конечный предикат f k-ичным, подчеркивая тем самым,<br />
что его алфавит А состоит из k букв.<br />
Любой конечный предикат f можно, в принципе,<br />
задать с помощью таблицы его значений. В этой<br />
таблице каждому набору значений аргументов (x1 ,<br />
x2 ,…, xn ) ставится в соответствие значение t предиката<br />
f. В виде примера таблицей 1 задан двуместный<br />
предикат t=f(x1 , x2 ), определенный над алфавитом<br />
А={а, м, п}. По таблице находим, что, например, на<br />
наборе (x1 , x2 ) значений аргументов x1 , x2 , равном<br />
(а, м), предикат f принимает значение 0, на наборе<br />
(п, м) – значение 1. Аналогично находим значения<br />
предиката и для остальных наборов. Расставив в<br />
последней строке таблицы логические значения<br />
каким-либо иным способом, получим другой двуместный<br />
предикат над тем же алфавитом.<br />
Таблица 1<br />
х 1 а а а м м м п п п<br />
х 2 а м п а м п а м п<br />
t 0 0 1 1 1 0 0 1 1<br />
Для упрощения дальнейшего изложения сейчас<br />
нам будет полезно познакомиться с некоторыми<br />
сведениями об n-разрядных k-ичных числовых кодах.<br />
При построении k-ичных кодов используют k<br />
знаков 0, 1,…, k-1, называемых k-ичными цифрами.<br />
Число k называется основанием k-ичной системы<br />
счисления. Цифры в k-ичном коде располагаются<br />
в определенном порядке, значение каждой цифры<br />
определяется ее положением в коде. Так, например,<br />
в десятичной системе счисления в записи<br />
179 цифра 1 обозначает число 100 или 1 . 10 2 , цифра<br />
7 – число 70 или 7 . 10 1 , цифра 9 – число 9 или 9 . 10 0 .<br />
Сумма этих чисел дает значение кода:<br />
179=1 . 102 +7 . 101 +9 . 100 .<br />
В общем виде десятичный код а1а2 ...аi ...аn-1аn ,<br />
где а1 , а2 ,..., аi ,..., аn-1 , аn – десятичные цифры; n –<br />
число разрядов в коде; i – номер разряда кода, обозначает<br />
число:<br />
а1а2 ...аi ...аn-1аn =а110n-1 +а210n-2 +...+аi10n-i +...+<br />
+аn-1101 +аn100 .
Как узнать, какое число представляет собой тот<br />
или иной k-ичный код? Для этого достаточно его<br />
перевести в привычный нам десятичный код. Этот<br />
перевод можно осуществить, воспользовавшись<br />
определением k-ичного кода. Пусть b 1 b 2 ...b i ...b n-1 b n<br />
– k-ичный код, где b 1 , b 2 ,..., b i ,..., b n-1 , b n – какиенибудь<br />
произвольно выбранные k-ичные цифры.<br />
По определению этот код представляет собой следующее<br />
число:<br />
b 1 b 2 ...b i ...b n-1 b n =b 1 k n-1 +b 2 k n-2 +...<br />
...+b i k n-i +...+b n-1 k 1 +b n k 0 .<br />
В качестве примера переведем двоичный код<br />
10110011 в десятичный:<br />
10110011 2 =<br />
=1 . 2 7 +0 . 2 6 +1 . 2 5 +1 . 2 4 +0 . 2 3 +0 . 2 2 +1 . 2 1 +1 . 2 0 =179 10 .<br />
При одновременном рассмотрении кодов с различными<br />
основаниями, во избежание путаницы,<br />
справа внизу у кода будем указывать его основание.<br />
Рассмотрим теперь способ обратного перевода<br />
десятичного кода числа в k-ичный. Пусть задано<br />
некоторое число N в десятичном коде, которое мы<br />
хотим перевести в k-ичный код. Предположим, что<br />
b 1 b 2 ...b n есть k-ичный код числа N. Тогда:<br />
N=b 1 k n-1 +b 2 k n-2 +...+b n-1 k 1 +b n k 0 .<br />
Разделим число N на k:<br />
N<br />
k<br />
n−2n−30bn = bk 1 + bk 1 + ... + bn−2k + .<br />
k<br />
Целая часть частного N 1 этого деления равна:<br />
N 1 =b 1 k n-2 +b 2 k n-3 +…+b n-2 k 1 +b n-1 k 0 .<br />
В остатке получаем b n . Итак, в результате деления<br />
числа N на k в остатке получаем последний<br />
разряд k-ичного кода этого числа. Выполним второе<br />
деление, разделив число N 1 на k. В целой части<br />
частного получаем число<br />
N 2 =b 1 k n-3 +b 2 k n-4 +…+b n-3 k 1 +b n-2 k 0 ,<br />
а в остатке – b n-1 , то есть предпоследний разряд<br />
k-ичного кода числа N. При третьем делении в остатке<br />
получаем b n-2 и т. д. При n-ном делении в остатке<br />
получаем b 1 , то есть первый разряд k-ичного кода, а<br />
в целой части частного – нуль.<br />
В итоге приходим к следующему правилу перевода<br />
десятичного кода в k-ичный. Для перевода десятичного<br />
кода в k-ичный код следует разделить его<br />
на k, полученную целую часть частного снова разделить<br />
на k и т. д. Деление продолжать до тех пор,<br />
пока в целой части частного получится нуль. Считывая<br />
остатки этих делений в обратном порядке,<br />
получаем k-ичный код числа. В качестве примера<br />
переведем число 169 в двоичный код. Выполняем<br />
последовательные деления заданного числа на 2, в<br />
скобках записываем остатки делений: 169:2=84 (1),<br />
ОБ АЛГЕБрЕ КОНЕЧНЫх ПрЕДИКАТОВ<br />
84:2=42 (0), 42:2=21 (0), 21:2=10 (1), 10:2=5 (0),<br />
5:2=2 (1), 2:2=1 (0), 1:2=0 (1). Считывая остатки,<br />
получаем двоичный код числа: 16910 =101010012 .<br />
Введем число L(n, k) всех различных n-разрядных<br />
k-ичных кодов. Оно выражается формулой L(n,<br />
k)=kn . Для примера подсчитаем число всех трехразрядных<br />
восьмиричных кодов: L(3, 8)=83 =512. Наборы<br />
значений аргументов (x1 , x2 ,…, xn ) n-местных<br />
k-ичных предикатов удобно интерпретировать как<br />
n-разрядные k-ичные числовые коды. При этом<br />
буквы a1 , a2 ,…, ak алфавита А интерпретируем как<br />
k-ичные цифры соответственно 0, 1,…, k-1. В таблице<br />
значений предиката наборы значений аргументов<br />
будем располагать в порядке возрастания<br />
представляемых ими чисел. Именно в таком<br />
порядке расположены, к примеру, двухразрядные<br />
троичные коды в табл. 1. В этом случае буквы а, м,<br />
п интерпретируем соответственно как троичные<br />
цифры 0, 1, 2. Введем число М(n, k) всех различных<br />
наборов значений аргументов n-местного k-ичного<br />
предиката. Очевидно, что M(n, k)=L(n, k)=kn . Число<br />
столбцов в таблице значений предиката, в которых<br />
располагаются наборы значений аргументов,<br />
определяется величиной M(n, k). Например, число<br />
столбцов табл. 1 равно M(2, 3)=32 =9. Каждому<br />
набору значений конечного предиката присвоим<br />
свой номер, в качестве которого примем число, соответствующее<br />
этому набору при его интерпретации<br />
в виде числового кода.<br />
Пронумеруем все k-ичные n-местные предикаты.<br />
С этой целью будем интерпретировать последовательность<br />
значений предиката, расположенную<br />
в нижней строке его таблицы, как kn-разрядный<br />
двоичный код. При этом символ 0 интерпретируем<br />
как цифру нуль, а символ 1 – как цифру один. Число,<br />
соответствующее этому коду, примем в качестве<br />
номера конечного предиката. К примеру, предикату,<br />
представленному табл. 1, присваиваем номер<br />
001110011, что соответствует числу 115 в десятичной<br />
записи. Пусть N(n, k) — число всех различных<br />
n-местных k-ичных предикатов. Очевидно, оно<br />
совпадает с числом всех kn-разрядных двоичных<br />
кодов, поэтому N(n, k)=L(kn n<br />
( k )<br />
, 2)= 2 . В виде примера<br />
определим число всех различных двуместных<br />
2<br />
( 3 ) 9<br />
троичных предикатов: N ( 23 , ) = 2 = 2 = 512.<br />
4. Применения конечных предикатов<br />
Каждому конечному алфавитному оператору<br />
можно поставить в соответствие некоторый свой<br />
конечный предикат. Сделать это можно следующим<br />
образом. Пусть<br />
F(x1x2…xm )=y1y2…ym – произвольно выбранный конечный алфавитный<br />
оператор, преобразующий входные слова x1x2… xm длины m в выходные слова y1y2…ym той же длины,<br />
составленные из букв алфавита А. Построим<br />
7
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
2m-местный конечный предикат f(x 1 , x 2 ,…, x m , y 1 ,<br />
y 2 ,…, y m ) над алфавитом А, руководствуясь следующим<br />
правилом:<br />
8<br />
f( x , x , …, x , y , y , … , y ) =<br />
1 2 m 1 2 m<br />
⎧1,<br />
если F( x1x2... xm) = yy 1 2...<br />
ym,<br />
= ⎨<br />
⎩0,<br />
если F( x1x2... xm) ≠ yy 1 2...<br />
ym.<br />
Запишем уравнение:<br />
(1)<br />
f(x 1 , x 2 ,…, x m , y 1 , y 2 ,…, y m )=1. (2)<br />
Это уравнение связывает переменные x 1 , x 2 ,…,<br />
x m , y 1 , y 2 ,…, y m некоторым отношением [5]. Подставляя<br />
в (2) буквы x 1 , x 2 ,…, x m входного слова x 1 x 2 …<br />
x m алфавитного оператора F, получим в результате<br />
решения этого уравнения буквы y 1 , y 2 ,…, y m выходного<br />
слова y 1 y 2 …y m . Таким образом, предикат<br />
f, построенный указанным способом, содержит в<br />
себе всю информацию об интересующем нас алфавитном<br />
операторе F. С его помощью можно<br />
определить выходное слово алфавитного оператора,<br />
представляемого этим предикатом, для любого<br />
входного слова.<br />
Важно отметить, что точно таким же способом<br />
можно задать с помощью конечных предикатов не<br />
только всюду определенные, но также и любые частичные<br />
конечные алфавитные операторы. Если<br />
для входного слова x 1 x 2 …x m алфавитный оператор<br />
F не ставит в соответствие никакого выходного<br />
слова, это значит, что уравнение (2) для заданного<br />
набора значений аргументов (x 1 , x 2 ,…, x m ) не имеет<br />
ни одного решения относительно набора переменных<br />
(y 1 , y 2 ,…, y m ), то есть что решения этого<br />
уравнения не существует. Важно, что с помощью<br />
одного конечного предиката можно задать целое<br />
семейство конечных алфавитных операторов. Это<br />
достигается введением в предикат дополнительной<br />
переменной z, значениями которой служат номера<br />
задаваемых алфавитных операторов. Пусть, к<br />
примеру, нам нужно представить в виде конечного<br />
предиката семейство, состоящее из трех алфавитных<br />
операторов:<br />
F 1 (x 1 x 2 …x m )=y 1 y 2 …y m ,<br />
F 2 (x 1 x 2 …x m )=y 1 y 2 …y m ,<br />
F 3 (x 1 x 2 …x m )=y 1 y 2 …y m .<br />
Строим 2m+1-местный предикат f(x 1 , x 2 ,…, x m ,<br />
y 1 , y 2 ,…, y m , z), полагая, что при z=1 он соответствует<br />
алфавитному оператору F 1 , при z=2 – оператору<br />
F 2 , при z=3 – оператору F 3 .<br />
С помощью конечных предикатов можно представить<br />
не только интересующие нас конечные алфавитные<br />
операторы с однозначными значениями,<br />
но и так называемые многозначные операторы.<br />
Многозначным конечным алфавитным оператором<br />
называется такое соответствие F, которое связывает<br />
каждое входное слово из A m с некоторым се-<br />
мейством входных слов из того же множества. Если<br />
входному слову x 1 x 2 …x m алфавитный оператор F<br />
ставит в соответствие несколько входных слов, значит,<br />
уравнение (2) для заданного набора значений<br />
аргументов (x 1 , x 2 ,…, x m ) имеет несколько решений<br />
относительно набора переменных (y 1 , y 2 ,…, y m ).<br />
Многозначный оператор можно рассматривать<br />
как обобщение понятия однозначного конечного<br />
алфавитного оператора. Однозначный конечный<br />
алфавитный оператор – это такой многозначный<br />
конечный оператор, который каждому входному<br />
слову ставит в соответствие некоторое множество<br />
выходных слов, состоящее не более чем из одного<br />
слова. Если каждому входному слову ставится в соответствие<br />
множество, состоящее не менее чем из<br />
одного слова, то такой конечный алфавитный оператор<br />
называется всюду определенным, если же некоторым<br />
из входных слов ставится в соответствие<br />
пустое множество слов, то – частичным.<br />
Поначалу, быть может, несколько обескураживает<br />
то, что конечные предикаты дают нам больше,<br />
чем мы от них ожидали. В самом деле, введя конечные<br />
предикаты, мы хотели получить средство<br />
представления только для однозначных конечных<br />
алфавитных операторов, фактически же получили<br />
в виде «бесплатного приложения» возможность<br />
представления и многозначных операторов. Хорошо<br />
это или плохо? Если бы оказалось, что многозначные<br />
алфавитные операторы бесполезны для<br />
теории <strong>интеллект</strong>а, то это, конечно, было бы плохо,<br />
так как в теории <strong>интеллект</strong>а появились бы неинтерпретируемые<br />
математические структуры. К<br />
счастью, однако, обнаруживается, что многозначные<br />
алфавитные операторы (а это покажет дальнейшее<br />
изложение) весьма удобны для математического<br />
описания высказываний или суждений<br />
<strong>интеллект</strong>а – важных объектов теории <strong>интеллект</strong>а.<br />
Однозначным же алфавитным операторам отводится<br />
роль средства математического описания<br />
деятельности <strong>интеллект</strong>а.<br />
Читатель, вероятно, заметил, что при переходе<br />
от конечных алфавитных операторов к соответствующим<br />
им конечным предикатам мы одновременно<br />
совершили переход от переменных X и Y, значениями<br />
которых были слова, к переменным x 1 , x 2 ,…,<br />
x m , y 1 , y 2 ,…, y m , пробегающим буквенные значения.<br />
Переход к буквенным переменным очень важен,<br />
он дает нам в руки удобный математический <strong>язык</strong><br />
для описания функций <strong>интеллект</strong>а. Важно понять,<br />
что буквенные переменные было бы невозможно<br />
использовать, если б мы в свое время не перешли к<br />
конечным алфавитным операторам, а продолжали<br />
базироваться на понятии алфавитного оператора,<br />
заданного на бесконечном множестве слов произвольной<br />
длины.<br />
При попытке представления алфавитных операторов<br />
с помощью предикатов с буквенными
переменными нам пришлось бы столкнуться с<br />
необходимостью введения бесконечного числа<br />
буквенных переменных. Если б мы, уже после<br />
введения конечного множества слов, сохранили в<br />
данном множестве слова различной длины, то это<br />
также помешало бы прийти к буквенным переменным,<br />
так как потребовалось бы ввести предикаты<br />
от непостижимого переменного числа переменных.<br />
Конечные предикаты с буквенными переменными<br />
– это та награда, которую мы получаем<br />
в обмен на отказ от традиционного понятия алфавитного<br />
оператора, базирующегося на абстракции<br />
потенциальной бесконечности.<br />
Рассмотрим пример представления конечного<br />
алфавитного оператора с помощью конечного<br />
предиката. Пусть нам дан оператор FX=Y, преобразующий<br />
двухбуквенные слова X=x 1 x 2 русского<br />
алфавита в однобуквенные слова Y=y 1 того же алфавита.<br />
Вид преобразования указан в табл. 2. Этому<br />
алфавитному оператору ставим в соответствие<br />
предикат t=f(x 1 , x 2 , y 1 ), описываемый табл. 3. В таблице<br />
указаны не все столбцы, а только те из них, у<br />
которых в последней строке стоит значение 1. Полагаем,<br />
что во всех отсутствующих столбцах предикат<br />
принимает значение 0.<br />
Таблица 2<br />
Х до ре ми фа ля си<br />
У а о у и е я<br />
Таблица 3<br />
x 1 д р м ф л с<br />
x 2 о е и а я и<br />
y 1 а о у и е я<br />
t 1 1 1 1 1 1<br />
Поскольку в русском алфавите 33 буквы, то<br />
общее число столбцов таблицы должно было бы<br />
составлять 33 3 ≈30 тысяч. В связи со столь резким<br />
увеличением размера таблицы у читателя может<br />
сложиться впечатление, что представление операторов<br />
в виде конечных предикатов не дает никаких<br />
преимуществ и даже усложняет дело, однако это не<br />
так. Дело в том, что конечные предикаты, в отличие<br />
от конечных алфавитных операторов, которые<br />
пришлось бы описывать средствами многозначной<br />
логики, допускают весьма удобную аналитическую<br />
запись, сходную с формулами алгебры логики [6].<br />
К разработке этой аналитической записи мы сейчас<br />
и приступаем.<br />
5. Формулы алгебры конечных предикатов<br />
Для того чтобы получить возможность записывать<br />
конечные предикаты в виде формул, мы введем<br />
специальную алгебраическую систему, которая<br />
называется алгеброй конечных предикатов. Точнее,<br />
будет введена не одна алгебра, а целое семейство<br />
таких алгебр. Каждая алгебра конечных предика-<br />
ОБ АЛГЕБрЕ КОНЕЧНЫх ПрЕДИКАТОВ<br />
тов полностью характеризуется алфавитом букв<br />
А, состоящим из к символов a 1 , а 2 , ..., а к , и алфавитом<br />
переменных В, состоящим из n символов x 1 ,<br />
x 2 ,..., x n . Cредствами алгебры конечных предикатов<br />
с алфавитом букв А={a 1 , а 2 ,..., а к } и алфавитом<br />
переменных В={x 1 , x 2 ,..., x n } может быть записан<br />
любой n-местный k-ичный предикат f(x 1 , x 2 ,..., x n ),<br />
заданный над алфавитом А. Мы будем считать, что<br />
буквы и переменные алфавитов А и В пронумерованы.<br />
Введем понятие формулы алгебры конечных предикатов<br />
с алфавитом букв {a 1 , а 2 , ..., а к } и алфавитом<br />
переменных {x 1 , x 2 ,..., x n }. Формулы будем<br />
строить из следующих символов: букв a 1 , а 2 ,..., а к ,<br />
переменных x 1 , x 2 ,..., x n , знаков дизъюнкции ∨ и<br />
конъюнкции ∧, открывающей и закрывающей скобок<br />
(, ), логических констант 0 и 1, называемых соответственно<br />
ложью и истиной. Понятие формулы<br />
алгебры конечных предикатов определим индуктивно<br />
с помощью следующей системы из четырех<br />
правил: 1) символы 0 и 1 называем формулами; 2)<br />
все выражения вида а i (x j ), где индекс i находится в<br />
пределах от 1 до k, а индекс j – в пределах от 1 до n<br />
называем формулами; 3) если выражения А и В являются<br />
формулами, то выражение (А∨В) называем<br />
формулой; 4) если выражения А и В – формулы, то<br />
выражение (А∧В) – тоже формула.<br />
Каждую формулу будем рассматривать как обозначение<br />
некоторого предиката f(x 1 , x 2 ,..., x n ), заданного<br />
над алфавитом {a 1 , а 2 ,..., а k }. Закон соответствия<br />
между формулами и обозначаемыми ими<br />
предикатами определяем индуктивно следующими<br />
правилами: 1) формула 0 обозначает тождественно<br />
ложный предикат, то есть предикат, равный 0<br />
для всех наборов значений аргументов; 2) формула<br />
1 обозначает тождественно истинный предикат, то<br />
есть предикат, равный 1 для всех наборов значений<br />
аргументов; 3) формула a i (x j ) обозначает предикат,<br />
равный 1 для всех тех наборов значений аргументов,<br />
у которых x j =a i , и равный 0 – для всех остальных<br />
наборов. Пусть формула А обозначает предикат<br />
f, а формула В – предикат g; тогда: 4) формула<br />
(А∨B) обозначает предикат, равный 0 для всех тех<br />
наборов значений аргументов, при которых f=0 и<br />
g=0, и равный 1 – для остальных наборов; 5) формула<br />
(А∧B) обозначает предикат, равный 1 для всех<br />
тех наборов значений аргументов, при которых f=1<br />
и g=1, и равный 0 – для остальных наборов.<br />
Предикат (А∨B) называется дизъюнкцией или<br />
логической суммой, а предикат (А∧B) – конъюнкцией<br />
или логическим произведением предикатов А<br />
и В. Функция, которая ставит в соответствие любым<br />
предикатам А и В предикат (А∨B), называется<br />
операцией дизъюнкции или логического сложения<br />
предикатов. Аналогично функцию, сопоставляющую<br />
произвольным предикатам А и В предикат<br />
(А∧B), назовем операцией конъюнкции или логиче-<br />
9
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
ского умножения предикатов. Операции дизъюнкции<br />
и конъюнкции будем называть элементарными<br />
операциями алгебры конечных предикатов. Пусть<br />
x, y – логические переменные. Функция x∨y со<br />
значениями 0∨0=0, 0∨1=1, 1∨0=1, 1∨1=1 называется<br />
функцией дизъюнкции, а функция x∧y со значениями<br />
0∧0=0, 0∧1=0, 1∧0=0, 1∧1=1 – функцией<br />
конъюнкции. В ряде случаев формулы алгебры конечных<br />
предикатов удобно рассматривать как значения<br />
соответствующих предикатов, то есть как<br />
логические константы. При такой интерпретации<br />
записи вида (А∨B) и (А∧B) можно рассматривать<br />
как функции дизъюнкции и конъюнкции, а входящие<br />
в их состав выражения А и В – как логические<br />
переменные.<br />
Каждую формулу вида a i (x j ) удобно рассматривать<br />
как одноместный предикат, зависящий только<br />
от переменной x j и определяемый следующим<br />
образом:<br />
10<br />
⎧⎪<br />
1,<br />
если xj = ai,<br />
ai( xj)<br />
= ⎨<br />
⎩⎪ 0,<br />
если xj ≠ ai.<br />
(3)<br />
Предикат ai (xj ) как бы “узнаёт” одну единственную<br />
букву ai среди возможных букв алфавита А,<br />
поэтому назовем его предикатом узнавания буквы<br />
ai или просто узнаванием буквы ai , зависящим от<br />
переменной xj . Всего имеется kn различных узнаваний<br />
букв. Действуя на различные узнавания букв<br />
операциями дизъюнкции и конъюнкции, многократно<br />
и в различном порядке, мы получаем различные<br />
предикаты. Узнавания букв будем считать<br />
элементарными предикатами алгебры конечных предикатов.<br />
Совокупность элементарных операций и<br />
элементарных предикатов образует базис алгебры<br />
конечных предикатов.<br />
Рассмотрим пример формулы алгебры конечных<br />
предикатов. Пусть k=3, n=4, a1 =а, a2 =м, a3 =п,<br />
x1 =x, x2 =y, x3 =z, x4 =t. Выражение<br />
((а(y)∧а(t))∧((м(x)∧м(z))∨(п(x)∧п(z)))) (a)<br />
есть формула алгебры конечных предикатов.<br />
Действительно, согласно второму правилу, выражения<br />
а(y), а(t), м(x), м(z), п(x), п(z) – формулы.<br />
С помощью четвертого правила из имеющихся<br />
уже формул строим следующие формулы:<br />
(а(y)∧а(t)), (м(x)∧м(z)), (п(x)∧п(z)). Из двух последних<br />
формул по третьему правилу образуем<br />
формулу ((м(x)∧м(z))∨(п(x)∧п(z))). Наконец, применяя<br />
четвертое правило к формулам (а(y)∧а(t)),<br />
((м(x)∧м(z))∨(п(x)∧п(x))), получаем формулу (а).<br />
Недостатком введенных формул является то,<br />
что они выглядят неоправданно громоздкими. Это<br />
хорошо видно на приведенном примере. Этот недостаток<br />
мы компенсируем тем, что будем пользоваться<br />
сокращенной записью формул. При переходе<br />
от полной записи формулы к сокращенной<br />
будем опускать внешние скобки, то есть формулы<br />
(А∨B) и (А∧B) мы будем писать в виде А∨B и А∧B.<br />
Далее, узнавания букв ai (xj ) будем записывать в бо-<br />
a<br />
лее краткой и удобной форме x i<br />
j , называя букву<br />
ai в этой записи показателем узнавания буквы. Наконец,<br />
знак конъюнкции в сокращенных записях<br />
формул будем заменять точкой или же вовсе опускать<br />
А∧B=А⋅В=АВ.<br />
Кроме того, в записях формул будем опускать<br />
все те скобки, наличие которых не обязательно<br />
для правильного понимания смысла формулы.<br />
Если скобки, регулирующие порядок выполнения<br />
действий в сокращенной записи формулы не указаны,<br />
то, по принимаемому нами соглашению о<br />
старшинстве операций, вначале будем выполнять<br />
операции конъюнкции и лишь затем – операции<br />
дизъюнкции, например запись A∨B∧C следует понимать<br />
как формулу A∨(B∧C). Этим соглашением<br />
операция конъюнкции принимается старшей по<br />
отношению к операции дизъюнкции. При отсутствии<br />
скобок в формуле условимся первой из однотипных<br />
операций выполнять ту, знак которой стоит<br />
в формуле левее, например, A∨B∨C=(A∨B)∨C,<br />
A∧B∧C=(A∧B)∧C. Принятые нами правила сокращения<br />
записи формул таковы, что при необходимости<br />
всегда можно от сокращенной записи формулы<br />
перейти к самой формуле. Применяя, к примеру,<br />
только что рассмотренные способы сокращенной<br />
записи, формулу (а) можно представить в более<br />
компактном и удобном для чтения виде:<br />
yata (xмzм∨xпzп ). (б)<br />
От формулы всегда можно перейти к таблице<br />
обозначаемого ею предиката. Для этого нужно по<br />
формуле вычислить значения предиката для всевозможных<br />
наборов значений аргументов. Вычислим,<br />
к примеру, значения предиката f(x, y, z, t),<br />
представленного формулой (б) для наборов значений<br />
аргументов (м, а, м, а) и (м, а, п, а):<br />
f(м, а, м, а)=a a a a (м м м м ∨м п м п )=<br />
=1⋅1⋅(1⋅1∨0⋅0)=1⋅(1∨0)=1⋅1=1,<br />
f(м, а, п, а)=a a a a (м м п м ∨м п п п )=<br />
=1⋅1⋅(1⋅0∨0⋅1)=1⋅(0∨0)=1⋅0=0.<br />
Аналогичные вычисления для всевозможных<br />
четырехбуквенных наборов, составленных из букв<br />
а, м, п (их всего 3 4 =81), показывают, что предикат<br />
f «узнаёт» два слова мама и папа: он ставит им в соответствие<br />
значение 1, то есть истину. Остальным<br />
словам предикат f ставит в соответствие значение<br />
0, то есть ложь.<br />
Возникает вопрос, полна ли введенная нами алгебра<br />
конечных предикатов, то есть для каждого ли<br />
конечного предиката найдется обозначающая его<br />
формула? Оказывается, что алгебра конечных предикатов<br />
полна. Действительно, тождественно ложный<br />
предикат может быть записан в виде формулы 0.
Предикат, принимающий значение 1 только на<br />
одном наборе значений аргументов (σ1 , σ2 ,..., σn ),<br />
σ1 σ2 σn<br />
можно представить формулой x1 x2 ... xn . Предикат,<br />
принимающий значение 1 на произвольных<br />
наборах (σ11 , σ12 ,..., σ1n ), (σ21 , σ22 ,..., σ2n ),..., (σm1 ,<br />
σm2 ,..., σmn ), может быть представлен формулой:<br />
σ σ σ<br />
1 2<br />
σ σ σ<br />
1 2<br />
σ σ σ<br />
1 2 n<br />
11 12 1n<br />
21 22 2n<br />
m1 m2 mn<br />
x x ... xn ∨ x x ... xn ∨...∨ x x ... x .<br />
Таким образом, любой конечный предикат может<br />
быть записан на <strong>язык</strong>е алгебры конечных предикатов.<br />
Алгебра конечных предикатов не только полна,<br />
но даже в некотором смысле избыточна. Так,<br />
мы видим, что введенная в ней первым правилом<br />
формула 1 нам не понадобилась для записи произвольных<br />
предикатов. Обозначаемый формулой 1<br />
тождественно истинный предикат может быть выражен<br />
с помощью других средств алгебры конечных<br />
предикатов, например, в форме дизъюнкции<br />
σ1 σ2 σn<br />
всевозможных конъюнкций вида x1 x2 ... xn . В<br />
случае, когда k≥2, то есть когда алфавит A содержит<br />
по крайней мере две буквы а1 и а2 , можно обойтись<br />
и без формулы 0. Обозначаемый этой формулой<br />
тождественно ложный предикат может быть запи-<br />
a1 a2<br />
сан, например, в виде формулы x1 x1<br />
.<br />
Исключим из этого определения формулы алгебры<br />
конечных предикатов первое правило, вводящее<br />
формулы 0 и 1; кроме того, предположим,<br />
что k≥2, и рассмотрим вопрос, можно ли в этих<br />
условиях еще более упростить определение формулы<br />
при сохранении полноты алгебры. Оказывается,<br />
что при принятых предположениях алгебра<br />
конечных предикатов несократима в том смысле,<br />
что любые дальнейшие сокращения в оставшихся<br />
правилах образования ее формул ведут к неполноте<br />
данной алгебры. Действительно, исключим из<br />
числа формул одно из выражений: ai (xj ), вводимое<br />
вторым правилом. Тогда мы не сможем образовать<br />
формулу для обозначения предиката, обращающегося<br />
в 1 на всех тех наборах значений аргументов,<br />
у которых xj =ai , и в 0 – на всех остальных наборах.<br />
Если же мы исключим третье правило, тогда станет<br />
невозможным представление в виде формулы тождественно<br />
истинного предиката. Исключая четвертое<br />
правило, мы не сможем представить в виде<br />
формулы тождественно ложный предикат.<br />
Таким образом, формулы 0 и 1 не обязательны<br />
для алгебры конечных предикатов. Их введение не<br />
расширяет выразительные возможности этой алгебры,<br />
поскольку и без этих формул алгебра конечных<br />
предикатов полна. Символы 0 и 1 включены в<br />
число формул лишь потому, что они обеспечивают<br />
дополнительные удобства при пользовании алгеброй<br />
конечных предикатов. Заметим, что формула<br />
0 для полноты алгебр, у которых k=1, необходима.<br />
Алгебры этого типа не представляют серьезного<br />
интереса для теории <strong>интеллект</strong>а ввиду их вы-<br />
ОБ АЛГЕБрЕ КОНЕЧНЫх ПрЕДИКАТОВ<br />
рожденности. Алфавит А таких алгебр состоит из<br />
одной буквы a 1 . Предикаты, охватываемые этими<br />
алгебрами, принимают значения лишь на одном<br />
наборе значений аргументов (a 1 , а 1 ,..., а 1 ), в котором<br />
буква a 1 встречается n раз. Алгеброй охватывается<br />
всего два предиката 0 и 1.<br />
6. Тождества алгебры конечных предикатов<br />
Приступим к изучению свойств алгебры конечных<br />
предикатов. Сначала рассмотрим ее основные<br />
тождества. Назовем тождественными формулы,<br />
выражающие один и тот же предикат. Факт тождественности<br />
формул будем обозначать знаком ≡ .<br />
Для равенства значений предикатов будем использовать<br />
знак =. Пусть A, B, C – произвольные формулы<br />
алгебры конечных предикатов. Справедливы<br />
следующие тождества: законы коммутативности<br />
А∨В≡В∨А, (4)<br />
AB≡BA; (5)<br />
законы ассоциативности<br />
(A∨B)∨C≡A∨(B∨C), (6)<br />
(AB)C≡A(BC); (7)<br />
законы дистрибутивности<br />
(A∨B)C≡AC∨BC, (8)<br />
AB∨C≡(A∨C)(B∨C); (9)<br />
законы идемпотентности<br />
A∨A≡A, (10)<br />
AA≡A; (11)<br />
законы элиминации (поглощения)<br />
A∨AB≡A, (12)<br />
A(A∨B)≡A. (13)<br />
Названия для приведенных тождеств заимствованы<br />
из алгебры логики, где рассматриваются совпадающие<br />
с ними по форме законы. Однако в<br />
алгебре логики формулы обозначают не конечные<br />
предикаты, а булевы функции [7]. Справедливость<br />
тождеств легко проверяется перебором всевозможных<br />
значений предикатов A, B, C. Например, докажем<br />
первый закон коммутативности: 0∨0≡0∨0,<br />
0∨1≡1∨0, 1∨0≡0∨1, 1∨1≡1∨1. Справедлив, кроме<br />
того, ряд тождеств, в которых участвуют логические<br />
константы:<br />
A∨1≡1, (14)<br />
A⋅0≡0, (15)<br />
A⋅1≡A, (16)<br />
A∨0≡A. (17)<br />
Пусть х – произвольная буквенная переменная.<br />
Имеет место следующее тождество:<br />
a a a k<br />
1 2 x ∨x ∨... ∨x≡1. (18)<br />
11
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
Действительно, какую бы букву алфавита А мы<br />
ни подставили вместо х в левую часть равенства<br />
(18), всегда один из дизъюнктивных членов, а вместе<br />
с ним и вся дизъюнкция, обращается в 1. Тождество<br />
(18) назовем законом истинности. Пусть а и<br />
b – произвольные, но отличающиеся друг от друга<br />
(a≠b) буквы алфавита А. Имеют место следующие<br />
тождества:<br />
x a x b ≡0. (19)<br />
Действительно, какую бы букву мы ни подставили<br />
вместо х в левую часть равенства (19), всегда<br />
хотя бы один из конъюнктивных членов обратится<br />
в 0, а вместе с ним обратится в 0 и вся левая часть<br />
равенства (19). Тождество (19) назовем законом<br />
ложности. Закон истинности в некотором смысле<br />
можно рассматривать как аналог закона исключенного<br />
третьего алгебры логики, а закон ложности<br />
– как аналог закона противоречия [1].<br />
С абстрактной точки зрения введенная нами<br />
алгебра конечных предикатов есть дистрибутивная<br />
решетка с нулем и единицей [8]. А именно – это<br />
есть множество всех n-местных k-ичных предикатов<br />
с заданными на нем бинарными операциями<br />
дизъюнкции и конъюнкции, для которых выполняются<br />
аксиомы (4) – (17) дистрибутивной решетки<br />
с нулем и единицей. Роль нуля в алгебре конечных<br />
предикатов выполняет тождественно ложный<br />
предикат 0, роль единицы – тождественно истинный<br />
предикат 1. Важно заметить, что в алгебре конечных<br />
предикатов выполняются сверх этого еще<br />
и тождества (18) и (19). Как будет показано ниже,<br />
наличие этих тождеств позволяет ввести в алгебре<br />
конечных предикатов третью, унарную операцию<br />
– отрицание и рассматривать эту алгебру как булеву<br />
алгебру [7]. В силу наличия тождеств (18) и (19)<br />
алгебра конечных предикатов оказывается более<br />
богатой свойствами, чем булева алгебра, взятая в<br />
чистом виде.<br />
Интересно выяснить вопрос: полна ли система<br />
тождеств, введенных нами в алгебре конечных<br />
предикатов. Иными словами, можно ли с помощью<br />
этих тождеств доказать тождественность любых<br />
двух формул алгебры конечных предикатов,<br />
обозначающих один и тот же предикат? Несколько<br />
позже будет доказано, что система тождеств (4) –<br />
(19) в указанном смысле полна. Эта система тождеств<br />
разбивает все множество формул алгебры<br />
конечных предикатов на классы эквивалентности<br />
[7] таким образом, что каждому из этих классов<br />
может быть взаимно однозначно сопоставлен свой<br />
конечный предикат.<br />
Не все из перечисленных тождеств, однако,<br />
необходимы для достижения полноты. Поэтому<br />
число тождеств в системе можно сократить. Например,<br />
справедливость тождеств (14) и (15) может<br />
быть доказана на основе остальных тождеств:<br />
A∨1≡1∨A≡1∨A⋅1≡1∨1⋅A≡1; A⋅0≡0⋅A≡0⋅(0∨A)≡0.<br />
12<br />
Из совокупности остальных тождеств выводится<br />
второй закон дистрибутивности (9):<br />
AB∨C≡AB∨C∨CB≡AB∨C∨CA∨CB≡<br />
≡AB∨CC∨CA∨CB≡BA∨CA∨BC∨CC≡<br />
≡(B∨C)∧A∨(B∨C)C≡<br />
≡A(B∨C)∨C(B∨C)≡(A∨C)(B∨C).<br />
Было бы интересно указать какую-нибудь несократимую<br />
полную систему тождеств алгебры конечных<br />
предикатов, удобную в роли системы аксиом<br />
для этой алгебры.<br />
Алгебру конечных предикатов можно определить<br />
абстрактно как некую алгебраическую систему<br />
[8]. Рассмотрим множество M, в котором содержатся,<br />
по крайней мере, два элемента 0 и 1 и k⋅n<br />
элементов aij (1≤i≤k, 1≤j≤n). Пусть на множестве M<br />
заданы две операции и ∆, удовлетворяющие следующим<br />
аксиомам:<br />
a b≡b a, a∆b≡b∆a, (20)<br />
(ab) c≡a (b c), (a∆b)∆c≡a∆(b∆c), (21)<br />
(ab)∆c≡(a∆c) (b∆c), (a∆b) c≡(a c)∆(b c), (22)<br />
a a≡a, a∆a≡a, (23)<br />
a (a∆b)≡a, a∆(a b)≡a, (24)<br />
a 1≡1, a∆0≡0, a∆1≡a, a 0≡a, (25)<br />
a1j a2j ... akj≡1, (1≤j≤n), (26)<br />
ai1j ∆ ai2j ≡0, (i1≠i2 , 1≤i1 , i2≤k, 1≤j≤n). (27)<br />
Тождества (20) – (27) назовем аксиомами абстрактной<br />
алгебры конечных предикатов. Любая алгебраическая<br />
система, удовлетворяющая перечисленным<br />
требованиям, изоморфна [7] описанной<br />
ранее алгебре конечных предикатов. Чтобы перейти<br />
от абстрактного определения алгебры конечных<br />
предикатов к прежнему ее определению, следует<br />
множество M проинтерпретировать как множество<br />
всевозможных k-ичных n-местных предикатов,<br />
элементы 0 и 1 – как тождественно ложный и тождественно<br />
истинный предикаты, элементы aij – как<br />
a<br />
предикаты x i<br />
j , операции и ∆ – как дизъюнкцию<br />
и конъюнкцию предикатов.<br />
Заметим, что только что приведенное определение<br />
абстрактной алгебры конечных предикатов<br />
допускает еще одну, двойственную первой, интерпретацию.<br />
А именно, множество M, как и прежде,<br />
интерпретируем как множество всевозможных<br />
k-ичных n-местных предикатов, элементы 0 и 1 –<br />
как тождественно истинный и тождественно ложный<br />
предикаты, элементы aij как предикаты вида:<br />
⎧⎪<br />
0,<br />
если xj = ai,<br />
Pi( xj)<br />
= ⎨<br />
⎩⎪ 1,<br />
если xj ≠ ai.<br />
(28)<br />
Операции и ∆ интерпретируем как конъюнкцию<br />
и дизъюнкцию предикатов. Интересно отме-
тить, что в пределах каждой из этих двух интерпретаций<br />
абстрактной алгебры конечных предикатов<br />
при k>2 двойственности не наблюдается (такая<br />
двойственность имеет место в алгебре логики и в<br />
алгебре конечных предикатов при k=2). Хотя при<br />
замене знака на ∆ и знака 0 на 1, и наоборот, набор<br />
тождеств (20) – (25) остается тем же самым, однако<br />
тождества (26) и (27) не переходят друг в друга.<br />
Выводы<br />
Может показаться, что алгебра конечных предикатов<br />
есть обобщение алгебры логики. Так, мы<br />
видим, что обе алгебры относятся к классу булевых<br />
алгебр. Кроме того, в частном случае, когда k=2 и<br />
A={0,1}, тождества (18) и (19) превращаются соответственно<br />
в закон исключенного третьего x∨ x =1<br />
и закон противоречия x x =0 алгебры логики. Здесь<br />
обозначено x1 =x, x0 = x . Все тождества (4) – (19)<br />
алгебры конечных предикатов в этом случае по<br />
форме совпадают с тождествами алгебры логики.<br />
И все же неверно было бы утверждать, что алгебра<br />
логики – это частный случай алгебры конечных<br />
предикатов.<br />
Дело в том, что смысл, вкладываемый в операцию<br />
отрицания x в алгебре логики и в предикат<br />
узнавания нуля x0 в алгебре конечных предикатов<br />
при k=2, A={0, 1}, различен. В то время как в алгебре<br />
логики операцией отрицания можно действовать<br />
на любую булеву функцию, в алгебре конечных<br />
предикатов при k=2, A={0, 1} положение иное:<br />
узнаванием нуля разрешается действовать лишь<br />
на буквенные аргументы х1 , х2 ,..., хn , на предикаты<br />
же действовать узнаванием нуля не разрешается. В<br />
алгебре конечных предикатов выражения вида A0 ,<br />
где A – произвольная формула, не являются формулами.<br />
А в алгебре логики выражения типа ⎺A –<br />
это формулы.<br />
Таким образом, алгебра логики не является<br />
частным случаем алгебры конечных предикатов.<br />
В этом обстоятельстве кроется объяснение того<br />
факта, что, как было отмечено выше, алгебра конечных<br />
предикатов (без 0 и 1 и при k≥2) несократима.<br />
В алгебре же логики набор ее базисных (элементарных)<br />
операций (отрицание, дизъюнкция и<br />
конъюнкция) можно сократить без потери данной<br />
алгеброй свойства полноты (например, можно исключить<br />
операцию дизъюнкции), чего не могло бы<br />
случиться, если бы алгебра логики была частным<br />
случаем алгебры конечных предикатов. Алгебра<br />
конечных предикатов при k=2 и A={0, 1}, как алгебраическая<br />
система, насколько нам известно, в ли-<br />
ОБ АЛГЕБрЕ КОНЕЧНЫх ПрЕДИКАТОВ<br />
тературе специально не рассматривалась. Однако<br />
она неявно присутствует во многих руководствах<br />
по алгебре логики. Так, например, в литературе<br />
можно встретить термин формулы с тесными отрицаниями,<br />
обозначающий формулы алгебры логики,<br />
у которых отрицания могут стоять только непосредственно<br />
над независимыми переменными [8].<br />
К такого рода формулам алгебры логики относятся,<br />
в частности, дизъюнктивные и конъюнктивные<br />
нормальные формы, а также скобочные формы.<br />
Эти формы реализуют в виде двухступенчатых или<br />
многоступенчатых комбинационных схем, на входы<br />
которых поступают двоичные сигналы вместе с<br />
их отрицаниями [1].<br />
Список литературы: 1. Глушков, В.М. Введение в кибернетику.<br />
[Текст] / В.М. Глушков – К.: Изд. АН УССР, 1964.<br />
– 324 с. 2. Энциклопедия кибернетики [Текст] / Т. 1. – К.:<br />
Изд. АН УССР, 1974. – 608 с. 3. Глушков, В.М. Алгебра,<br />
<strong>язык</strong>и, программирование [Текст] / В.М. Глушков, Г.Е.<br />
Цейтлин, Е.Л. Ющенко – К.: Наук. думка, 1974. – 318 с.<br />
4. Новиков, П.С. Элементы математической логики [Текст]<br />
/ П.С. Новиков – М.: Наука, 1973. – 400 с. 5. Шрейдер, Ю.А.<br />
Равенство, сходство, порядок [Текст] / Ю.А. Шрейдер<br />
– М.: Наука, 1971. – 256 с. 6. Дискретная математика и<br />
математические вопросы кибернетики [Текст] / Под ред.<br />
С.В. Яблонского и О.Б. Лупанова. – М.: Наука, 1974. –<br />
Т. 1. – 311 с. 7. Мальцев, А.И. Алгебраические системы<br />
[Текст] / А.И. Мальцев – М.: Наука. – 1970. – 394 с.<br />
8. Лавров, И.А. Задачи по теории множеств, математической<br />
логике и теории алгоритмов [Текст] / И.А. Лавров,<br />
Л.Л. Максимова – М.: Наука, 1975. – 247 с.<br />
Поступила в редколлегию 25.05.<strong>2011</strong><br />
УДК 519.7<br />
Про алгебру cкінченних предикатів / М.Ф. Бондаренко,<br />
Ю.П. Шабанов-Кушнаренко // Біоніка інтелекту:<br />
наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 3-13.<br />
Розробляється математична мова опису структур і<br />
функцій систем природного інтелекту. Введені поняття<br />
скінченного алфавітного оператора, алгебри скінченних<br />
предикатів і формул алгебри скінченних предикатів.<br />
Табл. 3. Бібліогр.: 8 найм.<br />
UDC 519.7<br />
About algebra of final predicates / M.f. Bondarenko,<br />
Yu.P. Shabanov-Kushnarenko // Bionics of Intelligense: Sci.<br />
Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 3-13.<br />
The mathematical language of structures and functions<br />
of the natural intellect systems description is developed. The<br />
concepts of finite alphabetical operator, algebras of finite<br />
predicates and formulas of finite predicates algebra, are entered.<br />
Tab. 3. Ref.: 8 items.<br />
13
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 14–29 хНурэ<br />
УДК 519.7<br />
14<br />
Введение<br />
Наличие тождеств в алгебре конечных предикатов<br />
свидетельствует о том, что один и тот же конечный<br />
предикат можно записать в виде различных<br />
формул. Значит, формул алгебры конечных предикатов<br />
больше, чем обозначаемых ими предикатов.<br />
Возникает задача: из множества всех формул выделить<br />
класс формул, называемых нормальными<br />
формами, чтобы в нем каждому предикату соответствовала<br />
только одна формула алгебры конечных<br />
предикатов. Выделим два таких класса формул:<br />
класс совершенных дизъюнктивных нормальных<br />
форм (СДНФ) и класс совершенных конъюнктивных<br />
нормальных форм (СКНФ).<br />
1. Совершенная дизъюнктивная нормальная форма<br />
Вначале введем понятие совершенной дизъюнктивной<br />
нормальной формы. Элементарной конъюнкцией<br />
назовем любую конъюнкцию узнаваний<br />
различных буквенных переменных, взятых с произвольными<br />
фиксированными показателями. Наибольшее<br />
число множителей в элементарной конъюнкции<br />
равно n, наименьшее – нулю. В качестве<br />
элементарной конъюнкции, не имеющей в своем<br />
составе ни одного узнавания буквы, примем формулу<br />
1. Примерами элементарных конъюнкций в алгебре<br />
конечных предикатов с алфавитом букв A={a, b,<br />
c} и алфавитом переменных B={x1 , x2 , x3 } могут служить<br />
формулы x a<br />
1 x2<br />
b , x2<br />
cx3 b , x1<br />
bx2 cx3 c . Элементарные<br />
конъюнкции, отличающиеся между собой только<br />
порядком конъюнктивных членов, будем считать<br />
одинаковыми, например, x b<br />
1 x2<br />
cx3 c и x2<br />
cx1 bx3 c . Любую<br />
дизъюнкцию произвольного числа различных элементарных<br />
конъюнкций назовем дизъюнктивной<br />
нормальной формой (ДНФ). В качестве ДНФ, не содержащей<br />
ни одного дизъюнктивного члена, примем<br />
формулу 0. Примером ДНФ в той же алгебре<br />
может служить формула x a<br />
1 x2<br />
b∨x2 cx3 c∨x1 bx2 cx3 c .<br />
Любая элементарная конъюнкция, в которой<br />
встречаются все переменные алгебры конечных<br />
предикатов, называется конституэнтой единицы.<br />
Условимся все узнавания в конституэнте единицы<br />
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
ХНУРЭ, г. Харьков, Украина<br />
НОРМАЛЬНЫЕ ФОРМЫ ФОРМУЛ АЛГЕБРЫ<br />
КОНЕЧНЫХ ПРЕДИКАТОВ<br />
Рассмотрены задачи построения нормальных форм формул алгебры конечных предикатов, показано,<br />
что между конечными предикатами и совершенными дизъюнктивными нормальными формами<br />
существует взаимно однозначное соответствие. Cформулирована теорема о конъюнктивном разложении,<br />
рассмотрена задача канонической минимизации формул алгебры конечных предикатов, методы<br />
дизъюнктивной и конъюнктивной минимизации.<br />
ТЕОРИЯ ИНТЕЛЛЕКТА, ПРЕДИКАТ, АЛГЕБРА КОНЕЧНЫХ ПРЕДИКАТОВ, ДНФ, СДНФ,<br />
МИНИМИЗАЦИЯ ФОРМУЛ<br />
располагать в порядке возрастания номеров переменных.<br />
Примеры конституэнт единицы (в той же<br />
алгебре): x 1 a x2 a x3 b , x1 b x2 c x3 b . В общем виде конституэнта<br />
единицы запишется следующим образом:<br />
σ σ σ<br />
n<br />
1 2 n<br />
x1 x2 ... xn ≡∧<br />
i =<br />
1<br />
i xi σ .<br />
Здесь σ 1 , σ 2 , ..., σ n – некоторые фиксированные<br />
буквы алфавита А, знак ∧ обозначает операцию<br />
i = 1<br />
логического перемножения n членов, i – индекс,<br />
изменяющийся в пределах от 1 до n, по которому<br />
ведется перемножение.<br />
Присвоим каждой конституэнте едини-<br />
σ1 σ2 σn<br />
цы x1 x2 ... xn свой номер. Для этого составим<br />
n-разрядный k-ичный код σ1σ2 ...σn из показателей<br />
ее узнаваний, рассматривая буквы а1 , а2 ,..., аk алфавита<br />
А как k-ичные цифры 0, 1, ..., k-1. Число,<br />
соответствующее коду σ1σ2 ...σn , будем считать номером<br />
данной конституэнты единицы. Например,<br />
номером конституэнты единицы x b<br />
1 x2<br />
ax3 c служит<br />
число 11 (в десятичной записи), соответствующее<br />
троичному коду 102. Всего имеется kn различных<br />
конституэнт единицы.<br />
Любая дизъюнкция произвольного числа n различных<br />
конституэнт единицы называется совершенной<br />
дизъюнктивной нормальной формой (СДНФ).<br />
Мы будем отождествлять между собой все СДНФ,<br />
отличающиеся только порядком расположения<br />
конституэнт единицы. Конституэнты единицы<br />
условимся располагать в порядке возрастания<br />
их номеров. Пример СДНФ (в той же алгебре):<br />
x а<br />
1 x2<br />
ax3 c∨x1 bx2 bx3 a∨x1 cx2 cx3 b . Общий вид СДНФ следующий:<br />
σ σ σ<br />
1 2<br />
11 12 1n 21 22 2n 1 2<br />
x x ... xn ∨ x x ... xn ∨...∨ x x ... x<br />
m<br />
≡∨<br />
i = 1<br />
n<br />
σ σ σ<br />
1 2<br />
σ σ σ<br />
1 2 n<br />
m<br />
i1 i2 in<br />
x x ... x ≡∨=<br />
n<br />
i 1 ∧ j = 1<br />
σm σm σm<br />
1 2 n<br />
σ ij<br />
x j .<br />
n ≡<br />
Здесь σ ij – некоторые фиксированные буквы ал-<br />
m<br />
фавита А; знак ∨ обозначает операцию логическо-<br />
i = 1<br />
го суммирования m членов; m – число конституэнт
единицы в СДНФ; i, j – индексы, изменяющиеся<br />
в пределах соответственно от 1 до m и от 1 до n, по<br />
которым ведутся логическое суммирование и логическое<br />
перемножение.<br />
Присвоим каждой СДНФ свой номер. Для<br />
этого каждой СДНФ поставим в соответствие некоторый<br />
двоичный код длины k n . Длина кода совпадает<br />
с числом всех различных конституэнт<br />
единицы. Если в рассматриваемой СДНФ конституэнта<br />
единицы с номером i отсутствует, то в i-том<br />
разряде ее двоичного кода записываем 0, если присутствует,<br />
то записываем 1. Нумерацию разрядов<br />
двоичного кода в данном случае начинаем с нуля<br />
и ведем слева направо. Число, соответствующее<br />
полученному таким способом двоичному коду,<br />
будем считать номером СДНФ. В качестве СДНФ<br />
с номером 0 принимаем формулу 0. Например,<br />
номер СДНФ x 1 a x2 b ∨x1 b x2 c в алгебре с алфавитами<br />
А={a, b, c}, B={x 1 , x 2 } будет число 136 10 , соответствующее<br />
двоичному коду 010001000. Всего имеется<br />
2 kn различных СДНФ, то есть ровно столько,<br />
сколько существует всех различных конечных предикатов.<br />
Вместе с тем, каждой формуле соответствует<br />
единственный конечный предикат, каждому<br />
же конечному предикату соответствует некоторая<br />
своя СДНФ. Следовательно, между конечными<br />
предикатами и совершенными дизъюнктивными<br />
нормальными формами существует взаимно однозначное<br />
соответствие.<br />
Важно выяснить вопрос: можно ли с помощью<br />
приведенных выше тождеств преобразовать произвольную<br />
формулу алгебры конечных предикатов к<br />
СДНФ. Если да, то отсюда будет следовать, что система<br />
этих тождеств полна. Действительно, сравнивая<br />
между собой СДНФ двух формул, всегда можно,<br />
в силу единственности представления любого<br />
конечного предиката в виде СДНФ, решить вопрос<br />
о тождестве этих формул. Если СДНФ совпадают,<br />
то исходные формулы тождественны, если не совпадают,<br />
то они соответствуют различным предикатам.<br />
Такое преобразование существует. Следовательно,<br />
система тождеств (4) – (19) [1] алгебры<br />
конечных предикатов полна.<br />
Ниже приводится описание алгоритма преобразования<br />
произвольной формулы к СДНФ. Алгоритм<br />
сопровождается примером: А={a, b}, B={x 1 ,<br />
x 2 , x 3 }, требуется преобразовать к СДНФ формулу<br />
f≡(x 1 a ∨x2 b )(x1 a ∨x1 b x3 a )∨(x1 a ∨x2 a )(x2 b x3 b ∨x2 a x3 a ).<br />
1) Пользуясь тождествами (5), (7) и (8) [1], раскрываем<br />
в формуле все скобки:<br />
f≡x a<br />
1 (x1 a∨x1 bx3 a )∨x2 b (x1 a∨x1 bx3 a )∨<br />
∨x a<br />
1 (x2 bx3 b∨x2 ax3 a )∨x2 a (x2 bx3 b∨x2 ax3 a )≡<br />
≡(x a<br />
1 ∨x1 bx3 a )x1 a∨(x1 a∨x1 bx3 a )x2 b∨(x2 bx3 b∨x2 ax3 a )x1 a∨ ∨(x b<br />
2 x3<br />
b∨x2 ax3 a )x2 a≡x1 ax1 a∨x1 bx3 ax1 a∨x1 ax2 b∨x1 bx3 ax2 b∨ ∨x b<br />
2 x3<br />
bx1 a∨x2 ax3 ax1 a∨x2 bx3 bx2 a∨x2 ax3 ax2 a .<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
В результате получаем некоторую дизъюнкцию<br />
конъюнкций узнаваний предмета.<br />
2) Пользуясь тождествами (4)-(7), (10), (11),<br />
(15), (17) и (19) [1], производим упрощения в формуле:<br />
f≡x a<br />
1 ∨0⋅x3 a∨x1 ax2 b∨x1 bx2 bx3 a∨x1 ax2 bx3 b∨x1 ax2 ax3 a∨ ∨0⋅x b<br />
3 ∨x2 ax3 a≡x1 a∨0∨x1 ax2 b∨x1 bx2 bx3 a∨x1 ax2 bx3 b∨ ∨x a<br />
1 x2<br />
ax3 a∨0∨x2 ax3 a≡x1 a∨x1 ax2 b∨ ∨x b<br />
1 x2<br />
bx3 a∨x1 ax2 bx3 b∨x1 ax2 ax3 a∨x2 ax3 a .<br />
В результате получаем некоторую дизъюнктивную<br />
нормальную формулу предиката.<br />
3) Пользуясь тождествами (16) и (18) [1], во все<br />
конъюнкции вводим недостающие переменные:<br />
f≡x a<br />
1 (x2 a∨x2 b )(x3 a∨x3 b )∨x1 ax2 b (x3 a∨x3 b )∨x1 bx2 bx3 a∨ ∨x a<br />
1 x2<br />
bx3 b∨x1 ax2 ax3 a∨(x1 a∨x1 b )x2 ax3 a .<br />
4) Пользуясь тождествами (4)-(8) и (10) [1], снова<br />
раскрываем скобки и производим упрощения:<br />
f≡x a<br />
1 x2<br />
ax3 a∨x1 ax2 ax3 b∨x1 ax2 bx3 a∨x1 ax2 bx3 b∨x1 ax2 bx3 a∨ ∨x a<br />
1 x2<br />
bx3 b∨x1 bx2 bx3 a∨x1 bx2 bx3 a∨x1 ax2 bx3 b∨x1 ax2 ax3 a∨ ∨x a<br />
1 x2<br />
ax3 a∨x1 bx2 ax3 a≡x1 ax2 ax3 a∨x1 ax2 ax3 b∨x1 ax2 bx3 a∨ ∨x a<br />
1 x2<br />
bx3 b∨x1 bx2 ax3 a∨x1 bx2 bx3 a .<br />
В результате получаем искомую СДНФ.<br />
От совершенной дизъюнктивной нормальной<br />
формы нетрудно перейти к таблице обозначаемого<br />
ею конечного предиката. Для этого нужно выделить<br />
в таблице все наборы значений аргументов, совпадающие<br />
с наборами показателей узнаваний букв<br />
конституэнт единицы, фигурирующих в СДНФ.<br />
Против выделенных наборов надо выписать значение<br />
предиката 1, против остальных наборов –<br />
значение 0. Рассмотрим пример. Пусть А={a, b, c},<br />
B={x1 , x2 }. Предикат задан совершенной дизъюнктивной<br />
нормальной формой t≡x a<br />
1 x2<br />
b∨x1 ax2 c∨x1 bx2 a .<br />
Этому предикату соответствует табл. 1.<br />
Таблица 1<br />
х 1 а a a b b b c c с<br />
x 2 а b c a b c a b с<br />
t 0 1 1 1 0 0 0 0 0<br />
Для обратного перехода от таблицы значений<br />
конечного предиката к его СДНФ выделяем в таблице<br />
все те наборы аргументов, на которых этот<br />
предикат обращается в 1. Далее, для каждого такого<br />
набора выписываем соответствующую конституэнту<br />
единицы, принимая в ней показатели<br />
узнаваний букв в соответствии с этим набором.<br />
Наконец, все полученные таким способом конституэнты<br />
единицы соединяем знаками дизъюнкции.<br />
Рассмотрим пример. Предикат задан табл. 2.<br />
Таблица 2<br />
x 1 0 0 0 1 1 1 2 2 2<br />
x 2 0 1 2 0 1 2 0 1 2<br />
t 1 0 0 0 1 0 0 1 0<br />
15
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
16<br />
СДНФ этого предиката имеет вид:<br />
x 1 0 x2 0 ∨x1 1 x2 1 ∨x1 2 x2 1 ≡ t.<br />
Заметим, что таблицу значений предиката можно<br />
легко построить также и по его произвольной<br />
дизъюнктивной нормальной форме. Для этого<br />
нужно выделить в таблице те наборы значений<br />
аргументов, в состав которых входят наборы показателей<br />
узнаваний элементарных конъюнкций<br />
ДНФ. Против выделенных наборов проставляем<br />
значения 1, против остальных наборов – значение<br />
0. Рассмотрим пример. Пусть А={α, β}, B={x, y, z}.<br />
Предикат задан следующей ДНФ:<br />
t≡x α y β ∨x β z α .<br />
Ему соответствует табл. 3.<br />
Таблица 3<br />
x α α α α β β β β<br />
y α α β β α α β β<br />
z α β α β α β α β<br />
t 0 0 1 1 1 0 1 0<br />
В ряде случаев бывает полезно, отправляясь от<br />
задания конечного предиката в виде произвольной<br />
формулы алгебры конечных предикатов, получить<br />
какую-нибудь по возможности экономную ДНФ. С<br />
этой целью можно воспользоваться первыми двумя<br />
шагами описанного выше алгоритма приведения<br />
к СДНФ. Полученную ДНФ следует попытаться<br />
упростить, применяя первый закон поглощения<br />
(12) и первый закон идемпотентности (10) [1].<br />
Подчеркнем, что по данному методу мы находим<br />
формулу, не обязательно простейшую среди всевозможных<br />
ДНФ. Однако она, как правило, оказывается<br />
не намного сложнее самой простой ДНФ.<br />
На отыскание такой экономной формулы затрачивается<br />
гораздо меньше усилий. Для примера произведем<br />
упрощение ДНФ, полученной на втором<br />
шаге в примере только что упомянутого алгоритма<br />
преобразования к СДНФ:<br />
x a<br />
1 ∨x1 ax2 b∨x1 bx2 bx3 a∨x1 ax2 bx3 b∨x1 ax2 ax3 a∨x2 ax3 a =<br />
=x a<br />
1 ∨x1 bx2 bx3 a∨x2 ax3 a .<br />
В алгебре конечных предикатов имеет место<br />
важное утверждение, которое назовем теоремой о<br />
разложении. Можно сформулировать два варианта<br />
этой теоремы: теорему о дизъюнктивном разложении<br />
и теорему о конъюнктивном разложении. Сформулируем<br />
и докажем теорему о дизъюнктивном<br />
разложении. Теорему о конъюнктивном разложении<br />
рассмотрим несколько позже. Формулируется<br />
теорема о дизъюнктивном разложении следующим<br />
образом.<br />
Любой конечный предикат f(x1 , x2 ,…, xn ) может<br />
быть представлен в виде<br />
f x1 x2 xl xl 1 xn<br />
x x xl l<br />
( , , …, , + , …,<br />
)≡<br />
(1)<br />
σ1 σ2 σ<br />
≡ ∨ 1 2 ... f( s 1, s 2, …, s l, xl+ 1,<br />
…,<br />
xn<br />
).<br />
( σ1, σ2,..., σl<br />
)<br />
Представление предиката f(x 1 , x 2 ,…, x n ) в виде<br />
правой части тождества (1) назовем его дизъюнктивным<br />
разложением по переменным x 1 , x 2 ,…, x l .<br />
Буквенные переменные σ 1 , σ 2 ,…, σ l играют роль<br />
индексов при образовании многократной дизъюнкции.<br />
Запись (σ 1 , σ 2 ,…, σ l ) под знаком дизъюнкции<br />
означает, что логическая сумма берется<br />
по всевозможным наборам индексов σ 1 , σ 2 ,…, σ l .<br />
Таким образом, в правой части тождества (1) присутствуют<br />
k l дизъюнктивных членов.<br />
Докажем теорему о дизъюнктивном разложении.<br />
Доказательство будем вести индукцией по k,<br />
l и n.<br />
1. При k=l=n=1 равенство (1) принимает вид:<br />
f(x1 )≡ ∨ ( σ1 )<br />
1 x1 σ f(σ1 ).<br />
Оно является тождеством. Действительно, переменная<br />
х 1 принимает единственное возможное<br />
значение а 1 , поэтому f(x 1 )≡f(a 1 ) и<br />
∨( )<br />
σ 1<br />
1 x1 σ f(σ1 )≡ x a<br />
1 1 f(а1 )≡1⋅f(a1 ).<br />
Таким образом, k=l=n=1, теорема о разложении<br />
справедлива.<br />
2. Пусть l=n=1. Предположим, что при k=t равенство<br />
(1) является тождеством и выведем отсюда,<br />
что при k=t+1 равенство (1) тоже будет тождеством.<br />
По индуктивному предположению имеем<br />
тождество<br />
f(x1 )≡ ∨ ( σ1 )<br />
1 x1 σ f(σ1 )≡<br />
x a<br />
1 1 f(а 1 )∨ x a<br />
1 2 f(а 2 )∨…∨ x a t<br />
1 f(а t ), (a)<br />
которое является частным случаем тождества (1) при<br />
l=n=1 и k=t. Для каждого предиката f(x 1 ) заданного<br />
на множестве A t ={a 1 , a 2 ,…, a t }, построим два предиката:<br />
f ′(x 1 ) и f ″(x 1 ), определенных на множестве<br />
A t+1 ={a 1 , a 2 ,…, a t , a t+1 }, задавая их следующими<br />
условиями:<br />
⎧ 0если , x1 = at+<br />
1,<br />
f ′ ( x1)<br />
= ⎨<br />
⎩ f( x1), если x1 ≠ at+<br />
1,<br />
⎧ 1если , x1 = at+<br />
1,<br />
f ′′ ( x1)<br />
= ⎨<br />
⎩ f( x1), если x1 ≠ at+<br />
1.<br />
Докажем, что для указанных предикатов справедливо<br />
тождество (1), то есть:<br />
f ′(x1 )≡ ∨ ( σ1 )<br />
f ″(x1 )≡ ∨ ( σ1 )<br />
1 x1 σ f ′(σ1 )≡ x a<br />
1 1 f ′(а1 )∨ x a<br />
1 2 f ′(а2 )∨…<br />
…∨ x a t<br />
1 f ′(аt )∨ x a t+<br />
1<br />
1 f ′(аt+1 ),<br />
1 x1 σ f ″(σ1 )≡ x a<br />
1 1 f ″(а1 )∨ x a<br />
1 2 f ″(а2 )∨…<br />
…∨x a t<br />
1 f ″(аt )∨ x a t+<br />
1<br />
1 f ″(аt+1 ). (б)<br />
Действительно, если x1≠at+1 , то f ′(x1 )≡f ″(x1 )≡f(x1 )<br />
и x a t+<br />
1<br />
1 ≡0. В этом случае, согласно (а), равенства (б)<br />
обращаются в тождества. Если же x1 =at+1 , то f ′(x1 )≡0,<br />
f ″(x1 )≡1, x a<br />
1 1 ≡ x a<br />
1 2 ≡…≡ x a t<br />
1 ≡0, x a t+<br />
1<br />
1 ≡1, f ′(аt+1 )≡0,
f ″(а t+1 )≡1, поэтому равенства (б) также обращаются<br />
в тождества типа 0≡0 или 1≡1. Заметим, что<br />
предикатами f ′(x 1 ) и f ″(x 1 ) исчерпывается класс<br />
возможных одноместных предикатов, заданных на<br />
множестве A t+1 . Таким образом, при l=n=1 теорема<br />
о разложении справедлива для любого k.<br />
3. Пусть l=1 и k произвольным образом зафиксировано.<br />
Предположим, что при n=t равенство (1)<br />
является тождеством, и выведем отсюда, что и при<br />
n=t+1 равенство (1) будет тождеством. По предположению,<br />
согласно (1), имеет место тождество<br />
f(x1 , x2 ,…, xt )≡ ∨ ( σ1 )<br />
Поэтому при любом a i (1≤i≤k)<br />
f(x1 , x2 ,…, xt , ai )≡ ∨ ( σ1 )<br />
Следовательно,<br />
f(x1 , x2 ,…, xt , xt+1 )≡ ∨ ( σ1 )<br />
1 x1 σ f(σ1 , x2 ,…, xt ).<br />
1 x1 σ f(σ1 , x2 ,…, xt , ai ).<br />
1 x1 σ f(σ1 , x2 ,…, xt , xt+1 ).<br />
Заметим, что предикатами, для которых справедливо<br />
записанное выше тождество, исчерпывается<br />
весь класс всевозможных t+1-местных предикатов.<br />
Таким образом, при l=1 теорема о разложении<br />
справедлива для любых k и n.<br />
4. Пусть k и n произвольно фиксированы. Предположим,<br />
что при l=t равенство (1) является тождеством,<br />
и выведем отсюда, что и при l=t+1, если<br />
l≤n, равенство (1) будет тождеством. По предположению,<br />
согласно (1), имеем тождество:<br />
≡ ∨<br />
( σ1, σ2,.., σt<br />
)<br />
f(x 1 , x 2 ,…, x t , x t+1 ,…, x n )≡<br />
σ σ σ<br />
1 2<br />
1 2 t<br />
x x ... xt f(σ1 , σ2 ,…, σt , xt+1 ,…, xn ).<br />
Пользуясь им, а также результатом, полученным<br />
в пункте 3 настоящего доказательства, имеем:<br />
≡ ∨<br />
( σ1, σ2,.., σt<br />
)<br />
≡ ∨<br />
( σ1, σ2,.., σt<br />
)<br />
f(x 1 , x 2 ,…, x t , x t+1 , x t+2 ,…, x n )≡<br />
σ σ σ<br />
1 2<br />
1 2 t<br />
x x ... xt f(σ1 , σ2 ,…, σt , xt+1 , xt+2 ,…, xn )≡<br />
σ σ σ<br />
1 2 t<br />
x1 x2 ... xt ( ∨<br />
+<br />
t x<br />
( σt 1)<br />
t + +<br />
1 1 σ<br />
xt+2 ,…, xn ))≡ ∨ x<br />
( σ1, σ2,.., σt+<br />
1)<br />
x t xt σt+1 , xt+2 ,…, xn ).<br />
f(σ 1 , σ 2 ,…, σ t , σ t+1 ,<br />
σ1 σ2 σ 1<br />
1 2 ... + 1<br />
+ f(σ1 , σ2 ,…,<br />
Таким образом, теорема доказана для любых k,<br />
l, n.<br />
Из теоремы о дизъюнктивном разложении вытекают<br />
следующие два следствия.<br />
Следствие 1. Любой конечный предикат f(x 1 , x 2 ,…,<br />
x n ) может быть представлен в виде:<br />
f(x 1 , x 2 ,…, x n )≡ x a<br />
1 1 f(a 1 , x 2 ,…, x n )∨ x a<br />
1 2 f(a 2 ,<br />
x 2 ,…,x n )∨…∨ x a k<br />
1 f(a k , x 2 ,…, x n ). (2)<br />
Следствие 2. Любой конечный предикат f(x 1 , x 2 ,…,<br />
x n ) может быть представлен в виде:<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
f(x1 , x2 ,…, xn )≡ ∨ f ( σ1, σ2,.., σn<br />
) = 1<br />
σ σ σ<br />
1 2<br />
1 2 n<br />
x x ... xn . (3)<br />
Тождества (2) и (3) получаем, полагая в (1) соответственно<br />
l=1 и l=n. Запись f(σ1 , σ2 ,…, σn )=1 в (3)<br />
под знаком дизъюнкции означает, что логическое<br />
суммирование ведется только по тем наборам индексов<br />
σ1 , σ2 ,…, σn , которые обращают предикат f<br />
в 1. Формула, стоящая в правой части тождества<br />
(3), представляет собой СДНФ предиката f. Если<br />
предикат f тождественно ложный, то, согласно<br />
теореме о дизъюнктивном разложении, в правой<br />
части тождества (3) нужно ставить 0.<br />
Тождество (2) может быть использовано в качестве<br />
эффективного средства упрощения формул<br />
алгебры конечных предикатов. Рассмотрим пример<br />
такого упрощения. Пусть A={a, b}, B={x1 , x2 ,<br />
x3 ,}. Требуется упростить формулу:<br />
f(x1 , x2 , x3 )≡<br />
≡(x a<br />
1 ∨x2 b )(x1 a∨x1 bx3 a )∨(x1 a∨x1 a )(x2 bx3 b∨x2 ax3 a ).<br />
Производим разложение функции f по переменной<br />
x1 :<br />
f(x1 , x2 , x3 )≡x a<br />
1 f(a, x2 , x3 )∨x b<br />
1 f(b, x2 , x3 ),<br />
f(a, x2 , x3 )≡(aa∨x b<br />
2 )(aa∨abx3 a )∨(aa∨x2 a )(x2 bx3 b∨ ∨x a<br />
2 x3<br />
a )≡(1∨x2 b )(1∨0⋅x3 a )∨(1∨x2 a )(x2 bx3 b∨x2 ax3 a )≡1,<br />
f(b, x2 , x3 )≡(ba∨x b<br />
2 )(ba∨bbx3 a )∨(ba∨x2 a )(x2 bx3 b∨x2 ax3 a )≡<br />
≡x b<br />
2 x3<br />
a∨x2 a (x2 bx3 b∨x2 ax3 a )≡x2 bx3 a∨x2 ax3 a≡ ≡(x a<br />
2 ∨x2 b )x3 a≡x3 a .<br />
Окончательно:<br />
f≡x 1 a ∨x1 b x3 a ≡(x1 a ∨x1 b )(x1 a ∨x3 a )≡x1 a ∨x3 a .<br />
Из второго следствия теоремы о разложении<br />
вытекает полнота алгебры конечных предикатов:<br />
любой конечный предикат можно записать в виде<br />
формулы алгебры конечных предикатов. Тождество<br />
(3) можно использовать для получения СДНФ<br />
предиката, заданного какой-нибудь произвольно<br />
выбранной формулой алгебры конечных предикатов.<br />
Пример: A={a, b}, B={x 1 , x 2 , x 3 ,}, дан предикат:<br />
f(x 1, x 2, x 3)≡<br />
≡(x 1 a ∨x1 b )(x1 a ∨x1 b x3 a )∨(x1 a ∨x2 a )(x2 b x3 b ∨x2 a x3 a ).<br />
Требуется отыскать СДНФ указанного предиката.<br />
Имеем:<br />
f(a, a, a)≡(aa∨ab )(aa∨abaa )∨(aa∨aa )(abab∨aaaa )≡1.<br />
Аналогично находим: f(a, a, b)≡1, f(a, b, a)≡1,<br />
f(a, b, b)≡1, f(b, a, a)≡1, f(b, a, b)≡1, f(b, b, a)≡1, f(b, b,<br />
b)≡0. СДНФ предиката f имеет вид:<br />
f(x1 , x2 , x3 )≡x a<br />
1 x2<br />
ax3 a∨x1 ax2 ax3 b∨ ∨x a<br />
1 x2<br />
bx3 a∨x1 ax2 bx3 b∨x1 bx2 ax3 a∨x1 bx2 bx3 a .<br />
2. Совершенная конъюнктивная нормальная форма<br />
Введем в алгебре конечных предикатов операцию<br />
отрицания. Введение отрицания позволит<br />
показать, что алгебра конечных предикатов есть<br />
17
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
булева алгебра. Кроме того, наличие операции<br />
отрицания даст возможность в ряде случаев записывать<br />
конечные предикаты в форме более компактных<br />
выражений, а также выполнять тождественные<br />
преобразования формул более коротким<br />
путем. Наконец, операция отрицания позволит<br />
естественным образом ввести понятие совершенной<br />
конъюнктивной нормальной формы и сформулировать<br />
теорему о конъюнктивном разложении<br />
предиката.<br />
Операция отрицания предиката − это одноместная<br />
функция, заданная на множестве всех k-ичных<br />
n-местных предикатов со значениями в том же<br />
множестве. Если A − аргумент и B – значение операции<br />
отрицания, то условимся писать (¬A)=B<br />
или, в сокращенной форме A =В. Отрицанием предиката<br />
f(x 1 , x 2 ,…, x n ) назовем предикат<br />
18<br />
g(x 1 , x 2 ,…, x n )≡ f (x 1 , x 2 ,…, x n ),<br />
принимающий значение 0 для всех тех наборов<br />
значений аргументов (x1 , x2 ,…, xn ), при которых f(x1 ,<br />
x2 ,…, xn )=1, и принимающий значение 1 для всех<br />
тех наборов значений аргументов, при которых f(x1 ,<br />
x2 ,…, xn )=0.<br />
При k≥2 можно определить операцию отрицания<br />
аксиоматически, задав ее следующими тождествами:<br />
A∨B ≡ AB , (4)<br />
AB ≡ A∨ B , (5)<br />
a i<br />
x ≡ a1∨ a2 +<br />
∨ ∨ ai-1 1 ∨ ai ∨ ∨ a k<br />
x x ... x x ... x . (6)<br />
Здесь A и B − произвольные формулы, х − произвольная<br />
буквенная переменная, ai − произвольная<br />
буква алгебры конечных предикатов, индекс i принимает<br />
значения в пределах от 1 до k. Тождества<br />
(4) и (5) совпадают по форме с известными в алгебре<br />
логики законами де Моргана, которые, однако,<br />
применяются теперь не к булевым переменным, а<br />
к переменным предикатам. Тождество (6) назовем<br />
законом отрицания. Заметим, что при k=1 закон отрицания<br />
теряет смысл.<br />
Справедливость законов де Моргана доказывается<br />
проверкой тождеств для всех возможных вариантов<br />
значений предикатов A и B. Например, убеждаемся<br />
при A=0 и B=1, что 0∨1≡0⋅1 и 01 ⋅ ≡0∨ 1.<br />
Легко устанавливается также справедливость закона<br />
отрицания. Действительно, если x=ai , то предикаты,<br />
стоящие слева и справа от знака тождества в<br />
(6), обращаются в 0, если же x≠ai , то оба предиката<br />
обращаются в 1.<br />
Пользуясь приведенными ранее тождествами<br />
алгебры конечных предикатов, а также тождествами<br />
(4) – (6), можно доказать, что:<br />
0 ≡1 , (7)<br />
1 ≡0. (8)<br />
Действительно,<br />
a a ≡ a ∨ a 2 ≡ a<br />
x ∨ a 3<br />
x ∨…∨ a k<br />
x ∨ a1<br />
x ∨ a 3<br />
x ∨<br />
k ∨…∨ a<br />
x ≡1,<br />
0 ≡ 1 2 1 2<br />
x x x x<br />
a a a a a a<br />
1 2 k 1 2 k<br />
1 ≡- x ∨x ∨... ∨x ≡ x x ... x ≡<br />
2 ≡( a<br />
x ∨ a 3<br />
x ∨…∨ a k 1<br />
x )( a<br />
x ∨ a 3<br />
x ∨…∨ a k<br />
x )…<br />
1 ...( a<br />
x ∨ a 2<br />
k-<br />
x ∨ ∨…∨ a 1<br />
x )≡0.<br />
Любая формула с отрицаниями может быть<br />
преобразована с помощью зависимостей (4) – (8)<br />
в тождественную ей формулу без отрицаний. Действительно,<br />
применяя многократно законы де<br />
Моргана, мы всегда сможем все знаки отрицания,<br />
стоящие над формулой или ее частями, опустить<br />
непосредственно на узнавания букв или на 0 и 1.<br />
Затем, пользуясь тождествами (6) – (8), исключаем<br />
отрицания из формулы. Рассмотрим пример исключения<br />
знаков отрицания из формулы. Пусть<br />
A={a, b, c}. Тогда:<br />
a b c a b c<br />
1 1 2 1 1 2<br />
a b c<br />
1 1 2<br />
x ∨x x ≡ x x x ≡ x ( x ∨ x ) ≡<br />
≡(x 1 b ∨x1 c )(x1 a ∨x1 c ∨x2 a ∨x2 b ).<br />
С помощью тождеств (4) – (6) совместно с перечисленными<br />
выше основными тождествами алгебры<br />
конечных предикатов можно решить вопрос о<br />
тождественности двух любых формул со знаками<br />
отрицания. Сначала исключаем из формул знаки<br />
отрицания, а затем приводим формулы к СДНФ.<br />
Отсюда следует, что система тождеств (4) – (6)<br />
полна, она совместно с тождествами (4) – (19) [1]<br />
аксиоматически определяет все свойства операции<br />
отрицания.<br />
В ряде случаев процесс исключения знаков отрицания<br />
из формул существенно упрощается, если<br />
использовать следующие тождества:<br />
a a a<br />
i j i<br />
x x ≡ x , (9)<br />
a a a<br />
i j i<br />
x ( x ∨A) ≡ x . (10)<br />
Тождества справедливы при условии, что i≠j,<br />
индексы i и j принимают значения в пределах от 1<br />
до k. Буквой A обозначена произвольная формула<br />
алгебры конечных предикатов. Тождество (9) назовем<br />
законом поглощения отрицания, тождество<br />
(10) − обобщенным законом поглощения отрицания.<br />
Докажем справедливость тождества (10):<br />
x a i ( x a j ∨A)≡ x a i ( x a 1 ∨ x a 2 ∨…∨ x a i ∨…<br />
∨ x a j−1 ∨ x a j+1 ∨…∨ x a k ∨A)≡ x a i ∨ x a i A≡ x a i .<br />
Рассмотрим пример, иллюстрирующий применение<br />
только что приведенных тождеств. Пусть<br />
A={a, b, c}, требуется упростить формулу<br />
a b c a<br />
1 1 1 2<br />
f≡ ( x x ∨x ∨x ) x b<br />
1 x2<br />
c ,
предварительно исключив из нее отрицания. Применяя<br />
тождество (10), непосредственно получаем<br />
искомый результат f≡x 1 b x2 c . Без использования<br />
законов поглощения отрицания тот же результат<br />
достигается более длинным путем:<br />
f≡((x 1 b ∨x1 c )(x1 a ∨x1 c )∨x1 a ∨x1 b ∨x2 b ∨x2 c )x1 b x2 c ≡<br />
≡(x 1 c ∨x1 a ∨x1 b ∨x2 b ∨x2 c )x1 b x2 c ≡x1 b x2 c ∨x1 b x2 c ≡x1 b x2 c .<br />
Для операции отрицания также справедливы<br />
следующие тождества: закон двойного отрицания<br />
закон исключенного третьего<br />
закон противоречия<br />
A ≡ A,<br />
(11)<br />
A∨A ≡1, (12)<br />
AA ≡ 0. (13)<br />
Эти тождества по форме совпадают с одноименными<br />
законами алгебры логики. Тождества (11)<br />
– (13) можно получить из ранее выведенных тождеств.<br />
Докажем справедливость закона двойного отрицания<br />
индукцией по длине формулы. Он выполняется<br />
для формул 0 и 1, а также для всевозможных<br />
узнаваний букв: 0≡1≡ 0,<br />
1≡0≡ 1,<br />
a a a a a a<br />
i 1 2 i− 1 i+ 1<br />
k<br />
x ≡ x ∨x ∨ ... ∨x ∨x ∨... ∨x ≡<br />
a a a a<br />
1 2 i− 1 i+<br />
1<br />
≡ x x ... x x ... x<br />
2 i k 1 3<br />
( x ∨... ∨x ∨... ∨x )( x ∨x∨... ∨<br />
i k<br />
∨x ∨... ∨ x )...( x<br />
ak<br />
a a a a a<br />
a a<br />
≡<br />
a1 ai ai+<br />
2<br />
∨... ∨x ∨x ∨... ∨<br />
ak a1 ai ak−1ai ∨x )...( x ∨... ∨x ∨... ∨x ) ≡ x .<br />
Предположим, что закон двойного отрицания<br />
справедлив для формул А и В, и установим, что он<br />
выполняется также для формул А∨В и AB:<br />
A∨B ≡ AB ≡ A∨B ≡ A∨ B,<br />
AB ≡ A∨B ≡ AB ≡ AB.<br />
Таким образом, закон двойного отрицания<br />
справедлив для всех формул.<br />
Докажем тождество (12). Оно выполняется для<br />
формул 0 и 1, а также для всех узнаваний букв: 0∨ 0<br />
≡0∨1≡1, 1∨1 ≡1∨0≡1,<br />
a a<br />
i i x ∨x ≡<br />
a a a a a a<br />
i 1 2 i− 1 i+ 1 k<br />
≡ x ∨x ∨x ∨... ∨x ∨x ∨... ∨x ≡1.<br />
Если тождество (40) справедливо для формул A<br />
и B, то оно справедливо и для формул A∨B и AB:<br />
A∨B∨ A∨B ≡A∨B∨ A B ≡<br />
≡(A∨ A )(A∨ B )∨(B∨ A )(B∨⎺B)≡A∨ B ∨B∨ A ≡1,<br />
AB∨ AB ≡AB∨ A ∨ B ≡(A∨ A )(B∨ A )(A∨ B )(B∨ B )≡<br />
≡ B∨ A ∨A∨ B ≡1.<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
Аналогично доказывается закон противоречия.<br />
Итак, мы видим, что в алгебре конечных предикатов<br />
наряду с операциями дизъюнкции и конъюнкции<br />
существует операция отрицания со всеми<br />
свойствами, которыми наделяет ее булева алгебра<br />
(тождества (4), (5), (7), (8), (11) – (13)). Поэтому алгебру<br />
конечных предикатов можно рассматривать<br />
как разновидность булевой алгебры. Основным<br />
множеством в ней служит система всех k-ичных<br />
n-местных предикатов с алфавитом букв {a 1 , a 2 ,<br />
…, a k } и алфавитом переменных {x 1 , x 2 , …, x n }, роль<br />
нуля выполняет тождественно ложный предикат,<br />
роль единицы − тождественно истинный предикат,<br />
в роли базисных операций выступают дизъюнкция,<br />
конъюнкция и отрицание.<br />
В качестве системы тождеств алгебры конечных<br />
предикатов, задающей в ней структуру булевой алгебры<br />
(и только эту структуру), можно использовать,<br />
к примеру, следующий набор аксиом [1]: (10),<br />
(4), (6), (8), (39), (32) и тождество:<br />
( A∨A) B ≡ B.<br />
(14)<br />
Подчеркнем еще раз, что алгебра конечных предикатов<br />
не есть только булева алгебра, она имеет и<br />
свои специфические тождества: закон истинности<br />
(18) [1], закон ложности (19) [1] и закон отрицания<br />
(6), не вытекающие из аксиом булевой алгебры.<br />
Законы истинности и ложности можно записать<br />
в модифицированном виде без использования<br />
символов 0 и 1:<br />
x a 1 ∨ x a 2 ∨…∨ x a k ≡A∨ A , (15)<br />
x a i x a i ≡A A , (i≠j) (16)<br />
Тождество (16) может быть выведено из тождеств<br />
булевой алгебры и тождеств (6), (15). Действительно,<br />
пусть i≠j. Тогда:<br />
a a a a<br />
x a a<br />
i j i j i j<br />
x ≡ x x ≡ x ∨x ≡<br />
≡( x a 1 ∨ x a 2 ∨…∨ x a i−1 ∨ x a i+1 ∨…∨ x a k ∨ x a 1 ∨<br />
∨ x a 2 ∨…∨ x a j−1 ∨ x a j+1 ∨…∨ x a k )≡ ( x a 1 ∨ x a 2 ∨…∨ x a k )≡<br />
≡ A∨A ≡ AA.<br />
Таким образом, при наличии операции отрицания,<br />
заданной аксиоматически тождествами (4)-<br />
(6), законы ложности можно исключить из числа<br />
аксиом алгебры конечных предикатов.<br />
Заметим, что введение операции отрицания в<br />
алгебре конечных предикатов не расширяет ее выразительных<br />
возможностей. Ведь мы знаем, что<br />
алгебра конечных предикатов полна и без операции<br />
отрицания. Таким образом, введением операции<br />
отрицания достигается лишь консервативное<br />
расширение [3] алгебры конечных предикатов. В<br />
дальнейшем мы не раз будем вводить в алгебре конечных<br />
предикатов новые операции. Хотя они и не<br />
расширяют выразительных возможностей алгебры<br />
19
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
конечных предикатов, однако делают более гибким<br />
ее <strong>язык</strong>, повышают уровень его абстрактности.<br />
Рассмотрим понятие инверсного предиката, которое<br />
нам понадобится при введении совершенной<br />
конъюнктивной нормальной формы. Предикат<br />
g(x1 , x2 ,…, xn ) назовем инверсным по отношению к<br />
предикату f(x1 , x2 ,…, xn ), если<br />
g(x1 , x2 ,…, xn )≡ f (x1 , x2 ,…, xn ).<br />
Предикат, инверсный предикату f, будем записывать<br />
в виде f * , так что:<br />
20<br />
f * (x 1 , x 2 ,…, x n )≡ f (x 1 , x 2 ,…, x n ). (17)<br />
Таблица инверсного предиката может быть<br />
получена из таблицы исходного предиката заменой<br />
в ее последней строке значений предиката на<br />
обратные: 0 на 1 и 1 на 0. Для каждого предиката<br />
существует инверсный ему предикат. Предикат,<br />
инверсный инверсному предикату, совпадает с исходным<br />
предикатом:<br />
f ** (x1 , x2 ,…, xn )≡f(x1 , x2 ,…, xn ). (18)<br />
Система предикатов, инверсных всевозможным<br />
предикатам, совпадает с системой всех предикатов<br />
(имеются в виду предикаты, соответствующие<br />
вполне определенным наборам множествам букв<br />
и переменных). По формуле, представляющей некоторый<br />
конечный предикат, нетрудно построить<br />
формулу для инверсного предиката. Для этого<br />
нужно в исходной формуле заменить все знаки<br />
конъюнкции знаками дизъюнкции, знаки дизъюнкции<br />
– знаками конъюнкции, знаки 0 – знаками<br />
1 и знаки 1 – знаками 0. Следует также ввести<br />
знаки отрицания над теми узнаваниями букв, где<br />
они до этого отсутствовали, и исключить знаки отрицания<br />
у тех узнаваний букв, над которыми они<br />
прежде присутствовали. Например, пусть<br />
тогда<br />
a b c<br />
1 2 3 ,<br />
f ≡ x x ∨x<br />
a b c<br />
1 2 3 .<br />
f* ≡( x ∨x<br />
) x<br />
Рассмотрим теперь конъюнктивное разложение<br />
предиката. Для этого применим тождество (1)<br />
к предикату f * (x1 , x2 ,…, xn ):<br />
f * (x1 , x2 ,…, xl , xl+1 ,…, xn )≡<br />
σ1 σ2 σl<br />
≡ ∨ x1 x2 ... xl f * (σ1 , σ2 ,…, σl , xl+1 ,…, xn ).<br />
( σ1, σ2,.., σl<br />
)<br />
Действуем отрицанием на левую и правую части<br />
полученного тождества, используя законы де Моргана<br />
и учитывая, что f * ≡ f . В результате приходим<br />
к теореме о конъюнктивном разложении, формулируемой<br />
следующим образом.<br />
Любой конечный предикат f(x1 , x2 ,…, xn ) может<br />
быть представлен в виде:<br />
f ( x , x , …, x , x , …,<br />
x )≡<br />
1 2 l l+ 1 n<br />
∨<br />
σ1 σ2 σl<br />
x1 ∨x2 ∨... ∨ x<br />
( σ l<br />
1, σ2,.., σl<br />
)<br />
∨f( σ , σ , …, σ , x , …,<br />
x )).<br />
1 2 l l+ 1 n<br />
(19)<br />
Представление предиката f(x 1 , x 2 ,…, x n ) в виде<br />
правой части тождества (19) назовем его конъюнктивным<br />
разложением по переменным x 1 , x 2 ,…, x n .<br />
Буквенные переменные σ 1 , σ 2 ,…, σ l играют роль<br />
индексов при образовании многократной конъюнкции.<br />
Запись (σ 1 , σ 2 ,…, σ l ) под знаком конъюнкции<br />
означает, что логическое перемножение<br />
ведется по всевозможным наборам индексов σ 1 ,<br />
σ 2 ,…, σ l . Таким образом, в правой части тождества<br />
(19) присутствуют k l конъюнктивных членов.<br />
Из теоремы о конъюнктивном разложении вытекают<br />
следующие два следствия.<br />
Следствие 1. Любой конечный предикат f (x 1 , x 2 ,<br />
…, x n ) может быть представлен в виде<br />
a1<br />
f ( x , x , …,<br />
x )≡( x ∨ f a , x , …,<br />
x )<br />
1 2 n 1 1 2<br />
a<br />
1<br />
2 ∧( x ∨ f a , x , …,<br />
x<br />
( ) ∧<br />
ak<br />
( 2 2 n ) ) …( x1<br />
∨<br />
( )<br />
∨f a , x , …,<br />
x ).<br />
k 2 n<br />
n<br />
(20)<br />
Следствие 2. Любой конечный предикат<br />
f( x1, x2 ,..., xn) может быть представлен в виде<br />
f(x1 , x2 ,…, xn )≡ ∨ f ( σ1, σ2,.., σn<br />
) = 0<br />
σ σ σ<br />
1 2<br />
1 2<br />
n<br />
( x ∨x ∨... ∨ xn ). (21)<br />
Тождества (20) и (21) находим, полагая в виде (19)<br />
соответственно l=1 и l=n. Запись f(σ1 , σ2 ,…, σn )=0 в<br />
(21) под знаком конъюнкции означает, что логическое<br />
перемножение ведется только по тем наборам<br />
индексов (σ1 , σ2 ,…, σl ), которые обращают предикат<br />
f в 0. Если предикат f тождественно истинный, то,<br />
согласно теореме о конъюнктивном разложении, в<br />
правой части тождества (21) нужно ставить 1.<br />
Представление предиката f в виде формулы, получаемой<br />
в результате исключения из первой части<br />
тождества (21) знаков отрицания с помощью<br />
законов отрицания, назовем совершенной конъюнктивной<br />
нормальной формой предиката f (СКНФ).<br />
Рассмотрим пример получения СКНФ предиката.<br />
Пусть A={a, b, c}, B={x1 , x2 }. Найти СКНФ предиката:<br />
a b a c b a<br />
f(x1, x2)= x x ∨x x ∨ x x .<br />
1 2 1 2 1 2<br />
Значения f(σ 1 , σ 2 ) равны 0 для всех наборов (σ 1 ,<br />
σ 2 ), кроме (a, b), (a, c) и (b, a). По формуле (49) находим:<br />
a a b b b c<br />
1 2 1 2 1 2<br />
f( x , x ) ≡( x ∨x )( x ∨x )( x ∨x) ∧<br />
1 2<br />
c a c b<br />
c c<br />
∧( x1 ∨x2)( x1 ∨ x2)(<br />
x1 ∨ x2).<br />
Избавляясь от отрицаний с помощью тождеств<br />
(34), выводим СКНФ предиката f:<br />
b c b c a c a c<br />
1 2 1 1 2 2 1 1 2 2<br />
f( x , x ) = ( x ∨x ∨x ∨x )( x ∨x ∨x ∨x) ∧<br />
a c a<br />
1 1 2<br />
b a b b c<br />
2 1 1 2 2<br />
∧( x ∨x ∨x ∨x )( x ∨x ∨x ∨x ) ∧<br />
a b a c a b a b<br />
1 1 2 2 1 1 2 2<br />
∧( x ∨x ∨x ∨x )( x ∨x ∨x ∨ x ) .<br />
Как известно, в алгебре логики понятия СДНФ<br />
и СКНФ двойственны друг другу. Это значит, что
определение понятия СКНФ в алгебре логики может<br />
быть получено простой заменой в определении<br />
СДНФ слов “конъюнкция”, “дизъюнкция”, “истина”,<br />
“ложь” соответственно словами “дизъюнкция”,<br />
“конъюнкция”, “ложь”, “истина”. В алгебре<br />
конечных предикатов было бы неправильно определять<br />
СКНФ по аналогии с СДНФ как конъюнкцию<br />
таких дизъюнкций узнаваний букв, в которые<br />
каждая переменная входит по одному разу. На самом<br />
деле в конъюнктивные члены СКНФ каждая<br />
переменная входит k-1 раз. В алгебре конечных<br />
предикатов только при k=2 имеет место двойственность<br />
понятий СДНФ и СКНФ такого же типа, как<br />
и в алгебре логики.<br />
Введем понятия элементарной дизъюнкции,<br />
конституэнты нуля и конъюнктивной нормальной<br />
формы. Эти понятия не являются двойственными<br />
понятиями элементарной конъюнкции, конституэнты<br />
единицы и ДНФ, как это имеет место в алгебре<br />
логики. Элементарной дизъюнкцией назовем такую<br />
дизъюнкцию узнаваний букв, в которую каждое<br />
узнавание буквы может входить не более одного<br />
раза и ни одна из переменных не может входить не<br />
более k-1 раз. Элементарной дизъюнкцией, не содержащей<br />
ни одного дизъюнктивного члена, будем<br />
считать формулу 0. Иными словами, никакая переменная<br />
не может быть представлена в элементарной<br />
дизъюнкции всеми своими узнаваниями, хотя<br />
бы одно из узнаваний должно отсутствовать. Примерами<br />
элементарных дизъюнкций при A={a, b, c},<br />
B={x 1 , x 2 , x 3 } могут служить формулы:<br />
a b<br />
a c b<br />
b c a c<br />
x1 ∨ x2;<br />
x1 ∨x1 ∨ x2<br />
; x2 ∨x2 ∨x3 ∨ x3<br />
.<br />
Формула<br />
a b c a<br />
x ∨x ∨x ∨ x<br />
1 1 1 2<br />
не является элементарной дизъюнкцией, так<br />
как в нее входят все узнавания буквы для переменной<br />
x 1 . Такая формула выражает тождественно истинный<br />
предикат.<br />
Любую конъюнкцию произвольного числа различных<br />
элементарных дизъюнкций назовем конъюнктивной<br />
нормальной формой (КНФ) предиката.<br />
В качестве КНФ не содержащей ни одного конъюнктивного<br />
члена, примем формулу 1. Пример<br />
КНФ:<br />
a b a c b b c a c<br />
1 2 1 1 2 2 2 3 3<br />
( x ∨x )( x ∨x ∨x )( x ∨x ∨x ∨ x ) .<br />
Любую элементарную дизъюнкцию, в которой<br />
встречаются все переменные алгебры конечных<br />
предикатов, причем каждая из них входит k-1 раз<br />
в составе узнаваний букв с различным показателями,<br />
назовем конституэнтой нуля. Условимся в<br />
конституэнте нуля все узнавания букв располагать<br />
в порядке роста номеров переменных, а для одинаковых<br />
переменных – в порядке роста номеров<br />
букв, играющих роль показателей узнаваний буквы.<br />
Пример конституэнты нуля (в той же алгебре):<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
a b b c a c<br />
1 1 2 2 3 3<br />
x ∨x ∨x ∨x ∨x ∨ x .<br />
Используя знак отрицания, можно записывать<br />
конституэнты нуля в более компактной форме,<br />
близкой к форме записи конституэнты единицы.<br />
Конституэнту нуля, приведенную в предыдущем<br />
примере, запишем так:<br />
c a b<br />
1 2 3<br />
x ∨x ∨ x .<br />
Последняя форма записи конституэнты нуля<br />
инверсна форме записи конституэнты единицы: в<br />
ней вместо знаков конъюнкции стоят знаки дизъюнкции,<br />
а над узнаваниями букв появились знаки<br />
отрицания.<br />
Теперь мы можем дать еще одно, равносильное<br />
первому, определение совершенной конъюнктивной<br />
нормальной формы как конъюнкции произвольного<br />
числа различных конституэнт нуля. Осуществляя<br />
нумерацию конституэнт нуля и СКНФ, можно показать,<br />
что каждому k-ичному n-местному предикату<br />
соответствует одна СКНФ. В качестве СКНФ<br />
тождественно истинного предиката принимаем<br />
формулу 1.<br />
Кроме конъюнкции и дизъюнкции предикатов,<br />
рассмотренных ранее, введем в алгебре конечных<br />
предикатов еще одну двухместную операцию – импликацию<br />
предикатов ⊃, определив ее следующим<br />
равенством:<br />
A ⊃B≡ A∨B . (22)<br />
def<br />
Буквы А и В обозначают произвольные формулы<br />
алгебры конечных предикатов. Знак ≡<br />
def<br />
обозначает<br />
равенство предикатов по определению. Операцию<br />
⊃ будем считать младшей по отношению к операциям<br />
∧ и ∨. Это значит, что при отсутствии в формуле<br />
скобок, регулирующих порядок выполнения<br />
операций, операция импликации должна выполнятся<br />
после выполнения операций конъюнкции и<br />
дизъюнкции.<br />
Свойства импликации предикатов совпадают<br />
со свойствами импликации высказываний [3]. Выпишем<br />
наиболее важные из них – рефлексивность<br />
импликации:<br />
A⊃A≡1, (23)<br />
транзитивность импликации:<br />
(A⊃B)(B⊃C)⊃(A⊃C)≡1, (24)<br />
свойства логических констант:<br />
0⊃A≡1, (25)<br />
1⊃A≡A, (26)<br />
закон дедукции:<br />
A⊃0≡ A , (27)<br />
A⊃1≡1, (28)<br />
A(A⊃B)⊃B≡1, (29)<br />
21
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
22<br />
закон контрапозиции:<br />
закон импортации:<br />
закон экспортации:<br />
A⊃B≡ B ⊃ A , (30)<br />
(A⊃(B⊃C))⊃(AB⊃C)≡1, (31)<br />
(AB⊃C)⊃(A⊃(B⊃C))≡1, (32)<br />
закон приведения к абсурду:<br />
A A ⊃B≡1. (33)<br />
Используя операцию импликации, тождество<br />
(19) можно записать без знаков отрицания:<br />
f ( x , x , …, x , x , …,<br />
x )≡<br />
1 2 l l+ 1 n<br />
∧<br />
σ σ σ<br />
( σ1, σ2,.., σl<br />
) 1 2 l<br />
1 2 l<br />
≡ x x ... x ⊃<br />
⊃ f( σ , σ , …, σ , x , …,<br />
x )).<br />
1 2 l l+ 1 n<br />
(34)<br />
В соответствии с этим первое и второе следствия<br />
теоремы о конъюнктивном разложении запишутся<br />
в виде:<br />
f ( x , x , …,<br />
x )≡<br />
1 2<br />
a<br />
1 1 2<br />
1 ≡( x ⊃ f a , x , …,<br />
x )<br />
a<br />
1 2 2<br />
n<br />
( ) ∧<br />
2 ∧( x ⊃ f( a , x , …, x )) ∧…<br />
a<br />
1 k 2 n<br />
k ∧( x ⊃ f( a , x , …,<br />
x )).<br />
1 2 n ∧ f ( σ 1 2 n<br />
1, σ2,.., σn<br />
) = 0<br />
n<br />
n<br />
(35)<br />
σ1 σ2 σn<br />
f ( x , x , …,<br />
x )≡( ( x x ... x ⊃0).<br />
(36)<br />
Последнее тождество называется импликативным<br />
разложением предиката. Оно показывает, что<br />
любой конечный предикат может быть представлен<br />
в виде суперпозиции операций конъюнкции и<br />
импликации, действующих на всевозможные узнавания<br />
букв, и на тождественно ложный предикат 0.<br />
Вместе с тем, как указывалось выше, при k≥2 предикат<br />
0 можно выразить в виде конъюнкции неко-<br />
a1 a2<br />
торых узнаваний букв, например, x1 x1<br />
= 0 . Таким<br />
образом, мы приходим к еще одной полной алгебре<br />
конечных предикатов. Ее базис составляют операции<br />
конъюнкции и импликации и всевозможные<br />
узнавания букв. Чтобы иметь возможность различать<br />
обе введенные алгебры, первую назовем дизъюнктивной<br />
алгеброй конечных предикатов, а вторую<br />
– импликативной. Импликативная алгебра может<br />
быть получена из дизъюнктивной заменой в ее базисе<br />
операции дизъюнкции операцией импликации,<br />
и наоборот. Кроме двух найденных, существует<br />
множество других алгебр конечных предикатов.<br />
В частности, любой набор операций, удовлетворяющий<br />
условиям теоремы Поста [4], вместе со всевозможными<br />
узнаваниями букв можно принять в<br />
качестве базиса полной алгебры конечных предикатов.<br />
В роли полной системы элементарных операций<br />
также подходит любая система операций,<br />
через которые выражаются операции конъюнкции<br />
и дизъюнкции или операции конъюнкции и<br />
импликации. По-видимому, существуют и другие<br />
базисы, задающие полные алгебры конечных предикатов.<br />
Еще предстоит сформулировать критерий<br />
полноты для алгебр конечных предикатов.<br />
В данной статье в качестве <strong>язык</strong>а для записи конечных<br />
предикатов принята дизъюнктивная алгебра<br />
и различные ее консервативные расширения.<br />
Удобство дизъюнктивной алгебры конечных предикатов<br />
состоит в том, что на ее <strong>язык</strong>е кратко и<br />
изящно записываются законы истинности и ложности.<br />
Эти законы в любой алгебре конечных предикатов<br />
будут играть особую роль. По существу,<br />
они представляют собой требования, выполнение<br />
которых необходимо и достаточно для корректного<br />
введения переменных на конечных множествах.<br />
Закон истинности задает область изменения переменной,<br />
а закон ложности обеспечивает попарное<br />
различие всех элементов множества, на котором<br />
заданна переменная. В любой другой алгебре законы<br />
истинности и ложности будут записываться в<br />
виде гораздо более громоздких выражений. В дальнейшем<br />
дизъюнктивную алгебру и ее консервативные<br />
расширения будем называть просто алгеброй<br />
конечных предикатов.<br />
3. Дизъюнктивная минимизация формул алгебры<br />
предикатов<br />
Существует целое множество дизъюнктивных<br />
и конъюнктивных нормальных форм, соответствующих<br />
одному и тому же конечному предикату.<br />
Представляет интерес следующая задача: выбрать<br />
из этого множества такую форму, в которую входит<br />
наименьшее число узнаваний букв. Назовем эту<br />
задачу канонической задачей минимизации формул<br />
алгебры конечных предикатов. Умение минимизировать<br />
формулы, как будет показано ниже, полезно<br />
при решении уравнений теории <strong>интеллект</strong>а, а также<br />
при построении схем, реализующих функции<br />
<strong>интеллект</strong>а. Дизъюнктивные и конъюнктивные<br />
нормальные формы, получаемые в результате канонической<br />
минимизации, назовем минимальными<br />
ДНФ и КНФ. Проблема канонической минимизации<br />
в алгебре конечных предикатов имеет много<br />
общего с одноименной проблемой в алгебре логики.<br />
Все излагаемые в этой статье методы можно<br />
рассматривать как обобщение известных в алгебре<br />
логики методов канонической минимизации [5]:<br />
а) отыскание минимальной дизъюнктивной нормальной<br />
формы. Здесь мы наметим последовательность<br />
действий, которые должны быть выполнены<br />
при нахождении минимальной ДНФ. Предикат g<br />
назовем импликантой предиката f, если на любом<br />
наборе значений аргументов, для которого g=1,<br />
имеем также f=1. Будем говорить, что импликанта<br />
g накрывает своими единицами единицы предиката<br />
f. Элементарную конъюнкцию g назовем<br />
собственной частью элементарной конъюнкции f,<br />
если g может быть получена из f выбрасыванием
некоторых узнаваний букв. Например, элементарная<br />
конъюнкция х 1 a х3 b есть собственная часть элементарной<br />
конъюнкции х 1 a х2 c х3 b . Назовем простой<br />
импликантой предиката f любую элементарную<br />
конъюнкцию, обладающую следующими свойствами:<br />
она есть импликанта предиката f и никакая<br />
ее собственная часть не является импликантой<br />
предиката f.<br />
Дизъюнкция любого числа импликант конечного<br />
предиката есть импликанта этого предиката.<br />
Систему S импликант конечного предиката f назовем<br />
полной, если любая единица из таблицы значений<br />
предиката f накрывается единицами хотя<br />
бы одной импликанты системы S. Тому или иному<br />
конечному предикату может соответствовать, вообще<br />
говоря, несколько различных полных систем<br />
импликант. Дизъюнкция всех импликант полной<br />
системы импликант каждого конечного предиката<br />
выражает собой этот предикат. Система всех<br />
простых импликант любого конечного предиката<br />
является его полной системой. Дизъюнкция всех<br />
простых импликант конечного предиката выражает<br />
собой этот предикат; назовем ее сокращенной<br />
дизъюнктивной нормальной формой данного конечного<br />
предиката.<br />
Во многих случаях (однако далеко не всегда)<br />
сокращенная дизъюнктивная нормальная форма<br />
представляет собой более экономное средство записи<br />
конечных предикатов, чем СДНФ. Однако<br />
сокращенная форма, как правило, не совпадает с<br />
минимальной дизъюнктивной нормальной формой,<br />
сложнее ее. Дизъюнктивным ядром конечного<br />
предиката назовем множество всех таких его простых<br />
импликант, исключение каждой из которых<br />
из системы всех простых импликант делает эту систему<br />
неполной. Элементы дизъюнктивного ядра<br />
входят в состав любой полной системы простых<br />
импликант. Систему простых импликант конечного<br />
предиката назовем приведенной, если она полна<br />
и никакое ее собственное подмножество не является<br />
полной системой. Дизъюнкцию всех простых<br />
импликант приведенной системы назовем тупиковой<br />
дизъюнктивной нормальной формой предиката.<br />
Отметим, что предикат может иметь много тупиковых<br />
дизъюнктивных нормальных форм.<br />
Любая минимальная дизъюнктивная нормальная<br />
форма является, вместе с тем, и тупиковой<br />
ДНФ. Многие конечные предикаты имеют несколько<br />
различных минимальных ДНФ, содержащих<br />
одинаковое число узнаваний букв. Выбирая<br />
из числа тупиковых ДНФ одну с наименьшим числом<br />
узнаваний букв, получаем минимальную ДНФ<br />
предиката. Сформулированные понятия и положения<br />
позволяют наметить ход действий, лежащих<br />
в основе всех описываемых ниже методов минимизации<br />
формул алгебры конечных предикатов.<br />
Вначале нужно отыскать все простые импликанты<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
заданного конечного предиката и составить из них<br />
сокращенную ДНФ. Затем следует найти все тупиковые<br />
ДНФ и из их числа выбрать минимальную<br />
дизъюнктивную нормальную форму конечного<br />
предиката.<br />
Ниже рассматриваются три алгоритма минимизации<br />
формул алгебры конечных предикатов. Алгоритмы<br />
сопровождаются примерами. В частном<br />
случае при k=2 они превращаются в известные<br />
алгоритмы канонической минимизации формул<br />
алгебры логики Квайна-Мак-Класки, Порецкого-<br />
Блейка и Нельсона [6].<br />
б) обобщение метода квайна-мак-класки. Рассмотрим<br />
метод дизъюнктивной минимизации формул<br />
алгебры конечных предикатов, обобщающий<br />
известный метод Квайна-Мак-Класки минимизации<br />
формул алгебры логики. Исходной информацией<br />
при минимизации служит совершенная<br />
дизъюнктивная нормальная форма предиката, для<br />
которого отыскивается минимальная ДНФ. Рассмотрим<br />
пример. Пусть А={a, b, c}, B={x1 , х2 , х3 }.<br />
Предикат задан следующей СДНФ:<br />
f≡x a<br />
1 x2<br />
ax3 a∨x1 ax2 ax3 b∨x1 ax2 ax3 c∨x1 ax2 bx3 b∨ ∨x a<br />
1 x2<br />
cx3 a∨x1 ax2 cx3 b∨x1 ax2 cx3 c∨x1 bx2 bx3 a∨ x b<br />
1 x2<br />
bx3 b∨x1 bx2 bx3 c∨x1 cx2 ax3 b∨x1 cx2 bx3 b∨ ∨x c<br />
1 x2<br />
cx3 b∨x1 cx2 cx3 c .<br />
Ниже описывается алгоритм минимизации,<br />
включающий в себя 9 шагов.<br />
1) Всюду, где это возможно, применяем операцию<br />
неполного дизъюнктивного склеивания, основанную<br />
на тождестве:<br />
a Ax 1 a a<br />
∨Ax2∨... ∨Axk≡ a a a<br />
≡ Ax 1∨Ax2∨... ∨Axk∨ A.<br />
(37)<br />
Здесь A – некоторая элементарная конъюнкция,<br />
х – одна из буквенных переменных. Операция<br />
неполного дизъюнктивного склеивания состоит<br />
в дописывании к исходной ДНФ в виде дополнительных<br />
дизъюнктивных членов всевозможных<br />
элементарных конъюнкций, которые можно получить<br />
переходом от левой части тождества (37)<br />
к правой. Операцию неполного дизъюнктивного<br />
склеивания сперва применяем к конституэнтам<br />
единицы исходной СДНФ, затем – к элементарным<br />
конъюнкциям, состоящим из n-1 узнаваний букв,<br />
n-2 узнаваний букв и т.д. и, наконец, к элементарным<br />
конъюнкциям, состоящим из одного узнавания<br />
буквы. В нашем примере имеем:<br />
f≡x a<br />
1 x2<br />
ax3 a∨x1 ax2 ax3 b∨x1 ax2 ax3 c∨x1 ax2 bx3 b∨x1 ax2 cx3 a∨ ∨x a<br />
1 x2<br />
cx3 b∨x1 ax2 cx3 c∨x1 bx2 bx3 a∨x1 bx2 bx3 b∨x1 bx2 bx3 c∨ ∨x c<br />
1 x2<br />
ax3 b∨x1 cx2 bx3 b∨x1 cx2 cx3 b∨x1 cx2 cx3 c∨x1 ax2 a∨ ∨x a<br />
1 x2<br />
с∨x1 bx2 b∨x1 ax3 b∨x1 cx3 b∨x2 bx3 b .<br />
2) Применяем к дизъюнктивным членам полученной<br />
формулы всюду, где возможно, операцию<br />
элементарного дизъюнктивного поглощения<br />
23
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
24<br />
Ax σ ∨A≡A, (38)<br />
где xσ – некоторый предикат узнавания буквы. В<br />
результате получаем сокращенную ДНФ. В примере<br />
имеем:<br />
f≡x a<br />
1 x2<br />
a∨x1 ax3 b∨x1 ax2 с∨x2 bx3 b∨x1 bx2 b∨x1 cx3 b∨x1 cx2 cx3 c .<br />
3) Составляем импликантную таблицу. Импликантная<br />
таблица конечного предиката f представляет<br />
собой матрицу, строки которой обозначены<br />
всевозможными простыми импликантами предиката<br />
f, а столбцы – конституэнтами единицы<br />
того же предиката. Каждая ячейка таблицы соответствует<br />
паре предикатов, один из них представлен<br />
конституэнтой единицы, другой – некоторой<br />
элементарной конъюнкцией. Если элементарная<br />
конъюнкция, соответствующая некоторой строке<br />
таблицы, является импликантой для конституэнты<br />
единицы, соответствующей некоторому столбцу,<br />
то в ячейку, образуемую пересечением строки<br />
и столбца, заносим звездочку, в противном случае<br />
ячейку оставляем незаполненной. Импликантная<br />
таблица, получаемая в примере, представлена в<br />
табл. 7.<br />
Таблица 7<br />
Простая<br />
импликанта<br />
x 1 a x2 a * * *<br />
x a<br />
1 x2<br />
ax3 a<br />
x a<br />
1 x2<br />
ax3 c<br />
x a<br />
1 x2<br />
ax3 c<br />
x a<br />
1 x2<br />
bx3 b<br />
x a<br />
1 x2<br />
cx3 a<br />
x a<br />
1 x2<br />
cx3 b<br />
x a<br />
1 x2<br />
cx3 c<br />
x b<br />
1 x2<br />
bx3 a<br />
x b<br />
1 x2<br />
bx3 b<br />
x b<br />
1 x2<br />
bx3 c<br />
x c<br />
1 x2<br />
ax3 b<br />
x c<br />
1 x2<br />
bx3 b<br />
x c<br />
1 x2<br />
cx3 b<br />
x c<br />
1 x2<br />
cx3 c<br />
x 1 a x3 b * * *<br />
x 1 a x2 c * * *<br />
x 2 b x3 b * * *<br />
x 1 b x2 b * * *<br />
x 1 c x3 b * * *<br />
x 1 c x2 c x3 c *<br />
4) По импликантной таблице находим дизъюнктивное<br />
ядро предиката, для чего находим те<br />
столбцы таблицы, в которых содержится по одной<br />
звездочке. Соответствующие звездочкам простые<br />
импликанты образуют дизъюнктивное ядро предиката.<br />
В примере дизъюнктивное ядро предиката<br />
представляет собой следующее множество:<br />
{x a<br />
1 x2<br />
a , x1<br />
ax2 c , x1<br />
bx2 b , x1<br />
cx3 b , x1<br />
cx2 cx3 c }.<br />
5) По импликантной таблице отыскиваем систему<br />
всех конституэнт единицы предиката, которые<br />
не накрываются единицами его дизъюнктивного<br />
ядра. С этой целью отмечаем все столбцы, в<br />
которых содержатся звездочки, соответствующие<br />
простым импликантам, вошедшим в состав дизъюнктивного<br />
ядра. Столбцы, оставшиеся неотмеченными,<br />
соответствуют искомым конституэнтам<br />
единицы. В нашем примере разыскиваемая система<br />
имеет в своем составе единственную конституэнту<br />
единицу {x a<br />
1 x2<br />
bx3 b }.<br />
6) По импликантной таблице методом полного<br />
перебора отыскиваем все приведенные системы<br />
простых импликант, накрывающих своими единицами<br />
все конституэнты единицы системы, найденной<br />
на пятом шаге алгоритма. В примере имеем две<br />
такие системы: {x 1 a x3 b }, {x2 b x3 b }, каждая из которых<br />
состоит из одной конституэнты единицы.<br />
7) Объединяя дизъюнктивное ядро предиката<br />
с каждой из систем, полученных на шестом шаге<br />
алгоритма, формируем все приведенные системы<br />
простых импликант предиката. В нашем примере<br />
имеем две системы:<br />
{x 1 a x2 a , x1 a x2 c , x1 b x2 b , x1 c x3 b , x1 c x2 c x3 c , x1 a x3 b },<br />
{x 1 a x2 a , x1 a x2 c , x1 b x2 b , x1 c x3 b , x1 c x2 c x3 c , x2 b x3 b }.<br />
8) Строим все тупиковые ДНФ предиката. В<br />
примере имеем две такие формы:<br />
x 1 a x2 a ∨ x1 a x2 c ∨ x1 b x2 b ∨ x1 c x3 b ∨ x1 c x2 c x3 c ∨ x1 a x3 b ,<br />
x 1 a x2 a ∨ x1 a x2 c ∨ x1 b x2 b ∨ x1 c x3 b ∨ x1 c x2 c x3 c ∨ x1 b x3 b .<br />
9) Из числа тупиковых ДНФ выбираем минимальную<br />
ДНФ, имеющую наименьшее число<br />
узнаваний букв. В нашем примере обе тупиковые<br />
ДНФ имеют одинаковое число узнаваний букв —<br />
13, любая из них может быть принята в качестве<br />
минимальной ДНФ. Исходная СДНФ предиката f<br />
имеет 42 узнавания буквы. В результате минимизации<br />
число узнаваний букв в формуле сократилось<br />
более чем в три раза.<br />
в) обобщение методов Порецкого-блейка и нельсона.<br />
Ниже приводится описание алгоритма минимизации<br />
формул алгебры конечных предикатов,<br />
обобщающего алгоритм Порецкого-Блейка дизъюнктивной<br />
минимизации формул алгебры логики.<br />
Исходной информацией при минимизации для<br />
этого алгоритма служит произвольно выбранная<br />
ДНФ предиката, для которого отыскивается минимальная<br />
ДНФ. Рассмотрим пример. Пусть A={а, b,<br />
c}. Предикат f задан следующей ДНФ:<br />
a a a b a a b c a c c a<br />
1 2 1 2 1 3 1 2 3 1 2 3 .<br />
f ≡ x x ∨x x ∨x x ∨x x x ∨ x x x<br />
1) Применяем к дизъюнктивным членам исходной<br />
ДНФ всюду, где возможно, операцию группировки<br />
узнаваний букв:<br />
σ1 σ2 σr σ1 σ2 σr<br />
Ax ∨Ax ∨... ∨Ax ≡ Ax ( ∨x ∨... ∨ x ). (39)<br />
Указанная операция не используется в методе<br />
Порецкого-Блейка при минимизации формул алгебры<br />
логики, она становится необходимой только<br />
в алгебре конечных предикатов при дизъюнктивной<br />
минимизации в случае, когда k>2. В результате<br />
выполнения операции группировки узнавания<br />
букв получаем дизъюнкцию некоторых скобочных<br />
форм. В нашем примере:<br />
a a a b a a b c c a<br />
1 2 1 2 1 3 1 1 2 3<br />
f ≡( x ) x ∨( x ) x ∨( x ) x ∨( x ∨x ) x x ∨<br />
a a b<br />
1 2 2<br />
b c a c c a a a<br />
1 2 3 1 2 3 1 3<br />
∨x ( x ∨x)<br />
∨x ( x ) x ∨x ( x ) x ∨x ( x ) ∨<br />
b c a c c a<br />
1 2 3 1 2 3<br />
∨x x ( x ) ∨x<br />
x ( x ).
2) К скобочным формам всюду, где возможно,<br />
применяем операцию обобщенного дизъюнктивного<br />
склеивания, основанную на использовании тождества:<br />
σ1 σ2 σr<br />
Ax ( ∨x ∨... ∨x ) ∨<br />
σr+ 1 σr+ 2<br />
σs<br />
∨B( x ∨x ∨... ∨x ) ≡<br />
σ1 σ2<br />
≡ Ax ( ∨x∨... ∨x<br />
σr+ 1 σr+ 2<br />
σs<br />
∨B( x ∨x ∨... ∨x ) ∨ AB.<br />
Это тождество справедливо лишь в том случае,<br />
когда множество {σ1 , σ2 ,…, σs }совпадает с алфавитом<br />
А, причем в записи множества допускаются<br />
повторения букв. Результатом операции обобщенного<br />
дизъюнктивного склеивания является множество<br />
всех ненулевых конъюнкций вида АВ. В нашем<br />
примере получаем множество, состоящее из<br />
единственного произведения {x c<br />
2 x3<br />
a }. Заметим, что<br />
тождество (40), лежащее в основе операции обобщенного<br />
дизъюнктивного склеивания в алгебре<br />
конечных предикатов, выглядит сложнее, чем соответствующее<br />
тождество в алгебре логики. В частном<br />
случае при k=2 тождество (40) переходит в известное<br />
тождество алгебры логики: Ax∨B x ≡Ax∨B x<br />
∨AB, используемое в алгоритме Порецкого-Блейка.<br />
Докажем справедливость тождества (40):<br />
σr<br />
) ∨<br />
σ1 σ2 σr σr+ 1 σr + 2<br />
σs<br />
Ax ( ∨x ∨... ∨x ) ∨Bx ( ∨x ∨... ∨x ) ≡<br />
σ1 σ2 σr σ1 σ2 σr<br />
≡ Ax ( ∨x ∨... ∨x ) ∨AB( x ∨x ∨... ∨x ) ∨<br />
σr+ 1 σr+ 2 σs σr+ 1 σr+<br />
2<br />
∨Bx ( ∨x ∨... ∨x ) ∨AB( x ∨x ∨... ∨<br />
. ∨ ≡ ∨ ∨ ∨ ∨<br />
σs σ1 σ2 σs<br />
x ) ABx ( x ... x )<br />
σ1 σ2<br />
∨Ax ( ∨x∨... ∨<br />
σr σr+ 1 σr + 2 σs<br />
a1<br />
. ∨x ) ∨B( x ∨x ∨... ∨x ) ≡ ABx ( ∨<br />
a2 ak σ1 σ2 σr σr+<br />
1<br />
∨x ∨... ∨x ) ∨Ax ( ∨x ∨... ∨x ) ∨Bx ( ∨<br />
σr + 2 σs σ1 σ2 σr<br />
∨x ∨... ∨x ) ≡ AB ∨Ax ( ∨x ∨... ∨x ) ∨<br />
σr+ 1 σr+ 2 σs<br />
∨Bx ( ∨x ∨... ∨x<br />
) .<br />
(40)<br />
3) Исходную ДНФ пополняем дизъюнктивными<br />
членами из системы, полученной на втором<br />
шаге алгоритма. В нашем примере имеем:<br />
a a a b a a b c a c c a c a<br />
1 2 1 2 1 3 1 2 3 1 2 3 2 3 .<br />
f ≡ x x ∨x x ∨x x ∨x x x ∨x x x ∨x<br />
x<br />
4) Применяем всюду, где только возможно, операцию<br />
дизъюнктивного поглощения A∨AB ≡ A . В<br />
результате выполнения этого шага алгоритма получаем<br />
сокращенную ДНФ конечного предиката.<br />
В примере сокращенная ДНФ имеет вид:<br />
a a a b a a c a<br />
1 2 1 2 1 3 2 3 .<br />
f ≡ x x ∨x x ∨x x ∨x<br />
x<br />
5) От сокращенной ДНФ переходим к минимальной<br />
ДНФ по методу, описанному в пункте б). В примере<br />
получаем следующую минимальную ДНФ:<br />
a a a b c a<br />
1 2 1 2 2 3 .<br />
f ≡ x x ∨x x ∨ x x<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
Переходим к описанию алгоритма минимизации<br />
формул алгебры конечных предикатов, обобщающего<br />
метод Нельсона минимизации формул<br />
алгебры логики. Исходной информацией при<br />
минимизации для этого алгоритма служит произвольно<br />
выбранная КНФ предиката, для которой<br />
отыскивается минимальная ДНФ. Рассмотрим<br />
пример. Пусть А={a, b, c}, B={x 1 , х 2 , х 3 }. Предикат<br />
f задан следующей КНФ:<br />
a c a b a<br />
1 2 2 2 3 .<br />
f ≡( x ∨x )( x ∨x ∨x<br />
)<br />
1) Раскрываем скобки и уничтожаем все нулевые<br />
дизъюнктивные члены. В примере получаем:<br />
a a a b a a c a<br />
1 2 1 2 1 3 2 3 .<br />
f ≡ x x ∨x x ∨x x ∨x<br />
x<br />
2) Применяем операцию дизъюнктивного поглощения.<br />
В результате получаем сокращенную<br />
ДНФ. В нашем примере применение операции<br />
дизъюнктивного поглощения не приводит к упрощениям,<br />
поэтому формула, выведенная на первом<br />
шаге алгоритма, есть сокращенная ДНФ.<br />
3) По методу, описанному в пункте б), переходим<br />
от сокращенной ДНФ к минимальной ДНФ,<br />
которая в примере равна:<br />
a a a b c a<br />
1 2 1 2 2 3 .<br />
f ≡ x x ∨x x ∨ x x<br />
Отметим, что в рассмотренном примере исходная<br />
КНФ предиката f имеет пять узнаваний<br />
букв, это меньше, чем в минимальной ДНФ, где их<br />
шесть. Этим примером демонстрируется важность<br />
задачи отыскания минимальной КНФ в алгебре<br />
конечных предикатов. Решение указанной задачи<br />
излагается в следующем пункте.<br />
4. Конъюнктивная минимизация формул алгебры<br />
предикатов<br />
г) отыскание минимальной конъюнктивной<br />
нормальной формы. В алгебре логики имеет место<br />
принцип двойственности, в силу которого методы<br />
отыскания минимальной КНФ оказываются совершенно<br />
аналогичными методам отыскания минимальной<br />
ДНФ. В алгебре конечных предикатов<br />
при k>2 положение иное. Здесь мы лишены принципа<br />
двойственности, он теперь утрачивает силу,<br />
операции конъюнкции и дизъюнкции теперь уже<br />
не равноправны. Поэтому методы конъюнктивной<br />
минимизации должны рассматривается специально,<br />
здесь нельзя обойтись ссылкой на аналогию с<br />
методами дизъюнктивной минимизации.<br />
Предикат g назовем имплицентой предиката f,<br />
если на любом наборе значений аргументов, для<br />
которого g=0, имеем также f=0. Будем говорить,<br />
что имплицента g накрывает своими нулями нули<br />
предиката f. Элементарную дизъюнкцию g назовем<br />
собственной частью элементарной дизъюнкции f,<br />
если g может быть получена из f выбрасыванием<br />
некоторых узнаваний букв. Например, элемен-<br />
a b c<br />
тарная дизъюнкция x1 ∨x1 ∨ x3<br />
есть собственная<br />
a b c c<br />
часть элементарной дизъюнкции x ∨x ∨x ∨ x .<br />
1 1 2 3<br />
25
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
Назовем простой имплицентой предиката f любую<br />
элементарную дизъюнкцию, обладающую следующими<br />
свойствами: она является имплицентой предиката<br />
f и никакая ее собственнная часть не является<br />
имплицентой предиката f.<br />
Конъюнкция любого числа имплицент конечного<br />
предиката является имплицентой этого предиката.<br />
Систему S имплицент конечного предиката<br />
f назовем полной, если любой нуль из таблицы<br />
значений предиката f накрывается нулями хотя бы<br />
одной имплиценты системы S. Тому или иному<br />
конечному предикату может соответствовать, вообще<br />
говоря, несколько различных полных систем<br />
имплицент. Конъюнкция всех имплицент полной<br />
системы имплицент некоторого конечного предиката<br />
выражает собой этот предикат. Система всех<br />
простых имплицент любого конечного предиката<br />
есть его полная система. Конъюнкция всех простых<br />
имплицент конечного предиката выражает<br />
собой этот предикат, назовем ее сокращенной КНФ<br />
данного конечного предиката.<br />
Конъюнктивным ядром конечного предиката назовем<br />
множество всех таких его простых имплицент,<br />
исключение каждой из которых из системы<br />
всех простых имплицент делает систему неполной.<br />
Элементы конъюнктивного ядра входят в состав<br />
любой полной системы простых имплицент. Систему<br />
простых имплицент конечного предиката<br />
назовем приведенной, если она полна и никакое ее<br />
собственное подмножество не является полной<br />
системой. Конъюнкцию всех простых имплицент<br />
приведенной системы назовем тупиковой конъюнктивной<br />
нормальной формой предиката. Выбирая из<br />
числа тупиковых КНФ одну с наименьшим числом<br />
узнаваний, получаем минимальную КНФ.<br />
Рассмотрим метод конъюнктивной минимизации<br />
формул алгебры конечных предикатов, обобщающий<br />
метод Квайна-Мак-Класки. Исходной<br />
информацией при минимизации служит СКНФ<br />
предиката, для которого отыскивается минимальная<br />
КНФ. Рассмотрим пример. Пусть А={a, b, c},<br />
B={x 1 , х 2 , х 3 }. Предикат задан следующей СКНФ:<br />
26<br />
a a a a b a<br />
1 2 3 1 2 3<br />
f ≡( x ∨x ∨x )( x ∨x ∨x) ∧<br />
b a a b b a c c a<br />
1 2 3 1 2 3 1 x2 x3<br />
∧( x ∨x ∨x)( x ∨x ∨ x )( x<br />
c c b c c c<br />
1 2 3 1 2 3<br />
∧( x ∨x ∨x )( x ∨x ∨ x ).<br />
∨ ∨ ) ∧<br />
СКНФ представлена в сокращенной записи с<br />
использованием знаков отрицания. Последующей<br />
обработке подвергается сама СКНФ, а не ее сокращенная<br />
запись.<br />
Ниже описывается алгоритм минимизации:<br />
1) Всюду, где это возможно, применяем операцию<br />
неполного конъюнктивного склеивания, основанного<br />
на тождестве<br />
a a a a<br />
i j i j<br />
( A∨x )( A∨x ) ≡( A∨x )( A∨ x ) A , (41)<br />
которое справедливо при условии i ≠ j . Операция<br />
неполного конъюнктивного склеивания состоит<br />
в дописывании в исходной КНФ в виде дополнительных<br />
конъюнктивных членов всевозможных<br />
элементарных дизъюнкций А. Последние можно<br />
получить переходом от левой части тождества (40)<br />
к правой. Операцию неполного конъюнктивного<br />
склеивания сначала применяем к конституэнтам<br />
нуля исходной СКНФ, затем — к элементарным<br />
дизъюнкциям, состоящим из n(k-1)-1 узнаваний<br />
букв, n(k-1)-2 узнаваний букв и т.д., наконец, к<br />
элементарным дизъюнкциям, состоящим из одного<br />
узнавания буквы. В нашем примере имеем<br />
b c b c b c b c a c b<br />
1 1 2 2 3 3 1 1 2 2 3<br />
f ≡( x ∨x ∨x ∨x ∨x ∨x )( x ∨x ∨x ∨x ∨x ∨<br />
c a c b c b c a c a c b<br />
3 1 1 2 2 3 3 1 1 2 2 3<br />
∨x )( x ∨x ∨x ∨x ∨x ∨x )( x ∨x ∨x ∨x ∨x ∨<br />
c a b a b b c a b a b a<br />
3 1 1 2 2 3 3 1 1 2 2 3<br />
∨x )( x ∨x ∨x ∨x ∨x ∨x )( x ∨x ∨x ∨x ∨x ∨<br />
c a b a b a b b c c b<br />
3 1 1 2 2 3 3 1 1 2 3<br />
∨x )( x ∨x ∨x ∨x ∨x ∨x )( x ∨x ∨x ∨x ∨<br />
c c a c b c a c c b c<br />
3 1 2 2 3 3 1 1 2 3 3<br />
∨x )( x ∨x ∨x ∨x ∨ x )( x ∨x ∨x ∨x ∨x) ∧<br />
a b a b c a b a b a<br />
1 1 2 2 3 1 1 2 2 3<br />
∧( x ∨x ∨x ∨x ∨x )( x ∨x ∨x ∨x ∨x ) ∧<br />
c c b c a b a b<br />
1 2 3 3 1 1 2 2 .<br />
∧( x ∨x ∨x ∨x )( x ∨x ∨x ∨ x )<br />
2) Применяем к конъюнктивным членам полученной<br />
формулы операцию элементарного конъюнктивного<br />
поглощения:<br />
σ<br />
( A∨x ) A ≡ A . (42)<br />
В результате получаем сокращенную КНФ. В<br />
нашем примере имеем:<br />
a b a b c c b c<br />
1 1 2 2 1 2 3 3<br />
f ≡( x ∨x ∨x ∨x)( x ∨x ∨x ∨ x ).<br />
В примере сокращенная КНФ совпадает с минимальной<br />
КНФ. В более сложных случаях процесс<br />
минимизации продолжатся.<br />
3) Составляем имплицентную таблицу. Имплицентная<br />
таблица конечного предиката f представляет<br />
собой матрицу, строки которой обозначены<br />
всевозможными простыми имплицентами предиката<br />
f, а столбцы — конституэнтами нуля того же<br />
предиката. Каждая ячейка таблицы соответствует<br />
паре предикатов, один из которых представлен<br />
конституэнтой нуля, другой — некоторой элементарной<br />
дизъюнкцией. Если элементарная дизъюнкция,<br />
соответствующая некоторой строке таблицы,<br />
является имплицентой для конституэнты<br />
нуля, соответствующей некоторому столбцу, то в<br />
ячейку, образуемую пересечением строки и столбца,<br />
заносим звездочку, в противном случае ячейку<br />
оставляем незаполненной.<br />
4) По имплицентной таблице находим конъюктивное<br />
ядро предиката. Для этого находим те<br />
столбцы таблицы, в которых содержится только<br />
по одной звездочке. Соответствующие звездочкам<br />
простые имплиценты образуют конъюнктивное<br />
ядро предиката.
5) По имплицентной таблице отыскиваем систему<br />
всех простых конституэнт нуля предиката, которые<br />
не накрываются нулями его конъюнктивного<br />
ядра. С этой целью отмечаем все столбцы, в которых<br />
содержатся звездочки, соответствующие простым<br />
имплицентам, вошедшие в состав конъюнктивного<br />
ядра. Столбцы, оставшиеся неотмеченными, соответствуют<br />
искомым конституэнтам единицы.<br />
6) По имплицентной таблице методом полного<br />
перебора отыскиваем все приведенные системы<br />
простых имплицент, накрывающих своими нулями<br />
все конституэнты нуля системы, найденной на<br />
пятом шаге алгоритма.<br />
7) Объединяя конъюнктивное ядро предиката<br />
с каждой из систем, полученных на шестом шаге<br />
алгоритма, формируем все приведенные системы<br />
простых имплицент предиката.<br />
8) Строим все тупиковые КНФ предиката.<br />
Приведем описание алгоритма минимизации<br />
формул алгебры конечных предикатов, обобщающего<br />
алгоритм Порецкого-Блейка конъюнктивной<br />
минимизации формул алгебры логики. Исходной<br />
информацией при минимизации для этого<br />
алгоритма служит произвольно выбранная КНФ<br />
предиката, для которой отыскивается минимальная<br />
КНФ. Рассмотрим пример. Пусть А={a, b, c},<br />
B={x 1 , х 2 }. Предикат f задан следующей КНФ:<br />
b c a b a b a b<br />
1 1 2 a 1 1 2 2<br />
f ≡( x ∨x ∨x ∨x )( x ∨x ∨x ∨ x )<br />
a c c a b<br />
b c<br />
2 2<br />
( x1 ∨x1 ∨x2)( x1 ∨x1∨x ∨ x ).<br />
1) К конъюнктивным членам исходной КНФ<br />
всюду, где возможно, применяем операцию обобщенного<br />
конъюнктивного склеивания, основанную<br />
на использовании тождества:<br />
a<br />
i<br />
j<br />
( A∨x )( B∨x ) ≡<br />
(43)<br />
a<br />
a<br />
i<br />
j<br />
≡( A∨x )( B∨x )( A∨B), справедливого в случае, когда i≠j. Результатом операции<br />
обобщенного конъюнктивного склеивания<br />
является множество всех не равных единице элементарных<br />
дизъюнкций вида A∨B. В нашем примере<br />
получаем следующее множество элементарных<br />
дизъюнкций:<br />
b c a b a b a b b a b<br />
1 1 2 2 1 1 2 2 1 2 2<br />
{ x ∨x ∨x ∨x , x ∨x ∨x ∨x , x ∨x ∨x,<br />
a b b<br />
1 1 2<br />
x ∨x ∨x ∨ x2,<br />
x1 ∨x1 ∨x2, x1 ∨x1 ∨x2 ∨ x2,<br />
a b c<br />
1 ∨ 2 ∨ 2<br />
a<br />
c a b b a c b c<br />
x x x<br />
Заметим, что тождество (43), лежащее в основе<br />
операции обобщенного конъюнктивного склеивания,<br />
в алгебре конечных предикатов выглядит<br />
несколько иначе, чем соответствующее тождество<br />
в алгебре логики. В частном случае при k=2 тождество<br />
(41) переходит в известное тождество алгебры<br />
логики<br />
(A∨x)(B∨ x )≡(A∨x)(B∨ x )(A∨B),<br />
используемое в алгоритме Порецкого-Блейка. Докажем<br />
справедливость тождества (41):<br />
}.<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
a a a a a<br />
i j i i j<br />
( A∨x )( B∨x ) ≡( A∨x )( A∨x ∨B)( B∨x) ∧<br />
a a<br />
a a a<br />
j i<br />
j i j<br />
∧( B∨x ∨A) ≡( A∨x)( B∨x )( A∨B∨x x ) ≡<br />
a<br />
i<br />
j<br />
≡( A∨x )( B∨x )( A∨B). 2) Исходную КНФ пополняем конъюнктивными<br />
членами из системы, полученной на первом<br />
шаге алгоритма. В нашем примере имеем<br />
b c a b a b a b<br />
1 1 2 2 1 1 2 2<br />
f ≡( x ∨x ∨x ∨x )( x ∨x ∨x ∨x) ∧<br />
a c c a b b c b a b<br />
1 1 2 1 1 x2 x2 x1 x2 x2<br />
∧( x ∨x ∨x )( x ∨x<br />
a b b a c b c<br />
1 2 2 1 1 2 2<br />
∧( x ∨x ∨x )( x ∨x ∨x ∨x<br />
)( x1<br />
∨x2 ∨ x2).<br />
Простая<br />
имплицента<br />
x 1 b ∨x1 c ∨x2 a ∨x2 b<br />
a<br />
∨ ∨ )( ∨ ∨ ) ∧<br />
a b c<br />
Конституэнта нуля<br />
x 1 a ∨x1 c ∨x2 b ∨x2 c<br />
x 1 a ∨x1 c ∨x2 a ∨x2 c<br />
a c c<br />
x ∨x ∨ x<br />
* *<br />
1 1 2<br />
x 1 a ∨x1 b ∨x2 b ∨x2 c<br />
Таблица 8<br />
x 1 a ∨x1 b ∨x2 a ∨x2 b<br />
b a b<br />
x ∨x ∨ x * *<br />
1 2 2<br />
a b b<br />
x ∨x ∨ x<br />
* *<br />
1 1 2<br />
a b c<br />
x ∨x ∨ x<br />
* *<br />
1 2 2<br />
3) Применяем всюду, где возможно, операцию<br />
конъюнктивного поглощения A(A∨B)≡A. В результате<br />
выполнения этого шага алгоритма получаем сокращенную<br />
КНФ конечного предиката. В нашем<br />
примере имеем следующую сокращенную КНФ:<br />
a c c b a b<br />
1 1 2 1 2 2<br />
f ≡( x ∨x ∨x )( x ∨x ∨x) ∧<br />
a b b a b c<br />
1 1 2 1 2 2<br />
∧( x ∨x ∨x )( x ∨x ∨ x ).<br />
4) Выполняем шаги 3-9 предыдушего алгоритма.<br />
В нашем примере имплицентная таблица имеет<br />
вид, представленный табл. 8, по которой находим<br />
конъюнктивное ядро предиката:<br />
a c c b a b<br />
1 1 2 1 2 2<br />
{ x ∨x ∨x , x ∨x ∨ x } .<br />
Имеются две тупиковые КНФ:<br />
0 A A b a b a b b<br />
1 1 2 1 2 2 1 1 2<br />
( x ∨x ∨x )( x ∨x ∨x )( x ∨x ∨ x ) ,<br />
a c c<br />
1 1 2<br />
b a b a b c<br />
1 2 2 1 2 2<br />
( x ∨x ∨ x ) ( x ∨x ∨x )( x ∨x ∨ x ) ,<br />
каждая из которых может быть принята в качестве<br />
минимальной КНФ предиката f.<br />
Переходим к описанию алгоритма минимизации<br />
формул алгебры конечных предикатов, обобщающего<br />
алгоритм Нельсона конъюнктивной минимизации<br />
формул алгебры логики. Исходной<br />
информацией при минимизации служит произвольно<br />
выбранная ДНФ предиката, для которого<br />
отыскивается минимальная КНФ. Рассмотрим<br />
пример. Пусть А={a, b, c}, B={x 1 , х 2 , х 3 }. Предикат<br />
задан следующей ДНФ:<br />
27
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
28<br />
a a a b c a<br />
1 2 1 2 2 3 .<br />
f ≡ x x ∨x x ∨ x x<br />
1) Пользуясь вторым законом дистрибутивности,<br />
переходим к некоторой КНФ предиката f.<br />
В примере имеем:<br />
a c a a a b c<br />
1 2 1 3 1 2 2<br />
f ≡( x ∨x )( x ∨x )( x ∨x ∨x ) ∧<br />
a b a a a c<br />
1 2 3 1 2 x2<br />
∧( x ∨x ∨x ) ∧( x ∨x∨ a a a a b a<br />
1 2 3 2 2 3<br />
) ∧<br />
∧( x ∨x ∨x )( x ∨x ∨ x ).<br />
2) Применяем операцию конъюнктивного поглощения.<br />
В результате получаем сокращенную<br />
КНФ. В нашем примере сокращенная КНФ имеет<br />
вид:<br />
a c a a a b c<br />
f ≡( x ∨x )( x ∨x )( x ∨x ∨ x )<br />
1 2 1 3 2 2 3 .<br />
3) Выполняем шаги 3-9 алгоритма, описанного<br />
первым в пункте г). В примере получаем следующую<br />
минимальную КНФ:<br />
a c a b a<br />
1 2 2 2 3 .<br />
f ≡( x ∨x )( x ∨x ∨x<br />
)<br />
Заметим, что в области минимизации формул<br />
алгебры конечных предикатов много важных задач<br />
еще ждет своего решения. К их числу относятся:<br />
дальнейшая разработка методов канонической<br />
минимизации; разработка оценок сложности минимальных<br />
форм; разработка методов минимизации<br />
скобочных форм; разработка методов факторизации<br />
(разыскания форм с наименьшим числом<br />
вхождения знаков конъюнкции и дизъюнкции).<br />
Выводы<br />
У читателя, ознакомившегося с [1] и настоящей<br />
статьей, может возникнуть вопрос: почему в<br />
работе, посвященной теории <strong>интеллект</strong>а, так много<br />
внимания уделяется разработке формального<br />
<strong>язык</strong>а в виде алгебры конечных предикатов? Не<br />
лучше ли было бы, довольствуясь существующим<br />
математическим аппаратом, сразу же взяться за<br />
моделирование какой-нибудь сложной <strong>интеллект</strong>уальной<br />
деятельности, например, игры в шахматы<br />
или доказательства теорем. К своему стыду, авторы<br />
когда-то именно так и поступили. Объектом математического<br />
описания был выбран русский <strong>язык</strong>.<br />
В качестве формальных <strong>язык</strong>ов, на которых велось<br />
описание этого объекта, были испробованы <strong>язык</strong>и<br />
программирования [7], аппарат теории графов<br />
[8], <strong>язык</strong> теории алгоритмов [9], логические исчисления<br />
[10]. Много лет ушло в малоэффективных<br />
попытках, пока наконец стало ясно, что все эти<br />
средства настолько плохо приспособлены для целей<br />
формального описания человеческого <strong>язык</strong>а,<br />
что создают труднопреодолимые препятствия при<br />
его моделировании. Поскольку естественный <strong>язык</strong><br />
лежит в основе <strong>интеллект</strong>уальной деятельности человека,<br />
то можно не сомневаться, что и моделирование<br />
вышележащих слоев <strong>интеллект</strong>а будет столь<br />
же неэффективным, если ограничится существующими<br />
математическими средствами.<br />
Трудности, с которыми пришлось столкнуться<br />
при моделировании естественного <strong>язык</strong>а, в конце<br />
концов были проанализированы. Из них родились<br />
требования, предъявляемые к формальному <strong>язык</strong>у,<br />
способному эффективно описывать человеческий<br />
<strong>язык</strong>. В свою очередь, сформулированные требования,<br />
можно сказать, принудительно привели к<br />
алгебре конечных предикатов. Проводившееся затем<br />
математическое описание явлений русского<br />
<strong>язык</strong>а средствами алгебры конечных предикатов<br />
продемонстрировало преимущества этой алгебры,<br />
причем настолько большие, что в дальнейшем ни<br />
разу не возникала необходимость обратиться к помощи<br />
какого-нибудь другого формального <strong>язык</strong>а.<br />
Ниже излагаются доводы, которые убедили авторов<br />
в том, что алгебра конечных предикатов как раз<br />
и есть тот формальный <strong>язык</strong>, на котором должно<br />
вестись описание проявлений человеческого <strong>язык</strong>а<br />
(а может быть, и многих других функций <strong>интеллект</strong>а),<br />
что никакие другие формальные средства<br />
не могут составить ему конкуренцию и что именно<br />
этот <strong>язык</strong> призван стать фундаментом, на котором<br />
должно строиться здание теории <strong>интеллект</strong>а.<br />
Человеческий <strong>язык</strong> как явление дискретное,<br />
естественно, должен описываться средствами дискретной<br />
математики. Между тем выбор средств<br />
указанного типа весьма ограничен. Это — <strong>язык</strong>и<br />
программирования для ЭВМ, логические исчисления,<br />
<strong>язык</strong>и теории алгоритмов, аппарат теории<br />
графов. При попытке использования <strong>язык</strong>ов программирования<br />
или <strong>язык</strong>ов теории алгоритмов<br />
приходится столкнуться со следующими труднопреодолимыми<br />
препятствиями. Эти <strong>язык</strong>и, как известно,<br />
предназначены для описания алгоритмов<br />
[11], то есть процедур с однозначным исходом.<br />
Между тем естественный <strong>язык</strong> многозначен, что<br />
проявляется, например, в виде омографичности<br />
слов, то есть неоднозначности их смысла. Языки<br />
программирования и теории алгоритмов – это такие<br />
<strong>язык</strong>и, которые могут описывать только однозначные<br />
функции. Естественный же <strong>язык</strong> требует<br />
формальных средств для описания многозначных<br />
функций, то есть соответствий произвольного<br />
вида, иначе говоря, – отношений.<br />
Для описания человеческого <strong>язык</strong>а лучше всего<br />
подошел бы аппарат уравнений, подобный аппарату,<br />
используемому в математическом анализе,<br />
отличающийся от последнего тем, что он предназначен<br />
для формализации не непрерывных, а дискретных<br />
процессов. Такой <strong>язык</strong> дают логические<br />
исчисления, а именно: исчисления высказываний<br />
и исчисления предикатов. Однако, чтобы иметь<br />
возможность эффективно решать указанные уравнения,<br />
необходимо довести интересующие нас исчисления<br />
до уровня алгебраической системы. Сделано<br />
же это только в исчислении высказываний.<br />
В результате мы имеем алгебру логики и аппарат
булевых уравнений [12]. Однако аппарат булевых<br />
уравнений для формального описания естественного<br />
<strong>язык</strong>а наталкивается на серьезное неудобство,<br />
заключающееся в том, что в алгебре логики<br />
используются лишь двоичные знаки, в то время<br />
как в естественном <strong>язык</strong>е фигурируют буквенные,<br />
то есть многозначные символы.<br />
Этого недостатка, казалось бы, можно избежать,<br />
обратившись к аппарату многозначной логики [13].<br />
Однако при ближайшем рассмотрении обнаруживается,<br />
что многозначная логика развита только в сторону<br />
описания однозначных функций, а не отношений.<br />
Учение об уравнениях в многозначной логике,<br />
насколько нам известно, совершенно не развито.<br />
Развитие же в этом направлении многозначной логики<br />
принудительно приводит к алгебре конечных<br />
предикатов. Действительно, чтобы иметь возможность<br />
записывать самые общие уравнения многозначной<br />
логики, в правой их части нет необходимости<br />
ставить произвольные формулы, достаточно<br />
писать константы. Необязательно использовать все<br />
константы, достаточно взять всего две знака: 0 и 1.<br />
Но как только мы так поступим, немедленно приходим<br />
к понятию конечного предиката, а следовательно,<br />
и к алгебре конечных предикатов.<br />
Использование исчисления предикатов [3] для<br />
целей математического описания человеческого<br />
<strong>язык</strong>а также наталкивается на определенную<br />
трудность: исчисление очень слабо развито применительно<br />
к нуждам описания конечных объектов.<br />
Исчисление предикатов не располагает даже<br />
средствами для формульной записи любых индивидуальных<br />
конечных отношений. Вместе с тем,<br />
человеческий <strong>язык</strong> – явление сугубо конечное и он<br />
требует для своей формализации аппарата конечной<br />
математики. Пытаясь алгебраизировать конечный<br />
фрагмент исчисления предикатов, мы не сможем<br />
прийти ни к чему иному, как только к алгебре<br />
конечных предикатов. Наконец, обратившись к<br />
аппарату теории графов [14], мы обнаружим, что,<br />
хотя он и используется для описания конечных отношений,<br />
однако совершенно не содержит в себе<br />
выразительных средств для записи этих отношений<br />
в виде уравнений некоторой алгебры. Если же мы<br />
захотим перевести информацию, содержащуюся в<br />
графах, на <strong>язык</strong> таблиц, то увидим, что с помощью<br />
графов выражаются именно конечные предикаты.<br />
Таким образом, какой бы путь мы ни избрали<br />
при разработке приемлемых формальных средств<br />
для математического описания человеческого <strong>язык</strong>а,<br />
мы неизбежно приходим к алгебре конечных<br />
предикатов. Вместе с тем в данной статье установлено,<br />
что алгебра конечных предикатов полна, то<br />
есть на ее <strong>язык</strong>е могут быть описаны любые конечные<br />
отношения. Поэтому любой другой математический<br />
аппарат, предназначенный для описания<br />
произвольных конечных отношений, в логическом<br />
НОрМАЛЬНЫЕ ФОрМЫ ФОрМуЛ АЛГЕБрЫ КОНЕЧНЫх ПрЕДИКАТОВ<br />
смысле обязательно будет равносилен алгебре конечных<br />
предикатов.<br />
Список литературы: 1. Бондаренко, М.Ф. Об алгебре конечных<br />
предикатов [Текст] / М.Ф. Бондаренко, Ю.П. Шабанов-<br />
Кушнаренко, С.Ю. Шабанов-Кушнаренко // Бионика<br />
<strong>интеллект</strong>а: науч.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3. – С. 3-13.<br />
2. Мальцев, А.И. Алгебраические системы [Текст] / А.И.<br />
Мальцев. – М.: Наука, 1970. – 310 с. 3. Ершов, Ю.Л. Математическая<br />
логика / Ю.Л. Ершов, Е.А. Палютин. – М.:<br />
Наука, 1979. – 372 с. 4. Глушков, В.М. Введение в кибернетику<br />
[Текст] / В.М. Глушков. – К.: Изд. АН УССР, 1964.<br />
– С. 67-75. 5. Глушков, В.М. Синтез цифровых автоматов<br />
[Текст] / В.М. Глушков. – М.: Физматгиз, 1962. – 316 с.<br />
6. Шабанов-Кушнаренко, Ю.П. Об одной математической<br />
модели морфологической классификации множества<br />
имен существительных русского <strong>язык</strong>а [Текст] / Ю.П.<br />
Шабанов-Кушнаренко, Л.И. Якименко. – Проблемы бионики.<br />
1971. – Вып. 6. – С. 104-107. 7. Шабанов-Кушнаренко,<br />
Ю.П. Математическая модель определения классов одинаковых<br />
слов [Текст] / Ю.П. Шабанов-Кушнаренко,<br />
Л.И. Якименко // Проблемы бионики. – 1971. – Вып. 7. –<br />
С. 103-105. 8. Шабанов-Кушнаренко, Ю.П. К вопросу об автоматическом<br />
морфологическом анализе причастий русского<br />
<strong>язык</strong>а [Текст] / Ю.П. Шабанов-Кушнаренко, Е.А. Соловьева<br />
// Проблемы бионики. – 1974. – Вып. 12. – С. 46-50.<br />
9. Осыка, А.Ф. Модель определения исходной формы<br />
числительных русского <strong>язык</strong>а [Текст] / А.Ф. Осыка, Ю.П.<br />
Шабанов-Кушнаренко // Проблемы бионики. – 1976. –<br />
Вып. 16. – С. 78-84. 10. Осыка, А.Ф. К вопросу о моделировании<br />
грамматической обработки имен числительных<br />
[Текст] / А.Ф. Осыка. – Пробл. бионики, 1979, Вып. 22,<br />
С. 129-137. 11. Мальцев, А.И. Алгоритмы и рекурсивные<br />
функции [Текст] / А.И. Мальцев. – М.: Наука, 1965. –<br />
С. 9-11. 12. Закревский, А.Д. Логические уравнения [Текст]<br />
/ А.Д. Закревский. – Минск: Наука и техника, 1975. –<br />
С. 92. 13. Дискретная математика и математические вопросы<br />
кибернетики [Текст] / Под ред. С.В. Яблонского и О.Б.<br />
Лупанова. – М.: Наука, 1974. – Т. 1. – С. 35-66. 14. Белов,<br />
В.В. Теория графов [Текст] / В.В. Белов, Е.Н. Воробьев,<br />
В.Е. Шаталов. – М.: Высш. школа, 1976. – 389 с.<br />
Поступила в редколлегию 15.06.<strong>2011</strong><br />
УДК 519.7<br />
Нормальні форми формул алгебри скінченних предикатів<br />
/ М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко,<br />
С.Ю. Шабанов-Кушнаренко // Біоніка інтелекту: наук.техн.<br />
журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 14-29.<br />
Розглянуто побудову нормальних форм формул алгебри<br />
скінченних предикатів, методи кон’юнктивної<br />
мінімізації. Сформульовано теорему про конюнктивний<br />
розклад предикатів.<br />
Табл. 8. Бібліогр.: 14 найм.<br />
UDC 519.7<br />
PDNF in final predicates algebra / M.f. Bondarenko,<br />
S.Yu. Shabanov-Kushnarenko, Yu.P. Shabanov-Kushnarenko<br />
// Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>).<br />
–P. 14-29.<br />
The construction of the final predicates algebra formulas<br />
normalized forms and the of conjunctive minimization methods<br />
is considered. The theorem about the predicates conjunctive<br />
decomposition is formulated.<br />
Ref.: 14 items.<br />
29
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 30–45 хНурэ<br />
УДК 519.7<br />
30<br />
Введение<br />
Предикаты – это основной математический<br />
инструмент теории <strong>интеллект</strong>а, они используются<br />
для формального описания объектов бионики<br />
<strong>интеллект</strong>а. Алгебра предикатов – это логический<br />
аппарат первой ступени, ее можно рассматривать<br />
как аналог школьной алгебры, на <strong>язык</strong>е которой<br />
записываются числовые функции. Аппаратом второй<br />
ступени в логике является алгебра предикатных<br />
операций, которую можно рассматривать как<br />
логический аналог изучаемого в вузах математического<br />
анализа. Алгебры предикатов и предикатных<br />
операций рекомендуются в качестве <strong>язык</strong>а формального<br />
описания для разработчиков, создающих<br />
средства искусственного <strong>интеллект</strong>а. Язык алгебры<br />
предикатов представляет собой универсальное<br />
средство формального описания любых объектов,<br />
наблюдаемых в мире, на нем можно выразить любое<br />
отношение. Язык алгебры предикатных операций<br />
тоже универсален, но он используется уже<br />
в ином качестве: на нем можно выразить любые<br />
действия над отношениями. Когда возникает необходимость<br />
формально описать какой-нибудь процесс<br />
или объект, то прибегают к услугам алгебры<br />
предикатов. Когда же требуется реально воспроизвести<br />
уже описанный ранее процесс или создать в<br />
натуре спроектированный объект (то есть нужно<br />
перейти от слов к делу), то используется аппарат алгебры<br />
предикатных операций.<br />
Отношения выражают внутреннее строение объектов,<br />
свойства объектов и связи между ними. Они<br />
представляют собой универсальное средство формального<br />
представления любых объектов. За две с<br />
половиной тысячи лет существования науки ей не<br />
удалось обнаружить в мире ни одного объекта, о<br />
котором можно было бы с уверенностью сказать,<br />
что он, в принципе, не поддается формальному<br />
представлению с помощью отношений. Никакие<br />
другие известные средства формального представления<br />
объектов (например, школьная алгебра и математический<br />
анализ) свойством универсальности<br />
не обладают. Естественный <strong>язык</strong>, представляющий<br />
собой универсальное средство духовного общения<br />
людей, можно рассматривать как инструмент для<br />
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
ХНУРЭ, г. Харьков, Украина<br />
УРАВНЕНИЯ ТЕОРИИ ИНТЕЛЛЕКТА<br />
Разрабатывается математический аппарат для формализации и моделирования систем искусственного<br />
<strong>интеллект</strong>а. Предложены способы записи уравнений теории <strong>интеллект</strong>а, а также методы их аналитического<br />
решения. Предложено несколько различных методов аналитического представления конечных<br />
алфавитных операторов с помощью формул универсальной алгебры.<br />
АЛГЕБРА КОНЕЧНЫХ ПРЕДИКАТОВ, ПРЕДИКАТ, ИНТЕЛЛЕКТ, УРАВНЕНИЕ, УНИВЕР-<br />
САЛЬНАЯ АЛГЕБРА, АЛФАВИТНЫЙ ОПЕРАТОР<br />
выражения отношений. Обращаясь с речью к другим<br />
людям, мы передаем им вполне определенный<br />
смысл произносимого предложения, который есть<br />
не что иное, как некоторое отношение. Обмен мыслями<br />
между людьми осуществляется за счет передачи<br />
и приема отношений. Каждая мысль представляет<br />
собой какое-то отношение. Мышление же есть<br />
процесс преобразования отношений, получения<br />
новых отношений из уже имеющихся. Информация,<br />
поступающая к нам из внешнего мира, имеет вид<br />
отношений, характеризующих структуру, свойства<br />
и связи окружающих нас предметов и процессов.<br />
Результатом действий человека во внешнем мире<br />
является приведение структуры предметов и процессов<br />
в соответствие тем отношениям, которые<br />
были сформированы в уме человека в результате<br />
его мыслительной деятельности.<br />
1. Канонические уравнения<br />
Любая интересующая нас информации о деятельности<br />
и суждениях <strong>интеллект</strong>а, в принципе,<br />
может быть записана в виде уравнений алгебры конечных<br />
предикатов. В данной статье будут рассмотрены<br />
способы записи таких уравнений, а также<br />
методы их аналитического решения. Для большего<br />
удобства записи уравнений алгебры конечных предикатов<br />
нам понадобятся, кроме уже введенных<br />
четырех операций – дизъюнкции, конъюнкции,<br />
отрицания и импликации, еще две двуместные<br />
операции – равнозначность ~ и неравнозначность ⊕<br />
предикатов. Эти операции формально определим<br />
следующими равенствами:<br />
A∼B ≡ AB ∨AB<br />
(1)<br />
def<br />
A⊕B ≡ AB ∨AB<br />
(2)<br />
def<br />
Здесь буквами А и В обозначены произвольно<br />
выбранные формулы алгебры конечных предикатов.<br />
Условимся в случае отсутствия в формуле<br />
скобок, регулирующих порядок выполнения операций,<br />
непосредственно после выполнения операций<br />
отрицания, конъюнкции, дизъюнкции импликации<br />
выполнять операции равнозначности и<br />
лишь затем – операции неравнозначности.
Свойства введенных операций аналогичны<br />
свойствам одноименных операций, рассматриваемых<br />
в алгебре логики. Все они могут быть выведены<br />
из только что принятых определений. Перечислим<br />
наиболее важные тождества алгебры конечных<br />
предикатов, в которых фигурируют знаки ∼, ⊕,<br />
а именно – рефлексивность равнозначности:<br />
A∼A≡1; (3)<br />
антирефлексивность неравнозначности:<br />
A⊕A≡0; (4)<br />
коммутативность равнозначности и неравнозначности:<br />
A∼B≡B∼A; (5)<br />
A⊕B≡B⊕A; (6)<br />
ассоциативность равнозначности и неравнозначности:<br />
(A∼B)∼C≡A∼(B∼C); (7)<br />
(A⊕B)⊕C≡A⊕(B⊕C); (8)<br />
дистрибутивность неравнозначности:<br />
(A⊕B)C≡AC⊕BC; (9)<br />
транзитивность равнозначности:<br />
(A∼B)(B∼C)⊃(A∼C)≡1; (10)<br />
свойства логических констант:<br />
Уравнение вида<br />
A∼0≡ A ; (11)<br />
A∼1≡A; (12)<br />
A⊕0≡A; (13)<br />
A⊕1≡ A . (14)<br />
f 1 (x 1 , x 2 ,..., x n )=1, (15)<br />
где f – произвольно выбранный фиксированный<br />
конечный предикат, назовем каноническим уравнением<br />
алгебры конечных предикатов для предиката<br />
f. К каноническому виду может быть приведено<br />
любое уравнение алгебры конечных предикатов.<br />
Действительно, уравнение<br />
f1 (x1 , x2 ,..., xn )=f2 (x1 , x2 ,..., xn ), (16)<br />
где f1 , f2 – произвольно выбранные фиксированные<br />
конечные предикаты, является наиболее общим<br />
видом уравнения алгебры конечных предикатов,<br />
однако оно может быть записано в виде равносильного<br />
ему канонического уравнения:<br />
f1 (x1 , x2 ,..., xn )∼f2 (x1 , x2 ,..., xn )=1. (17)<br />
Система канонических уравнений<br />
⎧ f1( x1, x2,..., xn)=<br />
1,<br />
⎪<br />
⎪ f2( x1, x2,..., xn)=<br />
1,<br />
⎨<br />
⎪................<br />
..........<br />
⎪<br />
⎩ fm( x1, x2,..., xn)=<br />
1.<br />
(18)<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
может быть записана в виде одного равносильного<br />
ей канонического уравнения:<br />
( )∧ ( )∧<br />
f x , x ,..., x f x , x ,..., x ...<br />
1 1 2 n 2 1 2 n<br />
∧ f ( x , x ,..., x )= 1.<br />
m 1 2 n<br />
(19)<br />
Равносильными назовем такие уравнения или<br />
системы уравнений, множества всех решений которых<br />
совпадают между собой. В дальнейшем мы<br />
ограничимся рассмотрением только канонических<br />
уравнений, имея в виду, что любое уравнение или<br />
система уравнений алгебры конечных предикатов<br />
могут быть заменены равносильными им каноническими<br />
уравнениями.<br />
Любое каноническое уравнение может быть<br />
интерпретировано как некоторое высказывание.<br />
В самом деле, уравнение x σ =1 равносильно высказыванию<br />
«x=σ»: если х σ =1, то х=σ; если x=σ, то<br />
x σ =1. Точно так же, уравнения A∨B=1, AB=1, ⎺A=1,<br />
A⊃B=1, A∼B=1, A⊕B=1 соответственно равносильны<br />
высказываниям «А или также В», «A и B», «ложно,<br />
что A», «если А, то В», «А равносильно В», «или<br />
А, или В». На том же основании можно утверждать,<br />
что любое сложное высказывание, у которого в<br />
качестве простых высказываний фигурируют канонические<br />
уравнения, может быть представлено<br />
в виде некоторого канонического уравнения. Для<br />
перехода от такого высказывания к каноническому<br />
уравнению нужно в высказывании логические<br />
связки «или также», «и», «ложно, что», «если – то»,<br />
«равносильно», «или – или» заменить соответственно<br />
символами ∨, ∧, , ⊃, ∼, ⊕ и приравнять полученную<br />
формулу к единице.<br />
Как решить каноническое уравнение f(x 1 , x 2 ,...,<br />
x n )=1 алгебры конечных предикатов? Решить<br />
уравнение – это значит отыскать множество всех<br />
наборов значений переменных (x 1 , x 2 ,..., x n ), удовлетворяющих<br />
этому уравнению, то есть обращающих<br />
его левую часть в 1. Мы уже располагаем<br />
универсальным, хотя, быть может, громоздким и<br />
не всегда удобным, методом решения канонического<br />
уравнения. В качестве такого метода может<br />
быть использован алгоритм приведения любой<br />
формулы алгебры конечных предикатов к СДНФ,<br />
описанный в п. 3 [1]. Пусть задано уравнение (15)<br />
и требуется его решить. Представляя предикат f в<br />
виде СДНФ, имеем:<br />
f(x1 , x2 ,..., xn )= ∨ 1 2<br />
f ( σ1, σ2,..., σn<br />
) = 1<br />
σ1 σ2 σn<br />
x x ... xn .<br />
σ1 σ2 σn<br />
Каждой конституэнте единицы x1 x2 ... xn СДНФ предиката f соответствует решение (σ1 , σ2 ,...,<br />
σn ) уравнения (15). Вместе взятые, эти решения образуют<br />
систему всех решений уравнения (15).<br />
Рассмотрим пример решения уравнения вида<br />
(15) при А={а, b}, В={x1 , x2 , x3 }. Предикат f задан<br />
формулой:<br />
f(x1 , x2 , x3 ) ≡<br />
(x a<br />
1 ∨x2 b )(x1 a∨x1 bx3 a )∨(x1 a∨x2 a )(x2 bx3 b∨x2 ax3 a ).<br />
31
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
32<br />
СДНФ этого предиката имеет вид:<br />
f≡x 1 a x2 a x3 a ∨x1 a x2 a x3 b ∨x1 a x2 b x3 a ∨<br />
∨x 1 a x2 b x3 b ∨x1 b x2 a x3 a ∨x1 b x2 b x3 b .<br />
По СДНФ предиката f находим систему Т всех<br />
решений уравнения f(x 1 , x 2 , x 3 )=1:<br />
T={(a, a, a), (a, a, b), (a, b, a), (a, b, b),<br />
(b, a, a), (b, b, b)}.<br />
Система всех решений уравнения (15) может<br />
быть представлена, как правило, в значительно<br />
более компактном виде, чем в форме СДНФ, если<br />
воспользоваться алгоритмом получения некоторой<br />
ДНФ предиката, описанным в [1]. Более компактное<br />
представление системы всех решений предиката<br />
достигается использованием минимальной<br />
ДНФ. Каждой элементарной конъюнкции<br />
σiσi σis<br />
i1<br />
i2<br />
is<br />
1 2 x x ... x<br />
(s≤n) ДНФ предиката соответствует некоторое подмножество<br />
системы всех решений уравнения (15),<br />
составленное из всевозможных наборов значений<br />
переменных (x1 , x2 ,..., xn ), у которых на i1 , i2 ,..., is местах стоят соответственно буквы σi , σi ,..., σ<br />
1 2 i .<br />
s<br />
Объединение всех таких подмножеств дает систему<br />
всех решений уравнения (15).<br />
Рассмотрим пример представления системы<br />
всех решений уравнения алгебры конечных предикатов<br />
при А={а, b, с} и В={x1 , x2 , x3 }с помощью<br />
минимальной ДНФ. Предикат f задан формулой<br />
f(x1 , x2 , x3 )≡(x a<br />
1 ∨x2 c )(x2 a∨x2 b∨x3 a ).<br />
Минимальная ДНФ этого предиката имеет вид:<br />
f=x 1 a x2 a ∨x1 a x2 b ∨x2 c x3 a .<br />
Система Т всех решений уравнения f(x 1 , x 2 , x 3 )=1<br />
может быть представлена в следующей сокращенной<br />
форме T={(a, a, x 3 ), (a, b, x 3 ), (x 1 , c, a)). В данной<br />
записи под x 1 и x 3 понимаются произвольные<br />
буквы алфавита А. Полная же запись системы всех<br />
решений имеет вид: Т={(а, а, а), (а, а, b), (а, а, с),<br />
(а, b, а), (а, b, b), (а, b, с), (а, с, а), (b, с, а), (с, с, а)}.<br />
Введенные ранее понятия конечного предиката,<br />
формулы алгебры конечных предикатов, канонического<br />
уравнения и множества всех его решений<br />
допускают содержательную логическую интерпретацию.<br />
Формулы алгебры конечных предикатов<br />
можно интерпретировать как высказывания или<br />
суждения <strong>интеллект</strong>а. Каноническое уравнение<br />
А=1, где А – произвольно выбранная формула алгебры<br />
конечных предикатов, можно интерпретировать<br />
как утверждение об истинности высказывания<br />
А, уравнение A=0 можно интерпретировать как<br />
утверждение о ложности высказывания A. Конечный<br />
предикат f(x 1 , x 2 ,..., x n ), обозначаемый формулой<br />
А, а также эквивалентное ему множество Т всех<br />
решений (x 1 , x 2 ,..., x n ) уравнения А=1 можно интерпретировать<br />
как содержание высказывания А.<br />
Формулы, обозначающие тождественно истинный<br />
предикат, назовем тождественно истинными,<br />
их можно интерпретировать как бессодержательные<br />
или тавтологические высказывания. Формулы,<br />
обозначающие тождественно ложный предикат,<br />
назовем тождественно ложными. Их можно интерпретировать<br />
как противоречивые высказывания.<br />
Формулу, не являющуюся тождественно ложной,<br />
можно рассматривать как выполнимое высказывание.<br />
В случае, когда формула A⊃B тождественно истинна,<br />
высказывание В можно интерпретировать<br />
как логическое следствие высказывания А. Если<br />
тождественно истинна формула A∼B, то высказывания<br />
A и B можно интерпретировать как логически<br />
равносильные. Если формула A~B – тождественно<br />
ложна, то высказывания А и В можно интерпретировать<br />
как логически несовместимые, в противном<br />
случае – как логически совместимые, иначе говоря,<br />
как высказывания, имеющие общее содержание.<br />
Рассмотрим пример логического использования<br />
понятия уравнения алгебры конечных предикатов.<br />
Решим средствами алгебры конечных предикатов<br />
одну простую задачу. Пусть задано, что<br />
x∈{а, b, с} x≠а, x≠b. Требуется определить значение<br />
буквенной переменной x. Человек, лишь взглянув<br />
на условие задачи, мгновенно находит: x=с. Алгебраическое<br />
же решение данной задачи требует<br />
определенной затраты усилий. Условие x∈{а, b, с}<br />
означает, что х=а или х=b, или х=с. Оно формально<br />
запишется в виде канонического уравнения<br />
x a ∨x b ∨x c =1. Условия x≠а и x≠b на <strong>язык</strong>е алгебры<br />
конечных предикатов запишутся в виде уравнений<br />
x a =1, x b =1. Все вместе условия задачи запишутся<br />
в виде уравнения:<br />
(x a ∨x b ∨x c ) x a x b =1.<br />
Упрощаем левую часть этого уравнения:<br />
(x a ∨x b ∨x c ) x a x b x b ≡x a x a x b ∨x b x a x b ∨x c x a x b ≡<br />
≡0∨0∨x c ≡x c .<br />
Таким образом, x c =1, откуда находим x=c. Рассмотрим<br />
другой пример на ту же тему: доказать, что<br />
из x∈{a, b, c}, x≠a, x≠b следует x=c. Чтобы решить<br />
эту задачу, записываем формулу, соответствующую<br />
утверждению, которое требуется доказать:<br />
(x a ∨x b ∨x c ) x a x b ⊃x c .<br />
Производим упрощение этой формулы<br />
(x a ∨x b ∨x c ) x a x b ⊃x c ≡x c ⊃x c ≡1.<br />
Таким образом, формула тождественно истинна,<br />
а значит, утверждение x=c следует из условия<br />
x∈{a, b, c}, x≠a, x≠b.<br />
Приведенные примеры могут служить иллюстрацией<br />
к следующему общему утверждению:<br />
процесс решения уравнений и определения значения<br />
формул алгебры конечных предикатов мож-
но интерпретировать как мышление <strong>интеллект</strong>а,<br />
являющееся основой <strong>интеллект</strong>уальной деятельности<br />
человека. Машинное мышление возможно<br />
в той же мере, в какой возможно машинное решение<br />
уравнений и машинное определение значений<br />
формул алгебры конечных предикатов. Одной<br />
из важнейших задач теории <strong>интеллект</strong>а является<br />
разработка методов оперирования с формулами и<br />
уравнениями алгебры конечных предикатов, предназначенных<br />
для их машинной реализации.<br />
2. Универсальная алгебра<br />
До сих пор говорилось об алгебре конечных<br />
предикатов в единственном числе, на самом же<br />
деле была введена не одна, а целое семейство таких<br />
алгебр. Данное семейство включает в себя бесконечное<br />
число различных алгебр. Каждой паре<br />
– алфавиту букв А={a1 , a2 ,..., ak } и алфавиту переменных<br />
В={x1 , x2 ,..., xn } – соответствует отличная<br />
от других алгебра конечных предикатов. Всякий<br />
раз, прежде чем приступить к рассмотрению той<br />
или иной задачи, мы указывали алфавиты А и В,<br />
производя тем самым выбор конкретной алгебры<br />
конечных предикатов, на <strong>язык</strong>е которой затем велось<br />
решение задачи. Указанный образ действий,<br />
однако, не всегда удобен, в частности при рассмотрении<br />
проблем, включающих в себя ряд взаимосвязанных<br />
задач. Если для каждой из таких задач<br />
выбрать наиболее экономную при заданных условиях<br />
алгебру конечных предикатов и на ее <strong>язык</strong>е<br />
описывать решение задачи, то впоследствии могут<br />
возникнуть трудности, обусловленные «<strong>язык</strong>овым<br />
барьером», при соединении в единое целое результатов,<br />
полученных при решении различных задач.<br />
Так, например, если формула А записана на <strong>язык</strong>е<br />
одной алгебры конечных предикатов, а формула<br />
В – на <strong>язык</strong>е другой, то система уравнений {A=1,<br />
B=1}, вообще говоря, теперь уже не равносильна<br />
уравнению А∨В=1.<br />
К такого рода проблемам относится проблема<br />
математического описания функций человеческого<br />
<strong>интеллект</strong>а. Интеллект человека – это очень<br />
сложная система, его функционирование не может<br />
быть описано «одним ударом». Теория <strong>интеллект</strong>а,<br />
без сомнения, будет развиваться постепенно, накапливая<br />
отдельные результаты. Чтобы в процессе<br />
развития не столкнуться с <strong>язык</strong>овым барьером<br />
при объединении отдельных результатов в единую<br />
систему, очевидно, нужно с самого начала выбрать<br />
в качестве формального <strong>язык</strong>а весьма мощную и<br />
единую для всех задач теории <strong>интеллект</strong>а алгебру,<br />
оперирующую достаточно большим числом букв и<br />
переменных. Тогда все объекты теории <strong>интеллект</strong>а<br />
можно будет описывать на одном и том же <strong>язык</strong>е.<br />
Однако возникает серьезное неудобство: всякий<br />
раз, описывая те или иные функции <strong>интеллект</strong>а, в<br />
том числе самые простые (а именно с простейшими<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
функциями теория <strong>интеллект</strong>а будет иметь дело в<br />
первую очередь), придется использовать в качестве<br />
формального <strong>язык</strong>а громоздкий математический<br />
аппарат, рассчитанный на применение к сложным<br />
объектам. Так, например, для записи СДНФ простейшего<br />
предиката придется ввести в действие весь<br />
арсенал букв и переменных. Такая СДНФ должна<br />
иметь невообразимо большую длину, оперировать<br />
ею будет практически невозможно. Вместе с тем,<br />
резервирование с самого начала огромного числа<br />
букв и переменных не спасает положения: сколь<br />
бы ни была обширна выбранная алгебра конечных<br />
предикатов, рано или поздно она станет недостаточной<br />
для удовлетворения постоянно растущих<br />
нужд развивающейся теории <strong>интеллект</strong>а. Таким<br />
образом, оба подхода – использование для каждой<br />
конкретной задачи собственной экономной специализированной<br />
алгебры и использование алгебры,<br />
общей для всех возможных в теории <strong>интеллект</strong>а<br />
задач, – обладают достоинствами и недостатками.<br />
Хотелось бы иметь такой третий подход, который,<br />
соединяя достоинства первых двух подходов, был<br />
бы свободен от присущих им недостатков. Такой<br />
подход существует. Он основан на использовании<br />
универсальной алгебры конечных предикатов, к<br />
рассмотрению которой мы и переходим<br />
Теперь мы будем во всех случаях пользоваться<br />
единой алгеброй с алфавитом букв А={a 1 , a 2 ,..., a χ }<br />
и алфавитом переменных В={х 1 , х 2 ,..., x ν }, называемой<br />
универсальной алгеброй конечных предикатов,<br />
особенность которой заключается в том ,что числа<br />
χ и ν букв и переменных в ее алфавитах всегда<br />
будут оставаться неопределенными. Вместе с тем,<br />
при практическом применении универсальной алгебры<br />
не должна возникать необходимость узнать<br />
точные значения этих чисел. О числах χ и ν будем<br />
считать известным лишь то, что они конечны и настолько<br />
велики, что удовлетворяют любым нуждам<br />
теории <strong>интеллект</strong>а, которые могут возникнуть<br />
даже в самом отдаленном будущем при ее развитии.<br />
При указанном подходе невозможно перечислить<br />
все буквы и переменные универсальной<br />
алгебры, однако такое перечисление нам никогда<br />
и не понадобится. Просто мы будем считать, что в<br />
алфавитах А и В содержатся все нужные знаки и в<br />
универсальной алгебре можно будет пользоваться<br />
любыми знаками без каких бы то ни было ограничений.<br />
Поскольку у отдельного человека (и даже<br />
у всего человечества в целом за всю историю его<br />
существования) может находиться в обращении<br />
лишь конечное число знаков, мы не вступаем в<br />
противоречие с требованием конечности алфавитов<br />
А и В универсальной алгебры.<br />
Приступая к рассмотрению той или иной конкретной<br />
задачи теории <strong>интеллект</strong>а, будем каждый<br />
раз перечислять все переменные, которые мы собираемся<br />
в этой задаче использовать. Остальные<br />
33
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
переменные универсальной алгебры, не указанные<br />
в этом перечне, будем молчаливо считать фиктивными.<br />
Обозначим переменные, введенные в данной<br />
конкретной задаче, через x 1 , x 2 ,..., x n . Для каждой<br />
такой переменной укажем область ее задания,<br />
то есть множество всех тех букв, которые эта переменная<br />
может принимать в данной задаче. С этой<br />
целью вводим следующую систему уравнений:<br />
a a a<br />
11 21 k1<br />
x1 x1 x1<br />
a a ak<br />
x2 x2 x2<br />
1<br />
12 22 2 2<br />
⎧ ∨ ∨... ∨ = 1,<br />
⎪<br />
⎪ ∨ ∨... ∨ = 1,<br />
⎨<br />
(20)<br />
⎪.......................................<br />
⎪ a a<br />
a<br />
1n 2n knn ⎩⎪<br />
xn∨xn∨... ∨ xn<br />
= 1.<br />
Эти уравнения означают, что x1∈{a11 , a21 ,..., ak11 }, x2∈{a12 , a12 ,..., ak2 2 },..., xn∈{a1n , a2n ,..., akn n};<br />
они<br />
задают для каждой переменной, участвующей в задаче,<br />
свою область изменения. Здесь a11 , a21 ,..., ak11 , a12 , a22 ,..., ak2 2 ,..., a1n , a2n ,..., aknn – буквы алфавита<br />
А, предназначенные для использования в задаче;<br />
k1 , k2 ,..., kn – числа, не превышающие число χ. На<br />
систему уравнений (20) целесообразно смотреть,<br />
как на часть математического описания объекта,<br />
рассматриваемого в задаче. При решении задачи<br />
уравнения (20) должны учитываться наравне с другими<br />
фигурирующими в ней уравнениями.<br />
Требование предварительного задания области<br />
изменения для каждой переменной, встречающейся<br />
в задаче, не более обременительно, чем необходимость<br />
указания алфавита букв при выборе специализированной<br />
алгебры конечных предикатов<br />
для той же задачи. Если область изменения некоторой<br />
переменной точно неизвестна, то всегда допустимо<br />
взять для этой переменной область задания<br />
«с запасом», включив в нее и такие значения,<br />
которые переменная, быть может, никогда не будет<br />
принимать. В частности, при желании можно для<br />
всех переменных, участвующих в задаче, принять<br />
одну и ту же область задания. В универсальной<br />
алгебре, ввиду невозможности перечисления всех<br />
букв алфавита А, практически не удается воспользоваться<br />
законом истинности:<br />
34<br />
a a<br />
a<br />
1 2<br />
j j<br />
j 1<br />
χ<br />
x ∨x ∨... ∨ x =<br />
, (1≤j≤n). (21)<br />
Указанное обстоятельство, однако, не приводит<br />
к затруднениям, так как в универсальной алгебре<br />
на смену системе тождеств (21) в каждой конкретной<br />
задаче приходит система (20) уравнений того<br />
же типа. Уравнения (20) назовем усеченными законами<br />
истинности.<br />
В универсальной алгебре по той же причине<br />
нельзя практически применить и закон отрицания<br />
a<br />
a<br />
a<br />
i xj 1 2 i− 1 i+<br />
1<br />
χ<br />
= xj∨xj∨... ∨xj∨xj∨... ∨ xj,<br />
( 1 ≤ j ≤n),<br />
(22)<br />
лежащий в основе определения операции отрицания.<br />
Однако это не ведет к трудностям, поскольку в<br />
a<br />
a<br />
a<br />
универсальной алгебре на смену законам отрицания<br />
приходит система равенств<br />
σ σ σ σ<br />
j j j j<br />
ij 1j 2 j i−1, j<br />
x = x ∨x ∨... ∨x ∨<br />
σ σ<br />
j j<br />
i+ 1,<br />
j ki , j<br />
∨x ∨... ∨ x ,<br />
(23)<br />
легко выводимых из усеченных законов истинности.<br />
Здесь i пробегает значения в пределах от 1<br />
до k j , j – в пределах от 1 до n. Уравнения (23) назовем<br />
усеченными законами отрицания. Они дают<br />
возможность ввести операцию отрицания также<br />
и в универсальной алгебре, в которой можно без<br />
каких бы то ни было ограничений пользоваться<br />
всеми тождествами алгебры конечных предикатов,<br />
кроме законов истинности и отрицания. Все законы<br />
ложности сохраняют силу, однако в конкретной задаче<br />
фактически используются только те, в которых<br />
фигурируют введенные в задаче переменные и показатели<br />
узнавания при них из областей изменения<br />
для данных переменных.<br />
Как было уже отмечено выше, в универсальной<br />
алгебре невозможно практически воспользоваться<br />
совершенными дизъюнктивными и конъюнктивными<br />
нормальными формами – важным<br />
инструментом алгебры конечных предикатов. К<br />
счастью, им на смену приходят усеченные формы,<br />
к рассмотрению которых мы и приступаем.<br />
Изучение вопроса начнем с введения смешанных<br />
n-разрядных числовых кодов или кодов типа (k 1 ,<br />
k 2 ,..., k n ). Типом кода назовем набор чисел (k 1 , k 2 ,...,<br />
k n ). Введем n множеств символов R j ={0, 1,..., k j-1 },<br />
(1≤j≤n). Символы множества R j назовем k j -ичными<br />
цифрами j-го разряда, под этими символами понимаем<br />
первые k j чисел натурального ряда. Число k j<br />
назовем основанием j-го разряда. При построении<br />
смешанных кодов в их j-м разряде разрешается использовать<br />
лишь цифры из множества R j . Каждый<br />
код: a 1 a 2 ...a n-1 a n обозначает некоторое число, называемое<br />
значением этого кода и вычисляемое по<br />
формуле:<br />
a 1 a 2 ...a n-1 a n =a 1 k 2 ...k n +a 2 k 3 ...k n +…+a n-1 k n +a n . (24)<br />
В качестве примера найдем с помощью формулы<br />
(24) числовое значение смешанного кода 122 типа<br />
(2, 4, 5). Десятичная запись значения этого кода<br />
равна 122 (2, 4, 5) =1⋅4⋅5+2⋅5+2=32 10 . Справа внизу у<br />
смешанного кода 122 указан его тип (2, 4, 5).<br />
Для нахождения смешанного кода типа (k 1 , k 2 ,...,<br />
k n ) заданного числа нужно разделить это число на<br />
k n , полученную целую часть частного разделить на<br />
k n-1 и т. д., наконец, целую часть частного n-1-го<br />
деления разделить на k 1 . Считывая остатки этих делений<br />
в обратном порядке, получаем смешанный<br />
код заданного числа. В целой части частного после<br />
n-го деления должен получиться 0, в противном<br />
случае для заданного числа код типа (k 1 , k 2 ,...,<br />
k n ) не существует. В качестве примера найдем код
типа (4, 3, 5) числа, заданного десятичным кодом<br />
38. Выполняем последовательные деления, остатки<br />
делений указываем в скобках: 38:5=7(3), 7:3=2(1),<br />
2:4=0(2). Имеем 38 10 =213 (4, 3, 5) . Заметим, что число<br />
L(k 1 , k 2 ,..., k n ) всех различных n-разрядных кодов<br />
типа (k 1 , k 2 ,..., k n ) определяется формулой:<br />
L(k 1 , k 2 ,..., k n )=k 1 k 2 ...k n . (25)<br />
При использовании универсальной алгебры<br />
описание объектов той или иной конкретной задачи<br />
осуществляется с помощью усеченных форм, то<br />
есть таких формул алгебры конечных предикатов,<br />
в которых встречаются не все буквы и переменные<br />
универсальной алгебры, а только их часть, указанная<br />
в условии задачи. Предикат, заданный усеченной<br />
формой, можно представить в виде усеченной<br />
таблицы его значений, которая составляется только<br />
для тех переменных и их значений, которые указаны<br />
в условии рассматриваемой задачи. Каждая<br />
переменная xj при этом пробегает все значения из<br />
заданной области Tj={a1j, a2j,..., akj j}.<br />
Наборы значений<br />
аргументов, указанные в задаче (назовем их<br />
усеченными наборами), (x1 , x2 ,..., xn ) удобно интерпретировать<br />
как n-разрядные смешанные числовые<br />
коды типа (k1 , k2 ,..., kn ). Буквы a1j , a2j ,..., akjj ,<br />
расположенные на j-ом месте усеченного набора,<br />
интерпретируем как числа 0, 1,..., kj-1. Заметим,<br />
что одни и те же буквы, стоящие на разных местах в<br />
наборе, могут интерпретироваться как различные<br />
числа.<br />
В усеченной таблице наборы x1 , x2 ,..., xn будем<br />
располагать в порядке возрастания числовых значений<br />
соответствующих этим наборам смешанных<br />
кодов. Порядок расположения кодов назовем<br />
лексикографическим. Усеченную таблицу значений<br />
иногда удобно рассматривать как полную таблицу<br />
некоторого конечного предиката, заданного на декартовом<br />
произведении T1 ×T2 ×...×Tn . Указанный<br />
предикат будем называть усеченным конечным предикатом<br />
или усечением исходного предиката универсальной<br />
алгебры. Усеченные предикаты могут<br />
быть все пронумерованы, для чего воспользуемся<br />
способом, описанным в п. 1.1. Всего существует<br />
k1k2 n 2 k ...<br />
различных предикатов, заданных на декартовом<br />
произведении T1 ×T2 ×...×Tn .<br />
Универсальную алгебру, вместе с введенными<br />
в ней усеченными законами истинности и отрицания,<br />
можно рассматривать как некую разновидность<br />
алгебры конечных предикатов. Назовем<br />
такую алгебру усеченной. Уравнения (20) играют в<br />
ней роль тождеств этой алгебры. В усеченной алгебре<br />
сохраняют силу все понятия и результаты,<br />
рассмотренные в [1], в том числе понятия СДНФ и<br />
СКНФ. Отличие усеченной алгебры от ранее рассмотренной<br />
алгебры конечных предикатов состоит<br />
в том, что в ней каждая буквенная переменная<br />
определена на своей собственной области. В неусе-<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
ченной же алгебре все переменные заданы на единой<br />
области. СДНФ и СКНФ усеченной алгебры<br />
можно использовать в качестве заменителей недосягаемых<br />
СДНФ и СКНФ универсальной алгебры<br />
при рассмотрении той или иной конкретной задачи,<br />
приняв их в качестве усеченных СДНФ и СКНФ<br />
универсальной алгебры.<br />
Аналогично все другие понятия и результаты<br />
усеченной алгебры конечных предикатов могут<br />
быть приняты в качестве «усеченных» понятий и<br />
результатов универсальной алгебры. Понятия и<br />
результаты усеченной алгебры могут быть получены<br />
тем же путем, что и в неусеченной алгебре<br />
с той разницей, что вместо законов истинности и<br />
отрицания нужно везде применять усеченные законы<br />
истинности и отрицания. Универсальной алгеброй<br />
можно пользоваться при решении многих<br />
произвольных взаимосвязанных друг с другом задач<br />
столь же свободно, как и конкретной алгеброй<br />
конечных предикатов, используемой для решения<br />
какой-нибудь одной задачи. Единственной платой<br />
за полученную свободу служит необходимость введения<br />
в каждой конкретной задаче дополнительных<br />
уравнений – усеченных законов истинности,<br />
ограничивающих области изменения всех переменных,<br />
фигурирующих в данной задаче.<br />
Рассмотрим пример пользования усеченными<br />
формами. Заданы следующие усеченные законы<br />
истинности:<br />
x a<br />
1 ∨x1 b =1, x2<br />
c∨x2 d =1, x3<br />
a∨x3 d =1. (a)<br />
Требуется преобразовать к усеченной СДНФ<br />
формулу:<br />
f=(x a<br />
1 ∨x2 d )(x1 a∨x1 bx3 a )∨(x1 a∨x2 c )(x2 dx3 d∨x2 cx3 a ). (б)<br />
Преобразование производим, руководствуясь<br />
алгоритмом преобразования к СДНФ произвольной<br />
формулы алгебры конечных предикатов, описанным<br />
в п. 3 [1]. Раскрывая скобки и производя<br />
упрощения, имеем:<br />
f=x 1 a ∨x1 a x2 d ∨x1 b x2 d x3 a ∨x1 a x2 d x3 d ∨x1 a x2 c x3 a ∨x2 c x3 a .<br />
Во все конъюнкции вводим недостающие переменные,<br />
при этом, вопреки указаниям, содержащимся<br />
в описании алгоритма, пользуемся не законами<br />
истинности, а равенствами (а):<br />
f=x 1 a (x2 c ∨x2 d )(x3 a ∨x3 d )∨x1 a x2 d (x3 a ∨x3 d )∨x1 b x2 d x3 a ∨<br />
∨x 1 a x2 d x3 d ∨x1 a x2 c x3 a ∨(x1 a ∨x1 b )x2 c x3 a .<br />
Раскрывая скобки и производя упрощения, получаем<br />
усеченную СДНФ:<br />
f=x a<br />
1 x2<br />
cx3 a∨x1 ax2 cx3 d∨x1 ax2 dx3 a∨x1 ax2 dx3 d∨ ∨x b<br />
1 x2<br />
cx3 a∨x1 bx2 dx3 a .<br />
Важным свойством усеченной СДНФ является<br />
то, что она указывает все решения системы уравнений,<br />
математически описывающей объект в кон-<br />
35
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
кретной рассматриваемой задаче. В рассмотренном<br />
примере СДНФ указывает множество {(a, c,<br />
a), (a, c, d), (a, d, a), (a, d, d), (d, c, a), (b, d, a)} всех<br />
решений системы, состоящей из уравнения (б) и<br />
уравнений (а).<br />
3. Аналитическое представление алфавитных<br />
операторов в виде уравнений<br />
Формулы универсальной алгебры – удобное<br />
средство для аналитического представления конечных<br />
алфавитных операторов, нашего главного орудия<br />
математического описания деятельности <strong>интеллект</strong>а.<br />
Можно предложить несколько различных<br />
методов аналитического представления конечных<br />
алфавитных операторов. Их целесообразно разделить<br />
на две группы: методы неявного и явного задания<br />
операторов. Рассмотрим два метода неявного<br />
задания алфавитных операторов и один метод явного<br />
задания. Метод, который мы рассмотрим первым,<br />
позволяет осуществить неявное задание алфавитного<br />
оператора одним уравнением. Пусть y1y2…yq =F(x1x2… xp ) – произвольно выбранный конечный алфавитный<br />
оператор, преобразующий входные слова x1x2… xp длины p в выходные слова y1y2…yq длины q. Чтобы<br />
получить в универсальной алгебре корректное<br />
математическое описание объекта, нужно ограничить<br />
области изменения всех буквенных переменных,<br />
относящихся к этому объекту. В данном случае<br />
объектом математического описания служит алфавитный<br />
оператор F, в роли буквенных переменных<br />
выступают символы x1 , x2 ,…, xp , y1 , y2 ,…, yq .<br />
Требуемые ограничения вводим с помощью<br />
усеченных законов истинности для буквенных переменных<br />
входного слова:<br />
36<br />
a a a<br />
11 21 k1<br />
x1 x1 x1<br />
a a ak<br />
x2 x2 x2<br />
1<br />
12 22 2 2<br />
⎧ ∨ ∨... ∨ = 1,<br />
⎪<br />
⎪ ∨ ∨... ∨ = 1,<br />
⎨<br />
⎪........................................<br />
⎪ a a<br />
a<br />
1p 2p kp p<br />
⎩⎪<br />
xp∨xp∨... ∨ x p = 1;<br />
для буквенных переменных выходного слова:<br />
b b b<br />
11 21 l1<br />
y1 y1 y1<br />
b b bl<br />
y2 y2 y2<br />
1<br />
12 22 2 2<br />
⎧ ∨ ∨... ∨ = 1,<br />
⎪<br />
⎪ ∨ ∨... ∨ = 1,<br />
⎨<br />
⎪........................................<br />
⎪ b b<br />
b<br />
1q 2q lqq ⎩⎪<br />
yq∨yq∨... ∨ yq<br />
= 1.<br />
(26)<br />
(27)<br />
Смысл указанных уравнений состоит в том, что<br />
x1∈{a11 , a21 ,…, ak11 }, x2∈{a12 , a22 ,…, ak2 2 },…, xp∈{a1p ,<br />
a2p ,…, akp p},<br />
y1∈{b11 , b21 ,…, bl1 1 }, y2∈{b12 , b22 ,…, bl2 2<br />
},…, yq∈{b1q , b2q ,…, blq}. q<br />
Построим усеченный конечный предикат<br />
f(x1 , x2 ,…, xp , y1 , y2 ,…, yq ) с областью определения<br />
S1 ×S2 ×…×Sp ×T1 ×T2 ×…×Tq , где Si ={a1i , a2i ,…, aki i },<br />
Tj ={b1j , b2j ,…, blj j},<br />
(1≤i≤p, 1≤j≤q), задавая его значения<br />
следующим правилом:<br />
f ( x1, x2, …, xp, y1, y2, …,<br />
yq)=<br />
⎧⎪<br />
1, если yy 1 2... yq = F( xx 1 2...<br />
x p ) ,<br />
= ⎨<br />
⎩⎪ 0, если yy 1 2... yq ≠ F( xx 1 2...<br />
x p ) .<br />
Запишем уравнение<br />
σ1 σ2 σ p ε1 ε2 εq<br />
x1 x2 ... xp y1 x2 ... xq<br />
1<br />
F ( σσ 1 2... σp)= ε1ε2... εq<br />
(28)<br />
∨ = , (29)<br />
левая часть которого совпадает с усеченной<br />
СДНФ предиката f. Запись F ( σ1, σ2,..., σp) = ε1ε2... εq<br />
под знаком ∨∨ означает, что логическое суммирование<br />
ведется по тем буквенным наборам<br />
( σ1, σ2,..., σp, ε1ε2... εq<br />
), для которых имеет место<br />
равенство F ( σ1, σ2,..., σp) = ε1ε2... εq<br />
. Уравнение (29)<br />
можно принять в качестве математической записи<br />
конечного алфавитного оператора F. Действительно,<br />
подставляя в него вместо x1 , x2 ,…, xp соответственно<br />
буквы σ1 , σ2 ,…, σp из областей S1 , S2 ,…, Sp и решая<br />
уравнение (29) относительно набора переменных<br />
(y1 , y2 ,…, yq ) получаем единственное решение (ε1 ,<br />
ε2 ,…, εq ). Составленное из букв этого решения слово<br />
ε1ε2…εq совпадает с выходным словом оператора F<br />
для входного слова σ1σ2…σp .<br />
Отметим, что уравнение (29) не только задает<br />
реакции оператора F в области его определения<br />
S1 ×S2 ×…×Sp , но, кроме того, формирует саму область<br />
определения. Если мы захотим найти реакцию<br />
оператора F на входное слово, находящееся<br />
за пределами области определения оператора, то,<br />
подставив буквы этого слова в (29), получим противоречие:<br />
0=1. Следовательно, в данном случае<br />
указанное уравнение не имеет решений. Таким<br />
образом, характеризуемый им оператор не ставит<br />
в соответствие заданному входному слову никакого<br />
выходного слова, иначе говоря, алфавитный<br />
оператор в этом случае не определен. Если представление<br />
конечного алфавитного оператора F в<br />
виде усеченной СДНФ нас чем-то не устраивает,<br />
то можно путем тождественных преобразований<br />
левой части уравнения (29) перейти к любому другому<br />
формальному представлению этого уравнения.<br />
В процессе тождественных преобразований,<br />
поскольку здесь мы имеем дело с усеченными<br />
формулами универсальной алгебры, следует вместо<br />
закона истинности пользоваться равенствами<br />
(26) и (27). Если в процессе тождественных преобразований<br />
левой части уравнения (29) приходится<br />
использовать какие-либо из равенств (26) и (27),<br />
то преобразованное уравнение уже нельзя считать<br />
полной записью оператора F. Для полноты представления<br />
оператора F следует к преобразованному<br />
уравнению присовокупить те из уравнений (26),<br />
(27), которые были использованы при тождественных<br />
преобразованиях.<br />
Рассмотрим пример аналитического представления<br />
конечного алфавитного оператора по первому<br />
методу. Пусть y1y2y3 =F(x1x2 ) – алфавитный
оператор, который ставит в соответствие троичным<br />
цифрам x 1 , x 2 их сумму в виде трехразрядного<br />
двоичного кода y 1 y 2 y 3 . Требуется записать в виде<br />
уравнения универсальной алгебры алфавитный<br />
оператор F. Записываем уравнения, ограничивающие<br />
значения введенных переменных:<br />
0<br />
1<br />
2<br />
1<br />
2<br />
1<br />
0<br />
2<br />
1<br />
2<br />
2<br />
2<br />
x ∨x ∨ x = 1, x ∨x ∨ x = 1,<br />
0<br />
1<br />
1<br />
1<br />
0<br />
2<br />
1<br />
2<br />
0<br />
3<br />
x ∨ x = 1, x ∨ x = 1,<br />
x ∨ x<br />
1<br />
3<br />
. (a)<br />
Составляем таблицу соответствия между входными<br />
словами x 1 x 2 и выходными словами y 1 y 2 y 3 ,<br />
задаваемого оператором F (табл. 1).<br />
Таблица 1<br />
x 1 0 0 0 1 1 1 2 2 2<br />
x 2 0 1 2 0 1 2 0 1 2<br />
y 1 0 0 0 0 0 0 0 0 1<br />
y 2 0 0 1 0 1 1 1 1 0<br />
y 3 0 1 0 1 0 1 0 1 0<br />
По таблице записываем уравнение (29), связывающее<br />
переменные x 1 , x 2 , y 1 , y 2 , y 3 точно так, как<br />
их связывает алфавитный оператор F:<br />
0 0 0 0 0<br />
1 2 1 2 3<br />
0 1 0 0 1<br />
1 2 1 2 3<br />
0 2 0 1 0<br />
1 2 1 2 3<br />
x x y y y ∨x x y y y ∨x x y y y ∨<br />
1 0 0 0 1<br />
1 2 1 2 3<br />
1 1 0 1 0<br />
1 2 1 2 3<br />
1 2 0 1 1<br />
1 2 1 2 3<br />
∨x x y y y ∨x x y y y ∨x x y y y ∨(б)<br />
2<br />
0<br />
0<br />
1<br />
0<br />
2<br />
1<br />
0<br />
∨x1x2y1y2y3∨x1x2y1y2y3∨ x1x2y1y2y3= .<br />
В левой части уравнения (б) записана усеченная<br />
СДНФ предиката f, определяемая по оператору F<br />
соотношениями (28). Пользуясь первым законом<br />
дистрибутивности (8), уравнение (б) можно представить<br />
в более компактном виде, переходя к скобочной<br />
форме:<br />
( x<br />
0 0<br />
2 2<br />
0 0<br />
1 2<br />
2 1<br />
1 2<br />
(( x y ∨x y )( x y ∨x y ) ∨<br />
0 2<br />
1 2<br />
∨( x x ∨x x ) y y ∨<br />
2 1<br />
2 2<br />
1 1<br />
1 3<br />
1<br />
1<br />
0 0<br />
2 3<br />
1 1<br />
1 2<br />
0<br />
1<br />
1 0<br />
2 3<br />
2<br />
2<br />
1 1<br />
2 3<br />
2 2 1 0 0<br />
1 2 1 2 3<br />
y ∨x y ) x y ) y ∨ x x y y y )) = 1.<br />
1<br />
0<br />
0 1<br />
(в)<br />
Дополнять уравнение (в) уравнениями (а) в<br />
данном случае нет необходимости, поскольку они<br />
не приняли участия при преобразовании уравнения<br />
(б) в уравнение (в). Обратим внимание на то,<br />
что формульное представление предиката f, полученное<br />
в примере, неизмеримо компактнее табличного.<br />
Усеченная таблица значений предиката<br />
f должна была бы содержать 3⋅3⋅2⋅2⋅2=72 столбца.<br />
Уравнение же, выражающее предикат f, содержит<br />
всего 26 узнаваний букв. Определим, например, с<br />
помощью уравнения (в) выходное слово алфавитного<br />
оператора F для входного слова 12. Имеем<br />
x1 =1, x2 =2. Подставляем значения x1 .и x2 в уравнение<br />
(в):<br />
((10y 0<br />
2 ∨12y2 1 )(20y3 0∨21y3 1 )∨(1022∨1121 )y2 1y3 0∨(20y2 0∨ ∨22y 1<br />
2 )11y3 1 )y1 0∨1222y1 1y2 0y3 0 ))=1.<br />
Из полученного уравнения исключаем константы.<br />
В результате получаем уравнение y 0<br />
1 y2<br />
1y3 1 =1,<br />
откуда находим: y 0<br />
1 =1, y2<br />
1 =1, y3<br />
1 =1. Таким образом,<br />
y1 =0, y2 =1, y3 =1. Выходное слово равно 011.<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
Располагая уравнением, описывающим алфавитный<br />
оператор F, можно решать обратную задачу:<br />
по заданному выходному слову отыскать соответствующее<br />
ему для оператора F входное слово.<br />
Рассмотрим пример. Для алфавитного оператора,<br />
введенного в предыдущем примере, по выходному<br />
слову 100 требуется найти соответствующее ему<br />
входное слово. Имеем y 1 =1, y 2 =0, y 3 =0. Подставляем<br />
значения y 1 , y 2 , y 3 в уравнение (в) и производим<br />
упрощения. В результате получаем: x 1 2 x2 2 =1,<br />
входное слово равно 22. Если в качестве выходного<br />
слова взять слово 010, то для него уравнение (в)<br />
принимает вид:<br />
x 1 2 x3 0 ∨x1 0 x2 2 ∨x1 1 x2 1 =1.<br />
Согласно последнему уравнению, выходному<br />
слову 010 соответствует три входных слова: 20, 02 и<br />
11. Беря же в качестве выходного слова 101 и подставляя<br />
y 1 =1, y 2 =0, y 3 =1 в уравнение (в), получаем<br />
в его левой части 0; мы приходим к равенству 0=1,<br />
то есть к противоречию. Следовательно, не существует<br />
ни одного входного слова, которому бы алфавитный<br />
оператор F ставил в соответствие выходное<br />
слово 101.<br />
Уравнение универсальной алгебры, описывающее<br />
алфавитный оператор F, можно использовать<br />
при решении различного рода логических задач, в<br />
которых фигурирует оператор F. Рассмотрим пример<br />
одной из указанных задач. В ней для того же<br />
алфавитного оператора, который рассматривался<br />
в предыдущих примерах параграфа, требуется найти<br />
входное и выходное слова, если известно, что<br />
обе буквы входного слова одинаковы, а первые и<br />
последние буквы выходного слова различны. По<br />
условию имеем x 1 =x 2 и y 1 ≠y 3 . Условие x 1 =x 2 запишем<br />
в виде высказывания: «x 1 =0 и x 2 =0, или x 1 =1<br />
и x 2 =1, или x 1 =2 и x 2 =2», которое, в свою очередь,<br />
математически описывается следующим уравнением<br />
универсальной алгебры:<br />
x 1 0 x2 0 ∨x1 1 x2 1 ∨x1 2 x2 2 =1. (г)<br />
Условие y1≠y3 представим в виде равносильного<br />
ему высказывания «y1 =1 и y3 =0, или y1 =0, y3 =1» а<br />
затем – в виде уравнения<br />
y 1<br />
1 y3<br />
0∨y1 0y3 1 =1. (д)<br />
Решим совместно уравнения (б), (г) и (д). Для<br />
этого запишем все три уравнения в виде единого<br />
канонического уравнения:<br />
(x 1 0 x2 0 y1 0 y2 0 y3 0 ∨x1 0 x2 1 y1 0 y2 0 y3 1 ∨x1 0 x2 2 y1 0 y2 1 y3 0 ∨<br />
∨x 1 1 x2 0 y1 0 y2 0 y3 1 ∨<br />
∨x 1 1 x2 1 y1 0 y2 1 y3 0 ∨x1 1 x2 2 y1 0 y2 1 y3 1 ∨x1 2 x2 0 y1 0 y2 1 y3 0 ∨<br />
∨x 1 2 x2 1 y1 0 y2 1 y3 1 ∨x1 2 x2 2 y1 1 y2 0 y3 0 )(x1 0 x2 0 ∨x1 1 x2 1 ∨<br />
∨x 1 2 x2 2 )(y1 1 y3 0 ∨y1 0 y3 1 )=1,<br />
37
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
в левой части которого раскрываем скобки и производим<br />
упрощения, пользуясь законами ложности<br />
[1, (19)]. В результате получаем x 1 2 x2 2 y1 1 y2 0 y3 0 =1,<br />
откуда находим x 1 =x 2 =2, y 1 =1, y 2 =y 3 =0. Таким образом,<br />
условию задачи удовлетворяет единственная<br />
пара слов: входное слово 22 и соответствующее ему<br />
выходное слово 100 алфавитного оператора F.<br />
Перейдем к рассмотрению второго метода<br />
представления алфавитных операторов. Метод позволяет<br />
осуществить неявное задание алфавитного<br />
оператора системой уравнений, число которых совпадает<br />
с числом букв выходного слова этого оператора.<br />
Когда указывают некоторый конечный алфавитный<br />
оператор y 1 y 2 …y q =F(x 1 , x 2 ,…, x p ), то тем<br />
самым задают систему<br />
38<br />
⎧y1<br />
= F1( xx 1 2...<br />
x p ),<br />
⎪<br />
⎪y2<br />
= Fq( xx 1 2...<br />
x p),<br />
⎨<br />
⎪...........................<br />
⎪<br />
⎩yq<br />
= Fq( xx 1 2...<br />
x p )<br />
(30)<br />
алфавитных операторов F 1 , F 2 , …, F q , каждый из которых<br />
формирует в зависимости от входного слова<br />
x 1 x 2 …x p соответственно одну букву y 1 , y 2 , …, y q выходного<br />
слова y 1 y 2 …y q алфавитного оператора F. Записывая<br />
для каждого из алфавитных операторов (30)<br />
соответствующее ему уравнение (29) универсальной<br />
алгебры, получаем аналитическое представление алфавитного<br />
оператора F в виде следующей системы,<br />
состоящей из q уравнений:<br />
∨<br />
σ1 σ2 σ p ε1<br />
x1x2... xpy1= 1,<br />
F ( σσ 1 2... σp) = ε1<br />
σ1<br />
2 p<br />
∨ x1<br />
x2xpy2 F ( σσ 1 2... σp) = ε2<br />
2 ⎧<br />
⎪<br />
⎪<br />
σ σ ε<br />
⎪<br />
... = 1,<br />
⎨<br />
⎪.......................................<br />
.<br />
⎪<br />
σ1 σ2 σp εq<br />
⎪ ∨ x1x2... xp yq<br />
= 1.<br />
⎩⎪<br />
F ( σσ 1 2...<br />
σp) = εq<br />
(31)<br />
Рассмотрим пример аналитического представления<br />
алфавитного оператора по второму методу.<br />
Описываем тот же оператор, что и в предыдущих<br />
примерах. По табл. 1 составляем три уравнения<br />
типа (31):<br />
0 0 0<br />
1 2 1<br />
0 1 0<br />
1 2 1<br />
0 2 0<br />
1 2 1<br />
1 0 0<br />
1 2 1<br />
x x y ∨x x y ∨x x y ∨x x y ∨<br />
0 0 0<br />
1 2 2<br />
1 1 0<br />
1 2 1<br />
2 1 0<br />
1 2 1<br />
0 1 0<br />
1 2 2<br />
1 2<br />
1 2<br />
0<br />
2 2 1<br />
1 2 1<br />
2 0 0<br />
x1x2y1 ∨x x y ∨x x y1∨<br />
∨<br />
x x y ∨ x x y = 1,<br />
x x y ∨x x y ∨x<br />
0 0 0<br />
1 2 3<br />
1 1 1<br />
1 2 2<br />
2 1 1<br />
∨x1x2y2 1 2 1<br />
1 2 2<br />
0 2 1<br />
1 2 2<br />
2 0 1<br />
1 2 2<br />
1 0 0<br />
1 2 2<br />
x y ∨x x y ∨<br />
∨x x y ∨x x y ∨x x y ∨<br />
0 1 1<br />
1 2 3<br />
2 2 0<br />
x1x2y2 ∨ = 1,<br />
0 2 0<br />
1 2 3<br />
1 0 1<br />
1 2 3<br />
x x y ∨x x y ∨x x y ∨x x y ∨<br />
1 1 0<br />
1 2 3<br />
∨x<br />
2 0 0<br />
1 2 3<br />
2 1 1<br />
1 2 3<br />
1 2 1<br />
1 2 3<br />
x y ∨x x y ∨<br />
2 2 0<br />
1 2 3 1<br />
∨x x y ∨x x y ∨ x x y = .<br />
(е)<br />
Записанная система уравнений равносильна<br />
уравнению (б), полученному для того же алфавитного<br />
оператора по первому методу. При сравнении<br />
описаний (б) и (е) видим, что в данном конкретном<br />
примере первый метод дает более простое<br />
представление алфавитного оператора, чем второй<br />
(45 узнаваний буквы против 81), однако каждое из<br />
уравнений (е) проще, чем уравнение (б) (27 узнаваний<br />
буквы против 45).<br />
Заметим, что нетрудно перейти от описания алфавитного<br />
оператора одним уравнением к описанию<br />
того же оператора системой уравнений. Для<br />
получения описания функции y i =F(x 1 x 2 …x p ), где<br />
1≤i≤q, нужно все узнавания букв для переменных<br />
y 1 ,…, y i-1 , y i+1 ,…, y q в исходном уравнении положить<br />
равными 1. Например, подставляя 1 в уравнение<br />
(б) вместо y 2 0 , y2 1 , y3 0 , y3 1 , находим первое из уравнений<br />
(е). Для перехода от описания алфавитного<br />
оператора системой уравнений к описанию того<br />
же оператора одним уравнением надо образовать<br />
конъюнкцию всех уравнений системы. Например,<br />
образуя конъюнкцию левых частей всех уравнений<br />
(е) и приравнивая ее логическому значению 1,<br />
выведем уравнение, равносильное уравнению (б).<br />
Попытаемся упростить левые части уравнений (е).<br />
Осуществляя в них вынос за скобки некоторых из<br />
узнаваний и применяя усеченные законы истинности<br />
(а) и вытекающие из них усеченные законы<br />
отрицания, а также используя сокращения с помощью<br />
знаков ∼ и ⊕, перепишем систему (е) в более<br />
компактном виде:<br />
2 2<br />
1 2<br />
1<br />
1<br />
2<br />
1<br />
2<br />
2<br />
2 2<br />
1 2<br />
x x ~ y = 1, ( x ⊕x ) ∨ x x ~ y = 1,<br />
2<br />
1<br />
2<br />
2<br />
1<br />
3<br />
( x ⊕ x )~ y = 1.<br />
1<br />
2<br />
(ж)<br />
Сравнивая систему (ж) с уравнением (в), видим,<br />
что в результате преобразования выражений,<br />
полученных вторым методом, мы пришли в данном<br />
примере к более компактному результату, чем<br />
тот, который был достигнут на базе первого метода<br />
(11 узнаваний буквы против 26). Правда, систему<br />
(ж) можно считать полным описанием заданного<br />
алфавитного оператора только при условии присоединения<br />
к ней системы уравнений (а), а это добавляет<br />
еще 12 узнаваний букв. Заметим, что без<br />
предварительного перехода к описанию алфавитного<br />
оператора F системой уравнений было бы затруднительно<br />
перейти от уравнения (в) к системе<br />
(ж). Таким образом, использование второго метода<br />
неявного представления алфавитного оператора<br />
в данном случае привело, в конечном счете, к<br />
отысканию более простой записи этого оператора.<br />
Практика решения одних и тех же задач обоими методами<br />
показывает, что в зависимости от характера<br />
задачи в одних случаях более предпочтительным<br />
оказывается первый метод, а в других – второй.<br />
Было бы интересно на базе изучения асимптотических<br />
оценок сложности формул выяснить вопрос о
рациональных областях применения двух этих методов.<br />
Представляет интерес и разработка других<br />
методов аналитического представления алфавитных<br />
операторов, в чем-то более предпочтительных<br />
в сравнении с только что описанными методами.<br />
Рассмотрим метод явного задания алфавитного<br />
оператора. Выражения, которые получаются при<br />
явном задании алфавитных операторов, имеют,<br />
как правило, большую суммарную длину, чем выражения<br />
неявного задания, однако они незаменимы<br />
для построения переключательных цепей,<br />
реализующие конечные алфавитные операторы.<br />
Явное задание алфавитного оператора можно рассматривать<br />
как формальную запись переключательной<br />
цепи, воспроизводящей реакции этого<br />
алфавитного оператора. Хранить же информацию<br />
об алфавитных операторах в памяти более удобно в<br />
форме выражений их неявного задания.<br />
Сформулируем и докажем важное утверждение,<br />
которое назовем теоремой о явном задании конечного<br />
алфавитного оператора. Ограничим область изменения<br />
буквенной переменной у значениями b 1 ,<br />
b 2 ,…, b l , то есть опишем ее уравнением<br />
b b b l<br />
1 2 y ∨y ∨ ... y = 1 . (32)<br />
Тогда любой однозначный, вообще говоря, частичный,<br />
алфавитный оператор y = G( x1, x2,..., xm, y)<br />
= 1 ,<br />
заданный в неявной форме уравнением<br />
g(x1 , x2 ,…, xm , y)=1, (33)<br />
может быть представлен в явной форме с помощью<br />
следующей системы уравнений:<br />
1<br />
gx ( 1, x2,..., xm, b1) = y ,<br />
b2<br />
gx ( 1, x2,..., xm, b2) = y ,<br />
............ ......................<br />
bl gx ( , x ,..., x , b ) y .<br />
1 2 m l =<br />
b<br />
(34)<br />
Чтобы доказать только что сформулированное<br />
утверждение, установим, что система, состоящая<br />
из уравнений (32) и (33), равносильна системе<br />
уравнений (32) и (34). Зафиксируем произвольным<br />
образом значения переменных x 1 , x 2 ,…, x m , y.<br />
Предположим, что набор (x 1 , x 2 ,…, x m , y) является<br />
решением системы, состоящей из уравнений (32) и<br />
(33). Отсюда следует существование такого i(1≤i≤l),<br />
что y=b i и g(x 1 , x 2 ,…, x m , b i )=1. В силу однозначности<br />
алфавитного оператора G для любого j≠i (1≤j≤l)<br />
имеем g(x 1 , x 2 ,…, x m , b j )=0. Поэтому все уравнения<br />
системы (34), кроме i-го, обращаются в тождества<br />
вида 0=0, i-е же уравнение обращается в тождество<br />
вида 1=1. Таким образом, набор (x 1 , x 2 ,…, x m , y)<br />
есть также решение системы, состоящей из уравнений<br />
(32) и (34).<br />
Предположим теперь, что набор (x 1 , x 2 ,…, x m , y)<br />
не является решением системы уравнений (32) и<br />
(33). Если y∈{b 1 , b 2 ,…, b l }, то условие (32) не выпол-<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
няется, а вместе с ним не выполняется и система<br />
условий (32) и (34). Если же y=b i (1≤i≤l), то не выполняется<br />
условие (33), поэтому g(x 1 , x 2 ,…, x m , b i )=0.<br />
В результате i-е уравнение системы (34) обращается<br />
в противоречие вида 0=1. Таким образом, набор<br />
(x 1 , x 2 ,…, x m , y) не является также решением системы<br />
уравнений (32) и (34). Следовательно, системы<br />
уравнений (32), (33) и (32), (34) равносильны друг<br />
другу. Теорема доказана. Отметим, что в случае,<br />
когда уравнением (33) задан многозначный в области<br />
значений (b 1 , b 2 ,…, b l )=1 алфавитный оператор<br />
G, системы уравнений (32), (33) и (32), (34) уже не<br />
будут равносильными друг другу. Действительно,<br />
предположим, что существуют два набора (x 1 , x 2 ,…,<br />
x m , b i ) и (x 1 , x 2 ,…, x m , b j ), причем i≠j и 1≤i, j≤l, удовлетворяющие<br />
уравнению (33). Однако ни один из<br />
этих наборов не удовлетворяет системе уравнений<br />
(34). Набор (x 1 , x 2 ,…, x m , b i ) обращает в противоречие<br />
вида 1=0 j-е уравнение системы (34), а набор<br />
(x 1 , x 2 ,…, x m , b j ) – i-е уравнение.<br />
Зададим алфавитный оператор y 1 y 2 …y n =F(x 1 x 2 …<br />
x m ) системой уравнений:<br />
f ( x ,x ,...,x ,y ) = 1,<br />
1 1 2 m 1<br />
f ( x ,x ,...,x ,y ) = 1,<br />
2 1 2 m 2<br />
.............. ....................<br />
f ( x ,x ,...,x ,y ) = .<br />
n 1 2 m n 1<br />
(35)<br />
Каждым из этих уравнений определяется значение<br />
соответствующей буквы выходного слова<br />
y 1 y 2 …y n алфавитного оператора F для входного слова<br />
x 1 x 2 …x m . Тем самым уравнения (35) задают в неявной<br />
форме систему алфавитных операторов:<br />
y1 = F1( xx 1 2...<br />
xm<br />
),<br />
y1 = F2( xx 1 2...<br />
xm<br />
),<br />
............................<br />
y F ( xx... x ),<br />
n = n 1 2 m<br />
(36)<br />
формирующих отдельные буквы выходного слова<br />
алфавитного оператора F.<br />
Переходя описанным выше методом к представлению<br />
в явной форме алфавитных операторов<br />
F1 , F2 , …, Fn , получаем в явной форме аналитическое<br />
задание алфавитного оператора F: Здесь<br />
имеется в виду, что области изменения переменных<br />
yi (1≤i≤n) ограничены множествами букв<br />
Ti = { bi1, bi2 ,..., bil},<br />
где l<br />
i i – число букв в множестве Ti .<br />
Всего в системе (37) содержится l1 +l2 +…+ln уравнений.<br />
Система (37) допускает непосредственное<br />
вычисление букв выходного слова y1y2…yn алфавитного<br />
оператора F по заданным значениям букв<br />
входного слова x1x2…xm . Задание же алфавитного<br />
оператора F в виде системы (35) не дает такой возможности.<br />
В этом случае буквы выходного слова<br />
могут быть найдены только путем решения уравнения.<br />
39
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
b11<br />
f1( x 1,x 2,...,x m ,b11 ) = y , ⎫<br />
1<br />
⎪<br />
b12<br />
f1( x 1,x 2,...,x m ,b12 ) = y 1 , ⎪<br />
⎪<br />
.... .................................. ⎪<br />
b ⎪ 1ln<br />
f1( x 1,x 2,...,x m ,b1l)= y<br />
1 1 , ⎪<br />
b ⎪<br />
21<br />
f2( x 1,x 2,...,x m ,b21 ) = y 2 , ⎪<br />
b ⎪<br />
22<br />
f2( x 1,x 2,...,x m ,b22 ) = y2,<br />
⎪<br />
.......................................<br />
⎪<br />
⎪<br />
b2l ⎪ n<br />
f2( x 1,x 2,...,xm<br />
,b2l ) = y 2 , ⎬ (37)<br />
2<br />
⎪<br />
....................................... ⎪<br />
.... ................................... ⎪<br />
⎪<br />
....................................... ⎪<br />
bn1 ⎪<br />
fn( x 1,x 2,...,x m,bn1) = y ,<br />
n ⎪<br />
b ⎪ n2<br />
fn( x 1,x 2,...,<br />
x m,bn2) = y ,<br />
n ⎪<br />
⎪<br />
......................................<br />
⎪<br />
bnln ⎪<br />
fn( x1,x<br />
2 ,...,x m ,bnl ) = y n .<br />
n ⎪<br />
⎭<br />
Рассмотрим пример. В роли оператора F возьмем<br />
оператор y1y2y3 =F(x1x2 ), который ставит в соответствие<br />
троичным цифрам x1 , x2 их сумму в виде<br />
трехразрядного двоичного кода y1y2y3 . В предыдущем<br />
разделе было получено неявное описание<br />
этого оператора в виде системы (е). Требуется записать<br />
заданный алфавитный оператор F в явном<br />
виде. Значения переменных y1y2y3 – двоичные,<br />
поэтому принимаем T1 =T2 =T3 ={0, 1}. Отправляясь<br />
от уравнений (е) и поочередно подставляя в них<br />
вместо переменных y1 , y2 , y3 значения 0 и 1, после<br />
упрощения получаем следующую систему, задающую<br />
оператор y1y2y3 =F(x1x2 ) в явном виде:<br />
40<br />
0<br />
1<br />
1<br />
1<br />
0<br />
2<br />
1<br />
2<br />
( x ∨x )( x ∨x ∨x ) ∨x ( x ∨ x ) = y ;<br />
2 2<br />
1 2<br />
1<br />
1<br />
0<br />
1<br />
x x = y ; x ( x<br />
0 2<br />
1 2<br />
1<br />
1<br />
1<br />
2<br />
0<br />
2<br />
2<br />
2<br />
2<br />
2<br />
1<br />
2<br />
2<br />
1<br />
2<br />
1<br />
0<br />
2<br />
1 2<br />
1 2<br />
0<br />
2<br />
1<br />
2<br />
1<br />
2<br />
0<br />
2<br />
∨x ) ∨ x x = y ;<br />
1<br />
2<br />
x x ∨x ( x ∨x ) ∨x ( x ∨ x ) = y ;<br />
0<br />
1<br />
1<br />
0<br />
2<br />
2<br />
1<br />
2<br />
2<br />
0<br />
2<br />
2<br />
2<br />
0<br />
1<br />
1 1<br />
1 2<br />
2<br />
1<br />
1<br />
2<br />
0<br />
3<br />
( x1<br />
∨x )( x ∨x ) ∨ x x = y ;<br />
1<br />
3<br />
x ( x ∨x ) ∨( x ∨ x ) x = y .<br />
0<br />
1<br />
(з)<br />
Уравнения (37) можно вывести непосредственно<br />
по таблице алфавитного оператора, минуя его неявную<br />
форму задания (35). С этой целью в левой части<br />
уравнений записываем усеченные СДНФ, составленные<br />
из всех конституэнт единицы, наборы показателей<br />
которых совпадают с входными словами,<br />
такими, что им соответствует одна и та же буква на<br />
заданном месте в выходных словах. В правой части<br />
уравнений пишем переменную, соответствующую<br />
заданному месту в выходных словах, с показателем,<br />
совпадающим с буквой, стоящей на заданном месте.<br />
Например, по табл. 1 для алфавитного оператора<br />
y 1 y 2 y 3 =F(x 1 x 2 ), рассмотренного выше, записываем<br />
следующие уравнения типа (37):<br />
0 0<br />
1 2<br />
0 1<br />
1 2<br />
0 2<br />
1 2<br />
1 0<br />
1 2<br />
1 1<br />
1 2<br />
x x ∨x x ∨x x ∨x x ∨x x ∨x x ∨<br />
0 2<br />
1 2<br />
0 0<br />
1 2<br />
2 0<br />
1 2<br />
2 1<br />
1 2<br />
x x ∨ x x = y<br />
0 2 2 1<br />
; x x = y ;<br />
0 0<br />
1 2<br />
1 1<br />
1 2<br />
0 1<br />
1 2<br />
1<br />
1<br />
1<br />
1<br />
1 2<br />
1 2<br />
x x ∨x x ∨ x x = y<br />
0 2<br />
1 2<br />
2<br />
1 1<br />
1 2<br />
2 0<br />
1 2<br />
2 0<br />
1 2<br />
2<br />
0<br />
2<br />
;<br />
1<br />
2 1<br />
1 2<br />
1 2<br />
1 2<br />
1 2<br />
1 2<br />
x x ∨x x ∨x x2<br />
∨x x ∨ x x = y<br />
x x ∨x x ∨x x ∨x x ∨ x x = y<br />
0 1<br />
1 2<br />
1 0<br />
1 2<br />
1 2<br />
1 2<br />
2 1<br />
1 2<br />
x x ∨x x ∨x x ∨ x x = y<br />
1<br />
3<br />
.<br />
1<br />
2<br />
;<br />
0<br />
3<br />
;<br />
(и)<br />
Из них путем тождественных преобразований<br />
могут быть получены уравнения (з).<br />
Рассмотрим пример вычисления выходного<br />
слова y 1 y 2 …y n алфавитного оператора F по заданному<br />
входному слову x 1 x 2 …x m . Определим двоичную<br />
сумму y 1 y 2 y 3 троичных слагаемых x 1 =1, x 2 =2 с<br />
помощью явного задания алфавитного оператора<br />
y 1 y 2 y 3 =F(x 1 x 2 ). Подставляя в левые части равенств<br />
(з) или (и) заданные значения x 1 , x 2 , x 3 , имеем<br />
y 1 0 =1, y1 1 =0, y2 0 =0, y2 1 =1, y3 0 =0, y3 1 =1. Таким образом,<br />
y 1 y 2 y 3 =011.<br />
4. Декомпозиция уравнений<br />
Одна из важных задач теории <strong>интеллект</strong>а состоит<br />
в том, чтобы научиться производить декомпозицию<br />
уравнений алгебры конечных предикатов,<br />
то есть замену одного сложного уравнения эквивалентной<br />
ему системой более простых уравнений.<br />
Такую декомпозицию ежеминутно производит человек,<br />
выражая свою мысль (сложное уравнение)<br />
в форме последовательности отдельных предложений<br />
(системы более простых уравнений). Декомпозиция<br />
уравнений важна как один из этапов<br />
процесса решения уравнений алгебры конечных<br />
предикатов, поскольку в ряде случаев систему простых<br />
уравнений решать значительно легче, чем эквивалентное<br />
ей одно сложное уравнение. Декомпозиция<br />
уравнений также может служить мощным<br />
средством упрощения и сокращения записи уравнений<br />
алгебры конечных предикатов.<br />
Тот факт, что человек никогда не испытывает<br />
затруднений при выражении мыслей в виде последовательности<br />
сравнительно коротких высказываний,<br />
свидетельствует о том, что мысли обладают<br />
одной важной особенностью: вне зависимости от<br />
уровня своей сложности они допускают выражение<br />
в виде конъюнкции (состоящей, быть может,<br />
из очень большого числа конъюнктивных членов)<br />
достаточно простых высказываний. Указанное<br />
свойство человеческого <strong>интеллект</strong>а назовем конъюнктивностью<br />
<strong>интеллект</strong>а. Очевидно, что свойство<br />
конъюнктивности чрезвычайно ограничивает<br />
класс уравнений алгебры конечных предикатов,<br />
которые могут эффективно решаться человеческим<br />
<strong>интеллект</strong>ом. В свете данного вывода выглядит поразительной<br />
способность человеческого <strong>интеллект</strong>а<br />
эффективно познавать окружающий мир. Мы<br />
полагаем, что эту способность можно удовлетвори-
тельным образом объяснить, лишь признав конъюнктивность<br />
самого физического мира, то есть<br />
наличие такой его структуры, которая допускает<br />
описание в виде конъюнкции достаточно простых<br />
высказываний. Конъюнктивность представляется<br />
нам одним из фундаментальных качеств человеческого<br />
<strong>интеллект</strong>а. Она указывает на особую важность<br />
для теории <strong>интеллект</strong>а задачи декомпозиции<br />
уравнений алгебры конечных предикатов.<br />
Рассмотрим условия, при которых уравнение<br />
А=1 может быть представлено в виде эквивалентной<br />
ему системы уравнений В=1, С=1. Здесь А,<br />
В, С − формулы алгебры конечных предикатов.<br />
Очевидно, такое представление возможно в том и<br />
только том случае, когда<br />
A≡B∧C. (а)<br />
Пусть задана некоторая формула А. Какой надо<br />
взять формулу В, чтобы для нее нашлась формула<br />
С, удовлетворяющая равенству (а)? Необходимое<br />
и достаточное условие состоит в следующем: формула<br />
В должна быть имплицентой для формулы А,<br />
то есть A⊃B≡1 . Иными словами, предикат В можно<br />
выбрать любым, но при условии, что он сохраняет<br />
все единичные значения предиката А. Это же самое<br />
можно сказать и о выборе предиката С: его можно<br />
выбрать любым, но с тем условием, чтобы он был<br />
имплицентой предиката А, то есть чтобы выполнялось<br />
условие A⊃C≡1.<br />
Если же к заданной формуле А подходящая<br />
формула В уже подобрана, то класс допустимых<br />
предикатов С, удовлетворяющих условию (а), сужается.<br />
Теперь, наряду с заранее сформулированными<br />
условиями, при выборе предиката C должно<br />
соблюдаться дополнительное условие C⊃A∨ B ≡1<br />
Действительно, согласно (а) имеем A~BC≡1, что<br />
после тождественных преобразований дает: (A⊃B)<br />
(A⊃C)(C⊃A∨ B )≡1. Таким образом, предикат С<br />
должен выбираться с таким расчетом, чтобы он<br />
был импликантой предиката A∨ B и имплицентой<br />
предиката А. Иными словами, предикат С можно<br />
выбрать любым, но при условии, что он сохраняет<br />
все единичные значения предиката А и все нулевые<br />
значения предиката A∨ B .<br />
Проиллюстрируем сказанное примером. Требуется<br />
представить формулу<br />
A≡y 1 z 0 t 1 ∨x 0 y 1 t 1 ∨x 0 y 1 z 0 ∨x 0 z 0 t 1<br />
в виде конъюнкции возможно более простых формул<br />
В и С. Переменные x, y, z, t заданы в области<br />
{0, 1}. Значения предиката А указаны в таблице 2,<br />
составленной в форме диаграммы Вейча [2]. При<br />
формировании предиката В мы должны сохранить<br />
все единицы предиката А, часть же его нулей можно<br />
заместить единицами с таким расчетом, чтобы<br />
достичь определенного упрощения формулы для<br />
предиката В.<br />
zt<br />
xy 0<br />
0<br />
0<br />
0<br />
0<br />
1<br />
1<br />
1<br />
1<br />
0<br />
zt<br />
xy 0<br />
0<br />
0<br />
0<br />
0<br />
1<br />
1<br />
1<br />
1<br />
0<br />
0<br />
1<br />
1<br />
1<br />
0 1 0 0<br />
1 1 1 0<br />
Таблица 2<br />
1<br />
0<br />
0 1 0 0 A<br />
0 0 0 0<br />
0<br />
1<br />
1<br />
1<br />
1 1 0 0<br />
1 1 1 0<br />
Таблица 3<br />
1<br />
0<br />
0 1 1 0 В<br />
0 0 0 0<br />
Наибольшего упрощения формулы для предиката<br />
В можно достичь, замещая все нули единицами,<br />
но тогда формула В превратится в истину, а<br />
формула С совпадет с формулой А, и в результате<br />
эффективная декомпозиция формулы А не будет<br />
достигнута. В табл. 3 даны значения предиката В,<br />
полученного в результате более умеренного замещения<br />
нулей единицами. Очень сильно упрощать<br />
формулу для предиката В не следует, так как это<br />
может привести к неоправданному усложнению<br />
формулы С. По табл. 3 находим минимальную<br />
ДНФ: B≡y 1 t 1 ∨x 0 z 0 . В табл. 4 переносим все единицы<br />
предиката А (то есть все единицы табл. 2) и все<br />
нули предиката A∨⎺B.<br />
Таблица 4<br />
zt<br />
xy 0<br />
0<br />
0<br />
0<br />
0<br />
1<br />
1<br />
1<br />
1<br />
0<br />
0 1<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
0<br />
1<br />
1 1 1<br />
1 0<br />
Нули надо ставить только в тех ячейках, в которых<br />
в табл. 3 стоят единицы, «лишние» по сравнению<br />
с табл. 2. В ячейках табл. 4, оставшихся незаполненными,<br />
можно проставить нули и единицы<br />
произвольным образом, руководствуясь соображениями<br />
минимизации формулы С. Предикат С<br />
1<br />
1<br />
1<br />
0<br />
41
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
задаем табл. 5, ей соответствует следующая минимальная<br />
ДНФ:<br />
C≡x0t1∨y1z0 .<br />
Таблица 5<br />
42<br />
zt<br />
xy 0<br />
0<br />
0<br />
0<br />
0<br />
1<br />
1<br />
1<br />
1<br />
0<br />
0<br />
1<br />
1<br />
1<br />
1 1 0<br />
1 1 1 0<br />
1<br />
0<br />
1 1 0 С<br />
0 0 0 0<br />
Таким образом:<br />
y 1 z 0 t 1 ∨x 0 y 1 t 1 ∨x 0 y 1 z 0 ∨x 0 z 0 t 1 ≡(y 1 t 1 ∨x 0 z 0 )∧(x 0 t 1 ∨y 1 z 0 ).<br />
Мы совершили декомпозицию уравнения<br />
y 1 z 0 t 1 ∨x 0 y 1 t 1 ∨x 0 y 1 z 0 ∨x 0 z 0 t 1 =1 (б)<br />
на систему более простых уравнений:<br />
1 1 0 0<br />
⎧⎪<br />
yt ∨ x z = 1,<br />
⎨ 0 1 1 0<br />
⎩⎪ xt ∨ yz = 1.<br />
(в)<br />
Заметим, что в данном примере декомпозиция<br />
уравнения привела не только к уменьшению длины<br />
каждого уравнения, но и к упрощению полной его<br />
записи, поскольку общее число узнаваний буквы<br />
в системе уравнений (в) меньше, чем в исходном<br />
уравнении (8 против 12).<br />
Если бы мы в качестве первого сомножителя<br />
выбрали более простую формулу, B′≡y 1 ∨t 1 , что соответствует<br />
табл. 6, то в роли второго сомножителя<br />
вынуждены были бы взять более сложное выражение<br />
(см. табл. 7 и 8):<br />
C′≡x0z0∨y1z0t1∨x0y1t1 .<br />
Такое построение приводит к системе уравнений<br />
1 1<br />
y ∨ t = 1,<br />
⎫⎪<br />
⎬<br />
(г)<br />
0 0 1 0 1 0 1 1<br />
x z ∨yzt ∨ x yt = 1,<br />
⎭⎪<br />
более сложной, чем система (в) (10 узнаваний<br />
буквы против 8).<br />
zt<br />
xy 0<br />
0<br />
0<br />
0<br />
0<br />
1<br />
1<br />
1<br />
1<br />
0<br />
0<br />
1<br />
1<br />
1<br />
0 1 1 0<br />
1 1 1 1<br />
Таблица 6<br />
1<br />
0<br />
1 1 1 1 В’<br />
0 1 1 0<br />
zt<br />
xy 0<br />
0<br />
0<br />
0<br />
0<br />
1<br />
1<br />
1<br />
1<br />
0<br />
0<br />
1<br />
1 0<br />
1<br />
1<br />
1 1 1 0<br />
0 1 0 0<br />
0 0<br />
Таблица 7<br />
Наиболее сложное уравнение в системе (в) имеет<br />
4 узнавания буквы, в системе (г) – 8 узнаваний<br />
буквы. Таким образом, вариант декомпозиции (в)<br />
по обоим показателям удачнее варианта (г). Результат<br />
декомпозиции, вообще говоря, оказывается<br />
различным в зависимости от того, будем ли<br />
мы стремится к минимизации наиболее сложного<br />
уравнения системы или же к минимизации суммарной<br />
сложности уравнений системы. Общий<br />
метод решения этих задач здесь не приводится.<br />
Таблица 8<br />
zt<br />
xy 0 0 1 1<br />
0 1 1 0<br />
0 1 1 0<br />
0<br />
0 1 1 1 0<br />
1<br />
1 0 1 0 0 С’<br />
1<br />
1 0 0 0 0<br />
0<br />
Задачу декомпозиции уравнения можно сформулировать<br />
и по-другому. Требуется заменить<br />
уравнение А=1 равносильной ему системой уравнений<br />
{A1 =1, A2 =1,…, An =1}, причем число n уравнений<br />
нас не лимитирует и может быть принято<br />
достаточно большим. Однако важно, чтобы каждое<br />
уравнение Ai =1 (1≤i≤n) было как можно более простым.<br />
Похожую задачу решает школьный учитель,<br />
излагающий первоклассникам свою мысль в виде<br />
последовательности достаточно простых высказываний.<br />
Метод решения этой задачи продемонстрируем<br />
на примере. Задано уравнение (б). Предикату,<br />
стоящему в левой части этого уравнения,<br />
соответствует табл. 2. Единицы таблицы охватываем<br />
какой-нибудь системой прямоугольников максимального<br />
размера, соответствующих наиболее<br />
коротким простым импликантам (табл. 9).<br />
В результате получаем предикат A1≡y1∨t1 . Крестиками<br />
в таблице отмечены «лишние» ячейки, попавшие<br />
внутрь прямоугольников. Содержательно<br />
эти ячейки будем интерпретировать как признак<br />
неполноты выражения мысли А высказыванием<br />
1<br />
0
A1 . Чем больше крестиков содержится в таблице,<br />
тем менее полно выражена мысль. Далее формируем<br />
предикаты A2≡y1∨z0 , A3≡x0∨y1 , A4≡z0∨t1 , A5≡x0∨t1 ,<br />
A6≡x0∨z0 с таким расчетом, чтобы, во-первых, каждый<br />
из них был возможно более простым и, вовторых,<br />
чтобы с введением очередного предиката<br />
сокращалось число крестиков (таблицы 10÷13).<br />
Таблица 9<br />
Таблица 10<br />
Таблица 11<br />
Таблица 12<br />
После введения предиката A 6 все крестики исчезают<br />
(табл. 14). Это значит, что мы достигли полного<br />
выражения мысли А системой высказываний A 1 ÷A 6 .<br />
Таким образом, мы совершили декомпозицию уравнения<br />
(б) на систему простых уравнений<br />
y 1 ∨t 1 =1, y 1 ∨z 0 =1, x 0 ∨y 1 =1, z 0 ∨t 1 =1, x 0 ∨t 1 =1, x 0 ∨z 0 =1.<br />
Заметим, что в результате декомпозиции суммарное<br />
число узнаваний буквы в системе уравнений<br />
осталось таким же, как и в исходном уравнении<br />
(12 узнаваний буквы).<br />
Таблица 13<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
Таблица 14<br />
Задачи только что рассмотренного типа можно<br />
решать также и чисто аналитически без привлечения<br />
диаграмм Вейча. Рассмотрим пример. Дано<br />
уравнение:<br />
x 1 c x2 a x3 a ∨x1 c x2 a x3 b ∨x1 b x3 b ∨x1 c x2 c x3 b ∨x1 b x2 b x3 c =1.<br />
Переменные x 1 , x 2 , x 3 – троичные со значениями<br />
а, b, c. Требуется заменить это уравнение равносильной<br />
ему системой возможно более коротких<br />
уравнений. Ищем первое уравнение системы, отправляясь<br />
от предиката:<br />
x c<br />
1 x2<br />
ax3 a∨x1 cx2 ax3 b∨x1 bx2 b∨x1 cx2 cx3 b∨x1 bx2 bx3 c∨ ∨x a<br />
1 x2<br />
ax3 a∨x1 ax2 bx3 a∨x1 ax2 cx3 a∨x1 ax2 ax3 b∨ ∨x a<br />
1 x2<br />
bx3 b∨x1 ax2 cx3 b∨x1 ax2 ax3 c∨x1 ax2 bx3 c∨ ∨x a<br />
1 x2<br />
cx3 c∨x1 bx2 ax3 a∨x1 bx2 bx3 a∨x1 bx2 cx3 a∨ x b<br />
1 x2<br />
ax3 c∨x1 bx2 cx3 c∨x1 cx2 bx3 a∨x1 cx2 cx3 a∨ ∨x 1 c x2 b x3 b ∨x1 c x2 a x3 c ∨x1 c x2 b x3 c ∨x1 c x2 c x3 c .<br />
В указанном предикате сохранена вся левая<br />
часть исходного уравнения. Кроме того, в него введены<br />
в роли дополнительных членов конституэнты<br />
единицы для всех наборов (x 1 , x 2 , x 3 ), не являющихся<br />
решениями исходного уравнения. Эти конституэнты<br />
единицы заключены в квадратные скобки.<br />
Производим такую минимизацию полученной<br />
формулы, при которой разрешается использовать<br />
любые дополнительные члены, но не все одновременно.<br />
Все дизъюнктивные члены, не охваченные<br />
квадратными скобками, в процессе минимизации<br />
должны быть использованы обязательно.<br />
После минимизации получаем левую часть первого<br />
уравнения x 1 b ∨x1 c . В процессе минимизации<br />
были использованы следующие дополнительные<br />
конституэнты единицы:<br />
x 1 b x2 a x3 a , x1 b x2 b x3 a , x1 b x2 c x3 a , x1 b x2 a x3 c , x1 b x2 c x3 c ,<br />
x 1 c x2 b x3 a ,<br />
x 1 c x2 c x3 a , x1 c x2 b x3 b , x1 c x2 a x3 c , x1 c x2 b x3 c , x1 c x2 c x3 c .<br />
Далее, отправляясь от того же предиката, ищем<br />
второе уравнение системы. Теперь в процессе минимизации<br />
не должны использоваться все конституэнты<br />
единицы из только что приведенного перечня.<br />
Все те конституэнты единицы, которые не<br />
приведены в этом перечне и охвачены квадратными<br />
скобками, могут использоваться или не использоваться<br />
по нашему усмотрению. Получаем левую<br />
часть второго уравнения x 1 b ∨x2 a ∨x2 c . При минимизации<br />
не использовались из нашего перечня сле-<br />
43
М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко<br />
дующие конституэнты единицы: x 1 c x2 b x3 a , x1 c x2 b x3 b ,<br />
x 1 c x2 b x3 c . Повторяем процесс минимизации для еще<br />
более сокращенного перечня конституэнт единицы:<br />
44<br />
x b<br />
1 x2<br />
ax3 a , x1<br />
bx2 bx3 a , x1<br />
bx2 cx3 a , x1<br />
bx2 ax3 c ,<br />
x b<br />
1 x2<br />
cx3 c , x1<br />
cx2 cx3 a , x1<br />
cx2 ax3 c , x1<br />
cx2 cx3 c .<br />
Получаем левую часть третьего уравнения<br />
x 1 c x2 a ∨x3 b ∨x3 c . Перечень оставшихся конституэнт<br />
единицы становится еще меньшим:<br />
x 1 b x2 a x3 c , x1 b x2 c x3 c , x1 c x2 a x3 c , x1 c x2 c x3 c .<br />
Наконец, получаем левую часть четвертого<br />
уравнения x 1 b x2 b ∨x3 a ∨x3 b . Перечень конституэнт<br />
единицы превращается в пустое множество, что<br />
служит признаком окончания процесса построения<br />
системы уравнений. Итак, мы заменили исходное<br />
уравнение<br />
x 1 c x2 a x3 a ∨x1 c x2 a x3 b ∨x1 b x2 b ∨x1 c x2 c x3 b ∨x1 b x2 b x3 c =1 (д)<br />
системой равносильных ему уравнений:<br />
x b<br />
1 ∨x1 c =1, x1<br />
b∨x2 a∨x2 c =1, x1<br />
cx2 a∨x3 b∨x3 c =1,<br />
x b<br />
1 x2<br />
b∨x3 a∨x3 b =1.<br />
Суммарное число букв в системе осталось почти<br />
тем же, что и в исходном уравнении (13 узнаваний<br />
буквы против 14), зато максимальная сложность<br />
уравнений резко уменьшилась (с 14 до 4 узнаваний<br />
буквы).<br />
Рассмотрим один специальный, но важный метод<br />
декомпозиции уравнений алгебры конечных<br />
предикатов, основанный на применении теоремы<br />
о конъюнктивном разложении. Пусть требуется<br />
произвести декомпозицию произвольно выбранного<br />
уравнения f(x 1 , x 2 ,…, x n )=1, где переменная x 1<br />
определена на множестве букв {a 1 , a 2 ,…, x k }. Тогда<br />
согласно первому следствию теоремы о конъюнктивном<br />
разложении имеем:<br />
f(x 1 , x 2 ,…, x n )≡( x a<br />
1 1 ∨f(a 1 , x 2 ,…, x n ))…<br />
( x a k<br />
1 ∨f(a k , x 2 ,…, x n )).<br />
Таким образом, исходное уравнение заменяется<br />
системой, состоящей из k уравнений<br />
a<br />
1 1 2<br />
1 x ∨ f ( a , x ,..., x )= 1,<br />
a<br />
1 k 2 n<br />
k x ∨ f ( a , x ,..., x )= 1.<br />
n<br />
(е)<br />
При желании процесс декомпозиции можно<br />
продолжить, раскладывая левую часть каждого из<br />
уравнений (е) по переменной x 2 и т.д.<br />
Для иллюстрации метода приведем декомпозицию<br />
уравнения (д), рассмотренного в предыдущем<br />
примере. Производим разложение левой части<br />
уравнения (д) по переменной x 1 . В результате получаем<br />
следующую систему уравнений:<br />
a b b b c c a a a b c b<br />
1 1 3 2 3 1 2 3 2 3 2 3<br />
x = 1, x ∨x ∨ x x = 1, x ∨x x ∨x x ∨ x x = 1.<br />
Согласно закону отрицания:<br />
a b c<br />
1 1 1<br />
b a c<br />
1 1 1<br />
c a b<br />
1 1 1<br />
x ≡ x ∨ x , x ≡ x ∨ x , x ≡ x ∨ x .<br />
Окончательно имеем:<br />
x 1 b ∨x1 c =1, x1 a ∨x1 c ∨x3 b ∨x2 b x3 c =1,<br />
x 1 a ∨x1 b ∨x2 a x3 a ∨x2 a x3 b ∨x2 c x3 b =1.<br />
Суммарное число предикатов узнавания буквы<br />
в полученной системе несколько увеличилось<br />
по сравнению с тем, которое было в исходном<br />
уравнении (15 узнаваний буквы против 14), зато<br />
сложность каждого уравнения уменьшилась (соответственно<br />
2, 5 и 8 узнаваний буквы против 14).<br />
Продолжив разложение второго и третьего уравнений<br />
по переменным x 2 и x 3 , можно добиться еще<br />
большего упрощения отдельных уравнений, однако<br />
их число при этом увеличится.<br />
Рассмотренный выше процесс замены уравнения<br />
равносильной ему системой более простых<br />
уравнений назовем эквивалентной декомпозицией.<br />
Наряду с нею возможна еще и неэквивалентная<br />
декомпозиция уравнений. Идею неэквивалентной<br />
декомпозиции поясним на примере. Дано уравнение:<br />
x 1 b x2 c x3 b ∨(x1 b x2 c x3 b ∨x1 c )(x2 c x3 b ∨x2 a )=1.<br />
Вводим обозначения для предикатов t1 =x c<br />
2 x3<br />
b<br />
и t2 =x b<br />
1 t1 , входящих несколько раз в исходное<br />
уравнение. После подстановки имеем t2∨(t2∨x c<br />
1 )<br />
(t1∨x a<br />
2 )=1. Таким образом, мы заменили исходное<br />
уравнение системой, состоящей из трех более простых<br />
уравнений:<br />
t1 =x c<br />
2 x3<br />
b , t2 =x b<br />
1 t1 , t2∨(t2∨x c<br />
1 )(t1∨x a<br />
2 )=1.<br />
Наиболее сложное из этих уравнений имеет 2<br />
узнавания буквы и 3 вхождения логических переменных<br />
против 10 узнаваний буквы в исходном<br />
уравнении. Полученная система уравнений, строго<br />
говоря, неэквивалентна исходному уравнению,<br />
так как в ней содержатся дополнительные логические<br />
переменные t1 и t2 . Однако если эти переменные<br />
рассматривать исключительно как промежуточные,<br />
воздерживаясь от их использования в роли<br />
независимых переменных, то мы обнаружим, что<br />
система уравнений связывает переменные x1 , x2 , x3 тем же самым отношением, что и исходное уравнение.<br />
Рассмотрим один специальный, но важный<br />
способ введения промежуточных логических переменных<br />
в уравнение алгебры конечных предикатов.<br />
Пусть задано произвольное уравнение<br />
f(x1 , x2 ,…, xn )=1, (ж)<br />
где переменная x 1 определена на множестве букв<br />
{a 1 , a 2 ,…, x k }. Тогда согласно первому следствию<br />
теоремы о дизъюнктивном разложении имеем:
f(x 1 , x 2 , …, x n )≡ x a<br />
1 1 f(a 1 , x 2 , …, x n )∨…∨<br />
Обозначим<br />
∨ x a k<br />
1 f(a k , x 2 , …, x n )).<br />
f(a 1 , x 2 , …, x n )=t 1 ,<br />
..…..…………… (з)<br />
f(a k , x 2 ,…, x n )=t k .<br />
После замены уравнение (ж) запишетcя в виде:<br />
a a<br />
ak 1 1 2 1 k 1<br />
1 2 tx ∨tx ∨... ∨ t x = 1.<br />
(и)<br />
Таким образом, мы заменили уравнение (ж) системой<br />
уравнений (з) и (и). Каждое из уравнений<br />
(з) в случае надобности также можно заменить некоторой<br />
системой уравнений, производя разложение<br />
по переменной x2 , и т. д.<br />
Рассмотрим пример декомпозиции уравнения<br />
только что описанным методом. Дано уравнение:<br />
(xa 1 ∨x1 b )x2 bx3 c∨x1 bx2 ax3 b∨x1 c =1. (к)<br />
Производим разложение по переменной x1 . Записываем<br />
уравнение (и):<br />
t1x a<br />
1 ∨t2x b<br />
1 ∨t3x c<br />
1 =1.<br />
Согласно (в):<br />
t1 =(aa∨ab )x b<br />
2 x3<br />
c∨abx2 ax3 b∨ac≡x2 bx3 c ,<br />
t2 =(ba∨bb )x b<br />
2 x3<br />
c∨bbx2 ax3 b∨bc≡x2 bx3 c∨x2 ax3 b ,<br />
t3 =(ca∨cb )x b<br />
2 x3<br />
c∨cbx2 ax3 b∨cc≡1. Таким образом, уравнение (к) мы заменили системой<br />
уравнений:<br />
t1xa 1 ∨t2x b<br />
1 ∨t3x c<br />
1 =1, t1 =x b<br />
2 x3<br />
c , t2 =t1∨x a<br />
2 x3<br />
b . (л)<br />
Исходное уравнение (к) содержит 8 узнаваний<br />
буквы, наиболее же сложное из уравнений (л)<br />
– только 3 узнавания буквы и 2 вхождения логических<br />
переменных. Каждое уравнение системы<br />
проще, чем исходное уравнение, однако вместе<br />
взятые уравнения системы (л) сложнее (7 узнаваний<br />
буквы и 5 вхождений логических переменных<br />
против 8 узнаваний буквы в исходном уравнении).<br />
При определении сложности уравнений мы условно<br />
приравняли одно вхождение логической переменной<br />
к одному узнаванию буквы.<br />
Выводы<br />
Описанными выше методами широко пользуются<br />
люди в своей <strong>интеллект</strong>уальной деятельности.<br />
Когда какое-то понятие (то есть формулу)<br />
нам приходится использовать многократно, то мы<br />
урАВНЕНИЯ ТЕОрИИ ИНТЕЛЛЕКТА<br />
вводим специальный термин (то есть обозначение<br />
формулы), его называющий, после чего для<br />
краткости в высказываниях употребляем уже не<br />
сами понятия, а только лишь соответствующие им<br />
термины. Очевидно, что метод неэквивалентной<br />
декомпозиции будет эффективным не для любых<br />
уравнений, а лишь для тех из них, у которых<br />
имеются черты иерархической структуры. Можно<br />
предположить, что уравнения именно такого типа<br />
будут наиболее важны для теории <strong>интеллект</strong>а. Об<br />
этом свидетельствует тот факт, что люди в своей<br />
<strong>интеллект</strong>уальной деятельности чрезвычайно<br />
широко пользуются терминологией, а это значит,<br />
что наши мысли имеют иерархическую структуру,<br />
построены по блочному принципу. Это свойство<br />
<strong>интеллект</strong>а человека назовем иерархичностью <strong>интеллект</strong>а.<br />
Весьма вероятно, что и окружающий<br />
нас физический мир также имеет иерархическую<br />
структуру, иначе было бы трудно понять, каким<br />
образом нам удается успешно его познавать. Мы<br />
ожидаем, что прием неэквивалентной декомпозиции<br />
уравнений найдет применение при решении<br />
многих задач теории <strong>интеллект</strong>а.<br />
Список литературы: 1. Бондаренко, М.Ф. Об алгебре конечных<br />
предикатов [Текст] / М.Ф. Бондаренко, Ю.П.<br />
Шабанов-Кушнаренко, С.Ю. Шабанов-Кушнаренко //<br />
Бионика <strong>интеллект</strong>а. – <strong>2011</strong>. – <strong>№</strong> 3. – С. 3-13. 2. Справочник<br />
по цифровой вычислительной технике. – К.: Изд-во<br />
«Техніка», 1979. – 511 c.<br />
Поступила в редколлегию 12.09.<strong>2011</strong><br />
УДК 519.7<br />
Рівняння теорії інтелекту / Бондаренко М.Ф.,<br />
Шабанов-Кушнаренко Ю.П. // Біоніка інтелекту: наук.техн.<br />
журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 30-45.<br />
Розвивається спеціалізований математичний апарат<br />
для ефективного моделювання роботи механізмів інтелекту<br />
людини – алгебри предикатів і предикативних<br />
операцій. Запропоновані способи запису предикативних<br />
рівнянь, а також методи їх аналітичного розв’язання.<br />
Бібліогр.: 2 найм.<br />
UDC 519.7<br />
The intellect theory equations / M.f. Bondarenko, Yu.P.<br />
Shabanov-Kushnarenko // Bionics of Intelligense: Sci. Mag.<br />
– <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 30-45.<br />
The specialized mathematical apparatus develops for the<br />
effective design of the human intellect mechanisms work - algebra<br />
of predicates and predicate operations. The methods of<br />
the predicate equalizations record, and also methods of their<br />
analytical decision, are offered.<br />
Ref.: 2 items.<br />
45
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 47–49 хНурэ<br />
УДК 65.012.23 + 519.766.2<br />
46<br />
Введениие<br />
Широкое внедрение процессно-ориентированных<br />
систем на сегодняшний день связано с тем,<br />
что они позволяют формализовать знания о протекании<br />
бизнес-процессов на предприятиях и в организациях.<br />
В то же время, построение формальных<br />
моделей бизнес-процессов требует значительных<br />
временных и материальных затрат, а также оно<br />
подвержено влиянию человеческого фактора, поскольку<br />
часто проводится во взаимодействии с<br />
экспертами и исполнителями, цели которых могут<br />
не совпадать с целями моделируемых бизнеспроцессов<br />
и общими целями предприятия. Данное<br />
противоречие может приводить к расхождению<br />
между реальным бизнес-процессом и его разработанной<br />
моделью. Это может приводить к построению<br />
неадекватных моделей бизнес-процессов.<br />
Один из важных подходов к решению данной<br />
проблемы реализуется на основе методологии <strong>интеллект</strong>уального<br />
анализа бизнес-процессов. Интеллектуальный<br />
анализ направлен на получение моделей<br />
реально выполняющихся бизнес-процессов<br />
на основе исследования журналов регистрации событий<br />
таких процессов (файлов - логов).<br />
Такой анализ данных особенно важен в тех случаях,<br />
когда регистрируется происходящая последовательность<br />
событий, однако процесс частично либо<br />
полностью не формализован, т.е. исполнители имеют<br />
возможность принимать решения о порядке дальнейшего<br />
прохождения процесса, исходя из имеющейся<br />
у них локальной информации и с учетом своих<br />
знаний о правилах работы бизнес-процесса. Фактически,<br />
в таких процессах реализуются неявные связи<br />
между процедурами БП. Указанные связи основаны<br />
на знаниях, не входящих в описание процесса, могут<br />
приводить к отклонениям от его документированного<br />
поведения и при этом практически не распознаются<br />
на основе существующих подходов в области<br />
<strong>интеллект</strong>уального анализа бизнес-процессов.<br />
В настоящее время разработаны алгоритмы построения<br />
моделей бизнес-процессов на основе<br />
анализа журналов регистрации событий и [1-4]. В<br />
то же время, разработанные подходы не позволяют<br />
до конца решить проблему выявления неявных<br />
связей и, с их помощью, конструкций неявного<br />
выбора в структуре бизнес-процессов.<br />
Н.В.Голян 1 , Ю.П. Шабанов-Кушнаренко 2<br />
1, 2 ХНУРЭ, Харьков, Украина, veragolyan@yandex.ru<br />
ПРЕДИКАТНЫЕ МОДЕЛИ НЕЯВНЫХ СВЯЗЕЙ<br />
МЕЖДУ ПРОЦЕДУРАМИ БИЗНЕС-ПРОЦЕССА<br />
Произведен анализ извлеченной информации из журналов регистрации событий бизнес-процесса с<br />
тем, чтобы формализовать реальное поведение БП. Такой анализ данных особенно важен в тех случаях,<br />
когда регистрируется происходящая последовательность событий, т.е. исполнители имеют возможность<br />
принимать решение о порядке дальнейшего прохождения процесса.<br />
БИЗНЕС-ПРОЦЕСС, ПРОЦЕДУРА, ЛОГИЧЕСКАЯ СЕТЬ, ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ<br />
1. Постановка задачи<br />
Неявные зависимости в бизнес-процессах отражают<br />
непрямые причинно-следственные связи<br />
между процедурами и обладают свойствами связности,<br />
достижимости и не обладают свойством последовательности.<br />
В случае неявных зависимостей<br />
между рассматриваемыми процедурами бизнеспроцесса<br />
существует цепочка других процедур (непрямая<br />
связь), что и затрудняет выявление таких<br />
фрагментов.<br />
Все вышеизложенное определяет важность формализации<br />
неявных связей между процедурами.<br />
Задача авторов статьи состоит в получении формальных<br />
моделей неявных связей между процедурами<br />
бизнес-процесса, которые бы обладали следующими<br />
особенностями:<br />
– отражение параллельного и последовательного<br />
выполнения текущего фрагмента бизнеспроцесса<br />
и остальных его подпроцессов;<br />
– охват необходимого и достаточного набора<br />
свойств неявных связей, позволяющих выделить<br />
их на основе анализа последовательности процедур<br />
выполнившегося бизнес-процесса.<br />
2. Разработка предикатных моделей неявных<br />
связей между процедурами<br />
Разработка метода идентификации ситуаций<br />
неявного выбора требует формализации основных<br />
признаков таких ситуаций, а именно формализации<br />
неявных связей различного вида, что требует<br />
разработки моделей представления неявных связей<br />
между процедурами.<br />
Данный подраздел посвящен разработке предикатных<br />
моделей представления неявных связей<br />
между процедурами бизнес-процесса на основе<br />
алгебро-логической модели обобщенной конструкции<br />
неявного выбора. Данная модель объединяет<br />
четыре схемы взаимодействия конструкции<br />
неявного выбора с другими фрагментами<br />
бизнес-процесса. Поэтому далее будут рассмотрены<br />
и формализованы в виде предикатных моделей<br />
4 типа неявных связей между процедурами.<br />
Реализация моделей неявных связей базируется<br />
на предикатной модели представления непрямой<br />
связи между процедурами в журнале регистрации<br />
событий бизнес-процесса.
Рассмотрим и доказательно формализуем неявные<br />
связи всех четырех типов.<br />
Неявная связь типа 1: выходы внешнего подпроцесса<br />
– входы анализируемого фрагмента.<br />
Данный тип связи основан на взаимодействиях<br />
вида: выход внешнего подпроцесса – входы конечной<br />
процедуры P і и промежуточной цепочки процедур<br />
P 2 , …, P n . (рис. 1). В соответствии с данной<br />
схемой взаимодействия сформулируем набор условий,<br />
определяющих связь данного типа:<br />
1) Между начальной P 1 и конечной P n процедурами<br />
исследуемого фрагмента отсутствует явная<br />
связь.<br />
Рис. 1. Неявная связь типа 1: выходы внешнего<br />
подпроцесса – входы анализируемого фрагмента<br />
2) У начальной процедуры фрагмента P 1 в полученной<br />
на основании анализа журнала операций<br />
модели имеется только один выход, который является<br />
входом для процедуры P j , j = 2, n-1.<br />
3) У процедуры P j имеется второй вход, который<br />
является общим для конечной процедуры P n .<br />
4) Общий для процедур P j и P n вход является результатом<br />
работы процедуры P k , которая относится<br />
к иной ситуации данного бизнес-процесса или<br />
иному подпроцессу. Отметим, что разделение по<br />
ситуациям или подпроцессам заложено в структуре<br />
журнала регистрации событий, поскольку в таком<br />
журнале обычно существует графа «Код ситуации».<br />
5) Внешняя по отношению к анализируемому<br />
фрагменту процедура P k (обобщая – весь внешний<br />
подпроцесс) не связана с начальной процедурой P 1<br />
по входу-выходу.<br />
6) Между процедурами P 1 и P n имеется непрямая<br />
связь.<br />
При выполнении рассмотренных шести условий<br />
между процедурами P 1 и P n имеется неявная<br />
связь первого типа.<br />
Подведя итог изложенному, можно сказать, что<br />
данная связь позволяет идентифицировать конструкцию<br />
неявного выбора в полученной в результате<br />
анализа журнала регистрации событий модели<br />
бизнес-процесса. Выявление такой конструкции<br />
происходит тогда, когда в анализируемом фрагмен-<br />
ПрЕДИКАТНЫЕ МОДЕЛИ НЕЯВНЫх СВЯЗЕЙ МЕЖДу ПрОЦЕДурАМИ БИЗНЕС-ПрОЦЕССА<br />
те модели имеется такая промежуточная последовательность<br />
из одной или более процедур, что вход<br />
данной последовательности одновременно со входом<br />
конечной процедуры фрагмента определяется<br />
выходом внешнего подпроцесса. Также конечная<br />
процедура фрагмента имеет второй вход, тогда по<br />
этому второму входу имеется неявная связь между<br />
начальной и конечной процедурами.<br />
Неявная связь типа 2: докажем наличие неявной<br />
связи на основе упрощенной схемы взаимодействия<br />
конструкции неявного выбора с другими<br />
фрагментами бизнес-процесса на базе связи по<br />
входу в P n . Упрощение заключается в том, что последовательность<br />
процедур заменяется<br />
одной процедурой P n , а внешний подпроцесс заменяется<br />
отдельной процедурой P 2 . Данное упрощение<br />
не влияет на суть доказательства, поскольку<br />
представление части процесса в виде последовательности<br />
процедур либо единой обобщенной процедуры,<br />
реализующей весь подпроцесс, зависит от<br />
степени детализации модели (рис. 2).<br />
Рис. 2. Неявная связь типа 2: выходы анализируемого<br />
фрагмента – входы внешнего подпроцесса<br />
Исходя из представленных на рис. 2 взаимодействий,<br />
сформулируем набор условий, определяющих<br />
неявную связь данного типа:<br />
1) Между начальной P 1 и конечной P n процедурами<br />
исследуемого фрагмента отсутствует явная связь.<br />
2) У начальной процедуры фрагмента P 1 в полученной<br />
на основании анализа журнала операций<br />
модели имеется два выхода (или больше – в общем<br />
случае), которые являются входами:<br />
– для начальной процедуры P j , j = 2, n-1 внешнего<br />
подпроцесса;<br />
– для процедуры P 2 текущего фрагмента бизнеспроцесса;<br />
3) Между процедурами P 1 и P n имеется непрямая<br />
связь в смысле выражения.<br />
4) Результаты выполнения процедуры P n-1 используются<br />
как входные для процедур P k и P n .<br />
5) Конечная процедура внешнего подпроцесса<br />
P k не связана непрямой связью с начальной процедурой<br />
P n . Точнее, такая связь в общем случае не<br />
гарантируется.<br />
При выполнении рассмотренных пяти условий<br />
между процедурами P 1 и P k имеется неявная связь<br />
второго типа.<br />
47
Н.В.Голян, Ю.П. Шабанов-Кушнаренко<br />
Набор сформулированных условий позволяет<br />
идентифицировать конструкцию неявного выбора<br />
в полученной в результате анализа журнала<br />
регистрации событий модели бизнес-процесса в<br />
том случае, если в текущем фрагменте модели существует<br />
два (в общем случае более двух) варианта<br />
протекания процесса, которые завершаются процедурами<br />
P k и P n . Их выполнение зависит от того,<br />
по какой цепочке — или по внешнему<br />
подпроцессу пойдет реализация бизнеспроцесса<br />
после выполнения начальной процедуры.<br />
Тогда, если при реальном исполнении процесса,<br />
отраженном в журнале регистрации событий, выполнена<br />
процедура P n , значит произошла реализация<br />
цепочки .<br />
Неявная связь типа 3: внешний подпроцесс выполняется<br />
параллельно, влияя на последовательность<br />
(рис. 3).<br />
48<br />
Рис. 3. Неявная связь типа 3: внешний подпроцесс<br />
выполняется параллельно<br />
На основании анализа представленной схемы<br />
сформулируем набор условий, определяющих связи<br />
данного типа:<br />
– выход начальной процедуры P 1 – вход в промежуточный<br />
фрагмент ;<br />
– выход начальной процедуры внешнего подпроцесса<br />
P i – вход в промежуточный фрагмент<br />
;<br />
– выход процедуры P n-1 – вход в конечную процедуру<br />
внешнего подпроцесса P k $<br />
– выход последней процедуры промежуточной<br />
последовательности текущего фрагмента P n-1 вход в<br />
конечную процедуру внешнего подпроцесса P k .<br />
На основании анализа представленной схемы<br />
сформулируем набор условий, определяющих связи<br />
данного типа:<br />
1) Между начальной P 1 и конечной P n процедурами<br />
исследуемого фрагмента отсутствует явная<br />
связь.<br />
2) Между начальной P 1 и конечной P n процедурами<br />
исследуемого фрагмента существует непрямая<br />
связь .<br />
3) У первой процедуры P 2 промежуточной последовательности<br />
имеется два входа:<br />
– из начальной процедуры P 1 текущего фрагмента<br />
бизнес-процесса внешнего подпроцесса;<br />
– из начальной процедуры P i внешнего подпроцесса.<br />
4) Результаты выполнения процедуры P n-1 используются<br />
как входные для процедур P k и P n-1 .<br />
5) Конечная процедура P k внешнего подпроцесса<br />
не связана непрямой связью с начальной процедурой<br />
P 1 . Точнее, такая связь в общем случае не<br />
гарантируется.<br />
При выполнении рассмотренных пяти условий<br />
между процедурами P i и P k имеется неявная связь<br />
третього типа.<br />
Приведенные выше условия позволяют идентифицировать<br />
конструкцию неявного выбора третьего<br />
типа в том случае, если параллельно текущему<br />
фрагменту бизнес-процесса выполняется внешний<br />
подпроцесс, что приводит к возникновению конструкции<br />
с двумя входными процедурами и двумя<br />
выходными, определяющими два варианта протекания<br />
процесса. Выполнение того или иного варианта<br />
зависит от того, по какой цепочке – или<br />
по внешнему подпроцессу пойдет реализация<br />
бизнес-процесса после выполнения начальных<br />
процедур . Тогда, если в журнале регистрации событий<br />
отражено выполнение процедуры, то произошло<br />
выполнение цепочки и, следовательно,<br />
между процедурами имеется неявная связь.<br />
Неявная связь типа 4: внешний подпроцесс выполняется<br />
параллельно и в зависимости от последовательности<br />
.<br />
Данный тип связи является детализацией взаимодействий,<br />
представленных на рис. 2 и основан<br />
на параллельном выполнении рассматриваемого<br />
фрагмента и внешнего подпроцесса, причем запуск<br />
внешнего подпроцесса определяется текущим<br />
фрагментом, а его завершение влияет на выполнение<br />
текущего фрагмента (рис. 4):<br />
– выход процедуры P 2 – вход в начальную процедуру<br />
внешнего подпроцесса P i ;<br />
– выход конечной процедуры внешнего подпроцесса<br />
P k – вход в последнюю процедуру промежуточной<br />
последовательности текущего фрагмента P n -1 .<br />
На основании анализа изображенной выше схемы<br />
сформулируем набор условий, позволяющих<br />
формализовать связи данного типа:<br />
1) Между начальной P 1 и конечной P n процедурами<br />
исследуемого фрагмента отсутствует явная<br />
связь.<br />
2) Между начальной P 1 и конечной P n процедурами<br />
исследуемого фрагмента существует непрямая<br />
связь через последовательность .<br />
3) У первой процедуры P 2 промежуточной последовательности<br />
имеется два выхода:<br />
– в последующую процедуру текущего фрагмента<br />
бизнес-процесса;<br />
– в начальную процедуру P i внешнего подпроцесса.
Рис. 4. Неявная связь типа 4: внешний подпроцесс<br />
выполняется параллельно<br />
4) Результаты выполнения процедуры внешнего<br />
подпроцесса используются как входные для<br />
процедуры P k .<br />
5) Конечная процедура внешнего подпроцесса<br />
не связана непрямой связью с начальной процедурой.<br />
Точнее, такая связь в общем случае не гарантируется.<br />
При выполнении рассмотренных пяти условий<br />
между процедурами P i и P k имеется неявная связь<br />
четвертого типа.<br />
Полученные в данном подразделе предикатные<br />
модели неявных связей между процедурами<br />
отражают различные варианты параллельного и<br />
последовательного выполнения текущего фрагмента<br />
бизнес-процесса, отражающего текущую<br />
ситуацию, с другими подпроцессами. Указанные<br />
модели позволяют формально представить скрытые<br />
знания о взаимосвязях между процедурами и,<br />
таким образом, повысить адекватность модели,<br />
получаемой в результате анализа журналов регистрации<br />
событий бизнес-процесса.<br />
Выводы<br />
Неявные зависимости в бизнес-процессах отражают<br />
непрямые причинно-следственные связи<br />
между процедурами и обладают свойствами связности,<br />
достижимости и не обладают свойством последовательности.<br />
В случае неявных зависимостей<br />
между рассматриваемыми процедурами бизнеспроцесса<br />
существует цепочка других процедур (непрямая<br />
связь), что и затрудняет выявление таких<br />
фрагментов.<br />
На примерах работы построенных логических<br />
сетей можно видеть, что в большей части тактов<br />
вычисляется только один предикат, что говорит о<br />
том, что эти логические сети работают практически<br />
в последовательном режиме и не имеют преимущества<br />
над моделями этих же процессов в виде многоместных<br />
предикатов. Однако если учесть, что в<br />
рассмотренных примерах охватывались только небольшие<br />
ключевые фрагменты реальных бизнес-<br />
ПрЕДИКАТНЫЕ МОДЕЛИ НЕЯВНЫх СВЯЗЕЙ МЕЖДу ПрОЦЕДурАМИ БИЗНЕС-ПрОЦЕССА<br />
процессов, а полные модели часто содержат много<br />
процедур, которые можно выполнять одновременно,<br />
то тогда преимущество моделей в виде систем<br />
бинарных уравнений станет очевидным.<br />
Практический аспект полученных результатов<br />
заключается в следующем. Выполнение логической<br />
сети, реализующей конструкции неявного<br />
выбора, обеспечивает возможность для получения<br />
журнала регистрации событий с отражением неявных<br />
взаимосвязей между процедурами, что создает<br />
условия для разработки методов выявления конструкций<br />
неявного выбора.<br />
Список литературы: 1. R. Agrawal, D. Gunopulos, and F. Leymann.<br />
Mining Process Models from Workflow Logs [Текст]<br />
/ In Sixth International Conference on Extending Database<br />
Technology. – 1998. – 469-483 pages. 2. W.M.P. van der<br />
Aalst, B.F. van Dongen, J. Herbst, L. Maruster, G. Schimm,<br />
and A.J.M.M. Weijters [Текст] / Workflow Mining: A Survey<br />
of Issues and Approaches. Data and Knowledge Engineering,<br />
47(2):237–2003. – 267 pages. 3. A.K.A. de Medeiros, W.M.P.<br />
van der Aalst, and A.J.M.M. Weijters. Workflow Mining: Current<br />
Status and future Directions. In R. Meersman, Z. Tari,<br />
and D.C. Schmidt, editors [Текст] // On The Move to Meaningful<br />
Internet Systems 2003: CoopIS, DOA, and ODBASE.<br />
Volume 2888 of Lecture Notes in Computer Science. Pages<br />
389 -406. Springer-Verlag, Berlin, 2003. 4. W.M.P. van der<br />
Aalst, A.J.M.M. Weijters, and L. Maruster. Workflow Mining:<br />
Discovering Process Models from Event Logs. [Текст]/ IEEE<br />
Transactions on Knowledge and Data Engineering. – 2004. –<br />
16(9):1128-1142 pages.<br />
Поступила в редколлегию 20.09.<strong>2011</strong><br />
УДК 65.012.23 + 519.766.2<br />
Предикативні моделі неявних зв'язків між процедурами<br />
бізнес-процесу / Н.В. Голян, Ю.П. Шабанов-Кушнаренко<br />
// Біоніка інтелекту: наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3<br />
(<strong>77</strong>). – С. 46-49.<br />
Розроблено ефективні методи інтелектуального аналізу<br />
бізнес-процесів, зокрема, методи виявлення фрагментів<br />
таких процесів. Також проведено аналіз витягнутої<br />
інформації з журналів реєстрації подій бізнес-процесу<br />
з тим, щоб формалізувати реальну поведінку БП. Такий<br />
аналіз даних особливо важливий у тих випадках, коли<br />
реєструється відбувається послідовність подій, тобто виконавці<br />
мають можливість приймати рішення про порядок<br />
подальшого проходження процесу<br />
Іл.: 4. Бібліогр.: 4 найм.<br />
УДК 65.012.23 + 519.766.2<br />
Predicate models of non-obvious cjnnections between procedures<br />
of business prosses / N.V. Golyan, Ю.П. Шабанов-<br />
Кушнаренко// Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>. –<br />
<strong>№</strong> 3 (<strong>77</strong>). –P. 46-49.<br />
The effective methods of intellectual analysis of business<br />
processes are worked out, in particular, methods of exposure<br />
of fragments of such processes. The analysis of prolate information<br />
is also conducted from the magazines of registration of<br />
events to the business process with that, to formalize the real<br />
behavior of БП. Such analysis of data is especially important<br />
in those cases, when registered there is a sequence of events,<br />
id est performers have the opportunity to make decision about<br />
the order of the further passing of process.<br />
fig.: 4. Ref.: 4 items.<br />
49
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 50–53 хНурэ<br />
УДК 519.7<br />
50<br />
Введение<br />
Как известно, отношение – это универсальное<br />
средство формального описания структуры<br />
любых объектов, их свойств, связей между ними,<br />
действий над нами, а также любых информационных<br />
процессов. В формульном виде отношения<br />
записываются с помощью предикатов [1]. Любой<br />
предикат, описывающий конечный процесс в вычислительной<br />
технике, можно записать в виде таблицы.<br />
В статье решается вопрос перехода от таблицы<br />
предиката к логической схеме, электронная<br />
реализация которой будет решать уравнения вида<br />
P( x1, x2,..., xm) = 1 .<br />
Ниже представлен алгоритм расслоения предиката<br />
P( x1, x2,..., xm) , заданного на A1 × A2 × ... × Am .<br />
При этом размерность m области A1, A2,..., Am задания<br />
аргументов x1, x2,..., xm предиката P и сам<br />
предикат могут быть выбраны произвольно. Расслоение<br />
предиката ценно тем, что приводит к построению<br />
реляционной сети любой математической<br />
модели и к обоснованию ее универсальности<br />
и эффективности. Кроме того, расслоение предиката<br />
служит фундаментом для обобщения метода<br />
нулевого прибора [2], который является основным<br />
средством моделирования психофизических процессов.<br />
Такое обобщение приводит к существенному<br />
расширению сферы применения метода<br />
нулевого прибора, превращая его из метода моделирования<br />
процессов классификации объектов в<br />
универсальное средство формального описания<br />
произвольных психофизических процессов.<br />
Описание алгоритма расслоения<br />
Приведенный алгоритм сопровождается универсальным<br />
примером. При решении этого примера<br />
должны присутствовать все детали, которые<br />
могут возникнуть в более сложном примере, а также<br />
он должен быть наиболее простым.<br />
Предикат P( x1, x2, x3) = t задан табл. 1. Имеем<br />
три предметных переменных x1, x2, x3<br />
, каждая<br />
задана на своей области A1, A2, A3<br />
. Если записать<br />
уравнение P( x1, x2,..., xm) = 1 , то это уравнение задает<br />
отношение, соответствующее предикату P .<br />
Н. Е. Русакова<br />
ХНУРЭ, г. Харьков, Украина<br />
О МЕТОДЕ РАССЛОЕНИЯ КОНЕЧНОГО ПРЕДИКАТА<br />
Анализ уже имеющихся достижений в области моделирования мозгоподобных структур показывает,<br />
что многие актуальные задачи в этой области еще ждут своего решения. В связи с этим в статье ставится<br />
задача разработки метода преобразования математической модели произвольной конечной мозгоподобной<br />
структуры в ее техническую эффективно действующую модель, называемую реляционной сетью.<br />
РАССЛОЕНИЕ ПРЕДИКАТА, КЛАССИФИКАТОРЫ, ПЕРЕКЛЮЧАТЕЛЬНАЯ ЦЕПЬ, РЕЛЯ-<br />
ЦИОННАЯ СЕТЬ, МОЗГОПОДОБНАЯ СТРУКТУРА<br />
Таблица задания предиката P<br />
x 1<br />
xx<br />
2 3<br />
00 01 10 11 20 21<br />
0 1 1 1 1 1 0<br />
1 1 1 1 1 1 0 t<br />
2 1 0 1 0 0 0<br />
3 1 0 1 0 0 0<br />
Таблица 1<br />
Определяем области изменения A1, A2, A3<br />
ходных переменных x1, x2, x3<br />
предиката P :<br />
Следовательно:<br />
1 1<br />
0<br />
1<br />
1<br />
1<br />
2<br />
1<br />
3<br />
1<br />
A ( x ) = x ∨x ∨x ∨x<br />
;<br />
2 2<br />
0<br />
2<br />
1<br />
2<br />
2<br />
2<br />
A ( x ) = x ∨x ∨ x ;<br />
3 3<br />
0<br />
3<br />
1<br />
3<br />
A ( x ) = x ∨x<br />
.<br />
A 0, 1, 2, 3 , A 0, 1, 2 , A 0, 1 .<br />
= { } = { } = { }<br />
1 2 3<br />
ис-<br />
Совершенная дизъюнктивная нормальная форма<br />
исходного предиката P равна:<br />
0 0 0<br />
1 2 3 1 2 3<br />
0 0 1<br />
1 2 3<br />
0 1 0<br />
1 2 3<br />
0 1 1<br />
1 2 3<br />
P( x , x , x ) = x x x ∨x x x ∨x x x ∨x xx ∨<br />
0 2 0<br />
1 2 3<br />
1 0 0<br />
1 2 3<br />
1 0 1<br />
1 2 3<br />
1 1 0<br />
1 2 3<br />
1 1 1<br />
1 2 3<br />
∨x x x ∨x x x ∨xxx ∨x xx ∨xxx ∨<br />
1 2 0<br />
1 2 3<br />
2 0 0<br />
1 2 3<br />
2 1 0<br />
1 2 3<br />
3 0 0<br />
1 2 3<br />
3 1 0<br />
1 2 3 .<br />
∨xxx ∨x x x ∨x x x ∨x x x ∨ x x x<br />
(1)<br />
Предикат P( x1, x2, x3) = t можно кратко изобразить<br />
в виде, представленном на рис. 1.<br />
Рис. 1. Расслоение предиката<br />
Здесь Q – классифицирующий слой, который<br />
преобразовывает классы x1, x2, x3<br />
в классы
y1, y2, y3<br />
; R – ассоциирующий слой, в котором все<br />
переменные соединяются в единое целое.<br />
Алгоритм состоит из восьми шагов, опишем<br />
каждый из них.<br />
Шаг 1. Вводим предикаты эквивалентности<br />
Ei( xi, xi<br />
)<br />
•<br />
( i = 1 , m)<br />
, характеризующие классификаторы<br />
предиката P . Вычисление производится<br />
по формуле, которая может использоваться для<br />
любого конечного числа переменных xm :<br />
•<br />
E ( x , x ) =∀x ∈A ∀x ∈A ... ∀x ∈A<br />
i i i 1 1 2 2 i−1 i −1<br />
∀x ∈A ... ... ∀x ∈A<br />
( P( x , x ,..., x ,<br />
i+ 1 i+ 1 m m 1 2 i −1<br />
x , x ,... x ) ∼ P( x , x ,..., x , x , x ,... x )).<br />
i i+ 1 m 1 2 i−1 i i+ 1 m<br />
•<br />
•<br />
(2)<br />
Находим эквивалентность E1( x1, x1)<br />
для заданного<br />
предиката (1) согласно формуле (2):<br />
•<br />
E ( x , x ) x 0, 1, 2 x 0,<br />
1<br />
=∀ ∈{ }∀ ∈{ }<br />
1 1 1 2 3<br />
( P( x , x , x ) ∼ P( x , x , x )) =<br />
1 2 3 1 2 3<br />
= ( T ( x ) ∼T ( x )) ⋅( T ( x ) ∼T ( x )) ⋅ ( T ( x ) ∼T<br />
( x )) =<br />
•<br />
• • •<br />
1 1 1 1 2 1 2 1 3 1 3 1<br />
= ( 1∼1) ⋅( T ( x ) ∼T ( x )) ⋅ ( 0∼0) =<br />
•<br />
2 1 2 1<br />
• •<br />
= T ( x ) ⋅T ( x ) ∨ T ( x ) T ( x ) =<br />
0<br />
1<br />
2 1 2 1 2 1 2 1<br />
1<br />
1<br />
• • • •<br />
0 1 0 1 0 1<br />
1 1 1 1 1 1<br />
= ( x ∨x )( x ∨x ) ∨( x ∨x )( x ∨ x ) =<br />
0<br />
1<br />
1<br />
1<br />
• • • •<br />
0 1 2 3 2 3<br />
1 1 1 1 1 1<br />
= ( x ∨x )( x ∨x ) ∨( x ∨x )( x ∨x<br />
).<br />
Аналогично •<br />
• находим эквивалентности<br />
E2( x2, x2<br />
) , E3( x3, x3)<br />
для переменных x2, x3:<br />
•<br />
E ( x , x ) x 0, 1, 2, 3 x 0,<br />
1<br />
=∀ ∈{ }∀ ∈{ }<br />
2 2 2 1 3<br />
•<br />
0 1<br />
•<br />
0<br />
•<br />
1<br />
1 2 3 1 2 3 2 2 2 2<br />
•<br />
2 2<br />
2 2<br />
( P( x , x , x ) ∼ P( x , x , x )) = ( x ∨x )( x ∨x ) ∨x<br />
x ;<br />
•<br />
E ( x , x ) x 0, 1, 2, 3 x 0,<br />
1, 2<br />
=∀ ∈{ }∀ ∈{ }<br />
3 3 3 1 2<br />
•<br />
0<br />
•<br />
0 1<br />
•<br />
1<br />
1 2 3 1 2 3 3 3 3 3<br />
( P( x , x , x ) ∼ P( x , x , x )) = x x ∨x<br />
x .<br />
Шаг 2. Получаем классификаторы предиката<br />
P в неявном Fi( xi, yi<br />
) и в явном fi( xi)= yi<br />
видах<br />
( i = 1 , m)<br />
для исходного предиката:<br />
1 1 1<br />
0<br />
1<br />
1<br />
1<br />
0<br />
1<br />
2<br />
1<br />
3<br />
1<br />
F ( x , y ) = ( x ∨x ) y ∨( x ∨x<br />
) y ;<br />
2 2 2<br />
0<br />
2<br />
1<br />
2<br />
0<br />
2<br />
2 1<br />
2 2<br />
F ( x , y ) = ( x ∨x ) y ∨ x y ;<br />
0 0<br />
3 3 3 3 3<br />
1 1<br />
3 3<br />
F ( x , y ) = x y ∨x<br />
y .<br />
0 1 0<br />
0 1 0<br />
⎧⎪<br />
x1∨ x1= y1<br />
;<br />
⎧⎪<br />
x2∨ x2= y2<br />
;<br />
f1( x1) = y1<br />
: ⎨<br />
f x y<br />
2 3 1 2( 2) = 2 : ⎨ 2 1<br />
⎩⎪ x1∨ x1= y1<br />
;<br />
⎩⎪ x2= y2;<br />
0 0 ⎧⎪<br />
x3= y3;<br />
f3( x3) = y3<br />
: ⎨ 1 1<br />
⎩⎪ x3= y3.<br />
1<br />
1<br />
О МЕТОДЕ рАССЛОЕНИЯ КОНЕЧНОГО ПрЕДИКАТА<br />
Шаг 3. Строим классифицирующий слой переключательной<br />
цепи предиката P (рис. 2).<br />
Рис. 2. Переключательная цепь предиката P<br />
Шаг 4. Находим предикат Q( y1, y2,..., ym) , ассоциирующий<br />
слои переключательной цепи предиката<br />
P( x1, x2, x3)<br />
. Его вычисление производится<br />
по формуле:<br />
Q( y , y ,..., y ) =∃x ∈A ∃x ∈A ... ∃x ∈A<br />
1 2 m 1 1 2 2 m m<br />
( P( x , x ,..., x ) ∧F ( x , y ) ∧F ( x , y ) ∧... ∧F<br />
( x , y )).<br />
1 2 m 1 1 1 2 2 2<br />
m m m<br />
Для предиката P( x1, x2, x3)<br />
получаем следующий<br />
результат:<br />
Q( y , y ,..., y ) x 0, 1, 2, 3 x 0,<br />
1, 2<br />
=∃ ∈{ } ∃ ∈{ }<br />
1 2 m 1 2<br />
∃x ∈{ 0, 1 } ( P( x , x , x ) ∧F ( x , y ) ∧F ( x , y ) ∧<br />
3 1 2 3 1 1 1 2 2 2<br />
0 0 0<br />
3 3 3 1 2 3<br />
0 0 1<br />
1 2 3<br />
0 1 0<br />
1 2 3<br />
1 0 0<br />
1 2 3<br />
∧ F ( x , y )) = y y y ∨y y y ∨y y y ∨ yyy .<br />
Таблица отношения, соответствующего предикату<br />
Q( y1, y2,..., ym) , наборы значений переменных<br />
в которой пронумерованы значениями вспомогательной<br />
переменной z , представлена в табл. 2.<br />
Отношение, соответствующее предикату Q<br />
y 1 0 0 0 1<br />
y2 0 0 1 0 Q( y1, y2, y3)<br />
y3 0 1 0 0<br />
z 0 1 2 3<br />
R( y , y , y , z)<br />
1 2 3<br />
Таблица 2<br />
Шаг 5. Производим бинаризацию предиката<br />
Q( y1, y2,..., ym) . Используем его представление<br />
следующей формулой:<br />
где<br />
Q( y , y ,..., y ) =∃z ∈C( G ( y , z)<br />
∧<br />
1 2 m<br />
1 1<br />
∧G ( y , z) ∧... ∧G<br />
( y , z)),<br />
2 2<br />
m m<br />
G ( y , z) =∃y ∈B ∃... y ∈B<br />
i i 1 1 i−1 i−1<br />
∃y ∈B ...... ∃y ∈B<br />
R( y , y ,..., y , z),<br />
i+ 1 i+ 1 m m 1 2 m<br />
(i = 1, m)<br />
;<br />
R( y1, y2, y3)<br />
– предикат, получаемый из предиката<br />
Q( y1, y2,..., ym) нумерацией его конституэнт единицы.<br />
Следовательно для P( x , x , x ) имеем:<br />
1 2 3<br />
0 0 0 0<br />
1 2 3 1 2 3<br />
0 0 1 1<br />
1 2 3<br />
R( y , y , y , z) = y y y z ∨y y y z ∨<br />
0 1 0 2<br />
1 2 3<br />
1 0 0 3<br />
1 2 3 ;<br />
∨y y y z ∨yyy<br />
z<br />
0 0<br />
1 1 1<br />
0 1<br />
1<br />
0 2<br />
1<br />
1 3<br />
1<br />
G ( y , z) = y z ∨y z ∨y z ∨ y z =<br />
0<br />
1<br />
0 1 2<br />
1 3<br />
1<br />
= y ( z ∨z ∨z ) ∨yz;<br />
51
Н. Е. русакова<br />
52<br />
0 0<br />
2 2 2<br />
0 1<br />
2<br />
1 2<br />
2<br />
0 3<br />
2<br />
G ( y , z) = y z ∨y z ∨y z ∨ y z =<br />
0<br />
2<br />
0 1 3<br />
1 2<br />
2<br />
= y ( z ∨z ∨z ) ∨yz;<br />
0 0<br />
3 3 3<br />
1 1<br />
3<br />
0 2<br />
3<br />
0 3<br />
3<br />
G ( y , z) = y z ∨y z ∨y z ∨ y z =<br />
0<br />
3<br />
0 2 3<br />
1 1<br />
3<br />
= y ( z ∨z ∨z ) ∨yz.<br />
Шаг 6. Строим ассоциирующий слой переключательной<br />
цепи предиката P (рис. 3).<br />
Q( y , y , y ) = t<br />
1 2 3<br />
Рис. 3. Ассоциирующий слой переключательной<br />
цепи предиката P<br />
Шаг 7. Задаем t = 1 и превращаем схему предиката<br />
P в реляционную сеть, реализующую отношение<br />
P (рис. 4).<br />
Рис. 4. Реляционная сеть, реализующая<br />
отношение P( x , x , x )<br />
1 2 3<br />
Шаг 8. Представляем реляционную сеть в виде<br />
многополюсника [3] (рис. 5).<br />
По ветвям реляционной сети происходит преобразование<br />
информации при помощи вычисления<br />
дизъюнктивного и конъюктивного образов<br />
множества по формулам:<br />
∃x ∈A( P( x) ⋅ K( x, y)) = Q ( y)<br />
,<br />
max<br />
∀x ∈A( P( x) ⊃ K( x, y)) = Q ( y)<br />
.<br />
min<br />
Рис. 5. Реляционная сеть, представленная<br />
в виде многополюсника<br />
Сеть отыскивает во всех случаях неискаженные<br />
множества корней уравнения P( x1, x2,..., xm) = 1 ,<br />
а значит она эффективна. Сеть решает уравнения<br />
для любых предикатов P( x1, x2,..., xm) при любом<br />
числе m предметных переменных x . Это означает,<br />
что она обладает свойством универсальности.<br />
Наличие свойств универсальности и эффективности<br />
позволяет рекомендовать так определенную<br />
реляционную сеть к применению в качестве решателя<br />
мозгоподобной структуры. Универсальная и<br />
эффективная реляционная сеть называется совершенной.<br />
Любая же рациональная модификация<br />
совершенной реляционной сети называется просто<br />
реляционной сетью.<br />
Выводы<br />
В статье разработан алгоритм синтеза реляционной<br />
сети на основе метода расслоения предиката,<br />
который был использован при построении реляционных<br />
сетей для моделей различных объектов.<br />
Метод расслоения произвольного многоместного<br />
предиката позволяет расчленить его в набор одноместных<br />
[4] и двуместных предикатов [3]. С помощью<br />
предметных переменных исходного предиката<br />
все полученные одно- и двуместные предикаты<br />
единстсвенным образом соединятся в реляционную<br />
сеть исходного многоместного предиката.<br />
При помощи процедуры расслоения предиката<br />
существенно усилен метод нулевого прибора,<br />
являющийся основным инструментом моделирования<br />
психофизических процессов. За счет этого<br />
теперь становится возможным моделировать влияние<br />
всевозможных внешних факторов, меняющих<br />
способ классификации предметов. За счет такого<br />
усиления метод нулевого прибора приобретает<br />
универсальность при моделировании психофизических<br />
процессов.
Список литературы: 1. Бондаренко, М.Ф. Теория <strong>интеллект</strong>а<br />
[Текст]: Учебник / М.Ф. Бондаренко, Ю.П. Шабанов-<br />
Кушнаренко. – Харьков. Изд-во СМИТ. – 2007. – 576 с.<br />
2. Бондаренко, М.Ф. О методе нулевого прибора [Текст] /<br />
М.Ф. Бондаренко, Н.П. Кругликова, Н.Е. Русакова, Ю.П.<br />
Шабанов-Кушнаренко // Бионика <strong>интеллект</strong>а. – 2010. –<br />
<strong>№</strong> 2. – С. 111-115. 3. Бондаренко, М.Ф. О реляционных сетях<br />
[Текст] / М.Ф. Бондаренко, Н.П. Кругликова, И.А. Лещинская,<br />
Н.Е. Русакова, Ю.П. Шабанов-Кушнаренко //<br />
Бионика <strong>интеллект</strong>а. – 2010. – <strong>№</strong> 3. – С. 8-13. 4. Бондаренко,<br />
М.Ф. Об алгебре одноместных предикатов [Текст]<br />
/ М.Ф. Бондаренко, Н.П. Кругликова, И.А. Лещинская,<br />
Н.Е. Русакова, Ю.П. Шабанов-Кушнаренко // Бионика<br />
<strong>интеллект</strong>а. – 2010. – <strong>№</strong> 2. – С. 62-67.<br />
Поступила в редколлегию 11.09.<strong>2011</strong><br />
О МЕТОДЕ рАССЛОЕНИЯ КОНЕЧНОГО ПрЕДИКАТА<br />
УДК 519.7<br />
Про метод розшарування кінцевого предикату/<br />
Н. Є. Русакова // Біоніка інтелекту: наук.-техн. журнал.<br />
– <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 50-53.<br />
У статті ставиться задача розробки методу перетворення<br />
математичної моделі довільної кінцевої мозкоподібної<br />
структури у технічну эффективно діючу модель,<br />
що зветься реляційною мережею.<br />
Табл. 2. Іл. 5. Бібліогр.: 4 найм.<br />
UDC 519.7<br />
About method of stratification of eventual predicate / N.E.<br />
Rusakova // Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3<br />
(<strong>77</strong>). –P. 50-53.<br />
In the article the task of development of method of<br />
transformation of mathematical model of arbitrary eventual<br />
braine-like structure is put in its technical effectively operating<br />
model, urgent a relation network.<br />
Tabl. 2. fig. 5. Ref.: 4 items.<br />
53
маТемаТическое моделирование. сисТемный анализ. ПриняТие решений<br />
УДК 004.942+271.47.15.14.21.21<br />
54<br />
Yu. Bespalov 1 , I. Gorodnyanskiy 2 , G. Zholtkevych 3 , I. Zaretskaya 4 ,<br />
K. Nosov 5 , T. Bondarenko 6 , K. Kalinovskaya 7 , Y. Carrero 8<br />
1 V. N. Karazin Kharkiv National University, Kharkiv, Ukraine,<br />
yuri.g.bespalov@univer.kharkov.ua;<br />
2 V. N. Karazin Kharkiv National University, Kharkiv, Ukraine, biolog@univer.kharkov.ua;<br />
3 V. N. Karazin Kharkiv National University, Kharkiv, Ukraine, zholtkevych@univer.kharkov.ua;<br />
4 V. N. Karazin Kharkiv National University, Kharkiv, Ukraine, zar@univer.kharkov.ua;<br />
5 V. N. Karazin Kharkiv National University, Kharkiv, Ukraine, k-n@nm.ru;<br />
6 Institute for Problems of Cryobiology and Cryomedicine of the National Academy of Sciences of Ukraine,<br />
Kharkiv, Ukraine, cryo@online.kharkov.ua;<br />
7 Kharkiv Zoo, Kharkiv, Ukraine, kharkovzoo2010@gmail.com;<br />
8 College of Mount Saint Vincent, New York, USA, yafreisycarrero@ymail.com.<br />
Discrete Dynamical moDeling of system characteristics<br />
of a turtle’s Walk in orDinary situations anD after slight stress<br />
In the paper a class of discrete dynamical models, based on the intra- and between-specific relationships<br />
(interactions), which adopted in biology and ecology, is suggested. The relevance of the models in the form of<br />
a convergence in probability of sample correlation coefficients is grounded. One of the introduced models, applied<br />
to the analysis of a turtle’s walk under two states, allowed to reveal deep systemic factors of biomechanics<br />
of animal’s walking.<br />
DYNAMICAL SYSTEMS, BIOMECHANICS Of WALK, DISCRETE MODELS, SYSTEM IDENTIfICATION,<br />
INTERSPECIfIC INTERACTIONS<br />
Introduction<br />
There are concepts that describe an animal’s walk as<br />
a complex process of system character, which has been<br />
known at least since the first half of 20-th century, and<br />
are used to analyze the walking characteristics of different<br />
animals from human beings to dinosaurs [1, 2,<br />
6, 7, 8]. Beginning with reptiles, the relation between<br />
factors guaranteeing stability of an animal’s body along<br />
with the motion rate in the process of motion is of very<br />
importance. Considerable difficulties arise when it is<br />
impossible to trace the entire sequence of an animal’s<br />
motion during each phase. To get over these difficulties,<br />
in this paper we used a mathematical apparatus of<br />
discrete modeling and dynamic systems with feedback<br />
(DMDS), to develop with some of the authors participation<br />
[3, 4, 5], a way to obtain the sequence of phases<br />
of a cycle of system changes (system trajectory) based<br />
on the partial information, when only separate phases<br />
are known but not their sequence. The objective of this<br />
paper is to investigate the relation between the rate of<br />
motion and body stability factors, in a rather simple<br />
case, of a turtle’s walk using the DMDS method.<br />
1. Theory<br />
In this paper, the authors suggest an approach to<br />
determine the relationships between biological objects<br />
(say, species) in the framework of some discrete dynamical<br />
model. In brief, this approach is presented in<br />
illustration [3], which we will discuss in more details.<br />
Let a biological or ecological system be described by<br />
N components A1, A 2 , … , A N . These components can<br />
have different representations, for example, they can be<br />
express the numbers of animals or the amount of biomass<br />
of different species. We assume that components<br />
only take discrete values 1, 2, … , K , i. e. K values. The<br />
value 1 means a minimum amount of a component, the<br />
value K means its maximum value, i. e. a component<br />
varies from 1 to K . Indeed, the real range of component’s<br />
varying may differ from the range [1, K ] , but for<br />
our model the only important thing is that the component<br />
varies in some quantitative scale from minimum to<br />
maximum.<br />
The value of each of the components is observed and<br />
measured at discrete instants of time t = 0,1, … . Thus,<br />
the values of the component A i (i. e. i -th component)<br />
at the instants of time t = 0,1, … are numbers A i (0) ,<br />
A i (1) , … .<br />
The trajectory of the system is described by an infinitive-right<br />
matrix<br />
⎛ A1(0) A1(1) A1(2)<br />
…⎞<br />
⎜ ⎟<br />
⎜<br />
A2(0) A2(1) A2(2)<br />
…<br />
⎟.<br />
⎜ …⎟<br />
⎜ ⎟<br />
⎝AN(0) AN(1) AN(2)<br />
…⎠<br />
(1)<br />
This trajectory, as always, includes all states of the<br />
system at the instants of time t = 0,1, … . Hence the state<br />
of the system at the instant of time t is the vector ( A1( t ) ,<br />
A2 ( t ) , … , AN( t ))T , where T means the matrix transposition.<br />
We suppose that the system is strictly determined,<br />
and its state at the instant of time t is fully determined<br />
by the state at the moment t − 1 . According to<br />
the theory of mathematical systems [9], such a system<br />
is called a free dynamical system with discrete time, but<br />
in our paper we shall use own terminology. Since the
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 54–59 хНурэ<br />
N<br />
system has only finite number of states (namely, K ),<br />
there exists a positive integer T , for which the conditions<br />
of periodicity hold<br />
Aj( s) = Aj( s+ T ), ∀s ≥ s0,<br />
for some integer s 0 > 0.<br />
It is natural to call a number T the period of the<br />
system. Let us extract the minor<br />
⎛ A1( s) A1( s+ 1) … A1( s+<br />
T −1)<br />
⎞<br />
⎜ ⎟<br />
⎜<br />
A2( s) A2( s+ 1) … A2( s+<br />
T −1)<br />
⎟ (2)<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝AN( s) AN( s+ 1) … AN( s+<br />
T −1)<br />
⎠<br />
from the matrix (1) ( s ≥ s0),<br />
which gives full description<br />
of the behavior of the system.<br />
Let us introduce a concept of relationships between<br />
components. Let Ω = { − ,0, + } , i. e. the set Ω consists<br />
of three elements. We determine a relationship between<br />
components i A and A j as an entry from the set Ω×Ω<br />
and denote it as Λ ( Ai, Aj) = ( ω1, ω2)<br />
, where ω1 ∈Ω,<br />
ω2 ∈Ω . If Λ ( Ai, Aj) = ( ω1, ω2)<br />
, this means of this relationship<br />
following:<br />
1. If ω1 ={ − } then large values of the component j A<br />
implies decreasing the value of the component A i .<br />
2. If 1 = {0} ω then the value of the component j A<br />
doesn’t influence the value of the component A i .<br />
3. If ω 1 ={ + } then the large values of the component<br />
A j implies increasing the value of the component A i .<br />
The relationship Λ is antisymmetric, i. e. if<br />
Λ ( Ai, Aj) = ( ω1, ω2)<br />
, then Λ ( Aj, Ai) = ( ω2, ω1)<br />
. It is<br />
obvious that all combinations ( ω1, ω 2)<br />
correspond to<br />
relationships (interspecific interactions) of neutralism,<br />
competition, amensalism, predation, commensalism<br />
and mutualism, widely used in ecology and biology. We<br />
assume, that each component A j can have with itself<br />
only following relationships — (0,0) , ( −, − ) and ( + , + ) ,<br />
i. e. symmetric relationships.<br />
Assume that all relationships Λ ( Aj, Ai)<br />
between all<br />
pairs ( Aj, A i)<br />
of components A1, A 2 , … , A N are fixed.<br />
Let us define for each A j the set of components, for<br />
which A j has the relationship ( s, u ), s, u∈Ω, i. e. ( s, u )<br />
is some fixed relationship from the set Ω×Ω<br />
Lj( s, u) ={ Ai | Ω(<br />
Aj, Ai) = ( s, u)}.<br />
The sets L j ( + , + ) , L j ( −, − ) , L j (0,0) can have from<br />
0 to N entries, other sets ( L j ( ω1, ω 2)<br />
, ω1 = ω 2)<br />
can<br />
have from 0 to N − 1 entries. It is convenient to express<br />
relationships by a relationships matrix. If we have N<br />
components A1, A2, … , AN,<br />
the relationships matrix is<br />
called the following table<br />
⎡ A1 A2 … AN⎤<br />
⎢<br />
A1<br />
( ω1, ω1)<br />
⎥<br />
⎢ ⎥<br />
⎢ A2<br />
( ω2, ω1) ( ω2, ω2)<br />
⎥.<br />
⎢ ⎥<br />
⎢ ⎥<br />
⎢<br />
⎣AN ( ωN, ω1) ( ωN, ω2) … ( ωN, ωN)<br />
⎥<br />
⎦<br />
(3)<br />
The relationships above the main diagonal are omitted,<br />
since they are recovered by the relationships below<br />
the diagonal (according to the antisymmetric property).<br />
Let = {1, 2, …,<br />
K}<br />
and Nj( s, u ) is the number of<br />
components in the set Lj( s, u ) , j = 1, 2, … , N . A transition<br />
from the state ( A1( t ) , A2 ( t ) , … , An( t ))T to the<br />
state ( A1( t + 1) , A2 ( t + 1) , … , An( t + 1))T is described<br />
by N transition functions F j . Each function defines<br />
the mapping<br />
Nj( + , + ) + Nj( + ,0) + Nj( + , − ) + Nj( − , + ) + Nj( − ,0) + Nj(<br />
−, −) → .<br />
This mapping in symbolic form may be expressed by<br />
the formula<br />
Aj( t + 1) = Fj( Ak( t) ∈ Lj( + , + ), Ak( t) ∈ Lj(<br />
+ ,0),<br />
Aj( t) ∈ Lk( + , −), Ak( t) ∈Lj( − , + ),<br />
(4)<br />
Ak( t) ∈Lj( −,0), Ak( t) ∈Lj( −, −)), j = 1, 2, …,<br />
N,<br />
where Ak( t) ∈ Lj(<br />
+ , + ) , Ak( t) ∈ Lj(<br />
+ ,0) , … are the values<br />
Ak( t ) of all A k , belonging to L j ( + , + ) , L j ( + ,0) , …<br />
correspondingly.<br />
The transition function, introduced by the above formula,<br />
is quite natural in its structure. The given component<br />
A j is influenced only by those components, which<br />
indeed influence A j , i. e. the components from the sets<br />
L j ( + , ω)<br />
and L j ( − , ω)<br />
for any ω ∈ W .<br />
Now, let us describe types of relationships, inherent<br />
to real biological and ecological systems.<br />
The formula (4) expresses a general form of transition<br />
of the system from the state at the moment t to the<br />
moment t + 1 . for a more detailed description of the<br />
behavior of biological or ecological system, we have to<br />
specify an explicit form of transitional functions, which<br />
express dynamical properties of the system.<br />
We suggest two approaches to such a dynamics,<br />
which are based on concepts of biological interactions.<br />
Let us introduce the following functions defined on<br />
the set <br />
I nc( A) = min{ K, A + 1},<br />
D ec( A) = max{1, A −1}.<br />
first we define a type of relationships, which takes<br />
into account the weighted sum of all Aj( t ) (inclusive<br />
Ai( t ) ) for calculating the value of component A i at the<br />
instant of time t + 1 . We call this type of relationships a<br />
weight functions’ approach. Now, this is the exact definition.<br />
for each j ( j = 1, 2 , … , N ) we introduce a set of<br />
,<br />
functions , 1 ()<br />
s u<br />
ϕ j<br />
〈 〉 ,<br />
⋅ , ,2 ()<br />
s u<br />
ϕ j<br />
〈 〉 〈 s, u〉<br />
⋅ , … , ϕ () ⋅ . These are the<br />
j, Nj functions of interactions of those components, where<br />
A j has relationships ( s, u ) , s ∈ { + , − } , u ∈ W . The<br />
properties of these functions are the following:<br />
1. The functions are defined on the discrete set .<br />
,<br />
2. ϕ j, k ()<br />
〈+ +〉 ,0<br />
⋅ , ϕ j, k ()<br />
〈+ 〉 ,<br />
⋅ , ϕ j, k ()<br />
〈+ −〉 ⋅ are increasing functions.<br />
,<br />
3. ϕ j, k ()<br />
〈− +〉 ,0<br />
⋅ , ϕ j, k ()<br />
〈− 〉 ,<br />
⋅ , ϕ j, k ()<br />
〈− −〉 ⋅ are decreasing functions.<br />
55
Yu. Bespalov, I. Gorodnyanskiy, G. Zholtkevych, I. Zaretskaya, K. Nosov, T. Bondarenko, K. Kalinovskaya, Y. Carrero<br />
56<br />
〈+ , +〉 〈+ ,0 〉 〈+ , −〉<br />
4. ϕ j, k (1) = ϕj, k (1) = ϕj,<br />
k (1) =<br />
= 〈− , +〉 〈− ,0〉<br />
〈−, −〉<br />
ϕj, k (1) = ϕj,<br />
k (1) = ϕ j, k (1) = 0 .<br />
Now define a set of numbers δ j > 0 ( j = 1, 2, … , N )<br />
and call them thresholds of sensivity. for the system’s<br />
state at the instant of time t the following value is calculated<br />
d j =<br />
〈+ , +〉 〈+ ,0〉<br />
= ∑ ϕj, k ( Ak( t)) + ∑ ϕj,<br />
k ( Ak( t))<br />
+<br />
Ak∈ Lj( + , + ) Ak∈ Lj(<br />
+ ,0)<br />
〈+ , −〉 〈− , +〉<br />
∑ ϕj, k ( Ak( t)) + ∑ ϕj,<br />
k ( Ak( t))<br />
+<br />
Ak∈ Lj( + , −) Ak∈Lj( − , + )<br />
(5)<br />
〈− ,0 〉 〈−, −〉<br />
∑ ϕj, k ( Ak( t)) + ∑ ϕj,<br />
k ( Ak( t)),<br />
Ak∈Lj( −,0) Ak∈Lj( −, −)<br />
(it is clear that d j depends on t , but t is omitted for<br />
short in the left side).<br />
The value of the component A j changes according<br />
to the value d j by the following rules<br />
1. if d j ≥ δ j , then Aj( t + 1) = I nc( Aj( t))<br />
;<br />
2. if d j ≤ − δ j , then Aj( t + 1) = D ec( Aj( t))<br />
;<br />
3. if − δ j < d j < δ j , then Aj( t + 1) = Aj( t)<br />
.<br />
Now we can explain the mean of introduced tran-<br />
,<br />
sition functions. for example, the functions ϕ j, k ()<br />
〈− +〉 ⋅<br />
( k = 1, 2, … , Nj( − , + )) reflects the influence upon component<br />
j A of those components, which related with j A<br />
by relationship ( − , + ) , i. e. the components from the set<br />
L j ( − , + ) . The greater this influence (i. e. the greater values<br />
of Ai( t ) from the set L j ( − , + ) ), the less values of d j .<br />
An influence of other components, where A j has other<br />
relations, are ``weighted’’ in similar way. If cumulative<br />
influence of the components, interacting with A j and<br />
expressed by (5), exceeds the threshold value δ j , then<br />
the value of A j changes by unit.<br />
from the rules for definition of transitional function<br />
one can observe, that an increment of the value of A j is<br />
less or equal to 1 ( | Aj( t + 1) − Aj( t)<br />
| ≤ 1 ). This means, that<br />
the rate of changes of A j is invariable. It is possible to avoid<br />
such an unnatural restriction, for example, by introducing<br />
a dependence of the increment on | d j | / δ j . However, in<br />
this paper we do not consider such extensions.<br />
It is clear that the threshold δ j influences the dynamics<br />
of the system in following way: the greater δ j , the<br />
greater absolute value of the weighted sum d j required<br />
for overcoming j δ in changing the value of j A . So, if j δ<br />
is very large, the system becomes very inert. When<br />
〈+ , +〉 〈+ ,0〉<br />
δ j > max{ ∑ ϕj, k ( K) + ∑ ϕj,<br />
k ( K)<br />
+<br />
Ak∈ Lj( + , + ) Ak∈ Lj(<br />
+ ,0)<br />
〈+ , −〉 〈− , +〉<br />
+ ∑ ϕj, k ( K), − ( ∑ ϕj,<br />
k ( K)<br />
+<br />
Ak∈ Lj( + , −) Ak∈Lj( − , + )<br />
〈− ,0 〉 〈−, −〉<br />
+ ∑ ϕj, k ( K) + ∑ ϕj,<br />
k ( K))},<br />
Ak∈Lj( −,0) Ak∈Lj( −, −)<br />
the value of A j never changes ( Aj ( t) = const<br />
, t = 0,1, … ).<br />
If we wish to avoid this trivial case, the value of δ j should<br />
be not very large.<br />
A second approach, proposed here, is based on the<br />
famous Justus von Liebich’s law of limiting factors. This<br />
concept was originally applied to plant or crop growth.<br />
This approach is described in brief [3] and now we give<br />
detailed description of this approach. Our following results<br />
are based on it.<br />
Assume, that the system of relationships between A 1,<br />
A 2 , … , A N is given. Let us introduce two constant ma-<br />
*<br />
trices C and C of size N × N . The transition functions<br />
are based on the following algorithm.<br />
Let the system in the instant of time t has the state<br />
( A1 ( t ) , A2 ( t ) , … , AN( t ))T and A j is an arbitrary fixed<br />
component. Let i runs from 1 to N , by u we denote<br />
any entry from the set W .<br />
1. If for the current i the equality Λ( Aj, Ai) = ( − , u)<br />
holds, we assume<br />
⎧−<br />
*<br />
1, if Ai ( t) ≥ c ji ,<br />
⎪<br />
*<br />
fi = ⎨0,<br />
if c ji + 1 ≤ Aj ( t) ≤ c ji −1,<br />
⎪<br />
⎪1,<br />
if Aj ( t) ≤ c ji.<br />
⎩<br />
Note, that no matter the specific value of u , only the<br />
influence on j A from the side of A i plays the role.<br />
2. If for the current i the equality Λ ( Aj, Ai) = ( + , u)<br />
holds, we assume<br />
⎧−1, if Aj ( t) ≤ c ji ,<br />
⎪<br />
*<br />
fi = ⎨0,<br />
if c ji + 1 ≤ Aj ( t) ≤ c ji −1,<br />
⎪<br />
*<br />
⎪⎩<br />
1, if Aj ( t) ≥ c ji.<br />
3. If for the current i the equality Λ ( Aj, Ai) = (0, u)<br />
holds, we assume f i =1.<br />
After the cycle termination, we obtain the sequence<br />
f 1 , 2 f , … , f N . Then we can calculate the value<br />
Aj( t + 1) according to the following rule:<br />
⎧<br />
⎪D<br />
ec( Aj( t)), if min { fi}<br />
= −1,<br />
1≤i≤N<br />
⎪<br />
Aj( t + 1) = ⎨Aj( t), if min { fi}<br />
= 0, (6)<br />
⎪⎪⎪⎩<br />
1≤i≤N<br />
I nc( Aj( t)), if min { fi}<br />
= 1.<br />
1≤i≤N<br />
Applying this algorithm for each j =1,<br />
2 , … , N ,<br />
we shall obtain the system’s state at the instant of time<br />
t + 1 .<br />
Now we can explain the mean of an introduced transition<br />
from t to t + 1 . E. g., stating that the given component<br />
A j has the relationship ( + , − ) , which is the current<br />
component A i (see algorithm). According to the mean<br />
of relation ( + , − ) , large values of A i lead to decreasing<br />
A j . Indeed, according to the item 1 of the algorithm, if<br />
*<br />
Ai( t) ≥ cji(i.<br />
e. Ai( t ) is “large enough”), fi = − 1 and,<br />
according to (6), A j will decrease if Aj( t ) >1.<br />
Other<br />
cases of this transition works analogically.<br />
When we investigate real data, we do not observe the<br />
dynamics, described by relationships (3), by the matrix<br />
of the trajectory (1) or by its minor (2).
DIsCreTe DYNamICal moDelING of sYsTem CharaCTerIsTICs of a TurTle’s WalK IN orDINarY sITuaTIoNs aND afTer slIGhT sTress<br />
The result of this observation is the following table<br />
of cases<br />
⎛ C11 C12 … C1B⎞<br />
⎜ ⎟<br />
C21 C22 C2B<br />
M<br />
= ⎜<br />
…<br />
⎟,<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝CN1 CN2 … CNB⎠<br />
where columns correspond to cases and rows correspond<br />
to components ( N components and B cases).<br />
We propose an algorithm that reveals the system<br />
relationships of above mentioned type, on the base of<br />
transition functions F j , j = 1, 2, … , N and the observation<br />
table M .<br />
This algorithm allows us to determine between- and<br />
intra-components relationships, which are as close as<br />
possible relationships that form matrix (2) in a certain<br />
mean. Assume, that a number K and transition functions<br />
are given. In this case, for initial will be ( A1(0), A2(0)<br />
, … , (0)) T N<br />
A N ∈ and the given sets L1 ( u, s ) , L2 ( u, s)<br />
, … , LN( u, s ) , u ∈{ − ,0, + } , s ∈{ − ,0, + } , which makes it<br />
possible to calculate the matrix (1) or the minor (2). Let<br />
⎛ 1 r12 … r1N⎞<br />
⎜ ⎟<br />
r21 1 r2N<br />
P = ⎜<br />
…<br />
⎟<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝rN1 rN2<br />
… 1 ⎠<br />
be a Pearson correlation matrix between rows of minor<br />
(2). Now for the matrix M let us calculate Pearson correlation<br />
matrix of its rows<br />
⎛ 1 ρ12 … ρ1N⎞<br />
⎜ ⎟<br />
21 1<br />
2N<br />
P<br />
ρ ρ<br />
= ⎜<br />
…<br />
⎟.<br />
⎜ ⎟<br />
⎜ ⎟<br />
⎝ρN1 ρN2<br />
… 1 ⎠<br />
Let us introduce the measure of distance between<br />
correlation matrices P and P <br />
N−1N 2<br />
D( P, P) = ∑ ∑ ( rij−ρij) .<br />
j=1 j= i+<br />
1<br />
(7)<br />
Consider the task of minimization D( P, P) by all<br />
possible vectors of initial states ( A 1(0)<br />
, 2 (0) A , … ,<br />
T N<br />
AN (0)) ∈ and all allowable sets Lj( s, u ) , s, u∈ W<br />
for all j<br />
D( P, P) min <br />
by all initial states and by all allowable Lj( s, u ) .<br />
Now, we can explain the mean of the stated task.<br />
Suppose, that a process in some real system is described<br />
by cyclical trajectory (2). One cannot the possibility to<br />
observe the dynamic of this trajectory, i. e. a full length<br />
cycle. The observation are taken from the system at random<br />
instants of time t from s to s + T −1with<br />
equal<br />
probability. When an observation is fixed, the column<br />
( A1( t ) , A2 ( t ) , … , ( )) T<br />
ANt from (2) is attached to table<br />
of observations. In other words, the columns of table of<br />
observations M are obtained from (2) by an equiprobable<br />
choice of columns. The stated task means a search of<br />
such relationships between components, that the minor<br />
(2) is to be as close as possible to the table of observations<br />
in the mean of the measure (7).<br />
The following theorem shows, that this task is wellgrounded<br />
in some mean.<br />
If the table of observations M is obtained from the<br />
minor (2) by equiprobable choice of columns, then the<br />
correlation matrix of the observations table P converges<br />
to the correlation matrix of minor P (in probability)<br />
lim ρij<br />
= rij, i = 1, 2, …, N, j = 1, 2, …,<br />
N.<br />
B→∞<br />
Proof. Since the Pearson coefficient is a pairwise<br />
characteristics (between two variables), it is enough to<br />
prove the theorem for the case N = 2.<br />
Let<br />
⎛x1,1 x1,2 … x1,<br />
T ⎞<br />
⎜ ⎟<br />
⎝x2,1 x2,2 … x2,<br />
T ⎠<br />
be the minor (2), where we use the notation x i, j instead<br />
1<br />
Ai( j + s−<br />
1) for convenience. Let xi = ∑ j=1<br />
xi,<br />
j<br />
T , i = 1, 2 ,<br />
T<br />
are to be the means of rows. If a sample variance of both<br />
rows is not 0, the Pearson correlation coefficient (between<br />
rows) is equal to<br />
T<br />
∑(<br />
x1, j − x1)( x2, j − x2)<br />
j<br />
R0<br />
= .<br />
T T<br />
2 2<br />
∑( x1, j − x1) ∑(<br />
x2, j − x2)<br />
j=1 j=1<br />
Now we can present the observation matrix M as a<br />
frequency table<br />
⎡x1,1 x1,2 … x1,<br />
T ⎤<br />
⎢<br />
x2,1 x2,2 x<br />
⎥<br />
⎢<br />
… 2, T ⎥<br />
,<br />
⎢⎣m1 m2 … mT⎥⎦<br />
where j m is a frequency of the column ( 1, , 2, ) T<br />
x j x j ,<br />
which is taken from the minor (2) and placed into the<br />
observation matrix M .<br />
The means of the rows of the observation matrix M are<br />
1 B 1 T T m j<br />
Ci = ∑Ci, j = ∑mjxi, j = ∑ xi, j,<br />
i = 1, 2.<br />
B k=1 B j=1 j=1B<br />
m j 1<br />
According to the Bernoulli theorem [10],<br />
B → T<br />
(in probability, when B →∞ ) for all j = 1, 2, …, T .<br />
from this it follows Ci → xi<br />
(in probability, B →∞ ),<br />
i = 1, 2 .<br />
The Pearson correlation coefficient (between rows)<br />
of the observation matrix M equals<br />
Then,<br />
T mk ∑ ( x1, k − x1)( x2, k − x2)<br />
k=1<br />
B<br />
RB<br />
= .<br />
T m T<br />
k 2 mk<br />
2<br />
∑ ( x1, k − x1) ∑ ( x2, k − x2)<br />
k=1 B k=1B<br />
57
Yu. Bespalov, I. Gorodnyanskiy, G. Zholtkevych, I. Zaretskaya, K. Nosov, T. Bondarenko, K. Kalinovskaya, Y. Carrero<br />
58<br />
lim RB<br />
B→∞<br />
=<br />
lim<br />
B→∞ T mk ∑k<br />
=1 ( x1, k −C1)( x2, k −C2)<br />
B<br />
T mk 2 mk<br />
2<br />
k=1 ( x1, k −C1) T<br />
∑ ∑k=1(<br />
x2, k −C2)<br />
B B<br />
=<br />
T mk ∑k<br />
=1 ( x1, k − x1)( x2, k − x2)<br />
B<br />
lim<br />
=<br />
B→∞ T mk 2 mk<br />
2<br />
k=1 ( x1, k − x1) T<br />
∑ ∑k=1(<br />
x2, k − x2)<br />
B B<br />
T 1<br />
∑k<br />
=1 ( x1, k − x1)( x2, k − x2)<br />
T<br />
= R0<br />
T 1 2 1<br />
2<br />
k=1 ( x1, k − x1) T<br />
∑ ∑k=1(<br />
x2, k − x2)<br />
T T .<br />
(The convergence holds in probability).<br />
The theorem is proven.<br />
This result means that if the real dynamical periodic<br />
process is described by the minor (2), we can expect that<br />
the correlation matrix of the observations table will be<br />
close to correlation matrix of real process, i. e. to the<br />
correlation matrix of the minor.<br />
So, as mentioned above, we can consider the task (7)<br />
as the task of system identification. Initial states ( A 1(0)<br />
,<br />
2 (0) A , … , A N (0))T and sets Lj( s, u ) in (7) are parameters,<br />
which should be identified.<br />
2. Results<br />
By using digital photography, we captured separate<br />
walking phases (which by no means form a complete cycle)<br />
of a two year-old male Emys orbicularis along the<br />
bottom of an enameled pool located in a terrarium. In<br />
the case of using a stressor, a turtle was kept lying on its<br />
back for two minutes. Then another turtle was immediately<br />
put into the pool in a back up position (without<br />
using a stressor).Using the images, we calculated the ratio<br />
of the following distances to the length of the turtle’s<br />
shell: from the tail head to the ankle of each of the four<br />
legs — the right foreleg (rf), the right hand leg (rb), the<br />
left foreleg (lf), the left hand leg (lb). We considered such<br />
a distance to reflect the degree of a leg straightening.<br />
Using DMDS, the structures of relationships and<br />
sets of states of the four-component system were obtained<br />
for all four parameters rf, rb, lf, lb (the components<br />
of the system are the turtle’s legs). The results<br />
correspond to the observations both for the stressed and<br />
non-stressed cases in the outmost degree (in the conventional<br />
sense for DMDS).<br />
for modeling with DMDS, we used the approach<br />
based of the principles of the von Liebig law and proposed<br />
that K = 3 (three levels of components’ values).<br />
for these two cases, the system trajectories which showed<br />
the sequence of walking phases (the cycle including different<br />
combinations of contracting and straightening of<br />
each of four legs) were constructed. On these trajectories,<br />
the system factors analyzed the body’s stability for<br />
the stressed and the non-stressed turtles walk.<br />
A marked difference between the system trajectories<br />
for each case with and without the stressor was recovered.<br />
In the case of the turtle without the stressor, the<br />
DMDS obtained the following data in the system trajectory.<br />
This is represented in the table 1.<br />
Table 1. System trajectory for the case without stressor.<br />
rf 3 3 3 3 2 1 1 1 2 3 3<br />
rb 1 1 2 3 3 3 2 1 1 1 1<br />
lf 1 1 1 1 2 2 1 1 1 1 1<br />
lb 2 1 1 1 1 1 1 2 3 3 2<br />
Conditional<br />
time, steps<br />
1 2 3 4 5 6 7 8 9 10 11<br />
The bold font highlights the sequences of monotone<br />
increase of rf, rb, lf and lb values which corresponds to<br />
apparent motion of extremities (in this paper we neglect<br />
differences in the directions of motion). This system trajectory<br />
shows that the extremities start their motion in<br />
patterns so that only one leg keeps moving, and only at<br />
the end of each phase they start to move the other one.<br />
Thus, most of the time the turtle’s body has three supporting<br />
points which guarantees stability of its motion.<br />
In the case of the turtle with the stressor, the DMDS<br />
data obtained the following data in the system trajectory.<br />
This is represented in the table 2.<br />
Table 2: System trajectory for the case with stressor.<br />
rf 1 2 2 1 1 1 1 2 3 3 3 2 1 1 1<br />
rb 1 1 1 2 3 3 3 2 1 1 1 1 1 1 1<br />
lf 1 2 3 3 3 2 1 1 1 2 2 1 1 1 1<br />
lb 1 1 1 1 1 1 1 1 1 2 3 3 3 2 1<br />
Conditional<br />
time, steps<br />
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15<br />
This system trajectory shows that in contrast to the<br />
case of a non-stressed turtle the motion of a stressed turtle<br />
has phases where two legs are simultaneously moving<br />
so there is no guarantee that the body has three supporting<br />
points to maintain stability of its motion.<br />
The results of the DMDS allows us to put forward a<br />
working hypothesis: that even under very slight stress in<br />
the motion of a turtle there occurs a deviation from the<br />
optimal relation between factors providing motion rate,<br />
and stability to the deterioration of conditions for stable<br />
motion. This deviation can be registered by systems of<br />
remote sensing (say, by digital photography) and further<br />
analyzed by DMDS with the use of an animal’s motion<br />
trajectory based on the images representing the separate<br />
phases of motion. Information about the time sequence<br />
of these phases is not required, so images representing<br />
any incomplete fragments of a motion cycle can be used.<br />
In the case with the turtle, the requirements to refine<br />
the images are not so high. The images can be obtained<br />
by digital photography from any altitude, which allows<br />
us to alter the resolution degree and recognize the position<br />
of the animal’s legs at a position with respect to its<br />
body silhouette.
DIsCreTe DYNamICal moDelING of sYsTem CharaCTerIsTICs of a TurTle’s WalK IN orDINarY sITuaTIoNs aND afTer slIGhT sTress<br />
Discussion<br />
One should keep in mind that DMDS is mainly the<br />
method that we used to form the working hypotheses.<br />
The working hypothesis in this paper as well as system<br />
trajectories illustrating it, might present some theoretical<br />
interest to study rather simple cases of an animals’<br />
motion and some practical interest, for example, for the<br />
development of systems of ecological monitoring based<br />
on the remote (aerospace) methods of photographing<br />
animals in nature with further computer image processing<br />
of their silhouettes. Deliberately, the important feature<br />
is possibly to use the DMDS process and analyze<br />
the arrays of incomplete information with data of fragmentary<br />
observations for separate phases of an animals’<br />
motion, in conditions when it is impossible to observe<br />
the time sequence of all motion phases (say, presence of<br />
animals’ shelters, limited time of photographing etc.),<br />
but on the base of which the whole cycle of their motion<br />
can be restored.<br />
There are well known papers on mathematical modeling<br />
in the biomechanics of animal, reptiles, dinosaurs<br />
in particular, and other fossil of animals that have<br />
incomplete information [11, 2, 6, 7, 12, 13]. In all of<br />
these cases the working hypothesis about the structure<br />
of relations between components of a modeled multicomponent<br />
system is needed (in the case of dinosaurs<br />
components are parts of legs taking different but interrelated<br />
positions in the process of motion). This working<br />
hypothesis should be constructed independently from<br />
the results of numerical experiments on the given mathematical<br />
model, say, based on the data about the structure<br />
and position of the tail of a two-legged dinosaur<br />
and analogies with biomechanics of the recent animals.<br />
We speak about a structure which contains a certain set<br />
of relations from the following list of possible pairs of<br />
influences on each other component in a multi-component<br />
system of any kind: ( + , + ) , ( −, − ) , ( − , + ) , ( −,0)<br />
”, ( + ,0) and (0,0) . (The procedures of DMDS explains<br />
that if the previous value of an component, which is a<br />
subject to influence, is high then “minus” the influence<br />
leads to decreasing and a “plus” influence leads to the<br />
increasing of the current value of an component, which<br />
is an object of influence; “zero” influence stabilizes the<br />
current values of an component, which is an object of<br />
influence, on the level of previous ones). In the case of<br />
DMDS, the working hypothesis mentioned above appears<br />
as a result of modeling, and this provided successful<br />
results.<br />
References: 1. Poinar, G.Jr., Poinar R.:What Bugged the<br />
Dinosaurs?: Insects, Disease, and Death in the Cretaceous,<br />
Princeton University Press (2007). 2. Spotilla, J.R., Lommen,<br />
P.W., Bakken G.S., Gates, D.M.: A mathematical model for<br />
body temperature of large reptiles: Implications for dinosaur<br />
endothermy. Am. Nat. 107, 391-404 (1973). 3. Bespalov, Yu.G.,<br />
Derecha, L.N., Zholtkevych, G.N., Nosov, K.V. Discreet<br />
model of the system with negative feedback. Bulletin of V. N.<br />
Karazin Kharkiv National University. Series “Mathematical<br />
Modeling. Information Technology. Automated Control<br />
Systems’’, 833, 27-38 (2008). 4. Bespalov, Yu.G., Zholtkevych,<br />
G.N., Nosov, K.V., Marchenko, V.S., Marchenko, G.P.,<br />
Psarev, V.A., Utevsky, A. Yu.: Contribution to heliobiological<br />
effects investigation with the help of Discrete Modeling of<br />
Dynamical Systems with feedback. In: 8th Gamow Summer<br />
School “Astronomy and beyond: Astrophysics, Cosmology,<br />
Radioastronomy and Astrobiology’’, pp. 12-13. Odessa,<br />
(2008). 5. Zorya, A.V., Nosov, K.V., Bespalov, Yu.G.: On<br />
mathematical methods for forecasting population dynamics<br />
of murine rodents of Kharkiv region. In: Proceedings of 12th<br />
Kharkiv final regional theoretical and practical conference.<br />
Kharkiv, (2009). 6. Hutchinson, J.R., Ng-Thow-Hing, V.,<br />
Anderson, f.C.: A 3D interactive method for estimating body<br />
segmental parameters in animals: application to the turning<br />
and running performance of Tyrannosaurus rex. Journal of<br />
Theoretical Biology, 246, 660-680 (2004). 7. Hutchinson, J.R.:<br />
Biomechanical modeling and sensitivity analysis of bipedal<br />
running ability. II. Extinct taxa. Journal of Morphology, 262,<br />
441-461 (2004). 8. Christian, A., Horn, H.-G., Preuschoft, H.:<br />
Biomechanical reasons for bipedalism in reptiles. Amphibia-<br />
Reptilia, 15, 275-284 (1994). 9. Kalman, R.E., falb P.L., Arbib,<br />
M.A.: Topics in mathematical system theory. McGraw-Hill,<br />
New York, (1969). 10. Gnedenko, B.V.: Theory of Probability.<br />
CRC Press (1998). 11. Pontzer, H., Allen, V., Hutchinson,<br />
J.R.: Biomechanics of Running Indicates Endothermy in<br />
Bipedal Dinosaurs. PLoS ONE, 11, e<strong>77</strong>83 (2009). 12. Hart,<br />
R.T., Hennebel, V.V., Thongpreda, N., Buskirk, W.C.V.,<br />
Anderson, R.C.: Journal of Biomechanics, 25, 261-286 (1992).<br />
13. Papageorgiou, N.S., Kyritsi-Yiallourou, S.T.: Handbook<br />
of Applied Analysis. Springer (2009).<br />
Поступила в редколлегию 20.06.<strong>2011</strong><br />
УДК 004.942+271.47.15.14.21.21<br />
Дискретне динамічне моделювання системних характеристик<br />
ходи черепахи у звичайних обставинах та після легкого<br />
стресу / Ю.Г. Беспалов, І.Д. Городнянський, Г.М.<br />
Жолткевич, І.Т. Зарецька, К.В. Носов, Т.П. Бондаренко,<br />
К.М. Калиновська, Я. Карреро // Біоніка інтелекту:<br />
наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 54-59.<br />
У статті пропонується дискретна динамічна модель,<br />
що дозволяє виразити структуру внутрішньо- та<br />
зовнішньокомпонентних відносин динамічної системи<br />
у термінах міжвидової взаємодії, прийнятої у біології та<br />
екології. Запропонована модель застосовується до вивчення<br />
системних аспектів біомеханіки ходи черепахи у<br />
спокійному стані та після легкого стресу.<br />
Табл. 2. Бібліогр.: 13 найм.<br />
УДК 004.942+271.47.15.14.21.21<br />
Дискретное динамическое моделирование системных<br />
характеристик ходьбы черепахи в обычных условиях и после<br />
легкого стресса / Ю.Г. Беспалов, И.Д. Городнянский,<br />
Г.Н. Жолткевич, И.Т. Зарецкая, К.В. Носов, Т.П. Бондаренко,<br />
Е.М. Калиновская, Я. Карреро // Бионика <strong>интеллект</strong>а:<br />
наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 54-59.<br />
В статье предлагается дискретная динамическая модель,<br />
которая позволяет выразить структуру внутри- та<br />
внешнекомпонентных отношений динамической системы<br />
в терминах межвидовых взаимодействий, принятых<br />
в биологии та экологии. Предложенная модель применяется<br />
для изучения системных аспектов биомеханики<br />
ходьбы черепахи в спокойном состоянии и после легкого<br />
стресса.<br />
Табл. 2. Библиогр.: 13 назв.<br />
59
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 60–64 хНурэ<br />
УДК 519.81<br />
60<br />
Введение<br />
Последнее десятилетие ознаменовалось все более<br />
частыми и глубокими финансово-экономическими<br />
кризисами, которые в настоящее время превратились<br />
в перманентные. Этот процесс сопровождается<br />
расслоением общества, увеличением разрыва<br />
между благополучными и развивающимися странами,<br />
ростом социальной напряженности и экстремизма,<br />
общей политической нестабильностью.<br />
Неустойчивость социально-экономической системы<br />
(СЭС) сопровождается обострением экологической<br />
обстановки, возрастающей угрозой изменения<br />
климата, общей деградацией среды обитания. Все<br />
это в целом стало логическим итогом, как было отмечено<br />
на саммите ООН в Рио-де-Жанейро в 1992,<br />
концепции экономического роста, при которой<br />
экономические показатели доминируют в ущерб<br />
социальным и экологическим. В условиях стихийного<br />
рынка, неограниченной конкуренции, прибыли<br />
«любой ценой» возникает ситуация неконтролируемого,<br />
зачастую хищнического, использования<br />
всех видов ресурсов: природных, экологических,<br />
трудовых. Подобный подход привел цивилизацию<br />
к критическому состоянию. В качестве альтернативы<br />
была сформулирована концепция устойчивого<br />
развития мировой СЭС, предусматривающая гармоничное,<br />
сбалансированное, научно и морально<br />
обоснованное развитие человечества [1].<br />
Концепция устойчивого развития получила декларативную<br />
поддержку большинства стран мира.<br />
Она обсуждалась на саммите Тысячелетия (Нью-<br />
Йорк, 2000 г.), всемирном саммите по Устойчивому<br />
развитию (Йоханнесбург, 2002 г.), конференциях<br />
в Киото (Япония) и Брюсселе. Однако,<br />
практические итоги двух прошедших десятилетий,<br />
особенно в социальной сфере близки к нулевым.<br />
В экологической сфере дальше деклараций<br />
о готовности принимать меры, ситуация так же<br />
не продвинулась. В результате СЭС в измерении<br />
«устойчивого развития» продолжает деградировать<br />
возрастающими темпами.<br />
Э.Г. Петров 1 , Е.В. Губаренко 2<br />
1 ХНУРЕ, м. Харків, Україна, ST@kture.kharkov.ua;<br />
2 ХНУРЕ, м. Харків, Україна, vergeley@mail.ru<br />
РОЛЬ, ЗАДАЧИ И МЕТОДЫ ГОСУДАРСТВЕННОГО<br />
УПРАВЛЕНИЯ ПРИ РЕАЛИЗАЦИИ КОНЦЕПЦИИ<br />
УСТОЙЧИВОГО РАЗВИТИЯ<br />
Описан процесс восприятия государством социальных ресурсов и методы их описания. Проанализирован<br />
процесс обмена живого труда на универсальный ресурс. Сформулированы целевые требования к<br />
государственным органам управления. Подчеркнута необходимость ориентации государства на системы<br />
здравоохранения и образования<br />
СОЦИАЛЬНЫЕ РЕСУРСЫ, ГОСУДАРСТВО, ФОРМИРОВАНИЕ БЮДЖЕТА, ЖИВОЙ ТРУД,<br />
УНИВЕРСАЛЬНЫЙ РЕСУРС, ЗДРАВООХРАНЕНИЕ, СИСТЕМА ОБРАЗОВАНИЯ<br />
Большинство государств и представляющие их<br />
политические деятели понимают необходимость<br />
изменения ситуации, но хотят остаться в стороне,<br />
сохранив идеологию концепции экономического<br />
роста, рассчитывая, что другие государства компенсируют<br />
их безучастность собственными ресурсами.<br />
Такая ситуация обусловлена тем, что правительства<br />
всех стран, которые хотя бы декларативно<br />
заявляют о демократии, являются заложниками<br />
общественного мнения, а изменение взглядов и<br />
переориентирование их на новую концепцию требуют<br />
проявления сильной политической воли, что<br />
обществом всегда воспринималось крайне негативно.<br />
Вторым аспектом, сдерживающим практическую<br />
реализацию концепции устойчивого развития,<br />
является тот факт, что политическая жизнь во<br />
всех странах превратилась в бизнес-проект, когда<br />
группа лиц, финансирует продвижение некоторого<br />
индивида, который впоследствии становится<br />
выразителем их воли и защитником их интересов.<br />
Другими словами, демократия практически во всех<br />
странах выродилась в разновидности олигархии.<br />
Государство при таком способе правления выражает<br />
интересы не всего общества как целого, а только<br />
узкой социальной группы.<br />
Вместе с этим, из-за роста недовольства в обществе,<br />
которое выражается в виде протестов, забастовок,<br />
митингов, акций неповиновения вплоть<br />
до вооруженных столкновений и революций, государства<br />
вынуждены переориентировать свою<br />
политику на более полное удовлетворение потребностей<br />
общества в целом и составляющих его индивидов.<br />
Однако изменения должны быть системно аргументированы,<br />
проявлять признаки эволюционной<br />
наследственности, создавать условия для удовлетворения<br />
потребностей всех членов общества, сохраняя<br />
устойчивость СЭС. Реализация этих задач<br />
требует существенного изменения роли государственного<br />
управления, разработки новых моделей,
рОЛЬ, ЗАДАЧИ И МЕТОДЫ ГОСуДАрСТВЕННОГО уПрАВЛЕНИЯ ПрИ рЕАЛИЗАЦИИ КОНЦЕПЦИИ уСТОЙЧИВОГО рАЗВИТИЯ<br />
методов и средств их реализации, особенно в социальной<br />
сфере.<br />
Цель настоящей статьи заключается в системном<br />
анализе общественных и личных потребностей<br />
социума как системообразующего элемента<br />
государства, а также обосновании роли и задач<br />
государственного управления национальной социальной<br />
системой и определении возможных<br />
способов их решения в условиях перехода к концепции<br />
устойчивого развития.<br />
1. Роль и место социального ресурса<br />
в государстве<br />
Государство является организационной формой<br />
СЭС, которая является сложной целенаправленной<br />
системой, элементами которой выступают социум<br />
(социальные группы), субъекты экономических<br />
процессов и природно-экологическая среда.<br />
Особая роль социального элемента заключается в<br />
том, что он единственный является активным, т.е.<br />
способен формировать цели СЭС.<br />
Концептуальная (общая) цель СЭС заключается<br />
в том, что она должна как можно полно удовлетворять<br />
материальные и духовные потребности социума<br />
в целом и каждого индивида в отдельности.<br />
В свою очередь, все три элемента СЭС являются<br />
сложными метасистемами. Элементами социальной<br />
системы выступают индивидуумы, которые<br />
на основе межличностных отношений образуют<br />
сложную многоуровневую социальную структуру,<br />
порождающую основное свойство СЭС – ориентацию<br />
на удовлетворение потребностей общества.<br />
Реализация указанного свойства основана на производстве<br />
благ путем трансформации природноэкологических<br />
ресурсов с помощью живого труда в<br />
материальные и духовные блага посредством экономической<br />
системы. Это означает, что именно<br />
экономическая система является средством достижения<br />
цели СЭС как целостной метасистемы. В<br />
таком контексте живой труд является уникальным<br />
незаменимым ресурсом, а его количество и качество<br />
определяют эффективность СЭС.<br />
Трудность реализации цели СЭС обусловлена<br />
сложностью структуры социальной системы.<br />
Эта сложность заключается в том, что все элементы<br />
социальной системы являются активными<br />
целенаправленными элементами с уникальными<br />
потребностями по различным характеристикам и<br />
показателям. Это означает, что непосредственное<br />
удовлетворение потребностей каждого индивида<br />
невозможно. Поэтому в процессе развития цивилизации<br />
сложился следующий механизм удовлетворения<br />
индивидуальных потребностей: индивидуум<br />
посредством экономической системы обменивает<br />
свой живой труд на универсальный ресурс – деньги,<br />
которые затем путем обмена трансформирует<br />
в любые материальные и духовные блага.<br />
Такой механизм в процессе развития СЭС привел<br />
к тому, что на некотором этапе произошла<br />
подмена целей: цель удовлетворения потребностей<br />
каждого индивида была заменена целью максимизации<br />
прибыли (денежных средств) социальных<br />
групп, что вылилось в концепцию экономического<br />
роста и привело цивилизацию к границе устойчивости<br />
за счет хищнического, неконтролируемого,<br />
стихийного использования всех видов ресурсов, в<br />
том числе живого труда (трудовых ресурсов).<br />
Государство является бюрократической надстройкой,<br />
которой общество делегирует полномочия<br />
управлять СЭС для эффективной реализации<br />
стратегии (траектории) достижения цели. При<br />
этом, так как с одной стороны индивидуальные<br />
потребности являются ненасыщаемой функцией,<br />
а с другой, часто не совпадают и даже противоречивы,<br />
необходима концепция управления, гармонизирующая<br />
социальные отношения.<br />
В этих условиях под управлением понимается<br />
не принудительное подчинение одних социальных<br />
групп другим, а осознанный выбор социальных<br />
решений.<br />
Многие исследователи в настоящий момент<br />
развивают социально-экономический подход к<br />
анализу и учету социальных ресурсов. Появились<br />
новые индексы и индикаторы в мировой практике<br />
(индекс устойчивого развития, индекс развития<br />
человека) [2], которые разносторонне учитывают<br />
аспекты функционирования СЭС. Разрабатываются<br />
новые научные направления (экономика труда<br />
и прочее), где стараются объединить практику<br />
социологии и экономики.<br />
Труд с социальной точки зрения – деятельность<br />
человека, результатом которой является производство<br />
общественно полезных (или, хотя бы, потребляемых<br />
обществом) продуктов – материальных<br />
(товаров, услуг или средств их производства) или<br />
духовных [3]. Благодаря трудовой деятельности<br />
общество создает элементы культурного наследия,<br />
формирует производственный потенциал, накапливает<br />
знания и опыт, а также формирует характер<br />
взаимоотношений между человеком и природой.<br />
Ни один процесс искусственных целенаправленных<br />
систем, будь то общественные, организационные,<br />
экономические, технические и прочие системы,<br />
не может протекать без непосредственного<br />
участия человека, в частности без некой трудовой<br />
деятельности.<br />
С экономической точки зрения труд – процесс<br />
сознательной, целесообразной деятельности людей,<br />
с помощью которой они видоизменяют вещество<br />
и силы природы, приспосабливая их для<br />
удовлетворения своих потребностей [3].<br />
Как отдельному индивидууму, так и группе в<br />
целом свойственны социальные и индивидуально-психологические<br />
особенности. К социальным<br />
61
э.Г. Петров, Е.В. Губаренко<br />
особенностям могут быть отнесены потребности,<br />
мотивы и мотиваторы, ценностные ориентации,<br />
цели и ожидания, межличностные отношения, в<br />
том числе формальные и неформальные, социально-психологический<br />
климат в коллективе, уровень<br />
профессиональной подготовленности и т.д.<br />
Предметы труда (природное вещество, на которое<br />
человек воздействует в процессе труда) и средства<br />
труда (вещь или совокупность вещей, которые<br />
служат для реализации воздействия) не функционируют,<br />
если они не включены в процесс живого<br />
труда. Другими словами, человек, как единственный<br />
источник трудовой деятельности, является не<br />
просто частью системы производства, накопления,<br />
перераспределения, обмена и потребления благ,<br />
но ключевой составляющей. Без наличия человека<br />
в такой системе сама система теряет смысл. Из<br />
этого следует, что на успешное функционирование<br />
экономических и производственных систем достаточно<br />
сильное воздействие оказывают социальный<br />
и психологический аспекты.<br />
В социологи используют пять основных подходов<br />
при изучении и объяснении различных фактов<br />
[4].<br />
1. Демографический – изучение населения: рождаемости,<br />
смертности, миграции и связанной с<br />
этим деятельности людей. Долгое время основной<br />
подход к изучению демографических процессов<br />
был количественным, основные принципы которого<br />
были сформулированы Томасом Мальтусом<br />
еще в XVIII в. Современный взгляд на данные процессы<br />
связан более с системным подходом, восприятием<br />
демографической структуры общества<br />
как целостной мировой системы с уникальными<br />
законами и закономерностями. Одним из ярчайших<br />
представителей этого направления является<br />
С.П. Капица [5].<br />
2. Психологический – объясняет поведение человека<br />
с точки зрения его восприятия, как собственного,<br />
так и окружающих. Изучаются такие<br />
понятия как мотивы, мысли, навыки, представления<br />
человека о самом себе. Социальные психологи<br />
исследуют формирование социальных установок,<br />
взаимодействие общества и личности в процессе<br />
социализации, формирование и распространение<br />
настроений.<br />
3. Коллективистический подход применяется,<br />
когда изучаются два или более индивида, образующих<br />
группу. При помощи данного подхода анализируются<br />
конкуренция между политическими<br />
партиями, конфликты на расовой основе, соперничество<br />
между группами, бюрократические системы.<br />
Он также помогает понять, каким образом<br />
люди, принадлежащие к одному общественному<br />
классу, расе или связанные одинаковым этническим<br />
происхождением, возрастом, полом, образуют<br />
группы с целью защиты своих интересов (до-<br />
62<br />
стижения целей). Кроме того, этот подход важен<br />
при изучении коллективного поведения, например<br />
действий толпы, реакции аудитории, а также таких<br />
общественных движений, как борьба за гражданские<br />
права, феминизм, массовые акции протеста.<br />
4. Взаимоотношения – общественная жизнь рассматривается<br />
не через определенных участвующих<br />
в ней людей, а через их взаимодействие друг<br />
другом, обусловленное их ролями. В большинстве<br />
случаях социальный статус (роль) оказывает непосредственное<br />
влияние на выбор цели и траектории<br />
ее достижения. Более подробно данный аспект будет<br />
описан ниже при описании особенностей формирования<br />
обобщенных целей.<br />
5. Культурологический – он применяется при<br />
анализе поведения на основе таких элементов<br />
культуры, как общественные морально-этические<br />
правила (гласные или негласные) и общественные<br />
ценности (вытекающие из религиозных, политических<br />
и социальных интересов). Очень важно<br />
осознавать, что цели и траектория достижения<br />
целей выбираются индивидом из множества не<br />
только возможных альтернатив, но и приемлемых<br />
по этическим, религиозным и культурным ограничениям.<br />
Менталитет, этнические и национальные<br />
особенности, привычки, определяют предрасположенность<br />
различных социальных групп к выбору<br />
схожих целей и траекторий их достижения.<br />
Следует отметить, что при выборе государственной<br />
социальной политики (управляющих<br />
решений) необходимо учитывать все перечисленные<br />
выше подходы к анализу и идентификации<br />
социума, его групп и отдельных индивидов, так<br />
как полнота исходной информации является необходимым<br />
условием эффективности принимаемых<br />
организационных решений [6]. Практическая<br />
реализация указанного процесса является задачей<br />
социального мониторинга как составной части<br />
системы общего мониторинга СЭС.<br />
Государство должно обеспечить максимизацию<br />
уровня удовлетворения потребностей каждого<br />
индивида. Но достичь полного удовлетворения<br />
потребностей невозможно по двум причинам: вопервых,<br />
государство не может идентифицировать<br />
все потребности каждого индивида, а во-вторых,<br />
ресурсы государства ограничены. В сложившейся<br />
системе социально-экономических отношений целевая<br />
задача решается опосредованно путем обмена<br />
личного живого труда на универсальный ресурс<br />
– деньги, которые затем индивид трансформирует<br />
в личные потребности.<br />
При всей кажущейся самостоятельности процесса<br />
обмена живого труда на универсальный ресурс,<br />
именно государство должно обеспечивать потенциальную<br />
возможность каждому индивидууму<br />
максимизировать уровень личного потребления.<br />
При этом в условиях рыночных отношений госу-
рОЛЬ, ЗАДАЧИ И МЕТОДЫ ГОСуДАрСТВЕННОГО уПрАВЛЕНИЯ ПрИ рЕАЛИЗАЦИИ КОНЦЕПЦИИ уСТОЙЧИВОГО рАЗВИТИЯ<br />
дарство не всегда может непосредственно устанавливать<br />
цены на рынке труда. Стоимость живого<br />
труда, как и любого другого ресурса, определяется<br />
его количеством и качеством. В этих условиях<br />
средством достижения глобальной государственной<br />
цели является создание потенциальных условий<br />
для максимизации личного потенциала индивидов<br />
(т.е. максимизация количества и качества<br />
труда). При этом количество производимого труда<br />
определяется уровнем здоровья индивидуума, а<br />
качество – уровнем его <strong>интеллект</strong>уального развития.<br />
Поэтому именно система здравоохранения и<br />
система образования являются основными рычагами<br />
государственного управления в социальноориентированном<br />
государстве.<br />
2. Формирование бюджета<br />
Как уже отмечалось, государство непосредственно<br />
не производит материальных и духовных<br />
благ, но располагает консолидированным денежным<br />
бюджетом, пропорциональным в общем случае<br />
эффективности экономики государства. Так<br />
как деньги можно трансформировать в любой<br />
ресурс, на основе бюджета реализуются любые<br />
управляющие воздействия. При этом при выборе<br />
управления, статей и объемов расхода должны выполняться<br />
следующие условия:<br />
– должен отсутствовать дефицит бюджетных<br />
средств, объем расходов не должен превышать объем<br />
исходного бюджета. К сожалению, на данный<br />
момент далеко не каждая страна на нашей планете<br />
может похвастать выполнением этого условия;<br />
– расширенное воспроизводство бюджета или<br />
поступательный рост наполняющих его статей. Это<br />
означает, что государство вынуждено в первую очередь<br />
финансировать бюджетообразующие процессы<br />
с целью увеличить объем поступлений в бюджет<br />
и тем самым расширить собственные возможности;<br />
– эффективность использования бюджетных<br />
средств. Государство не зарабатывает денежных<br />
средств, а лишь заимствует их у общества с целью<br />
интеграции и более эффективного целенаправленого<br />
использования путем перераспределения.<br />
В случае, когда эффективность использования<br />
денежных средств государством ниже предполагаемой<br />
эффективности использования обществом,<br />
целесообразность существования государства как<br />
органа управления ставится под сомнение.<br />
3. Подход к решению целевых задач государства<br />
При решении этих формальных задач будем<br />
исходить из следующих соображений: объем<br />
бюджета пропорционален объему валового внутреннего<br />
продукта (ВВП), так как формируется<br />
как его процентная норма, следовательно, нужно<br />
принимать решения, стимулирующие его рост. В<br />
свою очередь, объем ВВП является неубывающей<br />
функцией численности активного населения, производительности<br />
труда и уровня его потребления,<br />
другими словами, чем выше численность населения<br />
и разнообразней структура потребления,<br />
тем выше ВВП. Например, первые три места по<br />
объему ВВП занимают ЕС, США и Китай, первые<br />
два известны своим потреблением, превышающим<br />
среднемировой уровень в разы, Китай же известен<br />
численностью населения.<br />
Следовательно, для выполнения ранее описанных<br />
условий государство должно обеспечить:<br />
– естественный прирост населения;<br />
– максимизацию количества живого труда при<br />
фиксированном уровне активного населения за<br />
счет снижения потерь по болезням, эпидемическим<br />
и хроническим заболеваниям, инвалидности<br />
и прочее;<br />
– производительность (качество) труда;<br />
– рост личного потребления и разнообразие его<br />
структуры.<br />
Существует два основных аспекта, на которые<br />
государство способно воздействовать, чтобы решить<br />
целевые задачи: здравоохранение (продолжительность<br />
жизни, устойчивость к заболеваниям)<br />
и образование (воспитание, фактологические<br />
знания, квалификационные умения). Здоровье состоит<br />
из физического и психологического. К физическому<br />
относят:<br />
– здоровье родителей до зачатия и во время беременности<br />
– основной путь увеличения численности<br />
населения – это естественный прирост, и<br />
чем здоровее родители, тем выше вероятность здорового<br />
потомства;<br />
– здоровье детей – во время развития очень<br />
важно сохранить здоровье молодого поколения по<br />
двум причинам, во-первых, именно в этот момент<br />
формируется способность человека противостоять<br />
болезням и обеспечивается долголетие; во-вторых,<br />
чем здоровее индивид, тем больше благ он способен<br />
произвести для общества;<br />
– здоровье взрослого населения – это основной<br />
производитель общественных благ, чем дольше<br />
индивиды сохраняют свое здоровье, тем больше и<br />
качественнее производят блага; каждая профессия<br />
и род занятий сопряжен с рисками для различных<br />
заболеваний, поэтому на государство возлагается<br />
груз разработки правовых и нормативных требований<br />
к трудовой деятельности.<br />
К психологическому здоровью относят:<br />
– профилактику и лечение душевных расстройств;<br />
– обеспечения уровня удовлетворения и счастья;<br />
– повышения производительности труда, посредством<br />
мотивационной стимуляции.<br />
Человек не способен контактировать, производить<br />
блага или просто выжить в современном<br />
63
э.Г. Петров, Е.В. Губаренко<br />
обществе без определенных знаний и умений. Поэтому<br />
государство посредством образовательных<br />
систем (дошкольной и школьной) предоставляет<br />
индивиду определенный набор знаний и умений,<br />
которыми необходимо обладать, дабы стать полноправным<br />
и полноценным членом общества. Также<br />
такие понятия как воспитание, этические нормы,<br />
правила поведения, социальные роли и нормы<br />
тоже прививаются в результате образования.<br />
Следует подчеркнуть, что вложения в указанные<br />
нематериальные сферы являются косвенными<br />
инвестициями в развитие материального производства.<br />
Выводы<br />
Государство как орган управления обществом<br />
было создано с целью удовлетворения личных целей<br />
индивидов, путем обеспечения роста объемов<br />
и разнообразия общественных благ. Чтобы удовлетворить<br />
максимально возможное количество<br />
личных целей индивидов, государство должно повышать<br />
эффективность производства общественных<br />
благ, а так как единственным производителем<br />
благ является человек, то речь идет о повышении<br />
эффективности живого труда. Такие показатели<br />
как производительность труда, эффективность,<br />
уровень производства являются немаловажными,<br />
и их рост достигается за счет повышения квалифицированности<br />
индивидов посредствам систем образования.<br />
Вторым принципиально важным направлением<br />
является долговечность производителей благ.<br />
Причем система здравоохранения, призванная решить<br />
эту проблему, должна обеспечить не просто<br />
выживание, а сохранить здоровье человека на таком<br />
уровне, чтобы он мог максимально долго и эффективно<br />
производить общественные блага.<br />
Государство неспособно напрямую обеспечивать<br />
удовлетворение каждой личной цели индивида,<br />
как и не может определить правомерность<br />
предоставления индивиду доступа к общественным<br />
благам. Поэтому была разработана схема, по<br />
которой человек обменивает свой живой труд на<br />
вознаграждение (универсальный ресурс), который<br />
впоследствии может обменять на общественное<br />
благо и достичь личной цели.<br />
Проведенный в статье системный анализ целей<br />
и задач государственного управления позволяет<br />
наметить основные направления и принципы формирования<br />
расходной части государственного и<br />
региональных бюджетов СЭС. Однако конкретизация<br />
и детализация намеченных принципов требует<br />
разработки решения комплекса оптимизационных<br />
задач по распределению ограниченного объема<br />
бюджетных ресурсов по критерию максимизации<br />
дохода в бюджет на следующем плановом интервале.<br />
В свою очередь это требует синтеза социаль-<br />
64<br />
но-экономических моделей, устанавливающих<br />
связь величины бюджетных расходов с ожидаемым<br />
бюджетообразующим эффектом. Государственная<br />
политика должна стать принятием строго аргументированных,<br />
научно обоснованных социальноэкономических<br />
решений.<br />
Список литературы: 1. Коптюг, В.А. Конференция ООН по<br />
окружающей среде и развитию (Рио-де-Жанейро, июнь<br />
1992 года). Информационный обзор [Текст] / В.А. Коптюг.<br />
– Новосибирск: СО РАН, 1992. – 63 с. 2. Згуровский,<br />
М.З. Роль инженерной науки и практики в устойчивом<br />
развитии общества [Текст] / М.З. Згуровский, Г.А. Статюха<br />
// Системні дослідження та інформаційні технології.<br />
– 2007. – <strong>№</strong>1. – С. 19-38. 3. Экономика труда: учебник. 2-е<br />
изд., перераб. И доп. / под ред. проф. Ю.П. Кокина, проф.<br />
П.Э. Шлендера. – М.: Магистр, 2010. – 686 с. 4. Смелзер,<br />
Н. Социология [Текст] / Н. Смелзер: пер. с англ. – М.:<br />
Феникс, 1994. – 688 с. 5. Капица, С.П. Парадоксы роста.<br />
Законы развития человечества [Текст] / С.П. Капица. –<br />
М.: АНФ. – 2010. – 192 с. 6. Глушков, В.М. Введение в<br />
АСУ [Текст]: изд.2-е, исправленное и дополненное / В.М.<br />
Глушков. – К.: Техніка, 1974, – 320 с.<br />
Поступила в редколлегию 29.06.<strong>2011</strong><br />
УДК 519.81<br />
Роль, завдання та методи державного управління при<br />
реалізації концепції сталого розвитку / Е.Г. Петров, Є.В.<br />
Губаренко // Біоніка інтелекту: наук.-техн. журнал. –<br />
<strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 60-64.<br />
Держава, як орган управління суспільством, має створювати<br />
умови для максимізації рівня особистого споживання<br />
індивідів. Для цього необхідно відмовитися від<br />
сприйняття населення як пасивної частини економічних<br />
процесів і сконцентрувати увагу на соціальних аспектах<br />
суспільства. Держава покликана підтримувати суспільні<br />
процеси, перерозподіляючи і стимулюючи виробництво<br />
суспільних благ. За допомогою формування кількісних і<br />
якісних характеристик індивіда, як джерела живої праці,<br />
держава має можливість підвищувати його потенційні<br />
можливості задоволення рівня особистого споживання.<br />
Інструментами такого впливу є системи охорони<br />
здоров’я і освіти.<br />
Бібліогр.: 6 найм.<br />
UDK 519.81<br />
The role, tasks and methods of state management in implementing<br />
the concept of sustainable development / E.G. Petrov,<br />
E.V. Gubarenko // Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>.<br />
– <strong>№</strong> 3 (<strong>77</strong>). –P. 60-64.<br />
The state, as the management body of the company, should<br />
create conditions to maximize the level of personal consumption<br />
of the individual. for this it is necessary to abandon the<br />
prevailing perceptions of the population as a passive part of<br />
the economic processes and focus on the social aspects of society.<br />
The state should support social processes, redistributing<br />
and stimulating the production of public goods. Through the<br />
formation of a quantitative and qualitative characteristics of<br />
the individual as the source of living labour, the state has the<br />
possibility to increase the potential of the satisfaction level of<br />
personal consumption. Instruments of such influence are the<br />
health and education systems.<br />
Ref.: 6 items.
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 65–69 хНурэ<br />
УДК 519.72;681.326<br />
Введение<br />
Развитие возможностей средств вычислительной<br />
техники, появление средств визуализации<br />
различных процессов позволяют перейти от номотетического<br />
способа представления информационных<br />
систем к их идеографическому представлению.<br />
Если номотетический подход – это способ<br />
познания, целью которого является установление<br />
общего, имеющего форму закона, то идеографический<br />
подход – это способ познания, целью которого<br />
является изображение объекта как единого<br />
уникального целого. Главной особенностью идеографического<br />
метода является постижение индивидуального<br />
в его однократности, уникальности и<br />
неповторимости.<br />
Номотетический и идеографический подходы<br />
различаются по нескольким основаниям. Во-первых,<br />
по-разному понимается объект измерения.<br />
Если в рамках номотетического подхода присутствует<br />
понятие объекта как набора свойств, то<br />
идеографический подход представляет объект как<br />
целостную систему. Во-вторых, для каждого из<br />
подходов характерна разная направленность измерений:<br />
выявление и измерение общих для всех<br />
объектов их свойств – для номотетического подхода<br />
и распознание индивидуальных особенностей<br />
объекта – для идеографического подхода. И,<br />
в-третьих, характер методов измерения в каждом<br />
из подходов различен по процессу и содержанию:<br />
стандартизованные методы измерения с одной<br />
стороны, и проективные методики и качественные<br />
техники – с другой.<br />
Индивидуализация, переход к конкретным особенностям<br />
каждой из информационных систем<br />
требуют их представления в терминах идеографического<br />
подхода в виде индивидуальных образов.<br />
Однако решение подобной задачи невозможно без<br />
разработки некоторой индивидуальной модели,<br />
которая позволит представить как общие, так и<br />
личностные свойства информационных систем. В<br />
связи с тем, что человеческое мышление оперирует<br />
образами, а не формулами и цифрами, при разработке<br />
индивидуальной модели необходим переход<br />
С. В Кузьменко<br />
ХНУВД, м. Харьков, Украина, unlaudt@kture.kharkov.ua<br />
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ИДЕОГРАФИЧЕСКОГО МЕТОДА<br />
Проведен анализ современного состояния использования идеографического подхода для решения<br />
задач моделирования информационных систем. Приведено математическое описание теоретических<br />
основ идеографического метода, а также структура информационной технологии идеографического<br />
описания систем.<br />
ИНФОРМАЦИОННЫЕ СИСТЕМЫ, НОМОТЕТИЧЕСКИЙ ПОДХОД, ИДЕОГРАФИЧЕСКИЙ<br />
ПОДХОД, ТЕОРЕТИЧЕСКИЕ ОСНОВЫ, ИДЕОГРАФИЧЕСКОЕ МОДЕЛИРОВАНИЕ, ИДЕОГРАМ-<br />
МА, ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ ИДЕОГРАФИЧЕСКОГО ОПИСАНИЯ СИСТЕМ<br />
к широкому использованию идеографического метода<br />
в сочетании с номотетическим.<br />
За последние 10-15 лет появился ряд работ, в<br />
которых сделана попытка разработки такой модели.<br />
В работах [1, 2] предложен идеографический<br />
метод представления систем имитационного<br />
моделирования, что позволило разработать ряд<br />
программных средств оперативного построения<br />
имитационных программ [3, 4]. В работах [5, 6] эти<br />
результаты были развиты для 2-уровневых имитационных<br />
моделей информационно-технологических<br />
систем, взаимосвязи между уровнями которых<br />
осуществляются на информационном уровне. В<br />
настоящее время получены результаты [7], которые<br />
позволяют распространить их на более широкий<br />
класс систем.<br />
1. Постановка задачи<br />
Проведенный анализ позволяет поставить следующую<br />
задачу: разработать теоретические основы<br />
идеографического метода и информационную<br />
технологию идеографического описания систем,<br />
которые, с одной стороны, позволят представлять<br />
различные системы с учетом их индивидуальности,<br />
а с другой – объединить идеографическое описание<br />
с их номотетическим представлением.<br />
2. Теоретические основы метода<br />
Основным методологическим предположением<br />
метода является предположение о том, что любая<br />
система может быть с определенной степенью точности<br />
представлена ее идеографической моделью.<br />
Определение 1. Любая система S может быть<br />
представлена ее идеографической моделью Mg ,<br />
т.е. Mg ≡ S , что определяет ее индивидуальность в<br />
однократности, уникальности и неповторимости.<br />
Любая система S имеет определенную структуру<br />
и описывается своими неповторимыми характеристиками.<br />
Исходя из этого, идеографическая<br />
модель Mg системы S строится на основе идеографических<br />
элементов Igi .<br />
Определение 2. Система S, которая моделируется,<br />
состоит из множества объектов Оb ,( i = 1 , n)<br />
.<br />
i<br />
65
С. В Кузьменко<br />
При этом во множестве Ob = { Obi } нет равнозначных<br />
объектов:<br />
66<br />
S = ∪ Ob, ( i = 1,<br />
n);<br />
i<br />
∀i ∈n∃ ! Ob ( Y = F( X ).<br />
i i i<br />
Определение 3. Идеографическая модель Mg<br />
системы S является объединением идеологических<br />
элементов Igi :<br />
n<br />
∪<br />
Mg = Ig ,( i = 1,<br />
n)<br />
.<br />
i = 1<br />
Определение 4. Идеографический элемент Igi описывает только один определенный объект Obi реальной системы, т.е.<br />
∀Ig ∈Ig ∨∀Ob ∈Ob∃! Ig ≡Ob<br />
.<br />
i<br />
i i i i<br />
Определение 5. Идеографические элементы Igi подразделяются на два вида: структурный идеогра-<br />
c<br />
фический элемент Igi ; функциональный идеогра-<br />
ф<br />
фический элемент Igi .<br />
Определение 6. Структурный идеографический<br />
c<br />
элемент Igi идеографической модели Mg описывает<br />
только один определённый структурный объ-<br />
c<br />
ект Оbi обработки материального потока моделируемой<br />
системы S .<br />
Определение 7. Функциональный идеографи-<br />
ф<br />
ческий элемент Igi идеографической модели Mg<br />
описывает методы обработки данных и их визуализации<br />
в моделируемой системе S .<br />
c<br />
Определение 8. Структурный Igi и функцио-<br />
ф<br />
нальный Igi идеографические элементы имеют<br />
трёхуровневую структуру, которая состоит из логического<br />
(l), концептуального (k) и физического<br />
(f) уровней (рис. 1).<br />
Логический уровень Igi – это идеографическое<br />
представление объекта Obi системы S, т.е. графическое,<br />
видеографическое или иное изображение,<br />
которое является легко узнаваемым. Физический<br />
уровень Igi – это физический элемент объекта<br />
Obi системы S , который может быть представлен<br />
в виде устройства, программы, схемы или другого<br />
элемента. Концептуальный уровень Igi – это уровень<br />
преоб-разования идеографического описания<br />
Igi в его физическое описание. Этот уровень может<br />
быть представлен математическими моделями,<br />
функциональными зависимостями и другим.<br />
ф ф ф<br />
Определение 9. Функция F : X → Y или<br />
ф ф ф<br />
Y = F ( X ) есть отображение множества входных<br />
значений X ф во множество элементов выходных<br />
результатов Y ф каждого из функциональных<br />
ф<br />
идео-графических элементов Igi идеографической<br />
модели Mg на каждом из уровней отобра-<br />
ф ф ф<br />
жения: l , k , f . Пространство входных переменных<br />
определяется областями определения A ф<br />
ф ф ф<br />
переменных x1 , x2 ,..., x ф , а элементом входных<br />
A<br />
ф ф ф<br />
данных являются точки x1 , x2 ,..., x ф . Простран-<br />
A<br />
ство выходных переменных определяется областями<br />
значений B ф ф ф ф<br />
переменных y1 , y2 ,..., y ф ,<br />
B<br />
а элементом выходных результатов являются точки<br />
ф ф ф<br />
y1 , y2 ,..., y ф .<br />
B<br />
Рис. 1. Структурная схема идеографического<br />
элемента Ig i<br />
c c c<br />
Определение 10. Функция F : X → Y или<br />
c c c<br />
Y = F ( X ) есть отображение множества входных<br />
значений X c во множество элементов выходных<br />
результатов Y c каждого из структурных идеогра-<br />
c<br />
фических элементов Igi идеографической модели<br />
c c c<br />
Mg на каждом из уровней отображения: l , k , f .<br />
Пространство входных переменных определяется<br />
областями определения A c переменных<br />
c c c<br />
x1, x2,..., x c , а элементом входных данных явля-<br />
A<br />
c c c<br />
ются точки x1, x2,..., x c . Пространство выходных<br />
A<br />
переменных определяется областями значений B c<br />
c c c<br />
переменных y1, y2,..., y c , а элементом выходных<br />
B<br />
c c c<br />
результатов являются точки y1, y2,..., y c .<br />
B<br />
j j j<br />
Аксиома 1. Функция F : X → Y или<br />
j j j<br />
Y = F ( X ), где j = ( l, k, f ) для каждого из уровней<br />
идеографического элемента Igi (структурного<br />
или функционального) идеографической модели<br />
Mg , имеет свои, свойственные только ей области<br />
l k f<br />
определения входных A , A , A и выходных пере-<br />
l k f<br />
менных B , B , B , а также соответствующие эле-<br />
j j<br />
менты входных xi и выходных yi результатов.<br />
Теорема 1. Идеографическая модель Mg системы<br />
S имеет трехуровневую структуру, состоящую<br />
из логического (), l концептуального ( k ) и физического<br />
( f ) уровней.<br />
Доказательство. Исходя из определения 8,<br />
идеографический элемент Igi имеет трехуровневую<br />
структуру, а исходя из определения 3 идеографическая<br />
модель Mg является объединением идеографических<br />
элементов, поэтому идеографическая<br />
модель Mg наследует структуру идеографического<br />
элемента и имеет трехуровневую структуру.<br />
Теорема 2. Идеографический элемент Igi (структурный или функциональный) на каждом<br />
уровне описания состоит из: плана отображения<br />
j ( П0 ) — графического отображения функции пре-<br />
j j j<br />
образования Y = F ( X ) во множество переменных<br />
P j , которые состоят из переменных входа,<br />
j<br />
выхода и внутренних переменных P<br />
j j j<br />
x , y , v ;<br />
= { }
j<br />
плана содержания ( Пc ), математического выражения,<br />
которое задает преобразование множества<br />
j j j j<br />
переменных P = { x , y , v } .<br />
Доказательство. На основании определений<br />
4, 9 и 10 идеографический элемент Igi имеет, вопервых,<br />
многоуровневую структуру, а во-вторых,<br />
описывается функцией преобразования Y = F ( X )<br />
множества входных элементов данных X во множество<br />
выходных результатов Y , что, в общем<br />
случае, является математическим выражением, а<br />
в-третьих, свое отображение в соответствии с восприятием<br />
различными категориями пользователей.<br />
Теорема 3. Между планом отображения По и планом содержания Пc уровней описания<br />
идеогра-фического элемента Igi (структурного или<br />
функцио-нального) есть взаимнооднозначное соответствие,<br />
которое описывается с помощью плана<br />
lk lf kf<br />
отображения ( По , По , По ) и плана содержания<br />
lk lf kf<br />
( Пc , Пc , Пc ) уровней.<br />
Доказательство. Исходя из того, что каждый<br />
идеографический элемент Igi описывает<br />
один определенный объект моделируемой системы<br />
(определение 4), а также из того, что каждый<br />
уровень описания имеет свой план отображения<br />
l k f<br />
l k f<br />
( По, По, По<br />
) и содержания ( Пc, Пc, Пc<br />
) – теорема<br />
2, выходит, что между планами отображения<br />
( По ) и планами содержания Пc ( ) уровней можно<br />
найти математическое выражение – план отобра-<br />
lk lf kf<br />
жения уровней ( По , По, По<br />
) и план содержания<br />
lk lf kf<br />
уровней ( П , П , П ) :<br />
c c c<br />
l lk k<br />
c c c<br />
П = П ( П );<br />
l lf f<br />
c c c<br />
П = П ( П );<br />
k kf f<br />
c c c<br />
П = П ( П ) .<br />
При этом считается, что расположение кодов<br />
уровней в верхнем индексе определяет порядок<br />
отображения: lk – логического в концептуальный,<br />
lf – логического в физический, kf – концептуального<br />
в физический.<br />
j<br />
Теорема 4. Выходные результаты yi идеографиического<br />
элемента Igi (структурного или функ-<br />
j<br />
ционального) не могут быть входными xi данными<br />
того же элемента.<br />
Доказательство. Если в идеографической<br />
модели Mg существует y = f ( yx , ) , то это означает,<br />
что объект Obi моделируется системой, передает<br />
выходные результаты на свой вход, что невозможно<br />
в классе последовательно связанных объектов<br />
системы.<br />
Аксиома 2. Количество и степень отношения<br />
между входными и выходными переменными<br />
идеографического элемента Igi (структурного или<br />
функционального) определяет аксиома вычисления<br />
eIg ( i ).<br />
ТЕОрЕТИЧЕСКИЕ ОСНОВЫ ИДЕОГрАФИЧЕСКОГО МЕТОДА<br />
Аксиома 3. Количество входов идеографического<br />
элемента Igi (структурного или функционального)<br />
определяется порогом вычисления pIg ( i ).<br />
Аксиома 4. Каждый функциональный идеогра-<br />
ф<br />
фический элемент Igi имеет связь по информации<br />
со структурным идеографического элемента<br />
c<br />
Igi , что позволяет персонифицировать данные<br />
каждого функциональный идеографического эле-<br />
ф<br />
мента Igi с конкретным структурным идеографи-<br />
c<br />
ческим элементом Igi .<br />
Аксиома 5. Структурный идеографический эле-<br />
A<br />
мент Igi имеет несколько планов отображения<br />
j<br />
( Пo ), которые используются для его отображения<br />
на υ –х уровнях иерархической структуры идеографической<br />
модели Mg .<br />
Теорема 5. Количество соединений, которые<br />
объединяют два смежных идеографических элемента<br />
( Igi, Igi+<br />
1 ) , не должно превышать их пороги<br />
вычисления: p= min ( Igi, Igi+<br />
1 ) .<br />
Доказательство. Превышение порогов вычисления<br />
при объединении двух смежных идеографических<br />
элемента ( Igi, Igi+<br />
1 ) привело бы к нарушению<br />
аксиомы 3, то есть к тому, что пороги вычисления<br />
идеографических элементов установлены неверно.<br />
Теорема 6. Выходные результаты идеографиического<br />
элемента Igi (структурного или функционального)<br />
являются входными данными другого<br />
идеографического элемента Igi +1 только в том случае,<br />
если они имеют совместную аксиому вычисления<br />
eIg ( i, Igi+<br />
1 ) .<br />
Доказательство. На основании аксиомы<br />
4 два идеографических элемента ( Igi, Igi+<br />
1 ) могут<br />
объединиться в ансамбль при существовании<br />
между их переменными совместной аксиомы вычисления<br />
e( Igi, Igi+<br />
1 ) . Поэтому, если такая аксиома<br />
не существует, то выходные результаты Y ( Igi) i -го<br />
идеографического элемента не могут быть входными<br />
переменными X ( Igi + 1 ) (i +1 )-го идеографического<br />
элемента.<br />
Теорема 7. Комплексирование идеографических<br />
элементов Igi (структурных и функциональных)<br />
в идеографическую модель Mg выполняется<br />
на основании их планов отображения<br />
l k f<br />
По = { По, По, По}<br />
, а проверка правильности комплексирования<br />
– на основании их планов содер-<br />
l k f<br />
жания Пc = { Пc, Пc, Пc}<br />
.<br />
Доказательство. Согласно теореме 2 план<br />
j<br />
отображения ( По ) идеографического элемента –<br />
это графическое отображения функции преобразо-<br />
j j j<br />
вания Y = F ( X ), то есть некоторое визуальное<br />
представление объекта Obi моделируемой системы<br />
S , которое используется для построения визуального<br />
представления системы S , а план содержания<br />
j ( Пc ) – это математическое выражение, которое<br />
j j j<br />
описывает функцию преобразования Y = F ( X ).<br />
Следовательно, построение визуального представления<br />
моделируемой системы S возможно только<br />
67
С. В Кузьменко<br />
на основании визуальных представлений объектов<br />
Obi этой системы, то есть их планов отображения<br />
l k f<br />
По = { По, По, По}<br />
, а проверка правильности комплексирования<br />
– на основании совместимости<br />
j j j<br />
их функций преобразования F : X → Y , то есть<br />
l k f<br />
планов содержания Пc = { Пc, Пc, Пc}<br />
Теорема 8. Пороги вычисления уровней идеографического<br />
элемента Igi (структурного или<br />
l k f<br />
функционального) одинаковы: p = p = p .<br />
Доказательство. Так как каждый уровень<br />
идеографического элемента Igi (структурного или<br />
функционального) представляет одну и ту же функ-<br />
j j j<br />
ции преобразования Y = F ( X ), но в разном виде<br />
(логическом, концептуальном и физическом), пороги<br />
вычисления уровней идеографического элемента<br />
Igi (структурного или функционального) не<br />
могут быть не одинаковы.<br />
Теорема 9. Между входными переменными<br />
уровней идеографического элемента Igi (струк-<br />
l k f<br />
турного или функционального) X = { X , X , X }<br />
l k f<br />
и выходными результатами Y = { Y , Y , Y } существует<br />
взаимно однозначное соответствие.<br />
Доказательство. Так как каждый уровень<br />
идеографического элемента Igi (структурного<br />
или функционального) представляет одну и ту же<br />
j j j<br />
функцию преобразования Y = F ( X ), но в разном<br />
виде (логическом, концептуальном и физическом),<br />
между входными переменными уровней<br />
идеографического элемента Igi (структурного или<br />
l k f<br />
функционального) X = { X , X , X } и выходны-<br />
l k f<br />
ми результатами Y = { Y , Y , Y } не может не существовать<br />
взаимно однозначное соответствие.<br />
Теорема 10. Множество идеографических элементов<br />
Igi (структурных и функциональных), которые<br />
описывают идеографическую модель Mg<br />
системы S , не содержит двух идеографических<br />
элементов, которые имеют одинаковые планы ото-<br />
l k f<br />
бражения По = { По, По, По}<br />
, планы содержания<br />
l k f<br />
Пc = { Пc, Пc, Пc}<br />
и множества переменных X, Y ,<br />
то есть:<br />
∀i ∈n∃! Ig ,<br />
68<br />
( Igi )≠ ( Ig( −i)<br />
)∨ ( Igi )≠ ( Ig(<br />
−i)<br />
)∨<br />
AIgiA( Ig(<br />
−i)<br />
)∨ B( Igi )≠ B( Ig(<br />
−i)<br />
).<br />
П П П П<br />
о о c c<br />
∨ ( )≠<br />
Доказательство. Согласно определению 4<br />
идеографический элемент Igi описывает только<br />
один определенный объект Obi реальной системы,<br />
то есть Igi ≡ Оbi<br />
. Поэтому если предположить, что<br />
имеется больше одного идеографического элемента<br />
Igi , которые имеют одинаковые планы ото-<br />
l k f<br />
бражения По = { По, По, По}<br />
, планы содержания<br />
l k f<br />
Пc = { Пc, Пc, Пc}<br />
и множества переменных X, Y ,<br />
то это означало бы, что нарушено определения 4 и<br />
неправильно сформирован состав идеографических<br />
элементов Igi идеографической модели Mg<br />
системы S .<br />
i<br />
3. Информационная технология идеографического<br />
описания систем<br />
Представленные в работе теоретические основы<br />
идеографического метода позволяют реализовать<br />
информационную технологию описания широкого<br />
класса систем на основе идеограмм (рис. 2).<br />
Основными объектами этой технологии являются:<br />
– пользователь (а) идеографического описания<br />
системы;<br />
– проектировщик (в) идеографических элементов<br />
описания системы;<br />
– идеографическая модель системы (с);<br />
– инструментальное средство (d), используемое<br />
при создании идеографических элементов;<br />
– реестр идеографических элементов (е).<br />
Рис. 2 . Контекстная схема информационной<br />
технологии идеографического моделирования систем<br />
Информационная технология реализуется<br />
следующим образом: пользователь (а) и проектировщик<br />
(в), используя <strong>язык</strong> спецификаций Я с ,<br />
определяют требования к идеографическому моделированию<br />
(описанию) той предметной области<br />
(системы), в которой работает пользователь. Проектировщик<br />
(в), используя <strong>язык</strong> проектирования<br />
Я пр и инструментальное средство (d), выполняет<br />
создание идеографических элементов описания<br />
системы и размещает их в реестре (е). Проектировщик<br />
(в) при отладке идеографических элементов<br />
описания системы использует <strong>язык</strong> Я и создания<br />
идеографической модели системы (с) и <strong>язык</strong> команд<br />
Я к для управления процессом использования<br />
идеографической модели системы (с).<br />
Пользователь (а), используя <strong>язык</strong> идеографического<br />
описания Я ио , имеет возможность анализировать<br />
состав реестра идеографических элементов<br />
(е) и, используя <strong>язык</strong> описания идеографической<br />
модели Я и системы (с), создает идеографическую<br />
модель (с), а используя <strong>язык</strong> команд Я к управляет<br />
процессом использования идеографической модели<br />
системы (с).<br />
Выводы<br />
Разработанные теоретические основы идеографического<br />
описания систем позволяют оперировать<br />
с системой на основе образов (плана отобра-
жения), а не математических зависимостей, схем,<br />
диаграмм и другого (плана содержания), что более<br />
естественно для пользователя. Однако реализация<br />
такого взаимодействия требует разработки информационной<br />
технологии идеографического описания<br />
систем (рис. 2) для конкретной предметной<br />
области, что является направлением дальнейшего<br />
развития работ. При разработке такой информационной<br />
технологии необходимо:<br />
– определиться с объектами информационной<br />
технологии (рис. 2);<br />
– разработать соответствующие <strong>язык</strong>и информационной<br />
технологии с учетом особенностей выбранной<br />
предметной области;<br />
– апробировать адаптивную информационную<br />
технологию для решения задач идеографического<br />
моделирования элементов и объектов системы выбранной<br />
предметной области;<br />
– провести анализ использования адаптивной<br />
информационной технологи для решения задач<br />
идеографического моделирования элементов и<br />
объектов систем различного назначения.<br />
Список литературы: 1. Кузьменко, В.М. Спеціальні мови<br />
програмування. Програмні та інструментальні засоби<br />
моделювання складних систем: [навч. посібник] [Текст] /<br />
В.М. Кузьменко – Х.: ХНУРЕ, 2000. – 324 с. 2. Кузьменко,<br />
В.М. Інформаційна технологія імітаційного моделювання<br />
на основі ідеографічного підходу [Текст] / В.М.<br />
Кузьменко // Надійність інструменту та оптимізація<br />
технічних систем. – 1999. – Вип. 9. – С. 64-70. 3. Кузьменко,<br />
В.М. Метод имитационного моделирования сложных<br />
систем на основе идеографического подхода [Текст] /<br />
В.М. Кузьменко, Л.Ф.Ненько // Проблемы бионики.<br />
– 2000. – <strong>№</strong> 52. – С. 67-72. 4. Ненько, Л.Ф. Методы и<br />
средства оперативного управления интегрированными<br />
организационно-технологическими системами: автореф.<br />
дис. … канд. техн. наук: спец. 05.13.06 «АСУ и прогрессивные<br />
информационные технологии» / Л.Ф.Ненько. – Х.,<br />
ТЕОрЕТИЧЕСКИЕ ОСНОВЫ ИДЕОГрАФИЧЕСКОГО МЕТОДА<br />
2001. – 21 с. 5. Шульга, Ю.В. Модели автоматизированного<br />
проектирования технологических систем обработки<br />
отправлений: автореф. дис. … канд. техн. наук: спец.<br />
05.13.12 «Системы автоматизации проектирования» /<br />
Ю.В. Шульга. – Х., 2002. – 21 с. 6. Кузьменко, В.М. Инструментальное<br />
средство имитационного моделирования<br />
информационно–технологических систем [Текст] / В.М.<br />
Кузьменко, Ю.В. Шульга // АСУ и приборы автоматики.<br />
– 2002. – <strong>№</strong> 120. – С. 51 – 55. 7. Кузьменко, С.В. Модели и<br />
информационная технология контроля в распределенных<br />
организационно-технологических системах: автореф.<br />
дис. … канд. техн. наук: спец. 05.13.06 «Информационные<br />
технологии» / С.В. Кузьменко. – Х., 2008. – 21 с.<br />
Поступила в редколлегию 05.07.<strong>2011</strong><br />
УДК 519.72;681.326<br />
Теоретичні основи ідеографічного методу / С.В. Кузьменко<br />
// Біоніка інтелекту: наук.-техн. журнал. – <strong>2011</strong>.<br />
– <strong>№</strong> 3 (<strong>77</strong>). – С. 65-69.<br />
Розглядається сучасний стан моделювання інформаційних<br />
системах з використанням засобів ідеографічного<br />
методу. Наведено нові результати щодо теоретичного<br />
обґрунтування ідеографічного моделювання інформаційних<br />
систем. Як практичний результат отриманих<br />
теоретичних досліджень приведена інформаційна технологія<br />
інформаційного опису систем з використанням<br />
ідеографічного методу.<br />
Іл. 2. Бібліогр.: 7 найм.<br />
UDS 519.72;681.326<br />
Theoretical bases of an ideographic method / S.V. Kuzmenko<br />
// Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>).<br />
–P. 65-69.<br />
The current state of modeling information systems with<br />
use of means of an ideographic method is considered. New<br />
results concerning a theoretical substantiation of ideographic<br />
modeling of information systems are resulted. As practical<br />
result of the received theoretical researches the information<br />
technology of the information description of systems with use<br />
of an ideographic method is resulted.<br />
fig. 2. Ref.: 7 items.<br />
69
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 70–73 хНурэ<br />
УДК 004.42:519.688:519.81<br />
70<br />
Введение<br />
Для успешной реализации проекта в какойлибо<br />
сфере деятельности первостепенное значение<br />
имеет эффективная команда проекта, которая<br />
представляет собой специфическую организационную<br />
структуру, формируемую на время жизненного<br />
цикла проекта [1]. Команда проекта является<br />
основным элементом его структуры, так как именно<br />
она обеспечивает реализацию замысла проекта.<br />
Под командой понимается объединение людей,<br />
осуществляющих совместную деятельность и обладающих<br />
общими интересами, которое способно<br />
достигать цели автономно и согласованно при<br />
минимальных управляющих воздействиях [2]. Для<br />
команды проекта необходимо наличие у ее членов<br />
комбинации взаимодополняющих навыков, которые<br />
составляют три категории:<br />
– функциональные (или профессиональные);<br />
– навыки по решению проблем и принятию решений;<br />
– навыки межличностного общения.<br />
Степень выраженности указанных качеств предопределяет<br />
те или иные роли членов команды в<br />
проекте [3[. Каждый из них выполняет роли двух<br />
типов: функциональную (проектную) - как определенный<br />
набор функций и полномочий в проекте, и<br />
командную, в основе которой лежат личностные<br />
особенности.<br />
Основными характеристиками команды являются<br />
состав, структура, групповые процессы.<br />
Состав – совокупность характеристик членов команды,<br />
важных для анализа ее как единого целого<br />
(например, численность, возрастной, половой состав).<br />
Структура рассматривается с точки зрения<br />
функций, выполняемых отдельными членами команды,<br />
а также с точки зрения межличностных отношений<br />
в ней. К групповым процессам относятся<br />
процессы развития, сплочения, группового давления,<br />
выработки решений.<br />
Команды могут быть однородные и неоднородные.<br />
В однородной команде члены команды выполняют<br />
однотипные функции, и при формиро-<br />
Н.И. Калита, А.В. Гурина<br />
ХНУРЭ, г. Харьков, Украина, kalita.nik@gmail.com<br />
СИНТЕЗ МОДЕЛИ МНОГОФАКТОРНОГО ОЦЕНИВАНИЯ<br />
ЭФФЕКТИВНОСТИ КОМАНДЫ ПРОЕКТА<br />
Предложена математическая модель определения оптимального состава проектной команды и оценки<br />
ее эффективности. Критерием оптимальности является максимальная полезность (привлекательность)<br />
вариантов команды с учетом ограничений на личностные и функциональные требования к проектным<br />
ролям. Приведен пример решения задачи.<br />
КОМАНДА ПРОЕКТА, ФУНКЦИОНАЛЬНЫЕ РОЛИ, ЛИЧНОСТНЫЕ ЧЕРТЫ, ЭФФЕКТИВ-<br />
НОСТЬ КОМАНДЫ ПРОЕКТА, ТЕОРИЯ ПОЛЕЗНОСТИ, МОДЕЛЬ ОЦЕНКИ ЭФФЕКТИВНОСТИ<br />
КОМАНДЫ<br />
вании такой команды основной задачей является<br />
распределение объемов работ между исполнителями.<br />
В неоднородной команде ее члены выполняют<br />
различные функции, причем каждый член<br />
команды в общем случае характеризуется определенными<br />
эффективностями реализации тех или<br />
иных функций. Поэтому при формировании неоднородной<br />
команды основной задачей является<br />
распределение ролей и видов деятельности между<br />
исполнителями, а потом уже распределяются объемы<br />
работ [2]. Проектные команды относятся к<br />
неоднородным командам, где члены команды выполняют<br />
различные роли.<br />
Эффективную команду можно охарактеризовать<br />
общепринятыми критериями эффективности<br />
любой организационной структуры, однако<br />
специфические черты, присущие только команде,<br />
обусловливают эффективность с позиций профессиональной<br />
деятельности по проекту и организационно-психологического<br />
климата деятельности.<br />
Проблема формирования команды сначала<br />
была предметом исследования в психологии, социологии<br />
и менеджменте [4-7], однако с развитием<br />
и внедрением информационных технологий возникла<br />
необходимость в использовании не только<br />
неформальных методов для исследования и формирования<br />
команды, но и основанных на математических<br />
моделях и методах.<br />
Целью статьи является разработка математической<br />
модели оценки эффективности команды<br />
проекта, которая учитывает наличие требуемых<br />
профессиональных и личностных качеств у претендентов<br />
в команду проекта.<br />
1. Состояние проблемы и постановка задачи<br />
В настоящее время при формировании команд<br />
используются методы, основанные [2, 4, 6, 7]:<br />
1) на исследовании межличностных отношений<br />
(социометрия, деловые игры); 2) на математических<br />
моделях различных классов. Первая группа<br />
методов позволяет количественно оценить такие<br />
показатели вариантов команды как взаимные
симпатии и антипатии, групповой статус, ролевой<br />
состав и на основе полученных показателей выработать<br />
рекомендации по персональному составу<br />
команды. При этом, однако, не учитывается распределение<br />
функциональных ролей между претендентами.<br />
Анализ второй группы методов показал,<br />
что с помощью моделирования решаются задачи<br />
как на этапе формирования команды, так и на этапе<br />
ее работы над проектом. Используются задачи<br />
о назначении, рефлексивные и теоретико-игровые<br />
модели, модель Маршака-Раднера, репутации и<br />
норм деятельности. Для формирования неоднородных<br />
команд вначале предлагается решить задачу<br />
распределения объемов работ, а затем распределить<br />
между претендентами функции. В [8] для<br />
формирования эффективной команды учитывается<br />
прошлый опыт работы над проектом. Несмотря<br />
на разнообразие моделей и методов формирования<br />
команды, нерешенной остается задача комплексного<br />
учета ролевых особенностей проектной команды,<br />
личностных и профессиональных качеств<br />
претендентов в команду, которые обеспечивают ее<br />
наибольшую эффективность.<br />
Рассмотрим задачу формирования неоднородной<br />
команды проекта в такой постановке. Для выполнения<br />
проекта необходима команда, в которой<br />
членам команды определено множество различных<br />
функциональных ролей Y = { yj}, j = 1, m . Количественный<br />
состав команды определяется объемом<br />
работ, предусмотренным проектом. Будем полагать,<br />
что объемы работ распределены между функциональными<br />
ролями. Ролевой состав команды и<br />
количество исполнителей каждой роли определяется<br />
менеджером проекта для каждого конкретного<br />
проекта. Например, IT-проект предполагает роли:<br />
руководитель разработки, разработчик, администратор<br />
ИС, тестировщик, менеджер по качеству,<br />
системный аналитик, технический писатель. Одна<br />
роль может исполняться несколькими специалистами.<br />
Но, в свою очередь, один и тот же специалист<br />
может совмещать различные роли.<br />
Известны также множества претендентов<br />
X j = { xi},<br />
i = 1, n на каждую j-ю роль (должность).<br />
При этом некоторые элементы xi могут быть включены<br />
в несколько множеств претендентов (претендуя<br />
на различные роли в команде проекта). Каждый<br />
претендент xi из множеств X j описывается<br />
множеством профессиональных K ( xi)= { ku( xi)<br />
},<br />
u= 1, U и личностных L( xi)= { lv( xi)<br />
}, v = 1, V качеств<br />
(характеристик). Для определенности будем<br />
полагать, что значения ku( xi),<br />
u= 1, U и lv( xi),<br />
v = 1, V известны и заданы в виде количественных<br />
оценок. Эти значения могут быть получены специалистами<br />
по персоналу методами, принятыми в<br />
данной предметной области, например, в результате<br />
обработки психологических тестов, тестов на<br />
профессиональные знания и навыки и т.п.<br />
СИНТЕЗ МОДЕЛИ МНОГОФАКТОрНОГО ОЦЕНИВАНИЯ эФФЕКТИВНОСТИ КОМАНДЫ ПрОЕКТА<br />
Каждая функциональная роль y j характеризует-<br />
* *<br />
ся множеством профессиональных K ( yi) = { ku( yi)}<br />
* *<br />
и личностных L ( yi)= { lv ( yi)<br />
} требований, которым<br />
должны удовлетворять претенденты xi , и в соответствии<br />
с которыми осуществляется выбор оптимальных<br />
исполнителей на роли y j , j = 1, m . Профессиональные<br />
требования описывают уровень<br />
знаний, умений и навыков для функциональной<br />
роли. Личностные качества включают: степень ответственности,<br />
способность самостоятельно принимать<br />
решения, умение работать в условиях плотного<br />
графика, системное мышление, способность<br />
работать в условиях рисков и неопределенностей,<br />
стратегическое мышление, лидерские качества,<br />
организационные и мотивационные навыки, дисциплинированность<br />
и организованность, навыки<br />
работы в команде, аналитический подход, способность<br />
к эффективному общению (устному и письменному),<br />
понимание технологий и трендов (тенденций),<br />
креативность. Для различных командных<br />
ролей (например, лидер, исполнитель, контролер)<br />
требования к личностным качествам различны.<br />
*<br />
Под оптимальным исполнителем xij роли y j<br />
будем понимать такого претендента xi из множества<br />
X j , который имеет максимальную привлекательность<br />
(полезность) Pj( xi)[9]:<br />
*<br />
ij<br />
x argmaxP<br />
x<br />
= ( )<br />
xi∈X j<br />
j i<br />
Необходимо разработать математическую модель<br />
оценки эффективности команды проекта, которая<br />
формируется из множеств претендентов X j<br />
на роли y j , j = 1, m .<br />
2. Математическая модель<br />
Для синтеза модели оценивания эффективности<br />
команды проекта используем модель многофакторного<br />
оценивания [9, 10]. Привлекательность<br />
Pj( xi)<br />
каждого претендента xi на j-ю роль<br />
определим как аддитивную функцию полезности,<br />
которая учитывает наличие и степень развития<br />
его профессиональных K ( xi) и личностных L( xi) характеристик, требуемых для рассматриваемой<br />
должности y j . Если претендент xi на роль y j обладает<br />
множеством характеристик K ( xi)= { ku( xi)<br />
}<br />
и L( xi)= { lv( xi)<br />
} большим, чем требуется в<br />
* *<br />
* *<br />
K ( yi) = { ku( yi)}<br />
и в L ( yi)= { lv ( yi)<br />
}, он участвует в<br />
отборе, если же у него отсутствует хотя бы одна характеристика,<br />
он исключается из претендентов на<br />
исполнение данной роли.<br />
Для каждой роли y j , j = 1, m при формировании<br />
команды на выполнение конкретного проекта<br />
* *<br />
значения критериев из требований K ( yi) и L ( yi)<br />
известны и могут быть заданы количественными<br />
оценками.<br />
Для различных функциональных ролей y j профессиональные<br />
и личностные качества претенден-<br />
.<br />
71
Н.И. Калита, А.В. Гурина<br />
тов имеют различный вес, поэтому введем для них<br />
весовые коэффициенты a1 и a2 соответственно.<br />
Кроме того, и профессиональные качества ku( xi),<br />
u= 1, U и личностные lv( xi),<br />
v = 1, V при оценке<br />
претендентов в различных проектах могут иметь<br />
разную важность. Следовательно, этот факт также<br />
необходимо учесть, используя соответствующие<br />
весовые коэффициенты важности qu и gv . Тогда<br />
привлекательность i-го претендента на j-ю функциональную<br />
роль определяется как<br />
72<br />
U<br />
( )= ∑ ( )+ ∑ ( )<br />
P x a q k x a g l x<br />
j i 1 u u i 2 v v i<br />
u=<br />
1<br />
v = 1<br />
V<br />
, (1)<br />
и многофакторная модель оценивания эффективности<br />
команды проекта имеет вид:<br />
при ограничениях<br />
m<br />
∑ j( i)<br />
max<br />
x X j<br />
j =<br />
i∈j, 1<br />
P( x)= P x →<br />
k ( x ) ≥ k ( y ) , j = 1, m ,<br />
u i u j<br />
l ( x ) ≥ l ( y ) , j = 1, m .<br />
v i v j<br />
Функция полезности вида (1) требует, чтобы<br />
значения частных критериев ku( xi)<br />
и lv( xi)<br />
имели<br />
одинаковый интервал изменения, были безразмерны,<br />
и большее значение было бы наилучшим.<br />
Поэтому в общем случае значения указанных частных<br />
критериев в приведенной модели пронормированы<br />
по формуле вида [9]:<br />
⎛ ki( x) − ki<br />
pk [ i ( x)]<br />
= ⎜<br />
⎝ k − k<br />
нх<br />
iнл iнх<br />
где ki нх , ki нл – соответственно наихудшее и наилучшее<br />
значения частного критерия ku( xi),<br />
u= 1, U ,<br />
и lv( xi),<br />
v = 1, V на всем множестве претендентов<br />
X j ; αi - показатель нелинейности; pk [ i ( x)]<br />
имеет<br />
смысл полезности частного критерия. Также весовые<br />
коэффициенты qu и gv удовлетворяют тре-<br />
U<br />
бованиям ∑qu = 1 , 0≤qu ≤1,<br />
∑ gv = 1 , 0≤ gv ≤1,<br />
и<br />
u=<br />
1<br />
V<br />
v = 1<br />
их значения могут быть определены различными<br />
методами [9, 10].<br />
3. Вычислительные эксперименты<br />
Предложенная математическая модель апробирована<br />
с помощью разработанного программного<br />
средства на примере формирования команды для<br />
выполнения IT-проекта. Для такой команды определено<br />
множество функциональных и личностных<br />
ролей, а также минимальные значения критери-<br />
* *<br />
ев K ( yi) и L ( yi).<br />
Сформированы множества<br />
претендентов на каждую функциональную роль<br />
X j = { xi}.<br />
Значения весовых коэффициентов qu и<br />
gv приняты одинаковыми, a1 = 065 , , a2 = 035 , . В<br />
таблице представлены результаты решения задачи<br />
в развернутом виде, т.е. по каждой роли приведены<br />
оценки эффективности претендентов.<br />
⎞<br />
⎟<br />
⎠<br />
αi<br />
,<br />
Роль Наименование xi Pj( xi)<br />
у 1<br />
у 2<br />
у 3<br />
у 4<br />
у 5<br />
у 6<br />
у 7<br />
Системный<br />
аналитик<br />
Руководитель<br />
разработки<br />
Разработчик<br />
Системный<br />
администратор<br />
Тестировщик<br />
Менеджер<br />
по качеству<br />
Технический<br />
писатель<br />
x 8<br />
x 12<br />
x 17<br />
x 9<br />
x 8<br />
x 18<br />
x 11<br />
x 6<br />
x 13<br />
x 6<br />
x 19<br />
x 15<br />
x 11<br />
0,8148<br />
0,80988<br />
0,93<br />
0,7193<br />
0,4972<br />
Таблица<br />
Желаемая<br />
должность<br />
Системный<br />
аналитик<br />
Системный<br />
аналитик<br />
Руководитель<br />
разработки<br />
Руководитель<br />
разработки<br />
Системный<br />
аналитик<br />
0,4097 Разработчик<br />
0,0825 Разработчик<br />
0,0656<br />
Системный<br />
администратор<br />
0,1065 Тестировщик<br />
0,1026<br />
0,08666<br />
0,1253<br />
0,039<br />
Менеджер<br />
по качеству<br />
Манеджер<br />
по качеству<br />
Технический<br />
писатель<br />
Технический<br />
писатель<br />
Из таблицы видно, что для команды<br />
Y = { y1, y2, y3, y4, y5, y6, y7}<br />
, в которой требуется<br />
по одному исполнителю на каждую функциональную<br />
роль, наилучшим вариантом является<br />
{ x8, x17, x9, x6, x13, x19, x15}.<br />
При этом претенденты<br />
x6, x13, x19, x15имеют<br />
достаточно низкие оценки<br />
привлекательности Pj( xi),<br />
что должен учесть руководитель<br />
проекта при принятии решений. На<br />
основании приведенной информации формируется<br />
также команда, в которой на одну функциональную<br />
роль необходимо подобрать несколько<br />
исполнителей.<br />
Выводы<br />
Построенная в работе математическая модель<br />
определения оптимального состава команды проекта<br />
и оценки ее эффективности, а также программное<br />
средство могут быть использованы в<br />
составе системы поддержки принятия решений<br />
по управлению проектом в любой предметной области.<br />
Вычислительные эксперименты показали<br />
эффективность предложенного подхода в смысле<br />
минимизации времени на обработку информации<br />
о претендентах на работу специалистами по персоналу<br />
за счет автоматизации и комплексного учета<br />
всевозможных выдвигаемых требований.<br />
Предложенную модель целесообразно использовать<br />
при формировании команд в случае, когда
претенденты незнакомы друг с другом и не могут<br />
высказать суждений об отношениях, определяющих<br />
психологическую совместимость, что является<br />
одним из важнейших факторов сплоченности<br />
команды. Дальнейшее развитие модели предполагает<br />
учет социометрических параметров претендентов<br />
и команды.<br />
Список литературы: 1. Управление проектами: учебное<br />
пособие [Текст] / под ред. И.И. Мазура. — 2-е изд. — М.:<br />
Омега-Л, 2004. — 664 с. 2. Новиков, Д.А. Математические<br />
модели формирования и функционирования команд<br />
[Текст] / Д.А. Новиков. – М.: ПМСОФТ, 2007. – 140 с.<br />
3. Белбин, Р.М. Типы ролей в командах менеджеров [Текст]:<br />
Пер с англ / Р.М. Белбин. – М.: Гиппо, 2003. – 216 с.<br />
4. Паркер, Г. Формирование команды [Текст] / Г. Паркер,<br />
З. Кролл – СПб.: Питер, 2003. – 560 с. 5. Мескон, М. Основы<br />
менеджмента [Текст]: Пер. с англ. / М. Мескон:– М.:<br />
Дело, 1999. – 800 с. 6. Минцберг, Г. Структура в кулаке:<br />
создание эффективной организации [Текст]: Пер. с англ.<br />
/ под ред. Ю. Н. Каптуревского / Г. Минцберг:– СПб.:<br />
Питер, 2004. – 512 с. 7. Карякин, А.М. Командная работа:<br />
основы теории и практики [Текст] / А.М. Карякин; Иван.<br />
гос. энерг. ун-т. – Иваново, 2003. – 136 с. 8. Харитонов,<br />
В.Н. Формирование команды проекта реконструкции<br />
системы теплоснобжения [Текст] / В.Н. Харитонов //<br />
Весник инженерной академии Украины. – 2008 <strong>№</strong> 3-4. –<br />
С. 263. 9. Петров, Э.Г. Методы и средства принятия<br />
решений в социально-экономических системах [Текст]<br />
СИНТЕЗ МОДЕЛИ МНОГОФАКТОрНОГО ОЦЕНИВАНИЯ эФФЕКТИВНОСТИ КОМАНДЫ ПрОЕКТА<br />
/ Э.Г. Петров, М.В. Новожилова, И.В. Гребенник,<br />
Н.А. Соколова. – Херсон: ОЛДИ-плюс, 2003. – 380 с.<br />
10. Петров, К.Э. Компараторная структурно-параметрическая<br />
идентификация моделей скалярного многофакторного<br />
оценивания [Текст] / К.Э. Петров, В.В. Крючковский.<br />
– Херсон: Олди-плюс, 2009. – 294 с.<br />
Поступила в редколлегию 30.08.<strong>2011</strong><br />
УДК 004.42:519.688:519.81<br />
Синтез моделі багатофакторного оцінювання ефективності<br />
команди проекту / Н.І. Калита, А.Є. Гуріна // Біоніка<br />
інтелекту: наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>).<br />
– С. 70-73.<br />
Аналізується одна із задач управління проектами –<br />
формування оптимальної команди виконання проекту.<br />
Для її розв’язання запропоновано математичну модель,<br />
яка враховує як професійні вимоги до претендентів, так<br />
і особистісні. Розглянуто результати обчислювальних<br />
експериментів.<br />
Табл. 1. Бібліогр.: 10 найм.<br />
UDK 004.42:519.688:519.81<br />
Synthesis of multifactor model of evaluating the project<br />
team effectiveness / N.I. Kalita, A.V. Gurina // Bionics of Intelligense:<br />
Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 70-73.<br />
One of the tasks of project management - formation of an<br />
optimal project team is analyzed. A mathematical model for it<br />
solving is offered that takes into account both professional and<br />
personality requirements for candidates. The results of computational<br />
experiments are considered.<br />
Tab. 1. Ref.: 10 items.<br />
73
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 74–<strong>77</strong> хНурэ<br />
УДК 518.81<br />
74<br />
Введение<br />
Рынок – система экономических отношений,<br />
складывающихся в процессе производства, обращения<br />
и распределения товаров и денежных<br />
средств, для которого характерна свобода субъектов<br />
в выборе покупателей и продавцов, определении<br />
цен, формировании и использовании ресурсных<br />
источников. [1].<br />
Рыночные отношения заставляют всех участников<br />
системы производства, транспортировки<br />
и потребления объединить свои усилия таким образом,<br />
чтобы производить ровно столько товара,<br />
сколько требуется на рынке, и доставлять этот<br />
товар к моменту, определенному спросом в сфере<br />
потребления.<br />
В настоящий момент времени перед большинством<br />
промышленных, а также коммерческих<br />
предприятий, стоит основная задача – снижение<br />
суммарных затрат на изготовление и реализацию<br />
продукции. При этом необходимо достигать заданного<br />
уровня качества товаров. Наиболее современным<br />
подходом, позволяющим оптимизировать<br />
стратегию развития предприятия, является логистический,<br />
рассматривающий взаимоувязанный<br />
комплекс проблем. Необходимость логистического<br />
подхода в практике хозяйственной деятельности<br />
предприятия обусловлена, прежде всего, переходом<br />
от рынка продавца к рынку покупателя, который<br />
требует гибкого реагирования производственных<br />
систем на быстро изменяющиеся приоритеты<br />
потребителей. Любое предприятие, не-зависимо<br />
от формы собственности, размера и вида деятельности,<br />
участвует в качестве логистического звена<br />
системы «поставщик – производитель – потребитель».<br />
По мере усложнения рыночных условий функционирования<br />
предприятий повышается актуальность<br />
логистического подхода к управлению<br />
предприятием. В той мере, в какой предприятие<br />
базирует свое конкурентное преимущество на логистике,<br />
оно обладает теми уникальными свойствами,<br />
которые трудно воспроизвести другим<br />
предприятиям.<br />
О.А. Писклакова, Д.Е. Шмидт, В.С. Алексенко<br />
ХНУРЕ, м. Харків, Україна, st@kture.kharkov.ua<br />
МОДЕЛЬ ВЫБОРА ОПТИМАЛЬНОГО ПАРТНЕРА<br />
ПРЕДПРИЯТИЯ В УСЛОВИЯХ МНОГОКРИТЕРИАЛЬНОСТИ<br />
И НЕОПРЕДЕЛЕННОСТИ<br />
Рассмотрена модель выбора оптимального партнёра предприятия в условиях многокритериальности<br />
и неопределенности. Проанализирован способ задания весовых коэффициентов и частных критериев<br />
в виде нечетких чисел.<br />
ВЫБОР ОПТИМАЛЬНЫХ ПОСТАВщИКОВ, МНОГОКРИТЕРИАЛЬНОСТЬ, ИНТЕРВАЛЬНАЯ<br />
НЕОПРЕДЕЛЕННОСТЬ, ФУНКЦИЯ ПОЛЕЗНОСТИ, МЕТОД РЕЙТИНГОВЫХ ОЦЕНОК<br />
Цель логистической деятельности считается достигнутой,<br />
если выполнены следующие правила:<br />
нужный продукт необходимого качества доставлен<br />
с требуемым уровнем затрат нужному потребителю<br />
в необходимом количестве, в нужное время и в<br />
нужное место [2].<br />
Одной из наиболее важных задач логистики является<br />
выбор поставщика<br />
Важность ее объясняется не только тем, что на<br />
современном рынке функционирует большое количество<br />
поставщиков одинаковых товаров, но<br />
главным образом тем, что поставщик должен быть<br />
надежным партнером фирмы в реализации ее логистической<br />
стратегии.<br />
Тенденции покупок вместо собственного производства<br />
ориентированы на улучшение качества,<br />
снижение уровня запасов, интеграцию систем поставщиков<br />
и покупателей в единую логистическую<br />
систему взаимодействия и координации в логистических<br />
каналах совместного бизнеса, обусловив<br />
тем самым потребность повысить эффективность<br />
работы с поставщиками. В настоящее время наблюдается<br />
повышение внимания к тщательному<br />
выбору поставщиков и предъявлению к ним более<br />
высоких требований.<br />
Процесс выбора поставщика включает в себя<br />
поиск и отбор предприятием потенциальных поставщиков<br />
сырья, материалов, комплектующих изделий.<br />
Оценивание поставщика проводится с точки<br />
зрения обеспечения поставок продукции требуемого<br />
качества, в требуемые сроки и по приемлемой<br />
цене.<br />
Эффективные решения по выбору источников<br />
снабжения являются основой создания устойчивой<br />
базы снабжения любой компании. Обычно решение<br />
покупателя зависит от его оценки способности<br />
поставщика удовлетворять критериям качества,<br />
объема, условий доставки, цены и обслуживания.<br />
На практике задача выбора оптимального поставщика<br />
решается в условиях неполноты знаний<br />
о взаимосвязи показателей поставщиков и, как<br />
следствие, неточного ее описания, невозможности
МОДЕЛЬ ВЫБОрА ОПТИМАЛЬНОГО ПАрТНЕрА ПрЕДПрИЯТИЯ В уСЛОВИЯх МНОГОКрИТЕрИАЛЬНОСТИ И НЕОПрЕДЕЛЕННОСТИ<br />
или неточности измерения некоторых показателей,<br />
случайных внешних и внутренних воздействий<br />
и т.д. Дополнительная сложность заключается<br />
в том, что показатели разнородны и могут быть<br />
представлены в виде случайных величин, нечетких<br />
множеств или просто интервальных величин.<br />
Целью настоящей статьи является анализ особенностей<br />
и обоснование модели выбора оптимального<br />
партнера предприятия в условиях многокритериальности<br />
и неопределенности исходных<br />
данных.<br />
1. Постановка задачи<br />
На практике выделяют следующие этапы решения<br />
задачи выбора поставщика:<br />
1. Поиск потенциальных поставщиков.<br />
При этом могут быть использованы следующие<br />
методы:<br />
– объявление конкурса;<br />
– изучение рекламных материалов: фирменных<br />
каталогов, объявлений в средствах массовой<br />
информации и т. п.;<br />
– посещение выставок и ярмарок;<br />
– переписка и личные контакты с возможными<br />
поставщиками.<br />
В результате перечисленных мероприятий формируется<br />
список потенциальных поставщиков,<br />
который постоянно обновляется и дополняется.<br />
2. Анализ потенциальных поставщиков.<br />
Составленный перечень потенциальных поставщиков<br />
анализируется на основании специальных<br />
критериев, позволяющих осуществить отбор<br />
приемлемых поставщиков. Количество таких критериев<br />
может составлять несколько десятков. Однако<br />
зачастую ограничиваются ценой и качеством<br />
поставляемой продукции, а также надежностью<br />
поставок, под которой понимают соблюдение поставщиком<br />
обязательств по срокам поставки, ассортименту,<br />
комплектности, качеству и количеству<br />
поставляемой продукции.<br />
К другим критериям, принимаемым во внимание<br />
при выборе поставщика, относят следующие:<br />
– удаленность поставщика от потребителя;<br />
– сроки выполнения текущих и экстренных заказов;<br />
– наличие резервных мощностей;<br />
– организация управления качеством у поставщика;<br />
– психологический климат у поставщика (возможности<br />
забастовок);<br />
– способность обеспечить поставку запасных<br />
частей в течение всего срока службы поставляемого<br />
оборудования;<br />
– финансовое положение поставщика, его кредитоспособность<br />
и др.<br />
Также следует обращать внимание на характеристики<br />
поставщика, которые свидетельствуют о<br />
его способности соответствовать заявленным требованиям<br />
покупателя: предыдущая история компании,<br />
развитость инфраструктуры, финансовое<br />
положение, организация и управление, репутация,<br />
местонахождение. С точки зрения управления<br />
отношениями с поставщиками ценность приобретенного<br />
потребителем товара или услуги – это<br />
окончательная (в долгосрочной перспективе) полезность<br />
этого приобретения. Это необязательно<br />
самая низкая цена покупки, минимальные инвестиции<br />
в запасы, самое быстрое время доставки,<br />
или самый быстрый жизненный цикл, или самое<br />
высокое качество; это оптимальное сочетание всего<br />
перечисленного.<br />
В результате анализа потенциальных поставщиков<br />
формируется перечень конкретных поставщиков,<br />
с которыми проводится работа по заключению<br />
договорных отношений.<br />
3. Оценка результатов работы с поставщиками.<br />
На выбор поставщика существенное влияние<br />
оказывают результаты работы по уже заключенным<br />
договорам. Для этого разрабатывается специальная<br />
шкала оценок, позволяющая рассчитать<br />
рейтинг поставщика [3].<br />
В общем случае задачу выбора оптимальных партнеров<br />
можно свести к функции полезности (1).<br />
P( x) = ∑ ak i i ( x)<br />
, (1)<br />
= 1<br />
i<br />
n<br />
где P( x)<br />
– функция полезности; ai – относительные<br />
безразмерные весовые коэффициенты, для<br />
которых выполняются ограничения (2)<br />
⎧0≤ai≤1<br />
⎪<br />
⎨ n<br />
∑ = 1∀ = 1<br />
⎩<br />
⎪ ai, i , n,<br />
i = 1<br />
(2)<br />
н<br />
а ki( x)<br />
– нормализованные, т.е. приведенные к<br />
изоморфному виду частные критерии [4]. Нормализация<br />
критериев проводится по формуле<br />
⎛<br />
Н ki( x) − ki<br />
ki( x)<br />
= ⎜<br />
⎝ k − k<br />
н<br />
НХ<br />
НЛ НХ<br />
i i<br />
⎞<br />
⎟<br />
⎠<br />
α<br />
ш<br />
,<br />
(3)<br />
НЛ НХ<br />
, ki<br />
где ki ( x ) – значение частного критерия; ki – соответственно наилучшее и наихудшее значение<br />
частного критерия, которое он принимает на области<br />
допустимых решений x ∈ X .<br />
В зависимости от вида экстремума (направления<br />
доминирования)<br />
k<br />
k<br />
НЛ<br />
i<br />
НХ<br />
i<br />
⎧max<br />
ki( x), если ki( x)<br />
→ max<br />
x∈X ⎪<br />
= ⎨<br />
⎪min<br />
ki( x), если ki( x)<br />
→ min<br />
,<br />
⎩⎪<br />
x∈X ⎧min<br />
ki( x), если ki( x)<br />
→ max<br />
x∈X ⎪<br />
= ⎨<br />
⎪max<br />
ki( x), если ki( x)<br />
→ min<br />
.<br />
⎩⎪<br />
x∈X (4)<br />
(5)<br />
75
О.А. Писклакова, Д.Е. Шмидт, В.С. Алексенко<br />
общая модель определения полезности решения<br />
x ∈ X имеет вид<br />
76<br />
P( x) = G[ J( a ), k ( x)<br />
], i = 1, n,<br />
(6)<br />
i i<br />
где J( ai) – <strong>информация</strong> о значениях коэффициентов<br />
относительной важности.<br />
Крайними ситуациями являются случаи, когда:<br />
1) весовые коэффициенты ai заданы в виде точных<br />
точечных количественных значений;<br />
2) <strong>информация</strong> о предпочтительности частных<br />
критериев полностью отсутствует.<br />
Как правило, между этими крайностями имеется<br />
множество ситуаций с различной степенью неопределенности<br />
задания весовых коэффициентов.<br />
В инженерной практике часто встречаются<br />
ситуации принятия решения многокритериальных<br />
решений в условиях, когда предпочтения<br />
частных критериев (весовые коэффициенты ai )<br />
заданы в виде интервалов возможных значений<br />
[ aimin, aimax ], ∀ i =1 , n . При этом возможны следующие<br />
случаи:<br />
– задание числовых значений ai в виде интервалов,<br />
без указания предпочтений внутри интервала;<br />
– задание распределения ai на интервале возможных<br />
значений в виде вероятностных характеристик;<br />
– задание возможных значений ai с помощью<br />
лингвистических переменных.<br />
Общим для всех перечисленных выше случаев<br />
условием корректности задания интервалов возможных<br />
значений ai является одновременное выполнение<br />
условий<br />
n<br />
∑ ai max<br />
i = 0<br />
n<br />
∑<br />
> 1 ; ai i = 0<br />
min<br />
< 1 , (7)<br />
Таким образом, экстремальное решение x°∈ X<br />
(оптимальный поставщик) определяется по формуле<br />
x°= argmax P( x ), i = 1, n.<br />
(8)<br />
xi∈X Необходимо рассмотреть два случая: когда a i<br />
заданы с помощью лингвистических переменных<br />
и когда весовые коэффициенты заданы в виде нечетких<br />
множеств.<br />
2. Дефазификация весовых коэффициентов,<br />
заданных нечеткими числами<br />
Для конструктивного решения задачи многокритериальной<br />
оптимизации необходимо определить<br />
численные значения весовых коэффициентов<br />
ai . Эта задача может быть решена двумя способами:<br />
методом экспертного оценивания или методом<br />
компараторной идентификации [5]. Однако<br />
в обоих случаях можно определить не точечную,<br />
а интервальную оценку значений ai , i = 1, n.<br />
Это<br />
обусловлено тем, что оба метода базируются на<br />
i<br />
определении, хотя и разными способами, некоторого<br />
ограниченного множества индивидуальных,<br />
субъективных оценок и последующей их обработке<br />
путем усреднения [4]. Таким образом, исходную<br />
информацию можно представить в виде<br />
min max<br />
j j j<br />
а точечную оценку, как<br />
a ≤a ≤ a , ∀ j = 1, n,<br />
(9)<br />
min max<br />
j j<br />
a ср<br />
a j =<br />
+ a<br />
2<br />
; ∀ j = 1, n.<br />
(10)<br />
При этом в общем случае<br />
n<br />
min<br />
a j<br />
j = 1<br />
n max<br />
cp<br />
∑ < 1 , ∑ a j > 1 , ∑a j ≠ 1, (11)<br />
j = 1<br />
n<br />
j = 1<br />
т.е., не выполняется ограничение (2).<br />
Необходимо устранить возникающую в процессе<br />
идентификации параметров a j , j = 1, n интервальную<br />
неопределенность, т.е. детерминировать<br />
параметры модели многокритериального оценивания<br />
(1).<br />
Один из возможных подходов к решению сформулированной<br />
задачи заключается в интерпретации<br />
интервалов (9), как нечетких множеств.<br />
Будем полагать, что кортеж весовых коэффициентов<br />
A =< ai> , i = 1 , n задан в виде интервалов,<br />
на которых экспертным путем определены функции<br />
принадлежности µ( ai ), i = 1 , m . При этом зна-<br />
*<br />
чения ai соответствуют функции принадлежнос-<br />
*<br />
ти µ( a j ) = 1 . Носителем каждой нечеткой оценки<br />
aj , ∀ j =1 , n , является соответствующий интервал<br />
min max *<br />
*<br />
[ aj , aj<br />
] , а a j соответствует µ( a j ) = 1 . Для простоты,<br />
но без потери общности рассматриваются<br />
функции принадлежности треугольного вида. Необходимо<br />
определить детерминированные точеч-<br />
Д<br />
ные значения a j , при этом должно выполняться<br />
условие<br />
m *<br />
m<br />
Д<br />
a j<br />
j = 1<br />
∑ = 1 . (12)<br />
Если ∑ a j = 1 , то решение задачи тривиально,<br />
j = 1<br />
Д *<br />
т.е. aj = aj<br />
. В противном случае, т.е. в случае если<br />
m<br />
*<br />
a j<br />
j = 1<br />
∑ ≠ 1 необходимо определить такой кортеж<br />
Д Д<br />
значений A =< aj> для которого:<br />
n<br />
*<br />
1) удовлетворяется условие ∑ ai = 1 ;<br />
j = 1<br />
2) минимизируется отклонение<br />
n<br />
∆µ = µ ( a µ<br />
a<br />
j ) − ( a<br />
∑ j )<br />
j<br />
n<br />
*<br />
∑ ∑<br />
j = 1 j = 1<br />
n<br />
(13)<br />
*<br />
или с учетом, что µ( ∑ ai ) = 1 , максимизируется<br />
n<br />
Д<br />
∑ai j = 1<br />
µ( ) .<br />
j = 1
МОДЕЛЬ ВЫБОрА ОПТИМАЛЬНОГО ПАрТНЕрА ПрЕДПрИЯТИЯ В уСЛОВИЯх МНОГОКрИТЕрИАЛЬНОСТИ И НЕОПрЕДЕЛЕННОСТИ<br />
Так как, по определению, значение функции<br />
принадлежности суммы нечетких чисел определяется<br />
минимальным значением µ a на множестве<br />
j<br />
слагаемых (1), то очевидно, что условие (13) будет<br />
выполняться при равенстве всех µ( a j ) , ∀ j = 1, n.<br />
Д<br />
Это означает, что в качестве a j , ∀ j = 1, n,<br />
необходимо<br />
выбрать такие значения из интервала неопределенности,<br />
для которых<br />
n<br />
Д Д<br />
µ ( aj ) = µ ( ∑aj = 1), ∀ j = 1,<br />
n . (14)<br />
j = 1<br />
Для треугольных функций принадлежности нетрудно<br />
получить следующую формулу<br />
n aj − a<br />
Д *<br />
Д<br />
j<br />
aj = aj ± [ 1− µ ( ∑ai<br />
= 1)]<br />
⋅<br />
. (15)<br />
2<br />
j = 1<br />
max min<br />
Знак (+) соответствует, случаю, когда<br />
n<br />
*<br />
a j<br />
j = 1<br />
∑ < 1 , (16)<br />
а (-) – противоположному случаю. Формула достаточно<br />
хорошо аппроксимирует и нелинейные<br />
(колоколообразные, гауссовы) функции принадлежности<br />
[6].<br />
3. Учет частных критериев, заданных нечеткими<br />
множествами<br />
На практике частные критерии чаще всего задаются<br />
в интервальном виде, а статистическая<br />
<strong>информация</strong> о характере распределения значений<br />
внутри интервала неизвестна. Эксперт в таком случае<br />
может назначить функцию принадлежности<br />
внутри интервала. Тогда значение частного критерия<br />
будет представлено в виде нечеткого числа с<br />
функцией принадлежности, при этом то значение<br />
функции принадлежности, при котором она равна<br />
единице, необязательно будет находиться на середине<br />
интервала.<br />
Для вычисления функции полезности, когда<br />
частные критерии заданы в виде НЧ, а весовые<br />
коэффициенты – в виде детерминированных<br />
значений, необходимо дефазифицировать частные<br />
критерии и найти точечные значения оценки<br />
альтернатив. Для этого необходимо выделить модальные<br />
значения нечетких чисел, т.е. значения,<br />
при которых функция принадлежности равна 1, и<br />
вычислить детерминированную оценку функции<br />
полезности. При этом значения весовых коэффициентов<br />
должны удовлетворять условию (2).<br />
Выводы<br />
В статье был выполнен анализ особенностей и<br />
обоснование модели выбора оптимального партнера<br />
предприятия в условиях многокритериальности<br />
и неопределенности исходных данных.<br />
Было разработано программное средство, которое<br />
позволяет осуществлять выбор оптимальных<br />
поставщиком методом рейтинговых оценок. При<br />
этом критерии поставщиков могут быть заданы<br />
либо детерминированно, либо лингвистически.<br />
Разработанное программное средство призвано<br />
повысить эффективность предприятия при выборе<br />
партнеров. Благодаря этому должны снизиться затраты,<br />
время выполнения, а также возможные риски<br />
данного бизнес-процесса, что приведет к снижению<br />
себестоимости конечной продукции.<br />
Программное средство предусматривает для<br />
решения данной задачи эффективный набор аналитических<br />
средств, автоматизирующих и упрощающих<br />
подбор оптимального поставщика по заданным<br />
критериям.<br />
Список литературы: 1. Троицкая, Н.А. Единая транспортная<br />
система: учеб. пособие [текст] / Н. А. Троицкая,<br />
А. Б. Чубуков. – М.: AKADEMIA, 2003. – 240 с.<br />
2. Миротин, Л.Б. Логистика: обслуживание потребителей:<br />
учеб. пособие [текст] / Л.Б. Миротин, И.Э. Ташбаев,<br />
А.Г. Касенов – М.: ИНФРА-М, 2002. – 190 с. 3. Гаджинский,<br />
А.М. Логистика [текст] / А.М. Гаджинский. – М.:<br />
Информационно-внедренческий центр “Маркетинг”,<br />
1999. – 228 с. 4. Катулев, А.Н. Современный синтез критериев<br />
в задачах принятия решений [текст] / А.Н. Катулев,<br />
Л.С. Виленчук, В.Н. Михно. – М.: Радио и связь, 1992. –<br />
119 с. 5. Петров, Е.Г. Методи і засоби прийняття рішень<br />
в соціально-економічних системах [текст] / Е.Г. Петров,<br />
М.В. Новожилова, І.В. Гребеннік. – К.: Техніка, 2004. –<br />
256 с. 6. Бодров, В.И. Математические методы принятия<br />
решений: учеб. пособие [текст] / В.И. Бодров, Т.Я. Лазарева,<br />
Ю.Ф. Мартемьянов. – Тамбов: Изд-во Тамб. гос. тех.<br />
ун-та, 2004. – 124 с. 7. Петров, Э.Г. Детерминизация нечетких<br />
параметров модели многокритериального оценивания<br />
[текст] / Э.Г. Петров, О.А. Писклакова, Н.А. Брынза<br />
// Вестник ХГТУ. – 2008. – <strong>№</strong>2(31). – С. 71-75.<br />
Поступила в редколлегию 07.09.<strong>2011</strong><br />
УДК 518.81<br />
Модель вибору оптимального партнера підприємства в<br />
умовах багатокритеріальності і невизначеності / О.О. Писклакова,<br />
Д.Є. Шмідт, В.С. Алексенко // Біоніка інтелекту:<br />
наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 74-<strong>77</strong>.<br />
Запропонована модель вибору оптимального партнера<br />
підприємства в умовах багатокритеріальності і невизначеності.<br />
Розглянуто випадки, коли вагові коефіцієнти<br />
та часткові критерії задані у вигляді нечітких чисел.<br />
Бібліогр.: 7 найм.<br />
UDK 518.81<br />
Model for selecting the best partner of a company in a multicriteria<br />
and uncertainty / O.A. Pisklakova, D.E. Schmidt,<br />
V.S. Aleksenko// Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>. –<br />
<strong>№</strong> 3 (<strong>77</strong>). – P. 74-<strong>77</strong>.<br />
The model for selecting the best partner of a company in<br />
a multi-criteria and uncertainty was proposed. The cases were<br />
considered when the weights and the particular criteria are<br />
defined as fuzzy numbers.<br />
Ref.: 7 items.<br />
<strong>77</strong>
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 78–84 хНурэ<br />
УДК 519.81<br />
78<br />
В.П. Писклакова 1 , О.А. Писклакова 2 , А.А. Пряничникова 3<br />
1, 2 ХНУРЭ, г. Харьков, Украина, ST@ kture.kharkov.ua<br />
3 ХНУРЭ, г. Харьков, Украина, stdep@kture.kharkov.ua<br />
СОЗДАНИЕ РЕГИОНАЛЬНОГО МОНИТОРИНГА КАК СРЕДСТВА<br />
РЕАЛИЗАЦИИ КОНЦЕПЦИИ УСТОЙЧИВОГО РАЗВИТИЯ<br />
СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМ<br />
В данной работе рассматриваются цели и задачи информационного мониторинга как средства получения<br />
полной, актуальной, достоверной информации о состоянии социально-экономических систем<br />
(СЭС) как объекта комплексного управления в рамках концепции устойчивого развития.<br />
КОНЦЕПЦИЯ, УСТОЙЧИВОЕ РАЗВИТИЕ, СОЦИАЛЬНО-ЭКОНОМИЧЕСКИЙ МОНИТО-<br />
РИНГ, РЕГИОНАЛЬНОЕ УПРАВЛЕНИЕ<br />
Введение<br />
Высокие темпы развития экономики и технологического<br />
прогресса повлекли за собой необходимость<br />
гармонизации социальной, культурной,<br />
экологической жизни населения. На современном<br />
этапе человечество столкнулось со всё обостряющимися<br />
противоречиями между своими<br />
растущими потребностями и неспособностью биосферы<br />
обеспечить их, не разрушаясь. В результате<br />
социально-экономическое развитие приняло характер<br />
ускоренного движения к глобальной экологической<br />
катастрофе. При этом ставится под<br />
угрозу не только удовлетворение жизненно важных<br />
потребностей и интересов будущих поколений<br />
людей, но и сама возможность их существования.<br />
Возникла идея разрешить это противоречие путем<br />
перехода к такому развитию общества, которое не<br />
разрушает своей природной основы, гарантируя<br />
человечеству возможность выживания и дальнейшего<br />
управляемого и устойчивого развития.<br />
Идеи и принципы, концепция и стратегия<br />
устойчивого развития изложены в решениях конференции<br />
ООН по охране окружающей среды и<br />
развитию (Рио-де-Жанейро, 1992 г.) [1]. Для перехода<br />
на путь устойчивого развития каждое государство<br />
должно разрабатывать собственную программу<br />
действий, с учетом собственных, существующих<br />
в данный период, тенденций в социальной, экономической<br />
и экологической сфере. Министерство<br />
экологии и природных ресурсов Украины выступило<br />
инициатором создания такой стратегии и в<br />
2004 году она должна быть разработана [2].<br />
1. Условия реализации концепции устойчивого<br />
развития общества<br />
Разработка стратегии устойчивого развития для<br />
Украины должна быть основана на тщательном,<br />
всестороннем изучении существующего состояния<br />
нашего общества, а также на анализе потенциальных<br />
возможностей его улучшения [2].<br />
Состояние современного украинского общества<br />
характеризуется обилием разнообразных про-<br />
блем, большое количество которых требует безотлагательного<br />
разрешения. Все эти проблемы тесно<br />
взаимосвязаны, и поэтому решать их необходимо<br />
комплексно. Но для этого необходимо преодолеть<br />
стереотипы мышления, например о противоречии<br />
экологии и экономики, то любые экологические<br />
мероприятия затратны для производства. На самом<br />
деле существует множество примеров, когда<br />
деньги, вложенные в экологизацию производства,<br />
приносят прибыль[2].<br />
Устойчивое развитие подразумевает создание<br />
условий, обеспечивающих удовлетворение потребностей<br />
сегодняшнего дня, не подвергая существование<br />
последующих поколений большему риску,<br />
чем нынешний. Устойчивое развитие – это гармоничное<br />
регулируемое развитие: целенаправленный<br />
контроль над происходящими изменениями в<br />
СЭС всех уровней, прогнозирование и компенсация<br />
наиболее опасных неустойчивостей и диспропорций<br />
развития.<br />
Мировое сообщество уже осознало пагубность<br />
концепции «экономического роста» и переходит<br />
к так называемой концепции «устойчивого<br />
развития». Концепция «экономического роста»<br />
предполагает принятие решения всего по одному<br />
скалярному критерию – «максимуму ожидаемой<br />
прибыли», в то время как концепция «устойчивого<br />
развития» при решении любых задач опирается на<br />
следующие три критерия: экономический, социальный<br />
и экологический.<br />
Концепция устойчивого развития – модель<br />
развития цивилизации, которая исходит из необходимости<br />
обеспечить мировой баланс между<br />
решением социально-экономических проблем<br />
и сохранением окружающей среды. Это модель<br />
развития общества, при которой удовлетворение<br />
жизненных потребностей нынешнего поколения<br />
людей достигается не за счет лишения такой возможности<br />
будущих поколений.<br />
В концепции устойчивого развития делается<br />
акцент на том, что экономический рост сам по себе<br />
не может рассматриваться как основной критерий
СОЗДАНИЕ рЕГИОНАЛЬНОГО МОНИТОрИНГА КАК СрЕДСТВА рЕАЛИЗАЦИИ КОНЦЕПЦИИ уСТОЙЧИВОГО рАЗВИТИЯ ...<br />
развития. Ведь этот рост по своей сути осуществляется<br />
за счет уничтожения природных ресурсов,<br />
и тогда последующие поколения вообще не будут<br />
иметь к ним доступа. Сюда относятся не только<br />
нефть, газ и полезные ископаемые, но и питьевая<br />
вода, воздух и т.п. Чтобы этого не допустить, сторонники<br />
концепции устойчивого развития предлагают<br />
гармонизировать экономическую, экологическую<br />
и социальную составляющие развития<br />
общества. Экономическая составляющая — сохранение<br />
совокупного капитала, с помощью которого<br />
должны производиться в необходимом объеме<br />
продукты потребления и услуги. Социальная составляющая<br />
устойчивого развития подчеркивает<br />
важность сохранения стабильности существующих<br />
социальных систем, в том числе, сокращения числа<br />
разрушающих конфликтов в обществе, путем<br />
справедливого распределения благ между людьми.<br />
Экологическая составляющая – сохранение возможности<br />
самовосстановления экосистем[3, 4].<br />
Существенное достоинство концепции устойчивого<br />
развития в том, что она учитывает не только<br />
экологический, но и временной фактор. Она ориентирована<br />
не на быстрое получение результата,<br />
а на длительную перспективу развития. Модель<br />
устойчивого развития основана на идее равенства<br />
интересов настоящего и будущих поколений. Таким<br />
образом, концепция устойчивого развития является<br />
формой регулирования социальной ответственности<br />
современного общества и государства<br />
за создание условий для будущих поколений удовлетворять<br />
разнообразные потребности – физиологические,<br />
экономические, духовные и иные – в<br />
процессе взаимодействия с природой.<br />
Для успешной реализации идей устойчивого<br />
развития в Украине необходимо следующее:<br />
– информирование всех слоев населения о проблемах<br />
устойчивого развития. Несмотря на то, что<br />
эта концепция в настоящий момент находится в<br />
центре внимания мирового сообщества, в Украине<br />
многие о ней либо не знают, либо не обращают на<br />
нее должного внимания;<br />
– смена приоритетов при разработке экономической,<br />
промышленной, энергетической, сельскохозяйственной<br />
политики. Необходимо реформировать<br />
налоговую систему, в частности перейти на<br />
рентную систему налогообложения, поддерживать<br />
развитие малого бизнеса, привлекать внутренние и<br />
внешние инвестиции;<br />
– формирование эффективной внешней политики<br />
(особенно в отношении импорта/экспорта).<br />
В настоящее время украинский рынок заполнили<br />
импортированные товары, хотя многие из них могут<br />
быть заменены товарами намного лучшего качества<br />
украинского производителя;<br />
– совершенствование нормативной базы. Необходимо<br />
создать подходящие нормативно-правовые<br />
условия для устойчивого развития;<br />
– использование новых информационных технологий<br />
для обмена информацией по устойчивому<br />
развитию, для создания баз данных и моделирования<br />
локальных социально-экономических и экологических<br />
систем;<br />
– развитие местного самоуправления. Устойчивое<br />
развитие предполагает тесное взаимодействие<br />
всех секторов общественной жизни, что является<br />
затруднительным при централизованном отраслевом<br />
управлении [2].<br />
Поэтому необходимо передать часть полномочий<br />
местным властям в рамках развития системы<br />
местного самоуправления. В Хартии устойчивого<br />
развития европейских городов это отражено в<br />
принципе субсидиарности, который предполагает<br />
наличие у органов местного самоуправления<br />
стольких полномочий сколько возможно, а у центральных<br />
– сколько необходимо, т.е. полномочия<br />
на решение соответствующей проблемы должны<br />
предоставляться властным структурам на как можно<br />
более низшем уровне, который способен решить<br />
эту проблему. Оптимально таким уровнем являются<br />
муниципальные власти, поскольку в силу своих<br />
полномочий в области планирования, инвестиций,<br />
регулирования, контроля и исполнения решений<br />
они являются самыми близкими к гражданам органами,<br />
то есть органами, которые могут непосредственно<br />
реагировать на пожелания и устремления<br />
своих избирателей. Процесс устойчивого развития<br />
городов позволит обеспечить городским властям<br />
обратную связь, показывая, какие виды деятельности<br />
ведут к сбалансированности городского развития,<br />
а какие, наоборот, препятствуют этому [2].<br />
Устойчивое развитие городов опирается на следующие<br />
базовые принципы:<br />
– города представляют собой, с одной стороны,<br />
наибольшую территориальную единицу, население<br />
которой непосредственно испытывает на себе<br />
нарушения социального, архитектурного, экономического,<br />
ресурсного и экологического равновесия.<br />
С другой стороны, городской уровень – это<br />
тот наименьший масштаб, на котором эти проблемы<br />
могут найти конструктивное целостное решение<br />
в реализуемых стратегиях развития;<br />
– признается важность рационального использования<br />
территории и формирования эффективной<br />
политики пространственного планирования,<br />
включающей стратегическую экологическую<br />
оценку всех планов. Преимущество отдается созданию<br />
многофункциональных зон, совмещающих<br />
жилье, места работы и оказания услуг, чтобы сократить<br />
потребность в переездах и, соответственно,<br />
снизить уровни загрязнения.<br />
– признается важность партнерства всех секторов<br />
общества (власть, бизнес, общественность),<br />
обеспечивается доступ всех граждан и заинтересованных<br />
групп к необходимой информации и<br />
79
В.П. Писклакова, О.А. Писклакова, А.А. Пряничникова<br />
участие каждого жителя в разработке локальных<br />
стратегий развития, осуществляются программы<br />
обучения и подготовки по вопросам устойчивого<br />
развития как для широкой общественности, так<br />
и для работников органов местного самоуправления.<br />
Таким образом, оптимальным уровнем реализации<br />
идей устойчивого развития является муниципальный<br />
уровень, и именно на этом уровне в<br />
Украине наметились положительные сдвиги. Ряд<br />
городов подписал Ольборгскую Хартию. Сдвинулся<br />
с мертвой точки процесс взаимодействия общественности<br />
(в лице общественных организаций) с<br />
властью и бизнесом [2].<br />
Для создания системы, основанной на описанной<br />
выше концепции, необходимо контролировать,<br />
в каком начальном состоянии находится объект,<br />
т.е. текущее состояние планетарной СЭС – в<br />
глобальном смысле и состояние конкретного объекта<br />
исследования в частности, т. е. создать систему<br />
комплексного мониторинга.<br />
Мониторинг можно представить как систему,<br />
специальным образом организованную и действующую<br />
постоянно, которая помогает производить<br />
сбор, анализ и обработку информации, позволяет<br />
вести необходимую статистическую отчетность,<br />
проводить оценку состояния объекта или процесса,<br />
а также прогнозировать его дальнейшее развитие.<br />
2. Мониторинг как компонент планирования<br />
Мониторинг является очень важным компонентом<br />
при планировании, принятии решений.<br />
Своевременное вмешательство в деятельность<br />
того или иного объекта иногда позволяет избежать<br />
очень серьезных ошибок и негативных результатов.<br />
Поэтому мониторинг изменения ситуации на<br />
протяжении некоторого определенного промежутка<br />
времени необходим для оценки эффективности<br />
вмешательства и его влияния на исследуемый объект.<br />
Мониторинг также позволяет сопоставить потребности<br />
и определить очередность осуществления<br />
запланированных действий по отношению к<br />
данному объекту.<br />
Основная цель мониторинга — сбор, изучение<br />
и подготовка информации для принятия и анализа<br />
решений, повышение эффективности принятия<br />
управленческих решений. Из этого можно сделать<br />
вывод, что мониторинг как система сбора и обработки<br />
информации должна удовлетворять нескольким<br />
условиям.<br />
Во-первых, мониторинг должен иметь некую<br />
целевую направленность, то есть производиться<br />
исходя из поставленной задачи.<br />
Во-вторых, мониторинг должен обеспечить<br />
максимальную точность и объективность получаемых<br />
результатов на каждой стадии обработки данных.<br />
80<br />
Таким образом, можно выделить следующие<br />
основные задачи социально-экономического и<br />
экологического мониторинга:<br />
– оценивание текущего состояния объекта и<br />
процессов, происходящих в нем;<br />
– анализ данных для установления определенных<br />
закономерностей хода процессов;<br />
– кратковременное прогнозирование процессов,<br />
которые могут происходить в исследуемом<br />
объекте;<br />
– визуализация результатов мониторинга и<br />
представление их конкретному пользователю в<br />
удобном виде.<br />
Также можно выделить еще несколько задач<br />
мониторинга:<br />
– организация наблюдения, получение достоверной<br />
и объективной информации о протекании<br />
процессов на исследуемом объекте;<br />
– оценка и системный анализ получаемой информации,<br />
выявление причин, вызывающих тот<br />
или иной характер протекания процессов;<br />
– обеспечение в установленном порядке органов<br />
управления, предприятий, учреждений и организаций<br />
независимо от их подчиненности и форм<br />
собственности, граждан информацией, полученной<br />
при осуществлении социально-экономического и<br />
экологического мониторинга;<br />
– выявление факторов, которые могут спровоцировать<br />
негативные последствия в настоящем<br />
времени и в перспективе;<br />
– разработка прогнозов развития ситуации;<br />
– подготовка рекомендаций, направленных на<br />
то, чтобы не допустить негативных последствий и<br />
обеспечить поддержку позитивных тенденций развития,<br />
а также доведение их до соответствующих<br />
органов управления.<br />
Рассматривая мониторинг как систему наблюдения<br />
за экономическими, социальными и экологическими<br />
изменениями в окружающем мире<br />
можно прийти к выводу, что все три направления<br />
очень тесно связаны между собой.<br />
Социально-экономическая структура является<br />
сложной системой, для управления которой органы<br />
власти должны точно описывать протекающие<br />
в ней процессы, правильно их интерпретировать и<br />
вырабатывать соответствующие реакции. Вместе с<br />
тем, направление и эффективность разрабатываемой<br />
и осуществляемой органами власти разного<br />
уровня социально-экономической политики зависит<br />
от системы координат (индикаторов), с помощью<br />
которой эта политика оценивается. Чтобы<br />
быстро и надежно оценить результативность развития<br />
территории (области, района, города и т.п.),<br />
надо иметь интегральные показатели, которые<br />
были бы достаточно чувствительны к изменениям<br />
социально-экономической ситуации во времени и<br />
в пространстве и которые можно было бы количе-
СОЗДАНИЕ рЕГИОНАЛЬНОГО МОНИТОрИНГА КАК СрЕДСТВА рЕАЛИЗАЦИИ КОНЦЕПЦИИ уСТОЙЧИВОГО рАЗВИТИЯ ...<br />
ственно измерить. Здесь встает вопрос о поведении<br />
социально-экономического мониторинга.<br />
А.Е. Когут определяет социально-экономический<br />
мониторинг как оценку, прогноз, систему наблюдения<br />
и анализа экономической и социальной<br />
обстановки, складывающейся на территории, а<br />
также выработку рекомендаций по принятию рациональных<br />
управленческих решений [5].<br />
Главной целью социально-экономического мониторинга<br />
принято считать обеспечение органов<br />
государственной власти полной, достоверной и<br />
своевременной информацией об изменениях происходящих<br />
в обществе, о процессах, протекающих<br />
в различных сферах жизнедеятельности населения<br />
не только на конкретной территории, но и на<br />
территории государства в целом. Также одной из<br />
основных целей социально-экономического мониторинга<br />
является сбор, изучение и подготовка<br />
информации для приятия на различных уровнях<br />
оптимальных управленческих решений. Это обусловливает<br />
две особенности, которым должен<br />
удовлетворять мониторинг как система сбора и<br />
обработки информации: целевая направленность<br />
информационных процессов и максимальная объективность<br />
получаемых выводов на каждой стадии<br />
переработки данных.<br />
Схематично систему социально-экономического<br />
мониторинга можно представить следующим<br />
образом (рис. 1):<br />
Такая система предназначена обеспечивать непрерывное<br />
отслеживание информации о социально-экономическом<br />
состоянии объектов и муниципальных<br />
образованиях, анализ и оценку<br />
происходящих в них процессов, среднесрочное<br />
и долгосрочное прогнозирование социальноэкономического<br />
развития объектов и муниципальных<br />
образований.<br />
Рис. 1. Система мониторинга<br />
Социально-экономическое состояние населения<br />
характеризует базовые аспекты жизни населения<br />
страны, которыми определены макроэкономическая<br />
и демографическая ситуации, состояние<br />
охраны здоровья, уровень образования, уровень<br />
занятости и условия труда, жилищные условия,<br />
степень социального напряжения, экологические<br />
условия проживания населения.<br />
Можно выделить следующие характерные черты<br />
социально-экономического мониторинга:<br />
1) мониторинг представляет собой постоянное<br />
продолжительное действие;<br />
2) включает в себя систематическое наблюдение<br />
и сбор информации о параметрах социальноэкономической<br />
системы;<br />
3) носит системный характер, что является важным<br />
условием его эффективности;<br />
4) сбор мониторинговых данных осуществляется<br />
при помощи разнообразных методов в зависимости<br />
от изучаемых подсистем;<br />
5) полученные данные подвергаются обработке:<br />
анализу и диагностике;<br />
6) мониторинговые данные должны быть сохранены<br />
для дальнейшего использования в принятии<br />
управленческих решений на основе моделирования<br />
и прогнозирования в социально-экономической<br />
ситуации в регионе;<br />
7) эффективность мониторинговых исследований<br />
связана с правильной постановкой цели, адекватной<br />
и своевременной информацией, проведением<br />
и использованием результатов анализа;<br />
8) охват всех значимых социальных явлений в<br />
регионе;<br />
9) наличие определенного постоянного состава<br />
показателей и индикаторов (социологических и<br />
статистических);<br />
10) наличие временных показателей, дополняющих<br />
основную систему и изменяющихся в за-<br />
81
В.П. Писклакова, О.А. Писклакова, А.А. Пряничникова<br />
висимости от потребностей пользователя, что обеспечивает<br />
гибкость системы мониторинга;<br />
11) передача данных по каналам связи на центральный<br />
вычислительный центр, их обработка и<br />
хранение;<br />
12) проведение мониторинга из единого организационного<br />
центра;<br />
13) организация доступа потребителей к имеющейся<br />
информации.<br />
Задачи социально-экономического мониторинга:<br />
как правило, сводятся к следующему [6]:<br />
– организация наблюдения, т.е. получение достоверной<br />
и объективной информации о протекании<br />
на территории муниципального образования<br />
социально-экономических процессов;<br />
– оценка и системный анализ имеющейся информации,<br />
выявление причин, влияющих на протекание<br />
экономических процессов;<br />
– обеспечение в установленном порядке органов<br />
управления, предприятий, учреждений и<br />
организаций независимо от их подчиненности и<br />
форм собственности, а также граждан информацией,<br />
полученной при осуществлении социальноэкономического<br />
мониторинга;<br />
– разработка прогнозов развития социальноэкономической<br />
ситуации;<br />
– подготовка рекомендаций, направленных на<br />
преодоление негативных и поддержку позитивных<br />
тенденций.<br />
Основные принципы организации сбора информации<br />
по социально-экономической тематике:<br />
– целенаправленность – вся система рационального<br />
мониторинга должна быть ориентирована<br />
на решение конкретных управленческих задач;<br />
– системный подход – рассмотрение региона<br />
как подсистемы более крупной общественной системы<br />
, исследование связей его с другими территориальными<br />
звеньями;<br />
– комлексность – мониторинг отдельных сфер<br />
и направлений развития региона должен осуществляться<br />
в их взаимосвязи друг с другом; необходимо<br />
осуществлять последовательное решение всей<br />
совокупности задач мониторинга по каждому из<br />
его направлений;<br />
– непрерывность в наблюдении за объектом;<br />
– периодичность снятия информации о происходящих<br />
изменениях;<br />
– сопоставимость применяемых показателей<br />
мониторинга во времени и другие.<br />
Основными направлениями социальноэкономического<br />
мониторинга являются:<br />
а) бюджетный потенциал, определяемый величиной<br />
местных налогов и сборов, отчислениями<br />
от федеральных и региональных налогов и сборов,<br />
поступлениями от сдачи муниципального имущества<br />
в аренду и пр.;<br />
82<br />
б) производственный потенциал, определяемый<br />
структурой и объемом производства, величиной и<br />
эффективностью использования фондов;<br />
в) инвестиционный потенциал, определяемый<br />
объемом привлеченных ресурсов;<br />
г) социально-инфраструктурный потенциал,<br />
характеризуемый количеством и качеством объектов<br />
инфраструктуры;<br />
д) демографический потенциал, определяемый<br />
общей численностью населения, динамикой роста/убыли,<br />
миграционными процессами;<br />
е) трудовой потенциал, определяемый образовательными,<br />
квалификационными характеристиками,<br />
занятостью в разрезе отраслей [7].<br />
Выделяют два основных вида индикаторов:<br />
1) качественные показатели, фиксирующие наличие<br />
или отсутствие определенного свойства;<br />
2) количественные показатели, определяющие<br />
меру выраженности, развития определенного<br />
свойства.<br />
Количественные оценки мониторинга предполагают<br />
наличие таких характеристик социальноэкономического<br />
развития муниципального образования,<br />
которые могут корректно выступать в<br />
виде совокупности численных значений и (или)<br />
их интегрального значения. Качественные оценки<br />
вышеназванных процедур исследования предполагают<br />
наличие неких эталонов, сравнение с<br />
которыми позволяет определить степень приближения<br />
или отклонения от заданного критерия. Качественные<br />
и количественные оценки эффективно<br />
использовать в совокупности [7].<br />
К мониторингу социально-экономических показателей<br />
предъявляется ряд требований, среди<br />
которых основными являются следующие:<br />
– во-первых, система социально-экономических<br />
показателей должна быть взаимоувязана в рамках<br />
общей схемы анализа экономической безопасности,<br />
допускающей проведение исследований как<br />
на федеральном, так и на региональном уровне;<br />
– во-вторых, система социально-экономических<br />
показателей должна отвечать перечню основных<br />
угроз экономической безопасности;<br />
– в-третьих, перечень социально-экономических<br />
показателей, используемых при мониторинге,<br />
должен быть минимальным и легко доступным с<br />
точки зрения наличия статистической информации;<br />
– в-четвертых, результаты анализа в выбранной<br />
системе показателей должны допускать простую и<br />
наглядную проверку на непротиворечивость объективной<br />
реальности;<br />
– в-пятых, социально-экономические показатели<br />
должны быть синхронизированы во времени<br />
и характеризовать определенные срезы социальноэкономической<br />
ситуации [8].<br />
Данные требования обусловливают перечень
СОЗДАНИЕ рЕГИОНАЛЬНОГО МОНИТОрИНГА КАК СрЕДСТВА рЕАЛИЗАЦИИ КОНЦЕПЦИИ уСТОЙЧИВОГО рАЗВИТИЯ ...<br />
показателей, который должен обеспечить, с одной<br />
стороны, проведение полного и достоверного анализа,<br />
а с другой – возможность быстрого получения<br />
информации и проведения необходимых расчетов<br />
с применением современных технических и программных<br />
средств на базе компьютерной техники.<br />
Для дальнейшего рассмотрения и изучения<br />
социально-экономических индикаторов прежде<br />
всего необходимо определить требования к ним.<br />
Основные требования к индикаторам для мониторинга:<br />
– простота для понимания;<br />
– политическая значимость;<br />
– возможность проведения количественных<br />
оценок,<br />
– научная обоснованность и статистическая достоверность;<br />
–возможность выявлять пространственные различия<br />
и изменения во времени;<br />
– финансовая оправданность и техническая<br />
осуществимость;<br />
– возможность проводить сравнительные оценки<br />
между государствами;<br />
– возможность агрегировать значения индикаторов<br />
на национальном и межнациональном уровне;<br />
– учет специфических особенностей различных<br />
стран;<br />
– удобство для различных категорий пользователей<br />
и, прежде всего, лиц, принимающих решения.<br />
Индикаторы могут содержать простую или агрегированную<br />
информацию. Различаются единичные<br />
и составные индикаторы. Единичные представляют<br />
собой отдельные параметры, связанные с<br />
эталонной величиной. Эталоном может быть цель<br />
(удаленность от цели), исходное состояние (удаленность<br />
от исходного состояния), пороговое значение<br />
(близость к исчезновению) или эталонный<br />
год (изменение с течением времени). Составные<br />
индикаторы объединяют разные единичные индикаторы,<br />
превращая их в другую общую единицу.<br />
Один способ заключается в превращении единичных<br />
индикаторов в безразмерные индексы путем<br />
деления их на эталонную величину. Другой подход<br />
предусматривает взвешенную трансформацию<br />
в общую единицу (перевод в эквиваленты). Затем<br />
эти единичные индикаторы могут быть обобщены.<br />
Менеджеров участков интересует, как правило,<br />
статистика и единичные индикаторы; политических<br />
деятелей на национальном уровне – составные<br />
индикаторы.<br />
Рассмотрим некоторые из этих индикаторов более<br />
подробно.<br />
Мониторинг здоровья населения должен осуществляться<br />
совместно с экологическим мониторингом,<br />
мониторингом уровня медицинского<br />
обслуживания, нормальных условий жилья, питания,<br />
отдыха.<br />
Мониторинг уровня медицинского обслуживания<br />
населения предполагает оценку его обеспеченности<br />
амбулаторно-поликлиническими учреждениями<br />
и стационарной сетью, соответствие<br />
численности медперсонала принятым нормам, наличие<br />
и доступность лекарств, медикаментов.<br />
Мониторинг уровня обеспеченности жильем<br />
предполагает помимо оценки обеспеченности,<br />
оценку уровня благоустройства жилья, характера<br />
заселения, соответствия современным планировочным<br />
и гигиеническим требованиям.<br />
При мониторинге уровня жизни населения необходимо<br />
также оценить состояние и уровень изношенности<br />
объектов ЖКХ, обеспеченность населения<br />
услугами бытового характера, наличие и<br />
доступность этих услуг, которые потребитель сможет<br />
приобрести на среднюю заработную плату.<br />
Мониторинг уровня занятости населения включает<br />
в себя помимо определения количественных и<br />
качественных показателей рынка труда определение<br />
структуры занятости по отраслям экономики,<br />
выявление динамики структуры отраслей.<br />
Мониторинг обеспечения общественного порядка<br />
предполагает определение уровня преступности,<br />
числа совершаемых преступлений, числа<br />
лиц, совершивших преступления.<br />
Информационный фонд социально-экономического<br />
мониторинга должен представлять собой<br />
систематизированные многолетние данные об<br />
экономической и социальной обстановке, складывающейся<br />
в разрезе, например, основных направлений<br />
мониторинга, нормативно-справочные<br />
материалы, сведенные в статистические регистры<br />
и базы данных [4].<br />
Итак, можно сделать вывод, что социальноэкономический<br />
мониторинг – это разветвленная<br />
система получения, обработки и хранения социологической<br />
о статистической информации по наиболее<br />
актуальным проблемам жизни общества.<br />
Выводы<br />
Таким образом, создание иерархической системы<br />
комплексного мониторинга является необходимым<br />
условием создания системы поддержки<br />
принятия решений (СППР) при реализации концепции<br />
устойчивого развития общества. Достаточным<br />
условием конструктивности и эффективности<br />
такой СППР является дополнение ее комплексом<br />
математических моделей, позволяющих формировать<br />
эффективные управляющие воздействия для<br />
перевода системы из идентифицированного текущего<br />
в заданное конечное состояние.<br />
Список литературы: 1. Рио-де-Жанейрская декларация<br />
по окружающей среде и развитию. Документ ООН A/<br />
CONf.151/26/Rev.1 (Vol. I), Стр. 3–7. 2. Лебедев, М.А.<br />
83
В.П. Писклакова, О.А. Писклакова, А.А. Пряничникова<br />
Устойчивое развитие в Украине: проблемы и возможности<br />
[Текст]/ М.А. Лебедев//Проблеми стійкого розвитку<br />
України: Зб. доповідей міжнародної наукової конфренції<br />
студентів. Київ, Всеукраїнська екологічна ліга, 2004.<br />
– C.15-18. 3. Згуровский, М.З. Роль инженерной науки<br />
и практики в устойчивом развитии общества [Текст]/<br />
М.З. Зауровский, Г.А. Статюха //Системні дослідження<br />
та інформаційні технології. – 2007. – <strong>№</strong>1. – С. 19-38.<br />
4. Згуровський, М.З. Сталий розвиток у глобальному і<br />
регіональному вимірах [Текст] /М.З. Згуровский. Київ:<br />
Політехніка, 2006. – 83 с. 5. Основы местного самоуправления<br />
в городах России [Текст] / Под ред. А.Е.Когута. //<br />
ИСЭП. – СП б, 1995. 6. Когут, А.Е. Информационные<br />
основы регионального социально-экономического мониторинга<br />
[Текст]/ А.Е. Когут, В.С. Рохчин // ИСЭП РАН.<br />
– СПб, 1995. – С.27-32. 7. Ушвицкий, Л.И. Мониторинг<br />
социально-экономической безопасности: методические<br />
основы [Электронный ресурс] / Л.И. Ушвицкий, В.Д.<br />
Протасов // Сборник научных трудов. Серия «Экономика».<br />
– СевКавГТУ. Ставрополь, 2002. – <strong>№</strong> 7. – Режим<br />
доступа: http://science.ncstu.ru/articles/econom/7/01.pdf/<br />
file_download. 8. Кузьмин, М.Н. Мониторинг как составная<br />
часть информационного обеспечения процесса управления<br />
[Электронный ресурс] / М.Н. Кузьмин. – Режим<br />
доступа: http://sisupr.mrsu.ru/2009-1/pdf/17_Kyzmin.pdf.<br />
Поступила в редколлегию 30.09.<strong>2011</strong><br />
84<br />
УДК 519.81<br />
Створення регіонального моніторингу як засобу реалізації<br />
концепції сталого розвитку соціально-економічних<br />
систем / В.П. Пісклакова, О.О. Пісклакова, А. А. Пряничнікова<br />
// Біоніка інтелекту: наук.-техн. журнал. –<br />
<strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 78-84.<br />
Стаття присвячена створенню засобів реалізації стійкого<br />
розвитку соціально-економічних систем. Розглянуто<br />
проблеми, що виникають при досягненні зазначеної<br />
мети, а також шляхи їх вирішення. Передумовою для<br />
створення таких систем є наявність повної, достовірної<br />
інформації про соціально-економічні об'єкти. Розглянуто<br />
види моніторингу, цілі та завдання.<br />
Іл.1. Бібліогр.: 9 найм.<br />
UDK 519.81<br />
Establish a regional monitoring as a means of implementing<br />
the concept of sustainable development of socio-economic<br />
systems / V.P. Pisklakova // Bionics of Intelligense: Sci. Mag.<br />
– <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – P. 78-84.<br />
The work is devoted to the creation of the implementation<br />
of sustainable socio-economic systems. The problems encountered<br />
in achieving this goal, as well as their solutions. A<br />
prerequisite for developing such systems is the availability of<br />
complete, accurate information on the socio-economic targets.<br />
Considered monitoring activities, goals and objectives.<br />
fig. 1. Ref.:9 items.
инТеллекТуальная обрабоТка информации. расПознавание образов<br />
УДК 004.932.2:004.93’1<br />
Введение<br />
В настоящее время для решения <strong>интеллект</strong>уальных<br />
задач компьютерного зрения, связанных с распознаванием<br />
объектов в условиях действия фона<br />
и помех, эффективны структурные технологии,<br />
основанные на анализе особенностей изображения<br />
в отдельных точках. Оценка свойств описания<br />
видео-объекта в виде конечного числа характерных<br />
признаков (ХП) позволяет за приемлемое время<br />
качественно разделить информацию об объекте<br />
и о фоновых образованиях [1-3]. Основой для формирования<br />
ХП служит <strong>информация</strong>, содержащаяся<br />
в некотором смысле «значимых» фрагментах.<br />
Распознавание на основе структурных описаний в<br />
виде множества ХП имеет следующие преимущества:<br />
достаточно простое в вычислительном плане<br />
формирование признаков, сжатое признаковое<br />
пространство с возможностью управления его размерностью<br />
в зависимости от задачи, устойчивость<br />
к влиянию фоновых искажений и ложных объектов.<br />
В пространстве ХП распознавание (классификация)<br />
видео-объектов сводится к построению<br />
мер подобия конечных множеств на основе соответствий<br />
элементов. Эффективный способ реализации<br />
подобия – голосование ХП [2]. Наряду с<br />
устойчивостью принятия решения при неполном<br />
или избыточном представлении описаний голосование<br />
обладает такими важными достоинствами,<br />
как высокая вероятность правильного распознавания<br />
и простота построения, что делает его конкурентоспособным<br />
среди других подходов.<br />
Особый интерес при сопоставлении конечных<br />
множеств признаков в задачах искусственного <strong>интеллект</strong>а<br />
представляет применение оптимальных<br />
подходов, в основе которых лежит оптимизация<br />
значения некоторого критерия (в данном случае<br />
величины подобия описаний) путем комбинатор-<br />
В.А. Гороховатский 1 , Т.В. Полякова 2<br />
1 Харьковский институт банковского дела Университета банковского дела НБУ,<br />
г. Харьков, Украина, е-mail:gorohovatsky-v@rambler.ru<br />
2 Харьковский национальный автомобильно-дорожный университет,<br />
г. Харьков, Украина, е-mail:assiada@list.ru<br />
ОПТИМАЛЬНЫЕ МЕТОДЫ СОПОСТАВЛЕНИЯ СТРУКТУРНЫХ<br />
ОПИСАНИЙ ВИДЕООБъЕКТОВ<br />
Обсуждаются вопросы применения оптимальных подходов при сопоставлении структурных описаний<br />
видео-объектов на примере венгерского метода для поиска максимального паросочетания в двудольном<br />
взвешенном графе. Результаты экспериментов с использованием признаков аффинных инвариантов,<br />
построенных на множестве координат характерных признаков изображения, подтверждают эффективность<br />
предложенных методов в плане более высокой достоверности распознавания по сравнению<br />
с традиционными методами на основе голосования.<br />
РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ, ХАРАКТЕРНЫЕ ПРИЗНАКИ, СОПОСТАВЛЕНИЕ<br />
СТРУКТУРНЫХ ОПИСАНИЙ, ПАРОСОЧЕТАНИЕ, ВЕНГЕРСКИЙ МЕТОД, ВЗАИМНО-<br />
ОДНОЗНАЧНОЕ СООТВЕТСТВИЕ<br />
ного перебора на конечном множестве вариантов<br />
[4]. Одним из эффективных способов структурного<br />
анализа данных, связанных с вычислением оптимального<br />
сходства конечных множеств (описаний<br />
распознаваемых объектов), является венгерский<br />
метод (ВМ), названный комбинаторной оптимизацией<br />
ограниченных множеств. Его можно рассматривать<br />
как решение задачи о назначениях для<br />
наиболее общего случая поиска максимального<br />
паросочетания в двудольном взвешенном графе [5-<br />
7]. Суть венгерского метода состоит в последовательном<br />
формировании оптимального решения за<br />
конечное число шагов. Решение задачи о назначениях<br />
решает проблему установления степени сходства<br />
структурных описаний объектов в условиях<br />
несоответствия порядка их следования или нарушения<br />
целостности описания из-за помех. Одним<br />
из достоинств применения ВМ при сопоставлении<br />
описаний является возможность оценки близости<br />
промежуточной величины сходства к оптимальному<br />
варианту решения на каждой из итераций. Это<br />
позволяет контролировать процесс и при необходимости<br />
(в целях сокращения временных затрат)<br />
прекращать его при достижении заданной точности.<br />
Такое свойство особенно важно для задач<br />
большой размерности, т.к. число векторов ХП в<br />
описаниях достигает двух-трех сотен.<br />
Принцип оптимального сопоставления структурных<br />
описаний по сравнению с известными<br />
решениями (SIfT, SURf [1]), основанными на<br />
голосовании ХП, позволяет реализовать схему построения<br />
однозначных соответствий ХП из сравниваемых<br />
описаний, что в целом улучшает достоверность<br />
распознавания.<br />
Цель исследования – анализ эффективности<br />
применения оптимальных подходов на примере<br />
венгерского метода для сопоставления описаний в<br />
виде множеств ХП.<br />
85
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 85–88 хНурэ<br />
Задачи работы состоят в модернизации ВМ для<br />
сопоставления структурных описаний, сравнительной<br />
оценке сложности вычислительных затрат<br />
с другими методами, экспериментальных исследованиях<br />
оптимальных методов для конкретных систем<br />
признаков и баз видеоинформации.<br />
1. Формализация метода оптимального<br />
сопоставления описаний<br />
Представим описание U визуального объекта в<br />
m<br />
виде конечного множества U = { ui} i=<br />
1 элементов ui ,<br />
где m – количество ХП в описании, ui – ХП, который<br />
может представлять как дескриптор (значение<br />
признака), так и геометрическую информацию<br />
(координаты ХП, значения аффинных инвариантов<br />
на основе этих координат и т.д.) [3].<br />
Критерием при сопоставлении элементов является<br />
значение некоторой метрики ρ( ui, uj<br />
) , оценивающей<br />
различия ui, uj<br />
, взятых из разных описаний<br />
uiU ∈ 1 , ujU ∈ 2 . Методы с использованием<br />
голосования определяют число (сумму) голосов<br />
элементов, исходя из величин ρ( ui, uj<br />
) путем оптимизации<br />
на конечном множестве или через оценку<br />
с помощью некоторого порога. Оптимальные<br />
методы на основе ρ( ui, uj<br />
) формируют некоторое<br />
оптимальное решение, например, минимизирующее<br />
сумму расстояний между описаниями U1, U2<br />
с учетом однозначности соответствий элементов<br />
сравниваемых множеств.<br />
Применим ВМ для оптимального установления<br />
величины соответствия между двумя структурными<br />
описаниями с учетом действия пространственных<br />
помех. Результатом выполнения ВМ является<br />
формирование максимального паросочетания для<br />
элементов двух множеств с минимизацией общей<br />
стоимости (весов), которую можно оценить в виде<br />
суммы расстояний между парами ХП из сравниваемых<br />
описаний. Сопоставление U1, U2<br />
на основе<br />
ВМ формально сводится к решению оптимизационной<br />
задачи:<br />
86<br />
m<br />
n<br />
R( x) = ∑∑ρ( ui, uj) xij<br />
→min<br />
, (1)<br />
i = 1 j = 1<br />
где uiU ∈ 1 , ujU ∈ 2 , m и n – количества точек в<br />
описаниях U1, U2<br />
; xij ∈{ 01 , } – бинарный признак,<br />
отражающий соответствие i -го и j -го элементов<br />
из U1, U2<br />
. Решение задачи (1) при ограничении на<br />
однозначность соответствия признаков из сопоставляемых<br />
множеств<br />
m ⎧<br />
⎪∑<br />
xij = 1∀ i = 1,<br />
n,<br />
⎪ j = 1<br />
⎨<br />
(2)<br />
n<br />
⎪<br />
∑ xij = 1∀ j = 1,<br />
m,<br />
⎪<br />
⎩i<br />
= 1<br />
минимизирует расстояние между U1, U2<br />
. Для прикладных<br />
задач, где необходима максимизация<br />
целевой функции в (1), переход к задаче (1) осу-<br />
ществляют путем вычитания значений ρ( ui, uj<br />
) из<br />
максимального значения метрики.<br />
Как оптимальный, так и традиционный (основанный<br />
на голосовании) подходы используют в качестве<br />
базовой информации матрицу расстояний<br />
⎡ρ11<br />
ρ12 ... ρ1n<br />
⎤<br />
⎢<br />
Ρ= ⎢<br />
ρ21 ρ22 ... ρ<br />
⎥<br />
2n<br />
⎥<br />
⎢ ... ... ... ... ⎥<br />
⎢<br />
⎥<br />
⎣ρm1<br />
ρm2 ... ρmn<br />
⎦<br />
между всевозможными парами ХП u U<br />
i ∈ 1<br />
, u U<br />
j ∈ 2 .<br />
Реализация принципа однозначного голосования<br />
элементов u i связана с анализом отдельных<br />
строк матрицы Ρ на предмет формирования голоса,<br />
равного 0 или 1. По полученному набору соответствий<br />
(голосов) можно вычислить значение<br />
критерия подобия двух описаний в виде суммы<br />
S1 L i<br />
i<br />
= ∑ (), где Li () – предикат, равный 1, если<br />
голос отдается (соответствие установлено).<br />
Реализация ВМ предполагает целенаправленный<br />
выбор такой последовательности из { ρij }, сумма<br />
значений которой S2 ij = ∑ρ будет минимальна<br />
на множестве возможных соответствий элементов<br />
описаний, и при этом из каждой строки и столбца<br />
матрицы Ρ будет выбран только один элемент,<br />
что в результате обеспечивает выбор оптимального<br />
по критерию S2 однозначного соответствия множеств<br />
элементов описаний (паросочетание).<br />
Реализация ВМ осуществляется путем целенаправленного<br />
эквивалентного преобразования матрицы<br />
Ρ с последовательным анализом строк и<br />
столбцов для получения матрицы с неотрицательными<br />
элементами и системой m независимых нулей, из<br />
которых никакие два не принадлежат одной и той же<br />
строке или одному и тому же столбцу. При достижении<br />
ситуации с m независимыми нулями проблема<br />
выбора считается решенной, оптимальный вариант<br />
назначений определяется позициями независимых<br />
нулей в преобразованной матрице [5]. Пример формирования<br />
паросочетания показан на рис. 1.<br />
Рис. 1. Паросочетания для множеств ХП<br />
Известно, что задача поиска паросочетаний<br />
с использованием ВМ решается за время, пропорциональное<br />
величине d 3 , где d – это размер<br />
сравниваемых описаний. Видим, что требуемые<br />
затраты вычислений существенно возрастают с<br />
увеличением d . В то же время для метода с голосованием<br />
затраты прямо пропорциональны d , что<br />
не так критично к росту объема описаний.
При применении ВМ для сопоставления описаний<br />
U1, U2<br />
их размерности m и n в общем случае<br />
могут отличаться. В этом случае в традиционном<br />
ВМ размер матрицы Ρ увеличивают до максимального<br />
среди m и n , а возникшие элементы заполняют<br />
нулями [5-7]. Если исходная матрица не<br />
является квадратной, то дополнительно вводят необходимое<br />
количество строк (или столбцов), а их<br />
элементам присваивают значения, определяемые<br />
условиями задачи. Для задачи определения подобия<br />
описаний полученным за счет расширения<br />
элементам необходимо присвоить некоторое максимальное<br />
значение среди возможных значений<br />
ρ( ui, uj<br />
) . Заметим, что для нашей задачи нецелесообразно<br />
усекать матрицу весов до квадратной<br />
традиционным способом в виде min( mn , ) , т.к. при<br />
этом может быть потеряна ценная <strong>информация</strong><br />
об видео-объекте. С другой стороны, дальнейшее<br />
усложнение обработки за счет применения ВМ<br />
требует минимизации размеров матрицы на этапе<br />
предварительной обработки. Это достигается посредством<br />
применения специальных методов сжатия<br />
структурных описаний [2]. Другим способом<br />
снижения затрат есть отбор в некотором смысле<br />
«значимых» строк и столбцов, например, содержащих<br />
большие по значению расстояния.<br />
2. Геометрические признаки аффинных инвариантов<br />
Особый интерес представляет применение<br />
оптимальных методов для геометрических признаков,<br />
построенных на основе координат ХП и отражающих<br />
пространственное расположение ХП объекта.<br />
Любое подмножество трех неколлинеарных<br />
точек объекта определяет аффинный базис, который<br />
задает на объекте систему координат. После<br />
выбора системы координат ХП можно представить<br />
с помощью аффинных инвариантов (АИ). После<br />
воздействия аффинного преобразования на объект<br />
значения АИ не изменяются [1]. Существуют различные<br />
способы пространственной группировки<br />
АИ для сопоставления описаний. В работе [3] для<br />
отдельного ХП формируется подмножество АИ<br />
путем рассмотрения всевозможных базисов (разные<br />
системы аффинных координат). Другим способом<br />
является формирование подмножества АИ<br />
для всех ХП в одной и той же системе координат,<br />
т.е. для отдельного базиса. Такой способ представления<br />
имеет вид значительного числа подмножеств<br />
(количество базисов) с небольшим количеством<br />
элементов. Данное представление удобно для применения<br />
ВМ из-за небольших по размеру матриц<br />
Ρ . Кроме того, оно дает возможность управлять<br />
количеством подмножеств (базисов) и принимать<br />
решение по неполному описанию.<br />
Рассмотрим множество АИ, отображающих геометрические<br />
свойства описания объекта и представленных<br />
в виде конечного множества числовых<br />
ОПТИМАЛЬНЫЕ МЕТОДЫ СОПОСТАВЛЕНИЯ СТруКТурНЫх ОПИСАНИЙ ВИДЕООБъЕКТОВ<br />
r<br />
троек { αq} q=1<br />
[3] , где r – число АИ. Расстояние<br />
между признаками αq и α p эталона и изображения<br />
для матрицы Ρ можно вычислить как<br />
qp ∑ (<br />
i = qi pi ) 2<br />
3<br />
1<br />
ρ = α −α<br />
Взаимно-однозначное соответствие элементов описаний<br />
может быть установлено путем решения задачи<br />
поиска взвешенного паросочетания. Решение<br />
о принадлежности объекта конкретному эталону<br />
принимается на основе максимального числа установленных<br />
соответствий между подмножествами<br />
АИ или на основе минимума величины S 2 .<br />
3. Результаты экспериментов<br />
В качестве критерия, характеризующего достоверность<br />
распознавания в конечной базе данных,<br />
рассмотрим величину θ=h1 / h2,<br />
где h2 – максимум<br />
гистограммы голосов, h1 – ближайший к нему<br />
максимум. Значение критерия θ показывает, насколько<br />
уверенно осуществляется принятие решения<br />
на основе полученного максимума числа голосов,<br />
отданных за конкретный эталон. Чем меньше<br />
значение θ , тем в большей степени глобальное решение<br />
значимо по отношению к локальному, соответствующему<br />
наиболее близкому из остальных<br />
(возможно, ложных) классов.<br />
Для базы объектов видео-данных Coil-20 [1]<br />
вычислено множество АИ { αq } . Эксперимент для<br />
традиционного подхода на основе голосования ХП<br />
состоял в том, что на вход системы распознавания<br />
поступало описание одного из эталонов, которое<br />
последовательно сравнивалось со всеми описаниями<br />
базы, в результате принималось решение<br />
в соответствии с максимумом нормированного<br />
количества голосов [2]. Для предложенного оптимального<br />
метода сопоставление осуществлялось по<br />
принципу «множество-множество» с достижением<br />
минимума в выражении (1) при условии однозначного<br />
соответствия элементов множеств. Для базы<br />
Coil-20 с применением структурных описаний в<br />
виде множеств АИ достигнуто безошибочное распознавание.<br />
Сравнительные эксперименты показали, что в<br />
традиционном подходе величина θ для правильно<br />
найденного класса относительно других эталонов<br />
достигает значения θ=08 , , в то время как для<br />
оптимального метода на основе ВМ максимальное<br />
из значений θ=016 , . Это непосредственно доказывает,<br />
что достоверность распознавания для<br />
оптимального метода существенно лучше.<br />
В то же время отметим, что для оптимального<br />
метода затраты времени на решение задачи распознавания<br />
несколько больше, чем для традиционного<br />
метода. При этом временные затраты значительно<br />
увеличиваются с увеличением размерности<br />
сравниваемых описаний, а применение аппарата<br />
АИ, как известно, по сравнению с обычным пред-<br />
.<br />
87
В.А. Гороховатский, Т.В. Полякова<br />
ставлением в виде множества ХП еще более усиливает<br />
временные различия. Например, для m = 6<br />
с использованием пространства АИ временные<br />
затраты оптимального метода при распознавании<br />
оказались в 1,5 раза выше, а при m = 13 – в десятки<br />
раз больше. Отметим, что эти затраты могут регулироваться<br />
за счет процедуры предварительной<br />
обработки структурных описаний для конкретно<br />
решаемой прикладной задачи.<br />
Выводы<br />
Оптимальные методы для сопоставления структурных<br />
описаний объектов за счет более тщательного<br />
отбора соответствий обеспечивают лучшую<br />
достоверность распознавания по сравнению с традиционными<br />
подходами на основе голосования.<br />
Проведен анализ и исследование оптимального<br />
метода сопоставления на основе ВМ для описаний,<br />
представленных множеством аффинных инвариантов.<br />
В целом полученные характеристики для оптимального<br />
метода могут быть оценены как предельно<br />
достижимые, в то время как традиционный подход<br />
с голосованием отдельных элементов описания<br />
можно считать некоторой практической аппроксимацией.<br />
Оптимальные методы целесообразно применять<br />
для задач, требующих наиболее тщательного<br />
анализа соответствия множеств описаний.<br />
Впервые показано, что применение оптимальных<br />
методов определения максимального паросочетания<br />
в двудольном графе для задачи сопоставления<br />
структурных описаний видео-объектов<br />
повышает достоверность распознавания за счет<br />
однозначного и более точного учета подобия подмножеств<br />
элементов описаний. На примере геометрических<br />
признаков изображений получено экспериментальное<br />
подтверждение эффективности<br />
предложенных методов.<br />
Практически важным является получение предпочтительных<br />
характеристик распознавания по<br />
сравнению с известными методами, что говорит о<br />
целесообразности развития и применения оптимальных<br />
методов сопоставления в задачах компьютерного<br />
зрения.<br />
Перспективы исследования состоят в разработке<br />
подходов к построению мер подобия на основе<br />
структурного анализа подмножеств значений аффинных<br />
инвариантов, сгруппированных для отдельных<br />
базисов.<br />
88<br />
Список литературы: 1. Шапиро, Л. Компьютерное зрение<br />
[Текст] / Л. Шапиро, Дж. Стокман; пер. с англ.– М.: БИ-<br />
НОМ. Лаборатория знаний, 2006. – 752 с. 2. Gorokhovatskiy<br />
V.A. Compression of Descriptions in the Structural Image<br />
Recognition / V.A. Gorokhovatskiy // Telecommunications<br />
and Radio Engineering. – <strong>2011</strong>, Vol. 70, No 15. – P. 1363-<br />
1371. 3. Гороховатский, В.А. Модели комплексированных<br />
мер подобия структурных описаний изображений [Текст]<br />
/ В.А. Гороховатский, Т.В. Полякова, Е.П. Путятин //<br />
Реєстрація, зберігання і обробка даних. — <strong>2011</strong>. — Т. 13,<br />
<strong>№</strong> 1. — С. 21–28. 4. Рассел, С. Искусственный <strong>интеллект</strong>:<br />
современный подход; 2-е изд. [Текст]/ С. Рассел, П. Норвиг;<br />
пер. с англ.– М.: Изд. дом «Вильямс», 2006. – 1408 с.<br />
5. Гольштейн, Е.Г. Задачи линейного программирования<br />
транспортного типа [Текст] / Е.Г. Гольштейн, Д.Б. Юдин,<br />
- M.: Наука, 1969. – 382 с. 6. Сонькин, Д.М. Адаптивный<br />
алгоритм распределения заказов на обслуживание автомобилями<br />
такси [Текст] / Д.М. Сонькин // Известия<br />
Томского политехнического университета. – 2009. –<br />
Т. 315, <strong>№</strong> 5. –С.65-69. 7. Пападимитриу, Х. Комбинаторная<br />
оптимизация. Алгоритмы и сложность [Текст] /<br />
Х. Пападимитриу, К. Стайглиц // М.: Мир, 1985. – 512 c.<br />
Поступила в редколлегию 19.05.<strong>2011</strong><br />
УДК 004.932.2:004.93’1<br />
Оптимальні методи зіставлення структурних описів<br />
відеооб’єктів / В.О. Гороховатський, Т.В. Полякова //<br />
Біоніка інтелекту: наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>).<br />
– С. 85-88.<br />
Обговорюються питання застосування оптимальних<br />
підходів при зіставленні структурних описів відеооб’єктів<br />
на прикладі угорського методу для пошуку максимального<br />
паросполучення у дводольному зваженому<br />
графі. Результати експериментів з використанням ознак<br />
аффінних інваріантів, побудованих на множині координат<br />
характерних ознак зображення, підтверджують<br />
ефективність запропонованих методів в плані більш високої<br />
достовірності розпізнавання в порівнянні з традиційними<br />
методами на основі голосування.<br />
Бібліогр.: 7 найм.<br />
UDC 004.932.2:004.93’1<br />
Optimal methods of structural descriptions of video objects<br />
comparison / V.O. Gorokhovatsky, T.V. Polyakova // Bionics<br />
of Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – P. 85-88.<br />
The application of optimal approaches for structural descriptions<br />
of video-objects comparison are discussed, e.g.<br />
Hungarian method for finding maximum matching in the bipartite<br />
weighted graph. Experimental results based on affine<br />
invariant features which are built on coordinate set of image<br />
characteristic features confirm efficiency of proposed methods<br />
at higher recognition rate in comparison with traditional<br />
voting methods.<br />
Ref.: 7 items.
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 89–93 хНурэ<br />
УДК 004.89<br />
М.М. Зацеркляний, А.Л. Єрохін, А.С. Бабій, О.П. Турута<br />
Харківський національний університет внутрішніх справ,<br />
м. Харків, Україна, ayerokhin@ukr.net<br />
РОЗРОБКА МЕТОДУ ВИЯВЛЕННЯ СЕЗОННИХ КОЛИВАНЬ<br />
З ЗАСТОСУВАННЯМ НЕЧІТКОГО ЗГЛАДЖУВАННЯ<br />
НА БАЗІ f-ПЕРЕТВОРЕННЯ<br />
У статті на основі методики виявлення сезонної складової запропонована модифікація підходу до<br />
виявлення тренда, яка полягає у використанні методу згладжування на базі нечіткого перетворення<br />
(f-перетворення). За основу покладена адитивна модель подання динамічного ряду. У методі попередньо<br />
виділяється тренд, а потім сезонний компонент. Тренд виділяється за допомогою нечіткого<br />
згладжування.<br />
МОДЕЛЮВАННЯ НЕСТАЦІОНАРНИХ ПРОЦЕССІВ, СЕЗОННІ КОЛИВАННЯ, ЗГЛАДЖУ-<br />
ВАННЯ ДИНАМІЧНОГО РЯДУ<br />
Вступ<br />
Використання сучасних методів та засобів штучного<br />
інтелекту для ефективного вирішення практичних<br />
задач кримінології є надзвичайно важливим.<br />
У 1988 році в рамках ООН створена інформаційна<br />
система в області боротьби зі злочинністю та розміщена<br />
в мережі Internet. Міжнародні конгреси ООН<br />
із попередження злочинності і поведінки з правопорушниками<br />
рекомендують державам вжити заходи<br />
щодо комп’ютеризації кримінального правосуддя.<br />
Ці рекомендації затверджені й Генеральною Асамблеєю<br />
ООН. Подальший розвиток інформатизації<br />
правозастосовної діяльності передбачений у резолюції<br />
1993/34 Економічної і Соціальної Ради ООН.<br />
Для виконання названої резолюції Секретаріат<br />
ООН приступив до вивчення питання про розвиток<br />
і поширення інформаційної мережі та створення<br />
міжнародного інформаційно-аналітичного центру<br />
з досить широкими функціями. Кінцевою метою<br />
роботи такого центру стане зміцнення потенціалу<br />
національних держав у питаннях одержання,<br />
збереження, опрацювання, аналізу та поширення<br />
електронної інформації із області попередження<br />
злочинності і кримінального правосуддя.<br />
Добре розроблене законодавство та система заходів<br />
попередження при їх невиконанні не забезпечують<br />
необхідного рівня законності. Для цього потрібний<br />
комплекс умов організаційного характеру<br />
– контроль, нагляд, перевірка виконання тощо, де<br />
є можливості для широкого застосування інформаційних<br />
технологій.<br />
Забезпечення структур управління, до яких належать<br />
і органи внутрішніх справ, належною інформацією<br />
– умова ефективної діяльності. Вимоги<br />
відбору необхідної інформації відносяться до всіх<br />
її форм, але в першу чергу – до статистичної, що<br />
є джерелом відомостей, які суттєво впливають на<br />
управлінський процес.<br />
Досить часто фактор сезонності є достатньо важливим<br />
під час прийняття рішення про проведення<br />
профілактичних заходів або протидії злочинності.<br />
У випадку, якщо суспільне явище має багато чин-<br />
ників, або носить комплексний характер, необхідні<br />
статистичні методи виявлення сезонності.<br />
1. Аналіз літератури<br />
Питанням аналізу та прогнозування злочинності,<br />
застосування методів штучного інтелекту для задач<br />
кримінології присвячені роботи [1-6]. Методи прогнозування<br />
можуть ґрунтуватися на штучних нейронних<br />
мережах, причому нейронні мережі в таких<br />
задачах виступають в якості універсального апроксиматора<br />
даних [2-6], тобто у процесі навчання підбираються<br />
функціональні коефіцієнти, а розрахунок<br />
значення апроксимаційної функції для заданих вхідних<br />
даних відбувається на етапі функціонування.<br />
Методи прогнозування можуть ґрунтуватися й<br />
на нечітких множинах. Основні принципи функціонування<br />
та підходи до застосування нечітких множин<br />
для прогнозування розглянуті в [7]. Підходи,<br />
що спираються на моделі виведення Мамдані-Заде<br />
[8] і TSK [9], дозволяють описати досліджуване<br />
явище у вигляді нелінійної функції вхідних змінних<br />
xi (і = 1,2,…,N) і параметрів нечіткої системи.<br />
В [10] відзначено, що ці підходи дають можливість<br />
апроксимувати з довільною точністю довільну нелінійну<br />
функцію багатьох змінних сумою нечітких<br />
функцій однієї змінної.<br />
В роботах [11,12] було розглянуто застосування<br />
методу нечіткого згладжування на основі<br />
f-перетворень для аналізу даних, в тому числі для<br />
виявлення трендової складової. В роботі [13] було<br />
розглянуто застосування методики Четверякова<br />
для аналізу сезонних коливань динамічного ряду.<br />
В даній статті пропонується модифікація методики<br />
визначення сезонних коливань злочинності<br />
шляхом застосування нечіткого згладжування на<br />
етапі виявлення тренду.<br />
2. Огляд методів аналізу та прогнозування<br />
числових рядів<br />
Використання сучасних інформаційних технологій<br />
дозволяє суттєво впливати на недопущення<br />
89
М.М. Зацеркляний, А.Л. Єрохін, А.С. Бабій, О.П. Турута<br />
посадових правопорушень, адже фіксація факту перевищення<br />
влади чи службових повноважень у процесі<br />
припинення злочинів чи інших неправових дій<br />
працівників дозволяє вести серйозну профілактичну<br />
роботу з кадрами. Створення умов для розгляду<br />
кожного факту правопорушення з боку працівника<br />
правоохоронного блоку є основою для притягнення<br />
його до юридичної відповідальності за свої дії.<br />
Вимоги відбору необхідної інформації відносяться<br />
до всіх її форм, але в першу чергу – до статистичної.<br />
Неповне відображення стану злочинності в<br />
статистичних обліках, незважаючи на наявність інформації<br />
про невраховані злочини (латентну злочинність),<br />
пов’язано з випадками навмисного приховування<br />
злочинів від обліку, які зустрічаються на<br />
практиці.<br />
Негативний ефект від приховування злочинів<br />
проявляється двояко: воно робить інформацію<br />
необ’єктивною і тим самим перешкоджає забезпеченню<br />
її повноти про стан злочинності, а також є<br />
тяжким порушенням законності.<br />
Отже, значну роль в реалізації “Комплексної цільової<br />
програми боротьби зі злочинністю” відіграє<br />
система інформаційного забезпечення, яка здійснює<br />
інформаційну підтримку органів внутрішніх<br />
справ у розкритті, розслідуванні та попередженні<br />
злочинів, у процесі встановлення та розшуку злочинців,<br />
надає багатоцільову статистичну, аналітичну<br />
та довідкову інформацію. Тому в останні<br />
роки в Україні спостерігається інтенсивне впровадження<br />
сучасних інформаційних технологій, і<br />
особливо методів і засобі штучного інтелекту, у<br />
діяльність правоохоронних органів. Інформація,<br />
зафіксована на основі офіційного обліку або шляхом<br />
спеціально організованого дослідження у статистичних<br />
картках, журналах обліку, базах даних,<br />
комп’ютерних інформаційних системах, в анкетах<br />
опитування громадян, при вивченні кримінальних,<br />
адміністративних, цивільних справ та інших матеріалів,<br />
є розрізненими “горами даних” про одиниці<br />
досліджуваної сукупності. Ця інформація стає дієвим<br />
засобом боротьби зі злочинністю тільки у випадку<br />
її аналітичного опрацювання, розвиток якого<br />
на сьогодні не є задовільним.<br />
Основний вид ресурсу в організаційних системах,<br />
до яких належать органи внутрішніх справ, –<br />
люди, які забезпечують виконання задач, що стоять<br />
перед цією системою.<br />
Прогнозування кадрових ресурсів, зокрема потреби<br />
різних служб і підрозділів органів внутрішніх<br />
справ у фахівцях відповідної кваліфікації, завжди<br />
було однією з найважливіших управлінських задач<br />
у системі МВС. Особливу актуальність ця проблема<br />
здобуває зараз в умовах децентралізації управління,<br />
підвищення самостійності низових органів<br />
у розв’язуванні організаційно-штатних задач.<br />
Крім кримінологічних прогнозів при обґрунтуванні<br />
потреби органів внутрішніх справ у ка-<br />
90<br />
драх необхідно враховувати сучасні соціальноекономічні,<br />
політичні і демографічні процеси,<br />
оскільки вони не тільки визначають кримінальну<br />
обстановку в країні, а й значно впливають на умови<br />
комплектування ОВС.<br />
Таким чином, в основі розрахунку потреби в<br />
кадрах знаходиться комплекс прогнозних оцінок<br />
різних факторів, які впливають як на стан злочинності,<br />
так і на умови комплектування ОВС кваліфікованими<br />
кадрами.<br />
Питаннями оцінювання злочинності займалися<br />
вчені різних країн світу протягом останніх декількох<br />
століть.<br />
Вивчення структурних показників у часі дає можливість<br />
виявити реальні тенденції складових частин<br />
юридично значущих явищ, спираючись на які можна<br />
розв’язувати і прогностичні проблеми. Важливе<br />
значення при аналізі злочинності має її інтенсивність.<br />
Інтенсивність злочинності є складним якіснокількісним<br />
параметром кримінологічної обстановки<br />
в країні, регіоні, районі чи населеному пункті, який<br />
вказує на рівень злочинних проявів, темпи їх зростання<br />
чи міру суспільної небезпеки (ваги).<br />
Проблеми математичного моделювання нестаціонарних<br />
процесів, до яких відносяться соціальні<br />
процеси, в тому числі злочинність, стають все<br />
більш актуальними завдяки можливості розвитку<br />
комп’ютерних інформаційних технологій, зокрема<br />
систем підтримки прийняття рішень (СППР),<br />
які інтегрують у собі сучасні методи взаємодії<br />
комп’ютер–особа, що приймає рішення, моделі та<br />
методи прийняття рішень, методи прогнозування<br />
та менеджменту процесів різної природи.<br />
Оцінювання злочинності неможливо проводити<br />
без врахування економічного, соціального, демографічного<br />
стану громади.<br />
Прийняття рішень при оцінюванні злочинності,<br />
необхідно відрізняти від прийняття рішень при<br />
протидії злочинності. Оцінювання є одним з етапів<br />
протидії злочинності.<br />
Під оцінюванням злочинності розуміється порівняння<br />
рівнів зареєстрованої злочинності серед<br />
громад, подібних за економічними, соціальними та<br />
демографічними показниками, та вибір адекватної<br />
моделі розвитку злочинності для подальшого прийняття<br />
рішень, пов’язаних з протидією злочинності<br />
для даної групи підрозділів або зменшенню рівнів<br />
латентності.<br />
Створюючи СППР як сукупність процедур з<br />
обробки даних та суджень, що допомагають керівнику<br />
в прийнятті рішень, що ґрунтуються на використанні<br />
моделей, будемо враховувати наступні<br />
специфічні риси:<br />
– можливість вироблення варіантів рішення в<br />
спеціальних, неочікуваних для ОПР ситуаціях;<br />
– можливість моделей, що застосовуються в<br />
системах, адаптуватися до конкретної, специфічної<br />
реальності в результаті діалога з користувачем;
рОЗрОБКА МЕТОДу ВИЯВЛЕННЯ СЕЗОННИх КОЛИВАНЬ З ЗАСТОСуВАННЯМ НЕЧІТКОГО ЗГЛАДЖуВАННЯ НА БАЗІ f-ПЕрЕТВОрЕННЯ<br />
– можливість системи інтерактивного генерування<br />
моделей.<br />
Все це поєднується із зручним поданням результатів<br />
обчислень альтернативних варіантів прийняття<br />
рішень, адаптивним дружнім інтерфейсом,<br />
базою знань і даних.<br />
Головною особливістю інформаційної технології<br />
підтримки ухвалення рішень є якісно новий<br />
метод організації взаємодії людини і комп’ютера.<br />
Вироблення рішень, що є основною метою цієї<br />
технології, відбувається в результаті ітераційного<br />
процесу, в якому беруть участь:<br />
– система підтримки ухвалення рішень у ролі<br />
обчислювальної ланки і об’єкту управління;<br />
– людина як управляюча ланка, що задає вхідні<br />
дані і оцінює одержаний результат обчислень на<br />
комп’ютері.<br />
Завершення ітераційного процесу відбувається<br />
за вказівкою людини. В цьому випадку можна говорити<br />
про здатність інформаційної системи спільно<br />
з користувачем створювати нову інформацію для<br />
ухвалення рішень.<br />
На сьогоднішній день в теорії ухвалення рішень<br />
широко відомі такі методи:<br />
1. Методи теорії корисності. Теорія корисності<br />
носить аксиометричний характер. Згідно з цими методами,<br />
якщо переваги людей відносно певних ігор<br />
задовольняють ряду аксіом, то їх поведінка може<br />
розглядатися як максимізація очікуваної корисності.<br />
Д. Седвіж розробив аксіоматичну теорію, яка дозволяє<br />
одночасно вимірювати корисність і суб’єктивну<br />
ймовірність. Це знайшло відображення в моделі<br />
суб’єктивної очікуваної корисності, де ймовірність<br />
визначається як міра впевненості в здійсненні тієї чи<br />
іншої події. Модель знайшла широке використання<br />
серед економістів і розглядається ними як обгрунтований<br />
засіб вибору якнайкращих рішень.<br />
Суть методу дерев рішень полягає в розбитті задачі<br />
на ряд підзадач, а ті, в свою чергу, на інші підзадачі,<br />
і так далі. В результаті основна задача подається<br />
у вигляді дерева рішень. В частині вершин дерева<br />
рішень вибір здійснюється безпосередньо особою,<br />
що приймає рішення, в іншій частині – на основі<br />
суб’єктивної ймовірності настання подій. Метод<br />
дерев рішень дозволяє особі, що приймає рішення,<br />
визначити оптимальну послідовність дій (стратегію)<br />
з урахуванням особистих оцінок і переваг.<br />
В основу багатокритерійної теорії корисності<br />
(МТП) покладається припущення, що варіанти рішень<br />
мають оцінки за багатьма критеріями. Причому<br />
при виконанні умови строгої умовної незалежності<br />
по корисності, функція корисності має<br />
або аддитивний, або мультиплікативний вигляд.<br />
2. Методи теорії проспектів (ТП). Проспект –<br />
це гра з результатами ймовірності. В методах теорії<br />
проспектів враховується 3 поведінкові ефекти:<br />
– ефект визначеності – тенденція надавати<br />
більшу вагу детермінованим результатам;<br />
– ефект віддзеркалення – до вимірювання переваг<br />
при переході від виграшів до втрат;<br />
– ефект ізоляції – тенденція до спрощення вибору<br />
шляхом виключення загальних компонентів<br />
варіантів рішення.<br />
Методи теорії проспектів мають аксіоматичні<br />
основи. Недоліком є те, що даний метод не знімає<br />
усіх проблем, які виникають при вивченні поведінки<br />
людей в задачах вибору рішень.<br />
3. Методи ELECTRE. В методах ELECTRE пропонується<br />
конструктивний підхід до вироблення<br />
рішень, в рамках якого методи, моделі і концепції<br />
розглядаються як допоміжні засоби практичного<br />
аналізу ситуації. Ці засоби дозволяють з’ясувати<br />
цілі ухвалення рішень і краще зрозуміти переваги<br />
особи, що приймає рішення. Недоліком методів<br />
ELECTRE є те, що вони є допоміжними засобами,<br />
а не способом вироблення кращого рішення як при<br />
аксіоматичному підході.<br />
4. Метод аналізу ієрархій. В цьому методі використовується<br />
дерево критеріїв, в якому загальні<br />
критерії діляться на критерії окремого характеру.<br />
Для кожної групи критеріїв визначаються коефіцієнти<br />
важливості. Альтернативи також порівнюються<br />
між собою за окремими критеріями з метою<br />
визначення кожної з них. Засобом визначення<br />
коефіцієнтів важливості критеріїв або критерійної<br />
цінності альтернатив є попарне порівняння.<br />
Результат порівняння оцінюється за бальною шкалою.<br />
На основі таких порівнянь обчислюються коефіцієнти<br />
важливості критеріїв, оцінки альтернатив<br />
і знаходиться загальна оцінка як зважена сума<br />
оцінок критеріїв.<br />
5. Евристичні методи. До евристичних методів<br />
відносяться такі методи:<br />
– метод зваженої суми оцінок критеріїв. Кожній<br />
альтернативі дається числова (бальна) оцінка<br />
за кожним із критеріїв. Критеріям приписується<br />
кількісна вага, що характеризує їх порівняльну<br />
важливість. Вага множиться на критерійні оцінки,<br />
одержані числа сумуються – так визначається цінність<br />
альтернативи. Далі вибирається альтернатива<br />
з найбільшим показником цінності;<br />
– метод компенсації. Даний метод використовується<br />
при попарному порівнянні альтернатив.<br />
3. Розробка методу виявлення сезонних коливань<br />
Сезонні коливання властиві абсолютній більшості<br />
юридично значущих явищ. Сезонність<br />
зв’язується, як правило, зі зміною природнокліматичних<br />
умов у рамках обмеженого проміжку<br />
часу – річного періоду. Найбільш яскраво цей<br />
зв’язок видно там, де досліджувані процеси прямо<br />
пов’язані з природними особливостями тієї чи іншої<br />
пори року. Проте сезонні коливання формуються<br />
не тільки під впливом природно-кліматичних<br />
чинників, а й, нехай меншою мірою, під впливом<br />
інших особливостей досліджуваної системи.<br />
91
М.М. Зацеркляний, А.Л. Єрохін, А.С. Бабій, О.П. Турута<br />
Не в усіх випадках сезонність є наслідком дії<br />
некерованих або майже некерованих факторів.<br />
Частіше вони піддаються регулюванню. Та навіть<br />
і в тих випадках, коли прямий вплив на процеси,<br />
які викликають сезонні коливання, неможливий,<br />
необхідно враховувати їх дію при вдосконалюванні<br />
відповідних процесів і процесів управління. Для<br />
цілеспрямованого впливу на сезонність необхідно<br />
вміти вимірювати та аналізувати сезонність, уміти<br />
передбачати розвиток процесів, залежних від сезонних<br />
коливаннь.<br />
Розглядаємо часовий ряд:<br />
92<br />
xi = Ui + Vi<br />
+ε i , i = 1,...., N , (1)<br />
де Ui – тренд; Vi – сезонний компонент, εi – випадковий<br />
компонент, N – число рівнів спостереження.<br />
щодо Ui передбачається, що це деяка гладка<br />
функція, міра гладкості якої заздалегідь невідома.<br />
Під мірою гладкості тренда розуміється мінімальний<br />
ступінь полінома, який адекватно згладжує<br />
компонент Ui . Сезонний компонент Vi має період<br />
Т0 : Vi+ T = V<br />
0 i (T0 =12 для ряду місячних даних; Т0 =4<br />
– для ряду квартальних даних).<br />
Крім того, відомо, що N=mТ0 , m – ціле число.<br />
Очевидно, коли Т0 – число місяців або кварталів у<br />
році, то m – число років, поданих у часовому ряді<br />
{xi }. Початкові дані часового ряду можна подати у<br />
вигляді матриці {xij } розміру [m×T0 ]. У цьому випадку<br />
вираз (1) записується так:<br />
x = U + V +ε , i = 1, m , j = 1, T0.<br />
(2)<br />
i, j i, j i, j i, j<br />
Аналіз сезонності полягає у дослідженні сезонних<br />
коливань та у дослідженні того зовнішнього<br />
циклічного механізму, який їх зумовлює. Для дослідження<br />
сезонних коливань поза зв’язком із причинами,<br />
які їх породжують, необхідно відфільтрувати<br />
із часового ряду {xi } сезонний компонент Vi і<br />
проаналізувати його динаміку.<br />
В методах фільтрації попередньо виділяється<br />
тренд, а потім сезонний компонент. Тренд у чистому<br />
вигляді необхідний і для аналізу динаміки<br />
сезонної хвилі.<br />
Розглянемо насамперед деякі теоретичні питання<br />
виявлення і фільтрації сезонного компонента<br />
динамічного ряду. Як і раніше, будемо розглядати<br />
динамічні ряди, породжувані аддитивним випадковим<br />
процесом (1).<br />
Основна ідея ітераційних процедур виявлення<br />
тренду динамічного ряду полягає в багатократному<br />
застосуванні ковзної середньої:<br />
xi−T<br />
x<br />
0 / 2<br />
i+ T0/<br />
2<br />
+ xi− T + +⋅⋅⋅+ xi +⋅⋅⋅+ xi+<br />
T + +<br />
0/ 2 1 0/<br />
2 1<br />
xi<br />
=<br />
2 2<br />
=<br />
T<br />
=<br />
0<br />
p<br />
∑ ατxi+ τ<br />
τ=−p<br />
T<br />
0<br />
(3)<br />
і оцінці сезонного компонента на кожній ітерації.<br />
При переході від однієї ітерації до іншої може<br />
відбуватися зміна довжини ділянки ковзання Т 0 і<br />
закону зміни вагових коефіцієнтів α τ .<br />
Для виявлення тренду в динамічних рядах злочинності<br />
пропонується модифікація, а саме: використовувати<br />
нечітке згладжування динамічного ряду на<br />
основі нечіткого перетворення (f-перетворення).<br />
Цей метод реалізується наступним алгоритмом<br />
[10, 11]:<br />
1. Для виявлення тренду скористаємося підходом,<br />
описаним в [14], що базується на використанні<br />
нечіткого згладжування динамічного ряду на<br />
основі нечіткого перетворення (f-перетворення).<br />
Нехай існує функція f , значення якої відомі в<br />
точках x1 ... xN∈ w .<br />
Розділимо динамічний ряд (w – інтервал динамічного<br />
ряду) на множину рівновіддалених вузлів<br />
t = υ + h( k − 1), k = 1 ,... n,<br />
k L<br />
υR − υL<br />
де N > n, h = . Визначимо n базисних функцій<br />
n −1<br />
A1 ... An, що покривають весь інтервал динамічного<br />
ряду та відповідають таким умовам:<br />
1. Ak – неперервна,<br />
2. Ak – монотонно зростає на [ tk−1 , t k]<br />
і монотонно<br />
спадає на [ tk, t k+1 ] ,<br />
3. Ak : w → [ 01 ,], Ak( tk)<br />
= 1,<br />
4. Ak ()= t 0 , якщо t ∉( tk− 1, tk+<br />
1 ) , де вважаємо, що<br />
t0 = t1 = υL, tn+ 1 = tn<br />
= υR<br />
,<br />
5. Ak t ()= ∑ 1 для всіх t ∈ w.<br />
Для даного випадку скористаємося базисною<br />
функцією<br />
⎧ t − tk−1<br />
⎪ , якщо : tk−1≤t ≤tk<br />
tk − tk−1<br />
⎪<br />
(4)<br />
⎨ tk+ 1 − t<br />
Ak() t =<br />
⎪<br />
, якщо : tk≤t ≤tk<br />
+ 1<br />
tk+ 1 − tk<br />
⎪<br />
⎩⎪<br />
0,в іншому випадку<br />
Розділимо інтервал w на n нечітких областей.<br />
Використовуючи базисні фунції, ми перетворимо<br />
дану функцію f в кортеж з n дійсних чисел<br />
[ U1 ,..., Un] , що визначені<br />
U<br />
k<br />
f ti Ak ti<br />
=<br />
A t<br />
∑ ( ) ( )<br />
( )<br />
∑<br />
k i<br />
, k = 1,..., n (5)<br />
f – компоненти (U k ) представляють собою тренд<br />
динамічного ряду. Для отримання значень тренду<br />
в точках, де відсутні значення f-компонентів після<br />
згладження, скористаємося в даному випадку<br />
лінійною інтерполяцією між двома найближчими<br />
точками з відомими значеннями:<br />
Нехай відомі значення U d 0 та U d1 . Тоді відшуку-<br />
( 1 )<br />
ване значення U i , де d0< i < d1можна<br />
знайти за<br />
такою формулою:<br />
( 1)<br />
Ud1 −Ud0<br />
Ui = Ud0+<br />
( i − d0)<br />
.<br />
d1−d0
рОЗрОБКА МЕТОДу ВИЯВЛЕННЯ СЕЗОННИх КОЛИВАНЬ З ЗАСТОСуВАННЯМ НЕЧІТКОГО ЗГЛАДЖуВАННЯ НА БАЗІ f-ПЕрЕТВОрЕННЯ<br />
У результаті дістаємо попередню оцінку тренду<br />
( 1 )<br />
U i і відхилення емпіричного ряду від вирівняного<br />
l ’ ( 1 )<br />
( 1 )<br />
i = li = xi -U i , або l’ij = xij -U ij , (i=1,m ; j=1,T 0 ).<br />
2. Для кожного року i обчислюється σi – середнє<br />
квадратичне відхилення:<br />
σ i<br />
=<br />
T0<br />
'2<br />
∑lij<br />
j = 1<br />
⎛<br />
⎜<br />
⎝<br />
−<br />
T<br />
T<br />
0<br />
T0<br />
'<br />
∑lij<br />
j = 1<br />
−1<br />
0<br />
⎞<br />
⎟<br />
⎠<br />
2<br />
, (6)<br />
на яке діляться окремі місячні (квартальні) відхилення<br />
відповідного року:<br />
'<br />
lij<br />
l ij = . (7)<br />
σ<br />
3. З нормованих таким чином відхилень обчислюється<br />
в першому наближенні середня сезонна<br />
хвиля:<br />
V<br />
m<br />
i<br />
( 1) 1<br />
j = =<br />
∑ l ij<br />
i<br />
m<br />
. (8)<br />
4. Середня сезонна хвиля множиться на середнє<br />
квадратичне відхилення кожного року і віднімається<br />
від рівнів початкового емпіричного ряду:<br />
( 1) x = x −V⋅σ . (9)<br />
ij ij j i<br />
Утворений таким чином ряд позбавлений сезонної<br />
хвилі, одержаної у першому наближенні.<br />
5. Цей ряд знову піддається нечіткому згладжуванню<br />
на основі f-перетворення (для місячних<br />
даних по п’яти або семи точках у залежності від<br />
інтенсивності дрібних коливань і тривалості більш<br />
значних). В результаті одержується нова оцінка<br />
( 2 )<br />
тренду U i .<br />
6. Відхилення початкового емпіричного ряду<br />
( 2 )<br />
{xi } від ряду {U i }, одержаного в п. 5,<br />
( 2)<br />
i<br />
( 2)<br />
U i<br />
l = yi<br />
(10)<br />
знову піддаються аналогічному опрацюванню згідно<br />
з пунктами 2 і 3 для виявлення наступного наближення<br />
середньої сезонної хвилі.<br />
Висновки<br />
В роботі проведено аналіз підходів, які присвячені<br />
аналізу та прогнозуванню злочинності та застосуванню<br />
систем і засобів штучного інтелекту до<br />
задач кримінології.<br />
В роботі отримав подальшого розвитку метод<br />
виявлення сезонної складової. На основі розглянутої<br />
методики запропоновано модифікацію підходу<br />
до виявлення тренду, а саме використання методу<br />
згладжування на базі нечіткого перетворення<br />
(f-перетворення), що дозволяє зменшити вплив<br />
аномальних рівнів.<br />
Розроблений метод в подальшому може використовуватися<br />
для оцінювання сезонності соціальних<br />
явищ.<br />
Застосування саме нечіткої моделі для згладжування<br />
ряду дозволяє зменшити вплив аномальних<br />
рівнів, пов’язаних з короткостроковим впливом<br />
невідомого фактору.<br />
Список литературы: 1. Яковлев, С.В. Анализ и прогнозирование<br />
показателей наркологической статистики в<br />
Украине и в Харьковской области [текст] / С.В. Яковлев,<br />
Ю.В. Гнусов // Молодёжь и наркотики (социология<br />
наркотизма). – Харьков: Торсинг, 2000. – С.194–221.<br />
2. Ерохин, А.Л. Использование нейросетевых методов для<br />
прогнозирования временных рядов [текст] / А.Л.Ерохин,<br />
Ю.В. Гнусов // Искусственный <strong>интеллект</strong>. – 2002. – <strong>№</strong>4.<br />
– С.686-691. 3. Specht, D. A General Regression Neural<br />
Network. IEEE Trans. on Neural Networks, Nov. 1991, <strong>№</strong>2/6,<br />
P.568-576. 4. Burrascano, P. Learning Vector Quantization<br />
for the Probabilistic Neural Network. IEEE Trans. on Neural<br />
Networks, July 1991, 2, P.458-461. 5. Caudill, M. The Kohonen<br />
Model. Neural Network Primer. AI Expert, 1990. – P.25-31.<br />
6. Hong D.H. fuzzy linear regression analysis for fuzzy inputoutput<br />
data using shape preventing operations, fuzzy Sets and<br />
Systs., vol. 27, pp. 275-289, 1988. 7. Zade L.A. fuzzy sets //<br />
Information and Control, 1965. – P.338-353. 8. Takagi T.,<br />
Sugeno M. fuzzy identificationof systems and it’s application<br />
to modeling and control // IEEE Trans. SMC, 1985. – P.116-<br />
132. 9. Widrow, В., Hoff M. E. “Adaptive switching circuits,”<br />
1960IRE WESCON Convention Record, New York IRE,<br />
pp. 96-104, 1960. 10. Widrow, В., Sterns S.D. Adaptive Signal<br />
Processing, New York: Prentice-Hall, 1985. 11. Perfilieva, I.,<br />
Novak,V., Pavliska,V., Dvorak,A. and Stepnicka, M. “Analysis<br />
and Prediction of Time Series Using fuzzy Transform”, Proc.<br />
IEEE World Congresson Computational Intelligence, Hong<br />
Kong, 2008, pp.3875–3879. 12. Perfilieva, I., Valasek, R. “fuzzy<br />
Transforms in Removing Noise” in: Computational Intelligence,<br />
Theory and Applications (Advancesin Soft Computing), Edited<br />
by B. Reusch, Berlin: Springer, pp.221–230, 2005. 13. Зацеркляний,<br />
М.М. Автоматизація аналізу сезоних коливань<br />
рівня злочинності [текст] / М.М. Зацеркляний, А.С. Бабій<br />
// Право і безпека. – 2005, <strong>№</strong>4’3. 14. Романов, А.А. Преобразования<br />
для прогноза компоненты векторного тренда<br />
и числового представления временного ряда [текст] //<br />
Известия Самарского научного центра Российской академии<br />
наук. T.12, <strong>№</strong>4(2), 2010. – C. 492-497.<br />
надійшла до редколегії 14.06.<strong>2011</strong><br />
УДК 004.89<br />
Разработка метода выявления сезонных колебания с применение<br />
нечеткого сглаживания на базе F-преобразования<br />
/ Н.М. Зацеркляный, А.Л. Ерохин, А.С. Бабий, А.П. Турута<br />
// Бионика <strong>интеллект</strong>а: научн.-техн. журнал. – <strong>2011</strong>.<br />
– <strong>№</strong> 3 (<strong>77</strong>). – С. 90-93.<br />
В статье на основе методики выявления сезонной<br />
составляющей предложена модификация подхода<br />
к выявлению тренда, а именно использование метода<br />
сглаживания на базе нечеткого преобразования<br />
(f-преобразование).<br />
Библиогр.: 14 назв.<br />
UDC 004.89<br />
Developing a method to identify seasonal variations using<br />
fuzzy transform / M.M. Zacerklyaniy A.L.Yerokhin, A.S. Babiy,<br />
О.P.Turuta // Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>.<br />
– <strong>№</strong> 3 (<strong>77</strong>). – P. 90-93.<br />
The paper-based methodology for the identification of<br />
the seasonal component proposed modification approach to<br />
identify a trend, namely to use a smoothing technique based<br />
on fuzzy transformation (f-transformation)<br />
Ref.: 14 items.<br />
93
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 94–97 хНурэ<br />
УДК: 004.032.26:519.174.2<br />
94<br />
Введение<br />
При решении задачи многомерной визуализации<br />
данных с помощью двумерных самоорганизующихся<br />
карт Кохонена, представленных в виде<br />
триангуляции Делоне, возникает проблема отображения<br />
данных на грани или в вершины треугольников<br />
карты. В результате будет искажена структура<br />
данных, а часть данных может стать неразличимыми<br />
на карте [1], что приводит к снижению точности<br />
визуализации данных. Проблема вызвана кусочноплоской<br />
структурой карты. В работах [2-4] предлагается<br />
аппроксимировать карту параметрической<br />
кубической сплайн-поверхностью и отображать<br />
данные на кусочно-гладкие карты Кохонена. Однако<br />
аппроксимация карт Кохонена, представленных<br />
в виде триангуляции, требует больших вычислительных<br />
затрат.<br />
1. Постановка задачи<br />
Пусть после обучения карты Кохонена в n -мерном<br />
евклидовом пространстве множество выходных<br />
нейронов W W W N<br />
1<br />
= { ,..., } имеет координаты<br />
l l l<br />
W w wn<br />
T<br />
= ( 1 ,..., ) , l = 1, N , N – количество выходных<br />
нейронов. На множестве W задана триангуляция<br />
Делоне T T T M<br />
1 k k k k<br />
= { ,..., } , где T = { T1 , T2 , T3}<br />
,<br />
k<br />
k = 1, M , M – количество треугольников, Tp –<br />
k<br />
номер нейрона в множестве W , Tp∈{ 1, N}<br />
, p = 13 ,<br />
(рис. 1) [5].<br />
Рис. 1. Плоское изображение карты Кохонена<br />
в виде триангуляции Делоне<br />
А.В. Шкловец, Н.Г. Аксак<br />
Харьковский национальный университет радиоэлектроники, г. Харьков, Украина<br />
ПОСТРОЕНИЕ ЧЕТЫРЁХУГОЛЬНЫХ КАРТ КОХОНЕНА<br />
НА ОСНОВЕ ТРИАНГУЛЯЦИИ ДЕЛОНЕ<br />
ДЛЯ ВИЗУАЛИЗАЦИИ МНОГОМЕРНЫХ ДАННЫХ<br />
Для уменьшения вычислительных затрат и упрощения алгоритма аппроксимации треугольных карт<br />
Кохонена кубической параметрической сплайн-поверхностью в работе предложен метод построения<br />
четырехугольных карт Кохонена. Аппроксимация карт Кохонена сплайн-поверхностью производится<br />
для увеличения точности визуализации многомерных данных.<br />
ТРИАНГУЛЯЦИЯ ДЕЛОНЕ, КАРТЫ КОХОНЕНА, ПАРАМЕТРИЧЕСКАЯ СПЛАЙН-ПО-<br />
ВЕРХНОСТЬ, ОСТОВНОЙ ЛЕС<br />
В работе [4] предлагается метод построения параметрической<br />
сплайн-поверхности на кусочноплоской<br />
карте Кохонена. Идея построения заключается<br />
в сопоставлении каждому треугольнику T k<br />
k<br />
произвольной кубической поверхности S ( t1, t2),<br />
ограниченной треугольником с вершинами в точках<br />
{ ( 00 , ) , ( 10 , ) , ( 01 , ) }. Сплайн-поверхность будет<br />
построена, если все параметры поверхностей<br />
k<br />
S ( t1, t2)<br />
k = 1, M будут определены. Для этого формируется<br />
система линейных алгебраических уравнений<br />
относительно параметров параметрической<br />
сплайн-поверхности, представляющая собой:<br />
1) условие прохождения параметрической<br />
сплайн-поверхности в точках { ( 00 , ) , ( 10 , ) , ( 01 , ) } через<br />
точки вершины треугольника T k ;<br />
2) условия гладкого соприкосновения повер-<br />
k1 k2 хностей S ( t1, t2)<br />
и S ( t1, t2),<br />
если соответствующие<br />
им треугольники имеют общую сторону.<br />
Если неэквивалентных уравнений системы больше,<br />
чем переменных, то часть уравнений удаляется,<br />
что ведет к снижению гладкости сплайн-поверхности.<br />
Иначе выбирается некоторое количество<br />
переменных системы, через которые выражаются<br />
оставшиеся, а первоначально выбранные определяются<br />
из дополнительного условия оптимальности<br />
(например, условия минимального отклонения<br />
сплайн поверхности от кусочно-плоской карты).<br />
Одной из проблем построения сплайнповерхностей<br />
на триангуляции является формирование<br />
условия гладкого соприкосновения двух поверхностей<br />
по стороне { ( 10 , ) , ( 01 , ) }. Чтобы описать<br />
данный случай, требуется составить большое количество<br />
уравнений, включающих в себя огромное<br />
количество переменных.<br />
2. Метод построения четырехугольных карт<br />
Кохонена<br />
Для устранения этой проблемы предлагается в<br />
триангуляции попарно объединить треугольники в<br />
четырёхугольники.<br />
Необходимым условием для существования четырёхугольных<br />
карт является чётное количество<br />
треугольников в триангуляции.
ПОСТрОЕНИЕ ЧЕТЫрЁхуГОЛЬНЫх КАрТ КОхОНЕНА НА ОСНОВЕ ТрИАНГуЛЯЦИИ ДЕЛОНЕ ДЛЯ ВИЗуАЛИЗАЦИИ ...<br />
Поставим в соответствие триангуляции T неориентированный<br />
граф G = ( T , U ) , где T T T M<br />
1<br />
= ( ,..., )<br />
– множество вершин и U u u N 1 u = ( ,..., ) – множество<br />
ребер графа, Nu – общее количество ребер (рис. 2.)<br />
по следующим правилам:<br />
k<br />
1) каждому треугольнику T ∈ T соответствует<br />
вершина k<br />
T ∈ G , k = 1, M ;<br />
p q<br />
2) если два треугольника T ∈ T и T ∈ T имеют<br />
общую сторону, то вершины p<br />
T ∈ G и Tq ∈ G<br />
i p q<br />
объединены ребром u = ( T , T<br />
) .<br />
Граф G обладает следующими свойствами:<br />
1) из каждой вершины графа G выходит не более<br />
трёх ребер, так как треугольник имеет не более<br />
трёх сторон, имеющих общую сторону с другими<br />
треугольниками;<br />
2) всегда существуют вершины, имеющие менее<br />
трёх смежных ребер. Этим вершинам соответствуют<br />
треугольники, образующие границу триангуляции.<br />
Задача построения четырехугольной карты эквивалента<br />
задаче построения остового леса OlO ∈<br />
графа G , где O – множество всех остовных лесов,<br />
i ∈ N . В остовном лесе все вершины попарно соединены,<br />
при этом из каждой вершины выходит<br />
одно и только одно ребро. Построение всех остовных<br />
лесов O схоже с построением всех остовых деревьев<br />
графа G [6].<br />
Построение всех остовых лесов O заключается<br />
в построении графа D , вершинами которого явля-<br />
i i i<br />
ются ребра { u u ∈Gu , ∈Ol}<br />
из графа G , принадлежащие<br />
остовому лесу Ol . Процедура построения<br />
позволяет найти все остовые леса Ol графа G ,<br />
образованные объединением ребер в вершинах<br />
ветвей графа D . На рис. 3 приведен пример построения<br />
графа D для графа G (рис. 2б), а на рис.<br />
4 представлен процесс построения остовного леса<br />
на каждой итерации.<br />
Процедура построения остовных лесов O .<br />
1) Установим вершину графа D с пустым множеством<br />
ребер графа G .<br />
2) Найдем среди всех вершин графа G такие<br />
вершины h<br />
T ∈ G , из которых выходит одно и толь-<br />
h<br />
ко одно ребро u ∈ U . Эти ребра принадлежат ос-<br />
h<br />
товному лесу ( u ∈ Ol)<br />
и помещаются в вершину<br />
графа D .<br />
3) Если таких вершин в графе G нет, выбираем<br />
любую вершину i<br />
T ∈ G , имеющую два смежных<br />
i j<br />
ребра u , u ∈ U (по свойству 2 графа G такая вершина<br />
существует) и рассмотрим два случая при-<br />
i<br />
j<br />
надлежности остовому лесу ребер u ∈ Olи<br />
u ∈ Ol.<br />
При этом имеем раздвоение графа D на две ветви.<br />
В каждую новую вершину графа D помещаем рассматриваемое<br />
ребро.<br />
4) Удаляем из графа G<br />
а) ребра, принадлежащие остовому лесу,<br />
б) вершины, в которые входят удаленные ребра,<br />
в) все ребра, которые выходят из удаленных<br />
вершин.<br />
5) Если в графе G не осталось ни одной вершины,<br />
то остовые леса O построены.<br />
6) Если в подмножестве вершин графа G , из<br />
которых исходят удаленные ребра на шаге 4в, образовались<br />
изолированные вершины (вершины,<br />
из которых не исходит ни одно ребро), то остовой<br />
лес при данном выборе вершин в шагах 3 или 7 не<br />
существует, и данную ветвь в графе D далее не<br />
следует рассматривать. Если эта ветвь была единственная,<br />
то остовой лес Ol для данного графа G не<br />
существует.<br />
7) Среди вершин графа G , из которых исходят<br />
удаленные ребра на шаге 4в, найдем такие h вершин<br />
h<br />
T ∈ G , из которых исходит одно и только<br />
h<br />
одно ребро u ∈ U . Эти ребра принадлежат остов-<br />
h<br />
ному лесу ( u ∈ Ol).<br />
Если таких вершин в графе G<br />
нет, то в подмножестве вершин графа G , из которых<br />
исходят удаленные ребра на шаге 4в, выбираем<br />
любую вершину i<br />
T ∈ G , из которой исходят два ре-<br />
i j<br />
бра u , u ∈ U . Рассмотрим два случая принадлеж-<br />
i<br />
j<br />
ности ребер u ∈ Olи<br />
u ∈ Olостовному<br />
лесу. Достроим<br />
граф D аналогично шагам 2 и 3.<br />
8) Переход к шагу 4.<br />
Граф D состоит из нескольких ветвей, каждая из<br />
которых представляет собой остовной лес O графа<br />
G . Каждый остовной лес получается путем объеди-<br />
а б<br />
Рис. 2. а – триангуляция Делоне T , б – граф G<br />
95
А.В. Шкловец, Н.Г. Аксак<br />
96<br />
Рис. 3. Построенный граф D для графа G<br />
Остовые леса графа G<br />
<strong>№</strong> Остовые леса О графа G <strong>№</strong> Остовые леса О графа G<br />
O1 u , u , u , u , u , u , u , u , u , u , u , u<br />
Таблица 1<br />
{ 30 27 26 20 7 2 12 4 6 19 14 23}<br />
O5 30 27 26 20 11 1 8 4 6 15 18 24<br />
{ u , u , u , u , u , u , u , u , u , u , u , u }<br />
{ 30<br />
,<br />
27<br />
,<br />
26<br />
,<br />
20<br />
,<br />
7<br />
,<br />
2<br />
,<br />
12<br />
,<br />
4<br />
,<br />
6<br />
,<br />
15<br />
,<br />
18<br />
,<br />
24}<br />
O6 30 27 17 25 16 1 3 13 23 19 9 6<br />
{ u , u , u , u , u , u , u , u , u , u , u , u }<br />
{ 30<br />
,<br />
27<br />
,<br />
26<br />
,<br />
20<br />
,<br />
11<br />
,<br />
1<br />
,<br />
3<br />
,<br />
13<br />
,<br />
23<br />
,<br />
19<br />
,<br />
9<br />
,<br />
6}<br />
O7 30 27 17 25 16 1 8 4 6 19 14 23<br />
{ u , u , u , u , u , u , u , u , u , u , u , u }<br />
{ 30<br />
,<br />
27<br />
,<br />
26<br />
,<br />
20<br />
,<br />
11<br />
,<br />
1<br />
,<br />
8<br />
,<br />
4<br />
,<br />
6<br />
,<br />
19<br />
,<br />
14<br />
,<br />
23}<br />
O8 30 27 17 25 16 1 8 4 6 15 18 25<br />
{ u , u , u , u , u , u , u , u , u , u , u , u }<br />
O 2 u u u u u u u u u u u u<br />
O 3 u u u u u u u u u u u u<br />
O 4 u u u u u u u u u u u u<br />
нения всех ребер одной ветви, записанных в вершинах<br />
графа D . Согласно рис. 5 для графа G , приведенного<br />
на рис. 4а, существует 8 остовных лесов.<br />
На рис. 4 приведена последовательность итераций<br />
алгоритма построения остового леса O1 графа<br />
G . На рисунке приняты следующие обозначения:<br />
i<br />
жирной линией (—— ) показаны ребра u ∈ U ,<br />
i<br />
принадлежащие остовному лесу u ∈O1 , выбранные<br />
на шагах 2, 3 и 7 и удаленные из графа G на<br />
шаге 4а; штрихованной линией (-----) показаны<br />
ребра, удаленные из графа G на шаге 4в; большой<br />
заштрихованной окружностью ( ) показаны вершины,<br />
которые рассматриваются на шагах 6 и 7.<br />
На основе полученного остового леса O1 можно<br />
построить четырехугольную карту Кохонена<br />
M<br />
Q = Q Q<br />
⎛ ⎞<br />
1<br />
⎜ ,..., 2<br />
⎟ на основе триангуляции T . Это<br />
⎝<br />
⎠<br />
достигается путем удаления общих сторон треугольников<br />
из триангуляции T , которым соответствуют<br />
ребра графа G , образующие остовой лес<br />
O1 . Четырёхугольник Q i , i<br />
M<br />
= 1, 2<br />
определяется<br />
i<br />
четырьмя точками с номерами Q<br />
i i i i<br />
Q , Q , Q , Q ,<br />
= { 1 2 3 4}<br />
причем номера обозначены так, что попарно сое-<br />
i i i i i i<br />
i i<br />
динены точки { Q1, Q2},<br />
{ Q1, Q3},<br />
{ Q2, Q4}<br />
и { Q3, Q4}.<br />
На рис. 5 показан пример построения четырехугольной<br />
карты для триангуляции T , приведенной<br />
на рис. 2а.<br />
Замечания:<br />
1) Если найдена ветвь графа D , которой соответствует<br />
остовой лес O1 графа G , то другие ветви<br />
можно не рассматривать. Вычислительная сложность<br />
предложенного метода линейно зависит от<br />
количества треугольников триангуляции T .<br />
2) Если во всех ветвях графа D возникают изолированные<br />
вершины графа G , то алгоритм можно<br />
продолжить, и построить остовое дерево с изолированными<br />
вершинами. В результате, после построения<br />
четырехугольной карты в ней останутся<br />
треугольники, соответствующие изолированным<br />
вершинам графа G .<br />
Выводы<br />
В работе предложена процедура построения<br />
четырёхугольных карт Кохонена на основе их<br />
треугольного аналога, которая позволяет уменьшить<br />
вычислительную сложность аппроксима-
ПОСТрОЕНИЕ ЧЕТЫрЁхуГОЛЬНЫх КАрТ КОхОНЕНА НА ОСНОВЕ ТрИАНГуЛЯЦИИ ДЕЛОНЕ ДЛЯ ВИЗуАЛИЗАЦИИ ...<br />
Рис. 4. Построение остового леса O 1 графа G , приведенного на рис. 2б<br />
Рис. 5. Построение четырехугольной карты Кохонена по триангуляции<br />
ции кусочно-плоской карты Кохонена кубической<br />
параметрической сплайн-поверхностью.<br />
Приведены необходимые условия существования<br />
четырёхугольных карт Кохонена. Построение таких<br />
карт ведет к существенному упрощению алгоритма<br />
аппроксимации параметрической сплайнповерхностью<br />
и уменьшает количество скалярных<br />
операций. Показано, что предложенный метод<br />
имеет линейную вычислительную сложность. Планируется<br />
разработать метод аппроксимации сплайн<br />
поверхностями четырёхугольных карт Кохонена.<br />
Список литературы: 1. Зиновьев, А.Ю. Визуализация многомерных<br />
данных [Текст] / А. Ю. Зиновьев. – Красноярск:<br />
Изд-во КГТУ, 2000. – 168 с. 2. Аксак, Н.Г. Метод аппроксимации<br />
карт Кохонена кубическим параметрическим<br />
сплайном [Текст] / Н. Г. Аксак, А. В. Шкловец // Системи<br />
управління навігації та зв‘язку. – 2010. – 2(14). – С.70-74.<br />
3. Метод аппроксимации сплайнами минимальной длины<br />
линейных карт Кохонена для визуализации многомерных<br />
данных [Текст] : сб. науч. тр. / НИЯУ МИФИ. М.: НИЯУ<br />
МИФИ, 2010. - 280 с. 4. Аппроксимация двумерных карт<br />
Кохонена кубическими сплайн поверхностями [Текст] //<br />
сб. науч. тр. – Евпатория: МОІНУ, 2010. – 225 с. 5. Скворцов,<br />
А. В. Триангуляция Делоне и её применение [Текст] /<br />
А. В. Скворцов. – Томск: изд-во Том. Ун-та, 2002. – 128 с.<br />
6. Кристофидес, Н. Теория графов. Алгоритмический подход<br />
[Текст] / Н. Кристофидис. – М: Мир, 1978. – 432 с.<br />
Поступила в редколлегию 30.06.<strong>2011</strong><br />
УДК 004.032.26:519.174.2<br />
Побудова чотирикутних карт Кохонена на основі<br />
тріангуляції Делоне для візуалізації багатовимірних даних<br />
/ А. В. Шкловець, Н. Г. Аксак // Біоніка інтелекту: наук.техн.<br />
журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 94-97.<br />
Запропоновано метод побудови чотирикутних карт<br />
Кохонена для зменшення кількості скалярних операцій<br />
апроксимації кусочно-плоских карт Кохонена кубічними<br />
параметричними сплайн-поверхнями для збільшення<br />
точності візуалізації багатовимірних даних.<br />
Табл 1. Іл. 5. Бібліогр.: 6. найм.<br />
UDK 004.032.26:519.174.2<br />
Building a rectangular Kohonen maps based on Delone triangulation<br />
to visualize multidimensional data / А.V. Shklovets,<br />
N. G. Axak // Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>. –<br />
<strong>№</strong> 3 (<strong>77</strong>). – P. 94-97.<br />
A method for construction rectangular Kohonen maps<br />
to reduce the number of scalar operations of approximation<br />
planar Kohonen maps by cubic parametric spline surfaces to<br />
increase the accuracy of multidimensional data visualization<br />
was suggested.<br />
Tab.: 1. fig.: 5. Ref.: 6 items.<br />
97
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 98–101 хНурэ<br />
УДК 616.07:004.032.26<br />
98<br />
Вступ<br />
Задача розпізнавання медичної відеоінформації<br />
суттєво ускладнюється із збільшенням потужності<br />
класів розпізнавання. Одним із перспективних<br />
шляхів вирішення цієї проблеми є побудова ієрархічної<br />
структури алгоритмів навчання та екзамену<br />
системи розпізнавання [1,2]. Більшість відомих методів<br />
розпізнавання зображень носять в основному<br />
модельний характер, оскільки вони не орієнтовані<br />
на апріорно нечітке розбиття простору ознак на<br />
класи , яке має місце на практиці. Одним із перспективних<br />
підходів до підвищення функціональної<br />
ефективності систем розпізнавання зображень<br />
є інформаційно-екстремальна інтелектуальна технологія<br />
(ІЕІ-технологія), що ґрунтується на максимізації<br />
інформаційної спроможності системи,<br />
що навчається [3, 4]. У працях [5, 6] розглядалося<br />
питання стиснення відеоінформації у рамках ІЕІтехнології<br />
для однорівневої структури алгоритму<br />
навчання, але побудовані вирішальні правила не<br />
були безпомилковими за навчальною матрицею.<br />
У статті розглядається задача підвищення функціональної<br />
ефективності навчання системи розпізнавання<br />
магнітокардіограм за ієрархічним алгоритмом<br />
шляхом оптимизации кроку зміни кута<br />
зчитування яскравості при обробленні зображень в<br />
полярній системі координат.<br />
1. Постановка задачі<br />
Нехай зображення магнітокардіограм різних<br />
станів серцево-судинної системи утворють ієрархічну<br />
структуру алфавіту класів розпізнавання<br />
{ Xr, s, m | r = 1, R; s = 1, Sr; m= 1 , M r, s}<br />
. Відомий структурований<br />
вектор параметрів функціонування системи<br />
розпізнавання g =< xr, s, m, dr,<br />
sm , , δr, s, φ r, s><br />
, де<br />
o<br />
xr, s, m – еталонний вектор-реалізація класу X r, s, m ;<br />
o<br />
dm – радіус контейнера класу X r, s, m , що відновлюється<br />
в радіальному базисі простору ознак розпізнавання;<br />
δr, s – параметр поля контрольних допусків<br />
на ознаки розпізнавання для алфавіту класів sr -ї<br />
страти, φ r, s – крок зміни кута зчитування яскравості<br />
зображення при його обробленні в полярних<br />
координатах для алфавіту класів sr -ї страти. При<br />
С.С. Мартиненко 1 , Саад Джулгам 2<br />
1 СумДУ, м. Суми, Україна, smart@unesco.sumdu.edu.ua<br />
2 СумДУ, м. Суми, Україна, saad710@mail.ru<br />
СТИСНЕННЯ ТА РОЗПІЗНАВАННЯ МЕДИЧНОЇ<br />
ВІДЕОІНФОРМАЦІЇ<br />
Розглядається ієрархічний алгоритм оптимізації параметрів навчання системи розпізнавання зображень<br />
медичних і біологічних об’єктів у рамках інформаційно-екстремальної інтелектуальної технології,<br />
що ґрунтується на максимізації кількості інформації, одержаної в процесі навчання системи.<br />
МАГНІТОКАРДІОГРАМА, РОЗПІЗНАВАННЯ ЗОБРАЖЕНЬ, ІЄРАРХІЧНА СТРУКТУРА, ПО-<br />
ЛЯРНА СИСТЕМА КООРДИНАТ, ІНФОРМАЦІЙНИЙ КРИТЕРІЙ<br />
цьому задано обмеження на відповідні параметри<br />
функціонування.<br />
Необхідно на етапі навчання побудувати оптимальні<br />
вирішальні правила, які забезпечать максимум<br />
усередненого критерію функціональної<br />
ефективності (КФЕ) E r навчання системи розпізнавати<br />
класи r -го ярусу ієрархічної структури<br />
де S M<br />
r r s<br />
1<br />
E r =<br />
M S<br />
S M<br />
r rs ,<br />
∑<br />
∑<br />
r, s r s = 1 m=<br />
1<br />
E<br />
*<br />
r, s, m<br />
, (1)<br />
, , – кількість страт і кількість класів в sr -й<br />
*<br />
страті r -го ярусу відповідно; Er, s, m<br />
– глобальний<br />
максимум інформаційного КФЕ навчання системи<br />
розпізнавати класи s r -ї страти.<br />
На етапі екзамену необхідно віднести реалізацію,<br />
що розпізнається, до відповідного класу розпізнавання<br />
із заданого алфавіту.<br />
2. Категорійна модель системи розпізнавання<br />
Математичну модель процесу навчання у вигляді<br />
діаграми відображень множин показано на<br />
рис. 1, де наведено такі позначення: G – множина<br />
факторів, що впливають на систему; T – множина<br />
моментів часу зняття інформації; Ω – простір<br />
ознак розпізнавання; Z – простір можливих<br />
функціональних станів системи; Θ – вхідні реалізації<br />
образу; Y – вхідна вибіркова множина<br />
(вхідна навчальна матриця яскравості зображень);<br />
Φ1 :G × T × Ω× Z → Θ – оператор формування<br />
вхідних реалізацій образів; Φ2 : Θ→Y<br />
– оператор<br />
формування вибіркової множини Y . Оператор<br />
| M |<br />
θ : Y →ℜ будує розбиття | |<br />
ℜ M простору ознак<br />
на класи розпізнавання, яке у загальному випадку<br />
| | ||<br />
є нечітким, а оператор класифікації Ψ : ℜ<br />
M l<br />
→I<br />
перевіряє основну статистичну гіпотезу про на-<br />
( j ) o<br />
лежність реалізацій { xm |j=1,n } класу X m і формує<br />
множину гіпотез I l || , де l – кількість статистичних<br />
гіпотез.<br />
Оператор γ: I| l | →ℑ | q | шляхом оцінки статистичних<br />
гіпотез формує множину точнісних ха-<br />
| |<br />
рактеристик ℑ q , де q = l<br />
2 – кількість точнісних<br />
характеристик. Оператор φ : ℑ q →E обчислює множину<br />
значень інформаційного критерію E , який
Як відомо, оброблення діагностичних медичних<br />
зображень в полярних координатах дозволяє забезпечити<br />
алгоритму навчання інваріантність до їх<br />
зсуву, повороту та зміні масштабу. Інформаційноекстремальний<br />
іерархічний алгоритм навчання<br />
системи розпізнавання з оптимізацією кроку зміни<br />
кута зчитування при обробленні зображень в<br />
полярних координатах подамо у вигляді багатоциклічної<br />
ітераційної процедури пошуку глобального<br />
максимуму інформаційного КФЕ (1), що обчислюється<br />
в робочій (допустимій) області визначення<br />
його функції<br />
∆φ<br />
де Gφ Gδ GE *<br />
r, s<br />
= arg< max{max{max E }} > , (2)<br />
Gφ Gδ GE<br />
, , – допустимі області значень кроку зміни<br />
кута зчитування ∆φr, s,<br />
параметра поля контрольних<br />
допусків δr, s і КФЕ відповідно.<br />
Для наочності обмежимося оптимізацією параметрів<br />
навчання системи розпізнавання для одного<br />
ярусу ієрархічної структури алфавіту класів. Вхідними<br />
даними є діагностичні медичні зображення,<br />
що характеризують класи r -го ярусу; система нормованих<br />
полів допусків { δH , i| i = 1 , N}<br />
на ознаки<br />
розпізнавання, що визначає області значень відповідних<br />
контрольних допусків, та розподіл класів<br />
r<br />
СТИСНЕННЯ ТА рОЗПІЗНАВАННЯ МЕДИЧНОЇ ВІДЕОІНФОрМАЦІЇ<br />
є функціоналом точнісних характеристик. Контур<br />
діаграми, який послідовно складається з операторів<br />
Ψ, γφ , і r оптимізує геометричні параметри<br />
розбиття | |<br />
ℜ M Рис. 1. Математична модель навчання системи розпізнавання<br />
розпізнавання по стратам ярусу згідно із заданою<br />
ієрархічною структурою алфавіту класів розпізнавання.<br />
При цьому в кожній страті визначається<br />
шляхом пошуку глобального макси- базовий клас, відносно якого формується система<br />
муму критерію E в робочій (допустимій) області контрольних допусків на ознаки розпізнавання.<br />
визначення його функції. Оптимізація системи Оброблення зображень в полярній системі<br />
контрольних допусків здійснюється за ітераційною координат та формування навчальної матриці<br />
( j )<br />
процедурою, в якій послідовно задіяно оператори || yr, s, mi , | m= 1, Mr, s;<br />
i = 1, N; j = 1 , n || , в якій i -а озна-<br />
θψγ , , , φ, δ1<br />
і δ2 . Контур оптимізації кроку зміни ка в j -му векторі-реалізації образу обчислюється<br />
кута зчитування яскравості зображень замикаєть- шляхом усереднення значень яскравості відповідся<br />
операторами p1 : Е → П, де П – терм-множина них RGB -складових зображення за формулою [5]<br />
кроків зміни кута зчитування, і p2 : П →Θ, який<br />
L<br />
( j ) 1 ( j )<br />
змінює вхідні реалізації образу. Оптимізація ієрар-<br />
Θi = ∑θ<br />
li , , i = 1,<br />
N , (3)<br />
2πRi<br />
l = 1<br />
хічної структури відбувається за допомогою опера-<br />
( j )<br />
торів h1 : E → H , де H – множина, яка складаєть- де Θi –значення ознаки розпізнавання в j -й<br />
() l<br />
ся з можливих варіантів ієрархічних структур, та реалізації образу; θ – значення RGB -складової в<br />
li ,<br />
h2 : H → Z . Оператор U: E → G × T × Ω × Z регла- l -му пікселі i -го кола зчитування яскравості зобраментує<br />
процес навчання системи.<br />
ження; L – кількість пікселів в i -му колізчитування;<br />
Ri – радіус i -го кола зчитування.<br />
3. Алгоритм навчання системи розпізнавання<br />
Розглянемо основні етапи реалізації<br />
інформаційно-екстремального іерархічного алгоритму<br />
навчання системи розпізнавання з оптимізацією<br />
кроку зміни кута зчитування при обробленні<br />
в полярних координатах діагностичних медичних<br />
зображень.<br />
1. Обнуління лічильника кількості страт в r -му<br />
ярусі: s : = 0;<br />
2. s: = s+1;<br />
3. Обнуління лічильника зміни кроку зчитуван-<br />
ня: ∆r, s:=<br />
0;<br />
4. ∆r, s:= ∆r,<br />
s+1;<br />
5. Обнуління лічильника кроків зміни параметра<br />
поля контрольних допусків δr, s:<br />
δ := 0 ;<br />
6. δ:= δ+1;<br />
7. На кожному кроці зміни значення параметра<br />
поля допусків обчислюються нижній AKH r, s,, i[<br />
δ ]<br />
і верхній AKB r, s, i[<br />
δ ] контрольні допуски для всіх<br />
ознак розпізнавання за формулами<br />
A [ δ] = y −δ<br />
[ k]<br />
;<br />
KH r, s, i r, s, 1 , i r, s<br />
AKB r, s, i[ δ] = yr,,, s 1 i + δr,<br />
s[]<br />
l , (4)<br />
де yr, s, 1 , i – вибіркове середнє значення i -ї ознаки<br />
в навчальній матриці базового (першого) класу<br />
o<br />
X r, s,<br />
1 .<br />
99
С.С. Мартиненко, Саад Джулгам<br />
8. Формується бінарна навчальна матриця<br />
( j )<br />
|| xr, s, mi , || за правилом<br />
( j )<br />
⎧<br />
( j ) ⎪1,<br />
if AKH r, s, i ≤ yr, smi , , ≤ AKB<br />
r, s, i ;<br />
xr,<br />
s, mi , = ⎨<br />
⎩⎪ 0,<br />
if else.<br />
o<br />
9. Для класу X r, s, m формується двійковий еталонний<br />
вектор-реалізація, i -й елемент якого визначається<br />
за правилом<br />
n ⎧<br />
( j )<br />
1,<br />
if ∑ xr,<br />
s, mi , > r, s;<br />
xr,<br />
s, mi , = ⎨ j = 1<br />
0,<br />
.<br />
1<br />
⎪<br />
ρ<br />
n<br />
⎪<br />
⎩ if else<br />
де ρr, s – рівень селекції (квантування) координат<br />
o<br />
еталонного вектора xr, s, m ∈ Xr,<br />
sm , , який за замовчуванням<br />
дорівнює ρr, s=<br />
05. ,<br />
10. Формується за критерієм мінімальної кодової<br />
відстані структуроване попарне розбиття<br />
| 2|<br />
{ ℜ r, s, m =< xr, sm , ; xr,<br />
s, c > } множини { xr, s, m } , яке задає<br />
план навчання. Тут xr, s, c – еталонний вектор-<br />
o<br />
реалізація класу X r, s, c,<br />
найближчого до класу X o<br />
r, s, m.<br />
11. Обчислюється значення інформаційного<br />
КФЕ навчання системи розпізнавати реалізації<br />
o<br />
класу X r, s, m . Як КФЕ може розглядатися будьяка<br />
статистична інформаційна міра. Наприклад,<br />
для двоальтернативних рішень та рівноймовірних<br />
гіпотез можна застосувати модифікацію інформаційної<br />
міри Кульбака [4]<br />
100<br />
E<br />
( k ) ⎛ D r s m + D<br />
⎜ ( k )<br />
⎝ αr, s, m + β<br />
( k )<br />
( k )<br />
r, s, m = 05 , log2<br />
1 , , 2 r, s, m<br />
( k )<br />
r, s, m<br />
( k )<br />
⎞<br />
⎟ ∗<br />
⎠<br />
( k )<br />
α = −<br />
( ) ( ) ( ) ( ) , , D<br />
k k k k r s m 1 1 r, s, m;<br />
(5)<br />
∗ {[ D1 + D2<br />
] − [ α + β ]} =<br />
=<br />
( k )<br />
( k )<br />
β = 1−D<br />
.<br />
r, s, m<br />
2 r, s, m<br />
( k ) ( k )<br />
⎛ 2 − [ αr, s, m + βr,<br />
s, m]<br />
⎞<br />
( k ) ( k )<br />
= 05 , log2<br />
⎜ ( k ) ( k ) ⎟ ∗{ 1−<br />
[ αr, s, m + βr,<br />
s, m]},<br />
⎝ α + β ⎠<br />
r, s, m<br />
r, s, m<br />
( k )<br />
де D1 r, s, m – перша достовірність прийняття рішень на<br />
( k )<br />
k -му кроці навчання; D2 r, s, m – друга достовірність;<br />
( k ) ( k )<br />
αr, s, m – помилка першого роду; βr<br />
, s, m – помилка<br />
другого роду.<br />
( k )<br />
12. Якщо δr, s≤<br />
δH/<br />
2 , то виконується пункт 6,<br />
інакше – пункт 13.<br />
13. У робочих областях визначення функції (5)<br />
здійснюється пошук її глобального максимального<br />
*<br />
значення Er, s,<br />
1 .<br />
14. Здійснюється за планом навчання оптимізація<br />
контейнерів інших класів, що відновлюються<br />
в радіальному просторі ознак розпізнавання.<br />
15. Обчислюється усереднене максимальне<br />
( k )<br />
значення E max r, sКФЕ<br />
навчання системи розпізнавати<br />
реалізації всіх класів при поточному значенні<br />
( k )<br />
параметра навчання ∆φr, s.<br />
( k )<br />
16. Якщо ∆φr, s≤<br />
∆φгран<br />
, то виконується пункт 4,<br />
інакше – пункт 17.<br />
17. Визначаються усереднене максимальне<br />
*<br />
значення E r, s КФЕ навчання системи розпізнавати<br />
реалізації всіх класів поточної страти і опти-<br />
мальні параметри навчання: еталонні вектори<br />
*<br />
реалізації { xr, s, m } , вершини яких визначають геометричні<br />
центри контейнерів відповідних класів;<br />
*<br />
радіуси контейнерів класів розпізнавання { dr, s, m } ;<br />
*<br />
параметр поля контрольних допусків δr, s;<br />
система<br />
контрольних допусків на ознаки розпізнавання, які<br />
*<br />
обчислюються за формулою (4) і параметр ∆r, s –<br />
крок зміни кута зчитування яскравості зображення<br />
при його обробленні в полярних координатах для<br />
алфавіту класів поточної страти.<br />
18. Якщо s ≤ Sr, то виконується пункт 2, інакше<br />
– ЗУПИН.<br />
Таким чином, у рамках ІЕІ-технології процес<br />
оптимізації параметрів функціонування системи<br />
розпізнавання зображень за ієрархічним алгоритмом<br />
зводиться до ітераційного пошуку глобального<br />
максимуму інформаційного критерію (1) в робочій<br />
області визначення його функції.<br />
4. Приклад реалізації алгоритму навчання<br />
Реалізацію алгоритму навчання розглянемо на<br />
прикладі розпізнавання магнітокардіограм. Алфавіт<br />
класів розпізнавання складався з чотирьох<br />
класів, яка характеризували такі стани серецевосудинної<br />
системи людини: X o<br />
1 – нормальний стан,<br />
X o<br />
o<br />
2 – ішемічна хвороба серця, X 3 – шуми в серці<br />
і X o<br />
4 – некоронарогенна хвороба серця. Оброблення<br />
зображень цих класів відбувалось у полярній<br />
системі координат за формулою (3)<br />
Навчання системи розпізнавання магнітокардіограм<br />
відбувалося за ієрархічним алгоритмом,<br />
структуру якого показано на рис. 2.<br />
Рис. 2. Ієрархічна структура алфавіту класів<br />
розпізнавання<br />
На рис. 2 верхні індекси в позначеннях класів<br />
визначають номер ярусу r та номер страти s відповідно.<br />
У роботі [6] для верхнього рівня ієрархічної<br />
структури (рис. 2) для аналогічного алфавіту класів<br />
розпізнавання вдалося побудувати безпомилкові<br />
за навчальною матрицею вирішальні правила, але<br />
для другого рівня ієрархічної структури усередне-<br />
*<br />
не значення КФЕ дорівнювало E 2 = 072 , . Тому для<br />
кожної страти цього рівня було реалізовано алгоритм<br />
навчання з оптимізацією кроку зміни кута<br />
зчитування яскравості зображень магнітокардіограм<br />
при їх обробленні в полярних координатах.<br />
Оптимізація кроку зміни кута зчитування яскравості<br />
при обробленні зображень магнітокардіо-
а б в г<br />
Рис. 3. Графіки залежності КФЕ від радіусів контейнерів: а – клас X o<br />
грам здійснювалася за трициклічною ітераційною<br />
процедурою пошуку глобального максимуму КФЕ<br />
навчання системи (2) для кожної страти нижнього<br />
ярусу структури. Реалізація вищенаведеного алгоритму<br />
дозволила підвищити функціональну ефективність<br />
навчання, а усереднене значення КФЕ<br />
*<br />
(1) збільшилося до величини E 2 = 078 , . При цьому<br />
оптимальне значення кроку зміни кута зчитування<br />
дорівнювало для кожної із страт значенням<br />
∆φ21 ∆φ22<br />
5<br />
* *<br />
, = , = . Таким чином, встановлено, що<br />
величина кроку зміни кута зчитування при формуванні<br />
навчальної матриці яскравості зображень<br />
впливає на функціональну ефективність навчання<br />
системи розпізнавання.<br />
На рис. 3 показано результати оптимізації радіусів<br />
контейнерів класів розпізнавання із заданого<br />
алфавіту для страти s21 , (рис. 3а і рис. 3б) і для<br />
страти s22 , (рис. 3в і рис. 3г). На рис. 3 подвійною<br />
штриховкою позначено робочі (допустимі) області<br />
визначення функції інформаційного критерію (4),<br />
в яких здійснювався пошук глобальних максимумів<br />
КФЕ навчання системи розпізнавання.<br />
Аналіз рис. 3 показує, що оптимальні радіуси<br />
контейнерів відповідних класів дорівнюють<br />
*<br />
*<br />
d211 ,, = 140 (тут і далі в кодових одиницях), d212 ,, = 142 ,<br />
*<br />
*<br />
d221 , , = 134 і d222 , , = 145.<br />
За результатами алгоритму екзамену, при якому<br />
послідовно розпізнавалися 100 реалізацій класів<br />
із заданого алфавіту, усереднене значення повної<br />
ймовірності правильного розпізнавання дорівнювало<br />
Pt = 087 , , що перевищує відомі результати [7].<br />
Висновки<br />
1. Використання ієрархічної структури навчання<br />
системи розпізнавання із оптимізацією параметра<br />
зміни кроку кута зчитування яскравості при обробленні<br />
зображень магнітокардіограм в полярній<br />
систем і координат дозволило підвищити достовірність<br />
розпізнавання.<br />
2. Для побудови безпомилкових вирішальних<br />
правил необхідно провести оптимізацію інших параметрів<br />
навчання.<br />
Список літератури: 1. Саати, Т. Принятие решений: Метод<br />
анализа иерархий [Текст] / Т. Саати – М.: Радио и связь,<br />
1993. – 273 с. 2. Прикладная статистика: Классификация<br />
СТИСНЕННЯ ТА рОЗПІЗНАВАННЯ МЕДИЧНОЇ ВІДЕОІНФОрМАЦІЇ<br />
211 ,,<br />
; б – клас X o<br />
212 ,,<br />
; в – клас X o<br />
o<br />
221 , , ; г – клас X 222 , ,<br />
и снижение размерности: Справ. изд./ под ред. С.А. Айвазян;<br />
[составители: С.А. Айвазян, В.М. Бухштабер, И.С.<br />
Енюков, Л.Д. Мешалкин]. – М.: Финансы и статистика,<br />
1989. – 607 с. 3. Краснопоясовський, А.С. Інформаційний<br />
синтез інтелектуальних систем керування: Підхід, що<br />
ґрунтується на методі функціонально-статистичних випробувань<br />
[Текст] / Краснопоясовський А.С. – Суми:<br />
Видавництво СумДУ, 2004. – 261 c. 4. Довбиш, А.С.<br />
Основи проектування інтелектуальних систем: Навч.<br />
посібник [Текст] / А.С. Довбиш– Суми: Видавництво<br />
Сум ДУ, 2009.– 171 с. 5. Мартиненко, С.С. Оброблення<br />
та розпізнавання магнітокардіограм [Текст] / С.С. Мартиненко<br />
// Вісник Сумського державного університету.<br />
Серія Технічні науки.– Суми:Видавництво СумДУ, 2010.<br />
– <strong>№</strong> 1. – С.16-23. 6. Информационно-экстремальный<br />
алгоритм распознавания магнитокардиограмм [Текст] /<br />
А.С. Довбиш, С.С. Мартиненко, А.С. Коваленко, Н.Н.<br />
Будник // Международный научно-технический журнал<br />
«Проблемы управления и информатики».– <strong>2011</strong>.– <strong>№</strong>1.–<br />
С. 140-146. 7. Use of machine learning for classification of<br />
magnetocardiograms / Embrechts M, Szymanski B, Sternickel<br />
K. [and others] //. Proc. IEEE Conference on System, Man and<br />
Cybernetics. – Washington DC, October 2003. – p. 1400-5.<br />
надійшла до редколегії 05.07.<strong>2011</strong><br />
УДК 616.07:004.032.26<br />
Сжатие и распознавание медицинской видеоинформации<br />
/ С.С. Мартыненко, Саад Джулгам // Бионика<br />
<strong>интеллект</strong>а: научн.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –<br />
С. 98-101.<br />
Рассматривается иерархический алгоритм оптимизации<br />
параметров обучения системы распознавания<br />
изображений медицинских и биологических объектов в<br />
рамках информационно-экстремальной <strong>интеллект</strong>уальной<br />
технологии, которая базируется на максимизации<br />
количества информации, полученной в процессе обучения<br />
системы.<br />
Ил.: 3. Библиогр.: 7 назв.<br />
UDC 616.07:004.032.26<br />
Medical video information compressing and recognition /<br />
S.S. Martynenko, Julgam Saad // Bionics of Intelligense: Sci.<br />
Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 98-101.<br />
Article presents hierarchical algorithm of learning parameters<br />
optimization of recognition system of images of medical<br />
and biological objects. Algorithm is presented in bounds of<br />
information-extreme intelligence technology, based on maximization<br />
of amount of information, gained in system learning<br />
process.<br />
fig.: 3. Ref.: 7 items.<br />
101
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 102–106 хНурэ<br />
УДК 004.89<br />
102<br />
Введение<br />
В настоящее время проблема кластеризации<br />
данных является одной из наиболее актуальных<br />
в области информационных технологий. Среди<br />
большого количества существующих методов кластеризации<br />
данных одним из часто используемых<br />
является метод k-means [1, 4]. Данный метод отличается<br />
тем, что количество кластеров изначально<br />
известно и определяется числом k . Характерными<br />
особенностями данного метода являются его простота<br />
реализации и модификации. Однако методу<br />
k-means присущи некоторые недостатки – проблема<br />
сходимости, и, как следствие, невозможность<br />
определения времени, необходимого на кластеризацию<br />
данных.<br />
Для повышения скорости работы алгоритма без<br />
потери точности при классификации методом kmeans<br />
предлагается использование биологических<br />
принципов организации вычислений, основанных<br />
на принципах работы искусственных иммунных<br />
систем (ИИС) [2, 3, 5]. При этом большое внимание<br />
уделяется определению исходных центров k<br />
кластеров, а также работе операторов клонирования<br />
и мутации клонов. Характерной особенностью<br />
иммунной модификации метода k-means является<br />
ограничение количества объектов, которые будут<br />
клонированы, на основе критерия пороговой аффинности,<br />
что значительно ускоряет работу алгоритма.<br />
1. Постановка задачи<br />
Дано множество объектов n , каждый из которых<br />
описывается набором признаков, и количество<br />
искомых кластеров k . Исходные объекты представляются<br />
популяцией антиген AG( ag1 ;...; agn ) . В<br />
качестве меры близости между объектами используется<br />
критерий аффинности Afij [2, 3, 5]:<br />
−1<br />
Af = ( 1+<br />
d ) , (1)<br />
ij ij<br />
где Af ij – аффинность между i и j объектами, а<br />
d ij – евклидово расстояние между их признаками.<br />
Н.М. Кораблев 1 , А.А. Фомичев 2<br />
1 ХНУРЭ, г.Харьков, Украина, korablev@kture.kharkov.ua<br />
2 ХНУРЭ, г.Харьков, Украина, alexandros_1985@mail.ru<br />
КЛАСТЕРИЗАЦИЯ ДАННЫХ МЕТОДОМ k-means<br />
С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННЫХ ИММУННЫХ СИСТЕМ<br />
В данной работе рассматривается алгоритм кластеризации данных методом k-means, функционирующий<br />
на основе использования искусственных иммунных систем. При определении центров k кластеров<br />
используется значение средней пороговой аффинности объектов. Для повышения скорости работы<br />
алгоритма кластеризации используются принципы клонирования граничных объектов и клонирования<br />
центров (центроидов).<br />
ИСКУССТВЕННЫЕ ИММУННЫЕ СИСТЕМЫ, ПОСЛЕДОВАТЕЛЬНОЕ КЛОНИРОВАНИЕ,<br />
ПОРОГОВАЯ АФФИННОСТЬ, УРОВЕНЬ СТИМУЛЯЦИИ<br />
Необходимо разработать алгоритм кластеризации<br />
объектов, функционирующий на основе метода<br />
k-means и иммунных принципов группировки,<br />
использующий в качестве основной меры близости<br />
объектов критерий (1), позволяющий определять<br />
центры k кластеров и принадлежность к ним<br />
исходных объектов.<br />
2. Алгоритм кластеризации<br />
Работу алгоритма k-means можно условно разделить<br />
на четыре основных этапа [1, 4]:<br />
1. Определение k центров кластеров.<br />
2. Определение принадлежности объектов кластерам.<br />
3. Определение центроидов k кластеров.<br />
4. Сравнение центров и центроидов кластеров.<br />
Определение центров кластеров может производиться<br />
как случайным образом, так и на основе<br />
некоторых критериев (например, по значению<br />
среднего евклидового расстояния с остальными<br />
объектами). Центроиды являются центрами кластеров,<br />
они могут быть кластеризуемыми объектами<br />
и определяются по средним значениям признаков<br />
объектов, входящих в данный кластер. На<br />
последнем этапе производится сравнение центров<br />
(центроидов), полученных на предыдущей итерации<br />
алгоритма, и центроидов, поученнях после<br />
переопределения принадлежности объектов кластерам.<br />
В случае их совпадения алгоритм кластеризации<br />
завершает работу, иначе происходит возврат<br />
ко второму этапу, где будет определяться принадлежность<br />
объектов к кластерам на основании выделенных<br />
ранее центроидов.<br />
Использование ИИС–принципов в организации<br />
работы k-means приводит к некоторому изменению<br />
в организации вычислений. Иммунная<br />
система оперирует с двумя типами клеток (лимфоцитов):<br />
Т-клетки, распознающие антигены и стимулирующие<br />
иммунный ответ, и В-клетки, нейтрализующие<br />
антигены. Антигенами AG( ag1 ;...; agn )<br />
являются все исходные объекты, B-клетки [3]
КЛАСТЕрИЗАЦИЯ ДАННЫх МЕТОДОМ K-meaNs С ИСПОЛЬЗОВАНИЕМ ИСКуССТВЕННЫх ИММуННЫх СИСТЕМ<br />
формируют популяцию Bc( bc1 ;...; bck ) и являются<br />
кластерами, которые переопределяются в ходе<br />
работы алгоритма. В работе данного метода на начальном<br />
этапе используется популяция T-клеток.<br />
Их основная задача заключается в определении<br />
критерия пороговой аффинности Affthr и стимуляции<br />
B-клеток.<br />
Основная идея модифицированного k-means<br />
алгоритма при использовании ИИС состоит в том,<br />
что предлагаемая модель иммунной сети предполагает,<br />
что процесс поиска антигенов уже произведен<br />
и Т-клетки, вступившие во взаимодействие с<br />
антигенами, определили их признаки (априорная<br />
завершенность процесса распознавания). В результате<br />
распознавания популяция Т-клеток содержит<br />
признаки всех исходных антигенов, после<br />
чего для каждой Т-клетки определяется уровень<br />
стимуляции. После отбора k Т-клеток с наибольшим<br />
уровнем стимуляции формируется популяция<br />
В-клеток путем клонирования отобранных объектов.<br />
После этого популяция В-клеток клонируется<br />
и мутирует до тех пор, пока не будут выделены все<br />
В-клетки, каждая из которых в ходе клонирования<br />
и мутации станет соответствующей некоторому<br />
количеству входных антигенов.<br />
Формально предлагаемый иммунный алгоритм<br />
k-means может быть представлен в виде следующей<br />
последовательности операторов:<br />
kmAIS( ag ;...; ag ) = stimTcell( t;... t ),<br />
1 n 1 n<br />
selBmem( b;...; b ), clonBcell( b′ ;...; b′<br />
),<br />
1<br />
k<br />
stimBcell( b′ ;...; b′<br />
),<br />
matchBcell(<br />
( b ;...; b ),( b′ ;...; b′<br />
)),<br />
1<br />
1 k 1 k<br />
k<br />
1<br />
k<br />
(2)<br />
где stimTcell( t1 ;... tn ) – оператор определения уровня<br />
стимуляции T-клеток; selBmem( b1 ;...; bk ) – оператор<br />
выделения центров В-клеток (исходных центров<br />
кластеров); clonBcell( b1 ′ ;...; bk′ ) – операторы клонирования,<br />
мутации и отбора В-клеток (формирование<br />
центроидов); stimBcell( b1 ′ ;...; bk′ ) – оператор<br />
определения уровня стимуляции для полученных<br />
центроидов (определение принадлежности<br />
исходных объектов выделенным кластерам);<br />
match(( b1;...; bk),( b1 ′ ;...; bk′<br />
)) – оператор сравнения<br />
клеток памяти Bmem( b1 ;...; bk) и сформированных<br />
клеток Bcell( b1 ′ ;...; bk′ ) .<br />
Следует отметить, что работа оператора<br />
clonBcell( b1 ′ ;...; bk′ ) может происходить на основе<br />
следующих подходов:<br />
1. Клонирование граничных антител в B-клетке.<br />
2. Клонирование центра (ядра) В-клетки.<br />
Граничные антитела В-клетки определяются с<br />
помощью критерия пороговой аффинности Affthr .<br />
Это происходит из предположения, что все антитела<br />
выделенной В-клетки соответствуют антигенам<br />
в ее области, т.е. её антитела по своим признакам<br />
идентичны вступившим с ней во взаимодействие<br />
антигенам. После этого граничные антитела подвергаются<br />
клонированию и мутации. Принадлежность<br />
объекта (антигена) кластеру (В-клетке) определяется<br />
путем выбора максимального веса клонов<br />
объектов (антител), соответствующего одной из<br />
В-клеток (кластеров).<br />
При клонировании всей В-клетки происходит<br />
мутация ее центра, представленного антителом с<br />
максимальным уровнем стимуляции ко всем антигенам,<br />
взаимодействующим с B-клеткой, либо её<br />
ядром (центроидом). После клонирования и мутации<br />
центра новое ядро (центроид) отбирается среди<br />
полученных клонов на основании конкурентного<br />
отбора, при этом ядром (центроидом) становится<br />
клон с наибольшим уровнем стимуляции ко всем<br />
антигенам В-клетки.<br />
Для определения уровня стимуляции Т-клеток<br />
stimTcell( t1 ;... tn ) производится вычисление их средних<br />
аффинностей affiAG со всеми антигенами популяции<br />
AG( ag1 ;...; agn ) :<br />
aff<br />
n<br />
j<br />
iAG = =<br />
∑<br />
1<br />
aff<br />
n<br />
ij<br />
, (3)<br />
где aff ij – аффинность Т-клетки t i и антигена ag j .<br />
После этого на основании полученных уровней<br />
стимуляции производится определение значения<br />
пороговой аффинности Aff thr :<br />
n<br />
∑<br />
1<br />
affiAG<br />
i<br />
Affthr<br />
=<br />
n<br />
=<br />
. (4)<br />
Пороговая аффинность используется при определении<br />
центров B-клеток (центров кластеров) и<br />
определении граничных антител (граничных объектов<br />
кластера) при кластеризации.<br />
Перед формированием популяции B-клеток по<br />
значениям affiAG определяются k наиболее стимулированных<br />
Т-клеток, аффинность между которыми<br />
не превышает значения Affthr . Эти клетки<br />
формируют популяцию B-клеток, каждая из которых<br />
изначально характеризуется только одним<br />
антителом (центром). Данное антитело становится<br />
клеткой памяти системы. После определения<br />
центра происходит рост В-клеток – антитела относятся<br />
к В-клеткам по максимальным значениям<br />
аффинности с её ядром (центральным объектом,<br />
центроидом).<br />
Клонирование и мутация В-клеток<br />
clonBcell( b1 ′ ;...; bk′ ) может происходить на основе<br />
указанных подходов. В первом случае (клонирование<br />
граничных антител) из антител, входящих<br />
в B-клетку для клонирования, выбираются антитела,<br />
аффинность которых к центру B-клетки удовлетворяет<br />
выражению:<br />
aff ≤ γ ⋅Aff<br />
, (5)<br />
ij thr<br />
103
Н.М. Кораблев, А.А. Фомичев<br />
где aff ij – аффинность i -го антитела с j -ым центром<br />
B-клетки (центром кластера), а γ – коэффициент<br />
деформации (сжатия) клетки, устанавливаемый<br />
в процентах. Для каждого клонируемого антитела<br />
количество возможных клонов определяется следующим<br />
образом:<br />
104<br />
cl = int || ( k⋅aff ) || , (6)<br />
i ij<br />
где int – округляет значение до ближайшего<br />
большего целого, k – количество кластеров, а<br />
aff ij – аффинность i -го антитела с центром j -ой<br />
B-клетки.<br />
При мутации клонированных антител используется<br />
оператор гипермутации, в результате чего<br />
коэффициент мутации σ i определяется как:<br />
2<br />
σ = γ⋅(<br />
1 − aff ) , (7)<br />
i ij<br />
где affij – аффинность i -го антитела с j -ым центром<br />
B-клетки, а γ – коэффициент деформации<br />
(сжатия) клетки, устанавливаемый в процентах.<br />
После клонирования и мутации клоны антитела<br />
определяют аффинности со всеми k центрами<br />
В-клеток (центрами кластеров). Принадлежность<br />
антитела кластеру определяется по значению общей<br />
максимальной аффинности его клонов ядру (центру,<br />
центроиду) В-клетки. После этого происходит<br />
переопределение ядер (центроидов) В-клеток по<br />
средним аффинностям входящих в него антител.<br />
Во втором случае (клонирование центра<br />
В-клетки) клонируется только ядро (центральный<br />
антиген), при этом количество клонов определяется<br />
как количество антител, содержащихся в данной<br />
В-клетке, а коэффициент мутации определяется<br />
как:<br />
σ = γ⋅<br />
aff , (8)<br />
i iAG<br />
где affiAG – аффинность центра i -й В-клетки с антигенами<br />
множества AG( ag1 ;...; agn ) .<br />
После клонирования для каждого из клонов<br />
определяется средняя аффинность affiAG с антигенами<br />
AG( ag1 ;...; agn ) . В результате конкурентного<br />
отбора [5] остается только клон с наибольшим значением<br />
аффинности, который формирует новое<br />
ядро (центроид) мутировавшей В-клетки.<br />
При определении уровня стимуляции полученных<br />
ядер (центроидов) В-клеток stimBcell( b1 ′ ;...; bk′ )<br />
для каждого нового ядра вычисляется аффинность<br />
affiAG , которая определяет уровень стимуляции<br />
В-клетки.<br />
В работе оператора сравнения<br />
match(( b1;...; bk ), ( b1′ ;...; bk′<br />
) ) происходит определение<br />
аффинности между соответствующими парами<br />
центров В-клеток. Клонирование и мутация<br />
В-клетки прекращается, если выполняются следующие<br />
условия:<br />
aff<br />
ij<br />
Affthr Affthr<br />
≥ i j<br />
⋅<br />
− ≤ ⋅<br />
γ<br />
γ<br />
; σ σ<br />
, (9)<br />
2 2<br />
где γ – коэффициент деформации клетки; Aff thr –<br />
пороговая аффинность; aff ij – аффинность между<br />
соответствующей парой центров; σ i и σ j – уровни<br />
стимуляции антител.<br />
В случае, если данное условие не выполняется,<br />
в памяти происходит замещение предыдущего<br />
центра В-клетки новым ядром (центроидом) и<br />
операции клонирования, стимуляции и сравнения<br />
повторяются.<br />
Процесс кластеризации с помощью иммунного<br />
k-means алгоритма можно представить как следующую<br />
последовательность шагов:<br />
1. Определение уровней стимуляции aff iAG (3)<br />
для популяции Т-клеток и значения пороговой аффинности<br />
Aff thr (4) для формируемого популяции<br />
В-клеток.<br />
2. Определение k наиболее стимулированных<br />
Т-клеток, аффинность между которыми не превышает<br />
значения пороговой аффинности Aff thr .<br />
Формирование исходной популяции В-клеток по<br />
результатам отбора Т-клеток.<br />
3. Определение принадлежности свободных<br />
антител В-клеткам по их аффинностям с центрами<br />
В-клеток.<br />
4. Клонирование и мутация В-клеток по одному<br />
из предложенных вариантов.<br />
5. Определение принадлежности антител к мутировавшим<br />
В-клеткам по аффинностям с их центрами.<br />
6. Сравнение центров В-клеток, расположенных<br />
в памяти, с центрами, выделенными в результате<br />
клонирования и мутации (8). В случае невыполнения<br />
условий (9) замещение клеток памяти<br />
выделенными центрами и переход к шагу 4, иначе<br />
переход к шагу 7.<br />
7. Конец.<br />
В результате работы будет получено множество<br />
k В-клеток (кластеров), содержащих антитела.<br />
Для антигенов принадлежность к кластерам<br />
(В-клеткам) определяется по принадлежности антител,<br />
вступивших с ними во взаимодействие.<br />
3. Результаты экспериментальных исследований<br />
Тестирование алгоритмов кластеризации производилось<br />
на нескольких наборах данных (табл. 1).<br />
Таблица 1<br />
Характеристики наборов данных<br />
Характеристики Набор 1 Набор 2 Набор 3<br />
Количество объектов 100 1000 10000<br />
Количество групп<br />
признаков<br />
2 5 10<br />
Размерность групп<br />
признаков<br />
3 6 10<br />
Кол. кластеров k 3 8 14<br />
На первом этапе работы алгоритмов для определения<br />
исходных центров кластеров по стан-
дартному методу k-means потребовалось меньше<br />
времени, чем его иммунным модификациям. Этап<br />
роста выделенных кластеров потребовал от всех<br />
типов алгоритмов приблизительно одинаковых затрат<br />
времени, но стандартный метод k-means снова<br />
показал лучший результат по сравнению с двумя<br />
его иммунными модификациями. Аналогичный<br />
результат наблюдался также и на этапе выделения<br />
новых центров (центроидов) k кластеров, где стандартному<br />
алгоритму k-means снова потребовалось<br />
меньше времени, в то время как для иммунных<br />
методов на данном этапе характерны наибольшие<br />
затраты времени, поскольку клонирование и мутация<br />
объектов сопряжены с выполнением большого<br />
количества вычислительных операций. При<br />
этом важной особенностью является наблюдаемое<br />
различие между временными затратами различных<br />
иммунных модификаций k-means: подход<br />
клонирования граничных антител при небольших<br />
наборах данных, характеризующихся малым количеством<br />
объектов, небольшим количеством групп<br />
признаков и их размерностью, требует больших<br />
временных затрат, чем подход клонирования центра<br />
кластера. Однако при повышении количества<br />
объектов в наборе данных, повышении количества<br />
групп признаков или повышении размерности при<br />
клонировании граничных объектов затраты времени<br />
меньше, чем при клонировании и мутации<br />
центра В-клеток. На сравнение исходных центров<br />
и выделенных центроидов алгоритмам потребовалось<br />
приблизительно одинаковое количество времени.<br />
Несмотря на то, что на выполнение одного прохода<br />
цикла кластеризации стандартному алгоритму<br />
k-means потребовалось значительно меньше<br />
времени, чем иммунным аналогам, его общие затраты<br />
времени больше, т.к. для кластеризации ему<br />
потребовалось значительно большее количество<br />
проходов цикла, чем его иммунным модификациям<br />
(табл. 2).<br />
Таблица 2<br />
Результаты работы алгоритмов<br />
Алгоритмы<br />
Стандартный<br />
k-means<br />
Иммунный<br />
k-means 1-го типа<br />
Иммунный<br />
k-means 2-го типа<br />
КЛАСТЕрИЗАЦИЯ ДАННЫх МЕТОДОМ K-meaNs С ИСПОЛЬЗОВАНИЕМ ИСКуССТВЕННЫх ИММуННЫх СИСТЕМ<br />
Набор 1 Набор 2 Набор 3<br />
C T C T C T<br />
13 100 154 100 1816 100<br />
9 96 96 87 1032 50<br />
7 88 93 83 1029 57<br />
В табл. 2 представлены результаты работы алгоритмов<br />
кластеризации на различных наборах данных,<br />
где C – количество проходов цикла кластеризации<br />
для выделенного набора данных, T – общее<br />
время, затраченное на кластеризацию выделенных<br />
наборов данных в процентах. Алгоритм, которому<br />
потребовалось максимальное количество времени<br />
T, имеет 100%, а значения затрат времени других<br />
алгоритмов определяются относительно выделенного<br />
максимума.<br />
Большое значение в работе иммунных алгоритмов<br />
приобретает коэффициент деформации клетки<br />
γ , который используется при определении граничных<br />
объектов (антител) (5) и при определении<br />
уровня мутации объектов (7), (8). Данный коэффициент<br />
отображает деформацию клеток организма,<br />
которая наблюдается в результате воздействия на<br />
них вирусов и бактерий, попавших в данный организм.<br />
В предложенных иммунных алгоритмах коэффициент<br />
деформации равен 10% ( γ=10% ). При<br />
повышении коэффициента деформации В-клеток<br />
предложенные иммунные алгоритмы требуют<br />
большего количества проходов цикла кластеризации<br />
и уступают стандартному k-means в затратах<br />
времени на кластеризацию. Уменьшение коэффициента<br />
деформации уменьшает необходимое количество<br />
проходов цикла кластеризации, следствием<br />
чего является уменьшение затрат времени на кластеризацию,<br />
но понижает точность группировки<br />
объектов, поэтому его целесообразно устанавливать<br />
в диапазоне 5-15%.<br />
Выводы<br />
В работе предложены иммунные модификации<br />
алгоритма k-means, в которых используются<br />
новые подходы для решения основных задач кластеризации<br />
данных. Для сокращения количества<br />
вычислений, влияющих на затраты времени, необходимого<br />
на кластеризацию, клонированию и<br />
мутации подвергаются лишь некоторые объекты<br />
исходного множества (граничные антигены, центры<br />
В-клеток). Выделение клонируемых объектов<br />
производится при использовании значения пороговой<br />
аффинности и коэффициента деформации,<br />
что значительно уменьшает количество выделяемых<br />
объектов и уменьшает затраты времени при<br />
кластеризации.<br />
Использование конкурентно-целевого отбора<br />
приводит к повышению эффективности отбора<br />
клонов при минимальных временных затратах, а<br />
определение принадлежности граничных объектов<br />
кластерам происходит на основании максимальной<br />
средней аффинности его клонов к центральному<br />
объекту кластера (центроиду), что значительно<br />
ускоряет процесс кластеризации и повышает её<br />
точность.<br />
По результатам тестирования алгоритмов на<br />
различных наборах данных видно, что предложенные<br />
иммунные модификации k-means незначительно<br />
усложняют алгоритм кластеризации, однако<br />
увеличивают скорость его работы.<br />
105
Н.М. Кораблев, А.А. Фомичев<br />
Список литературы: 1. Mirkin, B.G. Clustering for Data Mining.<br />
A Data recovery Approach / B.G. Mirkin. – Taylor &<br />
francis Group, 2005. – 278 p. 2. Дасгупта, Д. Искусственные<br />
иммунные системы и их применение [Текст]: Пер. с<br />
англ. – А.А. Романюха. М.: ФИЗМАТЛИТ, 2006. – 344 с.<br />
3. An Overview of Artificial Immune Systems / J. Timmis,<br />
T. Knight, L.N. de Castro, E. Hart. – Natural Computation,<br />
2004. – 29 p. 4. Duda, R.O. Pattern classification / R.O. Duda,<br />
P.R. Hart, D.G. Stork – Willey & Sons. – 2001. – 738 p.<br />
5. Кораблёв, Н.М. Классификация объектов на основе искусственных<br />
иммунных систем [Текст] / Н.М. Кораблёв,<br />
А.А. Фомичёв // Системи обробки інформації. – 2010 –<br />
Вип. 6 (87). – С. 13-17.<br />
Поступила в редколлегию 12.07.<strong>2011</strong><br />
УДК 004.89<br />
Кластеризація даних методом k-means за допомогою<br />
штучних імунних систем / М.М. Корабльов, О.О.Фомічов<br />
// Біоніка інтелекту: наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3<br />
(<strong>77</strong>). – С. 102-106.<br />
106<br />
У роботі запропоновані імунні підходи до вирішення<br />
задачі кластеризації даних методом k-means. Для підвищення<br />
швидкодії алгоритму кластеризації використовуються<br />
принципи клонування граничних об’єктів та<br />
клонування центрів. Проведені експериментальні дослідження<br />
запропонованих підходів вказали на високу<br />
швидкість кластеризації даних без втрат точності та хорошу<br />
масштабованість алгоритмів.<br />
Табл. 2. Бібліогр.: 5 найм.<br />
UDK 004.89<br />
K-means data clustering using artificial immune systems<br />
/ N.M. Korablev, А.А. fomichev // Bionics of Intelligense:<br />
Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 102-106.<br />
The paper presents the immune approaches to solving the<br />
problem of data clustering method k-means. To speed enhancing<br />
operation of clustering algorithm is used principles of<br />
boundary objects cloning and center objects cloning of clusters.<br />
Experimental studies suggested approaches indicated a<br />
high rate of clustering data without loss of accuracy and good<br />
scalability algorithms.<br />
Tab. 2. Ref. 5 items.
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 107–111 хНурэ<br />
УДК 004.93’1<br />
К.В. Барило<br />
Сумський державний університет, м. Суми, Україна, kate.barylo@gmail.com<br />
ОПТИМІЗАЦІЯ РІВНЯ СЕЛЕКЦІЇ КООРДИНАТ ЕТАЛОННИХ<br />
ВЕКТОРІВ ПРИ РОЗПІЗНАВАННІ ЕЛЕКТРОНОГРАМ<br />
Розглядається алгоритм оптимізації рівня селекції координат еталонних векторів-реалізацій класів<br />
розпізнавання для заданого алфавіту в рамках інформаційно-екстремальної інтелектуальної технології,<br />
що ґрунтується на максимізації інформаційної спроможності системи розпізнавання. При цьому досліджено<br />
вплив рівня селекції на функціональну ефективність системи розпізнавання зображень.<br />
ЕЛЕКТРОНОГРАМА, РІВЕНЬ СЕЛЕКЦІЇ, РОЗПІЗНАВАННЯ, ІНФОРМАЦІЙНИЙ КРИТЕРІЙ,<br />
НАВЧАННЯ<br />
Вступ<br />
Складність машинного розпізнавання електронограм,<br />
одержаних в електронній мікроскопії в режимі<br />
малої дифракції, обумовлена як довільними<br />
початковими умовами формування їх зображень,<br />
так і впливом неконтрольованих випадкових факторів<br />
(нестабільність параметрів мікроскопа та<br />
електронного пучка) [1]. Одним із перспективних<br />
напрямів аналізу і синтезу систем розпізнавання<br />
електронограм є використання ідей і методів<br />
інформаційно-екстремальної інтелектуальної технології<br />
(ІЕІ-технологія), що ґрунтується на максимізації<br />
інформаційної спроможності в процесі<br />
навчання системи [2,3]. У рамках ІЕІ-технології<br />
важливу роль в процесі навчання системи розпізнавання<br />
відіграє рівень селекції координат двійкових<br />
еталонних векторів-реалізацій образу [4], оскільки<br />
вони визначають геометричні центри контейнерів<br />
класів розпізнавання при їх цілеспрямованому відновленні<br />
в радіальному базисі простору ознак розпізнавання.<br />
Оптимізація рівня селекції дозволяє<br />
підвищити середню міжкласову кодову відстань<br />
для заданого алфавіту класів розпізнавання у відповідності<br />
з максимально-дистанційним принципом<br />
теорії розпізнавання образів.<br />
У статті розглянуто інформаційно-екстремальний<br />
алгоритм оптимізації рівня селекції координат<br />
еталонних векторів з метою підвищення функціональної<br />
ефективності навчання системи розпізнавання<br />
електронограм.<br />
1. Постановка задачі дослідження<br />
Нехай дано алфавіт класів розпізнавання<br />
o<br />
{ Xm| m= 1 , M } , навчальна матриця типу “об’єкт-<br />
( j )<br />
властивість” || ymi , ||, i = 1, N, j = 1 , n , де N, n–<br />
кількість<br />
ознак розпізнавання та реалізацій образу відповідно.<br />
При цьому задано структурований вектор<br />
параметрів функціонування системи, що навчається<br />
розпізнавати реалізації класу X o<br />
1 : g =< x1, d1,ρ<br />
> ,<br />
який складається відповідно з еталонної реалізації<br />
x1 класу X o<br />
1 , геометричного параметра d1 – кодо-<br />
вої відстані гіперповерхні контейнера K o<br />
1 класу<br />
X o<br />
1<br />
від вершини еталонної реалізації x X o<br />
1 1<br />
∈ і рів-<br />
ня селекції ρ координат еталонних векторів класів<br />
розпізнавання, який є рівнем квантування дискрет<br />
полігону емпіричних частот потрапляння значень<br />
ознак розпізнавання у свої поля контрольних допусків.<br />
При цьому полігон будується так: по осі<br />
абсцис відкладаються ранги ознак розпізнавання,<br />
які відповідають номерам ознак у векторі-кортежі<br />
( j )<br />
xm , а по осі ординат – відносні частоти ωm,i =ni /n,<br />
де ni – кількість випробувань, при яких значення<br />
і-ї ознаки знаходиться в своєму полі контрольних<br />
допусків.<br />
Задано допустимі області значень відповідних<br />
N<br />
параметрів: x1 B ∈Ω| | | N |<br />
, де ΩB – бінарний простір<br />
ознак потужності N ; d1 ∈[ 0; d( x1⊕xc) −1]<br />
, де xc –<br />
еталонна реалізація сусіднього (найближчого до<br />
X o<br />
1 ) класу X o<br />
c , і рівень селекції ρ координат еталонної<br />
реалізації x1 , ρ∈[ 01. ; ]<br />
Треба на етапі навчання за апріорно класифікованими<br />
реалізаціями нечітких образів побудувати<br />
оптимальне в інформаційному розумінні чітке роз-<br />
| |<br />
биття ℜ M дискретного простору ознак ΩB на M<br />
класів розпізнавання шляхом ітераційної оптимізації<br />
координат вектора параметрів функціонування<br />
g1 за умови, що значення усередненого за<br />
o<br />
алфавітом { X m}<br />
інформаційного критерію функціональної<br />
ефективності (КФЕ) навчання системи<br />
розпізнавання набуває глобального максимуму<br />
в робочій (допустимій) області визначення його<br />
функції.<br />
2. Алгоритм інформаційно-екстремальної<br />
оптимізації рівня селекції координат еталонних<br />
векторів класів розпізнавання<br />
Оптимізацію рівня селекції координат еталонних<br />
векторів класів розпізнавання будемо<br />
здійснювати за паралельним алгоритмом, при<br />
якому рівень селекції змінюється одночасно для<br />
всіх ознак розпізнавання. При цьому за умови<br />
прийняття у загальному випадку гіпотези нечіткої<br />
компактності реалізацій образу оптимізація<br />
рівня селекції ρ буде здійснюватися у рамках<br />
інформаційно-екстремального алгоритму навчання<br />
для гіперсферичного класифікатора, в якому<br />
107
К.В. Барило<br />
контейнери класів розпізнавання відновлюються<br />
на кожному кроці навчання в радіальному базисі<br />
дискретного простору Хеммінга. Оптимальний<br />
рівень селекції ρ * координат еталонної реалізації<br />
o<br />
xm ∈ Xm<br />
визначається у результаті реалізації багатоцикличної<br />
ітераційної процедури:<br />
108<br />
ρ<br />
*<br />
= argmax {max E }} , (1)<br />
GρGd де Gρ , Gd – області допустимих значень параметрів<br />
ρ і d1 ; E *<br />
– максимальне усереднене значення КФЕ<br />
для алфавіту класів розпізнавання.<br />
Таким чином, внутрішній цикл процедури (1)<br />
реалізує базовий алгоритм навчання і зовнішній<br />
цикл – пошук оптимального значення рівня селекції.<br />
Базовий алгоритм навчання виконується за<br />
попередньо знайденим значенням параметра поля<br />
контрольних допусків δ за паралельним алгоритмом<br />
оптимізації.<br />
Як критерій оптимізації параметрів навчання у<br />
рамках ІЕІ-технології використовувалася модифікація<br />
інформаційної міри Кульбака [4], в якій розглядається<br />
відношення правдоподібності у вигляді<br />
логарифмічного відношення повної ймовірності<br />
правильного прийняття рішень Pt до повної ймовірності<br />
помилкового прийняття рішень Pf . Для<br />
рівноймовірних двохальтернативних гіпотез міра<br />
Кульбака має такий вигляд:<br />
E<br />
m<br />
P<br />
P D D<br />
t m<br />
t m= , m + , m;<br />
,<br />
, 05 1, 05 2,<br />
= log 2 ∗[ Pt, m− Pf<br />
, m]<br />
=<br />
=<br />
P<br />
P = , + 05 , β .<br />
f , m<br />
f , m<br />
*<br />
05α m m<br />
1 ⎛ D1 + D2<br />
⎞<br />
= log 2<br />
⎝<br />
⎜<br />
+ ⎠<br />
⎟ [ ( D1 + D2)<br />
− ( α+ β)<br />
]=<br />
2 α β<br />
⎛ 2 − ( α+ β)<br />
⎞<br />
= log2<br />
⎝<br />
⎜<br />
α+ β ⎠<br />
⎟[<br />
2 − ( α+ β ) ] , (2)<br />
де D1, D2,<br />
αβ– , перша та друга достовірності, помилки<br />
першого та другого роду відповідно.<br />
При цьому усереднене значення критерію (2)<br />
визначається як<br />
M<br />
1 *<br />
E = Em ,<br />
M<br />
m=<br />
1<br />
*<br />
де Em – максимальне значення КФЕ навчання си-<br />
o<br />
стеми розпізнавати реалізації класу X m , обчислене<br />
в робочій (допустимій) області визначення функції<br />
критерію.<br />
Розглянемо основні етапи алгоритму паралельної<br />
оптимізації рівня селекції:<br />
1) Встановлюємо значення для верхнього ρv та<br />
нижнього ρn значення рівня селекції відповідно.<br />
2) Встановлюємо крок зміни рівня селекції<br />
ρс=0,1.<br />
3) Встановлюємо значення поточного рівня селекції:<br />
ρz:= ρ + ρc.<br />
4) Реалізується базовий алгоритм навчання,<br />
який включає в себе такі етапи:<br />
∑<br />
а) формування бінарної навчальної матриці<br />
( j )<br />
|| || , елементи якої дорівнюють<br />
xmi ,<br />
*<br />
де δki ,<br />
x<br />
( j )<br />
mi ,<br />
( j ) *<br />
⎧<br />
⎪1,<br />
if ymi<br />
, ∈δK,<br />
i,<br />
= ⎨ ( j ) *<br />
⎩⎪ 0,<br />
if ymi<br />
, ∉δK,<br />
i,<br />
– попередньо знайдене за паралельним<br />
алгоритмом оптимальне значення параметра поля<br />
контрольних допусків;<br />
б) формування масиву еталонних двійкових<br />
векторів { xmi , | m= 1, M, i = 1 , N } , елементи якого<br />
визначаються за правилом<br />
x<br />
mi ,<br />
n ⎧ 1 ( j )<br />
⎪1,<br />
if ∑ xmi , > pz,<br />
= ⎨ n j = 1<br />
⎪<br />
⎩0,<br />
if else,<br />
де ρz – поточне значення рівня селекції координат<br />
o<br />
вектора xm ∈ Xm;<br />
в) розбиття множини еталонних векторів на<br />
| 2 |<br />
пари найближчих «сусідів»: ℜm =, де xl –<br />
o<br />
еталонний вектор сусіднього класу X l ;<br />
г) оптимізація кодової відстані dm відбувається<br />
за рекурентною процедурою;<br />
д) процедура закінчується при знаходженні максимуму<br />
КФЕ в робочій області його визначення:<br />
∗<br />
Em= max Em,<br />
де { d} = { 01 , ,..., d < d( xm ⊕ xl)}<br />
– мно-<br />
{ d}<br />
жина радіусів концентрованих гіперсфер, центр<br />
o<br />
яких визначається вершиною xm ∈ Xm.<br />
5) Якщо ρz < ρv, то виконується крок 3, інакше<br />
– 6.<br />
6) Визначається значення рівня селекції при<br />
якому усереднене значення КФЕ максимальне.<br />
7) ЗУПИН.<br />
Таким чином, алгоритм оптимізації рівня селекції<br />
координат двійкових еталонних векторівреалізацій<br />
образу, як і інших параметрів навчання<br />
інтелектуальної СППР у рамках ІЕІ-технології полягає<br />
у наближенні глобального максимуму інформаційного<br />
критерію оптимізації до найбільшого<br />
його значення в області значень функції критерію.<br />
3. Приклад реалізації алгоритму<br />
Розглянемо алфавіт із чотирьох класів розпізнавання.<br />
Приклади електронограм-реалізацій кож-<br />
ного класу показано на рис. 1. При цьому клас X o<br />
1<br />
відповідає електронограмам алюмінію (рис. 1а),<br />
клас X o<br />
2 – електронограми з Кікучі лініями (рис.<br />
1б), X o<br />
3 – матеріалу з монокристалічною структурою<br />
(рис. 1в), а X o<br />
4 – матеріалу з полікристалічною<br />
структурою (рис. 1г). Розмірність кожного<br />
зображення електронограми становила 300× 300<br />
пікселів. Оскільки зображення електронограми<br />
є нестаціонарним за яскравістю, то за реалізацію<br />
приймається вся матриця яскравості. Матриця<br />
яскравості оброблялась у полярній системі координат<br />
з метою забезпечення інваріантності електронограм<br />
до операцій зсуву та повороту.
ОПТИМІЗАЦІЯ рІВНЯ СЕЛЕКЦІЇ КООрДИНАТ ЕТАЛОННИх ВЕКТОрІВ ПрИ рОЗПІЗНАВАННІ ЕЛЕКТрОНОГрАМ<br />
а б<br />
в г<br />
Рис. 1. Електронограми: а – алюміній (клас X o<br />
1 );<br />
б – з Кікучі лініями (клас X o<br />
2<br />
структура (клас X o<br />
3<br />
(клас X o<br />
4 )<br />
); в – монокристалічна<br />
); г – полікристалічна структура<br />
При обробленні зображень в полярних координатах<br />
вектор-реалізація образу формувався з ознак<br />
розпізнавання, які обчислювалися за формулою<br />
1<br />
=<br />
N<br />
∑<br />
Θ j i<br />
N i = 1<br />
θ ,<br />
де Θ j – числове значення усередненого спектру<br />
яскравості для кола зчитування в j -му радіусі,<br />
j = 1, R ; θi – значення яскравості в i-му пікселі,<br />
i = 1, N ; N – загальна кількість пікселів у колі<br />
зчитування.<br />
Вхідна ціла навчальна матриця яскравості для<br />
кожного класу складалася із 30 реалізацій і мала<br />
такі параметри: m = 14 . , i = 1150 , , j = 130 , .<br />
Оптимізація параметра δ поля контрольних<br />
допусків на ознаки розпізнавання здійснювалася<br />
за паралельним алгоритмом при значенні рівня<br />
селекції ρ=05 , . Графік залежності усередненого<br />
КФЕ (2) від параметра поля контрольних допусків<br />
δ показано на рис. 2.<br />
Рис. 2. Залежність усередненого КФЕ від параметра<br />
поля контрольних допусків δ при рівні селекції ρ=05 ,<br />
Темними ділянками на графіку (рис. 2) позначено<br />
робочі області визначення КФЕ, в яких здій-<br />
снюється пошук його глобального максимуму.<br />
Аналіз рис.2 показує, що оптимальне значення параметра<br />
δ , при якому значення усередненого КФЕ<br />
є максимальним, дорівнює δ * = 79. При цьому усереднене<br />
значення КФЕ становить 4,93.<br />
На рис. 3 наведено залежність КФЕ від радіусів<br />
контейнерів класів розпізнавання після проведення<br />
оптимізації параметра поля контрольних допусків<br />
δ при значенні рівня селекції ρ=05 , .<br />
а<br />
б<br />
в<br />
г<br />
Рис. 3. Графік залежності КФЕ від радіусів контейнерів:<br />
а – клас X o<br />
1<br />
; б – клас X o<br />
2<br />
o<br />
o<br />
; в – клас X 3 ; г – клас X 4<br />
Аналіз рис. 3 показує, що відновлені в процесі<br />
навчання гіперсферичні контейнери класів розпіз-<br />
*<br />
навання мають такі оптимальні радіуси: d1 = 14 (тут<br />
* * *<br />
і далі в кодових одиницях), d2 = 5, d3 = 17 і d4 = 16 .<br />
При цьому оптимальні радіуси контейнерів класів<br />
X o o<br />
1 і X 2 , для яких глобальні максимуми КФЕ на<br />
графіках мають ділянки типу “плато”, визначалися<br />
за умови мінімального значення коефіцієнта<br />
нечіткої компактності [2]<br />
109
К.В. Барило<br />
110<br />
l<br />
m<br />
*<br />
dm<br />
=<br />
d x ⊕ x<br />
→ min , (3)<br />
( )<br />
m c<br />
* o<br />
де dm – оптимальний радіус контейнера класу X m ;<br />
d( xm ⊕ xc)<br />
міжцентрова відстань між еталонним<br />
o<br />
вектором xm ∈ Xm<br />
і еталонним вектором xc най-<br />
o<br />
ближчого сусіднього класу X c .<br />
Після проведення навчання системи та знаходження<br />
оптимальних параметрів контейнерів<br />
класів розпізнавання міжцентрові кодові відстані<br />
для заданого алфавіту класів розпізнавання відповідно<br />
дорівнювали: d( x1⊕ x2)<br />
=17, d( x1⊕ x3)<br />
=32,<br />
d( x1⊕ x4)<br />
=35, d( x2 ⊕ x3)<br />
=17, d( x2 ⊕ x4)<br />
=18,<br />
d( x3 ⊕ x4)<br />
=23. При цьому середнє значення міжцентрової<br />
кодової відстані дорівнює 24 кодових<br />
одиниць. А усереднене значення коефіцієнта нечіткої<br />
компактності (3) дорівнює<br />
M<br />
1<br />
l = lm = 0,75.<br />
M<br />
∑<br />
m=<br />
1<br />
Згідено з максимально-дистанційним принципом<br />
теорії розпізнавання образів одним із шляхів<br />
підвищення функціональної ефективності навчання<br />
системи є збільшення міжцентрових кодових<br />
відстаней. З цією метою в рамках ІЕІ-технології<br />
було проведено на етапі навчання за процедурою<br />
(1) оптимізацію рівня селекції координат еталонних<br />
векторів-реалізацій класів розпізнавання. Графік<br />
залежності усередненого значення КФЕ для<br />
заданого алфавіту класів розпізнавання від значення<br />
рівня селекції ρ показано на рис. 4.<br />
Рис. 4. Графік залежності усередненого КФЕ<br />
від значення рівня селекції<br />
Аналіз рис.4 показує, що оптимальне значення<br />
рівня селекції визначається при глобальному максимумі<br />
КФЕ і дорівнює ρ *<br />
= 087 , . Таким чином,<br />
порівняльний аналіз графіків, показаних на рис. 2 і<br />
рис. 4 дозволяє зробити висновок, що оптимізація<br />
рівня селекції дозволило збільшити значення усередненого<br />
КФЕ з 4,93 (при ρ=050 , ) до 5,68.<br />
На рис. 5 показано графіки залежності КФЕ від<br />
радіусів контейнерів відповідних класів розпізнавання<br />
для оптимального рівня селекції координат<br />
еталонних векторів.<br />
Аналіз рис. 5 показує, що відновлені в процесі<br />
навчання гіперсферичні контейнери класів роз-<br />
*<br />
пізнавання мають такі оптимальні радіуси: d1 = 22 ,<br />
*<br />
= . При цьому міжцентрові<br />
* *<br />
d2 = 3, d3 = 25 і d4 22<br />
кодові відстані для заданого алфавіту класів розпізнавання<br />
відповідно дорівнюють: d( x1⊕ x2)<br />
=25,<br />
d( x1⊕ x3)<br />
=48, d( x1⊕ x4)<br />
=44, d( x2 ⊕ x3)<br />
=27,<br />
d( x2 ⊕ x4)<br />
=28, d( x3 ⊕ x4)<br />
=36, а значення середньої<br />
міжцентрової кодової відстані дорівнює 35,<br />
що суттєво перевищує аналогічне значення, одержане<br />
при неоптимальному значенні рівня селекції<br />
( ρ=050 , ), яке застосовується за замовченням.<br />
а<br />
б<br />
в<br />
г<br />
Рис. 5. Графік залежності КФЕ навчання від радіусів<br />
контейнерів класів розпізнавання: а – клас X o<br />
1 ;<br />
б – клас X o<br />
2<br />
o<br />
o<br />
; в – клас X 3 ; г – клас X 4<br />
Таким чином, усереднений коефіцієнт нечіткої<br />
компактності дорівнює l =0,68 (до оптимізації рівня<br />
селекції l =0,75), що свідчить про зменшення<br />
при оптимальному рівні селекції ступеня перетину<br />
класів розпізнавання.
ОПТИМІЗАЦІЯ рІВНЯ СЕЛЕКЦІЇ КООрДИНАТ ЕТАЛОННИх ВЕКТОрІВ ПрИ рОЗПІЗНАВАННІ ЕЛЕКТрОНОГрАМ<br />
Висновки<br />
1. Оптимізація рівня селекції координат еталонних<br />
векторів класів розпізнавання дозволяє<br />
підвищити функціональну ефективність навчання<br />
системи розпізнавання електронограм.<br />
2. У процесі відновлення контейнерів класів<br />
розпізнавання при оптимальному рівні селекції<br />
середня міжцентрова відстань збільшилася, а<br />
середнє значення коефіцієнта нечіткої компактності<br />
зменшилося, що відповідає дистанційномаксимальному<br />
і дистанційно-мінімальному<br />
принципам теорії розпізнавання образів.<br />
3. Оскільки побудовані вирішальні правила не<br />
є безпомилковими за навчальними матрицями, то<br />
для підвищення функціональної ефективності навчання<br />
доцільно застосовувати ієрархічні схеми<br />
алгоритмів.<br />
Список літератури: 1. Томас, Г. Просвечивающая электронная<br />
микроскопия материалов: [Текст] / Г. Томас,<br />
М.Дж. Гориндж: Под ред.. Б.К. Вайнштейна: Пер. с англ.<br />
– М.: Наука. Гл. ред. Физ.-мат. лит. – 1983. – 320 с. 2. Довбиш,<br />
А.С. Основи проектування інтелектуальних систем:<br />
Навчальний посібник [Текст] / А.С. Довбиш. – Суми:<br />
Вид-во СумДУ, 2009. – 171 с. 3. Краснопоясовський, А.С.<br />
Інформаційний синтез інтелектуальних систем керування,<br />
що навчаються: Підхід, що грунтується на методі<br />
функціонально-статистичних випробувань [Текст] /<br />
А.С. Краснопоясовський. – Суми: Видавництво Сум-<br />
ДУ. – 2003. – 257 с. 4. Шелехов, І. В.Вибір базового класу<br />
при розпізнаванні зображень [Текст] / І. В. Шелехов,<br />
К. В. Барило // Вісник Сумського державного університету.<br />
Серія Технічні науки. — 2010. — <strong>№</strong> 3, Т. 2. — С. 95-102.<br />
5. Довбиш, А.С. Інформаційно-екстремальний метод<br />
розпізнавання електронограм [Текст] / А.С. Довбиш,<br />
С.С. Мартиненко // Вісник Сумського державного<br />
університету. Серія: Технічні науки.– 2009. – <strong>№</strong> 2. –<br />
С. 85-91.<br />
надійшла до редколегії 26.08.<strong>2011</strong><br />
УДК 004.93’1<br />
Оптимизация уровней селекции координат эталонных<br />
векторов при распознавании электронограмм / Е.В. Барило<br />
// Бионика <strong>интеллект</strong>а: науч.-техн. журнал. – <strong>2011</strong>. –<br />
<strong>№</strong> 3 (<strong>77</strong>). – С. 107-111.<br />
В статье рассматривается алгоритм оптимизации<br />
уровня селекции координат эталонных векторовреализаций<br />
классов распознавания для заданного<br />
алфавита в рамках информационно-экстремальной<br />
<strong>интеллект</strong>уальной технологии, которая основана на<br />
максимизации информационной способности системы<br />
распознавания. При этом исследовано влияние уровня<br />
селекции на функциональную эффективность системы<br />
распознавания изображений.<br />
Ил. 5. Библиогр.: 5 назв.<br />
UDK 004.93’1<br />
Optimization of selection level of the vectors-implementations<br />
coordinates in pattern recognition / K.V.Barylo // Bionics<br />
of Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 107-<br />
111.<br />
In article algorithm optimization of the selection level of<br />
the vectors-implementations coordinate for the for a given<br />
class recognition alphabet by using information-extreme intellectual<br />
technology, which is based on maximizing the information<br />
capacity of the recognition system. The selection<br />
level of the pattern vectors-implementations coordinates influence<br />
on the system functional efficiency is estimated.<br />
fig.: 5/ Ref.: 5 items.<br />
111
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 112–118 хНурэ<br />
УДК 519.87<br />
112<br />
Введение<br />
Актуальность проблематики, связанной с моделированием<br />
(описанием и предсказанием поведения)<br />
процессов, происходящих в живой природе,<br />
существенно возросла в связи с осознанием<br />
мировым сообществом в последнее десятилетие<br />
серьёзных взаимосвязанных проблем в столь разнородных<br />
направлениях, как экология, климатология,<br />
демография, социология. Перспективным<br />
аппаратом компьютерного моделирования крупноразмерных<br />
систем с распределённой обработкой<br />
информации, интерпретируемых применительно к<br />
указанным направлениям, являются клеточные автоматы<br />
(КА). Целесообразность применения КА<br />
для моделирования поведения систем указанного<br />
типа обусловлена простотой описания конфигурации<br />
и набора рабочих правил. Дополнительный<br />
выигрыш по объёму моделируемой системы и эффективности<br />
работы КА может быть обеспечен<br />
локально-параллельными (ЛП) алгоритмами [1].<br />
Идеология ЛП алгоритмов совместима с принципами<br />
представления нечёткой информации [2, 3]. Для<br />
этого ключевой элемент нечёткого представления<br />
– функция принадлежности (ФП) – дискретизируется<br />
и масштабируется в соответствии с числом<br />
градаций, требуемым (достаточным) для описания<br />
конкретной системы. Ввиду дискретного характера<br />
и неотрицательности (по определению) значений<br />
ФП, ЛП аппарат нечёткого представления<br />
данных становится принципиально применимым<br />
также к КА. В частности, при чётком описании,<br />
как частном случае нечёткого, ФП принимает одно<br />
из двух значений (0, 1), что соответствует подвиду<br />
КА – бинарным клеточным автоматам (БКА) [4].<br />
Для полноты оперирования данными необходимо<br />
дополнить аппарат описания [2, 3] ЛП алгоритмами,<br />
реализующими смену состояний ячеек КА для<br />
конкретных видов (вариантов) КА. Цель настоящей<br />
работы – разработка и исследование (оценка<br />
эффективности) ЛП варианта одной из процедур<br />
работы КА: стекового алгоритма определения<br />
уровня (степени) соседства ячеек БКА.<br />
Бенаддия Абдельлатиф, О.Ф. Михаль<br />
ХНУРЕ, г. Харьков, Украина, fuzzy16@pisem.net<br />
ЛОКАЛЬНО-ПАРАЛЛЕЛЬНЫЙ СТЕКОВЫЙ АЛГОРИТМ<br />
БИНАРНОГО КЛЕТОЧНОГО АВТОМАТА<br />
Приложение принципов локально-параллельной обработки информации к клеточным автоматам<br />
позволяет существенно увеличить размеры реализуемых моделей. Для полноты оперирования данными<br />
локально-параллельное представление данных должно быть дополнено алгоритмами, реализующими<br />
смену состояний ячеек для конкретных видов (вариантов) клеточных автоматов. Предложен и продемонстрирован<br />
на тестовых примерах один из таких алгоритмов — локально-параллельный стековый<br />
алгоритм бинарного клеточного автомата.<br />
КЛЕТОЧНЫЕ АВТОМАТЫ, ЛОКАЛЬНАЯ ПАРАЛЛЕЛЬНОСТЬ, НЕЧЁТКАЯ ЛОГИКА, СТЕК<br />
1. Клеточные автоматы<br />
В основе КА [4] лежат следующие представления.<br />
Имеется регулярная решётка ячеек. Каждая<br />
ячейка может находиться в одном из конечного<br />
множества состояний. Для ячейки определено<br />
множество соседних ячеек – её окружение. Задаётся<br />
начальное состояние всех ячеек и набор правил<br />
перехода ячеек из одного состояния в другое. На<br />
каждой итерации, на основе правил перехода и в<br />
соответствии с текущим состоянием соседних ячеек,<br />
определяется новое состояние каждой ячейки.<br />
Таким образом, КА в целом последовательно сменяет<br />
состояния (этапы, фазы жизненного цикла,<br />
поколения).<br />
Характерно, что работа КА (переход в следующее<br />
поколение) необратима, как необратимы процессы<br />
в живой природе. Эволюционирование КА<br />
является однонаправленным, как и время в реальном<br />
физическом мире. Текущее j-е состояние КА<br />
однозначно определяет последующее (j+1)-е состояние,<br />
но (j-1)-е состояние не может быть однозначно<br />
восстановлено по текущему j-му состоянию.<br />
Таким образом, КА «автоматически» воспроизводят<br />
важную особенность реального мира – однонаправленность<br />
и необратимость времени.<br />
Привлекательность КА в качестве аппарата моделирования<br />
крупноразмерных пространственно<br />
распределённых систем определяется также концептуальной<br />
наглядностью, малым набором рабочих<br />
правил и, как следствие, простотой программной<br />
реализации и визуализации процесса работы.<br />
В БКА для записи состояния ячейки используется<br />
один бит. Подбором правил работы КА допустимы<br />
различные варианты соседства ячеек. Рис. 1<br />
иллюстрирует некоторые из возможных топологий<br />
БКА: ситуации с 4, 6 и 8 ячейками-соседями. Центральная<br />
ячейка выделена чёрным цветом, её окружение<br />
(соседи) – серым.<br />
Ориентированный граф, представленный на<br />
рис. 2, иллюстрирует совокупность правил для<br />
БКА с 8 соседями рис. 1 (в) для широко известного<br />
варианта бинарного КА «игра Жизнь» [5]. Ячейка
КА может находиться в одном из двух состояний:<br />
0 или 1 (узлы графа). При уровне (степени) соседства<br />
3 или 4 (при наличии в окружении 3 или 4 единичных<br />
ячеек) – единичное состояние сохраняется<br />
или 0 переходит в 1. Иначе – 0 сохраняется или<br />
1 переходит в 0.<br />
a б в<br />
Рис. 1. Бинарные КА с вариантами соседства:<br />
4 (а), 6 (б) и 8 клеток (в)<br />
При компьютерном моделировании на КА содержательность<br />
(репрезентативность, информационная<br />
ёмкость) моделей растёт с их размерами.<br />
В частности, применительно к экологии и статистической<br />
биологии для моделирования поведения<br />
растительных ареалов или животных сообществ, с<br />
учётом информативности для статистической обработки<br />
[6], представляются целесообразными<br />
модели объёмом более 10 4 ячеек. В связи с этим<br />
при компьютерной реализации реальной модели<br />
на БКА возникает проблема экономного расходования<br />
ресурсов вычислительной системы (ВС)<br />
– оперативной памяти, дискового пространства,<br />
времени работы программы и др. Сокращение<br />
расходуемых системных ресурсов эквивалентно<br />
общему сокращению затрат на эксплуатацию модели.<br />
С другой стороны, экономное расходование<br />
ресурсов ВС при фиксированном общем объёме<br />
ресурсов – эквивалентно повышению размера или<br />
точности модели.<br />
Рис. 2. Правила бинарного КА «игра Жизнь»<br />
Каждая ячейка КА самостоятельно (назависимо)<br />
изменяется в процессе работы программы. Изменения<br />
состояний i-й ячейки происходят, как отмечалось,<br />
в соответствии с правилами работы КА:<br />
ячейки влияют друг на друга, взаимно обусловливают<br />
свое поведение. При этом текущая <strong>информация</strong><br />
о состоянии i-й ячейки должна храниться отдельно<br />
от информации о состоянии других ячеек. То есть,<br />
для каждой ячейки требуется отдельный элемент<br />
хранения. Стандартные форматы хранения данных<br />
– расточительны в отношении использования<br />
ресурсов ВС. Существенный выигрыш может быть<br />
обеспечен при ЛП представлении информации<br />
[2, 3].<br />
ЛОКАЛЬНО-ПАрАЛЛЕЛЬНЫЙ СТЕКОВЫЙ АЛГОрИТМ БИНАрНОГО КЛЕТОЧНОГО АВТОМАТА<br />
2. Принцип локальной параллельности<br />
Поясним принцип ЛП представления и обработки<br />
информации. Пусть имеется два<br />
n-компонентных вектора:<br />
A: {a1 , a2 , a3 ,…, ai ,…, an },<br />
B: {b1 , b2 , b3 ,…, bi ,…, bn }, (1)<br />
где: i ∈ (1, 2, 3,…, n); ai , bi –целые положительные<br />
числа, причём<br />
ai ≤ amax ; bi ≤ bmax ; amax = bmax . (2)<br />
Условие (2), дополнительно налагаемое на (1),<br />
означает, что формат чисел – компонентов векторов<br />
– должен быть одинаковым и числа не могут<br />
быть сколь угодно большими.<br />
Требуется найти покомпонентную сумму векторов:<br />
C: { c1 , c2 , c3 ,…, ci ,…, cn }; ci = ai + bi . (3)<br />
Согласно последовательной схеме, для этого<br />
должен быть выполнен следующий набор операций:<br />
Шаг 1. Начальная установка: i=1.<br />
Шаг 2. Извлечение значения операнда ai из регистра<br />
памяти, в котором он хранится.<br />
Шаг 3. Извлечение значения операнда bi из регистра<br />
памяти, в котором он хранится.<br />
Шаг 4. Суммирование: ci = ai + bi .<br />
Шаг 5. Помещение результата ci в регистр памяти,<br />
в котором он должен храниться.<br />
Шаг 6. i = i + 1. Если i>n, завершение вычисления;<br />
иначе переход к Шагу 2.<br />
Согласно ЛП схеме, для нахождения покомпонентной<br />
суммы необходимо выполнить следующий<br />
набор операций:<br />
Шаг 1. Конкатенация:<br />
A:{a1 , a2 , a3 ,…, ai ,…, an } →<br />
→ a # = (a1 ⊕ a2 ⊕ a3 ⊕ … ⊕ ai ⊕ … ⊕ an ); (4)<br />
B:{b 1 , b 2 , b 3 ,…, b i ,…, b n } →<br />
→ b # = (b 1 ⊕ b 2 ⊕ b 3 ⊕ … ⊕ b i ⊕ … ⊕ b n ).<br />
Шаг 2. Извлечение значения операнда (конкатенанда)<br />
a # из регистра памяти, в котором он хранится.<br />
Шаг 3. Извлечение значения операнда (конкатенанда)<br />
b # из регистра памяти, в котором он хранится.<br />
Шаг 4. Суммирование конкатенандов:<br />
c # = a # + b # .<br />
Шаг 5. Помещение результата c # в регистр памяти,<br />
в котором он должен храниться.<br />
Шаг 6. Деконкатенация:<br />
c # = (c 1 ⊕ c 2 ⊕ c 3 ⊕ … ⊕ c i ⊕ … ⊕ c n ) →<br />
→ C:{c 1 , c 2 , c 3 ,…, c i ,…, c n }. (5)<br />
Операции конкатенации и деконкатенации<br />
требуют дополнительного пояснения. Обычно эти<br />
термины применяются при описании обработки<br />
113
Бенаддия Абдельлатиф, О.Ф. Михаль<br />
символьных последовательностей. В рассматриваемом<br />
случае конкатенируются целые положительные<br />
числа в двоичном представении.<br />
Числа (исходные данные, промежуточные значения,<br />
результаты) при их обработке располагаются<br />
в центральном процессоре в отдельных регистрах<br />
– линейках бинарных ячеек памяти. Отсюда<br />
применяемый далее термин – регистровое представление<br />
(РгП). В ЛП представлении результат<br />
конкатенации есть некоторое целое положительное<br />
число, помещаемое в едином регистре, – РгП,<br />
которое интерпретируется как состоящее из сегментов<br />
согласно длине конкатенантов. При деконкатенации<br />
сегменты извлекаются из РгП. Таким<br />
образом, конкатенация есть операция уплотнения<br />
представления компонентов векторов (1) в виде<br />
сегментов в РгП a # и b # вида (4). Cодержимые РгП<br />
a # и b # обрабатываются целиком, как числа. Деконкатенация<br />
– обратная операция – раскрытие<br />
РгП. Содержимое i-го сегмента c i извлекается и<br />
помещается в индивидуальный регистр. В результате,<br />
согласно ЛП схеме, операция (в рассматриваемом<br />
случае суммирование соответствующих<br />
компонентов векторов) производится над РгП, а<br />
результат C:{c 1 , c 2 , c 3 ,…, c i ,…, c n } выглядит так, как<br />
если бы операции производились над парами операндов<br />
раздельно.<br />
Сравним представленные выше пошаговые последовательности<br />
операций. Вычислительные блоки<br />
операций Шаги 2 – 5 в последовательной и ЛП<br />
схемах совпадают. Различие состоит в том, что в последовательной<br />
схеме блок выполняется n-кратно,<br />
в ЛП схеме – однократно. Этим обеспечивается<br />
выигрыш в производительности. Разумеется, процедуры<br />
конкатенация и деконкатенация (Шаги 1<br />
и 6 ЛП схемы) являются протяженными во времени,<br />
т.е. связаны с дополнительным расходованием<br />
ресурсов ВС. Однако, если в системе реализуются<br />
сложные вычисления, например с последовательным<br />
применением нескольких ЛП алгоритмов,<br />
РгП составляются из исходных данных только в<br />
самом начале вычислительного блока, а результаты<br />
извлекаются из РгП только в самом конце. Затраты<br />
ресурсов на конкатенацию-деконкатенацию<br />
при этом могут быть пренебрежимо малы по сравнению<br />
с общими затратами ресурсов ВС. При этом<br />
выигрыш в производительности приближается к<br />
n-кратному.<br />
Очевидно, что ЛП схема тем более эффективна,<br />
чем больше число конкатенированных сегментов<br />
n. Приближенно (при больших объёмах вычислительных<br />
ЛП блоков), выигрыш в производительности<br />
пропорционален длине регистра вычислительного<br />
устройства и обратно пропорционален<br />
длине сегмента [2, 3].<br />
Для единства структуры данных, разрядности<br />
сегментов, задействованных под операнды a # и b #<br />
114<br />
и результат c # , должны совпадать. При выполнении<br />
операции соседствующие сегменты не должны<br />
взаимодействовать, поэтому должны быть приняты<br />
меры по согласованию разрядностей. Форматы<br />
представления ЛП данных в системе должны быть<br />
организованы так, чтобы в сегментах c # было изначально<br />
зарезервировано достаточно места для размещения<br />
результата операции над a # и b # .<br />
Выигрыш в производительности и характеристики<br />
точности системы конкурируют между собой.<br />
При фиксированной разрядности регистра<br />
производительность ЛП системы тем выше, чем<br />
больше число сегментов. Следовательно, для повышения<br />
производительности целесообразно сократить<br />
разрядность сегментов до минимума. При этом<br />
уменьшается число градаций, с которым могут быть<br />
представлены в системе соответствующие обрабатываемые<br />
величины. Таким образом, при проектировании<br />
систем с использованием принципов ЛП<br />
при выборе размера сегментов должны приниматься<br />
компромиссные решения по соотношению производительности<br />
вычислений и точности результатов.<br />
Для операций должны быть разработаны соответствующие<br />
алгоритмы, подобные ЛП алгоритмам<br />
операций нечёткой логики, рассмотренным в<br />
[2, 3]. Имеются ограничения, определяемые длиной<br />
сегментов. В частности, рассмотренная ЛП<br />
операция суммирования реализуема только для<br />
положительных операндов ограниченного размера.<br />
Этому условию удовлетворяют, в частности,<br />
значения ФП, применяемые в нечетком теоретикомножественном<br />
описании. Применительно к ЛП<br />
представлению они масштабированы в соответствии<br />
с размерами сегментов и конкатенированы в<br />
РгП [2, 3]. Для ячеек КА так же имеется фиксированное<br />
число неотрицательных состояний. Следовательно,<br />
ЛП представление информации потенциально<br />
применимо и к КА.<br />
3. Локально-параллельное представление КА<br />
Упрощённо процессор ВУ Фон-Неймановского<br />
типа имеет два 32-разрядных регистра для хранения<br />
операндов и один 32-разрядный регистр для<br />
помещения результата. Процессор реализует стандартный<br />
набор арифметических и логических операций,<br />
включая поразрядную (побитовую) логику<br />
и регистровые сдвиги.<br />
Как отмечалось (п. 2), при ЛП обработке предполагается<br />
хранение нескольких элементов информации<br />
в виде раздельных непересекающихся<br />
сегментов РгП. В случае ЛП представления КА<br />
логично разместить в отдельных сегментах РгП отдельные<br />
клетки КА. При этом формат размещения<br />
информации в РгП должен быть удобным для реализации<br />
ЛП алгоритмов обработки.<br />
В обычной записи для хранения решётки ячеек<br />
(матрицы) КА требуется двумерный массив. При
размере поля M строк на N столбцов требуется M∙N<br />
индивидуально адресуемых элементов хранения<br />
информации. В случае 32-разрядного ВУ Фон-<br />
Неймановского типа это составляет 32∙M∙N бит. В<br />
ЛП представлении ячейки КА хранятся в сегментах<br />
РгП. То есть индивидуально адресуемыми элементами<br />
хранения становятся РгП, а не отдельные<br />
ячейка КА. В случае БКА в РгП может быть до 32<br />
однобитовых сегментов. Строка поля БКА может<br />
быть помещена в [М / 32] + 1 РгП (квадратные<br />
скобки обозначают взятие целой части от деления).<br />
В результате для представления всего БКА необходим<br />
массив из ([М / 32] + 1)∙N ≈ М∙N / 32 РгП<br />
(индивидуально адресуемых элементов хранения<br />
информации). Соответственно, если ячейка КА<br />
имеет n состояний, для её представления требуется<br />
k бит с соблюдением соотношения 2 k ≥ n, то есть<br />
k ≥ log 2 n, то есть k = [log 2 n]+1 бит. Таким образом,<br />
в 32-разрядном ВУ для представления строки элементов<br />
КА требуется [М∙k / 32] + 1, а для представления<br />
всего массива – М∙N∙k / 32 индивидуально<br />
адресуемых элементов хранения информации.<br />
Для БКА наиболее плотным (компактным, экономным,<br />
с минимальным расходованием ресурсов<br />
ВУ) является однобитовое сегментное представление.<br />
Например, поле БКА размером 30 × 30 элементов<br />
может быть размещено в одномерном массиве<br />
A из 30 штук 32-разрядных чисел в формате integer:<br />
(a 1 , a 2 ,…, a j ,…, a 29 , a 30 ). Сложность проявляется<br />
при реализации работы БКА. Как отмечалось, алгоритм<br />
функционирования КА предполагает рассмотрение<br />
окружения каждой клетки и принятие<br />
в зависимости от этого решения, будет ли клетка<br />
«живой» (значение «1») или «мёртвой» (значение<br />
«0») в следующем цикле жизни КА. В частности,<br />
для БКА с 8-ю соседями (рис. 1 а), согласно правилам<br />
(рис. 2), при ЛП вычислениях для j-й строки (jго<br />
РгП a j ) должны суммироваться 8 штук РгП:<br />
(a (j-1) p) + (a j p) + (a (j+1)p). (6)<br />
В (6) «p» означают процедуры регистрового<br />
сдвига на p бит (длину сегмента) в сторону<br />
старших или младших разрядов соответственно.<br />
В рассматриваемом случае БКА p = 1, а для представления<br />
результата по каждому сегменту требуется<br />
4 бита, поскольку имеется 9 градаций возможных<br />
значений сегментной суммы: (0, 1, 2,…, 7, 8).<br />
Как отмечалось, соседние сегменты не должны<br />
взаимодействовать. Для этого ЛП система должна<br />
быть организована так, чтобы в сегментах было изначально<br />
зарезервировано достаточно места для<br />
размещения результата. Типовым подходом при<br />
реализации подобных ЛП вычислений является<br />
прореживание РгП A [2, 3] с использованием битовых<br />
масок.<br />
ЛОКАЛЬНО-ПАрАЛЛЕЛЬНЫЙ СТЕКОВЫЙ АЛГОрИТМ БИНАрНОГО КЛЕТОЧНОГО АВТОМАТА<br />
E1 = (000100010001…0001) 2 ;<br />
E2 = (001000100010…0010) 2 ;<br />
E3 = (010001000100…0100) 2 ;<br />
E4 = (100010001000…1000) 2 . (7)<br />
При этом массив РгП A преобразуется в 4 массива<br />
A i ,: (a i1 , a i2 ,…, a ij ,…, a i29 , a i30 ); a ij = a j ∧ E i ;<br />
i ∈ (1, 2, 3, 4); где «∧» – побитовое логическое И. В<br />
полученных 4 массивах все сегменты содержатся<br />
в точности по одному разу. При этом они не взаимодействуют<br />
при проведении операции. После<br />
прореживания процедура выполняется последовательно<br />
для каждого из A i , с последующим сведениием<br />
результатов в единый РгП – сложением<br />
либо теоретико-множественным объединением.<br />
Эффективность ЛП алгоритма при этом снижается<br />
четырёхкратно.<br />
Аналогично, при 6 соседях (рис. 1 б) имеется 7<br />
градаций, а при 4 соседях (рис. 1 в) – 5 градаций,<br />
поэтому для хранения каждого из таких результатов<br />
потребуется 3 бита. Соответственно, для ЛП<br />
обработки потребуется прореживание A на три<br />
массива, с применением системы битовых масок<br />
E1 = (001001001…001) 2 ;<br />
E2 = (010010010…010) 2 ;<br />
E3 = (100100100…100) 2 . (8)<br />
Эффективность ЛП алгоритма снижается при<br />
этом только трёхкратно.<br />
Прореживание системой масок (7) или (8) и соответствующее<br />
кратное снижение эффективности<br />
ЛП обработки снимается полностью с применением<br />
стекового ЛП алгоритма.<br />
4. Стековый локально-параллельный алгоритм<br />
Сортировка материала, попавшего в k-й сегмент<br />
стека, реализуется «методом пузырька». Поясним<br />
работу ЛП стекового алгоритма на примере. Пусть<br />
имеются 8-битные числа<br />
А1 = 18810 = 101111002 ,<br />
A2 = 11310 = 011100012 ,<br />
A3 = 23510 = 111010112 ,<br />
A4 = 2510 = 000110012 , (9)<br />
случайным образом выбранные в интервале от 0 до<br />
255. Нижний индекс обозначает основание системы<br />
счисления представления числа. В двоичном<br />
представлении для наглядности лидирующие нули<br />
сохранены.<br />
Интерпретируем двоичные позиции, как сегменты<br />
в ЛП представлении. Таким образом, выражения<br />
(9) означают, что имеется четыре 8-сегментных<br />
РгП. Размер каждого сегмента – 1 бит.<br />
Стеками являются столбцы сегментов. Имеется ЛП<br />
набор из 8 стеков. Работа данного ЛП набора стеков<br />
заключается в том, что после первоначального<br />
заполнения единичные сегменты «проваливают-<br />
115
Бенаддия Абдельлатиф, О.Ф. Михаль<br />
ся» максимально вниз, а нулевые, соответственно,<br />
«всплывают» вверх согласно алгоритму сортировки<br />
«методом пузырька», который применяется<br />
к РгП посегментно, одновременно (локальнопараллельно)<br />
ко всем сегментам. С набором данных<br />
(9) это выглядит следующим образом:<br />
→ {<br />
→ {<br />
116<br />
10111100 10111100<br />
01110001 01110001<br />
11101011<br />
00011001<br />
} → {<br />
00001001<br />
11111011<br />
10111100<br />
00000001<br />
} → {<br />
00000000<br />
10111101<br />
01111001 01111001<br />
11111011 11111011<br />
00000000 00000000<br />
10111101<br />
01111001<br />
} → {<br />
00111001<br />
11111101<br />
11111011 11111011<br />
} →<br />
} →<br />
} →<br />
(10)<br />
00000000<br />
00111001<br />
11111001<br />
→ {<br />
11111111<br />
Выражение (10) изображает последовательную<br />
смену 7 состояний набора РгП (1). Первое состояние<br />
соответствует исходному (1), последнее –ситуации<br />
с полностью отсортированными сегментными<br />
стеками: все единицы максимально смещены<br />
вниз. Сортировка (ЛП работа стеков) организована<br />
за 6 шагов – переходов между состояниями. Фигурные<br />
скобки и стрелки переходов показывают,<br />
какие именно из РгП сопоставляются на каждом<br />
следующем шаге алгоритма сортировки.<br />
Рассмотренный процесс включает два вложенных<br />
цикла. Внешний цикл обеспечивает (n-1)кратное<br />
(где n – число РгП, в примере n = 4) повторение<br />
внутреннего цикла с сокращением его<br />
объёма от (n-1) (три первые смены состояний) до 1<br />
(последняя смена состояний).<br />
Первый (самый правый, соответствующий<br />
младшим разрядам чисел А1 – А4 ) стек не претерпевал<br />
изменений, т.к. оказалось, что изначальная<br />
расстановка единиц в нём не требует сортировки.<br />
4-е и 5-е состояния – тождественны, поскольку в<br />
результате сопоставления РгП А3 и А4 оказалось,<br />
что в этом цикле не происходит вертикального<br />
перемещения единиц («всплывания пузырьков»).<br />
Показателен 3-й справа разряд. В нём тремя последовательными<br />
обменами единица спускается<br />
из РгП A1 в РгП A4 .<br />
Рассмотрим бинарную процедуру сопоставления,<br />
обозначенную на (10) значком «→». Процедура<br />
включает арифметические операции «–» и<br />
«+», а так же побитовые (поразрядные) логические<br />
операции «END» и «XOR». Входными данными<br />
являются A и B, выходными – изменённые зна-<br />
чения A и B. В процедуре используются константа<br />
E0 = 11111…11 («ЛП единица») и промежуточная<br />
переменная M. Приведём описание процедуры в<br />
обозначениях, принятых в [7]:<br />
Local_Parallel_Stack()<br />
1 M ← A “END” ( B “XOR” E0 ) (11)<br />
2 A ← A – M<br />
3 B ← B + M<br />
В ходе выполнения в посегментном битовом<br />
представлении для всех четырёх возможных комбинаций<br />
входных данных происходит следующее.<br />
Исходное состояние:<br />
A = …1…1…0…0… ;<br />
B = …1…0…1…0… .<br />
Константа:<br />
E0 =…1…1…1…1… .<br />
Промежуточные состояния:<br />
B “XOR” E0 = …0…1…1…0… ;<br />
M = A “END” ( B “XOR” E0 ) = …0…1…0…0… .<br />
Состояние после завершения процедуры:<br />
A = …1…0…0…0… ;<br />
B = …1…1…1…0… .<br />
Как следует из представленного, в тех сегментных<br />
стеках, в которых имеется комбинация (1, 0),<br />
происходит преобразование (1, 0) → (0, 1), то есть<br />
при наличии «свободного места» единица «проваливается»<br />
вниз по стеку. Остальные стековые комбинации<br />
остаются без изменения.<br />
После завершения сортировки стеков (столбцов<br />
текущего набора РгП (10) ), имеется весь исходный<br />
материал для формирования результата – нового<br />
набора значений соответствующего фрагмента<br />
КА. Так, если рассматривать пример (10) как относящийся<br />
к работе БКА с четырьмя соседями<br />
(рис. 1 а), разность<br />
(A2 – A1 ) = (00111001) 2 – (00000000) 2 = (00111001) 2<br />
будет соответствовать правилу наличия трёх «живых»<br />
ячеек-соседей. В ней единицами отмечены те<br />
позиции (ячейки КА), которые «выжили» в новом<br />
поколении КА, поскольку в текущем поколении они<br />
были окружены тремя единичными соседями. Соответственно,<br />
нулями обозначены «не выжившие»<br />
ячейки, которые в текущем поколении были окружены<br />
меньшим либо большим числом соседей.<br />
Аналогично, выглядит ситуация с другим числом<br />
соседей (рис. 1 б, в) и более сложным набором<br />
правил. Так, в случае БКА с 8 соседями (рис. 1 в) и<br />
«выживанием» ячейки при 3 или 4 соседях (рис. 2)<br />
стек состоит из восьми РгП B1 , B2 ,…, Bm ,…, B8 .<br />
Здесь, как и в (9), B8 – основание стека, B1 – его<br />
вершина. При упорядочении РгП аналогично<br />
представленному в (10), после прохождения сортировки<br />
в стеках, значение «1» в некоторой позиции<br />
m-го РгП обозначает наличие у соответствующей
ячейки не менее (9 – m) «единичных» ячеексоседей.<br />
Поэтому ситуация с 3 или 4 «соседями»<br />
отображается в виде «1» в B 6 и B 5 , соответственно,<br />
при наличии «0» в B 5 и B 4 , соответственно. Результирующее<br />
выражение данного комбинированного<br />
решающего правила – (B 4 – B 6 ).<br />
5. Обсуждение результатов<br />
Работа БКА с применением предложенного<br />
стекового алгоритма смоделирована в варианте с<br />
8 соседями (рис. 1 а) на 32-разрядном процессоре,<br />
на <strong>язык</strong>е Python. Размер поля модели 32 × 32 ячейки.<br />
Моделированием подтверждена работоспособность<br />
стекового алгоритма. В процессе разработки<br />
выявлены следующие особенности стекового варианта<br />
построения КА.<br />
Позитивной стороной ЛП стекового алгоритма<br />
КА является универсальность подхода применительно<br />
к различным вариантам правил поведения<br />
КА. Универсальность проявляется в независимости<br />
от объёма и конфигурации окружения (соседства),<br />
а так же в простоте выбора порогового уровня или<br />
диапазона уровней при определении «выживающих»<br />
ячеек. Этим обеспечивается простота смены<br />
значений для ключевых параметров модели (числа<br />
ячеек-соседей, конфигурации соседства и правил<br />
перехода разметки ячеек) при экспериментальном<br />
подборе при исследовании применительно к конкретной<br />
моделируемой предметной области.<br />
Достоинством стекового варианта алгоритма<br />
КА является существенное (в 3 – 4 раза) сокращение<br />
времени обработки по сравнению с рассмотренным<br />
(п. 3) альтернативным ЛП вариантом – с<br />
прореживанием РгП.<br />
Ограничением выполненного моделирования<br />
ЛП стекового варианта БКА является размер поля:<br />
строка поля целиком помещена в одно РгП. Для<br />
размещения более длинных строк требуется несколько<br />
РгП и дополнительные алгоритмические<br />
решения по состыковке их концов (младшего сегмента<br />
i-й РгП и старшего сегмента (i+1)-й РгП)<br />
для правильной обработки соседства ячеек.<br />
В разработанном варианте стековый алгоритм<br />
детерминировано реализует два вложенных цикла.<br />
В результате, возможны, хотя и редки, случаи<br />
«холостого» прохождения цикла, типа отмеченного<br />
выше, продемонстрированного в примере (10)<br />
– тождественность 4-го и 5-го состояний. Сокращение<br />
количества переборов за счёт изъятия этих<br />
«холостых» прохождений цикла – проблематично.<br />
Введение соответствующих дополнительных проверок<br />
только усложнит и замедлит алгоритм, поскольку<br />
возможные проверки в совокупности будут<br />
в лучшем случае соизмеримы по сложности и<br />
объёму кода с основной процедурой (11).<br />
В связи со сказанным, последующими направлениями<br />
исследования могут явиться, в частности:<br />
ЛОКАЛЬНО-ПАрАЛЛЕЛЬНЫЙ СТЕКОВЫЙ АЛГОрИТМ БИНАрНОГО КЛЕТОЧНОГО АВТОМАТА<br />
– модифицирование алгоритма на случай представления<br />
строки поля КА несколькими РгП;<br />
– поиск оптимизационных алгоритмических<br />
решений, в частности по сокращению «холостых»<br />
циклов;<br />
– распространение стекового алгоритма на более<br />
широкий класс КА (большее число состояний<br />
ячейки, конфигурации соседства, отличные от иллюстрируемых<br />
рис. 1, многомерные и многослойные<br />
структуры с послойными функциями влияния).<br />
Кроме того ретроспективно целесообразны<br />
обобщения КА совместно с принципом ЛП и стековым<br />
подходом в реализации базового алгоритма:<br />
– введение весовых коэффициентов для уровней<br />
(при задании уровня срабатывания в виде диапазона<br />
значений) и отдельных полей конфигурации<br />
окружения;<br />
– интерпретация вводимых весовых коэффициентов<br />
как значений ФП;<br />
– вероятностная интерпретация ФП.<br />
Введение вероятностных представлений и элементов<br />
нечёткости – позволяет существенно разнообразить<br />
поведение КА и искать их устойчивые<br />
долгоживущие состояния (в смысле выживаемости<br />
КА) помимо зависимости от конкретных правил<br />
поведения КА.<br />
Применительно к приложениям типа моделирования<br />
различных аспектов функционирования<br />
живой природы нечёткий и вероятностный КА<br />
подходы принципиально интересны тем, что ими<br />
вводится (учитывается, изначально задаётся) мера<br />
детерминированности (известности, измеримости,<br />
наблюдаемости) в поведении моделируемой<br />
системы. Таким образом, не исключаются из рассмотрения<br />
неизвестные влияющие факторы, всегда<br />
присутствующие в моделируемой системе.<br />
Выводы<br />
Локально-параллельное представление информации<br />
обеспечивает повышенную эффективность<br />
работы программного обеспечения. Принципы<br />
локально-параллельной обработки применимы к<br />
клеточным автоматам и позволяют существенно<br />
увеличить размеры модели. Предложен и продемонстрирован<br />
на тестовых примерах локальнопараллельный<br />
стековый алгоритм бинарного<br />
клеточного автомата. Стековый подход в равной<br />
степени эффективен применении к различному<br />
числу и вариантом расположения ячеек-соседей; а<br />
также инвариантен по выбору порогового уровня<br />
или диапазона уровней для определения «выживающих»<br />
ячеек.<br />
Список литературы: 1. Бенаддия, Абдельлатиф. Перспективы<br />
реализации келлюлярных авторматов на локальнопараллельных<br />
алгоритмах [Текст] / Бенаддия Абдельлатиф<br />
// Материалы международной научно-практической<br />
117
Бенаддия Абдельлатиф, О.Ф. Михаль<br />
конференции студентов и аспирантов “Информационные<br />
технологии в экономике и образовании”. – М.:<br />
Российский университет кооперации, 2008. – С. 45–48.<br />
2. Михаль, О.Ф. Моделирование распределенных<br />
информационно-управляющих систем средствами<br />
локально-параллельных алгоритмов обработки нечеткой<br />
информации [Текст] / О.Ф. Михаль // Проблемы<br />
бионики: Всеукр. межвед. науч.-техн. сборник. – 2001.<br />
– Вып. 54. – С. 28–34. 3. Михаль, О.Ф. Принципы организации<br />
систем нечеткого регулирования на однородных<br />
локально-параллельных алгоритмах [Текст] / О.Ф. Михаль,<br />
О.Г. Руденко // Управляющие системы и машины.<br />
2001. <strong>№</strong> 3. С. 3–10. 4. Тоффоли, Т. Машины клеточных<br />
автоматов [Текст] : Пер. с англ. / Т. Тоффоли, Н. Марголус.<br />
– М., «Мир» 1991. – 280 с. 5. Люггер, Д.Ф. Искусственный<br />
<strong>интеллект</strong>: стратегии и методы решения сложных<br />
проблем [Текст] / Д.Ф. Люггер М.: Изд. дом «Вильямс»,<br />
2005. – 864 с. 6. Любищев, А.А. Дисперсионный анализ<br />
в биологии [Текст] / А.А. Любищев. – М.: Изд-во Моск.<br />
ун-та, 1986. 200 с. 7. Кормен, Т. Алгоритмы: построение<br />
и анализ [Текст] / Т. Кормен, Ч. Лейзерсон, Р. Ривест М.:<br />
МЦНМО, 2001. – 960 с.<br />
Поступила в редколлегию 12.09.<strong>2011</strong><br />
118<br />
УДК 519.87<br />
Локально-паралельний стековий алгоритм бінарного<br />
клітинного автомату / Бенаддія Абдельлатіф, О.П. Міхаль<br />
// Біоніка інтелекту: наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3<br />
(<strong>77</strong>). – С. 112-118.<br />
Локально-паралельне подання інформації забезпечує<br />
підвищення эфективности работи програмного забезпечення.<br />
Додання принципів локально-паралельної обробки<br />
до клітинних автоматів дозволяє суттєво підвищити<br />
розміри моделей. Запропоновано і продемонстровано на<br />
тестових прикладах локально-паралельний стековий алгоритм<br />
бінарного клітинного автомату.<br />
Іл. 2. Бібліогр.: 7 найм.<br />
UDK 519.87<br />
Local-parallel stack algorithm of the binary cellular automaton.<br />
/ Benaddia Abdellatif, O.Ph. Mikhal // Bionics of<br />
Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 112-118.<br />
Local-parallel presentation of information provides raised<br />
efficiency of the work of software. Application of principle of<br />
local-parallel processing to cellular automaton allows greatly<br />
enlarge the sizes of models. Local-parallel stacked algorithm<br />
of the binary cellular automaton is offered and demonstrated<br />
on test examples.<br />
fig. 2. Ref.: 7 items.
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 119–125 хНурэ<br />
УДК 519.87<br />
Мохамад Али, О.Ф. Михаль<br />
ХНУРЕ, г. Харьков, Украина, fuzzy16@pisem.net<br />
ЛОКАЛЬНО-ПАРАЛЛЕЛЬНАЯ СОРТИРОВКА ОГРАНИЧЕННЫХ<br />
МАЛЫХ НАБОРОВ ДАННЫХ<br />
Рассмотрены принципы локально-параллельного представления информации применительно к задаче<br />
сортировки данных. Процедура сортировки проанализирована на комбинаторном уровне на примере<br />
3-, 4- и 8-элементных числовых последовательностей. Описан принцип работы алгоритма локальнопараллельной<br />
сортировки. Моделированием на <strong>язык</strong>е Python показано, что локально-параллельный<br />
алгоритм максимально эффективен применительно к малым выборкам, суммарным размером в пределах<br />
разрядности процессора.<br />
ЛОКАЛЬНАЯ ПАРАЛЛЕЛЬНОСТЬ, СОРТИРОВКА ДАННЫХ<br />
Введение<br />
Сортировка данных – классическая задача<br />
теории алгоритмов, сочетающая в себе прозрачность<br />
общей концепции и простоту постановки<br />
с многовариантностью решений в зависимости<br />
от дополнительных условий, налагаемых в связи<br />
с конкретными особенностями обрабатываемой<br />
информации. Алгоритмы сортировки подробно<br />
изучены для вычислительных систем (ВС) последовательного<br />
действия. Параллельные ВС до недавнего<br />
времени были исключительно многопроцессорными,<br />
дорогими и громоздкими, поэтому<br />
они разрабатывались преимущественно для специальных<br />
применений, а задачи сортировки рассматривалась<br />
в них главным образом в контексте<br />
реализации общих принципов распараллеливания<br />
алгоритмов применительно к большим массивам<br />
данных. Ситуация изменилась в последние десятилетия<br />
с появлением многоядерных процессоров<br />
и широким распространением (массовым использованием)<br />
сетевых вычислительных структур [1]:<br />
приобрела актуальность обработка ограниченных<br />
малых наборов данных (ОМНД). Задача сортировки<br />
применительно к ОМНД [2, 3] эффективно решается<br />
с использованием алгоритмов, реализующих<br />
принципы локальной-параллельной (ЛП) обработки<br />
информации [4, 5]. Область применения ОМНД –<br />
задачи принятия решений при детерминированном<br />
наборе вариантов. К задачам этого типа относится,<br />
в частности, значительная часть тематики искусственного<br />
<strong>интеллект</strong>а (ИИ). Так, одна из парадигм<br />
ИИ – исследование и воспроизведение структур и<br />
функций человеческого <strong>интеллект</strong>а. Человек же в<br />
каждый конкретный момент своей практической<br />
деятельности эффективно оперирует ограниченным<br />
малым числом понятий [6]. Эффективность (скорость<br />
принятия решений) зачастую определяется<br />
правильной последовательностью рассмотрения<br />
вариантов, а реализация эффективности сводится<br />
к сортировке ОМНД. ЛП алгоритмы обеспечивают<br />
повышение скорости обработки без задействования<br />
дополнительных аппаратных ресурсов. Поэто-<br />
му они целесообразны как структурный элемент<br />
при реализации обработки ОМНД. Сказанным<br />
определяется актуальность и практическая ценность<br />
данного направления.<br />
В настоящей работе развиваются рассмотренные<br />
ранее [1-3] принципы сортировки на ЛП алгоритмах,<br />
проводится детальное сравнение с последовательными<br />
алгоритмическими процедурами<br />
и формулируются направления использования выявленных<br />
закономерностей в прикладных задачах.<br />
1. Гносеологический аспект<br />
Рассматриваемый предмет имеет глубокие корни<br />
в природе человеческого <strong>интеллект</strong>а. Эффективная<br />
человеческая деятельность характеризуется,<br />
в частности:<br />
– ограниченным (не слишком большим) количеством<br />
одновременно выполняемых (отслеживаемых)<br />
заданий (процессов, объектов, дел, работ);<br />
– правильным определением приоритетности<br />
(важности, последовательности) выполнения заданий.<br />
Деятельность с избыточным числом выполняемых<br />
заданий, или с плохо организованной приоритетностью,<br />
как правило, малоэффективна. Данные<br />
аспекты базируются на ограниченности ресурсов<br />
реализации человеческого <strong>интеллект</strong>а. Факт, известный<br />
в психологии [6]: средний человек способен<br />
эффективно взаимодействовать (удерживать<br />
в памяти, отслеживать изменения, мысленно<br />
оперировать) одновременно не более, чем с 5–7<br />
объектами (предметами, понятиями, блоками информации).<br />
Данная закономерность обусловлена<br />
ограниченным числом информационных каналов<br />
взаимодействия с объектами, а также ограниченными<br />
ресурсами параллельной обработки информации<br />
(мыслительной деятельности) по планированию<br />
выполнения действий с надлежащей<br />
приоритетностью.<br />
Данная особенность человеческого <strong>интеллект</strong>а<br />
имеет отношение к компьютерной технике<br />
и информационным технологиям в следующем<br />
аспекте. Практика развития компьютерных си-<br />
119
Мохамад Али, О.Ф. Михаль<br />
стем (hardware и software, включая ИИ) такова, что<br />
явно или неявно — мерилом прогресса в этой области<br />
является степень соответствия человеческому<br />
<strong>интеллект</strong>у. Данное положение соответствует,<br />
в частности, известному тесту Тюринга [7]. Исходя<br />
из этого, при разработке ВС целесообразно<br />
изучать «прототип» (hardware – человеческий мозг<br />
и software – человеческую психику) и следовать<br />
тенденциям, предначертанным в этой «уже разработанной»<br />
«эталонной» и «априорно совершенной»<br />
системе, являющейся «технической базой»,<br />
на которой реализован человеческий <strong>интеллект</strong>.<br />
Известно, что «прототип» «аппаратно реализован»<br />
на естественных (живых) нейронных сетях (НС).<br />
Основной особенностью обработки информации<br />
на НС и ключевым преимуществом НС является<br />
параллельность. Параллельность реализуема в настоящее<br />
время преимущественно на многопроцессорных<br />
и многоядерных вычислительных структурах,<br />
а также в виде распределённых (локально- и<br />
глобально-сетевых) ВС. Аппаратная база искусственных<br />
НС развита в настоящее время в существенно<br />
меньшей степени. Исходя из этого, наряду<br />
с развитием аппаратных искусственных НС,<br />
целесообразны исследования и разработки в области<br />
алгоритмов, поддерживающих параллельную<br />
обработку информации на имеющихся наиболее<br />
развитых на настоящий момент типах аппаратного<br />
обеспечения. Перспективны ЛП алгоритмы, которыми<br />
распараллеливание обработки информации<br />
может быть реализовано на ВС последовательного<br />
действия (работающих в рамках концепции Фон-<br />
Неймана), то есть на компьютерах общего назначения.<br />
Таким образом, с использованием принципа<br />
ЛП параллельные вычисления претерпевают некоторое<br />
качественное изменение. Соответственно,<br />
требуют пересмотра в рамках концепции ЛП также<br />
и классические процедуры сортировки данных [8].<br />
2. Основные определения<br />
Будем рассматривать набор данных А как множество,<br />
состоящее из элементов:<br />
A: (a1 , a2 , a3 ,…, ai-1 , ai , ai+1 ,…, an-2 , an-1 , an ). (1)<br />
Каждое из данных, соответствующее a i , ∈ A,<br />
i ∈ (1, 2,…., n), – объект произвольной природы:<br />
число, фрагмент текста, запись в БД, картинка,<br />
фрейм и др. При этом элементы множества A могут<br />
быть самими объектами набора данных, либо<br />
указателями на них, позволяющими взаимнооднозначно<br />
соотносить a i , ∈ A и соответствующий<br />
объект. В первом случае операции, производимые<br />
над объектами множества A, связаны с перемещением<br />
самих объектов (данных) в памяти, во втором<br />
– объекты непосредственно не перемещаются, а<br />
операции над ними сводятся к работе с указателями.<br />
С точки зрения рассматриваемых далее алго-<br />
120<br />
ритмов ЛП сортировки данное различие не существенно.<br />
Термин «ограниченный» предполагает конечное<br />
число n элементов, неизменное в процессе<br />
сортировки; термин «малый» – количество<br />
элементов, при котором не требуется использование<br />
видов (типов) памяти, существенно замедляющих<br />
информационный обмен в процессе выполнения<br />
сортировки. Разумеется, интерпретация термина<br />
«малый» может быть уточнена с учётом конкретной<br />
архитектуры ВС.<br />
Отношение порядка (наличие упорядоченности)<br />
на множестве A предполагает указание для некоторых<br />
элементов a i , a j ∈ A, i, j ∈ (1, 2, 3,…, n), i ≠ j,<br />
одного из следующих соотношений: a i ≺ a j , a i a j .<br />
Символы «≺ » и « » есть отношения следования:<br />
«предшествует» и «следует за». В частности они<br />
могут интерпретироваться как арифметические<br />
соотношения между числами – бинарные отношения<br />
«меньше» (). При этом интерпретацией<br />
арифметического соотношения a i = a j<br />
может быть «произвольное следование»: справедливо<br />
любое из отношений следования a i ≺ a j , или<br />
a i a j .<br />
Множество А является упорядоченным, если отношение<br />
порядка определено для любых a i , a j ∈ A.<br />
Множество А является частично упорядоченным,<br />
если отношение порядка определено только для<br />
некоторых из пар a i , a j ∈ A. Элементы, для которых<br />
отношения порядка не определены, являются несоизмеримыми.<br />
Множество является неупорядоченным,<br />
если ни для одной пары элементов не определено<br />
отношение порядка.<br />
Будем различать множество как совокупность<br />
элементов (1) и последовательность элементов<br />
множества как выборку некоторых элементов<br />
множества с учётом порядка их размещения. Для<br />
упорядоченной последовательности, включающей<br />
все элементы множества А (1), в арифметической<br />
интерпретации с учётом замечания о соотношении<br />
a i = a j справедливо одно из выражений:<br />
a 1 ≤ a 2 ≤ a 3 ≤…≤ a i-1 ≤ a i ≤ a i+1 ≤…≤ a n-2 ≤ a n-1 ≤ a n ; (2)<br />
a 1 ≥ a 2 ≥ a 3 ≥…≥ a i-1 ≥ a i ≥ a i+1 ≥…≥ a n-2 ≥ a n-1 ≥ a n . (3)<br />
Последовательность является упорядоченной по<br />
возрастанию (2) (соответственно, по убыванию (3)<br />
), если для любой пары её элементов справедливо<br />
a i ≤ a j (соответственно, a i ≥ a j ), где i, j ∈ (1, 2, 3,…, n),<br />
i < j. Если хотя бы для одной пары элементов условие<br />
a i ≤ a j (a i ≥ a j ) не выполняется, последовательность<br />
не является упорядоченной по возрастанию<br />
(убыванию), то есть является неупорядоченной по<br />
возрастанию (неупорядоченной по убыванию). Таким<br />
образом, последовательность, упорядоченная по<br />
возрастанию, является неупорядоченной по убыванию;<br />
последовательность, упорядоченная по
убыванию, является неупорядоченной по возрастанию.<br />
То есть упорядоченности по возрастанию<br />
и убыванию взаимно-обратно являются неупорядоченностями.<br />
Данные и подобные представления<br />
(упорядочение, разупорядочение или переупорядочение)<br />
продуктивны применительно к задачам<br />
сортировки ограниченных малых наборов элементов.<br />
Множество может быть изначально разупорядоченным.<br />
Процесс упорядочения – переход<br />
от одной последовательности (расстановки) элементов<br />
к другой. Может быть введена мера разупорядоченности<br />
множества как число перестановок<br />
соседних элементов, которое необходимо произвести<br />
чтобы прийти к упорядоченной последовательности<br />
элементов.<br />
3. Упорядочение элементов<br />
С учётом введенного понятия меры разупорядоченности,<br />
может быть показано, что множества,<br />
упорядоченные по возрастанию и убыванию, взаимно<br />
максимально разупорядочены по отношению<br />
друг к другу. В частности, для данного множества<br />
число перестановок в парах соседствующих<br />
элементов является максимальным при переупорядочении<br />
множества из упорядоченности по возрастанию<br />
в упорядоченность по убыванию, или<br />
наоборот: (2) → (3) или (3) → (2)<br />
Графы, представленные на рис. 1 а, б иллюстрируют<br />
сказанное для множеств из трёх и четырёх<br />
разных элементов. Термин «разный» понимается в<br />
значении ai , ≠ aj ; ai , aj ∈ A; i, j ∈ (1, 2, 3,…, n); i ≠ j.<br />
а<br />
б<br />
Рис. 1. Структуры частично упорядоченных множеств<br />
перестановок трёхэлементной (а) и четырёхэлементной<br />
(б) последовательностей.<br />
При рассмотрении цепочек перестановок необходимо<br />
исключить циклы, ограничившись только<br />
продуктивными перестановками. Графы рис. 1 а, б<br />
позволяют проследить различные варианты таких<br />
цепочек, поскольку охватывают все возможные<br />
варианты связей по перестановкам в парах соседствующих<br />
элементов. Так, для 4-элементной последовательности<br />
(рис. 1 б) одна из цепочек преобразования<br />
(1, 2, 3, 4) → (4, 3, 2, 1) имеет следующий<br />
вид:<br />
ЛОКАЛЬНО-ПАрАЛЛЕЛЬНАЯ СОрТИрОВКА ОГрАНИЧЕННЫх МАЛЫх НАБОрОВ ДАННЫх<br />
(1, 2, 3, 4) → (2, 1, 3, 4) →<br />
→ (2, 1, 4, 3) → (2, 4, 1, 3) →<br />
→ (4, 2, 1, 3) → (4, 2, 3, 1) →<br />
→ (4, 3, 2, 1)<br />
В (4) любые две соседние последовательности, разделённые<br />
знаком « → », различаются перестановкой<br />
местами одной (обозначенной) пары двух соседних<br />
элементов (цифр). Другая соседствующая пара, если<br />
она имеется и может быть переставлена, тем не менее<br />
остаётся незадействованной, поскольку процедура<br />
сортировки – последовательная. В результате,<br />
(1, 2, 3, 4) → (4, 3, 2, 1) реализуется за 6 шагов. Эта<br />
ситуация имеет место не только для (4), но и для<br />
любых вариантов цепочек перестановки элементов,<br />
что может быть прослежено непосредственно по<br />
графу (рис. 1 б), на котором имеется 7 вертикальных<br />
столбцов расположения 4-элементных последовательностей,<br />
различающихся перестановкой одной<br />
пары элементов.<br />
В отличие от последовательной процедуры сортировки,<br />
ЛП процедура поддерживает обмен<br />
местами сразу нескольких (всех имеющихся) пар<br />
соседствующих элементов последовательности.<br />
Вследствие этого, как будет показано далее, число<br />
переходов « → » в процедуре сортировки может<br />
быть существенно сокращено.<br />
4. Локальная параллельность<br />
ЛП обработка информации на процессорах<br />
общего назначения допускает широкий круг приложений.<br />
Принцип ЛП обработки информации<br />
может быть проиллюстрирован на следующем вычислительным<br />
примером. Имеется n выражений<br />
ci = ai + bi ; i = 1, 2,..., n. Значения ai и bi заданы.<br />
Требуется найти значения ci . Если используется<br />
ВС с одним процессором, задача разрешима за 4n<br />
шагов: загрузить ai , загрузить bi , произвести суммирование,<br />
выгрузить результат ci. Если ai и bi положительные,<br />
имеют ограниченное число разрядов<br />
и если в результате сложении разрядность не нарушается<br />
(числа ai , bi и ci имеют одинаковую разрядность),<br />
исходные данные могут быть представлены<br />
в виде:<br />
A = a1 ⊕ a2 ⊕ ... ⊕ ai ⊕ ... ⊕ an ;<br />
(4)<br />
B = b 1 ⊕ b 2 ⊕ ... ⊕ b i ⊕ ... ⊕ b n , (5)<br />
где символом ⊕ обозначена конкатенация. Если<br />
разрядность результата превышает разрядность<br />
слагаемых для переноса избыточного разряда при<br />
суммировании в формате представления данных<br />
требуется предусмотреть разделительные нули.<br />
В обоих случаях результат C = A + B может быть<br />
интерпретирован как конкатенация аналогично<br />
(5), в которой сегменты – числа c i – соответствуют<br />
121
Мохамад Али, О.Ф. Михаль<br />
по формату a i и b i . При этом весь набор значений c i<br />
может быть получен за 4 шага. Здесь n-кратный выигрыш<br />
достигнут без учёта «окаймляющих» операций<br />
конкатенации-деконкатенации, предназначенных<br />
для формирования A и B и извлечения результатов c i<br />
из C. Если в реальном случае вычислительный блок<br />
достаточно сложный и включает последовательное<br />
применение нескольких разнообразных операций<br />
без промежуточных конкатенаций-деконкатенаций,<br />
выигрыш может быть значительным. Выигрыш<br />
растёт с ростом разрядности процессора и с сокращением<br />
размеров конкатенируемых сегментов. При<br />
этом снижается точность представления данных<br />
(система «загрубляется»), что в ряде конкретных<br />
приложений бывает допустимо.<br />
Рост разрядности процессоров является долговременной<br />
устойчивой тенденцией развития процессорной<br />
техники. Известный закон Мура об<br />
удвоении числа транзисторов на кристалле на<br />
практике означает удвоение разрядности регистров<br />
процессора. Разрядность регистров, как известно,<br />
это объём непосредственно адресуемой<br />
оперативной памяти, т.е. допустимая размерность<br />
задач, разрешимых в данном ВС за приемлемое<br />
время. Поэтому разрядность вероятно, будет наращиваться<br />
и в дальнейшем, поскольку при этом<br />
стимулируется появление новых вычислительных<br />
задач, которые в свою очередь стимулируют рост<br />
требований к техническим характеристикам вновь<br />
разрабатываемых ВС. Данная «обратная связь» исправно<br />
работает на протяжении всей истории развития<br />
ВС и нет причин предполагать отход от данной<br />
тенденции. Соответственно, есть основания<br />
прогнозировать рост эффективности (производительности)<br />
применения ЛП алгоритмов за счёт<br />
увеличения числа конкатенируемых сегментов.<br />
5. ЛП сортировка<br />
Проиллюстрируем работу алгоритма ЛП сортировки<br />
ОМНД следующим образом. Пусть имеется<br />
множество элементов, на котором определено отношение<br />
порядка:<br />
A: {a 1 , a 2 , a 3 , a 4 ,…, a n }; a 1 > a 2 > a 3 > a 4 >…> a n . (6)<br />
Пусть из элементов множества А составлена<br />
разупорядоченная последовательность:<br />
122<br />
B: (b n , b (n-1) ,…, b 2 , b 1 ), b i = a j , i,j∈{1, 2,…, n},<br />
∃ (i, j): i ≠ j. (7)<br />
В частности, в максимально разупорядоченном<br />
случае (7) может быть обратно упорядоченным набором<br />
элементов из (6): B: (a n a n-1 , a n-2 , a n-3 , a n-4 ,…,<br />
a 3 , a 2 , a 1 ).<br />
Требуется упорядочить последовательность (7)<br />
в порядке убывания величины элементов от младшего<br />
(правого) к старшему (левому), т.е. привести<br />
к упорядочению согласно (6).<br />
Производим конкатенацию (5) элементов b i согласно<br />
их расположению в последовательности (7).<br />
Далее в вербальном описании ЛП процедура сортировки<br />
включает следующие 4 шага.<br />
Шаг 1. Скопировать текущее В для последующего<br />
сравнения: B 1 =B.<br />
Шаг 2. Сравнить попарно нечётные элементы B<br />
с чётными, стоящими слева от них. В каждой сравниваемой<br />
паре больший из элементов поставить на<br />
нечётное место, а меньший – на чётное.<br />
Шаг 3. Сравнить попарно чётные элементы B с<br />
нечётными, стоящими слева от них. В каждой сравниваемой<br />
паре больший из элементов поставить на<br />
чётное место, а меньший – на нечётное.<br />
Шаг 4. Сравнить В и В 1 . Если B 1 =B, ЛП процедура<br />
сортировки закончена. Результат содержится<br />
в В. Если B 1 ≠ B – перейти к Шагу.1.<br />
Процедура иллюстрируется рисунком 2. Разделение<br />
сегментов на чётные и нечётные организовано<br />
посредством пары регистров R1 и R2. Заштрихованы<br />
фрагменты регистров, в которых расположены<br />
информационные сегменты. Разделение (прореживание)<br />
конкатенации вида (4) на четный (R2) и<br />
нечётный (R1) регистры программно реализуется<br />
применением процедуры побитового «И» с использованием<br />
пары битовых полумасок вида:<br />
E1:{…(11…1)(00…0)(11…1)(00…0)(11…1)};<br />
E2:{…(00…0)(11…1)(00…0)(11…1)(00…0)}. (8)<br />
Сегменты, соответствующие конкатенированным<br />
данным в (5), выделены в (8) круглыми скобками.<br />
Рис. 2. Работа ЛП алгоритма сортировки<br />
Регистры последовательно совмещаются для сопоставления<br />
(Шаги 2 и 3) применением регистровых<br />
сдвигов на число бит, равное длине сегмента.<br />
Посегментное сопоставление показано двунаправленными<br />
прозрачными стрелками. Однонаправленные<br />
прозрачные стрелки показывают общее
прохождение ЛП процедуры по Шагам 1 – 4. Загрузка<br />
исходных данных и вывод результата обозначены<br />
in и out.<br />
6. Чередование обменов<br />
Основные черты ЛП сортировки ОМНД согласно<br />
алгоритму (рис. 2) могут быть прослежены на<br />
примере пересортировки набора из 8 элементов:<br />
(7, 6, 5, 4, 3, 2, 1, 0) → (0, 1, 2, 3, 4, 5, 6, 7). (9)<br />
Соответствующая процедура представлен на<br />
рис. 3.<br />
Существенным (и тривиальным) ограничением<br />
при выполнении обычной (не ЛП) процедуры<br />
сортировки является последовательный характер<br />
выполнения действий. Как отмечалось, в каждом<br />
акте сопоставления рассматривается исключительно<br />
одна пара соседствующих элементов (a i , a i+1 ).<br />
Предшествующие (a 1 , a 2 ), (a 2 , a 3 ),…, (a i-1 , a i ) и последующие<br />
(a i+1 , a i+2 ), (a i+2 , a i+3 ),…, (a n-1 , a n ) пары<br />
остаются вне рассмотрения. Таким образом проделывается<br />
n-1 однократных операций сопоставления.<br />
При этом, когда одна пара сопоставляется,<br />
n-2 не задействованы. Введением ЛП обработки<br />
эффективность существенно повышается: параллельно<br />
проводится ещё до (n/2)-1 сопоставлений.<br />
Нумерация шагов процесса дана в левой колонке.<br />
Нижняя строка – результат сортировки, полученный<br />
после ЛП операций обмена в предпоследней<br />
строке.<br />
Строками двунаправленных стрелок над соответствующими<br />
нумерованными строками обозначены<br />
ЛП операции обмена между сегментами.<br />
Каждая строка стрелок есть одна ЛП операция.<br />
Как показано, инвертирование последовательности<br />
реализуется за n шагов. В примере (рис. 3) в<br />
нечётных шагах процесса осуществляется обмен<br />
между чётными и нечётными сегментами (чётный<br />
сегмент стоит слева от нечётного), а в чётных строках<br />
– обмен между нечётными и чётными сегментами<br />
(чётный сегмент стоит справа от нечётного).<br />
1) 7 6 5 4 3 2 1 0<br />
2) 6 7 4 5 2 3 0 1<br />
3) 6 4 7 2 5 0 3 1<br />
4) 4 6 2 7 0 5 1 3<br />
5) 4 2 6 0 7 1 5 3<br />
6) 2 4 0 6 1 7 3 5<br />
7) 2 0 4 1 6 3 7 5<br />
8) 0 2 1 4 3 6 5 7<br />
0 1 2 3 4 5 6 7<br />
Рис. 3. ЛП сортировка<br />
последовательности из 8 элементов<br />
ЛОКАЛЬНО-ПАрАЛЛЕЛЬНАЯ СОрТИрОВКА ОГрАНИЧЕННЫх МАЛЫх НАБОрОВ ДАННЫх<br />
В примере (рис. 3) ЛП сортировка начата со<br />
строки обменов «чётный–нечётный». Возможен<br />
также другой порядок: начало сортировки со строки<br />
«нечётный–чётный». При изменении порядка<br />
чередования обменов общее число шагов сортировки<br />
не изменяется: полная ЛП пересортировка<br />
4 элементов (1, 2, 3, 4) → (4, 3, 2, 1) реализуется за<br />
равное число шагов.<br />
1) 1 2 3 4 1 2 3 4<br />
2) 2 1 4 3 1 3 2 4<br />
3) 2 4 1 3 3 1 4 2<br />
4) 4 2 3 1 3 4 1 2<br />
4 3 2 1 4 3 2 1<br />
а б<br />
Рис. 4. ЛП сортировка последовательности<br />
из 4 элементов в двух вариантах: начиная<br />
с «чётный–нечётный» (а) и «нечётный–чётный» (б)<br />
Результат сортировки также остаётся прежним,<br />
поскольку изменение касается только фаз сортировки<br />
по чередованию чётностей.<br />
Пример (рис. 4) соответствует графу на рис. 1 б.<br />
При этом ЛП алгоритм преобразования (1, 2, 3, 4)<br />
→ (4, 3, 2, 1) реализует пару цепочек (10, 11) типа<br />
(4), но с сокращённым числа промежуточных состояний:<br />
(1, 2, 3, 4) → (2, 1, 4, 3) → (2, 4, 1, 3) →<br />
→ (4, 2, 3, 1) → (4, 3, 2, 1) (10)<br />
(1, 2, 3, 4) → (1, 3, 2, 4) → (3, 1, 4, 2) →<br />
→ (3, 4, 1, 2) → (4, 3, 2, 1). (11)<br />
Выражение (10) соответствует рис. 4 а – ЛП сортировка<br />
начинается с сопоставления «чётный–<br />
нечётный»; выражение (11) – рис. 4 б – начало<br />
сортировки с «нечётный–чётный». На графе рис.<br />
1 б элементы (10) (кроме исходного и конечного)<br />
выделена жирным пунктиров, элементы (11)<br />
– мелким пунктиром. Сопоставление рис. 4 а, б с<br />
графом рис. 1 б позволяет видеть, каким образом<br />
реализуется выигрыш в производительности ЛП<br />
сортировки по сравнению с традиционной последовательной.<br />
7. Обсуждение результатов<br />
Граф (рис. 1 а) демонстрирует симметрию различных<br />
вариантов сортировки. Различные виды<br />
последовательностей из 3 элементов расположены<br />
в вершинах 6-угольника. Каждая вершина соединена<br />
с двумя другими, потому что связь соответствует<br />
обмену местами в паре соседствующих элементов,<br />
а у последовательности из трёх элементов имеется<br />
ровно 2 варианта пар обмена. Изменение порядка<br />
123
Мохамад Али, О.Ф. Михаль<br />
элементов на обратный реализуется за 3 шага не<br />
только для (1, 2, 3) → (3, 2, 1), но и для любых пар<br />
последовательностей (вершин графа) с взаимноинверсным<br />
расположением символов. Легко видеть,<br />
что на графе соответствующие парные вершины<br />
в 6-угольнике расположены диагонально.<br />
Аналогично, граф (рис. 1 б) также демонстрирует<br />
симметрию. Каждая из вершин графа соединена<br />
с тремя другими, так как у последовательности<br />
из 4 элементов имеется три пары соседствующих<br />
элементов, что соответствует трём вариантам обмена.<br />
Изменение порядка элементов на обратный<br />
реализуется за 6 шагов не только для (1, 2, 3, 4)<br />
→ (4, 3, 2, 1), но и для любых пар последовательностей<br />
(вершин графа) со взаимно-инверсным<br />
расположением символов. Это может быть непосредственно<br />
прослежено на графе. Изображение<br />
графа (рис. 1 б) укрупнено, имеет очертания<br />
ромба. Вершины графа, расположенные по левой<br />
верхней стороне ромба, в последовательности слева<br />
направо (т.е. (1, 2, 3, 4), (2, 1, 3, 4), (2, 3, 1, 4),<br />
(2, 3, 4, 1) ) взаимно-инверсны вершинам графа,<br />
расположенным по правой нижней стороне ромба,<br />
в последовательности справа налево (т.е. (4, 3, 2, 1),<br />
(4, 3, 1, 2), (4, 1, 3, 2), (1, 4, 3, 2) ). Аналогично,<br />
взаимно-инверсны вершины расположенные по<br />
правой верхней и левой нижней сторонам ромба.<br />
Граф (рис. 1 б) – непланарный. При других его<br />
начертаниях (начиная, например, с изменения порядка<br />
расположения вершин второго слева столбца)<br />
другие его вершины будут «выведены» на стороны<br />
ромба. При этом в силу симметрии (каждая<br />
вершина соединена ровно с тремя другими) сохраняется<br />
взаимно-инверсное расположение вершин.<br />
Между взаимно-инверсными вершинами непосредственно<br />
и наглядно может быть прослежена на<br />
графе цепочки длиной ровно 6 шагов.<br />
Описанная ситуация не является неожиданной,<br />
поскольку сводится к циклической замене символов<br />
или может рассматриваться как перекодировка<br />
записи выражений (1, 2, 3) → (3, 2, 1) и (1, 2, 3, 4)<br />
→ (4, 3, 2, 1) и соответствующая замена символов в<br />
графах (рис. 1).<br />
Таким образом, рассмотренное выше ЛП преобразование<br />
(1, 2, 3, 4) → (4, 3, 2, 1), проиллюстрированное<br />
графом (рис. 1 б) является достаточно<br />
общим, справедливым для любых пар взаимноинверсных<br />
вершин.<br />
В алгебраическом смысле рассматриваемые последовательности<br />
образуют конечные группы относительно<br />
операции перестановки пары элементов.<br />
В связи с этим представленные особенности,<br />
касающиеся симметрии в преобразованиях последовательностей,<br />
являются отражением теоретикогрупповых<br />
свойств.<br />
Работа ЛП процедуры сортировки (рис. 2) смоделирована<br />
в варианте с 8 3-битовыми сегментами.<br />
124<br />
Заполнение сегментов выполнено наборами чисел<br />
(0, 1, 2, 3, …, 7) со случайной перестановкой от генератора<br />
случайных чисел с равномерным законом<br />
распределения. Модель реализована на <strong>язык</strong>е Python<br />
и демонстрирует работоспособность алгоритма.<br />
8. Перспективы использования<br />
Сортировка данных – классическая задача, исчерпывающе<br />
разработанная для ВС последовательного<br />
типа. С применением элементов параллельной<br />
обработки сортировка приобретает новые<br />
очертания. В случае ЛП целесообразна работа с<br />
ограниченными наборами данных. При этом скорость<br />
выполнения сортировки возрастает пропорционально<br />
числу конкатенированных сегментов,<br />
вследствие чего она может быть использована в<br />
приложениях с быстрым принятием оперативных<br />
решений. Применительно к ситуациям типа систем<br />
массового обслуживания, наряду с дисциплинами<br />
выборки заданий из очередей fIfO и fILO, получает<br />
право на существование очередь с заданиями,<br />
последовательность (очерёдность, важность, актуальность,<br />
срочность) выполнения которых изменяется<br />
в процессе нахождения заданий в очереди.<br />
Одним из приложений для подобных систем является<br />
Интернет: распределённая система хранения<br />
информации с децентрализованным управлением<br />
и мультиагентной обработкой. Другая важная прикладная<br />
область – интерфейс взаимодействия ВС с<br />
оператором, в частности, обучающие системы.<br />
Выводы<br />
Локально-параллельное представление информации<br />
обеспечивает повышенную эффективность<br />
работы программного обеспечения. Принципы<br />
локально-параллельной обработки применимы<br />
к задачам сортировки наборов данных. Процедуры<br />
сортировки рассмотрены на комбинаторном<br />
уровне для 3-, 4- и 8-элементных последовательностей.<br />
Разработано алгоритмическое обеспечение<br />
локально-параллельной сортировки. В ходе<br />
моделирования, проведенного на <strong>язык</strong>е Python,<br />
выявлено, что локально-параллельный алгоритм<br />
максимально эффективен применительно к сортировке<br />
малых (в пределах разрядности процессора)<br />
выборок.<br />
Список литературы: 1. Мохамад, Али Перспективы реализации<br />
локально-параллельных вычислений на многоядерных<br />
процессорах [Текст] / Мохамад Али, О.Ф. Михаль //<br />
Радиоэлектронные и компьютерные системы. – 2008.<br />
– <strong>№</strong> 6 (33). – С. 234–237. 2. Мохамад, Али. Локальнопараллельная<br />
сортировка данных с ограниченной<br />
разрядностью [Текст] / Мохамад Али. // Материалы<br />
международной научно-практической конференции<br />
студентов и аспирантов “Информационные технологии<br />
в экономике и образовании”. – М.: Российский университет<br />
кооперации, 2008. – С. 48–52. 3. Мохаммед, Али
Локально-параллельная сортировка со встречной чередующейся<br />
упорядоченностью данных [Текст] / Мохамед<br />
Али, О.Ф. Михаль // Материалы 13-го международного<br />
молодёжного форума “Радиоэлектроника и молодёжь<br />
в ХХI веке”. Ч.2. – Харьков: ХНУРЭ, 2009. – С. 209.<br />
4. Михаль, О.Ф. Локально-параллельные алгоритмы<br />
определения степени включения и степени равенства<br />
нечетких множеств [Текст] / О.Ф. Михаль // Проблемы<br />
бионики. – Вып. 55. – 2001. – С. 80–90. 5. Михаль, О.Ф.<br />
Принципы организации систем нечеткого регулирования<br />
на однородных локально-параллельных алгоритмах<br />
[Текст] / О.Ф. Михаль, О.Г. Руденко // Управляющие системы<br />
и машины. – 2001. – <strong>№</strong> 3. – С. 3-10. 6. Милнер, П.<br />
Физиологическая психология [Текст] / П. Милнер М.:<br />
Мир, 1973. – 648 с. 7. Люггер, Дж.Ф. Искусственный<br />
<strong>интеллект</strong>: стратегии и методы решения сложных проблем<br />
[Текст] / Дж.Ф. Люгер 4-е изд.: Пер. с англ. – М.: Изд. дом<br />
«Вильямс», 2005. – 864 с. 8. Кормен, Т. Алгоритмы: построение<br />
и анализ [Текст] / Т. Кормен, Ч. Лейзерсон, Р. Ривест<br />
М.: МЦНМО, 2001. – 960 с.<br />
Поступила в редколлегию 28.09.<strong>2011</strong><br />
ЛОКАЛЬНО-ПАрАЛЛЕЛЬНАЯ СОрТИрОВКА ОГрАНИЧЕННЫх МАЛЫх НАБОрОВ ДАННЫх<br />
УДК 519.87<br />
Локально-паралельне сортування обмежених малих<br />
наборів даних / Мохамад Алі, О.П. Міхаль // Біоніка інтелекту:<br />
наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 119-125.<br />
Розглянуто локально-паралельне подання інформації<br />
стосовно задач сортування наборів даних. Процедури сортування<br />
проаналізовано на комбінаторному рівні для 3-,<br />
4- и 8-елементних послідовностей. Подано алгоритмічне<br />
забеспечення локально-паралельного сортування. В ході<br />
моделюровання на мові Python виявлено, що локальнопаралельний<br />
алгоритм максимально эфективний стосовно<br />
до сортування виборок в межах разрядности процесора.<br />
Іл. 4. Бібліогр.: 8 найм.<br />
UDK 519.87<br />
Local-parallel sorting of limited small sets of data / Mohamad<br />
Ali, O.Ph. Mikhal // Bionics of Intelligense: Sci. Mag.<br />
– <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 119-125.<br />
Local-parallel presentation of information is considered<br />
referring to problem of the sorted data sets. The Procedures<br />
of the sorting is analysed on combinatorial level for 3-, 4- and<br />
8-element sequences. Algorithmic provision of local-parallel<br />
sorting is presented. In the course of modeling in language<br />
Python is revealled that local-parallel algorithm is greatly efficient<br />
with reference to sorting the samples within processor<br />
register size.<br />
fig. 4. Ref.: 8 items.<br />
125
информационные Технологии и Программно-Технические комПлексы<br />
УДК 004.93<br />
126<br />
Введение<br />
В настоящее время экспертные системы, основанные<br />
на лингвистических правилах [1], успешно<br />
применяются в различных прикладных областях,<br />
таких как медицинская и техническая диагностика,<br />
финансовый менеджмент, распознавание образов,<br />
геологическая разведка, управление компьютерными<br />
сетями, управление технологическими<br />
процессами, анализ веб-контента в Интернет и др.<br />
Широкое применение таких систем обусловлено в<br />
первую очередь тем, что они являются прозрачными<br />
и относительно дешёвыми в реализации.<br />
Поскольку базы правил в экспертных системах<br />
часто характеризуются большим объёмом, актуальной<br />
является задача индукции правил, суть которой<br />
заключается в том, что на основе начального<br />
набора правил необходимо сформировать новую<br />
базу правил меньшего объёма, которая в достаточной<br />
мере представляла бы начальную базу правил<br />
и была бы менее избыточной.<br />
Существуют различные методы индукции правил<br />
[2], однако эти методы при обработке правил<br />
анализируют их качество по отдельности, не рассматривая<br />
и не учитывая качество всей базы в целом,<br />
что приводит к получению неоптимальных<br />
баз нечётких правил. Поэтому актуальной является<br />
разработка новых методов индукции правил, которые<br />
учитывали бы качество всей базы знаний, а не<br />
только отдельных правил. Для решения данной задачи<br />
предлагается создавать деревья решений [3–<br />
5], которые после их построения переводились бы<br />
в лингвистические правила. Выбор деревьев решений<br />
обосновывается их возможностью выявлять<br />
ненаблюдаемые связи внутри рассматриваемых<br />
объектов, процессов и систем.<br />
Целью данной работы является разработка метода<br />
индукции лингвистических правил с использованием<br />
математического аппарата деревьев решений.<br />
Для достижения поставленной цели необходимо<br />
решить следующие задачи:<br />
– обзор математического аппарата деревьев решений;<br />
Е. А. Гофман 1 , А. А. Олейник 2 , С. А. Субботин 3<br />
1 Запорожский национальный технический университет, г. Запорожье,<br />
Украина, gofman_jenek@rambler.ru;<br />
2 Запорожский национальный технический университет, г. Запорожье,<br />
Украина, olejnikaa@gmail.com;<br />
3 Запорожский национальный технический университет, г. Запорожье, Украина, subbotin@zntu.edu.ua<br />
ИНДУКЦИЯ ЛИНГВИСТИЧЕСКИХ ПРАВИЛ С ИСПОЛЬЗОВАНИЕМ<br />
ДЕРЕВЬЕВ РЕШЕНИЙ<br />
Рассматривается задача индукции лингвистических правил. Разработан метод идентификации деревьев<br />
решений для индукции лингвистических правил. Создано программное обеспечение на основе<br />
предложенного метода.<br />
ДЕРЕВО РЕШЕНИЙ, ИДЕНТИФИКАЦИЯ, ИНДУКЦИЯ ПРАВИЛ, ЛИНГВИСТИЧЕСКОЕ<br />
ПРАВИЛО, ОБУЧАЮщАЯ ВЫБОРКА<br />
– приведение основных этапов идентификации<br />
деревьев решений в соответствие с решаемой задачей;<br />
– создание правил преобразования деревьев решений<br />
в лингвистические правила;<br />
– сравнение разработанного подхода с существующими<br />
методами индукции лингвистических<br />
правил.<br />
1. Постановка задачи<br />
Пусть задана база лингвистических правил<br />
RB R R R RN<br />
1 2<br />
= { , ..., } , описывающая объекты обучающей<br />
выборки O O O O N<br />
1 2<br />
= { , ,..., } . Тогда на<br />
основе обучающей выборки объектов O требуется<br />
сформировать такую базу лингвистических правил<br />
RB R R R RN<br />
1 2<br />
*<br />
* = { , ,..., } , RN *
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 126–130 хНурэ<br />
Для применения деревьев решений на практике<br />
в целях классификации или прогнозирования<br />
значений выходных параметров исследуемых объектов<br />
по наборам значений входных характеристик<br />
необходимо с помощью данных обучающей<br />
выборки сформировать дерево решений таким образом,<br />
чтобы оно наилучшим образом описывало<br />
исследуемый объект.<br />
Построение деревьев решений связано с извлечением<br />
правил из обучающих выборок. Каждый<br />
путь от корня дерева к одному из его листьев может<br />
быть преобразован к логическому высказыванию<br />
– правилу типа «если А, то В», где его антецедент<br />
получается путем использования всех условий,<br />
представленных во внутренних узлах от корня к<br />
выходному листу, а правая часть правила получается<br />
из соответствующего листа дерева.<br />
Процесс построения дерева решений, как правило,<br />
содержит такие этапы: разрастание, ветвление,<br />
вычисление значения выходного параметра<br />
для листа, сокращение.<br />
В результате этапа разрастания (увеличения,<br />
growing) некоторая вершина заменяется поддеревом,<br />
полученным путем ветвления этой вершины.<br />
На данном этапе происходит разделение выбранной<br />
вершины на несколько новых (в случае дихотомического<br />
дерева вершина разбивается на две<br />
новых). При этом перебираются все признаки и<br />
все возможные варианты ветвления по каждому из<br />
признаков. В результате остается вариант разбиения,<br />
при котором значение критерия качества разбиения<br />
является наилучшим. Если новые вершины<br />
являются перспективными для последующего<br />
разделения (критерии завершения разрастания не<br />
удовлетворены), то выполняется их ветвление. В<br />
случае невозможности дальнейшего разделения<br />
вершины она становится листом, и для нее выполняется<br />
процедура вычисления значения выходного<br />
параметра. Если ветвление вершины приводит<br />
к ухудшению качества дерева, то вершина также<br />
объявляется листом.<br />
Процедура ветвления (разделения, splitting)<br />
дерева вызывается рекурсивно при выполнении<br />
этапа разрастания. Ветвление подразумевает создание<br />
для выбранной вершины заданного количества<br />
(для дихотомических деревьев – две) вершинпотомков.<br />
Вычисление значения выходного параметра<br />
происходит путем передвижения по синтезированному<br />
дереву решений от корневого узла к листу в<br />
зависимости от значений входных параметров.<br />
Этап сокращения (усечение, обрезка, pruning)<br />
используется для упрощения построенного дерева<br />
путем отсечения потомков у выбранной вершины,<br />
которая впоследствии становится листом с определенным<br />
значением. Усечение узла выполняется<br />
в случае, если оно не приведет к существенному<br />
ухудшению аппроксимационных и обобщающих<br />
характеристик дерева решений.<br />
Таким образом, этап усечения дерева выполняется<br />
снизу вверх: движение начинается от листов<br />
дерева и происходит вверх до тех пор, пока аппроксимационные<br />
способности дерева решений<br />
остаются приемлемыми.<br />
3. Индукция лингвистических правил<br />
на основе построения деревьев решений<br />
Существующие методы построения деревьев<br />
решений [2–7] не учитывают особенностей задачи<br />
индукции лингвистических правил. В связи с этим<br />
разрабатывается новый метод построения деревьев<br />
решений для индукции правил. Подобно известным<br />
методам построения дерева решений, предлагаемый<br />
метод состоит из основных фаз: рост дерева<br />
и его сглаживание (сокращение), после чего выполняется<br />
преобразование дерева решений в лингвистические<br />
правила. Наиболее важными аспектами<br />
предлагаемого метода являются следующие:<br />
использование модифицированной энтропии как<br />
оценочной меры, и использование сглаживания<br />
для отсечения.<br />
Таким образом, предлагаемый метод состоит из<br />
следующих этапов:<br />
– рост дерева;<br />
– сглаживание дерева;<br />
– преобразование дерева решений в лингвистические<br />
правила.<br />
На этапе роста дерева предлагается использовать<br />
жадный подход. В каждом узле, соответствующем<br />
подмножеству T обучающей выборки, выбирается<br />
признак f и значение v таким образом, что данные<br />
i, f f , v i i, f<br />
1<br />
1<br />
и T f , v<br />
из T разделяются на два подмножества T f , v<br />
исходя из условий x<br />
1<br />
≤ v: T = { x ∈T : x ≤v}<br />
и<br />
2<br />
Tf , v= { xi ∈ T : xi, f > v}<br />
. Такое разбиение разделяет<br />
множество объектов обучающей выборки на такие,<br />
для которых значение признака f меньше значения<br />
v, и на те, для которых значение признака f больше<br />
значения v.<br />
С целью разбиения дерева решений для каждого<br />
возможного разбиения (f, v) рассчитывается<br />
оценочная функция (1):<br />
1 2<br />
f , v f , v f , v f , v<br />
Q( f, v) = p g( p ) + ( 1 − p ) g( p ), (1)<br />
1 1<br />
f , v i i f , v<br />
2 2<br />
f , v i i f , v<br />
где p = P( y = 1 | x ∈ T ) , p = P( y = 1 | x ∈ T )<br />
1<br />
и pf , v= P( xi ∈Tf , v | xi ∈T)<br />
; g(p) – модифицированная<br />
энтропия для вероятности отнесения выходной<br />
переменной y к рассматриваемому классу при усло-<br />
1 2<br />
вии, что x больше или меньше значения v ( p f , vи<br />
p f , v<br />
соответственно):<br />
g( p) =−r( p)ln( r( p)) −( 1−r( p))ln( 1 − r( p))<br />
, (2)<br />
где r(p) преобразует оценку вероятности:<br />
127
Е. А. Гофман, А. А. Олейник, С. А. Субботин<br />
128<br />
⎧1<br />
( 1+ 2p− 1),если p><br />
0, 5;<br />
⎪2<br />
r( p)<br />
= ⎨<br />
, (3)<br />
⎪1<br />
( 1− 1− 2p),если p><br />
0, 5.<br />
⎩⎪<br />
2<br />
Таким образом, чем ближе значение вероятности<br />
к 0,5, тем выше модифицированное значение,<br />
а чем дальше от 0,5, тем значение ниже.<br />
Оценочная функция рассчитывается для всех<br />
возможных разбиений и выбирается разбиение с<br />
наименьшим значением оценочной функции. Разбиение<br />
начинается от корневого узла и продолжается<br />
до тех пор, пока не возникнет ситуация, когда<br />
невозможно произвести новое разбиение.<br />
После выполнения первого этапа может возникнуть<br />
ситуация «переобучения» дерева, что может<br />
привести к не совсем корректной работе дерева на<br />
тестовых выборках. В связи с этим на втором этапе<br />
производится усечение большого дерева, чтобы дерево<br />
меньших размеров давало более стабильные оценки<br />
вероятности и было более интерпретабельным.<br />
Далее описывается подход, который вместо<br />
урезания полного дерева будет производить переоценку<br />
вероятности каждого листового узла путем<br />
усреднения оценки вероятности по пути следования<br />
от корневого узла к листовому узлу. Для достижения<br />
данной цели была взята идея «утяжеления<br />
дерева» [8]. Если используется дерево для сжатия<br />
бинарного классового признака yi , основанного<br />
на xi , то в таком случае метод утяжеления дерева<br />
гарантирует, что коэффициент сжатия переоцененной<br />
вероятности не будет хуже, чем в успешно<br />
усечённом дереве. Так как предлагаемый метод<br />
применяется в большей степени к трансформированной<br />
оценке вероятности r( p),<br />
чем непосредственно<br />
к p , то теоретически результат может быть<br />
следующим: путем использования переоцененной<br />
вероятности можно достичь ожидаемую классификацию<br />
обучающего множества с не худшим результатом,<br />
чем у правильно усеченного дерева.<br />
Следует отметить, что данный подход также<br />
является сжатием, поскольку при помощи такого<br />
подхода оценка сжимается от дальних узлов дерева<br />
по направлению к оценкам узлов, которые находятся<br />
ближе к корню дерева.<br />
Пусть узлы T1 и T2 являются элементами одного<br />
уровня с общим родительским узлом T . Пусть<br />
pT ( 1 ) , pT ( 2 ) и pT ( ) будут соответствующими<br />
оценками вероятности. Локальная переоцененная<br />
вероятность это wT p( T) + ( 1−wT ) pT ( 1 ) для T1 и wT p( T) + ( 1−wT ) pT ( 2 ) для T2 . Локальная значимость<br />
wT и сопутствующая функция G( T)<br />
рассчитываются<br />
рекурсивно, основываясь на следующих<br />
формулах:<br />
wT<br />
c⋅exp( −|<br />
T | g( p( T )))<br />
=<br />
− w exp( −| T | G( T ) −|<br />
T | GT ( )) ,<br />
1 t<br />
1 1 2 2<br />
g p T<br />
w w<br />
T c<br />
T<br />
GT<br />
T GT<br />
1<br />
( ( )) + log(( 1+ ) T ) , T > , ,<br />
| |<br />
| | | T<br />
( ) = ( ) +<br />
| |<br />
1<br />
если 05<br />
1<br />
2 |<br />
1 ( )<br />
| T |<br />
log(( )( )),<br />
| | GT<br />
⎧<br />
⎪<br />
⎪<br />
⎪<br />
⎨<br />
2 +<br />
⎪<br />
⎪ 1<br />
⎪ + 1+ c 1−iwTвпротивном<br />
случае.<br />
⎩ T<br />
Параметр с устанавливается априорно и показывает<br />
Байесову «оценку» разбиения. Для листового<br />
узла Т устанавливается: G( T) = g( p( T )) и wT =1.<br />
После вычисления значимостей wT для каждого<br />
узла рекурсивным методом (используется нисходящая<br />
рекурсия) необходимо рассчитать глобальную<br />
оценку вероятности для каждого узла дерева<br />
сверху вниз. Данный этап усредняет все оценки r(p)<br />
от корневого узла T0 к узлу Th по пути T0 , …, Th ,<br />
основываясь на значимости wT . Следует отметить,<br />
что значимость wT является лишь локально важной.<br />
Это означает то, что глобальная значимость<br />
узла Th является wT * =∏ ( 1 − w ) w на всём пути.<br />
h<br />
∑ 1<br />
i< k i k<br />
По определению, i = wi<br />
= 1 для любого направления,<br />
ведущему к листу. По следующим рекурсивным<br />
формулам вычисляется глобальная переоценка<br />
подчиненных узлов T1 и T2 в родительском узле<br />
T :<br />
<br />
w<br />
<br />
= w ( 1 −w)<br />
, (4)<br />
Ti T T<br />
r *( T ) = r *( T) + w w r( pT ( )),<br />
<br />
i Ti Ti i<br />
(5)<br />
где r( p( T )) – преобразование по формуле (3) из<br />
оценки вероятности pT ( )в узле T . В корневом узле<br />
устанавливается: w = 1 . После вычисления r *( Th) для листового узла Th в качестве оценки вероятности<br />
−1<br />
можно использовать следующее: r ( r( Th )) . Метка<br />
класса для Ti будет равна единице, если rT ( i ) > 05 ,<br />
, в противном случае – нулю. Усечение дерева выполняется,<br />
начиная с основания по направлению<br />
вверх путем проверки идентичности узлов одного<br />
уровня. Если идентичность узлов выявлена, то они<br />
удаляются и используется значение родительского<br />
узла. Данная процедура будет продолжаться до тех<br />
пор, пока она не станет невозможной. Метод сглаживания<br />
последовательно улучшает работу дерева.<br />
Оценка временной сложности – OM ( ), где M –<br />
количество узлов неусеченного дерева.<br />
Неотъемлемой частью предложенного метода<br />
является этап преобразования дерева решений в<br />
эквивалентный набор легко поддающихся толкованию<br />
лингвистических правил. Важность такого<br />
преобразования объясняется двумя причинами.<br />
1. Любому человеку легче понять и изменить<br />
набор правил, чем понять и изменить дерево решений.<br />
Потребность в таком изменении очевидна.<br />
Например, может возникнуть ситуация, когда<br />
имеется некоторое несоответствие между обучающей<br />
выборкой и реальной системой, что требует
ручной модификации автоматически созданной<br />
системы, и, таким образом, в системе, основанной<br />
на правилах, такую модификацию можно выполнить<br />
путём простого изменения соответствующих<br />
правил.<br />
2. Тот факт, что набор правил логически эквивалентен<br />
соответствующему дереву решений для<br />
данной обучающей выборки, гарантирует, что любой<br />
математический анализ эффективности работы<br />
дерева решений относится не только к дереву<br />
решений, но и к соответствующему набору правил.<br />
Самый простой способ преобразования дерева<br />
в эквивалентный набор правил заключается в том,<br />
чтобы создать набор правил из правил, каждое из<br />
которых соответствует отдельному листу дерева<br />
путём формирования логического объединения<br />
условий на пути от корня дерева к листу.<br />
Предлагается подход, преобразующий дерево<br />
решений в набор логически эквивалентных правил.<br />
Целью предлагаемого подхода не является получение<br />
доказуемо минимального набора правил.<br />
Вместо этого с помощью предлагаемого подхода<br />
производится логическое усечение правил.<br />
1. Проверка условий “>” и “
Е. А. Гофман, А. А. Олейник, С. А. Субботин<br />
1–3. – 16<strong>77</strong> p. 3. Rokach L. Data Mining with Decision Trees.<br />
Theory and Applications / L. Rokach, O. Maimon. – London :<br />
World Scientific Publishing Co, 2008. – 264 p. 4. Quinlan J. R.<br />
Induction of decision trees / J. R. Quinlan // Machine Learning.<br />
– 1986. – <strong>№</strong> 1. – P. 81–106. 5. Quinlan J. R. Decision<br />
trees and decision making / J. R. Quinlan // IEEE Transactions<br />
on Systems, Man and Cybernetics. – 1990. – <strong>№</strong> 2 (20).<br />
– P. 339–346. 6. Liu X. A decision tree solution considering<br />
the decision maker’s attitude / X. Liu, Q. Da // fuzzy Sets<br />
and Systems. – 2005. – <strong>№</strong> 152 (3). – P. 437–454. 7. Classification<br />
and regression trees / L. Breiman, J. H. friedman,<br />
R. A. Olshen, C. J. Stone. – California : Wadsworth & Brooks,<br />
1984. – 368 p. 8. Willems F. M. J. The Context Tree Weighting<br />
Method: Basic Properties / f. M. J. Willems, Y. M. Shtarkov,<br />
T. J. Tjalkens // IEEE Transactions on Information Theory.<br />
– 1995. – <strong>№</strong> 3. – P. 653–664. 9. UCI Machine Learning Repository<br />
[electronic resource] / Center for Machine Learning<br />
and Intelligent Systems. – Access mode : http://archive.ics.<br />
uci.edu/ml/datasets.html.<br />
Поступила в редколлегию 20.06.<strong>2011</strong><br />
130<br />
УДК 004.93<br />
Індукція лінгвістичних правил з використанням дерев<br />
рішень / Є. О. Гофман, А. О. Олійник, С. О. Субботін //<br />
Біоніка інтелекту: наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>).<br />
– С. 126-130.<br />
Розглядається завдання індукції лінгвістичних правил.<br />
Розроблено метод ідентифікації дерев рішень для<br />
індукції лінгвістичних правил. Створено програмне забезпечення<br />
на основі запропонованого методу.<br />
Бібліогр.: 9 найм.<br />
UDC 004.93<br />
Linguistic Rules Induction with Decision Trees / Ye. A. Gofman,<br />
A. O. Oliinyk, S. A. Subbotin // Bionics of Intelligense:<br />
Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 126-130.<br />
The problem of linguistic rules induction is considered in<br />
this paper. A method of decision trees identification for the<br />
linguistic rules induction is developed. The software based on<br />
the proposed method is created.<br />
Ref.: 9 items.
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 131–135 хНурэ<br />
УДК 004.93<br />
Введение<br />
При решении задач технического и медицинского<br />
диагностирования возникает необходимость<br />
определения дефектных изделий или опасных состояний<br />
объектов диагностирования, что предполагает<br />
наличие диагностической модели. Для обеспечения<br />
удобства применения диагностическую<br />
модель целесообразно представлять в виде набора<br />
продукционных правил вида “если-то”, которые<br />
могут быть получены посредством индуктивного<br />
обучения по прецедентам.<br />
В простейшем случае каждое правило основывается<br />
на бинарном представлении антецедентов,<br />
где значением “1” кодируется наличие признака, а<br />
значением “0” – его отсутствие у данного экземпляра.<br />
Исходя из значений битовой строки, описывающей<br />
экземпляр, принимается решение об<br />
отнесении его к классу годных или дефектных.<br />
Используемые для решения данной задачи подходы<br />
имеют ряд недостатков. В частности, нейронные<br />
сети требуют дополнительной процедуры вербализации<br />
для упрощения правил [1]. Деревья принятия<br />
решений часто сходятся на локальных оптимумах,<br />
при большом количестве признаков полученные<br />
правила значительно усложняются, а также деревья<br />
решений плохо поддаются переобучению [2].<br />
В целях устранения перечисленных выше недостатков<br />
при решении данной задачи целесообразно<br />
использовать принцип отрицательного отбора<br />
в искусственных иммунных системах. Он обладает<br />
таким рядом свойств, как способность работать с<br />
бинарным представлением признаков, возможность<br />
обучаться на экземплярах только одного<br />
класса, распределенность вычислений [3].<br />
Среди недостатков существующих реализаций<br />
модели отрицательного отбора [4] стоит отметить<br />
тот факт, что они требуют предварительной оценки<br />
и отбора информативных признаков, а также<br />
характеризуются высокой сложностью извлечения<br />
знаний из полученных результатов работы модели.<br />
С.А. Зайцев 1 , С.А. Субботин 2<br />
1 Запорожский национальный технический университет, г. Запорожье,<br />
zaitsev.serge@gmail.com<br />
2 Запорожский национальный технический университет, г. Запорожье,<br />
subbotin@zntu.edu.ua<br />
МОДЕЛЬ ОТРИЦАТЕЛЬНОГО ОТБОРА С ИСПОЛЬЗОВАНИЕМ<br />
МАСКИРОВАННЫХ ДЕТЕКТОРОВ И МЕТОД ЕЁ ОБУЧЕНИЯ<br />
ДЛЯ РЕШЕНИЯ ЗАДАЧ ДИАГНОСТИРОВАНИЯ<br />
Исследовалось применение модели отрицательного отбора в диагностировании. Предложена модель<br />
отрицательного отбора, использующая маскирование детекторов, и разработан метод ее обучения, что<br />
позволило повысить скорость работы модели и улучшить интерпретабельность получаемых результатов.<br />
Проведены эксперименты, подтверждающие эффективность предложенной модели.<br />
ОТРИЦАТЕЛЬНЫЙ ОТБОР, БИТОВАЯ СТРОКА, ДЕТЕКТОР, ПРАВИЛО СОПОСТАВЛЕНИЯ,<br />
МАСКИРОВАНИЕ<br />
Цель работы заключается в разработке такой<br />
модели отрицательного отбора, которая бы позволяла<br />
проводить отбор информативных групп признаков<br />
и формировать на их основе продукционные<br />
правила для проведения диагностирования, а<br />
также разработать метод ее обучения.<br />
1. Постановка задачи<br />
Пусть мы имеем выборку S ′ , состоящую из экземпляров,<br />
описанных битовыми строками фиксированной<br />
длины l . Будем считать, что набор<br />
всех возможных битовых строк длиной l формирует<br />
пространство признаков U . Множество U<br />
можно разделить на два комплементарных подмножества,<br />
описывающих “свои” (годные) и “чужие”<br />
(дефектные) экземпляры соответственно:<br />
U = S ∪ N , S ∩ N =∅, где S – множество годных<br />
экземпляров, а N – множество дефектных. Обучающая<br />
выборка состоит только из годных экземпляров<br />
S′ ⊂ S . В этом случае задача построения<br />
модели отрицательного отбора заключается в генерации<br />
такого набора правил, представленного<br />
множеством детекторов D , на основании которого<br />
каждый x ∈ U можно однозначно отнести к классу<br />
годных или дефектных экземпляров.<br />
2. Метод обучения модели отрицательного<br />
отбора с цензурированием<br />
Рассмотрим модель [5], реализующую парадигму<br />
отрицательного отбора.<br />
Как правило, для определения принадлежности<br />
экземпляра к множеству S или N модель отрицательного<br />
отбора в процессе обучения добавляет в<br />
набор D такие детекторы, которые не соответствуют<br />
“своим” экземплярам. Поскольку множества<br />
S и N комплементарны, то предполагается, что<br />
любая битовая строка x принадлежит множеству<br />
N , если ей соответствует хотя бы один детектор из<br />
набора D . Определение соответствия экземпляра<br />
детектору происходит на основании правила сопоставления<br />
match( dx , ), которое принимает значение<br />
“истина”, если детектор соответствует экземпляру,<br />
и “ложь” – в противном случае.<br />
131
С.А. Зайцев, С.А. Субботин<br />
Таким образом, работа данной модели осуществляется<br />
в два этапа.<br />
1. Генерация набора детекторов. Для этого случайно<br />
сгенерированные кандидаты в детекторы C ,<br />
представленные в виде битовых строк, подлежат<br />
цензурированию, и те из них, которые не отсеиваются<br />
на данном этапе, попадают в набор детекторов<br />
D . В результате цензурирования отсеиваются<br />
те кандидаты в детекторы c∈ C , для которых существует<br />
такой x ∈ S , чтобы match( cx , )= 1 .<br />
2. Классификация. На этом этапе экземпляр<br />
x , поступающий на вход модели, сравнивается с<br />
детекторами из набора D , используя правило сопоставления.<br />
Если хотя бы один из детекторов при<br />
этом активизируется, т.е. ∃d ∈ D: match( dx , )= 1 ,<br />
считается, что x ∈ N , в противном случае – x ∈ S .<br />
На практике оказывается [5], что множество D<br />
относительно небольшой мощности способно обеспечить<br />
достаточно высокую точность классификации<br />
диагностируемых данных. Более того, при<br />
неизменном количестве детекторов объем годных<br />
экземпляров может увеличиваться без снижения<br />
точности диагностирования.<br />
Метод генерации детекторов представляется<br />
чрезвычайно ресурсоемким, а потому очень важно<br />
своевременно осуществить останов во избежании<br />
генерации избыточного количества детекторов.<br />
3. Бинарные метрики<br />
В качестве правила сопоставления двух бинарных<br />
детекторов применяются различного рода метрики,<br />
позволяющие определить степень подобия<br />
двух битовых строк [5-8].<br />
Правило r-последовательных битов (r-contiguous<br />
rule, RCB rule) [5-7] использовалось изначально в<br />
модели отрицательного отбора. Метод генерации<br />
детекторов для модели отрицательного отбора оперировал<br />
строками фиксированной длины. Так, для<br />
двух строк, представленных в виде последовательности<br />
из n битов x = { x1, x2, … , xn} и d = { d1, d2, … , dm} правило выглядит следующим образом:<br />
⎧⎪<br />
1, ∃ii , ≤n− r + 1, ∀i ≤ j ≤ i + r − 1:<br />
xj = dj;<br />
match( d, x)<br />
= ⎨<br />
⎩⎪ 0, в противном случае.<br />
Иными словами, две строки совпадают, если<br />
существует такое окно размером r , в пределах которого<br />
все биты обеих строк совпадают.<br />
Данная метрика отличается своей простотой и<br />
используется в оригинальном методе генерации<br />
детекторов для модели отрицательного отбора, получившем<br />
свое дальнейшее развитие в линейном и<br />
“жадном” методах генерации детекторов [6]. Все<br />
эти методы ограничиваются использованием бинарной<br />
формы представления детекторов и RCBправила.<br />
Метрика R-chunks [7] является более общей по<br />
сравнению с RCB-метрикой, т.е. любой детектор,<br />
132<br />
оперирующий RCB-правилом, может быть представлен<br />
в виде множества r-chunks детекторов.<br />
Для двух строк x = { x1, x2, … , xn} и d = { d1, d2, … , dm} длиной n и m соответственно, n≤ m , правило<br />
r-chunks можно представить как:<br />
⎧⎪<br />
1, ∀i ≤ j ≤ i + m− 1:<br />
xj = dj;<br />
match( d, x)<br />
= ⎨<br />
⎩⎪ 0, в противном случае,<br />
где i определяет позицию начала отрезка строки<br />
(chunk).<br />
Правило r-chunks позволяет повысить точность<br />
работы метода отрицательного отбора.<br />
Метрика Хемминга применялась в [8] в качестве<br />
правила сопоставления:<br />
n ⎧<br />
⎪1,<br />
∑ xi ⊕di ≥r;<br />
match( d, x)<br />
= ⎨ i = 1<br />
⎪<br />
⎩0,<br />
впротивном случае,<br />
где n – длина битовой строки, ⊕ – операция “исключающее<br />
ИЛИ”, r – порог срабатывания правила,<br />
0 ≤r ≤n.<br />
Метрика Левенштейна [8] может считаться обобщением<br />
метрики Хемминга. Её значение определяется<br />
минимальным количеством изменений,<br />
необходимых для преобразования одной бинарной<br />
строки в другую. При этом изменения могут быть<br />
следующего вида: вставка разряда, удаление разряда,<br />
замена одного разряда (бита) другим из алфавита.<br />
В некоторых вариациях метрика Левенштейна<br />
считает замену нескольких смежных разрядов<br />
одной операцией.<br />
Использование метрики Левенштейна целесообразно,<br />
если экземпляры обладают различным количеством<br />
признаков.<br />
Важно отметить, что в случае использования метрики<br />
rcb и r-chunks необходимо заранее учитывать<br />
информативность признаков и возможно произвести<br />
перестановку битов в строках таким образом,<br />
чтобы биты, соответствующие информативным<br />
признакам образовывали последовательность –<br />
только в таком случае, метрики rcb и r-chunks смогут<br />
учитывать их значения наиболее эффективно.<br />
4. Метод обучения модели отрицательного отбора,<br />
использующий перестановку битов<br />
Использование бинарных детекторов часто<br />
приводит к такому явлению, как “дыры”. “Дырой”<br />
(hole) называют такую бинарную строку, описывающую<br />
экземпляр чужого класса, для которой<br />
невозможно сгенерировать корректный детектор<br />
(т.е. любой сгенерированный детектор, который<br />
соответствует этой строке, будет также соответствовать<br />
какой-то строке, описывающей “свои”<br />
экземпляры). Иными словами, чужая строка a∈ N<br />
образовывает “дыру”, тогда и только тогда, когда<br />
∀x ∈ U, match( x, a)= 1: ∃s∈ Smatch , ( sa , )= 1. “Дыры”<br />
образовываются при использовании любой метри-
МОДЕЛЬ ОТрИЦАТЕЛЬНОГО ОТБОрА С ИСПОЛЬЗОВАНИЕМ МАСКИрОВАННЫх ДЕТЕКТОрОВ И МЕТОД ЕЁ ОБуЧЕНИЯ ...<br />
ки с фиксированной вероятностью соответствия<br />
[6]. В [9] предлагается решение этой проблемы.<br />
Каждый детектор должен иметь несколько способов<br />
представления в бинарном виде. Например,<br />
для строк s1 = 01101011,<br />
s2 = 00010011 зададим правило<br />
перестановки бит L = 1−6−2−5−8−3−7−4 . Применив это правило к строкам, получим:<br />
Ls ( 1)=<br />
00111110 Ls ( 2 )= 00001011 . Используя rcbметрику<br />
с параметром r = 3 , можно увидеть, что<br />
match( s1, s2)=<br />
1 , т.к. последние три бита этих строк<br />
совпадают. Однако match( Ls ( 1) , L( s2)<br />
)= 0 .<br />
Фактически использование маски перестановок<br />
позволяет изменять форму детектора в пространстве<br />
признаков, в то время как форма “своего” пространства<br />
остается неизменной. Каждое фиксированное<br />
представление формирует свои “дыры”, а<br />
использование нескольких представлений снижет<br />
вероятность того, что одна и та же “чужая” строка<br />
приведет к формированию “дыр” одновременно<br />
во всех представлениях детектора.<br />
Хотя такой подход и позволяет повысить точность<br />
работы модели отрицательного отбора за счет<br />
устранения “дыр”, а также снизить количество детекторов<br />
в наборе, для каждого детектора производится<br />
несколько вычислений функции сопоставления,<br />
таким образом вычислительная сложность<br />
метода эквивалентна отрицательному отбору с<br />
цензурированием при большем количестве детекторов.<br />
Также усложняется процесс генерации набора<br />
детекторов, поскольку требуется случайным<br />
образом сгенерировать такую пару битовых строк<br />
(сам детектор и его представление после применения<br />
правила перестановки), чтобы ни одна из них<br />
не совпадала ни с каким “своим” экземпляром.<br />
Существенным недостатком метода является<br />
то, что он применим только для метрики rcb.<br />
5. Метод обучения с маскированием<br />
С целью устранения недостатков метода, описанного<br />
выше, авторами предлагается использовать<br />
детекторы с маскированием. Для этого необходимо<br />
расширить алфавит, на основе которого<br />
формируются детекторы, дополнив его еще одним<br />
символом – символом маски Z : Ω={ 01 ,,Z } .<br />
Значение Z играет особую роль – оно соответствует<br />
любому значению { 01 , } бита в битовой<br />
строке. Учитывая этот факт, существующие метрики<br />
должны быть модифицированы.<br />
Так, метрика Хемминга для порогового значения<br />
r и битовых строк s и d длиной l может быть<br />
представлена в виде:<br />
l ⎧<br />
⎪1,<br />
| di Z di si r;<br />
match( ∑{<br />
1 ≠ ∧ ≠ }≥<br />
ds , )= ⎨ i = 1<br />
⎪<br />
⎩0,<br />
впротивном случае.<br />
Иными словами, детектор d и битовая строка<br />
s совпадают, если у них совпадают r незамаскированных<br />
битов.<br />
Метрика rcb для маскированных детекторов вычисляется<br />
следующим образом:<br />
l<br />
⎧<br />
⎪1,<br />
∃ ii , = 1…l − r : | di Z di si r;<br />
match( ∑{<br />
1 = ∧ = }≥<br />
ds , )= ⎨<br />
j= i<br />
⎪<br />
⎩0,<br />
впротивном случае.<br />
В тех случаях, когда в результате обучения диагностической<br />
модели требуется получить набор<br />
правил, по которым будет проводиться классификация,<br />
рекомендуется применять модификацию<br />
метрики Хемминга:<br />
l ⎧<br />
⎪1,<br />
| di Z di si l;<br />
match( ∑{<br />
1 = ∨ = }=<br />
ds , )= ⎨ i = 1<br />
⎪<br />
⎩0,<br />
впротивном случае.<br />
Такая метрика предполагает, что детектор соответствует<br />
строке, если все незамаскированные<br />
биты детектора соответствуют битам строки.<br />
Жизненный цикл детектора включает в себя<br />
следующие стадии:<br />
– формирование полностью замаскированного<br />
детектора, т.е. такого детектора, у которого значение<br />
всех битов равно Z ;<br />
– замена замаскированных значений битов детектора;<br />
– добавление детектора в набор.<br />
Ниже представлен метод обучения модели отрицательного<br />
отбора, использующей маскирование<br />
детекторов.<br />
1. Сформировать замаскированный детектор<br />
d Z n<br />
= { } .<br />
2. Если ∃s∈ S : match( ds , )= 1 , тогда перейти к<br />
этапу 3, в противном случае – к этапу 5.<br />
3. Выбрать произвольным образом бит di ,<br />
i = 1, … , l , di = Z . Если такого бита не существует,<br />
тогда перейти к этапу 1, в противном случае – перейти<br />
к этапу 4.<br />
4. Установить значение i -го бита детектора:<br />
di =¬ si<br />
. Перейти к этапу 2.<br />
5. Добавить детектор d в набор детекторов:<br />
D = D∪{ d}.<br />
Если достигнуто достаточное для необходимого<br />
уровня точности количество детекторов,<br />
тогда перейти к этапу 6, в противном случае<br />
– перейти к этапу 1.<br />
6. Останов.<br />
В результате работы метода будет получен набор<br />
детекторов, у которых незамаскированные биты<br />
определяют правила, по которым можно проводить<br />
дальнейшую классификацию. Например, детектор<br />
{ 001Z 1}<br />
можно рассматривать следующим<br />
образом: если у экземпляра отсутствует 1-ый и<br />
2-ой признаки, однако присутствуют 3-ий и 5-ый,<br />
то экземпляр считается чужим.<br />
Так как метод не проверяет наличие подобных<br />
детекторов в наборе, то в процессе работы метода<br />
могут быть сгенерированы идентичные детекторы.<br />
По той же причине могут быть получены такие<br />
133
С.А. Зайцев, С.А. Субботин<br />
пары детекторов, у которых все незамаскированные<br />
биты совпадают, например { 010Z } и { 01ZZ }.<br />
Чтобы ускорить работу обученной модели предлагается<br />
по окончании обучения удалить из набора<br />
детекторов дубликаты. Также для детекторов,<br />
отличающихся только замаскированными битами,<br />
целесообразно оставлять только те, у которых<br />
большее количество замаскированных битов. Таким<br />
образом можно сократить набор детекторов<br />
без потери точности классификации.<br />
6. Модифицированный метод обучения<br />
с маскированием<br />
Предложенный выше метод позволяет сократить<br />
количество детекторов в наборе, тем самым<br />
повысив скорость процесса классификации с использованием<br />
модели отрицательного отбора.<br />
Однако формирование такого набора детекторов<br />
остается ресурсоемкой задачей, поскольку каждый<br />
новый детектор после изменения некоторого бита<br />
требуется сопоставить с каждым “своим” экземпляром.<br />
Этого можно избежать, если сохранять промежуточные<br />
детекторы, не вошедшие в состав модели,<br />
и использовать их в качестве кандидатов при<br />
генерации нового поколения детекторов.<br />
Модифицированный метод обучения модели<br />
отрицательного отбора с маскированием состоит<br />
из следующих этапов.<br />
1. Сформировать замаскированный детектор<br />
c Z n<br />
0 = { } .<br />
2. Создать набор кандидатов в детекторы<br />
C = { c0<br />
} .<br />
3. Выбрать произвольным образом кандидат в<br />
детекторы из набора c∈ C .<br />
4. Если ∃s∈ S : match( cs , )= 1 , тогда перейти к<br />
этапу 5, в противном случае – перейти к этапу 8.<br />
5. Выбрать произвольным образом бит ci ,<br />
i = 1, … , l , ci = Z . Если такого бита не существует,<br />
тогда перейти к этапу 1, в противном случае – перейти<br />
к этапу 6.<br />
6. Установить значение i -го бита детектора:<br />
ci =¬ si<br />
.<br />
7. Добавить модифицированный кандидат в набор<br />
C = C ∪{}. c Перейти к этапу 3.<br />
8. Добавить кандидат c в набор детекторов:<br />
D = D∪{}. c Если достигнуто достаточное для необходимого<br />
уровня точности количество детекторов<br />
– перейти к этапу 9, в противном случае – перейти<br />
к этапу 1.<br />
9. Останов.<br />
В первоначальной реализации метода, кандидат<br />
в детекторы состоял исключительно из замаскированных<br />
битов, а следовательно, всегда совпадал с<br />
экземплярами из набора S . Данная модификация<br />
снижает вероятность совпадения, поскольку боль-<br />
134<br />
шая часть кандидатов в детекторы уже содержит<br />
незамаскированные биты. Модифицированный<br />
метод предполагает наличие набора кандидатов в<br />
детекторы, мощность которого увеличивается по<br />
мере обучения модели.<br />
В качестве дальнейшего развития метода можно<br />
выбирать кандидата в детекторы из набора не<br />
случайным образом, а основываясь на значении<br />
некоторой фитнесс-функции, которая своим значением<br />
определяет насколько данный кандидат<br />
пригоден для формирования детекторов. Пригодность<br />
может определяться количеством замаскированных<br />
битов, а также количеством детекторов,<br />
сформированных на основе данного кандидата.<br />
7. Эксперименты и результаты<br />
Предложенный метод синтеза диагностической<br />
модели тестировался как на синтетических выборках,<br />
так и на практических задачах диагностирования<br />
[10] с использованием программной реализации<br />
метода на <strong>язык</strong>е Python.<br />
Синтетические тесты включали в себя наборы<br />
детекторов длинной l = 4, … , 12.<br />
Обучение проводилось<br />
на экземплярах “своего” класса, затем проводилась<br />
классификация и вычислялось значение<br />
ошибки первого рода, определяемое числом неверно<br />
распознанных чужих экземпляров выборки.<br />
На рис. 1 представлены графики, отображающие<br />
зависимости количества детекторов в наборе<br />
D от длины битовых строк l для метода с цензурированием<br />
и для предложенной модификации<br />
метода с маскированием соответственно.<br />
Рис. 2 отображает количество проверок соответствия<br />
детекторов и экземпляров для каждого из<br />
методов.<br />
Рис. 1. График зависимости размера набора<br />
детекторов от размерности задачи<br />
Как видно из рис. 1 и рис. 2, предложенный метод<br />
требует значительно меньше вычислений при<br />
построении модели отрицательного отбора, хотя<br />
при этом точность работы метода выше и составляет<br />
95–100%.
МОДЕЛЬ ОТрИЦАТЕЛЬНОГО ОТБОрА С ИСПОЛЬЗОВАНИЕМ МАСКИрОВАННЫх ДЕТЕКТОрОВ И МЕТОД ЕЁ ОБуЧЕНИЯ ...<br />
Рис. 2. График зависимости количества проверок<br />
правила сопоставления от размерности задачи<br />
Выводы<br />
С целью решения актуальной задачи автоматизации<br />
процесса диагностирования объектов,<br />
характеризуемых набором бинарных признаков,<br />
разработано математическое обеспечение, позволяющее<br />
проводить определение класса состояний<br />
объектов диагностирования на основе иммунокомпьютинга.<br />
Научная новизна работы заключается в том, что<br />
впервые предложена модель отрицательного отбора,<br />
использующая маскированные детекторы, а<br />
также метод ее обучения, основная идея которого<br />
состоит в том, чтобы замаскировать максимальное<br />
количество битов, отвечающих за признаки с<br />
низкой информативностью. Это позволяет одновременно<br />
с построением диагностической модели<br />
осуществлять отбор групп информативных признаков,<br />
за счет чего повышается скорость работы метода<br />
обучения, а также упрощаются генерируемые<br />
продукционные правила посредством сокращения<br />
числа условий в антецедентах, что, в свою очередь,<br />
упрощает диагностическую модель, повышает скорость<br />
ее работы и интерпретабельность.<br />
Практическая ценность работы заключается в<br />
том, что разработано программное обеспечение<br />
для проведения диагностирования объектов с помощью<br />
предложенной модели отрицательного отбора.<br />
Тестирование предложенной модели отрицательного<br />
отбора показало высокую точность классификации,<br />
что позволяет рекомендовать ее использование<br />
для решения практических задач.<br />
Дальнейшие исследования могут быть сосредоточены<br />
на развитии метода обучения предложенной<br />
модели, в частности, на разработке критериев<br />
отбора кандидатов в детекторы.<br />
Список литературы: 1. Миркес, Е.М. Логически прозрачные<br />
нейронные сети и производство явных знаний из<br />
данных [Текст] / Е.М. Миркес, А.Н. Горбань, В.Л. Дунин-<br />
Барковский, А.Н. Кирдин и др. // Нейроинформатика.<br />
Новосибирск: Наука. Сибирское предприятие РАН, 1998.<br />
– С. 296. 2. J. Ross Quinlan C4.5: Programs for Machine learning<br />
// Massachusetts, USA: Morgan Kaufmann Publishers,<br />
1993. P. 324. 3. Gonzalez F., Dasgupta D., Gomez J. The effect<br />
of binary matching rules in negative selection // Proceedings<br />
of the Genetic and Evolutionary Computation Conference<br />
GECCO–2003 (9-11 July, 2003). Berlin-Heidelberg: Springer-<br />
Verlag, 2003. P. 195–206. 4. Ji Z., Dasgupta D. Revisiting<br />
negative selection algorithms // Evolutionary Computation.<br />
2007. <strong>№</strong>15. P. 223–251. 5. Forrest S., Perelson A.S., Cherukuri<br />
R., Allen L. Self-Nonself Discrimination in a Computer<br />
// Proceedings of the 1994th IEEE Symposium on Research<br />
in Security and Privacy (1994). CA: IEEE Computer Society<br />
Press, 1994. P. 202–212. 6. D’haeseleer P., Forrest S., Helman<br />
P. An immunological approach to change detection:<br />
algorithms, analysis, and implications // Proceedings of the<br />
1996th IEEE Symposium on Computer Security and Privacy<br />
(6-8 May, 1996). CA: IEEE Computer Society Press, 1996.<br />
P. 110–119. 7. Balthrop J., Esponda F., Forrest S., Glickman M.<br />
Coverage and generalization in an artificial immune system //<br />
Proceedings of the Genetic and Evolutionary Computation<br />
Conference GECCO–2002 (9-13 July, 2002). San fransisco,<br />
USA: Morgan Kaufmann, 2002. P. 3–10. 8. Farmer J.,<br />
Packard N., Perelson A. The immune system, adaptation, and<br />
machine learning // Physica D: Nonlinear Phenomena. 1986.<br />
<strong>№</strong>2. P. 187–204. 9. Hofmeyr S., Forrest S. Architecture for an<br />
Artificial Immune System // Evolutionary Computation. 2000.<br />
<strong>№</strong>8(4). P. 443–473. 10. Герасимчук, Т.С. Использование<br />
искусственных иммунных систем для прогнозирования<br />
риска развития реккурентных респираторных инфекций<br />
у детей раннего возраста [Текст] / Т.С. Герасимчук, С.А.<br />
Зайцев, С.А. Субботин // Матеріали міжрегіональної<br />
науково-практичної конференції “Діагностика та<br />
лікування інфекційно опосередкованих соматичних захворювань<br />
у дітей” : конференція (10-11 лютого <strong>2011</strong> р.).<br />
Донецьк: Норд-пресс, <strong>2011</strong>. – С. 27–29.<br />
Поступила в редколлегию 27.06.<strong>2011</strong><br />
УДК 004.93<br />
Модель негативного відбору з використанням маскованих<br />
детекторів та метод її навчання для вирішення задач діагностування<br />
/ С. О. Зайцев, С. О. Субботін // Біоніка інтелекту:<br />
наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – С. 131-135.<br />
Проводилось дослідження моделі негативного відбору<br />
в задачі діагностування. Запропоновано модель<br />
негативного відбору, що використовує маскування детекторів,<br />
та розроблено метод її навчання, що дозволило<br />
підвищити швидкість роботи моделі та покращити інтерпретабельність<br />
результатів. Проведено експерименти,<br />
що підтверджують ефективність запропонованої моделі.<br />
Іл.: 2. Бібліогр.: 10 найм.<br />
UDC 004.93<br />
Negative selection model with masked detectods and its<br />
training method in diagnostics / S. A. Zaitsev, S. A. Subbotin<br />
// Bionics of Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –<br />
P. 131-135.<br />
Negative selection model application in diagnostics have<br />
been investigated. A new negative selection model based on<br />
detector masking has been proposed, which allows to increase<br />
model speed and improve results interpretation. The experiments<br />
have been carried to approve the efficiency of the suggested<br />
model.<br />
fig.: 2. Ref.: 10 items.<br />
135
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 136–142 хНурэ<br />
УДК 004.652.4, 004.652.6<br />
136<br />
Введение<br />
На сегодняшний день реляционная модель является<br />
стандартом для баз данных. Широкое распространение<br />
она получила из-за своей простоты и<br />
декларативности. Ведущие производители СУБД,<br />
такие как Oracle, Microsoft, IBM, DB2 выпускают<br />
именно реляционные системы.<br />
Под моделью данных подразумевают механизм<br />
хранения и обработки данных, а также <strong>язык</strong>, обеспечивающий<br />
взаимодействие между пользователем<br />
и базой данных.<br />
Несмотря на свою широкую распространенность,<br />
реляционная модель не идеальна и имеет<br />
ряд ограничений, одним из которых является слабая<br />
выразительная мощность стандартного для<br />
реляционной системы <strong>язык</strong>а SQL. Так как в нем<br />
отсутствует рекурсия, транзитивное замыкание не<br />
может быть определено без использования внешнего<br />
процедурного <strong>язык</strong>а.<br />
Другим существенным ограничением являются<br />
строгие требования реляционных систем к типам<br />
данных, что является недостатком при использовании<br />
неоднородных источников данных.<br />
Также к ограничениям реляционной модели<br />
можно отнести отсутствие возможности работы с<br />
неопределенной информацией.<br />
Следовательно, для решения описанных выше<br />
задач является целесообразным использование другой<br />
модели данных. Наиболее подходящей, с точки<br />
зрения описанных недостатков, является дедуктивная<br />
модель представления данных. В отличие от реляционных<br />
систем, дедуктивные базы данных (ДБД)<br />
используют доказательно-теоретическое представление<br />
данных вместо модельно-теоретичского.<br />
Доказательно-теоретический подход к базам<br />
данных рассматривает базу данных как комбинацию<br />
данных (аксиом) и набор теорем, которые<br />
должны быть выведены из аксиом. Выполнение<br />
запроса к дедуктивной базе данных является процессом<br />
доказательства теоремы.<br />
В отличие от модельно-теоретического,<br />
доказательно-теоретическое представление позво-<br />
С.С. Танянский 1 , Ю.А. Мальков 2<br />
1 ХНУРЭ, г. Харьков, Украина, tanyansky_ss@yahoo.com;<br />
2 ХНУРЭ, г. Харьков, Украина, malkov@smtp.ru<br />
ОТОБРАЖЕНИЕ ЭЛЕМЕНТОВ РЕЛЯЦИОННОЙ МОДЕЛИ<br />
ДАННЫХ В ЭЛЕМЕНТЫ ДЕДУКТИВНОЙ МОДЕЛИ<br />
Рассматривается соответствие понятий реляционной и дедуктивной моделей данных. Представлены<br />
отображения компонентов реляционной модели в соответствующие компоненты дедуктивной модели<br />
данных. Рассмотрены конструкции логического программирования, описывающие основные операции<br />
над данными реляционной модели.<br />
БАЗЫ ДАННЫХ, РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ, ДЕДУКТИВНАЯ МОДЕЛЬ ДАННЫХ,<br />
DATALOG, ЛОГИЧЕСКОЕ ПРОГРАММИРОВАНИЕ, ДЕДУКТИВНЫЕ БАЗЫ ДАННЫХ<br />
ляет описывать конструкции базы данных (базовые<br />
данные, запросы, ограничения целостности)<br />
единообразно – при помощи общего <strong>язык</strong>а. Это<br />
позволяет создавать более понятные и унифицированные<br />
интерфейсы.<br />
На данный момент в литературе не существует<br />
четкого определения соответствий понятий реляционной<br />
и дедуктивной моделей данных. В связи с<br />
этим, целью данной работы является определение<br />
соответствия компонентов реляционной и дедуктивной<br />
модели данных, рассмотрение <strong>язык</strong>овых<br />
конструкций логического программирования, используемых<br />
в ДБД, выражение стандартных операций<br />
реляционной алгебры в терминах логического<br />
программирования.<br />
2. Основные компоненты реляционной<br />
и дедуктивной моделей данных<br />
2.1. Реляционная модель<br />
В реляционной модели база данных рассматривается<br />
как набор явных именованных переменныхотношений,<br />
каждое из которых содержит явный<br />
набор кортежей и явный набор ограничений целостности.<br />
Согласно Дейту [1] реляционная модель состоит<br />
из трех частей:<br />
M =< S, IC, O > , (1)<br />
R<br />
где S – структура данных; IC – ограничения целостности<br />
и O – средства манипулирование данными.<br />
Структурная часть включает данные и описание<br />
объектов, рассматриваемых реляционной моделью:<br />
S =< D, R ><br />
(2)<br />
Постулируется [2], что единственной структурой<br />
данных, используемой в реляционной модели,<br />
являются нормализованные n-арные отношения.<br />
Каждое отношение r характеризуется схемой<br />
R( A1, A2, … , An) , состоящей из множества имен<br />
атрибутов A1, A2, … , An , каждому из которых ставится<br />
в соответствие множество Di , называемое доменом<br />
атрибута Ai .
ОТОБрАЖЕНИЕ эЛЕМЕНТОВ рЕЛЯЦИОННОЙ МОДЕЛИ ДАННЫх В эЛЕМЕНТЫ ДЕДуКТИВНОЙ МОДЕЛИ<br />
Целостная часть описывает ограничения, которые<br />
должны выполняться для любых отношений в<br />
любых реляционных базах данных. Ограничения<br />
целостности реляционной базы данных (IC) можно<br />
определить формулой:<br />
IC =< BF , > , (3)<br />
где B – бизнес-правила – ограничения, которые<br />
зависят от семантики элементов домена, а F– функциональные<br />
зависимости.<br />
Бизнес-правила ограничивают значения атрибута<br />
отношения, например, рост человека не может<br />
быть равен 100 метрам, а функциональные<br />
зависимости определяют зависимость между соответствующими<br />
атрибутами.<br />
Манипуляционная часть реляционной модели<br />
описывает способы определения и манипулирования<br />
данными и выражается формулой:<br />
O =< DDL, DML > , (4)<br />
где DDL – <strong>язык</strong> определения данных (ЯОД), а DML –<br />
<strong>язык</strong> манипулирования данными (ЯМД).<br />
2.2. Дедуктивная модель данных<br />
Дедуктивная модель данных интерпретирует<br />
базу данных как множество предложений логики<br />
первого порядка, а под выполнением запроса или<br />
удовлетворением ограничения здесь рассматривается<br />
доказательство того, что некоторая логическая<br />
формула является логическим следствием из<br />
базовых данных.<br />
Дедуктивная модель данных представлена формулой:<br />
M =< EDB, P > , (5)<br />
D<br />
где EDB – множество данных (экстенсионал), именуемых<br />
как факты, и P – множество правил вывода,<br />
являющихся логической программой.<br />
Под логической программой P подразумевают конечное<br />
множество правил вывода вида:<br />
p← p , p , …, p , not p , …,<br />
not p , (6)<br />
1 2 m m+ 1<br />
n<br />
где m,n ≥ 0, а p и pi – литералы: p называют головой<br />
правила, множество литералов pi образует<br />
тело правила, а символом ← обозначена операция<br />
импликации. Приведенная запись интерпретируется<br />
следующим образом: «Если истинно<br />
p1, p2, …, pm, not pm+ 1,<br />
…,<br />
not pn<br />
, то истинно p».<br />
Как видно из формулы (5), дедуктивная модель,<br />
в отличие от реляционной, обладает дополнительными<br />
возможностями, реализуемыми с помощью<br />
машины вывода логического программирования.<br />
Этот механизм, используя алгоритмы логического<br />
вывода, такие как обратный вывод и резолюция<br />
[3], способен продуцировать новые факты на основе<br />
применения правил вывода к фактам, заданным<br />
в EDB.<br />
Машину вывода ДБД можно представить как<br />
функцию f :<br />
EDB' = f( EDB),<br />
(7)<br />
где EDB – множество фактов экстенсионала; f –<br />
функция продуцирования фактов и EDB' – множество<br />
фактов, полученных вследствие логического<br />
вывода.<br />
Логическую программу P в контексте баз данных<br />
можно представить формулой:<br />
P =< IDB, IC > , (8)<br />
где IDB – интенсионал – часть дедуктивной БД,<br />
состоящая из множества правил вывода, а IC множество<br />
ограничений целостности.<br />
В ДБД представление и манипулирование<br />
данными осуществляется при помощи специальных<br />
конструкций, называемых дизъюнктами (9).<br />
Дизъюнкт является конечным списком литералов<br />
вида pa ( 1, a2, … , an) или отрицаний литералов<br />
−pa ( 1, a2 , …,<br />
an) . Приведенные литералы являются<br />
предикатными функциями, возвращающими множество<br />
значений { 01 , } (или «ложь» и «истина») и<br />
определены на множестве фактов EDB:<br />
pa ( 1, a2, …,<br />
an)← p1( a1, a2, …, ak), …, pm( a1, a2, … , an)<br />
(9)<br />
Любое выражение, включая данные (факты),<br />
правила вывода, ограничения целостности и запросы,<br />
определяется при помощи дизъюнктов. В<br />
соответствии с (9) рассмотрим несколько типов<br />
дизъюнктов.<br />
– Факты. Если в дизъюнкте будет отсутствовать<br />
тело, а все значения аргументов предиката p будут<br />
константами, то он будет представлять основную<br />
аксиому, т.е. утверждение, которое однозначно является<br />
истинным.<br />
– Правила вывода имеют вид (9) и могут рассматриваться<br />
как дедуктивные аксиомы, которые<br />
дают определение предиката в голове правила в<br />
терминах, представленных в теле правила.<br />
– Ограничения целостности выражаются дизъюнктами,<br />
в которых отсутствует голова.<br />
– Запросы или цели – это дизъюнкты, тело которых<br />
содержит предикатный символ, определяющий<br />
множество фактов, над которым будет осуществляться<br />
запрос, а голова состоит из знака “?”.<br />
Интерпретацией логической программы P называют<br />
комбинацию пространства рассуждений,<br />
отображения индивидуальных констант из этой<br />
программы на объекты в этом пространстве и набора<br />
заданных значений для предикатов и функций,<br />
содержащихся в P.<br />
Если дизъюнкт p удовлетворяется в интерпретации<br />
τ – то говорят, что τ является моделью для<br />
p. Аналогично, если множество дизъюнктов P удовлетворяется<br />
в интерпретации τ , говорят, что τ<br />
является моделью для P.<br />
Поскольку логическая программа может допускать<br />
несколько интерпретаций, то, следовательно,<br />
она может иметь более одной модели. Таким обра-<br />
137
С.С. Танянский, Ю.А. Мальков<br />
зом, с теоретико-доказательственной точки зрения<br />
база данных в общем случае может иметь несколько<br />
различных моделей, в отличие от модельнотеоретической,<br />
где модель всегда одна.<br />
После введения базовых понятий логического<br />
программирования, применяемого в дедуктивных<br />
базах данных, рассмотрим соответствие основных<br />
компонентов реляционной и дедуктивной модели.<br />
3. Отображение компонентов реляционной модели<br />
данных в компоненты дедуктивной<br />
Рассмотрение приведенных моделей данных<br />
показало, что реляционная модель данных (1) состоит<br />
из компонентов, описывающих структуру<br />
данных (2), целостную часть (3), представленную<br />
ограничениями целостности, и <strong>язык</strong>ов определения<br />
и манипулирования данными (4).<br />
В то же время дедуктивная модель данных представляется<br />
в виде множества фактов EDB, и логической<br />
программы (5), состоящей из множеств<br />
правил вывода и ограничений целостности (8).<br />
Проведенный выше анализ моделей данных позволяет<br />
сделать вывод о возможности отображения<br />
составных частей реляционной модели данных в<br />
компоненты дедуктивной (рис. 1).<br />
138<br />
Рис. 1. Отображение компонентов реляционной<br />
модели данных в компоненты дедуктивной<br />
Для структурной части реляционной модели<br />
можно построить отображение в множество фактов<br />
экстенсионала EDB дедуктивной модели:<br />
M M<br />
R D<br />
ρ : S → EDB .<br />
(10)<br />
Множество ограничений целостности реляционной<br />
модели можно представить множеством<br />
правил вывода логической программы, являющейся<br />
частью дедуктивной модели:<br />
M M<br />
R D<br />
β : IC → IC .<br />
(11)<br />
Манипуляционную часть реляционной модели<br />
данных можно выразить с помощью эквивалентных<br />
логических формул и конструкций логического<br />
программирования:<br />
M M<br />
R D<br />
θ : O → L .<br />
(12)<br />
Рассмотрим более подробно отображение каждого<br />
компонента реляционной модели.<br />
3.1. Отображение структурной части<br />
Структурная часть реляционной модели определяет<br />
отношение как средство хранения данных.<br />
В то же время предикат можно представить как<br />
функцию, описывающую реляционное отношение:<br />
если значения аргументов предиката являются<br />
кортежем некоторого отношения, то предикат<br />
будет возвращать истинное значение.<br />
Определение: Пусть r – реляционное отношение<br />
со схемой R( A1, A2, … , An) , которое содержит конечное<br />
множество кортежей { t1, t2, … , tk } . Каждый кортеж<br />
ti( A1, A2, … , An)<br />
представляется в виде литерала<br />
pi( a1, a2, , an)<br />
… , где каждый атрибут Aj кортежа ti отображается в аргумент a j предиката pi :<br />
t<br />
j<br />
p<br />
j<br />
i i φ : A → a .<br />
(13)<br />
Поскольку предикат является функцией, вышесказанное<br />
можно переформулировать следующим<br />
образом: предикат p i будет принимать значения<br />
“истина” лишь в том случае, если его аргументы<br />
будут отображением значений некоторого кортежа<br />
t i из отношения r.<br />
Рассмотрим пример: пусть дано отношение r<br />
(рис.2), состоящее из двух кортежей { a 1 , b 1 , c 1 } и<br />
{ a 1 , b 2 , c 2 }. Представим данное отношение в терминах<br />
дедуктивной модели с помощью предиката<br />
p. Тогда предикат p будет возвращать значение “истина”<br />
лишь при подстановке в качестве его аргументов<br />
{ a 1 , b 1 , c 1 } и { a 1 , b 2 , c 2 }.<br />
Рис. 2. Отображение реляционного отношения<br />
в множество фактов<br />
Кортеж отношения r, представленный в виде<br />
n-арного предикатного символа pa ( 1, a2, … , an) , где<br />
n арность исходного отношения r, а ai – константа,<br />
называют фактом. Множество всех фактов дедуктивной<br />
базы данных принято называть экстенсионалом.<br />
В реляционной модели данных понятие отношения<br />
непосредственно связано с понятием домена<br />
[2]. В связи с этим рассмотрим соответствующие<br />
домену понятия дедуктивной модели и построим<br />
отображение.<br />
Определение: пусть D = { D1, D2 , …,<br />
Dn} – мно-<br />
i i i<br />
i<br />
жество доменов, где Di= { d1, d2 , …,<br />
dk}<br />
, где d j<br />
- значение домена (1 < j < k ). Определим предикат<br />
pa ( 1, a2, , an) … и множество значений a i<br />
j =<br />
i i i<br />
{ a1, a2, , ak<br />
} … его аргумента ai . Тогда, можно построить<br />
отображение γ множества элементов домена<br />
Di в множество значений аргумента ai :<br />
i<br />
j<br />
i<br />
j<br />
γ : d → a .<br />
(14)<br />
Представим систему отображений структурной<br />
части реляционной модели в экстенсионал дедуктивной<br />
при помощи диаграммы (рис. 3).<br />
Пусть S M R – множество отношений, определенных<br />
в реляционной модели M R , а EDB M D –
ОТОБрАЖЕНИЕ эЛЕМЕНТОВ рЕЛЯЦИОННОЙ МОДЕЛИ ДАННЫх В эЛЕМЕНТЫ ДЕДуКТИВНОЙ МОДЕЛИ<br />
множество фактов экстенсионала M D . Пространство<br />
допустимых состояний, выразимых в M R и<br />
M D , обозначим, соответственно BR и BD . Тогда<br />
ρ – отображение вида (10), ω : BR → BD<br />
– отображение<br />
пространства состояний M R в пространство<br />
состояний M D , а µ Def – семантическая функция<br />
модели <strong>язык</strong>а определения данных.<br />
Рис. 3. Диаграмма отображения<br />
компонент M R в M D<br />
3.2. Отображение манипуляционной части<br />
Как было сказано выше, в основе дедуктивной<br />
модели лежит доказательно-теоретический подход<br />
к базам данных, расширяющих классическое<br />
понимание базы данных за счет применения логического<br />
программирования.<br />
Наиболее распространенным <strong>язык</strong>ом, применяемым<br />
в ДБД, является Datalog.<br />
Семантика Datalog определена на алфавитах<br />
Var, Const 8Pred , обозначающих переменные, константы<br />
и предикаты.<br />
Переменные обозначают строками буквенноцифровых<br />
символов конечной длины, начинающихся<br />
с прописной буквы. Следует отметить, что<br />
существует специальная переменная «_», называемая<br />
анонимной. Ею обозначают любую неименованную<br />
переменную. Анонимные переменные<br />
используют для отсечения, некоторых аргументов<br />
предиката, что аналогично операции проекции в<br />
реляционной алгебре.<br />
Константой является текстовая строка или число.<br />
Например: “строковая константа” или “12”.<br />
Предикаты обозначают строками алфавитноцифровых<br />
символов конечной длины, которые<br />
начинаются со строчной буквы. Как говорилось<br />
выше, предикаты являются булевыми функциями<br />
над множествами данных.<br />
К функциям Datalog, помимо формулирования<br />
дедуктивных правил вывода, относят описание запросов.<br />
Для выражения запросов, называемых в<br />
логическом программировании целями, на <strong>язык</strong>е<br />
Datalog используют дизъюнкты вида (15). Голова<br />
цели состоит из символа “?”, а тело – из предиката,<br />
над которым выполняют запрос и условий отбора:<br />
( )<br />
? ←p A1, A2, …, Ak, …,<br />
An , AkΩ C,<br />
(15)<br />
где, p – предикат, определенный на множестве<br />
фактов EDB M D ; Ai – переменные, связанные с<br />
значениями аргументов предиката; AkΩ C условие<br />
выборки; Ω – множество логических функций<br />
сравнения (>, C.<br />
1 2 k n 1 2 k n k<br />
Проекция πXY , ,.., Z ( R)<br />
q( X1, X2, …, Xk) ←r( X1, X2, …, Xk,<br />
_, …,_).<br />
139
С.С. Танянский, Ю.А. Мальков<br />
Операции соединения и деления являются зависимыми<br />
операциями, и следовательно могут<br />
быть выражены с помощь рассмотренных операций<br />
разности и декартова произведения.<br />
Представленные выражения на Datalog позволяют<br />
выражать все операции манипулирования<br />
данными, используемые в реляционной модели. В<br />
связи с этим можно построить диаграмму отображения<br />
<strong>язык</strong>а манипулирования данными реляционной<br />
модели в дизъюнкты Datalog (рис. 4).<br />
Пусть O MR – множество операторов <strong>язык</strong>а<br />
манипулирования данными модели M R , L M D –<br />
множество рассмотренных выражений на Datalog,<br />
представляющих ЯМД модели M D , эквивалентных<br />
операциям реляционной алгебры. Тогда θ<br />
– отображение вида (12), ω : BD → BR<br />
– отображение<br />
пространства состояний M R в пространство<br />
состояний M D , а µ Man - семантическая функция<br />
модели <strong>язык</strong>а манипулирования данными.<br />
140<br />
Рис. 4. Диаграмма отображения<br />
операторов ЯМД<br />
3.3. Отображение целостной части<br />
Под ограничениями целостности подразумевают<br />
соответствие имеющейся в базе данных информации<br />
её внутренней логике, структуре и всем явно<br />
заданным правилам. Каждое правило, налагающее<br />
некоторое ограничение на возможное состояние<br />
базы данных, называется ограничением целостности.<br />
Ограничения целостности, используемые в реляционной<br />
модели, можно классифицировать следующим<br />
образом [4]:<br />
1. Первичные ключи.<br />
2. Ограничения ссылочной целостности.<br />
3. Ограничения области значений.<br />
В общем случае ограничения целостности на<br />
Datalog выражают при помощи правил вида (16).<br />
Голова такого правила является пустой, а тело состоит<br />
из предиката, который нарушает целостность<br />
базы при истинности условия:<br />
( )<br />
←p A1, A2, …, Ak, …,<br />
An , AkΩ C,<br />
(16)<br />
где p – предикат, определенный на множестве<br />
фактов EDB M D ; Ai – переменные, связанные с<br />
значениями аргументов предиката; AkΩ C условие;<br />
C – константа. Из приведенного выражения следует,<br />
что целостность базы данных будет нарушена, если<br />
найдется хоть один факт p, у которого аргумент Ak будет отвечать заданному условию.<br />
Первичным ключом называют атрибут или множество<br />
атрибутов, уникальным образом идентифицирующих<br />
объект в его классе. Никакие два объекта<br />
класса не могут совпадать по своим значениям для<br />
каждого множества атрибутов, формирующих ключ.<br />
Применительно к ДБД, приведенное определение<br />
означает, что во множестве EDB M D не должно существовать<br />
двух фактов с одинаковыми значениями<br />
аргументов, определяющих уникальность факта.<br />
Для представления первичных ключей в дедуктивной<br />
модели данных вводят правила вида:<br />
unique key( p,<br />
γ ) , (17)<br />
где p – имя ограничиваемого ключом предиката и γ<br />
подмножество аргументов p, определяющих состав<br />
ключа. Подмножество аргументов γ задают в виде<br />
перечисления позиций аргументов, разделенных<br />
запятой. Например: unique key( p,<br />
[, 13 ]) .<br />
Ограничение ссылочной целостности в реляционной<br />
модели заключается в том, что каждому кортежу<br />
отношения, содержащему внешний ключ,<br />
должен соответствовать кортеж в другом отношении,<br />
содержащем первичный ключ. Отношение,<br />
содержащее внешний ключ, называют дочерним, а<br />
первичный – родительским.<br />
В дедуктивной модели ограничение ссылочной<br />
целостности в общем виде представляют правилом<br />
вида:<br />
( ) ( … … )<br />
← p A , …, A ,_ …,_<br />
, not p A , , A ,_, ,_ , (18)<br />
1 1 k 2 1 k<br />
где p1 – предикат, на который накладывается условие<br />
ссылочной целостности; p2 – родительский<br />
предикат для p1 ; A1, A2, … , Ak – атрибуты, входящие<br />
в состав внешнего ключа.<br />
Ограничения области значений требуют, чтобы<br />
значение атрибута реляционного отношения выбиралось<br />
из определенного множества значений<br />
или находилось в определенных границах. Ограничения<br />
такого вида можно представить правилами<br />
вида (19, 20):<br />
( ) = … =<br />
← p A , …, A , …,<br />
A , not A C , , not A C , (19)<br />
1 k n k 1<br />
k m<br />
где p – предикат; Ak – аргумент предиката, значение<br />
которого, не входящее в множество значений<br />
{C1, C2, … , Cm }, нарушает целостность БД,<br />
( ) < <<br />
← p A , A , …, A , …,<br />
A , A C , C A , (20)<br />
1 2 k n k 1 2 k<br />
где p – предикат; Ak – аргумент предиката, значение<br />
которого, выходящее за пределы диапазона {C1, C2},<br />
нарушает целостность БД.<br />
Кроме представленных выше ограничений<br />
целостности, накладываемых на факты EDB, дедуктивная<br />
система позволяет ограничивать вывод<br />
фактов, полученных в результате логического вывода<br />
( EDB ' ). Следовательно, ограничения целостности<br />
в дедуктивной модели можно представить<br />
формулой:
ОТОБрАЖЕНИЕ эЛЕМЕНТОВ рЕЛЯЦИОННОЙ МОДЕЛИ ДАННЫх В эЛЕМЕНТЫ ДЕДуКТИВНОЙ МОДЕЛИ<br />
EDB EDB '<br />
IC =< IC , IC > , (21)<br />
где IC EDB – ограничения целостности, накладываемые<br />
на множество фактов EDB , а IC EDB ' – ограничения<br />
целостности, накладываемые на множество<br />
продуцируемых фактов EDB ' . Поскольку в реляционной<br />
модели отсутствует механизм целостности<br />
хранимых запросов, механизмы, аналогичные<br />
IC EDB ' , в ней не представлены.<br />
4. Использование дедуктивных баз данных<br />
в задачах интеграции реляционных систем<br />
Достаточно часто реляционные системы используют<br />
для хранения табличных документов с нарушением<br />
требований реляционной модели. Это связано<br />
с ошибками и недоработками при проектировании,<br />
к которым можно отнести отсутствие нормализации<br />
и различную степень абстракции данных. Интеграция<br />
таких систем является достаточно сложной задачей<br />
и требует более мощных и выразительных<br />
средств, нежели реляционные <strong>язык</strong>и.<br />
Для решения этой задачи предлагается использовать<br />
аппарат дедуктивных баз данных, значительно<br />
расширяющий операционную спецификацию<br />
реляционных систем. Как было показано<br />
выше, все основные структурные компоненты<br />
реляционной модели выразимы средствами логического<br />
программирования, следовательно, их<br />
можно однозначно отобразить в дизъюнкты ДБД.<br />
Применение дедуктивных правил вывода к фактам,<br />
представляющим различные неоднородные<br />
системы баз данных, позволит представить их в<br />
виде единого виртуального множества данных, над<br />
которым можно осуществлять запросы. Общую<br />
схему работы предлагаемого метода представим на<br />
рис. 5.<br />
4.1. Архитектура системы интеграции неоднородных<br />
баз данных на основе ДБД<br />
Как было показано выше, любую реляционную<br />
базу данных можно представить в виде логической<br />
программы P и множества фактов EDB.<br />
Следовательно, множество интегрируемых си-<br />
стем баз данных { DB1, DB2, … , DBn } можно представить<br />
как совокупность множеств фактов<br />
EDB = { EDB1, EDB2 , …,<br />
EDBn} и логической программы<br />
P , включающей правила, заданные в<br />
P1, P2, … , Pn .<br />
Поскольку, интегрируемые базы данных зачастую<br />
имеют различную степень нормализации и<br />
абстракции данных, а также могут содержать нарушения<br />
требований реляционной модели, необходимо<br />
задать механизм приведения локальных<br />
структур данных к глобальной виртуальной схеме.<br />
Это достаточно просто реализовать при помощи<br />
правил вывода вида (6).<br />
Рассмотрим пример. Пусть даны две базы данных,<br />
представленные отношениями R1 и R2, R3<br />
(рис. 6). Представим их с помощью предикатов<br />
p1, p2, p3<br />
соответственно.<br />
Рис. 6. Отношения R1, R2, R3<br />
и их представление<br />
в виде фактов p1, p2, p3<br />
Поскольку предикаты p1, p2, p3<br />
обладают различным<br />
количеством аргументов, определим правила<br />
вывода, которые приведут описанные предикаты<br />
к глобальной схеме. Глобальную схему<br />
обозначим при помощи предиката p:<br />
p( X1, X2, X3, X4, X5)← p1( X1, X2, X3, X4, X5)<br />
.<br />
( , , , , )← ( , , ), ( , , ) . (22)<br />
p X X X X X p X X X p X X X<br />
1 2 3 4 5 2 1 2 3 3 3 4 5<br />
Подробнее правила преобразования различных<br />
вариантов неоднородных структур к глобальной<br />
схеме рассмотрены в [8].<br />
Рассмотрим схему осуществления запроса над<br />
глобальной схемой (рис. 7).<br />
Рис. 5. Схема интеграции реляционных СУБД на основе ДБД<br />
141
С.С. Танянский, Ю.А. Мальков<br />
142<br />
Рис. 7. Схема осуществления запроса<br />
над глобальной схемой EDB<br />
При осуществлении запроса над глобальной<br />
схемой EDB машина вывода Datalog, используя<br />
алгоритмы нисходящего вычисления [3], конструирует<br />
дерево доказательства запроса, начиная<br />
с предиката заданного в глобальной схеме и заканчивая<br />
на нижнем уровне, содержащем факты локальных<br />
экстенсионалов.<br />
Выводы<br />
В силу исторически сложившихся обстоятельств<br />
реляционная модель данных является доминирующей<br />
на рынке современных систем управления<br />
базами данных. Рассмотренные недостатки не позволяют<br />
решать ряд определенных задач из-за слабой<br />
выразительности реляционной модели. В то<br />
же время дедуктивная модель имеет более мощный<br />
манипуляционный компонент за счет использования<br />
логического программирования. Описанный<br />
в работе ряд отображений компонентов реляционной<br />
модели в элементы дедуктивной позволяет<br />
утверждать о возможности однозначной трансляции<br />
одной модели в другую. Представление реляционных<br />
систем в дедуктивном виде позволит<br />
решить ряд проблем, связанных с интеграцией<br />
неоднородных баз данных в силу большей выразительной<br />
мощности Datalog и отсутствия жестких<br />
требований к типизации данных.<br />
Полученные результаты дают основания для<br />
дальнейшего изучения механизма отображения<br />
ограничений целостности, заданных в локальных<br />
системах, в ограничения целостности глобальной<br />
схемы. Поскольку ограничения целостности, описывающие<br />
локальную схему, не всегда допустимы<br />
для глобальной схемы, а их удовлетворение может<br />
привести к потере данных.<br />
Список литературы: 1. Дейт, К. Дж. Введение в системы баз<br />
данных [Текст]: пер. с англ. – М.: Вильямс, 2006. – 1071 с.<br />
2. Кодд, Э.Ф. Реляционная модель данных для больших<br />
совместно используемых банков данных [Текст] / Э.Ф.<br />
Кодд // Системы управления базами данных. – 1995. – <strong>№</strong><br />
1. – C. 145-160. 3. Чери, С. Логическое программирование<br />
и базы данных [Текст] : пер. с англ. / С. Чери, Г. Готлоб,<br />
Л._Танка.– М.: Мир, 1992. – 352 с. 4. Ульман, Дж. Д.<br />
Введение в системы баз данных [Текст]: пер. с англ. –<br />
М.: Лори, 2000. – 374 с. 5. Калиниченко, Л.А. Методы и<br />
средства интеграции неоднородных баз данных [Текст] /<br />
Л.А. Калиниченко. – М.: Наука, 1983. – 424 с. 6. Zaniolo,<br />
C. Key Constraints and Monotonic Aggregates in Deductive<br />
Databases [Текст] / C. Zaniolo // Computational Logic: Logic<br />
Programming and Beyond. –2002. – С. 109-134. 7. Гарсиа-<br />
Молина Г. Системы баз данных. Полный курс [Текст]: пер.<br />
с англ. / Г. Гарсиа-Молина, Дж. Ульман, Дж. Уидом.– М.:<br />
Вильямс, 2003. – 1088 с. 8. Танянский, С.С. Организация<br />
запросов к распределенным данным средствами логического<br />
программирования [Текст] / С.С. Танянский, Ю.А.<br />
Мальков // Бионика <strong>интеллект</strong>а: науч.-техн. журнал. –<br />
2010. – <strong>№</strong>1(72). С. 118-121.<br />
Поступила в редколлегию 14.09.<strong>2011</strong><br />
УДК 004.652.4, 004.652.6<br />
Відображення елементів реляційної моделі даних в елементи<br />
дедуктивної моделі / С.С. Танянський, Ю.А. Мальков<br />
// Біоніка інтелекту: наук.-техн. журнал. – <strong>2011</strong>. –<br />
<strong>№</strong> 3 (<strong>77</strong>). – С. 136-142.<br />
В статті розглянуто відображення компонентів реляційної<br />
моделі в компоненти дедуктивної, що дає підстави<br />
для побудови системи інтеграції з локальнонезалежними<br />
даними, заснованої на використанні логічного програмування<br />
та дедуктивного представлення бази даних.<br />
Іл.: 7. Бібліогр.: 8 найм.<br />
UDK 004.652.4, 004.652.6<br />
Mapping relational model items to deductive model items /<br />
S.S. Tanyansky, Y.A. Malkov // Bionics of Intelligense: Sci.<br />
Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – P. 136-142.<br />
This article was focused on mapping items of relational<br />
model to deductive model items. This mapping provides a<br />
basis for constructing integration system with locally independent<br />
data, which based on application of logic programming<br />
and deductive presentation of databases.<br />
fig.: 7. Ref.: 8 items.
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 143–149 хНурэ<br />
УДК 004.853<br />
Введение<br />
Проблеме извлечения значимой информации из<br />
web-документов посвящается огромное количество<br />
научных статей и прикладных разработок в течение<br />
длительного промежутка времени (начиная с конца<br />
20 века и по наши дни). Но в большинстве существующих<br />
решений присутствует ряд ограничений<br />
или допущений, связанных с написанием эффективных<br />
алгоритмов работы специализированных<br />
систем, способных проанализировать и обработать<br />
почти любой источник, содержащий необходимые<br />
данные [1]. В первую очередь, это связано со сложностями<br />
понимания ими сути значимой информации<br />
и отличием ее от другой информации, которая<br />
не удовлетворяет требованиям или критериям, поставленным<br />
перед системой. Таким образом, это<br />
позволит утверждать о том, что данная проблема<br />
в полной мере не решена, а значит, исследование<br />
в данной области не утратило своей актуальности.<br />
1. Причины возникновения данной проблемной<br />
области<br />
Попробуем разобраться в причинах возникновения<br />
указанной проблемы. Итак, для начала<br />
остановимся на определении общего понятия<br />
термина <strong>информация</strong>. Данный термин означает<br />
сведения, передаваемые источником получателю<br />
(приемнику). Он всегда связан с материальным<br />
носителем, с материальными процессами и имеет<br />
некоторое представление. Информация, представленная<br />
в какой-либо форме, называется сообщением.<br />
Cообщения представляются в виде сигналов<br />
и данных. Сигналы используются для передачи<br />
информации в пространстве между источником и<br />
получателем, а данные — для хранения (т. е. для<br />
передачи во времени) [2].<br />
В нашем случае значимая <strong>информация</strong> будет<br />
рассматриваться в виде произвольного набора данных,<br />
сгруппированных в рамках заданной общей<br />
предметной области. По способу упорядочивания<br />
данных в различных типах документов их можно<br />
разделить на три вида: неструктурированные,<br />
частично-структурированные и структурированные<br />
[3].<br />
О.М. Почанский<br />
ХНУРЭ г. Харьков, Украина, pochansky.oleg@yandex.ru<br />
ИЗВЛЕЧЕНИЕ ЧАСТИЧНО-СТРУКТУРИРОВАННОЙ (ЗНАЧИМОЙ)<br />
ИНФОРМАЦИИ ИЗ ДИНАМИЧЕСКИХ Web-ДОКУМЕНТОВ<br />
В данной статье рассматривается модель системы, которая отвечает за извлечение значимой информации<br />
из web-документов. В основе модели лежит метод разделения web-страницы на структурные блоки.<br />
Каждый из них должен проходить проверку на наличие шумов. Те данные, которые прошли проверку<br />
и не содержат шумов, сохраняются в базе знаний системы.<br />
ИЗВЛЕЧЕНИЕ ЗНАНИЙ, БАЗА ЗНАНИЙ, ЗНАЧИМАЯ ИНФОРМАЦИЯ, ШУМ, ОНТОЛОГИЯ,<br />
ДИНАМИЧЕСКИЙ WEB-ДОКУМЕНТ<br />
Как правило, электронные документы составлены<br />
в произвольной форме на естественном <strong>язык</strong>е<br />
и содержат неструктурированные данные. Примером<br />
такого документа может быть статья с произвольной<br />
тематикой, опубликованная в журнале<br />
или газете. Частично-структурированные данные<br />
содержат в основном электронные Web-документы<br />
различных расширений (php, aspx, jsp, htm и т.д.),<br />
оформленные в текстовом формате HTML, где<br />
они описываются с помощью специальных тэгов.<br />
И наконец, структурированные данные содержат<br />
ХML-документы и базы данных [1]. Их относят к<br />
данному типу благодаря наличию специфических<br />
инструментов. В случае XML это – DTD (преамбула<br />
документа, где определяются его компоненты<br />
и структура) и XML schema (<strong>язык</strong> описания структуры<br />
XML документа) [1]. В случае базы данных<br />
это – функциональная особенность программной<br />
оболочки, в которой она была создана, и специализированный<br />
<strong>язык</strong> запросов – SQL, с помощью<br />
которого можно обратиться к любому существующему<br />
элементу базы данных.<br />
Следовательно, при исследовании вопроса извлечения<br />
значимой информации необходимо учитывать<br />
не только соответствие извлекаемых данных<br />
одной предметной области, но и тип источника, в<br />
котором они находятся.<br />
При этом к основным критериям значимости<br />
любой информации можно отнести: актуальность,<br />
достоверность, полноту и «чистоту» находящихся<br />
в ней данных. Первые три критерия можно отнести<br />
к субъективным понятиям, которые могут быть<br />
выявлены экспериментальным путем. В свою очередь,<br />
последний критерий можно отнести к объективным<br />
характеристикам, так как он отвечает за<br />
содержательную часть [4] и отражает качество получаемой<br />
информации – сигнализирует о зашумленности<br />
(отсутствуют данные, которые не несут<br />
смысловой нагрузки в рамках заданной тематики).<br />
Следовательно, <strong>информация</strong>, содержащая данные,<br />
не удовлетворяющая поставленному критерию –<br />
незначима.<br />
Также стоит учитывать, что Internet делает потенциально<br />
доступными огромные объемы ин-<br />
143
формации и, тем самым, ставит новые проблемы<br />
эффективной работы с такими объектами. В ситуации<br />
«информационной перегрузки» особенно<br />
актуальными становятся автоматические методы<br />
работы с большими объемами информации [5].<br />
Исходя из этого, можно предположить, что любая<br />
специализированная система, целью которой<br />
является извлечение значимой информации из<br />
определенного источника, должна заранее определить,<br />
с каким типом документа ей<br />
предстоит работать. А для этого системе<br />
необходимо скорректировать<br />
свой алгоритм работы автоматически<br />
под определенную структуру<br />
данных. При этом она должна разбить<br />
процесс обработки и извлечения<br />
знаний из источников информации<br />
на несколько этапов (рис. 1).<br />
Как видно из рис. 1, специализированной<br />
системе необходимо<br />
выполнить ряд дополнительных<br />
действий, прежде чем перейти непосредственно<br />
к извлечению значимой<br />
информации из документа.<br />
Причем данные действия должны<br />
быть выполнены в четко определенной<br />
последовательности, в противном<br />
случае это может привести<br />
к сбою всей системы. Это оказывает<br />
негативное влияние на производительность<br />
почти любой системы с<br />
указанным выше принципом рабо-<br />
ты. В конечном счете, автоматическое<br />
определение типа документа<br />
увеличивает время поиска значимой<br />
информации для каждого исследуемого<br />
документа. Но если заранее<br />
определить его тип и выполнять<br />
анализ нескольких источников информации<br />
параллельно, то можно<br />
повысить производительность всей<br />
системы и тем самым уменьшить<br />
временные затраты на поиск необходимого<br />
документа (рис. 2)<br />
Как видно из рис. 2, специализированная<br />
система за одну и ту же<br />
единицу времени может обработать<br />
в 3 раза больше документов при<br />
условии схожести алгоритмов и равном<br />
объеме извлекаемых данных.<br />
Хотя при этом область применения<br />
данной системы сужается из-за работы<br />
только с определенным типом<br />
документов.<br />
В настоящие время существуют<br />
системы, способные работать как с<br />
документами любых типов, так и с<br />
144<br />
одним, заранее определенным. Далее рассмотри<br />
некоторые из них.<br />
2. Обзор существующих решений<br />
Примером системы, которая способна работать<br />
с документами любых типов, является KIM – Semantic<br />
annotation platform [6]. Данная система отвечает<br />
за извлечение и обработку данных, получаемых<br />
из различных информационных источников.<br />
Рис. 1. Этапы работы специализированной системы по извлечению<br />
информации из заданного документа любого типа<br />
Рис. 2. Параллельная работа специализированной системы по извлечению<br />
информации из заданных документов заранее определенного типа
Она обеспечивает выполнение поставленных задач<br />
путем автоматического индексирования документов<br />
любого типа и построения их семантических<br />
аннотаций на основании проведенного анализа<br />
полученных данных. Для этого формируется база<br />
знаний, основанная на онтологии высшего порядка,<br />
в которой хранятся семантические аннотации<br />
в виде ключевых объектов (опорных слов) проиндексированных<br />
документов. Таким образом, в<br />
любом документе выделяются данные, которые<br />
соответствуют определенным классам, описанным<br />
в созданной онтологии. Каждый из классов, в свою<br />
очередь, делится на подклассы. Названия классов<br />
и подклассов соответствуют определенному общему<br />
термину, к которому можно отнести каждый из<br />
ключевых объектов (ключевой объект может соответствовать<br />
только одному классу или подклассу).<br />
Все проаннотированные документы могут быть<br />
разделены на группы (на основании проанализированной<br />
meta-информации), каждая из которых<br />
соответствует определенной предметной области.<br />
Причем все данные в рамках одной группы связаны<br />
между собой. Это обеспечивает доступ ко всем<br />
ключевым объектам соответствующей тематики из<br />
документа любого типа, который был предварительно<br />
обработан данной системой.<br />
К достоинствам KIM – Semantic annotation platform<br />
можно отнести:<br />
1. Работу с любыми типами документов.<br />
2. Взаимосвязь всех ключевых объектов различных<br />
документов, данные которых хранятся в базе<br />
знаний системы.<br />
3. Возможность выполнения поиска документов<br />
по ключевым объектам.<br />
К недостаткам KIM – Semantic annotation platform<br />
можно отнести:<br />
1. Необходимость выполнения дополнительной<br />
обработки документа при создании семантических<br />
аннотаций.<br />
2. Отсутствие проверки на зашумленность и повторяемость<br />
информации в исследуемых документах.<br />
3. Неиспользование ключевых объектов для<br />
определения тематики документа. Ключевые объекты<br />
несут чисто информативный характер.<br />
4. Отсутствие автоматизации составления логических<br />
правил, по которым ключевые объекты относят<br />
к какому-либо классу или подклассу, а также<br />
онтологии высшего порядка<br />
5. Отсутствие возможности вносить в структуру<br />
онтологии высшего порядка изменения в процессе<br />
роботы системы.<br />
Примером системы, которая способна работать<br />
с документами определенного типа, является<br />
программа, основанная на методе извлечения<br />
значимой информации из web-страниц путем их<br />
разделения на содержательную и навигационную<br />
часть. Данная система использует алгоритм, основанный<br />
на выделении повторяющихся фрагментов<br />
страниц одного сайта. Для этого на вход алгоритму<br />
подается директория с файлами, которая соответствует<br />
страницам одного сайта. После этого он<br />
анализирует данные файлы и выделяет в них повторяющиеся<br />
фрагменты, которые считаются навигационной<br />
частью. В зависимости от настроек,<br />
алгоритм либо удаляет навигационную часть из<br />
файла, либо выделяет навигационную часть специальными<br />
тегами. В свою очередь неповторяемые<br />
фрагменты относят к содержательной части, которая<br />
используется при информационном поиске<br />
документа, соответствующего формализованному<br />
запросу пользователя [4].<br />
К достоинствам данной системы можно отнести:<br />
1. Выполнение функций поиска данных, соответствующих<br />
запросу, сформированному пользователем,<br />
только в содержательной части web-документа.<br />
2. Эффективную обработку информации на<br />
сайтах форумов, блогов, web-конференций, которые<br />
имеют стандартную структуру.<br />
3. Возможность периодического мониторинга<br />
фиксированного списка сайтов.<br />
К недостаткам данной системы можно отнести:<br />
1. Необходимость выполнения дополнительной<br />
обработки web-документа при его разделении<br />
на содержательную и навигационную часть.<br />
2. Низкая эффективность поиска webдокумента,<br />
в случае если в его навигационной части<br />
содержится <strong>информация</strong>, релевантная сформированному<br />
запросу.<br />
3. Отсутствие проверки на зашумленность содержательной<br />
части web-документа<br />
4. Наличие случаев, в которых навигационную<br />
часть невозможно выявить или она выявлена неправильно<br />
на основе анализа совпадающих частей<br />
страниц.<br />
5. Отсутствие функции лексического анализа содержательной<br />
части web-документа при поиске релевантных<br />
данных по сформированному запросу.<br />
6. Работу только с одним типом документов.<br />
Исходя из этого, можно сделать вывод, что независимо<br />
от количества поддерживаемых типов<br />
документов различными системами, они обладают<br />
рядом характерных недостатков. Главным образом<br />
они заключается в отсутствии возможности выявления<br />
и исключения шумов при извлечении данных<br />
из информационных источников.<br />
Решением указанной проблемы посвящена<br />
данная статья.<br />
3. Общие проблемы рассмотренных систем<br />
Основываясь на приведенных выше исследованиях,<br />
было выявлено, что эффективного решения<br />
проблемы деления данных из любого информационного<br />
источника на значимую и незначимую<br />
145
часть не предложено. В основном это вызвано наличием<br />
ряда следующих причин:<br />
1. Большинство систем опираются на ключевые<br />
слова, которые могут иметь несколько значений и<br />
относится к разным тематикам, и поэтому возможно<br />
появление документов, не связанных со сформированным<br />
запросом.<br />
2. Часто при анализе страницы web-документа<br />
исследуется только meta-данные, при этом другая<br />
<strong>информация</strong> не рассматривается, как следствие,<br />
возникают шумы в полученных данных.<br />
3. В системах, направленных на извлечение информации<br />
из документов, отсутствуют критерии,<br />
характеризующие качество получаемой информации.<br />
4. В процессе работы систем, направленных на<br />
извлечения информации, не формируются список<br />
«надежных» источников, данные из которых содержат<br />
наименьшее количество шумов. Это может<br />
отрицательно сказаться на эффективности работы<br />
всей системы в целом.<br />
5. Большинство систем не выделяет значимую<br />
информацию из проанализированного источника<br />
и не хранит её в формате базы знаний. Тем самым<br />
данные системы сталкиваются с необходимостью<br />
повторной обработки данных во время появления<br />
новых поисковых запросов.<br />
4. Постановка задачи<br />
Исходя из изложенных выше причин, необходимо<br />
создать <strong>интеллект</strong>уальную систему, способную<br />
извлекать значимую информацию из документов<br />
с минимальным количеством шумов. Также она<br />
должна быть лишена основных недостатков и проблем,<br />
выявленных при рассмотрении схожих систем.<br />
Для повышения эффективности будущей<br />
системы было принято решения обрабатывать<br />
динамические web-документы только с<br />
частично-структурированными данными (htmlдокументами)<br />
в связи с тем, что она рассчитана на<br />
работу преимущественно с Internet ресурсами, где<br />
данный тип документов наиболее распространен.<br />
5. Метод решения<br />
На основании сформированной выше задачи<br />
предлагается рассмотреть модель работы системы<br />
извлечения значимой информации, которая способна<br />
повысить критерии качества получаемых<br />
данных. Данная модель отталкивается от предположения,<br />
что любой современный информационный<br />
web-документ можно разбить на различные<br />
структурные блоки. Каждый из этих блоков в свою<br />
очередь содержит определенные данные, посвященные<br />
заданной тематики, и выделен произвольным<br />
набором повторяемых html-тегов. В качестве<br />
примера одного из таких блоков возьмем часть<br />
146<br />
html-кода, взятого из сайта футбольного клуб “Металлист”<br />
(http://www.metallist.kharkov.ua). Итак,<br />
данный блок имеет следующую структуру:<br />
МЕТАЛЛИСТ<br />
ОПРОС<br />
Как, по Вашему мнению, завершится<br />
матч Металлист - Таврия?<br />
голосовать<br />
Его границы были выделены по следующему<br />
принципу: ключевой html-тег, в данном случае<br />
это , не может быть<br />
частью другого тега. К примеру, тег является<br />
частью рассмотренного выше ключевого тега,<br />
следовательно, он не может быть началом другого<br />
структурного блока. Закрытие ключевого тега () символизирует окончание описания данного<br />
структурного блока. Исключение составляют теги,<br />
отвечающие за формирование и описание общей<br />
структуры любой web-страницы.<br />
Если учесть, что структуру современного динамического<br />
web-документа можно представить в<br />
форме ориентированного графа [7], корнями которого<br />
являются гипертекстовые ссылки, представленные<br />
в виде меню-навигации, то блок, который<br />
содержит ссылки на внешний источник или другую<br />
страницу из другого домена (за исключением<br />
ссылок встречаемых в обширных текстовых описаниях),<br />
можно принять за шум. А значит, они не<br />
должны учитываться при обработке web-страницы<br />
данной системой. Остальные информационные<br />
блоки анализируются и записываются в базу знаний<br />
в соответствии с критериями, которые были<br />
предварительно заданы пользователем.<br />
Общий принцип модели системы, отвечающей<br />
за извлечения значимой информации из webстраницы,<br />
рассмотрен ниже (рис. 3).<br />
Далее остановимся подробнее на критериях,<br />
которые предварительно задаются пользователем.<br />
В общем случае они могут выглядеть в форме простых<br />
пожеланий в формате предоставляемых данных.<br />
К примеру, пользователи могут сформировать<br />
списки любимых источников и обмениваться ими<br />
между собой в форме rdf-файлов (рис. 4).<br />
Также в процессе работы данной системы осуществляется<br />
подсчет качества информации, которая<br />
содержится на текущей web-странице, по фор-<br />
муле:<br />
Iq = Ial − I b,<br />
где I q – процент значимой информации на текущей<br />
web-странице; I al –процент всей информации на<br />
текущей web-странице (обычно равен 100%); I b –<br />
процент шумов на текущей web-странице.<br />
Основываясь на данной формуле, можно выстроить<br />
внутренний рейтинг приоритета обработ-
Рис. 3. Общая структурная схема модели системы,<br />
отвечающей за извлечение значимой информации<br />
из динамической web-страницы<br />
ки информационных источников с наименьшим<br />
количеством шумов при условии схожести их тематик.<br />
5. Анализ полученных результатов<br />
В рамках рассмотренной модели системы, отвечающей<br />
за извлечения значимой информации<br />
из динамического web-документа, была сформирована<br />
база знаний сайта футбольного клуба “Металлист”.<br />
Каждый класс полученной онтологии<br />
соответствует пункту навигации данного сайта.<br />
Причем его название сформировано с использованием<br />
терминологический словаря онтологий по<br />
соответствующей предметной области [8].<br />
Стоит отметить, что экземпляры каждого из<br />
этих классов хранят информацию, полученную<br />
при анализе web-страниц сайта футбольного клуба<br />
“Металлист” (рис. 5). Причем в этой онтологии<br />
данные могут быть представлены как текстом, так<br />
и картинками или видео. Также для каждой webстраницы<br />
формируются «белые» и «черные» списки,<br />
<strong>информация</strong> из которых автоматически считается<br />
значимой в первом случае или шумом, во<br />
втором.<br />
Далее рассмотрим некоторые из основных полей,<br />
которые отображены на данном рисунке:<br />
1. hasadress – хранит URL страницы, из которой<br />
были взяты данные;<br />
2. hasname – хранит имя страницы, из которой<br />
были взяты данные;<br />
3. haspictures – хранит URL картинок страницы,<br />
из которой были взяты данные;<br />
Рис. 4. Пример отображения списка любимых источников в редакторе онтологий Protйgй<br />
147
4. hasLiteList – хранит URL страниц, которым<br />
доверяет система;<br />
5. hasBlackList – хранит URL страниц, которым<br />
не доверяет система;<br />
6. hasquality – хранит процент значимой информации<br />
от общего числа;<br />
148<br />
7. hasresorse – хранит значимую информацию,<br />
которая была взята из данной web-страницы<br />
(рис. 6).<br />
В заключение можно сделать вывод, что полученная<br />
онтология позволяет сократить время<br />
поиска нужной информации за счет структуриро-<br />
Рис. 5. Форма представление данных взятых из web-страницы сайта футбольного клуба “Металлист”<br />
Рис. 6. Выделенная значимая <strong>информация</strong> из web-страницы<br />
(http://www.metallist.kharkov.ua/history.html)
вания источников данных. Причем в полученном<br />
результате будут отсутствовать шумы, что ускорит<br />
процесс его обработки и скажется на эффективности<br />
применения сформированной базы знаний<br />
в смежных системах.<br />
Выводы<br />
Полученная <strong>интеллект</strong>уальная модель системы,<br />
отвечающей за извлечения значимой информации<br />
из web-страниц, обладает рядом следующих преимуществ:<br />
1. Извлекаемая <strong>информация</strong> проверяется на<br />
наличие шумов и повторяющихся данных, которые<br />
не записываются в базу знаний системы.<br />
2. В процессе работы системы формируется белый<br />
список ссылок, которые должны быть проработаны<br />
в первую очередь, и черный список, ссылки<br />
из которого не анализируются, а полученные<br />
данные из них автоматически считаются шумом.<br />
3. Хранение и обновления данных из проанализированных<br />
динамических web-документов осуществляется<br />
в формате единой базы знаний, через<br />
которую также выполняется поиск информации,<br />
релевантной сформированному запросу.<br />
4. Для учета лексической взаимосвязи данных<br />
используется терминологический словарь онтологий.<br />
5. Значимая <strong>информация</strong> в базе знаний разделяется<br />
за формой представления (картинки, текст,<br />
видео).<br />
Подводя окончательную черту в описании модели<br />
системы, отвечающей за извлечения значимой<br />
информации из web-страницы, нужно отметить,<br />
что сформированная база знаний может использоваться<br />
при создании специализированных поисковых<br />
систем [8], а именно – в процессе анализа<br />
заданного web-документа, применяя и используя<br />
описанные выше особенности.<br />
В последующих разработках планируется реализовать<br />
механизм проверки ссылок, встречаемых<br />
в обширных текстовых описаниях, а также применить<br />
описанную выше модель в рамках создание<br />
единой поисковой системы.<br />
Список литературы: 1. Chia-Hui, Ch. A survey of Web Information<br />
Extraction [Text] / Ch. Chia-Hui, K. Mohammed,<br />
R.G. Moheb, f. S. Khaled. // IEEE Transactions on Knowledge<br />
and Data Engineering – 2006. <strong>№</strong>18/10. – С. 1411-1428.<br />
2. Информация [Электронный ресурс] / Википедия –<br />
интернет энциклопедия. – Режим доступа: URL: http://<br />
ru.wikipedia.org/ – 18.09.<strong>2011</strong>. 3. Беленький, А. Текстомай-<br />
нинг. Извлечение информации из неструктурированных<br />
текстов [Электронный ресурс] / А. Беленький // Журн.<br />
“КомпьютерПресс”. – 2008. <strong>№</strong>10. Режим доступа: URL:<br />
http://www.compress.ru/article.aspx? id=19605&iid=905<br />
– 18.09.<strong>2011</strong>. 4. Агеев, М. С. Извлечение значимой информации<br />
из web-страниц для задач информационного<br />
поиска [Текст] / М. С. Агеев, И. В. Вершинников, Б. В.<br />
Добров // Интернет-математика 2005. Автоматическая<br />
обработка веб-данных. – М.:”Яndex”, 2005. – С. 283-301.<br />
5. Браславский, П. Автоматическое реферирование вебдокументов<br />
с учетом запроса [Текст] / П. Браславский, И.<br />
Колычев // Интернет-математика-2005. Автоматическая<br />
обработка веб-данных. – М. : “Яndex”, 2005. - С. 485-501.<br />
6. Popov, B. KIM – Semantic Annotation Platform [Text] / B.<br />
Popov, A. Kiryakov, D. Manov, D. Ognyanoff, M. Goranov<br />
// Journal of Natural Language Engineering, <strong>№</strong>10/3-4. – С<br />
375-392. 7. Ланде, Д.В. Поиск знаний в Internet. Профессиональная<br />
работа [Текст] : пер. с англ. – М.: Издательский<br />
дом “Вильямс”, 2005. – 272 с. 8. Почанский, О.М.<br />
Модель построение адаптивных Web-страниц на основе<br />
<strong>интеллект</strong>уального анализа сети Internet [Текст] / О.М.<br />
Почанский // Журн. восточно-европейский журнал передовых<br />
технологий. – 2010. - <strong>№</strong> 4/7(46). – С. 66-69.<br />
Поступила в редколлегию 19.09.<strong>2011</strong><br />
УДК 004.853<br />
Витяг частково-структурованої (значущої) інформації<br />
з динамічних Web-документів / О.М. Почанський // Біоніка<br />
інтелекту: наук.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –<br />
С. 143-149.<br />
В даній роботі описана модель інтелектуальної системи,<br />
що відповідає за вилучення значущої інформації<br />
з Web-сторінок. Це виконується шляхом поділу кожної<br />
сторінки аналізованого динамічного Web-документа на<br />
структурні блоки. Потім ці сторінки перевіряються на<br />
наявність шумів. А далі ті з них, які пройшли перевірку,<br />
зберігаються в базі знань. Результатом роботи системи<br />
є база знань, заповнена якісною інформацією (відсутні<br />
шуми) по заданій тематиці, яка може бути використана<br />
при створенні ефективних пошукових систем.<br />
Іл. 6. Бібліогр.: 7 найм.<br />
UDC 004.853<br />
Removing partially-structured (significant) information<br />
from dynamic Web-documents / OM Pochansky // Bionics of<br />
Intelligense: Sci. Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). – P. 143-149.<br />
The article describes the model of the intelligent system<br />
which is responsible for extracting meaningful information<br />
from Web-pages. Its main task is to divide each page of the<br />
analyzed dynamic Web-documents into different parts. Then<br />
they tested for the presence of noise, after that they saved into<br />
a knowledge base. The result of the system is the knowledge<br />
base that filled with quality information (without any noise),<br />
according to the chosen topic, which can be used to create effective<br />
search engines.<br />
fig. 6. Ref.: 7 items.<br />
149
УДК 007.681.5:519.7<br />
150<br />
сТрукТурная, Прикладная и маТемаТическая лингвисТика<br />
Вступ<br />
Стаття є логічним продовженням досліджень<br />
авторів в галузі систем штучного інтелекту, що<br />
були розглянуті раніше, наприклад, [1–3]. Так, в<br />
умовах роботи реальних систем із високим рівнем<br />
невизначеності інформації для побудови інтелектуальних<br />
систем неминуче використання нових<br />
інформаційних технологій, зорієнтованих на потоки<br />
контекстно-залежної інформації; фактично<br />
необхідна розробка природно-мовних принципів<br />
побудови інтелектуального управління – теорії інтелектуальних<br />
систем управління (ІСУ) – для систем<br />
вищих рівнів системної складності. Отже, для<br />
правомірного використання скінченного автомата<br />
(комп’ютера) у складі інтелектуальної системи<br />
теорія повинна розглядати можливість побудови<br />
абстрактних конструкцій, що реалізують не обчислювані<br />
в звичному значенні об’єкти. Все, що<br />
дотепер винайдене, всі узагальнені функціональні<br />
перетворення можна застосувати тільки для подання<br />
зліченних сукупностей процесів, поданих<br />
потоками, хоча і нескінченними, але однорідними,<br />
що складаються з нескінченно малих невиразних<br />
сутностей. У разі відкритих (інтелектуальних) систем<br />
ми маємо справу з незчисленною множиною<br />
потоків, кожний із яких може розкритися в більш<br />
ніж зчисленну сукупність потоків, що складаються<br />
з нескінченної різноманітності структур[4].<br />
Мета роботи. Основним завданням цієї роботи<br />
є викладення новоствореної концепції уніфікації<br />
методів та засобів побудови просторових багатозначних<br />
структур мовних систем. Предметом досліджень<br />
є моделювання інтелектуальної діяльності<br />
людей як у зовнішньому її прояві (вирішення<br />
складних завдань, розуміння природної мови, інтерпретація<br />
візуальної інформації та мови), так і у<br />
внутрішньому (накопичення, надання і використання<br />
знань).<br />
Згідно з завданням роботи та враховуючи основні<br />
аксіоми теорії інтелектуальних систем управління<br />
інтегруємо необхідні та уже розроблені природномовні<br />
принципи побудови інтелектуального<br />
М.Ф. Бондаренко, З.Д. Коноплянко, Г.Г. Четвериков<br />
ХНУРЕ, г. Харків, Україна, chetvergg@gmail.com<br />
КОНЦЕПЦІЇ УНІФІКАЦІЇ ІНФОРМАЦІЙНО-ІНТЕЛЕКТУАЛЬНИХ<br />
ТЕХНОЛОГІЙ В СИСТЕМАХ МОВЛЕННЯ<br />
Стаття присвячена аналізу проблеми створення систем штучного інтелекту, які дозволяють моделювати<br />
на логічному та апаратному рівнях процеси інтелектуального управління, що описані математичними<br />
операціями над природною мовою, і які є елементами k-значної структурної організації інформаційноінтелектуальних<br />
технологій. Показана необхідність і можливість розробки загальної теорії побудови<br />
інтелектуальних систем штучного інтелекту, яка могла б стати методологічною основою створення нових<br />
інформаційних технологій.<br />
ЛОГІКА, ЗНАННЯ, ПРИРОДНА МОВА, ЛІНГВІСТИЧНІ ТЕХНОЛОГІЇ, k-ЗНАЧНА СТРУКТУРА,<br />
АСП-СТРУКТУРА, ШТУЧНИЙ ІНТЕЛЕКТ<br />
управління і систем штучного інтелекту. У цій роботі,<br />
перш за все, хотілося б показати необхідність<br />
і можливість розробки загальної теорії побудови<br />
інтелектуального управління і систем штучного<br />
інтелекту, яка могла б стати методологічною основою<br />
безпосередньо для створення нових інформаційних<br />
технологій[1–5].<br />
1. Принципи побудови природно мовних систем<br />
штучного інтелекту<br />
Морфологічний аналіз. Задача морфологічного<br />
аналізу [1, 3] полягає в ідентифікації словоформ та<br />
присвоєнні кожній словоформі комплексу морфологічної<br />
інформації (КМІ). Такий комплекс складається<br />
із морфологічно-інформаційних рядків<br />
(МІ-рядків) з наступною структурою:<br />
– номер, , (де<br />
номер – порядковий номер даної словоформи у<br />
фразі);<br />
– основа (ознака основи) – код семантичної<br />
ознаки, номер синтаксичної чи семантичної моделі<br />
керування, що присвоєні даній основі в словнику<br />
основ;<br />
– МІ – частина мови та її граматичні категорії:<br />
рід, число, відмінок, час, особа тощо.<br />
Існує два методи реалізації [1, 3] морфологічного<br />
аналізу (МА): словниковий (декларативний)<br />
(використовується для аналізу мов із нерозвинутим<br />
відмінюванням слів (англійська, французька<br />
тощо)); алгоритмічний (процедурний) морфологічний<br />
аналіз. При МА здійснюється розчленування<br />
словоформ на основу та закінчення і в словниках<br />
зберігаються як основи, так і їх закінчення.<br />
МА здійснюється шляхом пошуку в складі словоформи,<br />
що аналізується, деякої словникової основи<br />
та певного словникового закінчення. Потім<br />
виконують порівняння інформації про основу та<br />
закінчення і отримують комплекс морфологічної<br />
інформації для всієї словоформи.<br />
Під час МА змінюваної словоформи її кінцеву<br />
частину за черзі порівнюють із закінченнями словника.<br />
Після порівняння ту частину словоформи,
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 150–156 хНурэ<br />
що співпала, відокремлюють і отримують припустиму<br />
основу (ПОС), припустиме закінчення (ПЗК)<br />
та припустиму морфологічну інформацію (ПМІ).<br />
Дані про ПЗК (ПМІ) зчитують із словника закінчень<br />
(морфологічної інформації). Потім переходять<br />
до пошуку інших ПЗК, ПОС та ПМІ.<br />
На другому кроці аналізу словоформи виконується<br />
ідентифікація її можливих основ шляхом перевірки<br />
збіжності отриманих припустимих основ із<br />
вмістом машинного словника основ.<br />
На третьому кроці МА словоформи порівнюється<br />
інформація з тими припустимими основами<br />
та ПЗК, що отримали підтвердження за допомогою<br />
словника основ.<br />
Ефективність МА суттєво залежить від виду подання<br />
машинних словників у пам’яті ЕОМ та способу<br />
їх кодування. При цьому доцільно мати окремий<br />
допоміжний словник перенумерованих основ,<br />
що наявні у одному примірнику та розташовані в<br />
алфавітному порядку.<br />
Для подання значень граматичних категорій<br />
будь-якої словоформи використаємо 9-ти розрядний<br />
10-значний код. Порозрядно у р(1), р(2) – закодовано<br />
частину мови словоформи, р(3) – тип та<br />
клас прийменника чи розрядів за значенням (іменника,<br />
повного прикметника); р(4.і) – дієслово 1–3<br />
особи відповідно; р(5) – код значення числа (однина,<br />
множина); р(6) – код відмінка (називний, родовий,<br />
давальний ...); р(7) – код категорії пасивностіактивності;<br />
р(8) – код часу (теперішній, минулий,<br />
майбутній); р(9) – код категорії виду (доконаний,<br />
недоконаний) закінчення [1].<br />
Для формування одного МІ-рядка до всієї словоформи<br />
порівнюють код основи та код закінчення<br />
на відповідність їх перших п’яти розрядів, якщо<br />
співпадання немає, то дані несумісні. Для порівняння<br />
вибирають черговий код закінчення. Якщо<br />
відповідність встановлена, то решту розрядів результуючого<br />
коду формують за правилами 10-значної<br />
диз’юнкції значень відповідних розрядів кодів<br />
основи та закінчення. При цьому попередньо перевіряють<br />
умову співпадання операндів чи рівність<br />
одного з них нулеві.<br />
Таким чином, описаний алгоритм дозволяє інтерпретувати<br />
різноманіття граматичного оброблення<br />
українських флексій (аналіз, синтез, нормалізація,<br />
корегування помилок тощо) за допомогою<br />
розв’язків канонічних рівнянь виду L ϕ (X, Y) = 1.<br />
Синтаксичний та семантичний аналіз. Тепер<br />
ми переходимо до розгляду необхідних відомостей<br />
про контекстно-залежні (КЗ) мови, тобто про<br />
реалізацію інтелектуального управління, коли нас<br />
цікавить можливість мінімізації яких би то не було<br />
втрат при використанні скінченого автомата як<br />
основи КЗ-мови.<br />
КЗ-мова (природна мова людини) в галузі наукової<br />
термінології володіє великою невизначе-<br />
ністю, що пояснюється частково поліморфізмом і<br />
контекстно-залежним поданням наукової інформації,<br />
а іноді (і для інформатики і для інтелектуального<br />
управління це особливо важливо) – недбалістю<br />
використання термінів.<br />
Семантика визначає відношення між знаками і<br />
їх концептами, тобто задає зміст чи значення конкретних<br />
знаків[7].<br />
Слова в мові не йдуть у довільному порядку і закони<br />
їх упорядкування є предметом синтаксису.<br />
Синтаксис описує структуру можливих фраз. Опис<br />
синтаксичних структур використовує наступні граматики<br />
(формалізми) [8–14]:<br />
– дерева синтаксичного підпорядкування;<br />
– системи складових;<br />
– розширені мережі переходів.<br />
Таким чином, синтаксичний аналіз використовує<br />
заготовлені за допомогою граматики шаблони<br />
вхідних фраз із метою виявлення (встановлення)<br />
відповідності між послідовністю, що аналізується,<br />
та значущими синтаксичними структурами. Основним<br />
формальним засобом математичного опису<br />
природної мови є алгебра скінченних предикатів<br />
(АСП), оскільки мова є скінченою, дискретною<br />
та k-значною. АСП у процесі її дії використовує<br />
процедури розв’язування рівнянь, а не алгоритмів.<br />
У роботі [8] в процесі синтаксичного розбору<br />
природномовних висловлювань розроблено метод<br />
побудови синтаксичних дерев для аналізу простих<br />
речень. Для встановлення інтегральних закономірностей<br />
обробки природної мови проаналізуємо,<br />
що власне відбувається у процесі аналітичних досліджень<br />
вищих лінгвістичних механізмів дії російської<br />
мови.<br />
Семантика. Вихідним матеріалом для семантичного<br />
аналізу природної мови є синтаксична<br />
структура фрази чи її фрагмента, а також дані про<br />
значення словоформ. Основна задача семантичного<br />
аналізу – це зняття неоднозначності, морфологічної<br />
та лексичної багатозначності словоформ та<br />
синтаксичних структур речень.<br />
У роботі [8] об’єктом математичного моделювання<br />
є словосполучення, що мають інструментальне<br />
значення. Для аналізу семантики повідомлення<br />
на природній мові необхідно визначити значення<br />
одиниць повідомлення. Значення слів класифікують<br />
згідно з набором апріорних ознак: дія – інструмент<br />
дії або, іншими словами, дієслово (конкретної дії<br />
чи акційне) – іменник у певному відмінку (називний,<br />
родовий, давальний тощо).<br />
Метод, що покладений в основу – метод семантичного<br />
аналізу. Для аналізу семантики повідомлення<br />
на природній мові необхідно визначити<br />
значення одиниць повідомлення. Значення слів<br />
класифікують згідно з набором апріорних ознак:<br />
дія – інструмент дії або, іншими словами, дієслово<br />
(конкретної дії чи акційне) – іменник у певно-<br />
151
М.Ф. Бондаренко, З.Д. Коноплянко, Г.Г. Четвериков<br />
му відмінку (називний, родовий, давальний тощо).<br />
Для дослідження семантики словосполучень такого<br />
виду використовують семантичні мережі та<br />
зв’язаний з ними математичний апарат, у даному<br />
випадку для кожного словосполучення у вигляді<br />
двох графів. У якості формального апарату подання<br />
семантики використовують АСП [9].<br />
Якщо побудова результуючого графа і відповідного<br />
йому предиката АСП можлива, то це означає,<br />
що розглянута комбінація слів утворює осмислене<br />
словосполучення, а також можливо встановити<br />
чи володіє об’єкт деякою властивістю; визначити<br />
якими властивостями повинен володіти інструмент<br />
для завершення дії та відновити іменник чи<br />
дієслово за набором ознак тощо.<br />
Наступною фазою досліджень стала робота<br />
[10] про змістовну інтерпретацію алгебри ідей.<br />
Тут об’єктом математичного моделювання стали:<br />
смислова однозначність; ситуаційно-предикатна;<br />
ситуаційно-множинна; ситуаційно-кодова ідея.<br />
У роботі [11] об’єктом математичного моделювання<br />
обрана семантика похідних слів із модифікаційними<br />
значеннями.<br />
Відповідно у роботі [12] досліджено міжморфемні<br />
семантичні зв’язки, які виникають у процесі<br />
словоутворення між префіксними та кореневими<br />
морфемами, кореневими та суфіксними морфемами,<br />
а також між основами та закінченнями.<br />
І нарешті робота [13, 14] присвячена процедурам<br />
приписування словоформам семантичних<br />
ознак і моделюванню семантики похідних слова<br />
(мідь-мідний, залізо-залізний).<br />
У всіх випадках ми маємо управління як результат<br />
“оптимізованого інформаційного пошуку”,<br />
мета якого – вироблення управляючого рішення,<br />
тобто відповідного повідомлення на основі аналізу<br />
структури даних, закладеної в машину при проектуванні<br />
інформаційної системи, і її відповідного<br />
наповнення.<br />
“Апріорна семантика” присутня лише у “власне<br />
даних”, тобто в значеннях первинних сигналів і в<br />
“словнику”, в наборі термінів, які “стали константами,<br />
що забезпечують життєздатність системи”.<br />
У випадку відкритих інтелектуальних систем<br />
управління структурно-динамічне, мета якого –<br />
формування деякої “структури знань”, змінної<br />
в часі іменованої структури зв’язків, організація<br />
“інформаційного резонансу”. Власне вироблення<br />
того чи іншого рішення є завданням найважливішої,<br />
але вторинної, похідної від основного завдання<br />
системи – “бути в курсі всіх змін і в постійній<br />
готовності до сприйняття сенсу запиту чи повідомлення<br />
за результатами попередньої інформаційної<br />
посилки”.<br />
Далі семантика накопиченої інформації вже забезпечить<br />
у потрібний момент вироблення структури<br />
зв’язків, що може служити для перетворення<br />
152<br />
в будь-які дії: організаційні, правові, судові, особові,<br />
моральні, чим, власне кажучи, і визначається<br />
інтелектуальне управління в такій інженерній постановці.<br />
Складається враження, що семантика – довільна<br />
вигадка теоретиків, а в природі її і немає зовсім.<br />
Насправді семантика нікуди не пропала, просто<br />
адекватно реалізований апарат “здвоєної<br />
W-граматики [4] акуратно і послідовно “розрізає”<br />
її на дві частини – “константну”, яку вона вкладає<br />
в БД у вигляді літералів і зв’язків і іменує після цього<br />
ієрогліфом словника, і “плинну”, змінну, яка<br />
“залишається в розпорядженні” ПЗ і користувача.<br />
Велика частка народів Землі успішно чинить так<br />
само – користується ієрогліфами, до яких ми повинні<br />
відносити і всю термінологію професійних<br />
сленгів. Звідси випливають два висновки.<br />
Теоретичний – семантика по суті динамічний<br />
об’єкт зі всіма витікаючими наслідками.<br />
Практичний – чи варто використовувати в реалізації<br />
програмних продуктів “функції семантичних<br />
оцінок” тощо, бо це не більше ніж часткова<br />
статистика. Саме часткова, зроблена конкретно і на<br />
конкретному матеріалі і що має дуже опосередковане<br />
відношення до решти всіх випадків. Користь<br />
від неї сумнівна, зате неприємності – гарантовані,<br />
у чому ми пересвідчились на прикладах робіт.<br />
Намагаючись досягти “чистої абстракції”, ми<br />
розриваємо деякі взаємодії, можливо “знищуємо”<br />
процеси, які відповідальні за виникнення та існування<br />
досліджуваних феноменів. Тим самим цілком<br />
імовірно знищується сама можливість рішення<br />
початкової проблеми, відбувається її неусвідомлена<br />
підміна на довгі роки, до тих пір, поки знов не<br />
проявлять себе факти, що не вклалися в поточний<br />
варіант “чистої абстракції”.<br />
Другий варіант – варіант відмови від проблеми<br />
або, що те ж саме – введення революційних перебудов,<br />
фактично є логічним доповненням першого,<br />
принаймні до тих пір, поки ми орієнтуємося на<br />
будь-які раціональні чи ірраціональні методи винайдення<br />
аксіоматики.<br />
Дійсно, чому б не припустити, що істина навіть<br />
не посередині, а в нерозривному зв’язку вказаних<br />
позицій? Повторимо тут висновки про необхідність<br />
постійної зміни правил формальної логіки, але вже<br />
з посиланням на Л. Керрола – “суть полягає в тому,<br />
що правила (гри) постійно змінюються”.<br />
Можливо, причина якраз у “правилах виникнення<br />
зміни правил” і зовсім не потрібно нескінченних<br />
сходів “правил-над-правилами” саме через<br />
динаміку системи. А нескінченні ієрархії “правил<br />
зміни правил” у багатьох дослідженнях виникають<br />
виключно від того, що розглядаються “мертві” статичні<br />
моделі чи довільно вирізані шматки систем.<br />
Інакше кажучи, якісь із цих “правил над правилами”,<br />
об’єктивно існуючі закони відкритих систем
КОНЦЕПЦІЇ уНІФІКАЦІЇ ІНФОрМАЦІЙНО-ІНТЕЛЕКТуАЛЬНИх ТЕхНОЛОГІЙ В СИСТЕМАх МОВЛЕННЯ<br />
можуть проявляти свою дію (або взагалі виникати!)<br />
тільки в деякій “мінімальній сукупності взаємодій”.<br />
Достатньо незначного спрощення “моделі”,<br />
відходу від реальної ситуації, щоб або ніколи їх не<br />
знайти, або одержати цілком реальні і несподівані<br />
наслідки їх дії. Саме ця ситуація найбільш типова<br />
для всіх модельних реалізацій інформаційних систем<br />
[15]. Практично весь попередній матеріал є<br />
коментарем цієї проблеми і пошуком інженерних<br />
шляхів її рішення.<br />
Взагалі кажучи, сказане в деяких аспектах вже<br />
давно всім знайоме, нікого не дивує, що в світі елементарних<br />
частинок, у квантовій механіці діють<br />
закони окремі, не схожі на макромеханіку. В світі<br />
елементарних частинок взаємодія, розпад одних<br />
структур і утворення інших відбуваються “в перебігу<br />
одного кванта часу”, тобто “усередині процесу<br />
нічого немає” (або ми поки що не уміємо уявити<br />
собі, що там є). Навпаки, весь зміст існування інформаційних<br />
систем полягає у процесі перетворення<br />
одних структур в інші [15, 16].<br />
Звернемо увагу, що при цьому для термодинаміки<br />
і статистичної механіки, тобто для подання<br />
ентропійних процесів, виявляється зручним і<br />
адекватним подання процесів у вигляді потоків<br />
однорідних нерозрізнених сутностей, які можна<br />
роздрібнити “до нескінченно малого стану”. Навпаки,<br />
сутність інформаційних систем, що самоорганізуються,<br />
полягає у взаємодії різних потоків,<br />
у нескінченній різноманітності структур, які можливо<br />
представити в скінченному вигляді, у вигляді<br />
скінченних алфавітів, знаків, складених із кінцевого<br />
числа розрізнимих елементів – “бітів”.<br />
Шляхом аналізу значної кількості текстів на<br />
проблемно-орієнтованій мові деякої галузі науки<br />
чи практичної діяльності можна виділити і стандартизувати<br />
обмежену, але достатню групу відношень<br />
R і правил побудови на їх основі логічних<br />
висновків, що практично виконуються на всьому<br />
інформаційному масиві.<br />
Можна виділити декілька рівнів мовного подання<br />
знань у його зв’язку з даними:<br />
• Рівень інтелектуальної системи – знань і дані<br />
існують у формі мовної моделі предметної галузі<br />
(моделі, в багатьох, якщо не у всіх, випадках<br />
невід’ємної від самої предметної галузі, що існує<br />
як мовний опис) і як опис складових цієї системи<br />
на рівні контекстно-залежної мови;<br />
• Рівень інформаційної системи – знання і дані<br />
існують у формі мовної моделі (саме моделі, яка<br />
виділяє з реальної системи дещо, що визнається<br />
“істотним”) на основі використання контекстнонезалежних<br />
мов;<br />
• Рівень математичної моделі – дані, формалізовані<br />
на рівні мови формул і передавальних функцій,<br />
містять у собі знання як формалізовані правила<br />
і апарат продукування висновків;<br />
• Рівень фактографічної моделі – текстові записи<br />
з фіксованою на рівні мови їх подання системою<br />
відношень між ними (наприклад, табличний<br />
запис).<br />
Наведений перелік характеризує різні рівні<br />
роботи з інформацією, виділяє якісно різні групи<br />
інформаційних технологій, особливо підкреслюючи<br />
можливості роботи із знаннями на рівні<br />
контекстно-залежного опису предметної галузі,<br />
тобто на рівні семантики і контекстної залежності<br />
трактування кожної інформаційної посилки. Таким<br />
чином, між першим і подальшими рівнями подання<br />
знань проходить стіна, що відокремлює інтелектуальні<br />
системи від неінтелектуальних, а саме<br />
поняття знань не є винятковою приналежністю інтелектуальних<br />
систем і кардинально змінюється на<br />
кожному рівні його подання.<br />
2. Формалізація принципу уніфікації багатовходових<br />
k-значних структур<br />
Для того щоб в узагальненому вигляді аналітично<br />
описати та сформулювати принцип симбіозу в<br />
просторових k-значних структурах, відзначимо, що<br />
присвоювання значень алфавіту Ek ∈ {0, 1, 2, ..., k– 1}<br />
здійснюється за рахунок вхідних сигналів X ∈ {0, 1,<br />
2, ..., k– 1}. У загальному випадку кожному станові<br />
вхідного сигналу X відповідає певне значення вихідного<br />
сигналу Y∈{0, 1, 2,...,k–1}. Функціональний<br />
перетворювач є багатополюсником, що має n<br />
входів і один вихід, який відображає прямий добуток<br />
n множин {x} i (i = 1, 2, ..., n) на множину {y}.<br />
n<br />
Об’єднання множин { x} i називається вхідним<br />
∑<br />
i = 1<br />
алфавітом, а множина Y – вихідним [6].<br />
В узагальненому вигляді універсальні просторові<br />
k-значні структури, згідно з узагальненим<br />
способом завдання функцій k-значної логіки з допомогою<br />
таблиць істинності та принципу симбіозу<br />
дво- та багаторівневого кодування і засобів, включають<br />
до свого складу такі компоненти: паралельний<br />
аналого-цифровий перетворювач (елемент<br />
розпізнавання k-значної змінної: ОБПЕ – оборотний<br />
багатозначний пороговий елемент); дешифратор<br />
(ДШ), селектор, комутатор, паралельний<br />
цифро-аналоговий перетворювач (ключовий комутатор,<br />
або підсумовувач струмів) [5,6].<br />
Вирішення задач формалізації принципів організації<br />
багатовходових k-значних структур забезпечує<br />
побудову новітньої концепції синтезу, зокрема,<br />
тривходового універсального просторового<br />
функціонального перетворювача (УПФП) рис. 1<br />
для високошвидкісних обчислювальних систем;<br />
застосування просторового та часового паралелізму<br />
на структурному й алгоритмічному рівнях та<br />
k-значних методів кодування; створення процедурних<br />
і функціональних мов, паралельних машин<br />
баз знань і логічного виводу [5, 15–17]. Отже, зрос-<br />
153
М.Ф. Бондаренко, З.Д. Коноплянко, Г.Г. Четвериков<br />
тання значності та числа вхідних змінних універсальної<br />
k-значної структури веде до суттєвих змін у<br />
побудові компонентів, що входять до її складу.<br />
Зокрема, на вході структури зростає пропорційно<br />
k число елементів розпізнавання; структури селекторів<br />
і комутаторів перетворюються в n-вимірні<br />
об’ємно-просторові утворення, а на виході структури<br />
зростає пропорційно k число ключів. Таким<br />
чином, в узагальненому вигляді універсальна просторова<br />
структура може бути описана системою<br />
ознак S→P→V→P→S, де V – об’єм (вимірність простору<br />
селектора і комутатора); S – статична ознака<br />
(кожному зі символів багатозначного структурного<br />
алфавіту ставиться у відповідність один із рівнів напругу<br />
чи струму); P – просторова ознака (символи<br />
алфавіту зображаються збудженим станом одного з<br />
k просторових полюсів).<br />
Зауважимо, що структурні побудови універсальних<br />
k-значних функціональних перетворювачів<br />
на засадах принципу уніфікації з відповідними<br />
операційними засобами (значність, специфічні<br />
функтори, об’ємно-просторовий паралелізм, багатомісність<br />
функцій) утворюють нову паралельну<br />
обчислювальну математику, аналогів якої на<br />
нинішній день не існує у світі, а фундаментальні<br />
дослідження її щодо детальнішого аналізу можливостей<br />
застосування під час побудови високошвидкісних<br />
обчислювальних систем ще навіть, по суті, і<br />
не починалися й залишаються завданням ближчого<br />
і подальшого майбутнього.<br />
Загалом виявляється [4], що метаструктура рішення<br />
будь-якої задачі складається з трьох рівнів<br />
деяких структур даних. І не лише метаструктура<br />
кінцевого стану, тобто деякого “статичного опису”<br />
154<br />
рішення, але й структура самого процесу побудови<br />
цього рішення. Звернемо увагу на наступні дві обставини:<br />
• процес отримання рішення по суті рекурсивний,<br />
зобов’язаний бути таким, оскільки апріорні<br />
оцінки критерію зупинки, за визначенням, відсутні.<br />
• поняття структури даних ніяк не визначене<br />
апріорі, структура ніяк не задана.<br />
З існування загального закону рекурсії структур<br />
і метаструктур виходить цікавий висновок: кожна<br />
проблемна галузь має не більше трьох рівнів метаструктур<br />
над структурою “елементної бази”. Назвемо<br />
цей висновок “правилом трійки”.<br />
Усе сказане еквівалентне припущенню про існування<br />
деякого закону рекурсії структур, метаструктур<br />
і процесів. Процесів це стосується в тому<br />
сенсі, що процеси самоорганізації не можуть не<br />
бути рекурсивними.<br />
3. Перспективи розвитку систем ШІ та<br />
комп’ютерна абсолютно універсальна система<br />
(КАУС)<br />
Отже, слід наголосити на двох напрямах, за якими<br />
робляться спроби вирішення проблеми штучного<br />
інтелекту:<br />
Перший з них – традиційний, в рамках розробки<br />
штучного інтелекту. Загальним для робіт цього напряму<br />
є те, що в них робляться спроби побудувати<br />
інтелект на основі дослідження і моделювання<br />
функцій інтелекту людини, наприклад, [17].<br />
другий з даних напрямів, який сформувався недавно<br />
[18], – це спроба на основі дослідження<br />
механізмів самоорганізації популяцій бактерій<br />
(простих, у порівнянні з людиною, організмів) від-<br />
Рис.1. Узагальнена схема тривходового універсального просторового функціонального перетворювача
КОНЦЕПЦІЇ уНІФІКАЦІЇ ІНФОрМАЦІЙНО-ІНТЕЛЕКТуАЛЬНИх ТЕхНОЛОГІЙ В СИСТЕМАх МОВЛЕННЯ<br />
повісти на запитання: чому наш «повільний» мозок<br />
вирішує, наприклад, задачі розпізнавання в мільйон<br />
раз швидше, ніж найшвидші комп’ютери?<br />
У цьому підході досліджувався механізм переходу<br />
від складної системи до простого організму,<br />
тобто була поставлена задача розробити псевдоорганізм.<br />
Для реалізації псевдоорганізму було розроблено<br />
комп’ютерну абсолютну універсальну систему<br />
(КАУС) [18].<br />
Наголосимо на основних чинниках, важливих<br />
для аналізу проблеми.<br />
Емерджентна властивість – це (якщо відштовхуватися<br />
від визначення емерджентності як властивості<br />
раптово виникати) несподіване, невідоме<br />
раніше, нова властивість. Використовуючи математичну<br />
термінологію, можна сказати, що емерджентними<br />
властивостями (рішеннями) володіють<br />
нелінійні рівняння. Тоді емерджентність можна<br />
заміряти ступенем нелінійності. Емерджентність<br />
нелінійності полягає у тому, що нелінійна модель<br />
здатна породжувати безліч якісно різних рішень. Із<br />
зростанням нелінійності кількість рішень стає настільки<br />
великою, що поведінка системи наближається<br />
до поведінки стохастичної системи. Саме це<br />
явище привело до введення поняття детермінованого<br />
хаосу. З появою у поведінці системи нелінійних<br />
ефектів порушується принцип суперпозицій.<br />
Ціле перестає бути тим, що складається з окремих<br />
елементів. Емерджентність – це одна з ознак<br />
середовища носія інтелекту, а оскільки інтелект<br />
невіддільний від середовища існування, то надалі<br />
говоритимемо, що емерджентність – це необхідна<br />
властивість інтелекту.<br />
Іншою властивістю інтелектуальних систем і самого<br />
інтелекту є його іманентність. Іманентне – те,<br />
що наявне в чому-небудь, властиве чому-небудь.<br />
До цього необхідно додати – і невіддільне від цього<br />
чого-небудь.<br />
Парадоксальність проблеми розробки ШІ полягає<br />
в наступному. З одного боку, інтелект є<br />
останнім досягненням еволюції людини як найвисокоорганізованішою<br />
матерією. Це останнє, що<br />
з’явилося в організмі в процесі його розвитку. У<br />
зв’язку з цим намагатися створити рукотворний інтелект,<br />
не маючи рукотворних простих організмів,<br />
здається безглуздим. З іншого боку, якщо цей феномен<br />
(мислення і інтелект) з’явився останнім, то<br />
він є наймолодшим в організмі і, як наслідок, його<br />
простіше змоделювати. Таким чином, проблема<br />
розробки ШІ одночасно і проста, і складна, тобто<br />
постановка самого питання про його розробку, з<br />
одного боку, виправдана, а з іншого, безглузда, неправомірна<br />
або передчасна. Цей парадокс виявляє<br />
єство механізмів, здатних забезпечити існування<br />
чогось подібного до інтелекту.<br />
Відзначимо також, що коли математик стверджує,<br />
що світ нелінійний, він не помиляється, а<br />
просто вкладає в поняття “нелінійність” набагато<br />
більше, ніж людина, що зводить нелінійність до<br />
рівняння ступеня вище першого. Нелінійність - це<br />
перш за все перехід (зв’язок) від детермінізму до<br />
стохастики. Звідси витікає, що нелінійність - це<br />
нетривіальний, діалектичний зв’язок, це власне<br />
«життя», як перехід від народження до смерті, це<br />
процес становлення, що поглиблюється і породжує<br />
нове.<br />
Однією з найяскравіших ознак нелінійності<br />
системи є той факт, що породжена нею реакція<br />
не міститься ні в одній з її початкових складових<br />
частин до дії. Іншими словами, нелінійна система<br />
здатна змінювати свою структуру, породжувати<br />
нові рішення. З опису КАУС відомо, що вона<br />
здатна візуалізувати власні уявлення про реальні<br />
об’єкти у вигляді реакцій (комп’ютерних образів<br />
чи структур, складених з комбінацій пікселів екрану,<br />
що знаходяться в різних станах) на збурення,<br />
джерелом яких ці об’єкти є.<br />
Псевдоорганізм, як і будь-який організм, володіє<br />
своїми властивостями і параметрами. В нашому<br />
сприйнятті це видимі графічні образи, що<br />
синтезуються на екрані. Їх параметри і властивості<br />
можна вимірювати, розпізнавати, вивчати. Для<br />
комп’ютера, що працює за фіксованою програмою,<br />
вони є метафізикою, оскільки багато які з них просто<br />
не передбачені програмою. Для комп’ютерної<br />
системи істотно і доступне тільки те, що ми вже<br />
«заклали» – формалізували і зробили доступним<br />
для неї, перетворивши на якусь, доступну тільки<br />
їй, програму. Для математика - це лише наші уявлення,<br />
виражені за допомогою математичної символіки,<br />
які безпосередньо не можна побачити і зміряти.<br />
Суть новітньої концепції в області розробки ШІ<br />
складають навчання і когнітивна графіка. Обидві<br />
ці складові є іманентними властивостями організму<br />
(живого) або реальної системи, розглянутої<br />
іншою реально живою системою на рівні поняття,<br />
яка сама є живим організмом. З іншого боку, якщо<br />
реалізувати дану концепцію в автономній системі,<br />
це ні що інше, як створення реального робота.<br />
Дана схема близька до відображення власне механізму<br />
функціонування живого, що природньо розвивається,<br />
еволюціонує й самоорганізовується.<br />
Висновки<br />
Сфери предметних галузей, де найдоцільніше<br />
працювати з даними і знаннями, поданими<br />
мовними моделями – це галузі з переважанням<br />
емпіричного знання, де складність фактів і їх<br />
описів виключає використання мови математики<br />
і, зокрема, інформаційно-інтелектуальних та<br />
лінгвістичних технологій. При цьому найбільш<br />
загальна проблема побудови системи управління<br />
семантичного чи семантико-прагматичного<br />
155
М.Ф. Бондаренко, З.Д. Коноплянко, Г.Г. Четвериков<br />
рівня взаємодії пов’язана з вибором технології<br />
контекстно-залежного подання знань, побудовою<br />
інформаційних баз (даних і знань) про предметну<br />
галузь і механізму висновку для отримання необхідних<br />
рішень. Зауважимо, що єдино відомим нам,<br />
об’єктивним носієм знання та інтелекту є людина,<br />
а виразником, засобом до зовнішнього спілкування<br />
та носієм інтелекту є людська мова, що й складатиме<br />
об’єкт і напрямок досліджень у наступних<br />
частинах роботи.<br />
Подання моделей декларативних мов здійснюється<br />
предикатами, рисунками, кресленнями, графами<br />
тощо. Математична структура даних у декларативних<br />
мовах базується на системах предикатних<br />
рівнянь в алгебрі скінченних предикатів або на аксіоматичній<br />
теорії множин, у якій теорія множин<br />
інтерпретується як структура даних. Отже, проблема<br />
створення ШІ полягає не в тому, щоб «будувати<br />
штучних людей», а в тому, щоб пізнати природні<br />
організми настільки, щоб використовувати їх на<br />
рівні систем.<br />
Список літератури: 1. Бондаренко, М.Ф. Основи теорії<br />
синтезу надшвидкодіючих структур мовних систем<br />
штучного інтелекту [Текст] / М.Ф. Бондаренко, З.Д.<br />
Коноплянко, Г.Г. Четвериков. – К.: ІЗМН, 1997. – 264 с.<br />
2. Коноплянко, З.Д. Концепціїї організаціі інформаціойноінтелектуальних<br />
технологій [Текст] / З.Д. Коноплянко<br />
// Бионика <strong>интеллект</strong>а. – 2008. – <strong>№</strong>2(69). – С. 164–172.<br />
3. Четвериков, Г.Г. Концепціїя уніфікаціі методів та засобів<br />
побудови просторових багатозначних структур мовних<br />
систем [Текст] / Г.Г. Четвериков // Бионика <strong>интеллект</strong>а.<br />
– 2010. – <strong>№</strong>1(72). – С. 3–11. 4. Лачинов, В.М. Информодинамика<br />
или Путь к Миру открытых систем [Текст] /<br />
В.М. Лачинов, А.О. Поляков. – Санкт-Петербург: Издательство<br />
СПбГТУ. – 1999. – 432 c. 5. Бондаренко, М.Ф.<br />
Основи теорії багатозначних структур і кодування в системах<br />
штучного інтелекту [Текст] / М.Ф. Бондаренко,<br />
З.Д. Коноплянко, Г.Г. Четвериков. – Х.: Фактор-Друк,<br />
2003. – 336 с. 6. Четвериков, Г.Г. Формалізація принципів<br />
побудови універсальних k-значних структур мовних<br />
систем штучного інтелекту [Текст] / Г.Г. Четвериков //<br />
Доповіді НАН України. – 2001.– <strong>№</strong>1 (41). – C. 76–79.<br />
7. Никитина, Ф.А. Моделирование <strong>язык</strong>овой действительности<br />
с помощью функционально-семантических полей<br />
[Текст] / Ф.А. Никитина // Проблемы бионики. – 1988.<br />
– Вып. 41. – С. 81–85. 8. Терзиян, В.Я. Формализация<br />
процесса устранения многозначности синтаксического<br />
разбора естествено<strong>язык</strong>ового высказывания. Сообщение<br />
1 и 2 [Текст] / В.Я. Терзиян, И.И. Попков // Проблемы<br />
бионики. – 1991. – Вып.47. – С. 23-36. 9. Осыка, А.Ф.<br />
О формализации семантики словосочетания с инструментальным<br />
значением [Текст] / А.Ф. Осыка, О.А. Кравец<br />
//Проблемы бионики. – 1990. – Вып.45(90). – Харьков:<br />
Основа. – С. 3 – 10. 10. Кольцов, В.П. О содержательной<br />
интерпретации алгебры идей [Текст] / В.П. Кольцов,<br />
Ю.П. Шабанов-Кушнаренко // Проблемы бионики.<br />
– 1990. – Вып.45(90). – Харьков: Основа. – С. 10–17.<br />
11. Бондаренко, М.Ф. О математическом моделировании<br />
156<br />
семантики производных с модификационными значениями<br />
[Текст] / М.Ф. Бондаренко, А. С. Левицкий //<br />
Проблемы бионики. – 1990. – Вып.45(90). – Харьков:<br />
Основа. – С. 17–22. 12. Шабанов-Кушнаренко, Ю. П.<br />
Математические модели межморфемных связей на множестве<br />
полисемантических производящих основ и словообразовательных<br />
суффиксов [Текст] / В.И. Булкин, Д.И.<br />
Ситников, Ю. П. Шабанов-Кушнаренко // Проблемы<br />
бионики. – 1991. – Вып. 47. – Харьков: Основа. – С. 3–22.<br />
13. Осыка, А.Ф. К вопросу о формировании семантических<br />
признаков слов. [Текст] / А.Ф. Осыка, О.А. Кравец //<br />
Проблемы бионики. – 1991. – Вып. 47. – Харьков: Основа.<br />
– С. 8–16. 14. Рябова, Н.В. Моделирование семантики<br />
производных слов русского <strong>язык</strong>а. [Текст] / Н.В. Рябова //<br />
Проблемы бионики. – 1990. Вып.45(90). – Харьков: Основа.<br />
– С. 17–23. 15. Четвериков, Г.Г. Структура элементов<br />
компьютерной лингвистики и пути ее моделирования<br />
[Текст] / Г.Г. Четвериков, Т.Н. Федорова, И.Д. Вечирская<br />
// Прикладная лингвистика и лингвистические технологи:<br />
сборник научных трудов.К.: Довіра, 2010. – С. 206–214.<br />
16. Широков, В.А. Очерк основных принципов квантовой<br />
лингвистики [Текст] / В.А. Широков // Бионика <strong>интеллект</strong>а.<br />
– 2007. – <strong>№</strong>1(66). – С. 25–32. 17. Бондаренко, М.Ф.<br />
Теория <strong>интеллект</strong>а [Текст]: учеб. / М.Ф. Бондаренко Ю.П.<br />
Шабанов-Кушнаренко – Харьков: Изд-во СМИТ, 2006.<br />
– 571 с. 18. Васильєв, Н.Р. Математическая модель псевдоорганизма<br />
(КАУС) – путь к созданию искусственного<br />
<strong>интеллект</strong>а [Электронный ресурс] / Н.Р. Васильєв, Е.В.<br />
Задорин – 2008. – Режим доступа: http://arupa-manas.<br />
narod.ru/BASE/nauka/index.html<br />
надійшла до редколегії 12.09.<strong>2011</strong><br />
УДК 519.71<br />
Концепция унификации информационно-<strong>интеллект</strong>уальных<br />
технологий в <strong>язык</strong>овых системах / М.Ф. Бондаренко,<br />
З.Д. Коноплянко, Г.Г. Четвериков // Бионика<br />
<strong>интеллект</strong>а: научн.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –<br />
С. 150-156.<br />
Проведен обзор состояния проблемы моделирования<br />
функций <strong>интеллект</strong>а человека на уровне его <strong>язык</strong>ового<br />
поведения; дан сравнительный синтаксический и семантический<br />
анализ морфологии словоформ. Предложен<br />
аппаратный способ реализации моделей естественного<br />
<strong>язык</strong>а в виде k-значных структур (АКП-структур). Изложена<br />
суть концепции в области дальнейшего развития<br />
систем искусственного <strong>интеллект</strong>а.<br />
Ил. 1. Библиогр.: 18 назв.<br />
Concept of unification information intellectual technologies<br />
in language systems / M.f. Bondarenko, Z.D. Konoplyanko,<br />
G.G. Chetverikov // Bionics of Intelligense: Sci. Mag. –<br />
<strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 150-156.<br />
The review condition of modelling functions intelligence<br />
person problem at level of its language behaviour is spent.<br />
The comparative syntactic and semantic analysis of morphology<br />
word forms is given. The hardware way realization natural<br />
language models in the form of k-unit structures (AKP-<br />
STRUCTURES) is offered. The concept matter in the field<br />
of the further development artificial intelligence systems is<br />
stated.<br />
fig. 1. Ref.: 18 items.
БИОНИКА ИНТЕЛЛЕКТА. <strong>2011</strong>. <strong>№</strong> 3 (<strong>77</strong>). С. 157–161 хНурэ<br />
УДК 004.652: 519.765:519.767:004.93<br />
Вступ<br />
Квантові комп’ютери та алгоритми є новим<br />
перспективним напрямком сучасних інформаційних<br />
технологій. Вони дають можливість суттєво<br />
пришвидшити розв’язок деяких класів задач внаслідок<br />
реалізації квантового паралелізму та заплутаності<br />
квантових станів. Одним із відомих квантових<br />
алгоритмів є алгоритм Гровера для пошуку<br />
даних у неструктурованій базі даних [1,2,3]. Цей<br />
алгоритм дає можливість знайти дані, які відповідають<br />
певним критеріям за час O( N ), використовуючи<br />
кількість елементів пам’яті, пропорційну<br />
O(log N)<br />
, де N – кількість елементів бази даних.<br />
В порівнянні із класичним алгоритмом, в якому<br />
пошук здійснюється за час ON ( ), алгоритм Гровера<br />
дає квадратичне прискорення розв’язку, що<br />
є актуальним при великих значеннях N. Особливістю<br />
квантового алгоритму Гровера є те, що він є<br />
імовірнісним алгоритмом, тобто дає правильний<br />
розв’язок із заданою ймовірністю, яка може бути<br />
збільшена шляхом повторного використання алгоритму.<br />
Алгоритм Гровера може бути складовою<br />
частиною інших квантових алгоритмів, зокрема, в<br />
роботі [4] він використовується для еволюційного<br />
аналізу кліткових автоматів. Інтелектуальний аналіз<br />
даних, зокрема, текстового типу є також одним<br />
із поширених напрямків інформаційних технологій.<br />
Зростаючий об’єм інформації зумовлює пошук<br />
нових комплексних рішень для інтелектуального<br />
аналізу даних. З цих позицій є перспективним розгляд<br />
можливих квантових алгоритмів аналізу слабо<br />
структурованих даних, таких як текстові масиви.<br />
На даний час розвитку квантових комп’ютерів<br />
розроблені лише елементарні базові елементи та<br />
пристрої з квантовим регістром, який містить декілька<br />
кубітів. Тому паралельно із розвитком елементної<br />
бази є необхідність розробки систем чисельного<br />
моделювання квантових алгоритмів на<br />
класичних комп’ютерах. В даній роботі розглянемо<br />
чисельне моделювання алгоритму Гровера для реалізації<br />
квантового пошуку ключових слів у масиві<br />
текстів.<br />
Б.М. Павлишенко<br />
Львівський національний університет імені Івана Франка,<br />
Україна, pavlsh@yahoo.com<br />
КВАНТОВИЙ АЛГОРИТМ ПОШУКУ КЛЮЧОВИХ СЛІВ<br />
У МАСИВАХ ТЕКСТОВИХ ДАНИХ<br />
Запропонована модель квантового запису масиву текстових даних. Проаналізовано пошук ключових<br />
слів у квантовій базі даних текстових масивів, використовуючи елементи алгоритму Гровера. Показана<br />
ефективність квантового алгоритму у випадку великих розмірів текстових масивів, які суттєво перевищують<br />
розмір словника, та у випадку багатократної появи ключових слів в аналізованому текстовому<br />
масиві.<br />
КВАНТОВІ ОБЧИСЛЕННЯ, АНАЛІЗ ТЕКСТІВ, КВАНТОВИЙ АЛГОРИТМ ГРОВЕРА<br />
1. Постановка задачі<br />
Розглянемо базові елементи квантових обчислень,<br />
які можуть бути використані в алгоритмах<br />
аналізу текстів. Створимо модель квантового запису<br />
масиву текстових даних. Розглянемо пошук заданих<br />
ключових слів у квантовій базі даних текстових<br />
масивів, використовуючи елементи алгоритму<br />
Гровера. Проаналізуємо ефективність квантового<br />
пошуку ключових слів у порівнянні із класичними<br />
алгоритмами.<br />
2. Базові елементи квантових обчислень<br />
Розглянемо базові квантові принципи реалізації<br />
квантових алгоритмів [5,6]. Основною відмінністю<br />
квантового біта - кубіта від класичного біта є те, що<br />
кубіт крім станів 0 і 1 може також знаходитись в<br />
суперпозиції цих станів<br />
ψ = a 0 + b 1 .<br />
Стани 0 і 1 є базисними векторами, які можна<br />
представити у матричному вигляді<br />
1<br />
0 =<br />
0<br />
⎛ ⎞<br />
⎝<br />
⎜<br />
⎠<br />
⎟ 1<br />
0<br />
=<br />
1<br />
⎛ ⎞<br />
⎝<br />
⎜<br />
⎠<br />
⎟ .<br />
Регістр із n кубітів x1, x2,... xn утворює суперпо-<br />
n<br />
зицію із N = 2 станів, яку можна записати так:<br />
N −1<br />
ψ = ∑ aii i = 0<br />
n<br />
Ортонормований базис { 0 , 1 ,... 2 − 1 }<br />
називають<br />
обчислювальним базисом.<br />
Розглянемо однокубітні квантові вентилі. Розрахунки<br />
в квантових алгоритмах здійснюють за<br />
допомогою унітарних перетворень, які можна розглядати<br />
як повороти комплексного векторного<br />
простору. Розглянемо базові операції над кубітами.<br />
Оператор тотожного перетворення не змінює значення<br />
кубітів і має вигляд<br />
I = ⎡1<br />
0⎤<br />
⎢ ⎥<br />
⎣0<br />
1 ⎦<br />
.<br />
.<br />
157
Б.М. Павлишенко<br />
Операцію заперечення використовують для реалізації<br />
інверсії значень кубітів і визначають так:<br />
158<br />
X = 0 1 + 1 0 .<br />
У спінорному зображенні оператор заперечення<br />
має вигляд матриці<br />
X = ⎡0<br />
1⎤<br />
⎢ ⎥<br />
⎣1<br />
0 ⎦<br />
.<br />
Одним із важливих елементів є «контрольоване<br />
НЕ», яке здійснюється над двома кубітами і змінює<br />
значення другого кубіта на протилежне, якщо значення<br />
першого кубіта рівне 1. Цей логічний елемент<br />
може бути визначений як<br />
U = 0 0 ⊗ I + 1 1 ⊗X,<br />
CNOT<br />
а матриця оператора унітарного перетворення «контрольоване<br />
НЕ» має вигляд<br />
⎡1<br />
0 0 0⎤<br />
⎢<br />
⎥<br />
UCNOT = ⎢<br />
0 1 0 0<br />
⎥ .<br />
⎢0<br />
0 0 1⎥<br />
⎢<br />
⎥<br />
⎣0<br />
0 1 0⎦<br />
Дію вентиля «контрольоване НЕ» можна зобразити<br />
так:<br />
U : a, b → a, a⊕ b ,<br />
CNOT<br />
де ⊕ означає сумування за модулем 2. ще одним<br />
важливим логічним елементом є вентиль Тоффолі,<br />
який діє на три кубіти і змінює значення третього<br />
кубіта на протилежне, якщо значення першого<br />
та другого кубітів рівне 1. Від логічного елемента<br />
«контрольоване НЕ» вентиль Тоффолі відрізняється<br />
наявністю ще одного додаткового керуючого кубіта.<br />
Цей вентиль можна визначити так:<br />
T = 0 0 ⊗I ⊗ I + 1 1 ⊗UCNOT<br />
.<br />
Перетворення Тоффолі можна зообразити в такому<br />
вигляді:<br />
T : a, bc , → abc , , ⊕ ab.<br />
Вентиль Тоффолі є універсальним квантовим<br />
логічним елементом на основі якого можна побудувати<br />
оборотну квантову машину Тюрінга. В подальших<br />
дослідженнях будемо використовувати вентиль<br />
Тоффолі із n керуючими кубітами. В такому вентилі<br />
відбувається інверсія керованого кубіта при умові,<br />
що n керуючих кубітів мають значення 1 .<br />
3. Представлення текстових масивів<br />
у квантовій пам’яті<br />
Нехай існує деякий текстовий масив, який можна<br />
представити у вигляді впорядкованої множини<br />
{ }<br />
T = t | i = 12 , ,... N ,<br />
i t<br />
де N t – кількість слів у текстовому масиві. Індекс<br />
кожного елемента цієї множини відповідає його по-<br />
ложенню в текстовому масиві. Словник слів цього<br />
масиву розглянемо у вигляді такої впорядкованої<br />
множини:<br />
{ }<br />
W = w | i = 12 , ,... N ,<br />
i w<br />
де N w – кількість слів у словнику. Кожне слово w i<br />
цього словника можна закодувати його номером i<br />
за допомогою відображення<br />
Uw : wi → i .<br />
Для простоти розгляду будемо вважати, що роз-<br />
nt<br />
мір множини текстового масиву рівний Nt = 2 ( ) ,<br />
nw<br />
а розмір словника рівний N w = 2 ( ) . Тоді для кодування<br />
положення слова в масиві потрібно nt<br />
двійкових елементів, а для кодування положення<br />
номера слова у словнику потрібно nw двійкових<br />
елементів. Нехай квантовий регістр складається із<br />
двох частин qt і qw :<br />
qt ⊗ qw ,<br />
t t<br />
1 1<br />
t<br />
nt<br />
qt = q , q ,..., q ,<br />
w w<br />
1 1<br />
w<br />
nw<br />
qw = q , q ,..., q .<br />
Регістр qt описує положення слова у текстовому<br />
масиві, а регістр qw описує положення слова у<br />
словнику. Введемо додатковий кубіт f , який буде<br />
відображати наявність слова із заданим номером<br />
в заданій позиції текстового масиву. Тобто, якщо<br />
дане слово присутнє в заданій позиції, то значення<br />
цього кубіта рівне 1 , в іншому випадку рівне 0 .<br />
Тоді весь текстовий масив можна буде записати у<br />
вигляді такої системи кубітів<br />
t t t w w<br />
1 1 nt 1 1<br />
w<br />
nw<br />
qr = q , q ,..., q ⊗ q , q ,..., q ⊗ f . (1)<br />
Для запису в квантову пам’ять тексту довжиною<br />
Nt , який містить словник розміром N w , достатньо<br />
nt + nw + 1= log 2(<br />
2⋅Nt<br />
⋅Nw)<br />
кубітів. Така експоненційна<br />
економія квантової пам’яті у порівнянні із<br />
класичною пам’яттю можлива внаслідок реалізації<br />
квантового паралелізму. Наприклад, якщо словник<br />
містить 215 слів, а текстовий масив 1040 слів, що<br />
приблизно відповідає обсягу світової класичної літератури,<br />
то для запису такої інформації необхідно<br />
лише 15+40+1=56 кубітів. Для запису всієї відомої<br />
текстової інформації потрібно буде лише декілька<br />
сотень кубітів.<br />
Запис тексту в квантову пам’ять розглянемо<br />
феноменологічно за допомогою квантового оракула.<br />
В теорії квантових обчислень показано, що<br />
на основі однокубітних та двокубітних квантових<br />
унітарних вентилів можна побудувати еквівалентні<br />
алгоритми класичної машини Тюрінга. Під оракулом<br />
будемо розуміти деяке формалізоване унітарне<br />
перетворення, за допомогою якого реалізуються<br />
наперед задані обчислення. Елементи текстового<br />
масиву визначаються квантовими станами складеного<br />
регістру кубітів (1). Суперпозиція цих ста-
нів утворює вектор в комплексному Гільбертовому<br />
просторі. Цей вектор є квантовим еквівалентим<br />
відображенням текстових даних. Розглянемо послідовність<br />
квантового запису тексту. Кубіт f<br />
візьмемо в початковому стані 0 , а регістри qt ,<br />
⊗( )<br />
qw в початкових станах 0 nt<br />
⊗( )<br />
та 0 nw відповідно.<br />
Застосуємо однокубітні унітарні перетворення<br />
Адамара до регістрів qt ⊗ qw ⊗ f :<br />
⊗( nt ) ⊗(<br />
nw)<br />
( )<br />
ψ = H ⊗H ⊗I qt ⊗ qw ⊗ f<br />
В результаті отримаємо<br />
N , N<br />
t w 1<br />
ψ = ∑ i ⊗ j ⊗ 0 . (2)<br />
nt + nw<br />
2 i= 0, j=<br />
0<br />
Суперпозиція ψ містить базисні ортогональні<br />
стани, кожен з яких відповідає одному положенню<br />
визначеного слова у тексті. В процесі вимірювання<br />
відбувається редукція суперпозиції до одного базового<br />
стану, який відповідає одному слову в деякому<br />
положенні. Отже, та кількість памяті, яка в класичному<br />
випадку необхідна для запису одного слова,<br />
у квантовому випадку є достатньою для запису цілого<br />
текстового масиву. Нехай наявність заданого<br />
слова у певному місці тексту описується функцією<br />
fq ( qtqw , ) , де індекс qt описує положення слова у<br />
тексті, а індекс qw описує положення цього слова<br />
у словнику. У випадку наявності заданого слова у<br />
заданому місці тексту функція набуває значення 1,<br />
інакще 0. Процес запису текста у квантову пам’ять<br />
опишемо унітарним перетворенням UF , яке визначається<br />
квантовим оракулом<br />
UF: qt ⊗ qw ⊗ f →<br />
,<br />
→ qt ⊗ qw ⊗ f ⊕ f ( qt, qw)<br />
де ⊕ означає сумування за модулем 2. Враховуючи,<br />
що кубіт f є в початковому стані 0 , отримаємо<br />
U : qt ⊗ qw ⊗ 0 → qt ⊗ qw ⊗ f ( qt, qw)<br />
. (3)<br />
F q<br />
4. Пошук заданого ключового слова<br />
у квантовій базі даних<br />
Завдання полягає в пошуку деякого ключового<br />
слова w k , яке може бути закодоване у вигляді<br />
квантового стану<br />
k k<br />
= 1 1<br />
qk q , q ,..., q .<br />
Використаємо вентиль Тоффолі для знаходження<br />
квантових станів, в яких закодовані ключові<br />
теги. Введемо в систему кубітів (1) додатковий кубіт<br />
– анцилу z , отримаємо<br />
q<br />
k<br />
nw<br />
qr = qt ⊗ qw ⊗ f ( qtqw , ) ⊗ z . (4)<br />
Подіємо на кубіт z в стані 1 оператором Адамара<br />
1<br />
z = H 1 = ( 0 − 1 ) . (5)<br />
2<br />
q<br />
КВАНТОВИЙ АЛГОрИТМ ПОШуКу КЛЮЧОВИх СЛІВ у МАСИВАх ТЕКСТОВИх ДАНИх<br />
.<br />
Допоміжний кубіт z буде керуватись за допомогою<br />
nw+1-мірного елемента Тоффолі Tnw+1 , в<br />
якому керуючими кубітами виступають nw кубітів<br />
регістру qw та кубіт f( qtqw , ) . Значення кубіта<br />
z в квантовому стані може змінитись під впливом<br />
вентиля Тоффолі у випадку, коли всі кубіти регістру<br />
qw та кубіт f( qtqw , ) будуть рівні одиниці.<br />
щоб перевести значення кубітів у значення 1 для<br />
квантових станів, які описують ключове слово wi ,<br />
розглянемо унітарний оператор, який є тензорним<br />
добутком однокубітних операторів<br />
де S<br />
i<br />
k ⎧⎪<br />
I, qi<br />
= 1;<br />
= ⎨ k<br />
⎩⎪ X, qi<br />
= 0;<br />
nw<br />
nt<br />
ST= I ⊗ ⊗ SiI I<br />
i<br />
⎛<br />
⊗(<br />
) ⎞<br />
⎝<br />
⎜<br />
⎠<br />
⎟ ⊗ ⊗ , (6)<br />
= 1<br />
Оператор ST переводить квантові базисні стани<br />
регістру qr у стани, в яких значення регістру qw<br />
рівні 1, якщо співпадають кодування слова в тексті<br />
та ключового слова qw = qk , тобто<br />
S qr = qt ⊗ 11 ,,... 1 ⊗ f( qt, qw) ⊗ z ,<br />
T nw<br />
якщо qw = qk .<br />
Розглянемо оператор<br />
⊗(<br />
nt )<br />
UT = ( ST ) ⋅( I ⊗Tnw+ 1 ) ⋅(<br />
ST<br />
) . (7)<br />
Подіємо цим оператором на систему регістрів<br />
кубітів qr . Перша справа група операторів виділених<br />
дужками переводить регістр qw у значення<br />
11 ,,... 1 для станів, які відповідають шуканим<br />
nw<br />
ключовим словам, друга група операторів реалізує<br />
інверсію керованого кубіта z для шуканих станів,<br />
третя група повертає змінені першою групою<br />
стани у стан перед застосуванням оператора UT . В<br />
результаті дії оператора UT отримаємо<br />
ψ T<br />
nt+ nw<br />
⎛<br />
x = 2<br />
1<br />
⎞<br />
= UT⎜∑x ⊗ f( x) ⊗ z ⎟ =<br />
nt + nw ⎝ 2<br />
x = 1<br />
⎠<br />
1 ⎛<br />
⎞<br />
= × ⎜ ∑ x ⊗ f( x)<br />
− ∑ x ⊗ f( x) ⎟ ⊗ z , (8)<br />
nt + nw<br />
2 ⎝<br />
∈<br />
⎠<br />
x∉Xk x X k<br />
x = qt ⊗ qw,<br />
де X k – множина станів суперпозиції, які відповідають<br />
кодуванню шуканих ключових слів. Допоміжний<br />
керований кубіт z не змінив свого значення під<br />
дією оператора U T і знаходиться у стані (5), в якому<br />
він знаходився перед дією оператора U T , тому його<br />
можна винести за дужки та вилучити із подальшого<br />
розгляду. Це зумовлено тим, що кубіт z був переведений<br />
в новий базисний стан (5) за допомогою<br />
оператора Адамара. Інверсія стану в цьому базисі<br />
є рівнозначна інверсії знаку амплітуди підсистеми<br />
квантових станів, в яких закодовані ключові слова.<br />
Роль цього кубіта полягала у тому, щоб під дією вентиля<br />
Тофолі він змінював свій знак на протилежний<br />
у квантових станах, які відповідають умові пошуку.<br />
159
Б.М. Павлишенко<br />
Умова рівності регістрів ключового тега та регістру<br />
кодування слова враховується в операторі ST .<br />
Наступним кроком алгоритму є переведення<br />
додаткового кубіта f у початковий базисний<br />
стан 0 та вилучення його із подальшого розгляду.<br />
Це можна зробити за допомогою унітарного опера-<br />
−1<br />
тора U F , який є оберненим до оператора U F (3). В<br />
результаті отримаємо<br />
160<br />
⎛<br />
⎞<br />
−1<br />
1<br />
ψ − 1 = U ψ<br />
F F = x − x<br />
T ⎜ ∑ ∑ ⎟,<br />
nt + nw<br />
2 ⎝ x∉X x∈X⎠ x = qt ⊗ qw.<br />
k k<br />
Отже, в результаті дії складеного оператора<br />
−1<br />
UF UTUFотримаємо суперпозицію базисних рівноймовірнісних<br />
станів (2), в якій стани, що кодують<br />
наявні ключові слова, мають від’ємну амплітуду.<br />
5. Підсилення амплітуд заданих квантових станів<br />
Для того щоб при вимірюванні виявити квантові<br />
стани, в яких закодовані ключові слова, необхідно<br />
підсилити амплітуди шуканих станів. Таке підсилення<br />
амплітуд станів, які мають задані властивості,<br />
можна здійснити за допомогою оператора інверсії<br />
відносно середнього, який використовується в<br />
алгоритмі Гровера для пошуку в неструктурованій<br />
квантовій базі даних [1,2,3]. Оператор інверсії розглянемо<br />
у вигляді<br />
де ψ c<br />
U = 2 ψ ψ −I<br />
, (9)<br />
G c c<br />
n<br />
i = 2 −1<br />
⊗n<br />
⊗n<br />
1<br />
= H 0 = i<br />
∑<br />
n<br />
2 i = 0<br />
В геометричній інтерпретації оператор U G здійснює<br />
в Гільбертовому просторі дзеркальне відображення<br />
деякого вектора відносно осі, яка визначається<br />
вектором ψ c . Оператор інверсії можна<br />
представити сукупністю однокубітних операторів<br />
Адамара та операторів інверсії стану кубіта відносно<br />
базисного вектора 0<br />
U = H ( 20 0 −I)<br />
H .<br />
G<br />
⊗n ⊗n ⊗n<br />
Оператор U G також називають оператором інверсії<br />
відносно середнього [1, 2, 3, 6], оскільки перетворення<br />
U G можна зообразити<br />
∑ ∑<br />
U : a i → ( 2 A−a ) i ,<br />
G i<br />
i<br />
де A – середнє значення амплітуд a i . Оператор U G<br />
можна зообразити унітарною матрицею, елементи<br />
якої визначаються правилом<br />
i j<br />
N<br />
Sij<br />
i j<br />
N<br />
=<br />
⎧ 2<br />
, ≠<br />
⎪<br />
⎨<br />
⎪ 2<br />
− 1,<br />
= .<br />
⎩⎪<br />
Підсилення амплітуд станів із інверсними знаками<br />
амплітуд відбувається внаслідок дії оператора<br />
i<br />
.<br />
i<br />
інверсії U G аналогічно до механізму, описаного в<br />
алгоритмі Гровера [1, 2, 3]. Враховуючи визначення<br />
операторів (3), (6), (7), (9), розглянемо ітерацію<br />
алгоритму Гровера у загальному вигляді складеного<br />
оператора<br />
I G<br />
−1<br />
F T F<br />
U = U U U U<br />
. (10)<br />
Можна показати, що внаслідок реалізації ітерації<br />
U I можна підсилити амплітуди заданих станів в<br />
3 рази. Якщо шукане ключове слово зустрічається<br />
в текстовому масиві лише один раз, то аналогічно<br />
до алгоритму Гровера [1,2,3] оптимальна кількість<br />
ітерацій U I буде<br />
π<br />
nt + nw<br />
kU≈ N, N = 2 ,<br />
4<br />
де N – кількість квантових станів рівна N = NtNw. Отже, складість алгоритму в даному випадку буде<br />
O( N)<br />
. Якщо кількість шуканих ключових тегів<br />
рівна l, тоді згідно із [1,2,3,6] кількість необхідних<br />
ітерацій буде рівна<br />
π N<br />
kU<br />
≈ .<br />
4 l<br />
Однак наперед невідомо, яка кількість входжень<br />
ключового слова в текстовому масиві. В такому випадку<br />
можна провести серію реалізацій алгоритму<br />
Гровера із кількостями ітерацій U I , які утворюють<br />
прогресію<br />
k = 1248 , , ,,... l ,<br />
U U<br />
де lU – деяке максимальне значення кількості<br />
ітерацій U I . Тобто спочатку реалізується алгоритм<br />
з однією ітерацією, потім із двома і т.д. Якщо в цій<br />
серії реалізацій алгоритму при вимірюванні виявлено<br />
шукані квантові стани, тоді можна прийняти<br />
рішення про наявність шуканого ключового слова<br />
в аналізованому текстовому масиві, а також оцінити<br />
кількість появи цього слова в текстовому масиві.<br />
Можна показати, що складність алгоритму в такому<br />
випадку є також O( N ). В класичному алгоритмі<br />
складність пошуку в неструктурованому текстовому<br />
масиві буде ON ( t ). Враховуючи те, що N = NtNw, можна побачити, що не для всіх випадків квантовий<br />
алгоритм дасть поліноміальне прискорення<br />
обчислень. Наприклад, коли Nt ≈ Nw,<br />
складність<br />
пошуку класичного та квантового алгоритму буде<br />
співмірною. Поліноміальне прискорення алгоритму<br />
буде спостерігатись для випадку, коли розмір текстового<br />
масиву суттєво перевищує розмір словника,<br />
тобто Nt >> Nw<br />
.<br />
Висновки<br />
В роботі розглянута модель запису текстових<br />
масивів у квантову пам’ять. Запропонований квантовий<br />
алгоритм пошуку ключових слів у текстових<br />
масивах. Реалізація цього алгоритму здійснюється<br />
на основі квантових логічних елементів, зокрема,
з використанням вентиля Тоффолі. Ітерація Гровера<br />
використовується для підсилення амплітуд<br />
квантових станів із заданими властивостями. Показано,<br />
що реалізація квантового алгоритму пошуку<br />
ключових слів у текстових масивах за деяких умов<br />
дає можливість експоненційно скоротити об’єм<br />
необхідної пам’яті та поліноміально зменшити час<br />
виконання алгоритму у порівнянні із класичними<br />
алгоритмами внаслідок реалізації квантового паралелізму.<br />
Ефективність квантового алгоритму зростає<br />
у випадку великих розмірів текстових масивів,<br />
які суттєво перевищують розмір словника, та у випадках<br />
багатократної появи ключових слів в аналізованому<br />
текстовому масиві.<br />
Список літератури. 1. Grover, L.K. Quantum Mechanics<br />
helps in searching for a needle in haystack/ L.K.Grover //<br />
Phys.Rev. Lett. 79(2):325–328, 1997. 2. Zalka, C. Grover’s<br />
quantum searching algorithm is optimal./ C. Zalka. // Phys.<br />
Rev. A., 60(4):2746–2751, 1999. 3. Lavor, C., Manssur,<br />
L.R.U., Portugal, R. Grover’s Algorithm: Quantum Database<br />
Search [Електронний ресурс] // C.Lavor, L.R.U. Manssur,<br />
R. Portugal // arXiv:quant-ph/0301079v1 (2003). 4. Pavlyshenko,<br />
B. Quantum Algorithm of Evolutionary Analysis of<br />
1D Cellular Automata [Електронний ресурс] // B. Pavlyshenko<br />
// arXiv:1001.4870v1 (2010). 5. Крохмальський, Т.<br />
Квантові комп’ютери: основи й алгоритми (короткий<br />
огляд) [Текст]/ Т.Крохмальський // Журнал фізичних<br />
досліджень. – 2004. – Т. 8. – <strong>№</strong> 4. – С. 1-15. 6. Китаев, А.<br />
КВАНТОВИЙ АЛГОрИТМ ПОШуКу КЛЮЧОВИх СЛІВ у МАСИВАх ТЕКСТОВИх ДАНИх<br />
Классические и квантовые вычисления [Текст] / А. Китаев,<br />
А. Шень, М. Вялий – М.: МЦНМО, ЧеРо, 1999.<br />
– 192 с.<br />
надійшла до редколегії 26.09.<strong>2011</strong><br />
УДК 004.652: 519.765:519.767:004.93<br />
Квантовый алгоритм поиска ключевых слов в текстовых<br />
массивах данных / Б.М. Павлышенко // // Бионика<br />
<strong>интеллект</strong>а: науч.-техн. журнал. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –<br />
С. 157-161.<br />
Предложена модель квантовой записи массива текстовых<br />
данных. Проанализирован поиск ключевых слов<br />
в квантовой базе данных текстовых массивов используя<br />
елементы алгоритма Гровера. Показана эффективность<br />
квантового алгоритма в случаэ больших размеров текстовых<br />
массивов, которые существенно превышают размер<br />
словаря и в случае многократного появления ключевых<br />
слов в анализированном массиве.<br />
Библиогр.: 6 назв.<br />
УДК 004.652: 519.765:519.767:004.93<br />
The Quantum Algorithm of Key Words Search in Text<br />
Arrays / B.M. Pavlyshenko // // Bionics of Intelligense: Sci.<br />
Mag. – <strong>2011</strong>. – <strong>№</strong> 3 (<strong>77</strong>). –P. 157-161.<br />
The model of text array quantum writing has been<br />
suggested. The search of key words in quantum database of<br />
text arrays with the use of Grover’s algorithm elements has<br />
been analyzed. The effectiveness of quantum algorithm in<br />
case of large text arrays when their size exceeds essentially the<br />
dictionary size and in cases when key words appear repeateadly<br />
in the analyzed text array is shown.<br />
Ref.: 6 items.<br />
161
162<br />
ОБ АВТОРАХ<br />
Алексенко Виктория Сергеевна 74 студентка факультета компьютерных наук Харьковского<br />
национального университета радиоэлектроники<br />
Аксак Наталия Георгиевна 94 канд. техн. наук, старший научный сотрудник,<br />
доцент кафедры ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Бабий Андрей Степанович 89 преподаватель кафедры информатики и информационных<br />
технологий в деяльности ОВС Харьковского<br />
национального университета внутренних дел<br />
Барыло Екатерина Васильевна 107 аспирант секции информатики кафедры компьютерных<br />
наук Cумского государственного университета<br />
Беспалов Юрий Гаврилович 54 старший научный сотрудник лаборатории моделирования<br />
адаптационных механизмов биологического факультета<br />
Харьковского национального университета<br />
им. В. Н. Каразина<br />
Бенаддия Абдельлатиф 112 аспирант кафедры ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Бондаренко Михаил Федорович 3, 14, член-корреспондент НАН Украины, д-р техн. наук,<br />
30, 150 профессор, ректор Харьковского национального<br />
университета радиоэлектроники<br />
Бондаренко Tатьяна Петровна 54 д-р биолог. наук, профессор, зав. отделом Института<br />
криобиологии и криомедицины Национальной академии<br />
наук Украины<br />
Голян Наталья Викторовна 46 ассистент кафедры программного обеспечения ЭВМ<br />
Харьковского национального университета<br />
радиоэлектроники<br />
Городнянский Илья Дмитриевич 54 студент биологического факультета Харьковского<br />
национального университета им. В. Н. Каразина<br />
Гороховатский Владимир Алексеевич 85 д-р техн. наук, заведующий кафедрой информационных<br />
технологий Харьковского института банковского дела<br />
Университета банковского дела Национального Банка<br />
Украины<br />
Гофман Евгений Александрович 126 аспирант кафедры программных средств Запорожского<br />
национального технического университета<br />
Губаренко Евгений Витальевич 60 аспирант кафедры системотехники Харьковского<br />
национального университета радиоэлектроники<br />
Гурина Анна Владимировна 70 студентка кафедры системотехники Харьковского<br />
национального университета радиоэлектроники<br />
Джулгам Саад 98 аспирант кафедры компьютерных наук Cумского<br />
государственного университета<br />
Ерохин Андрей Леонидович 89 д-р техн. наук, профессор, начальник факультета<br />
психологии, менеджмента, социальных<br />
и информационных технологий Харьковского<br />
национального университета внутренних дел<br />
Жолткевич Григорий Николаевич 54 канд. физ.-мат. наук, д-р техн. наук, декан механико-<br />
математического факультета Харьковского<br />
национального университета им. В. Н. Каразина<br />
Зайцев Сергей Алексеевич 131 аспирант кафедры программных средств Запорожского<br />
национального технического университета
Зарецкая Ирина Тимофеевна 54 канд. физ.-мат. наук, доцент механико-математического<br />
факультета Харьковского национального университета<br />
им. В. Н. Каразина.<br />
Зацеркляный Николай Милентиевич 89 д-р техн. наук, профессор кафедры информатики<br />
и информационных технологий в деятельности ОВС<br />
Харьковского национального университета внутренних дел<br />
Kалиновская Екатерина Михайловна 54 заместитель заведующего отделом рептилий Харьковского<br />
зоопарка<br />
Калита Надежда Ивановна 70 канд. техн. наук, доцент кафедры системотехники<br />
Харьковского национального университета<br />
радиоэлектроники<br />
Карреро Яфрейзи 54 бакалавр гуманитарных наук (BA), математика, fine Arts<br />
minor, College of Mount Saint Vincent, Riverdale, New York;<br />
магистр ландшафтной архитектуры (MLA, Master of<br />
Landscape Architecture), The Bernard and Anne Spitzer<br />
School of Architecture, CUNY City College of New York,<br />
New York<br />
Коноплянко Зеновий Дмитриевич 150 д-р техн. наук, профессор кафедры компьютерных<br />
технологий Львовского института банковского дела<br />
Университета банковского дела Национального Банка<br />
Украины<br />
Кораблев Николай Михайлович 102 канд. техн. наук, доцент кафедры ЭВМ Харьковского<br />
национального университета радиоэлектроники<br />
Кузьменко Сергей Викторович 65 канд. техн. наук, доцент Харьковского национального<br />
университета внутренних дел<br />
Мальков Юрий Анатольевич 136 аспирант кафедры ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Мартыненко Сергей Сергеевич 98 ведущий специалист кафедры компьютерных наук<br />
Cумского государственного университета<br />
Михаль Олег Филиппович 112, 119 д-р техн. наук, профессор кафедры ЭВМ Харьковского<br />
национального университета радиоэлектроники<br />
Мохамад Али 119 аспирант кафедры ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Носов Kонстантин Валентинович 54 канд. физ.-мат. наук, научный сотрудник лаборатории<br />
моделирования адаптационных механизмов<br />
биологического факультета Харьковского национального<br />
университета им. В. Н. Каразина<br />
Олейник Андрей Александрович 126 канд. техн. наук, доцент кафедры программных средств<br />
Запорожского национального технического университета<br />
Павлишенко Богдан Михайлович 157 канд. физ.-мат. наук, доцент факультета электроники<br />
Львовского национального университета им. Ивана Франка<br />
Петров Эдуард Георгиевич 60 д-р техн. наук, профессор, заведующий кафедрой<br />
системотехники Харьковского национального<br />
университета радиоэлектроники<br />
Писклакова Валентина Петровна 78 канд. техн. наук, старший научный сотрудник кафедры<br />
системотехники Харьковского национального<br />
университета радиоэлектроники<br />
Писклакова Ольга Александровна 74, 78 канд. техн. наук, доцент кафедры системотехники<br />
Харьковского национального университета<br />
радиоэлектроники<br />
163
Полякова Татьяна Викторовна 85 ассистент кафедры информатики Харьковского<br />
национального автодорожного университета<br />
Почанский Олег Михайлович 143 аспирант кафедры искусственного <strong>интеллект</strong>а<br />
Харьковского национального университета<br />
радиоэлектроники<br />
Пряничникова Алла Анатольевна 78 аспирант кафедры системотехники Харьковского<br />
национального университета радиоэлектроники<br />
Русакова Наталья Евгеньевна 50 младший научный сотрудник кафедры программного<br />
обеспечения ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Субботин Сергей Александрович 126, 131 канд. техн. наук, доцент кафедры программных средств<br />
Запорожского национального технического университета<br />
Танянский Сергей Станиславович 136 канд. техн. наук, доцент кафедры ЭВМ Харьковского<br />
национального университета радиоэлектроники<br />
Турута Алексей Петрович 89 преподаватель кафедры информатики и информационных<br />
технологий в деяльности ОВС Харьковского<br />
национального университета внутренних дел<br />
Фомичев Александр Александрович 102 аспирант кафедры ЭВМ<br />
Харьковского национального университета<br />
радиоэлектроники<br />
Четвериков Григорий Григорьевич 150 д-р техн. наук, профессор кафедры программного<br />
обеспечения ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Шабанов-Кушнаренко 3, 14, д-р техн. наук, профессор кафедры программного<br />
Юрий Петрович 30, 46 обеспечения ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Шкловец Артем Вадимович 94 аспирант кафедры ЭВМ Харьковского национального<br />
университета радиоэлектроники<br />
Шмидт Дмитрий Евгеньевич 74 студент факультета компьютерных наук Харьковского<br />
национального университета радиоэлектроники<br />
164
ПРАВИЛА<br />
оформлення рукописів для авторів науково-технічного журналу<br />
«БІОНІКА ІНТЕЛЕКТУ»<br />
Науково-технічний журнал «Біоніка интелекту»<br />
приймає до друку написані спеціально для нього<br />
оригінальні рукописи, які раніше ніде не друкувались.<br />
Структура рукопису повинна бути такою:<br />
індекс УДК, заголовок, відомості про авторів,<br />
анотація, ключові слова, вступ, основний текст<br />
статті, висновки, список використаної літератури.<br />
Відповідно до Постанови ВАК України від<br />
15.01.2003 <strong>№</strong>7-05/1 (Бюлетень ВАК, <strong>№</strong>1, 2003, с. 2),<br />
стаття повинна мати такі необхідні елементи:<br />
постановка проблеми в загальному вигляді та<br />
її зв’язок із важливими науковими чи практичними<br />
завданнями; аналіз останніх досліджень і<br />
публікацій і виділення не вирішених раніше частин<br />
загальної проблеми в даній області; формулювання<br />
цілей та завдань дослідження; виклад основного<br />
матеріалу досліджень з повним обґрунтуванням<br />
отриманих наукових результатів; висновки з даного<br />
дослідження та перспективи подальших<br />
досліджень у даному напрямку.<br />
Статті мають бути виконані в редакторі Microsoft<br />
Word. Формат сторінки – А4 (210х297 мм), поля:<br />
верхнє – 25 мм, нижнє – 20 мм, ліве, праве – 17 мм.<br />
Кількість колонок – 2, з інтервалом між ними 5 мм,<br />
основний шрифт Times New Roman, кегль основного<br />
тексту – 10 пунктів, міжрядковий інтервал<br />
– множник (1,1), абзацний відступ – 6 мм. Обсяг<br />
рукопису – від 4 до 12 сторінок (мови: російська,<br />
українська, англійська).<br />
УДК друкується з першого рядка, без відступів,<br />
вирівнювання по лівому краю.<br />
Назва статті друкується прописними літерами<br />
після відомостей про авторів; шрифт прямий,<br />
напівжирний, кегль 12. Назви розділів нумерують<br />
арабськими цифрами, виділяють жирним шрифтом.<br />
Відступи для назви статті, ініціалів та прізвищ<br />
авторів, відомостей про авторів, назв розділів, вступу<br />
та висновків, списку літератури: зверху – 6 пт,<br />
знизу – 3 пт.<br />
Анотацію (мовою статті, абзац 4-10 рядків, кегль<br />
9) розміщують на початку статті, в ній має бути<br />
розміщена інформація про результати описаних<br />
досліджень.<br />
Ключові слова (4-10 слів з тексту статті, які з точки<br />
зору інформаційного пошуку несуть змістовне<br />
навантаження) наводять мовою рукопису, через<br />
кому в називному відмінку, кегль 9.<br />
Малюнки та таблиці (чорно-білі, контрастні)<br />
розміщуються у тексті після першого посилання<br />
у вигляді окремих об’єктів і нумерують арабськими<br />
цифрами наскрізною нумерацією за наявності<br />
більше ніж одного об’єкта. Невеликі схеми, що<br />
складаються з 3-4 елементів виконують, використовуючи<br />
вставку об’єкта Рисунок Microsoft Word.<br />
Більш складні виконують у графічних редакторах<br />
у вигляді чорно-білих графічних файлів форматів<br />
.tiff, .jpg, .wmf, .cdr із розділенням 300 dpi. Рисунки<br />
мають міститися у текстовому файлі й обов’язково<br />
подаватися окремим файлом з відповідною назвою<br />
(наприклад, Рис.1.cdr).<br />
Усі елементи малюнка, включаючи написи,<br />
повинні бути згруповані. Усі написи в малюнках і<br />
таблицях мають бути виконані шрифтом Times New<br />
Roman, кегль у малюнках – 10, у таблицях – 9.<br />
Малюнок повинен мати центрований підпис<br />
(поза малюнком), шрифт 9, відступи зверху і знизу<br />
по 6 пт. Ширина малюнка має відповідати ширині<br />
колонки (або ширині сторінки).<br />
Формули, символи, змінні, повинні бути набрані<br />
в редакторі формул MathType або Microsoft Equation.<br />
Формули розміщують посередині рядка й<br />
нумерують за наявності посилань на них у рукописі.<br />
Шрифт – Times New Roman. Висота змінної – 10<br />
пунктів, великих і малих індексів – 8 пт, основний<br />
математичний символ – 12 (10) пт. Змінні, позначені<br />
латинськими літерами, набирають курсивом,<br />
грецькі літери, скорочення російських слів і цифри<br />
– прямим написанням. Змінні, які є в тексті, також<br />
набирають у редакторі формул.<br />
Список літератури вміщує опубліковані джерела,<br />
на які є посилання в тексті, укладені у квадратні<br />
дужки, друкують без абзацного відступу, кегль 9 пт,<br />
відступ зверху – 6 пт.<br />
Після списку літератури з відступом зверху 6 пт<br />
зазначають дату подання статті до редколегії. Число<br />
та місяць задають двозначними числами через<br />
крапку. Розмір шрифта – 9 пт, курсив, вирівнювання<br />
по правому краю.<br />
Реферати (Times New Roman, кегль – 9 пунктів,<br />
3-4 речення) подають російською та англійською мовами.<br />
Реферат не повинен дублювати текст анотації.<br />
Разом із рукописом (на аркушах білого паперу<br />
формату А4 щільністю 80-90 г/м2, надрукований<br />
на лазерному принтері, у 2-х примірниках) необхідно<br />
подати такі документи:<br />
1. Заяву, яку повинні підписати всі автори.<br />
2. Акт експертизи про можливість опублікування<br />
матеріалів у відкритому друці.<br />
3. Рецензію, підписану доктором наук.<br />
4. Відомості про авторів.<br />
5. Електронний варіант рукопису, реферату та<br />
відомостей про авторів.<br />
6. Оплату за публікацію.<br />
Необхідно також зазначити один з наступних<br />
тематичних розділів, якому відповідає рукопис:<br />
1. Теоретичні основи інформатики та кібернетики.<br />
Теорія інтелекту<br />
2. Математичне моделювання. Системний<br />
аналіз. Прийняття рішень<br />
3. Інтелектуальна обробка інформації. Розпізнавання<br />
образів<br />
4. Інформаційні технології та програмно-технічні<br />
комплекси<br />
5. Структурна, прикладна та математична лінгвістика<br />
6. Дискусійні повідомлення<br />
165
БІОНІКА ІНТЕЛЕКТУ<br />
інформація, мова, інтелект<br />
Науково-технічний журнал<br />
<strong>№</strong> 3 (<strong>77</strong>)<br />
<strong>2011</strong><br />
Рекомендовано Вченою радою<br />
Харківського національного університету радіоелектроніки<br />
(протокол <strong>№</strong> 5 від 28.10.<strong>2011</strong>)<br />
Коректор — Л. М. Денісова<br />
Комп’ютерне верстання — О. Б. Ісаєва<br />
Свідоцтво про державну реєстрацію КВ <strong>№</strong> 12072-943 ПР від 07.12.2006<br />
Підп. до друку 28.10.<strong>2011</strong>. Формат 60 х 84 1 / 8. Друк ризографічний.<br />
Папір офсетний. Гарнітура Newton. Умов. друк. арк. 19,3. Обл.-вид. арк. 19,0.<br />
Тираж 100 пр. Зам. <strong>№</strong> .<br />
Надруковано в навчально-науковому видавничо-поліграфічному центрі ХНУРЕ<br />
Свідоцтво суб’єкта видавничої справи ДК <strong>№</strong> 1409 від 26.06.2003<br />
Адреса редакції та видавця:<br />
просп. Леніна, 14, Харків-166, 61166, Україна,<br />
Харківський національний університет радіоелектроніки, к. 127<br />
тел. 702-14-<strong>77</strong>, факс 702-10-13,<br />
e-mail: bionics@kture.kharkov.ua