21.08.2015 Views

Труды

7fupm2 - Московский Физико-Технический Институт

7fupm2 - Московский Физико-Технический Институт

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Министерство образования и науки Российской ФедерацииМосковский физико-технический институт(государственный университет)Утверждаю в печатьПроректор по инновационной и научной работеМуравьев А.А._____________________18 декабря 2011 г.<strong>Труды</strong>54-й научной конференции МФТИПроблемы фундаментальных и прикладных естественных итехнических наук в современном информационном обществе10–30 ноября 2011 годаУправление и прикладная математикаТом 2Декан факультета____________________________________________18 декабря 2011 г.Москва–Долгопрудный–ЖуковскийМФТИ2011


ISBN 978-5-7417-0404-29 785741 704042


Министерство образования и науки Российской ФедерацииМосковский физико-технический институт(государственный университет)<strong>Труды</strong>54-й научной конференции МФТИПроблемы фундаментальных и прикладных естественныхи технических наук в современном информационномобществе10–30 ноября 2011 годаУправление и прикладная математикаТом 2Москва–Долгопрудный–ЖуковскийМФТИ2011


Министерство образования и науки Российской ФедерацииРоссийская академия наукМосковский физико-технический институт(государственный университет)Российский фонд фундаментальных исследований<strong>Труды</strong>54-й научной конференции МФТИПроблемы фундаментальных и прикладных естественныхи технических наук в современном информационномобществе10–30 ноября 2011 годаУправление и прикладная математикаТом 2Москва–Долгопрудный–ЖуковскийМФТИ2011


УДК 519.6(06)ББК 22.1Т78Т78<strong>Труды</strong> 54-й научной конференции МФТИ «Проблемыфундаментальных и прикладных естественных и техническихнаук в современном информационном обществе».Управление и прикладная математика. Том 2. — М.: МФТИ, 2011.— 148 с.ISBN 978-5-7417-0404-2Второй том посвящен преимущественно направлениям, связанным с компьютернымитехнологиями: программированию, распараллеливанию, интеллектуальномуанализу данных, системному программированию, системам математического обеспечения.Содержится большое количество приложений отмеченных технологий к решениюконкретных востребованных задач математического моделирования, распознаванияи прогнозирования. В 2011 году на ФУПМе открылись три новые базовыекафедры (на базе кафедры Информатики и Parallels, на базе ИППИ РАН, на базеИТМФ г. Сарова) и одна специализация («Анализ данных Яндекс» на базе кафедрычл.-корр. РАН К.В. Рудакова). Новая базовая кафедра «Предсказательного моделированияи оптимизации» с этого года добавила в программу конференции заседаниеодноименной секции, возглавляемой чл.-корр. РАН, директором ИППИ РАНА.П. Кулешовым. С этой кафедрой и с кафедрой Вычислительной математики связаныдва мегапроекта о создании лаборатории. По работе одноименных секций, представленныхв этом томе, можно косвенным образом ознакомиться с тематиками этихмегапроектов. В последние годы стало хорошей традицией кафедры Информатикинабирать порядка 20–30 тезисов. С этого года было решено разбить заседание секцииИнформатики на два, возглавляемые проф. И.Б. Петровым (зав. каф. Информатики)и проф. А.Г. Тормасовым (зав. каф. на базе Parallels). С аннотацией пленарногодоклада И.Б. Петрова можно познакомиться в томе 1.УДК 519.6(06)ББК 22.1ISBN 978-5-7417-0404-2© Федеральное государственное бюджетное образовательноеучреждение высшего профессионального образования«Московский физико-технический институт(государственный университет)», 2011


3Программный комитет конференцииН.Н. Кудрявцев, член-корр. РАН, ректор института — председательТ.В. Кондранин, профессор, первый проректор — зам. председателяА.А. Муравьёв, с.н.с., проректор по научной и инновационной работе —зам. председателяЛ.В. Стрыгин, к.ф.-м.н. — учёный секретарь конференцииМ.В. Алфимов, академик РАН — директор Центра фотохимии РАНА.Ф. Андреев, вице-президент РАН — директор ИФП РАНС.Т. Беляев, академик РАН — профессор МФТИЕ.П. Велихов, академик-секретарь Отделения НИТ РАН — Президент НИЦ«Курчатовcкий институт»В.Ф. Гантмахер, член-корр. РАН — зав. кафедрой МФТИЮ.В. Гуляев, академик РАН — директор ИРЭ РАНВ.Г. Дмитриев, член-корр. РАН — зав. кафедрой МФТИВ.П. Иванников, академик РАН — директор ИСП РАНА.С. Коротеев, академик РАН — директор Центра КелдышаН.А. Кузнецов, академик РАН — зав. кафедрой МФТИВ.Л. Макаров, академик РАН — директор ЦЭМИ РАНВ.Е. Фортов, академик-секретарь Отделения ЭММПУ РАН —директор ОИВТ РАНБ.Е. Патон, академик РАН — президент НАН УкраиныВ.Т. Черепин, член-корр. НАН Украины — директор ФТЦ НАН УкраиныС.А. Жданок, академик-секретарь Отделения ФТН НАН БеларусиС.Н. Гаричев, д.т.н. — декан ФРТКМ.Р. Трунин, д.ф.-м.н. — декан ФОПФС.С. Негодяев, к.т.н. — декан ФАКИИ.Н. Грознов, доцент — декан ФМБФП.А. Тодуа, профессор — декан ФФКЭВ.В. Вышинский, профессор — декан ФАЛТА.А. Шананин, профессор — декан ФУПМА.Г. Леонов, профессор — декан ФПФЭВ.Е. Кривцов, доцент — декан ФИВТМ.В. Ковальчук, член-корр. РАН — декан ФНБИКЛ.К. Ужинская, к.т.н. — декан ФИБСА.И. Кобзев, профессор — декан ФГНА.П. Алёхин, профессор — зав. кафедройЮ.М. Белоусов, профессор — зав. кафедройА.С. Бугаёв, академик РАН — зав. кафедройВ.Н. Бондарик, к.т.н. — зав. кафедройС.А. Гуз, доцент — зав. кафедройА.П. Иванов, профессор — зав. кафедройА.В. Кваченко, к.т.н. — зав. кафедройВ.А. Никишкин, к.ф.-м.н. — зав. кафедройД.С. Лукин, профессор — и.о. зав. кафедрой


4А.В. Максимычев, д.ф.-м.н. — зав. кафедройИ.Б. Петров, профессор — зав. кафедройЕ.С. Половинкин, профессор — зав. кафедройЭ.Е. Сон, член-корр. РАН — зав. кафедройА.А. Тельнова, доцент — зав. кафедройЭ.М. Трухан, профессор — зав. кафедройА.С. Холодов, член-корр. РАН — зав. кафедройР.М. Энтов, академик РАН — зав. кафедрой


Содержание 5СодержаниеПрограммный комитет конференции . . . . . . . . . . . . . . . . . . . . . . . . . . 3Секция вычислений на высокопроизводительных вычислительных системах . . . . 12Б.Г. Кухаренко, Д.И. ПономаревИспользование метода Прони для оценки временного масштаба при обнаружениипаттернов во временных рядах . . . . . . . . . . . . . . . . . . . . . . . 12В.В. РыковКогнитивные технологии в информационных системах — риторическое исчисление. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13Т.А. СивковаРазработка и реализация на CUDA алгоритмов произведения матриц и решениясистем линейных уравнений в арифметике высокой точности . . . . . 15В.Г. БайдинПроблемы качества сейсмической миграции в обратном времени на примеремодели BP2004 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16Д.Н. Морозов, А.А. ЛюпаРешение задач фильтрации на гибридных суперкомпьютерах . . . . . . . . . 18Н.Н. Оленев, В.В. ДикусарРаспределенные параллельные вычисления в идентификации моделей экономики. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19Н.А. Казеев, И.В. МорозовРешение уравнений движения с переменным шагом по времени в методемолекулярной динамики с волновыми пакетами . . . . . . . . . . . . . . . . . 20С.Г. Семёнов, И.В. МорозовЭффективная реализация комплексной функции ошибок для метода молекулярнойдинамики с волновыми пакетами . . . . . . . . . . . . . . . . . . . . 22Р.Г. БыстрыйМоделирование ионизованных наноразмерных кластеров на графическихускорителях . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Секция вычислительной математики . . . . . . . . . . . . . . . . . . . . . . . . . . 25А.Д. Подложнюк, Г.Е. ПекарьРазработка генератора гексаэдральных сеток для моделирования задач акустическогокаротажа в скважине, окруженной анизотропной средой . . . . . 25И.В. Цыбулин, Ю.И. СкалькоЧисленное построение квадратурной формулы для полусферы методом продолженияпо параметру . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27О.Г. Кононова, А.А. ЖмуровИсследование микромеханических свойств вирусных капсид методами молекулярнойдинамики на графических процессорах . . . . . . . . . . . . . . . . 29


6 СодержаниеМ.Н. ПетровРазработка программного комплекса для решения задачи распространениясейсмических волн в неоднородных средах . . . . . . . . . . . . . . . . . . . . 30Д.В. ЕгоровМоделирование распространения электрических импульсов в сердечной тканипроекционным методом . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31А.В. Шевченко, Ю.И. СкалькоПрименение разрывного метода Галеркина к задаче линейной акустики . . . 33М.С. ИшмановОб одной постановке задачи составления расписания движения общественноготранспорта . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34Секция динамики и управления движением космических аппаратов . . . . . . . . . 36С.П. Трофимов, М.Г. ШиробоковМетод виртуальных траекторий для проектирования сложных межпланетныхмиссий . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36А.В. Седельников, Д.С. РатничкинЗадача о влиянии изменения логарифмического декремента собственныхколебаний упругих элементов космического аппарата на поле создаваемыхмикроускорений его внутренней среды . . . . . . . . . . . . . . . . . . . . . . 37Н.А. ГерасимоваДвухимпульсный маневр поворота орбиты . . . . . . . . . . . . . . . . . . . . 37А.А. Дегтярев, В.Н. МаксименковМоделирование движения малого спутника, оснащенного оптическим датчикомориентации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39Д.С. Иванов, С.О. КарпенкоОпределение относительного положения и ориентации спутников в групповомполете с использованием видеосъемки освещенного Солнцем космическогоаппарата . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40Д.О. Нуждин, С.С. ТкачевДистанционная лаборатория . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42А.Б. НуралиеваО динамике космического лифта . . . . . . . . . . . . . . . . . . . . . . . . . . 43И.В. БезруковДвижение спутника на круговой орбите под действием аэродинамическогои гравитационного моментов . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44А.В. ЧерновО динамике космического лифта в окрестности рабочего состояния . . . . . 46Секция информатики . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48С.Л. Бабичев, А.К. Коньков, К.А. КоньковАвтоматизированный анализ проблем синхронизации параллельных алгоритмовв вычислительных системах с общей памятью . . . . . . . . . . . . . 48М.В. Муратов, В.И. ГолубевЧисленное моделирование волновых откликов трещиноватых геологическихпластов и их анализ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50


Содержание 7В.С. ФедоровВытесняющая дисковая планировка в ядре ОС Windows . . . . . . . . . . . . 51Д.И. ПономаревИспользование алгоритма ожидания и максимизации правдоподобия в марковскоймодели непрерывного профиля для синхронизации сигналов манипулятора. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52А.В. ФаворскаяСеточно-характеристический метод на иерархических сетках . . . . . . . . . 54А.В. ФаворскаяПостановка задачи численного моделирования динамических процессов всплошной линейно-упругой среде с анизотропией сеточно-характеристическимметодом . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55И.Е. Квасов, А.В. Санников, А.В. ФаворскаяЧисленное моделирование пространственных динамических процессов в гетерогенныхсредах сеточно-характеристическим методом на высокопроизводительныхвычислительных системах . . . . . . . . . . . . . . . . . . . . . . . 56В.И. Голубев, И.Е. КвасовОпределение геометрических характеристик геологических пластов на основеметодов быстрой оптимизации . . . . . . . . . . . . . . . . . . . . . . . . . 58А.Ю. Субботина, Д.В. Лунев, А.В. Николаев, А.Л. ЧуличковВиртуальный кластер . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59А.В. ВасюковО решении задач динамической прочности трубопроводов под давлением сиспользованием параллельной версии сеточно-характеристического численногометода на неструктурированных сетках . . . . . . . . . . . . . . . . . . . 60Л.И. ИваничкинаСистема безопасности для распределенного файлового хранилища TorFS . . 61Ю.В. ГоршенинСистема распределенного выполнения задач nacloud . . . . . . . . . . . . . . 62А.В. Храбров, Ю.В. РубановаМониторинг дисковой активности в ОС Windows . . . . . . . . . . . . . . . . 62М.А. ХламовПрименение высокопроизводительных вычислений на GPU для решения задачкриптографии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63В.А. ДавыдовОграничение использования ресурса процессора группами процессов прииерархическом планировании задач в ОС Linux . . . . . . . . . . . . . . . . . 64А.А ТемниковаРасчет взаимодействия упругой волны с пористой средой . . . . . . . . . . . 66М.Н. Пименов, Т.Р. Исходжанов, Д.С. ВьюковОпределение состояний гонки в языке программирования Go . . . . . . . . . 67Д.И. Петров, П.О. ТихомировРазработка прототипа программно-аппаратной системы быстрого реагированияавтоматизированного сбора и публикации информации от разнообразныхдатчиков в Internet и децентрализованных сетей ZigBee для последующегорезервирования данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68


8 СодержаниеО.О. ЕвсютинДекоррелирующие клеточные преобразования . . . . . . . . . . . . . . . . . . 69А.В. ТретьяковАвтоматизация составления расписаний для систем реального времени . . . 70Д.А. Подлесных, А.И. ФедорчукCистема быстрого развёртывания и тестирования GPU кластера . . . . . . . 72Секция предсказательного моделирования и оптимизации . . . . . . . . . . . . . . 74А.В. СеливерстовОб оптимизации на множестве вершин многомерного куба . . . . . . . . . . . 74А.А Зайцев, Е.В. Бурнаев, Е.Р. КапушевЗадача консолидации разноточных данных . . . . . . . . . . . . . . . . . . . . 75М.Е. Панов, Е.В. Бурнаев, И.А. КоноваленкоСравнительный обзор методов адаптивного планирования эксперимента дляпостроения аппроксимации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76М.Е. Панов, А.А. ЗайцевО способах введения расстояния при моделированиии ковариационной функциигауссовского процесса . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77М.Г. Беляев, А.Д. Любин, Е.В. БурнаевМетодика формирования функционального словаря в задаче аппроксимациимногомерной зависимости . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78Е.А. Крымова, Е.В. БурнаевСглаживание сплайнов с натяжением . . . . . . . . . . . . . . . . . . . . . . . 79М.Г. Беляев, Ю.А. ЯновичСглаживание суррогатных моделей . . . . . . . . . . . . . . . . . . . . . . . . 80П.Д. Ерофеев, П.В. ПриходькоЭффективное снижение размерности на основе аппроксимации гауссовскимипроцессами . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81П.Д. Ерофеев, П.В. ПриходькоПрименение техники эффективного снижения размерности в задаче оптимизациикрыла самолета . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82М.Г. Беляев, А.Д. ЛюбинРазделимость переменных в оптимизационной задаче при построении аппроксимации. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83Е.В. Бурнаев, Ю.А. ЯновичРазреженные гауссовские процессы . . . . . . . . . . . . . . . . . . . . . . . . 85А.В. Нехаев, М.Г. БеляевСравнение алгоритмов выбора размера скрытого слоя при аппроксимациинейронными сетями . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86И.И. Панин, Е.В. Бурнаев, П.В. ПриходькоО выборе регрессионных моделей . . . . . . . . . . . . . . . . . . . . . . . . . 87О.А. Зверков, К.Ю. Горбунов, А.В. Селиверстов, В.А. ЛюбецкийКластеризация белков с учётом их доменной структуры . . . . . . . . . . . . 88Д.С. КононенкоПриближенное вычисление обратной матрицы и ее детерминанта в гауссовскихпроцессах . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89


Содержание 9Е.В. Любецкая, К.Ю. Горбунов, А.В. Селиверстов, В.А. ЛюбецкийДифференциальные уравнения, описывающие клеточный процесс . . . . . . 90Секция проблем интеллектуального анализа данных, распознавания и прогнозирования. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93Д.А. Юдин, В.З. МагергутПрименение математического аппарата самоорганизующихся карт при разработкесистемы технического зрениядля вращающихся печей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93Р.Г. БерезовскийЦеленаправленное поведение интеллектуальных агентов со знаковой картиноймира . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94Н.В. СпиринОбъектно-ориентированный веб-поиск с логическими ограничениями . . . . 95А.В. Артемов, Н.В. СпиринМетоды машинного обучения в задаче автоматического извлечения информациииз электронных полнотекстовых документов . . . . . . . . . . . . . . . 97А.А. РоманенкоПрименение агрегирующего алгоритма В. Вовка в задаче прогнозированияпри несимметричном функционале потерь . . . . . . . . . . . . . . . . . . . . 98Н.К. ЖивотовскийКритерий точности комбинаторных оценок вероятности переобучения . . . . 99Ю.А. ЯновичОценивание скрытого профиля компактности в задачах обучения методомближайшего соседа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101Г.Б. СологубПрименение байесовских сетей для моделирования знаний студентов в интеллектуальнойсистеме тестирования . . . . . . . . . . . . . . . . . . . . . . . 102О.О. ИсуповаМетод формирования начальных приближений в вероятностном латентномсемантическом анализе . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103К.В. ПавловАлгоритм выбора многоуровневых моделей в задаче восстановления логистическойрегрессии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104К.В. ЧувилинАвтоматический синтез и статистическая оценка качества правил коррекциидокументов в формате LaTeX . . . . . . . . . . . . . . . . . . . . . . . . . . . 106А.В. Каменев, Ф.Ф. ПащенкоИнтеллектуальный анализ данных для прогнозирования транспортного потока108Н.В. Спирин, А.Н. ФирстенкоМетоды выделения терминов и тематической классификации текстовых документов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109В.В. ШейнинРанговый метод решения задач тематической кластеризации . . . . . . . . . 110


10 СодержаниеСекция синергетики и вычислительной нанофизики . . . . . . . . . . . . . . . . . . 112А.И. АвраменкоО классификации нелинейных структур, описываемых уравнением Гросса—Питаевского с периодическим потенциалом . . . . . . . . . . . . . . . . . . . . 112С.А. ЖдановГенерация кода приложений численного моделирования на основе системыкомпьютерной алгебры Symbalg . . . . . . . . . . . . . . . . . . . . . . . . . . 113С.А. ХилковЧисленное моделирование стохастического резонанса в системах с различнымистатистиками . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114М.Ю. КудрявцевАгентно-ориентированное моделирование фондового рынка на примере модифицированноймодели Сато—Такаясу . . . . . . . . . . . . . . . . . . . . . 114А.Ю. ПерепёлкинаЧисленное моделирование плазмы в канале холловского двигателя . . . . . . 116А.А. ЧесноковМоделирование столкновительных процессов в плазме холловского двигателя117А.В. Закиров, В.Д. ЛевченкоИнтерфейс задания параметров и обработки результатов программного комплексаLRnLA/Nano для моделирования задач нанооптики . . . . . . . . . . 118Е.В. Зипунова, А.В. ИвановК вопросу о подборе наилучшей разностной схемы для решения уравненияЛандау—Лифшица . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119Е.П. ГусевМоделирование процесса напыления тонких магнитных пленок методамимолекулярной динамики . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119Секция систем математического обеспечения . . . . . . . . . . . . . . . . . . . . . 121А.А. Домунян, А.М. Михайлов, М.Н. СергийчукПоисковая система Кортекс . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121А.А. БездушныйАвтоматизация разработки интернет-информационных систем на базе OWLонтологий. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122К.А. КузнецовПубликация данных ЕНИП РАН в пространстве Linked Open Data . . . . . . 124И.В. МашинцевПрототипирование электронной платежной системы . . . . . . . . . . . . . . 125А.А. КаленковаИнтеграция геоинформационных ресурсов и ресурсов электронных библиотек126В.В. КостинИнформационно-аналитическая система месторождений металлов . . . . . . 127Ф.В. Яременко, А.Н. БездушныйМоделирование документооборота и делопроизводства . . . . . . . . . . . . . 129Ф.В. ЯременкоФормализация федерального закона о государственных закупках с помощьюпотоков работ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130


Содержание 11Секция системного программирования и программной инженерии . . . . . . . . . . 132А.А. Пантелеймонов, А.В. Гапон, Ю.Н МанойлоПодход к масштабированию систем комплексной обработки событий . . . . . 132В.А. Золотов, К.С. ПетрищевЛокальное планирование движения на основе случайных деревьев . . . . . . 133Г.А. Дубовик, В.А. ПетрухинВерификация времени исполнения распределенных систем . . . . . . . . . . 135А.Е. Бобков, С.В. КлименкоИсследование и разработка методов добавления деталей к модели рельефа . 136С.П. Прохоров, Т.И. СергееваРегрессионное тестирование технологической цепочки компиляторов GCCдля новой архитектуры процессоров . . . . . . . . . . . . . . . . . . . . . . . . 137С.Н. НечуйвитерО возможности аддитивной агрегации шахматных рейтингов . . . . . . . . . 138А.Н. ЧернодубМетод смешивания мнений экспертов комитета нейронных сетей на основерасширенного фильтра Калмана для задачи прогнозирования временныхрядов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140В.П. Алешин, В.М. КулиевСистема трекинга для оценки 3D-восприятия в спорте . . . . . . . . . . . . . 141Я.В. Гевличев, М.Н. Данилин, А.В. БалашовИнтеллектуальные системы аутентификации, авторизации и аудита как методобеспечения сетевой безопасности информационных систем на примересистемы Mосковского физико-технического института . . . . . . . . . . . . . 143А.А. Манаенкова, Т.В. ПустовойМодуль шаблонной генерации документов персонализированной образовательнойсреды SIMLearn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144Т.В. ПустовойОсобенности интеграции персонализированного образовательного пространствавузов в коммуникационное пространство виртуального Сколково . . . . 145А.А. ШумилинВиртуализация в высокопроизводительных вычислениях. Исправление кодагипервизора Palacios для использования режима Unrestricted Guest процессоровIntel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146


12 Б.Г. Кухаренко, Д.И. ПономаревСекция вычисленийна высокопроизводительныхвычислительных системахУДК 519.246Использование метода Прони для оценки временногомасштаба при обнаружении паттернов во временных рядахБ.Г. Кухаренко 1,2 , Д.И. Пономарев 11 Институт машиноведения РАН2 Московский физико-технический институт (государственный университет)Рассматривается задача обнаружения паттернов во временных рядах. Для оценкихарактерного временного масштаба используется одночастотная аппроксимация временногоряда по методу Прони. В качестве примера рассматриваются записи управляющихсигналов манипулятора с MEMS-акселерометром [1]. Паттерны управляющегосигнала манипулятора представляют произвольные движения — жесты рукиоператора.Декомпозиция Прони сегмента (для краткости индекс сегмента i = 1, round(N 0 /N)ниже опускается) имеет вид: y[k] = ∑︀ pl=1 r[l](z[l])k−1 + n[k], k = 1, N, где p — числоопределяемых полюсов сегмента временного ряда; z(l) = exp(δ[l] + j2πf[l]), l = 1, p —полюса, которые определяются для сегмента (2), где δ[l] иf[l] — соответственно фактордемпфирования (логарифмический декремент) и частота; r[l] = α[l]exp(jφ[l]), l =1, p — вычеты в этих полюсах, где α[l] и φ[l] — соответственно амплитуда и фаза;n[k], k = 1, N, — аддитивный шум [2].В качестве алгоритма обнаружения паттернов в записи ускорения на рис. 1 используетсяалгоритм Mueen-Keogh (MK) Motif Discovery [3].Ключевая идея алгоритма MK Motif Discovery состоит в том, что одномерное (линейное)упорядочение последовательностей предоставляет полезную эвристическуюинформацию для поиска паттернов. Действительно, если две последовательностиблизки в исходном пространстве размерности M, то они должны быть также близкив линейном упорядочении. Отметим, что обратное неверно. Две последовательности,почти совпадающие после нормировки, которые представляют первый паттернв записи ускорения, обнаруженный посредством алгоритма MK Motif Discovery, показанына рис. 1 сплошной линией. Представляющие этот паттерн последовательности,которые почти совпадают после нормировки, показаны на рис. 2.


Когнитивные технологии в информационных системах — риторическое исчисление 13Рис. 1. Паттерн в записи ускоренияРис. 2. Две последовательности после нормировкиЛитература1. Kukharenko B.G., Ponomarev D.I. Bayesian filtering of control signal of teleroboticmanipulator with precise accelerometer // Проблемы машиностроения и автоматизации.— 2011. — № 1. — С. 72–76.2. Weiss L., McDonogh R.N. Prony’s method, Z-transform, and Pade approximation //SIAM Review. — 1963. — V. 9, N 2.— P. 145–149.3. Mueen A., Keogh E.J. Online discovery and maintenance of time series motifs //Proceedings of the 16th ASM SIGKDD Conference on Knowledge Discovery and DataMining (KDD 2010), July 25–28, 2010. — Washington, DC: ACM, 2010. — P. 1089–1098.УДК 002.001Когнитивные технологии в информационных системах —риторическое исчислениеВ.В. РыковМосковский физико-технический институт (государственный университет)Современные информационные технологии суть разные виды знаковой деятельности,то есть некоторые знаковые исчисления. При исследовании этих технологий


14 В.В. Рыковнеобходим междисциплинарный подход. Прежде всего необходимо описывать это втерминах пока еще не очень известных в нашей стране семиотики, или теории знаков.Действительно, создание, передача, понимание, хранение знаковых произведенийили текстов можно и следует описывать в рамках определенных знаковых технологий,или исчислений. К таким технологиям, или исчислениям, следует отнестисобственно семиотику с ее синтактикой (правила создания знаковых произведений —далее — текстов), семантикой — что эти тексты обозначают или их связи с действительностью.Также важно учитывать третью компоненту семиотики — прагматику,которая изучает отношение создателя и получателя к тексту. Несмотря на кажущуюсяабстрактность, прагматика есть необходимый компонент любой знаковой деятельности.Хорошим и наглядным примером здесь может послужить немедленное, затеми постоянное появление так называемых смайликов в сетевых коммуникациях. Людине могут не выражать своего отношения к тому, что они передают и получают. Можновысказать простую, но важную мысль. Любая теория, или исчисление, ценны своимипрогностическими свойствами. Так, появление особых прагматических знаков,или смайликов, в новых видах коммуникаций, где невозможно выразить прагматикужестами или интонацией (как теорема существования), можно было предсказать,зная основы семиотики.Также весьма продуктивной является теория обращения с текстами как социальнаядеятельность. Она изучает, казалось бы, рутинные правила — создания, передачи,хранения, копирования и цитирования текстов — устных, рукописных, печатныхи, наконец, на машинных носителях. Однако в рамках этой теории легко было предсказатьпоявление феномена Wikileaks с Джулианом Ассанжем. Еще более интересным,полезным и продуктивным представляется изучение риторики как информационногоисчисления и как части семиотики (поскольку это знаковая деятельность), аименно той ее части, которая называется прагматикой.Удивительно то, что эта наука была основана и очень подробно разработана болеедвух тысяч лет назад. Весь ее понятийный аппарат передавался в текстах, и впроцессе обучения пока не дошел до нас. Но большинство гуманитариев, не говоряо специалистах в точных науках, воспринимает ее как науку красиво или правильноговорить. Однако на самом деле это наука об эффективной деятельности. Какбудет кратко показано ниже — он, научный аппарат риторики, наконец, оказалсявостребованным. Но востребован он очень странным образом. Риторические моделиприменяются в новейших информационных продуктах и в информационной практике.Действительно, назовем только несколько риторических категорий. Это коммуникативныйакт, коммуникативная ситуация, субъект коммуникации, конвенции общения,эффективность взаимодействия. Становится ясно, что так или иначе эти категорииописывают существующую коммуникативную деятельность. Например, в риторикеговорят, что субъект коммуникации всегда выступает в образе автора. А этопрофили, ники, аватары сетевых коммуникантов.Развитие и изучение новых часто неожиданных и удивительных реалий нашейжизни требует привлечения также и новых, а часто забытых или невостребованныхтехнологий, или исчислений. Эти, модели, или исчисления, позволяют объяснить,предсказать, соединить воедино, казалось бы, странные или необъяснимые явления, вчастности в быстро развивающихся информационных или знаковых коммуникациях.Иными словами — после многих сложений и вычитаний полезно изучить алгебру.


Разработка и реализация на CUDA алгоритмов произведения матриц и решения систем линейныхуравнений в арифметике высокой точности 15Литература1. Рыков В.В. Обработка нечисловой информации. Управление знаниями. — М.:МФТИ, — 2008.2. Варзонин Ю.Н. Когнитивно-кoммуникативная модель риторики: докторскаядисс. — Тверь, 2001.УДК 519.688Разработка и реализация на CUDA алгоритмов произведенияматриц и решения систем линейных уравнений в арифметикевысокой точностиТ.А. СивковаМосковский физико-технический институт (государственный университет)Основная масса инженерных и научных расчетов выполняется с двойной точностью(реже — одинарной). Однако некоторые вычислительные задачи по своейприроде требуют использования чисел более высокой точности, что приводит к значительномуувеличению времени выполнения программ. В частности, при нахожденииматриц оператора прозрачных граничных условий, где возникает проблемачисленного выполнения обратного преобразования Лапласа [1]. Решением проблемыможет быть использование арифметики высокой точности с применением GPU.В открытом доступе находятся несколько библиотек для работы с числамивысокой точности, имеющие реализацию на CUDA. Мы рассмотрели две из них:«ARPREC (An Arbitrary Precision Computation Package)» [2] и «DD (Double —Double) and QD (Quad — Double)» [3]. Данные версии содержат только арифметическиеоперации с числами высокой точности и операции сравнения, а для практическогоприменения необходимо также иметь операции с матрицами и векторами.Поэтому мы разработали и реализовали на GPU с использованием технологии CUDA[4] алгоритмы произведения матриц и решения систем линейных уравнений, где векторнеизвестных и правая часть являются матрицами. Можно отметить следующиерезультаты проведенного анализа эффективности:1. Алгоритмы QD являются более производительными по сравнению с ARPRECдля работы с числами с 62-значной мантиссой.2. Расчеты на различных GPU (Tesla C1060, GeForce GTX480, Tesla C2050) показали,что предложенные алгоритмы достаточно оптимальны по распределению долейработы с памятью и количества вычислений.3. Для исполнения алгоритмов с quad-double числами, в которых доля арифметическихопераций существенно превышает долю операций обмена с памятью, предпочтительнееиспользовать Tesla C2050.4. Использование полученных алгоритмов на GPU Tesla C2050 может ускорятьвычисления операций произведения и обращения матриц в арифметике высокой точностиQD до 100 раз (по сравнению с ядром CPU Xeon5520). Этот результат близокк предельному, поскольку почти такое же ускорение имеют и сами элементарныеарифметические операции с quad-double.Работа выполнена при частичной поддержке гранта РФФИ 10-01-00567.


16 В.Г. БайдинЛитература1. Sofronov I.L., Zaitsev N.A. Numerical generation of transparent boundary conditionson the side surface of a vertical transverse isotropic layer // J. Comp. Appl. Math. —2010. — N 234. — С. 1732–1738.2. Bailey David H., Hida Yozo, Li Xiaoye S., Brandon Thompson ARPREC: AnArbitrary Precision Computation Package // Technical Report LBNL-53651. — 2002.3. Hida Yozo, Li Xiaoye S., Bailey David H. Library for Double-Double and Quad-DoubleArithmetic. — University of California, Berkeley, CA 94720. — 2008.4. Боресков А.В., Харламов А.А. Основы работы с технологией CUDA. — М.: ДМКПресс, 2010. — 232 с.УДК 519.688Проблемы качества сейсмической миграции в обратномвремени на примере модели BP2004В.Г. БайдинМосковский физико-технический институт (государственный университет),Технологическая компания «Шлюмберже»Задачи сейморазведки всегда требовали серьёзных вычислительных мощностей.С ростом производительности ЭВМ усложнялись и алгоритмы построения сейсмическихизображений. В данной работе рассматривается метод миграции в обратномвремени (Reverse time migration — RTM). Автором проделано тестирование программногокода [1] на ресурсоёмкой модели — EAGE BP2004 Benchmark. В работерассмотрены проблемы, возникающие при построении изображения методом RTM,а также способы их решения.Теоретическое обоснованиеВ данной работе рассматривается акустическое приближение с постоянной плотностью— скалярное волновое уравнение. Среда D с границей Γ задаётся одним скалярнымпараметром — скоростью звука c — и выписываются уравнения относительнодавления u:1c 2 u tt − ∆u = f (x, t) , (1)f (x, t) — функция сейсмоисточника. Для удобства введём κ = 1 c 2 .Для получения изображения используется следующая формула [2]:I 1 (x) =∫︁ T0S (x, t) · R (x, t) dt, (2)где S (x, t) = u j (x, t) — решение волнового уравнения (1), а R (x, t) = ψ (x, T − t) —решение сопряжённого к (1) уравнения.Фильтрация изображенийИзображение, полученное с помощью формулы (2), имеет ряд существенных недостатков,ухудшающих его качество.Из-за неоднородностей среды и ввиду очевидных ограничений, накладываемыхна систему наблюдения, некоторые участки изображения становятся сложными дляинтерпретации [3]. Для выравнивания освещенности применяется нормализация финальногоизображения по одной из следующих формул:


Проблемы качества сейсмической миграции в обратном времени на примере модели BP2004 17I Sn (x) =I(x)T∫︀S 2 (x,t) dt0, I Rn (x) =I(x)T∫︀R 2 (x,t) dt0.Чтобы убрать низкочастотный шум, применяют High-Pass Filter:∫︁1I HP F (x) = I (x) − I(ξ)σ √ (x−ξ)2e− 2σ 2 dξ. (3)2πDТехническая реализацияДля разработки методов улучшения качества изображения была использованамодель BP 2004 Benchmark размером 82.5×12 км. Вычисления велись на регулярнойсетке с шагом 6.25 × 6.25 м. Всего было использовано 1348 сейсмограмм, расчётпроизводился на 12 с, с шагом по времени 0.4 · 10 −3 c.Для вычислений использовался конечно-разностный код, написанный ЛеонидомДовгиловичем, на основе центральных разностей и компактных схем высокого порядкааппроксимации по пространству и вторым порядком по времени. Программаиспользует возможности архитектуры с общей памятью на основе POSIX Threads иработает распределённо, используя интерфейс MPI. Расчёты проводились на кластереМФТИ-60.РезультатыВ результате работы над моделью EAGE BP2004 Benchmark было получено качественноеизображение среды не только на исходной сетке с шагом 6.25 м, но и насетке с шагом 12.5 м. Были проанализированы различные методы нормализации ифильтрации изображения, на основе чего был выбран наилучший по качеству метод.Также показано, что численный метод, реализованный в используемой программе,устойчив и эффективен для решения задач такого масштаба.Рис. 1. Скоростная модель средыРис. 2. Изображение, полученное на сетке 12.5 × 12.5 метров с использованием компактнойсхемы 12-го порядка


18 Д.Н. Морозов, А.А. ЛюпаРис. 3. Примеры действия фильтров: a) Исходное изображение, b) Нормализация,c) HPF-фильтрЛитература1. Довгилович Л.Е. О трехуровневом параллельном алгоритме обратной миграцииво временной области (RTM) на основе компактных схем // XVIII конференция«Теоретические основы и конструирование численных алгоритмов решения задачматематической физики», 2010.2. Федоренко Р.П. Приближённое решение задач оптимального управления. М.: Наука,1978. — 488 с.3. Kaelin B., Guitton A. Imaging condition for reverse time migration // SEG TechnicalProgram Expanded Abstracts, SEG. — 2006. — V. 25. —2594–2598.УДК 519.63Решение задач фильтрации на гибридных суперкомпьютерахД.Н. Морозов, А.А. ЛюпаМосковский физико-технический институт (государственный университет)Быстрый рост производительности вычислительной техники открывает большиевозможности для математического моделирования, в том числе и для моделированияпроцессов добычи углеводородного сырья. При этом появляется возможность спомощью большого числа расчётных узлов (порядка 10 9 ) описать протяжённые геологическиепласты, обладающие сложной геометрией, что характерно для реальныхместорождений. Однако на пути реализации этих возможностей приходится сталкиватьсяс серьёзными проблемами, характерными для вычислительных систем сверхвысокойпроизводительности. Эти проблемы вызваны использованием многоядерныхпроцессоров, архитектура которых становится доминирующей для таких систем. Поэтомуна первый план выходит задача создания эффективных алгоритмов и математическогообеспечения для многоядерных (в том числе гибридных) систем.В докладе рассматривается подход к моделированию процессов нефтефильтрациис использованием явных разностных схем, обладающих простой структурой. Поаналогии с кинетически-согласованными разностными схемами и квазигидродинамическойсистемой [3] классическая модель фильтрации сжимаемой жидкости в пористыхсредах модифицируется с учётом минимальных размеров, осреднённых попространству. Преобразование уравнения неразрывности от параболического типа кгиперболическому позволяет повысить порог устойчивости [4], [5].В докладе представлен комплекс, включающий в себя программы для моделированияразличных видов фильтрации: от классического IMPES-метода для расчётафильтрации несжимаемых жидкостей до описанного выше метода фильтрации слабосжимаемыхжидкостей. Данным комплексом поддерживаются модели двухфазнойи трехфазной фильтрации в двумерной и трехмерной постановках для различныхвидов задач. Все вычисления проводятся с двойной точностью. Каждая из задач/программвыполняется на четырёх видах систем: локальный CPU, локальный


Распределенные параллельные вычисления в идентификации моделей экономики 19GPU, кластер на основе MPI, гибридный кластер (с применением совместного использованиябиблиотек CUDA и MPI).Основные расчёты производились на гибридных кластерах «МВС-Экспресс» и«К-100» в Институте прикладной математики имени М.В. Келдыша (ИПМ РАН).Литература1. Morozov D.N., Chetverushkin B.N., Churbanova N.G., Trapeznikova M.A. An ExplicitAlgorithm for Porous Media Flow Simulation using GPUs // Proceedings of the SecondInternational Conference on Parallel, Distributed, Grid and Cloud Computing forEngineering 2011, Civil-Comp Press, Stirlingshire, Scotland.2. Морозов Д.Н., Трапезникова М.А., Четверушкин Б.Н., Чурбанова Н.Г Использованиеявных схем для моделирования процесса двухфазной фильтрации // Математическоемоделирование. — 2011.3. Chetverushkin B.N. Kinetic-schemes and quasi-gasadynamic system of equation //CIMNE, Barselona. — 2008. — P. 298.4. Chetverushkin B.N.,. Churbanova N.G,. Morozov D.N, Trapeznikova M.A. KineticApproach to Simulation of Multiphase porous Media Flows. In: CD-Rom Proc. ofECCOMAS CFD 2010 Conference, ed. by J.C.F. Pereira et al., Instituto SuperiorTecnico — IDMEC, Lisbon, Portugal, N01069.— 2010.5. Четверушкин Б.Н., Морозов Д.Н., Трапезникова М.А., Чурбанова Н.Г., ШильниковЕ.В. Об одной схеме для решения задач фильтрации // Математическоемоделирование. — 2010. — Т. 22, № 4. — C. 99–109.УДК 519.86Распределенные параллельные вычисления в идентификациимоделей экономикиН.Н. Оленев, В.В. ДикусарВычислительный центр им. А.А. Дородницына РАНЗдесь поставлена задача идентификации многосекторной динамической моделиэкономики, представлены результаты численных экспериментов.Примером задач оптимального управления, численное решение которых требуетпараллельных вычислений, является задача идентификации внешних параметровдинамической модели экономики [1]. Внешние параметры модели, включающие постоянныевеличины и начальные данные переменных, можно разбить на три большиегруппы. Значения параметров первой группы определяют напрямую их данныхстатистики. Значения параметров второй группы оценивают косвенно, верифицируямодель по временным рядам исторической статистики. Параметры третьей группынаходят с помощью эвристических процедур, связывающих параметры модели нахарактерных частных режимах. Например, в [2] связь параметров третьей группыс параметрами первой и второй групп получена из условий стационарности на началорасчета. Верификация представляет собой сравнение близости статистическихвременных рядов макропоказателей экономики с их значениями, рассчитанными помодели. Это сравнение сводится к задаче оптимизации, в которой ищется экстремумсвертки критериев близости расчета и статистики для макропоказателей экономики.При большом числе неизвестных параметров такая задача оптимизации чрезвычайнотрудоемка, ее решение требует применения параллельных методов глобальнойоптимизации и распределенных вычислительных технологий.


20 Н.А. Казеев, И.В. МорозовРабота выполнена при поддержке РФФИ (проекты №№ 11-07-00201-а, 11-07-97017-р_поволжье_а), ПФИ Президиума РАН № 14 , ПФИ ОМН РАН № 3.Литература1. Дикусар В.В., Оленев Н.Н., Моллаверди Н. Распределенные вычисления в идентификациимногопараметрической динамической модели региональной экономики// VI Всерос. научн. конф. «Математическое моделирование развивающейсяэкономики, экологии и биотехнологи», ЭКОМОД-2011, посв. памяти академикаРАН Александра Александровича Петрова. г. Киров: cб. трудов. — Киров: ВятГУ,2011.2. Гергель В.П., Горбачев В.А., Оленев Н.Н., Рябов В.В., Сидоров С.В. Параллельныеметоды глобальной оптимизации в идентификации динамической балансовойнормативной модели региональной экономики // Вестник ЮУрГУ, 2011.№ 25(242). — С. 4–15. (Сер. «Матем. моделирование и программирование», вып. 9.)УДК 004.9Решение уравнений движения с переменным шагомпо времени в методе молекулярной динамики с волновымипакетамиН.А. Казеев, И.В. МорозовМосковский физико-технический институт (государственный университет),Объединённый институт высоких температур РАНМетод молекулярной динамики (МД) широко используется в самых различныхобластях вычислительных наук: квантовой химии, вычислительной биологии, наукахо материалах и физике плазмы. Одной из определяющих составляющих МД–моделиявляется выбор потенциала взаимодействия. Их принято разделять на два класса:короткодействующие, где можно пренебречь взаимодействием, начиная с определённогорасстояния между частицами, и дальнодействующие, где это невозможно. Применениедальнодействующих потенциалов, более сложных с вычислительной точкизрения, необходимо, например, при моделировании неидеальной плазмы с кулоновскимхарактером взаимодействия электронов и ионов [1]. Другой трудностью в примененииметодов молекулярной динамики к такой системе является квантовый характервзаимодействия электронов с ионами на коротких расстояниях. Для решенияэтой проблемы существует ряд подходов, один из которых основан на представленииэлектронов в виде гауссовских волновых пакетов. Этот метод получил названиемолекулярной динамики с волновыми пакетами (МДВП) [2]. Он позволяет учестьэффекты вырождения электронного газа и более точно моделировать столкновениячастиц на близких расстояниях, при этом оставаясь вычислительно более простым,нежели метод функционала плотности. Тем не менее для этого метода характернасложная поверхность потенциальной энергии и резкие колебания производных динамическихпеременных по времени. Это заставляет выбирать достаточно малый шагпо времени, что сильно увеличивает время расчёта. Таким образом, динамическийвыбор шага для этого метода является особенно актуальным.За основу разрабатываемого метода взята работа [3], в которой описана следующаяметодика: если после очередной итерации полная энергия системы измениласьбольше, чем на ε h , то итерация отменяется, а шаг по времени уменьшается на β = 0.5,


Решение уравнений движения с переменным шагом по времени в методе молекулярной динамикис волновыми пакетами 21в противном случае он увеличивается на α = 1.1. Мы усовершенствовали этот метод,введя два дополнительных параметра ε m и ε. Если изменение энергии dE < ε m ,тогда dt увеличивается, если ε m < dE < ε, то dt не меняется, если ε < dE < ε h , тоdt уменьшается, но итерация не пересчитывается. Это позволяет избежать большогоколичества повторных расчётов силы и, в случае прихода системы в равновесноесостояние, прийти к оптимальному постоянному шагу.Описанный алгоритм был применён для расчёта ионизации атома водорода методомМДВП. На рис. 1 изображена зависимость полной энергии системы (леваяось) и шага интегрирования (правая ось) от времени. На начальном этапе траекториишаг автоматически устанавливается на существенно меньшую величину, чем наконечном. При этом в начале симуляции, где неравновесность процесса была проявленанаиболее сильно, динамический шаг достигал 10 −7 . Динамика с постояннымшагом при том же суммарном времени расчёта (одинаковом полном числе шагов)дает очень большой и физически неверный скачок энергии.В сравнении с методом [3], при одинаковом уровне дрейфа полной энергии разработанныйалгоритм требует меньше шагов (при правильно подобранных параметрах)— 3440 против 8761. Аналогичный расчёт с постоянным шагом потребовал бы 7.3·10 5шагов.Рис. 1. Дрейф полной энергия от времени для МДВП расчёта ионизации атомаводорода. ε h = 10 −4 , ε = 4 · 10 −5 , ε m = 10 −5 , α vts = 1.05, β vts = 0.6Рис. 2. Распределение шагов по времени. Распределения вероятности были нормализованытак, чтобы площадь под ними была 1В целом разработанный алгоритм показал достаточно высокую эффективностьи может быть рекомендован к применению для широкого класса задач молекулярнойдинамики. Недостатком схемы является достаточно большое число параметров,


22 С.Г. Семёнов, И.В. Морозовзаметно влияющих на производительность. Механизм оптимального выбора этих параметровявляется предметом дальнейшей работы.Литература1. Морозов И.В., Норман Г.Э. Столкновения и плазменные волны в неидеальнойплазме // ЖЭТФ. — 2005. — Т. 127. — № 2. — С. 12—430.2. Morozov I.V., Valuev I.A. Localization constraints in Gaussian wave packet moleculardynamics of nonideal plasmas // J. Phys. A. — 2009. — V. 42. — P. 214044.3. Stuart S.J., Hicks J.M., Mury M.T. An Iterative Variable–Timestep Algorithm forMolecular Dynamics Simulations // Molecular Simulation. — 2003. — V. 29, Issue 3.УДК 004.421.2Эффективная реализация комплексной функции ошибокдля метода молекулярной динамики с волновыми пакетамиС.Г. Семёнов 1 , И.В. Морозов 21 Московский физико-технический институт (государственный университет)2 Объединенный институт высоких температур РАНМетод молекулярной динамики с волновыми пакетами (МДВП) является расширениемметода классической молекулярной динамики (МД) с целью более точногоучета квантово-механических эффектов взаимодействия электронов и ионов [1]. Онприменяется для моделирования неидеальной электрон-ионной плазмы, образующейсяпри электровзрыве проводников, в прикатодной области высоковольтных разрядов,в твердых телах под действием мощных пучков частиц и лазерных импульсов.Метод МДВП является вычислительно более сложным по сравнению с классическойМД. В частности, он включает в себя алгоритм вычисления элементов матрицы Кулоновскоговзаимодействия вида⎧ ⎫ν klmn = ⟨φ k φ l | ˆV e 2 ⎨|φ m φ n ⟩ = I 0km I 0ln|d km − d ln | erf |d km − d ln |⎬√︁⎩a −1ln+ ⎭ ,a−1 kmгде I, d и a — комплексные параметры волновых пакетов, а k, l, m, n — индексы, изменяющиесяв диапазоне от 1 до N, где N — полное число пакетов в системе. Сприменением профайлера было показано, что именно вычисление функции ошибоккомплексного аргумента erf в выражении для v klmn требует наибольших затрат процессорноговремени. Таким образом, ее оптимизация может значительно улучшитьбыстродействие программы в целом.В то время как функция ошибок действительного аргумента предоставляетсябольшинством стандартных библиотек языка Си, реализация функции ошибок комплексногоаргумента является редкостью. В качестве базового был рассмотрен алгоритмс открытым кодом [2], [3]. Но данный алгоритм не является оптимальным,поэтому была проведена работа по повышению его быстродействия для специфическогомножества аргументов erf, возникающих в методе МДВП, с учетом требуемойточности. В частности, были предприняты следующие шаги: выделена область аргументов,где erf(z) полагалась равной 1 с заданной точностью , подобрано оптимальноечисло членов степенного ряда и бесконечной цепной дроби в зависимости от ε, в областинаиболее вероятных значений z использована двухмерная интерполяционнаятаблица.


Моделирование ионизованных наноразмерных кластеров на графических ускорителях 23Для тестов мы использовали систему из 32 волновых пакетов с типичными условиямидля неидеальной плазмы с параметром неидеальности Г = 2.7 и параметромвырождения Θ = 0.42. Тесты проводились на процессоре Intel Core 2 Duo E8500(3.16GHz) CPU, компилятор — Microsoft Visual Studio 2005. Результаты тестированияпоказаны на (рис. 1). Как видно из рисунка, в результате оптимизации был полученприрост производительности в 3.5–4.5 раза для указанных условий тестирования.Рис. 1. Ускорение вычислений, зависящее от желаемой точности: (a) только функцияerf, (б) МКВПА модель с 32 волновыми пакетамиЛитература1. Morozov I.V., Valuev I.A. Localization constraints in Gaussian wave packet moleculardynamics of nonideal plasmas // J. Phys. A. — 2009. — V. 42. P. 214044.2. Abramowitz M., Stegun I., Handbook of Mathematical Functions with Formulas,Graphs and Mathematical Tables. — New York: Dover Publications, — 19723. Smith J. C++ code for the complex error function:https://mailman.cae.wisc.edu/pipermail/octave-sources/1999-October/000131.htmУДК 519.684.6Моделирование ионизованных наноразмерных кластеровна графических ускорителяхР.Г. БыстрыйМосковский физико-технический институт (государственный университет)Объединенный институт высоких температур РАНДля теоретического исследования неидеальной плазмы широко применяется методмолекулярной динамики (МД). Он позволяет на уровне движения электронов иионов исследовать элементарные процессы в плазме, такие как плазменные волны,электрон ионная релаксация, взаимодействие излучения с плазмой и др. В отличиеот метода Монте Карло, МД может применяться для описания неравновесныхсистем. В частности, он успешно применяется для описания неидеальной плазмы,образующейся при ионизации металлических нанокластеров короткими лазернымиимпульсами.В данной работе излагаются подходы к МД-моделированию кластеров, ионизированныхкороткими лазерными импульсами. Число атомов в рассматриваемом типе


24 Р.Г. Быстрыйкластеров составляло не более 1 млн, что позволяет напрямую моделировать динамикуэлектронов и ионов, учитывая взаимодействия отдельных частиц друг с другом,без применения приближения сплошной среды. Потенциал взаимодействия частиц втаких системах является дальнодействующим, поэтому для расчета сил, действующихна частицы, неприменим метод списка ближайших соседей, используемый традиционнодля короткодействующих потенциалов. Это делает задачу вычислительнотяжелой даже для сравнительно небольшого числа частиц в системе. Кроме того,необходимость знать координаты всех частиц системы для вычисления силы, действующейна одну частицу, делает неэффективным стандартный метод распараллеливанияМД-программ (декомпозиция по пространству), применяемый на системахс распределенной памятью. В этом случае GPU (Graphics Processing Unit) с общейпамятью для всех потоков может быть существенно более эффективным.В настоящей работе на примере задачи исследования динамики электронов впространственно ограниченной неидеальной плазме, образованной после ионизациитвердотельного нанометрового кластера коротким лазерным импульсом, исследованаэффективность ускорения МД-расчетов с помощью GPU. Были рассмотрены системыс числом частиц в диапазоне N = 50 − 2 · 10 5 . При этом рассматривались различныеспособы декомпозиции частиц между вычислительными нитями (thread): однанить вычисляет силу, действующую на одну частицу, или несколько нитей вычисляютсилу на 1 частицу. Проведено сравнение этих способов. Максимальное ускорение,полученное на GPU Nvi-dia Tesla 2050M по сравнению с одним ядром CPU Intel XeonE5520, составило 100 раз для системы, содержащей 20–200тыс. частиц.Увеличение количества нитей, которые вычисляют силу, действующую на однучастицу, позволило значительно (до 4 раз по сравнению с неоптимизированной версией)ускорить работу программы на кластерах с сравнительно небольшим числомчастиц.Литература1. Морозов И.В., Норман Г.Э. Столкновения и плазменные волны в неидеальнойплазме // ЖЭТФ. — 2005. — Т. 127, №2. — С. 412–430.2. Raitza T., Reinholz H., Repke G., Morozov I., Suraud E. Laser excited expandingsmall clusters: Single time distribution functions // Contributions to Plasma Physics.— 2009. — V. 49. — P. 496–506.3. Plimpton S.J. Fast Parallel Algorithms for Short-Range Molecular Dynamics //Journal of Computational Physics. — 1995. — V. 117. — P. 1.4. Stone J.E., Hardy D.J., Ufimtsev I.S., Schulten K. GPU-accelerated molecularmodeling coming of age // J. Mol. Graph. Model. — 2010. — V. 29. — P. 116.5. Anderson J.A., Lorenz C.D., Travesset A. General purpose molecular dynamicssimula-tions fully implemented on graphics processing units // Journal of ComputationalPhysics. — 2008. — V. 227. — P. 5342.6. Belkacem M., Megi F., Reinhard P.-G., Suraud E., Zwicknagel G. Coulomb explosionof simple metal clusters in intense laser fields // Phys. Rev. A. — 2006. — 73. —P. 051201R.7. Morozov I.V., Kazennov A.M., Bystryi R.G., Norman G.E., Pisarev V.V., StegailovV.V. Molecular dynamics simulations of the relaxation processes in the condensedmatter on GPUs // Computer Physics Communications. — 2011. — V. 182. — P. 1974–1978.


Разработка генератора гексаэдральных сеток для моделирования задач акустического каротажа вскважине, окруженной анизотропной средой 25Секция вычислительной математикиУДК 519.688Разработка генератора гексаэдральных сеток длямоделирования задач акустического каротажа в скважине,окруженной анизотропной средойА.Д. Подложнюк 1,2 , Г.Е. Пекарь 21 Московский физико-технический институт (государственный университет)2 Московский научно-исследовательский центр «Шлюмберже»Акустический каротаж — это определение структуры и механических свойствпород в околоскважинной зоне посредством измерения и изучения волнового поля,создаваемого источником акустических волн, расположенным в скважине. Численноемоделирование является, по-видимому, единственным возможным способом изученияособенностей процессов распространения акустических волновых полей дляреалистичных неоднородных трехмерных сред с анизотропией и поглощением.Для численного решения системы уравнений упругости, которые описывают распространениеакустических волн, используется метод спектральных элементов с явнойразностной схемой интегрирования по времени. Расчетную область удобно представлятьследующим образом. Внутри находится один цилиндр (скважина), его окружаеткольцевой цилиндр, потом еще один и так далее. На скорость и точность работыметода спектральных элементов существенно влияет используемая расчетная сетка.В настоящий момент не существует общего решения проблемы построения оптимальныхгексаэдральных сеток в 3D. Общее решение существует лишь для треугольныхсеток в 2D (сетка Делоне). Но использование гексаэдральных сеток предпочтительнее,так как требует меньше памяти в ЭВМ.Одним из методов (T-Hex) построения гексаэдральных сеток является построениететраэдральной сетки и последующее разбиение каждого тетраэдра на 4 гексаэдра(рис. 1). Существуют также различные программные пакеты для построения сетокв 2D и 3D. Большинство из них являются платными (CUBIT и Hexotic).В данной работе рассматривается проблема построения гексаэдральных сеток вгеометриях цилиндрического типа, с дроблением элементов как в плоскости XY , таки по оси Z. Сетка строится следующим образом. Сначала строится четырехугольнаясетка на плоскости (во внутреннем круге и окружающих ее кольцах). Причемцентры областей могут быть двинуты. В каждой области сетка строится со своимшагом. При построении 2D-сетки используется схема STransition (рис. 2) для дробленияэлементов и сшивки сеток на границе областей ввиду того, что шаги сеток всоседних областях могут сильно различаться, а строить сетку с шагом, равным минимальному,— не экономично. А затем — уже вся 3D–сетка. Данный метод построениясеток реализован в среде C++ в виде отдельного приложения. На вход подается числоцилиндров, их радиусы и шаги сетки. Программа протестирована на различныхслучаях. Варьировались все входные данные. В качестве примера рассматриваетсяследующая модель (рис. 3): заполненная флюидом скважина с трубой. Параметрыгеометрии следующие:


26 А.Д. Подложнюк, Г.Е. ПекарьR 1 = 0, 03429m, h 1 = 0.15m;R 2 = 0.060325m, h 2 = 0.15m;R 3 = 0.0762m, h 3 = 0.15m;R 4 = 3m, h 4 = 0.1m.Сетка на данной геометрии была создана различными генераторами. На (рис. 3)представлен образец сетки в разрезе в плоскости XZ, созданный разработаннымгенератором. В отличие от коммерческих генераторов на данной сетке (рис. 3) наблюдаетсяменьшее количество элементов и одновременно их лучшее качество потаким параметрам, как минимальный угол и максимальное отношение длин реберэлемента, что позволило ускорить время расчета и увеличить число Куранта в 7 разпо сравнению с сеткой, созданной пакетом Hexotic.Рис. 1. Метод T-HexРис. 2. STransition


Численное построение квадратурной формулы для полусферы методом продолжения по параметру27Рис. 3. Образец сеткиЛитература1. Байков Ю.А., Кузнецов В.М. Физика конденсированного состояния. — М.: Бином.Лаборатория знаний, 2011.2. Кузнецов В.М., Хромов В.И. Фрактальная модификация континуального приближения// ПЖТФ. — 2010. – Т. 36, вып. 11. — С. 98–103.3. Bowman Flexible (Supplementary Material) // J. Chem. Phys. — 2011. — V. 134. —P. 094509.УДК 519.644.7Численное построение квадратурной формулы дляполусферы методом продолжения по параметруИ.В. Цыбулин, Ю.И. СкалькоМосковский физико-технический институт (государственный университет)В данной работе предлагается численный метод нахождения узлов и весов квадратурнойформулы, которая является точной для интегралов видаzP n (x, y, z)dS, (1)x 2 +y 2 +z 2 =1z0где P n (x, y, z) — многочлен полной степени не выше n. Интегралы такого типа возникаютпри дискретизации кинетических уравнений методом сферических гармоник.Узлы квадратуры ищутся в виде прямого произведения равномерной сетки поазимутальному углу φ и некоторой сетки по полярному углу θ. При этом задачасводится к поиску квадратурной формулы по переменной θ, точной для интеграловвида∫︁π/2Q(sin θ, cos θ) cos θ sin θdθ. (2)0Область интегрирования, а также вес w = cos θ sin θ инвариантны относительно заменыcos θ ↔ sin θ, что позволяет проверять точность квадратурной формулы толькодля симметричных многочленов Q(r, z) = Q(z, r) [1]. Можно показать, что многочленыобразуют базис в пространстве симметричных многочленов Q(r, z) на окружностиz = cos θ, r = sin θ.


28 И.В. Цыбулин, Ю.И. СкалькоДля нахождения узлов θ i и весов w i квадратурной формулы порядка n можнозаписать систему нелинейных уравнений G n (θ, w) = 0, которая состоит из n + 1условия точности интегрирования S k (r, z) и дополнительно ⌊ n ⌋ условий симметрии2узлов θ i + θ n−i = π.2Построим параметрическую систему F(θ, w, λ) = 0, решение которой при λ = 0совпадает с решением G n (θ, w) = 0, а при λ = 1 — с решением G n+1 (θ, w) = 0. Дляэтого решение системы G n (θ, w) = 0 нужно дополнить фиктивным узлом с нулевымвесом. Тогда используя метод продолжения по параметру [2], можно сформулироватьзадачу Коши для функций (θ(λ)w(λ)):{︃d(θ,w)dλ= −(θ, w)| λ=0 = (θ * , w * )(︁ )︁ −1 ∂∂Gn+1 (θ,w) Gn+1 (θ * , w * ).∂∂(θ,w)Здесь (θ * , w * ) — решение системы G n (θ, w) = 0 с фиктивным узлом.Решение в точке λ = 1 и будет решением системы G n+1 (θ, w) = 0, то есть узламии весами квадратурной формулы следующего порядка точности. Для ускорения расчетаиспользуется следующий подход: после каждого шага интегрирования системыОДУ ((3)) производится корректировка траектории методом Ньютона при фиксированномλ. В зависимости от скорости сходимости метода Ньютона принимаетсярешение о увеличении или уменьшении шага интегрирования.Полученным методом построены квадратурные формулы для интегралов вида(1), точные для многочленов вплоть до 22-й степени.(3)Рис. 1. Узлы квадратурной формулы 22-го порядка для полусферыЛитература1. Соболев С.Л. О формулах механических кубатур на поверхности сферы // Сиб.матем. журнал. — 1962. — Т. 3, № 5. — С. 769–796.2. Федоренко Р.П. Введение в вычислительную физику. — М.: Изд-во Моск. физ.-тех. ин-та, 1994. — 528 с.


Исследование микромеханических свойств вирусных капсид методами молекулярной динамики награфических процессорах 29УДК 577.322.72Исследование микромеханических свойств вирусных капсидметодами молекулярной динамики на графическихпроцессорахО.Г. Кононова, А.А. ЖмуровМосковский физико-технический институт (государственный университет)University of Massachusetts LowellБольшие супрамолекулярные белковые комплексы играют фундаментальнуюроль в биологии. Одним из интересных представителей этих систем являются вирусы— микроскопические частицы, способные воспроизводиться внутри клетки живогоорганизма. Большинство известных вирусов имеют сферическую белковую оболочку(капсида), которая состоит из капсомеров. Механические свойства вирусных капсид,а также их переходы между стабильными и нестабильными состояниями определяютжизненный цикл многих вирусов. Понимание микроскопических свойств этихсистем и умение ими управлять представляет большой интерес для исследователейв области биофизики [1], [2].В настоящее время моделирование биомолекулярных процессов методами молекулярнойдинамики (МД) становится незаменимым для теоретического исследованиябиологических систем. Они позволяют получать численные характеристики биомолекул,объясняющие результаты экспериментов или дополняющие их [3], [4]. Болеетого, широкое распространение получили графические процессоры (ГП), которыедают возможность проводить моделирование биомолекулярных процессов и воспроизводитьэксперименты in silico почти на биологической временной шкале (порядкамиллисекунды) [5].В данной работе исследуются механические и физико-химические свойства капсидна примере вируса крапчатости фасоли (Cowpea Chlorotic Mottle Virus — CCMV).Используя метод нормальных мод [6], были изучены свойства капсиды и ее капсомеровв равновесии. Для исследования неравновесных свойств было проведено численноемоделирование силовой индентации и температурной денатурации капсиды методамиМД на ГП. Полученные траектории были изучены с помощью метода главныхкомпонент [7], что позволило установить основные механизмы движения, лежащиев основе деформации капсиды. Кроме того, механическая индентация капсиды выявиладва режима поведения оболочки: упругий эластичный и неэластичный — этохорошо согласуется с результатами, полученными in vitro. При температурной денатурациикапсида значительно уменьшается в объеме, что позволяет предположитьналичие нового стабильного состояния для капсид. Проведенные исследования даютхорошую основу для расчета численных параметров, описывающих упругие (модульЮнга, коэффициент жесткости) и физико-химические (энтальпия, свободная энергия)свойства системы, а также для создания механической и термодинамическоймоделей, характеризующих поведение многих вирусных капсид и других белковыхоболочек.


30 М.Н. ПетровРис. 1. Слева: Кривая зависимости силы механического сопротивления капсиды отсмещения кантилевра (черный цвет — результат МД моделирование, красный —экспериментальный результат) демонстрирует упругий режим (начальная линейнаязависимость), который затем сменяется разрывом белковой оболочки капсиды,что соответствует резкому падению силы. Справа: Нагревание капсиды (300–700 К)сопровождается заметным уменьшением объема, а затем распаданием на составляющиекапсидные белкиЛитература1. Garret R.H., Grisham C.M. Biochemistry. — Belmont: Thomson Brooks/Cole, 2007.2. Roos W.H., Ivanovska I.L., Evilevitch A., Wuite G.J.L. Viral capsids: Mechanicalcharacteristics, genome packaging and delivery mechanisms // Cell. Mol. Life. Sci. —2007. — V. 64. — P. 1484–1497.3. Zhmurov A., Rybnikov K., Kholodov Y., Barsegov V. Generation of random numberson graphics processors: Forced indentation in silico of the bacteriophage HK97 //Proteins. — 2002.V. 46. — P. 24–33.4. Arkhipov A., Freddolino P.L., Schulten K. Stability and dynamics of virus capsidsdescribed by coarse-grained modeling // Structure. — 2006. — V. 14. — P. 1767–1777.5. Zhmurov A., Dima R.I., Kholodov Y., Barsegov V. SOP-GPU: Acceleratingbiomolecular simulations in the centisecond timescale using graphics processors //Proteins. — 2010. — V. 78. — P. 2984–2999.6. Landau L.D., Lifshiz E.M. Theoretical physics. Mechanics. — Moscow: Nauka, 1965.7. Amadei A., Linssen A.B.M., Berendsen H.J.C. Essential dynamics of proteins //Proteins. — 1993. — 17. — P. 412–425.УДК 519.6Разработка программного комплекса для решения задачираспространения сейсмических волн в неоднородных средахМ.Н. ПетровМосковский физико-технический институт (государственный университет)Решение индустриальных задач поиска и разведки месторождений, связанных сраспространением сейсмических волн, являются крайне актуальными сегодня. Приэтом моделирование сейсмических волновых процессов является перспективным подходомдля понимания механизмов эволюции волнового поля, вызванных прохождениемчерез неоднородную среду. Моделирование — эффективный инструмент дляразработки и усовершенствования методов поиска и разведки месторождений. Дляприменения методов численного моделирования при решении таких задач необходимыпрограммные комлексы, реализующие современные вычислительные методы и


Моделирование распространения электрических импульсов в сердечной ткани проекционнымметодом 31использующие параллельные алгоритмы для эффективного счета, а также включающиесредства анализа результатов расчета и их наглядной визуализации.В докладе описано исследование и процесс отбора численных методов для реализациив программном комплексе. В качестве результата продемонстрированы возможностирасчетного кода на примере тестового расчета эволюции волнового поляв модельной задаче простой геометрии. Рассчитано поле скоростей смещения средыпри прохождении сейсмических волн. Результаты расчета показали способностьреализованной модели учитывать сложные волновые процессы и их суперпозиции,которые плохо поддаются изучению аналитическими и экспериментальными методами:распространение волн через неоднородную среду, сложные многократные отражения,преломления, возникновение сдвиговых волн из волн сжатия и наоборот (припрохождении через границу раздела), а также явлений дифракции и интерференции.В настоящий момент автором проводится работа по переносу текущих возможностейкомплекса на 3D-платформу с параллельной архитектурой с целью расширениявозможностей модели и повышения скорости счета.Работа выполняется при поддержке Министерства образования и науки РФ врамках ГК № 14.740.11.0588 и ГК № 02.740.11.0664.Рис. 1. Столкновение с объектом. Показаны вертикальная (слева) и горизонтальная(справа) компоненты скорости смещения t = 35 мс после «включения» источникаУДК 519.63Моделирование распространения электрических импульсов всердечной ткани проекционным методомД.В. ЕгоровМосковский физико-технический институт (государственный университет)Болезни сердечнососудистой системы являются ведущей причиной смертности вРоссии, Европе, США и всём развитом мире. Каждое сокращение сердца запускаетсяэлектрическим импульсом, генерирующимся в синусовом узле и распространяющимсяв виде незатухающей волны деполяризации клеток сердца. Эта волна синхронизируетмеханическое сокращение камер сердца. Именно нарушения возникновенияили распространения волны деполяризации миокарда является наиболее частойнепосредственной причиной смерти. В работе исследован механизм стимуляции сердца,создана программная реализация модели в двумерном случае, проведены новыерасчеты для различных анизотропных соотношений тензора проводимости. Чтобыизучить механизм стимуляции сердца, в этой работе взята комбинация пространственнойбидоменной модели [1] и модели возбуждения Алиева—Панфилова [2], про-


32 Д.В. Егоровведено численное моделирование проекционным методом. Такая модель численнореализована впервые. Также построены решения для сценариев, решение которыхбыло получено ранее другими методами.Бидоменная модель получила в последнее время широкое распространение в качествеосновного подхода при теоретическом и численном исследовании макроскопическихэлектрических явлений в сердечной ткани. Эта модель основана на представлениисердечной мышцы в виде двух взаимопроникающих пространств — внутриклеточногои внеклеточного, каждое из которых имеет различные коэффициентыпроводимости вдоль и поперек направления волокон. Состояние системы описываетсявнутриклеточным φ i и внеклеточным φ e потенциалами. Искомой переменнойявляется трансмембранный потенциал, определенный как разность φ m = φ i − φ e .Модель Алиева–Панфилова была предложена для упрощения описания волн возбужденияв сердечной мышце. С математической точки зрения — это нелинейнаясистема обыкновенных дифференциальных уравнений первой степени с коэффициентами,зависящими от значения трансмембранного потенциала.Используемый численный метод принадлежит семейству проекционных алгоритмов.Численное решение ищется в классе кусочно-полиномиальных функций. В стационарномслучае метод сводится к решению жесткой системы линейных алгебраическихуравнений, в нестационарном — к решению жесткой нелинейной системы дифференциальныхалгебраических уравнений с сингулярной весовой матрицей. Решение,полученное проекционным методом, дает хорошее согласование с точным решениемв стационарном случае. При численном моделировании наблюдаются явлениягиперполяризации и деполяризации, а также распространение потенциала действиярис. 1.С развитием вычислительной техники появились трехмерные бидоменные модели,позволяющие рассматривать процессы, скрытые в толще ткани и пока не доступныеисследованию экспериментальными методами. Обе примененные в работемодели были созданы для того, чтобы эффективно описывать электрофизиологическиепроцессы на сложных трехмерных структурах. Целью следующих исследованийявляется моделирование механизма стимуляции на реальной геометрии сердца.Рис. 1. Вид потенциала действия


Применение разрывного метода Галеркина к задаче линейной акустики 33Литература1. Henriquez C.S., Tranquillo J.V. Modeling the Impact of Cardiac Tissue Structure onCurrent Flow and Wavefront Propagation // Quantitative Cardiac Electrophysiology/ Ed. Candido Cabo and David Rosenbaum. Marchel Dekker Inc. — 2002.2. Aliev R.R., Panfilov A.V. Asimple model of cardiac excitation // Chaos,Solitons&Fractals 7. — 1996. — N 3. — P. 293–301.УДК 519.663.6+534-16Применение разрывного метода Галеркина к задаче линейнойакустикиА.В. Шевченко, Ю.И. СкалькоМосковский физико-технический институт (государственный университет)При решении современных задач механики геологических сред приходится иметьдело с все более усложняющимися механико-математическими моделями. Как правило,это многомерные уравнения в частных производных с многочисленными контактнымиграницами и разрывами в искомых решениях. Численное решение данныхзадач требует построения методов, которые могли бы учесть специфику задачи идавали бы адекватные результаты.В работе построен один из вариантов разрывного метода Галеркина, которыйявляется мировым лидером по расчетам задач с разрывными решениями. Данныйметод сочетает в себе положительные стороны методов конечных объемов и проекционныхалгоритмов. Проведено теоретическое исследование алгоритма, полученычисленные результаты, проведено сравнение с экспериментальными данными.Исходная модель среды — линейные уравнения Ламе [1]:(λ + μ)grad div u + μ△u + ρF = ρa,которые дополняются подходящими граничными условиями, заданными параметрамисреды, а также условиями на границах разрыва параметров среды.Последние являются важной частью постановки задачи и часто значительно влияютна характер численного решения. Особенностью рассматриваемого метода являетсяпрозрачный учет данных условий.В рассматриваемой области строится треугольная сетка, численное решениеищется в виде кусочно-полиномиальной функции, допускающей разрывы на границахтреугольников. Условия на численное решение получаются из интегральныхследствий для уравнения в соответствии с методами конечных объемов [2]. Пространственнаядискретизация сводит исходную задачу к разреженной системе ОДУбольшой размерности, которая решается методом Рунге–Кутты.Метод допускает эффективный параллелизм и реализован на гибридной архитектуре.Основная часть вычислений — решение системы ОДУ — производится награфических ускорителях.Литература1. Седов Л.И. Механика сплошной среды. Т. 1. — М.: Наука, 1970. 492 с.2. Kaser M., Dumbser M. An Arbitrary High Order Discontinuous Galerkin Methodfor Elastic Waves on Unstructed Meshes I: The Two-Dimensional Isotropic Case //Geophysics J. Int., 2000.


34 М.С. ИшмановУДК 519.6Об одной постановке задачи составления расписаниядвижения общественного транспортаМ.С. ИшмановМосковский физико-технический институт (государственный университет)Пусть имеется некоторый город с некоторым фиксированным графом дорог длядвижения общественного транспорта (скажем, автобусов): вершины этого графа —остановки автобусов, а ребра — дороги, соединяющие соответствующие остановки.Предполагая, что время, затрачиваемое на преодоление расстояния между двумяостановками, фиксировано и зависит только от расстояния между ними, введем весаребер графа, численно равные времени передвижения по ребру. Дополнительно награфе заданы маршруты автобусов и количество автобусов на каждом маршруте.Поток людей, входящих на i-ю остановку, описывается как пуассоновский процессс фиксированной интенсивностью λ i . Конечную остановку каждый пассажир выбираетиз списка остановок, до которых можно добраться без пересадок с начальнойостановки (если некоторой части пассажиров требуется остановка, до которой нельзядобраться без пересадки, то в рамках данной модели эти пассажиры едут до остановкипересадки и далее рассматриваются как новые пассажиры, едущие от остановкипересадки до нужной им остановки).Для достижения «оптимального движения» автобусов можно варьировать числомавтобусов на каждом маршруте. Предполагая, что обшее число автобусов фиксировано,необходимо перераспределить автобусы по маршрутам так, чтобы время,потраченное пассажирами на ожидание и поездку в автобусе, было минимальным.Оценим время ожидания автобуса: пусть некоторый пассажир пришел в некоторыймомент времени на остановку A и собирается доехать до остановки B. Предположим,что между этими остановками ходит m различных маршрутов автобусов ина i-м маршруте курсируют k i автобусов, длина i-го маршрута (сумма весов ребер,по которым проходит i-й маршрут) — l i . Тогда, время между соседними автобусамина i-м маршруте равно ν i = l ik i. Предположим, что пассажир приходит в случайныймомент времени. Время ожидания автобуса i-го маршрута x i — случайная величина,равномерно распределенная на отрезке [0, ν i ] ∀i ∈ 1, ..., m, причем x i независимы. Пассажирбудет ожидать первый пришедший автобус, следовательно, время ожидания— случайная величина, функция распределения которой определяется следующимобразом:⎧0, t < 0,⎪⎨ ∏︀F (t) = 1 − m (︁ )︁1 − tν i, t ∈ [0, ν min ],i=1 ⎪⎩1, t > ν min ,где ν min — минимальное время между соседними автобусами среди всех m маршрутов.Время передвижения между ребрами графа в рассматриваемой модели не меняетсяс течением времени, значит, временные потери пассажиров складываются извремен ожидания на остановках и зависят от частоты движения автобусов по каждомумаршруту (точнее, от ν i — времени между соседними автобусами на каждомi-м маршруте). Предположим, что число автобусов на всех маршрутах достаточновелико (k i > 10, что вполне согласуется с реальными данными), и можно считать,что ν i может изменяться непрерывно в зависимости от k i . Тогда исследуемая задачасводится к непрерывной задаче оптимизации.


Об одной постановке задачи составления расписания движения общественного транспорта 35i=1l iν iНеобходимо минимизировать времененные потери пассажиров, то есть следующийфункционал Ф = Ф(ν 1 , ν 2 , ..., ν M ), где M — общее число маршрутов в городе∑︀при условии M = N , где N — суммарное количество автобусов на всех маршрутах.Функционал Ф является выпуклым на множестве R M + , следовательно, можноиспользовать метод градиентного спуска по переменным (ν 1 , ν 2 , ..., ν M ).В рамках данной работы была написана программа, реализующая предложенныйалгоритм составления расписания движения автобусов. На входе программы задаютсяграф транспортной сети, маршруты движения автобусов, интенсивности потокаприхода пассажиров на каждую остановку и общее число автобусов на всех маршрутах,программа предлагает «оптимальное» распределение этого числа автобусов накаждый маршрут.Постановка задачи «пришла» от ЗАО НПЦ «Транспортные интеллектуальныесистемы».


36 С.П. Трофимов, М.Г. ШиробоковСекция динамики и управлениядвижением космических аппаратовУДК 519.6+531.55Метод виртуальных траекторий для проектирования сложныхмежпланетных миссийС.П. Трофимов, М.Г. ШиробоковМосковский физико-технический институт (государственный университет)Разработан метод виртуальных траекторий, который может использоваться дляпроектирования сложных межпланетных миссий. Под сложными понимаются такиемиссии, в которых траектория полета содержит несколько гравитационных маневров.Рассматривается класс задач с большой тягой и активными гравитационнымиманеврами.Общепринятый (классический) метод проектирования траекторий для прямогоперелета [1] заключается в переборе дат старта и времени полета и численном решенииполучающихся при этом задач Ламберта. Траектории же с промежуточнымигравитационными маневрами разбиваются на участки планета–планета, к которымприменяется та же самая процедура. С самого начала космической эры этот метод использовалсядля проектирования межпланетных полетов. Но он оказывается весьмаресурсозатратным для проектирования полетов с большим числом гравитационныхманевров.Суть разработанного метода состоит в построении массива виртуальных траекторий,состоящих из дуг кеплеровых эллипсов и соединяющих точки на орбитах,входящих в выбранный маршрут планет. Орбиты планет считаются некомпланарнымикеплеровыми эллипсами, элементы которых берутся на некоторую эпоху. Такимобразом, идет привязка не к реальным положениям планет в заданные моменты времени,а к геометрии их орбит.Метод виртуальных траекторий состоит из двух этапов: построение базы виртуальныхтраекторий и последующее наложение реального движения планет в интересующийнас интервал времени.Несмотря на то, что приходится просчитывать значительное число виртуальныхтраекторий, большая часть которых впоследствии будет отсеяна, вычислительныезатраты при реализации данного метода не превышают, а часто и бывают меньше всравнении с другими методами проектирования межпланетных траекторий. Причина— в отсутствии необходимости применения численных методов (все расчеты — поконечным формулам).В течение времени, пока элементы орбит можно считать постоянными, базу виртуальныхтраекторий для каждого планетного маршрута (первый этап метода) достаточнопросчитать всего один раз и затабулировать. Именно процесс построениябазы виртуальных траекторий составляет подавляющую часть вычислительных затрат.Поэтому это, пожалуй, самое главное достоинство метода, позволяющее сэкономитьвремя расчета.


Задача о влиянии изменения логарифмического декремента собственных колебаний упругихэлементов космического аппарата на поле создаваемых микроускорений его внутренней среды 37На примере модельной задачи полета к Урану применение данного метода позволилонайти траекторию, почти не требующую дополнительных затрат топлива.Литература1. Охоцимский Д.Е., Сихарулидзе Ю.Г. Основы механики космического полета. —М.: Наука. Гл. ред. физ.-мат. лит., 1990. — 448 с.УДК 531/534+629.783+523.3Задача о влиянии изменения логарифмического декрементасобственных колебаний упругих элементов космическогоаппарата на поле создаваемых микроускорений еговнутренней средыА.В. Седельников, Д.С. РатничкинИнститут энергетики и транспорта Самарского государственного аэрокосмическогоуниверситета им. С.П. КоролеваВ работах [1]–[3] рассмотрено влияние теплового удара на уровень микроускоренийво внутренней среде космической лаборатории. Тепловой удар возникает припогружении и выходе космического аппарата (КА) из тени Земли. Однако, помимомгновенных микроускорений, порожденных непосредственно тепловым ударом, существенныеизменения температуры больших упругих элементов КА приводят к изменениюпараметров демпфирования собственных колебаний этих элементов и влияютна микроускорения, создаваемые благодаря колебаниям [4].В работе рассмотрена динамика изменения передаваемых микроускорений в зависимостиот того, на освещенном или теневом участке своей траектории находитсяКА.Литература1. Седельников А.В., Казарина М.И. О влиянии температурных деформаций упругихэлементов на динамику движения космического аппарата // Известия СНЦРАН. — 2010. — Т. 12. — № 4. — С. 321–324.2. Седельников А.В., Казарина М.И. Влияние температурных деформаций упругихэлементов на динамику КА типа «НИКА-Т» // Вестник МАИ. — 2011. — Т. 18,№ 2. — С. 47–51.3. Седельников А.В., Юдинцев В.В. Оценка влияния температурных деформацийупругих элементов космической лаборатории на поле микроускорений ее внутреннейсреды // Известия СНЦ РАН. — 2011. — Т. 13, № 1(2). — С. 344–346.4. Седельников А.В. Проблема микроускорений: от осознания до фрактальной модели.Ч.1. Физическая модель квазистатической компоненты микроускорений. —М.: РАН, Избранные труды Российской школы. 2010. 107 c.УДК 531.55Двухимпульсный маневр поворота орбитыН.А. ГерасимоваМосковский физико-технический институт (государственный университет)Одной из важных и интересных задач при исследовании, выборе и анализе траекторийявляется задача маневров-переходов с орбиты на орбиту. В работе представленырезультаты сравнительного исследования одноимпульсного и двухимпульсного


38 Н.А. Герасимовакасательного переходов между компланарными конгруэнтными эллиптическими орбитами(поворот линии апсид на заданный угол). Для всех значений эксцентриситетови углов поворота линии апсид численно определена орбита перелета, которая соответствуетпереходу с минимальными затратами характеристической скорости приосуществлении двухимпульсного маневра. Такой переход был исследован Лоуденом(D.F.Lawden) [1]. Результат Лоудена — при повороте почти круговой орбиты двухимпульсныйманевр в два раза экономичнее. Цель данной работы — сравнительныйанализ маневров при повороте орбиты произвольного эксцентриситета.Рассматриваются две схемы поворота эллиптической орбиты в ее плоскости назаданный угол α вокруг притягивающего центра. Требуется сравнить затраты характеристическойскорости для этих двух схем.∆V 1 = 2V r = 2√︂ μp 0e 0 sin α 2 ,√︂ (︃√︃√︁ μ sin (︀ )︀θ∆V 2opt = 2 1 + 2e 0 cos θ 0opt + e 2 0opt − α 20 ·p 0 sin (︀ )︀θ 0opt−α2− e0 sin α 2где V r — радиальная составляющая скорости в точке пересечения орбит при одноимпульсномманевре, μ — гравитационный параметр, p 0 , e 0 — фокальный параметри эксцентриситет исходной орбиты, α —заданный угол поворота орбиты, θ 0opt — оптимальноезначение истинной аномалии при двухимпульсном маневре, полученноечисленно. Здесь первая формула выражает затраты характеристической скоростипри одноимпульсном маневре, а вторая — при двухимпульсном.Доказано, что в случае почти круговой орбиты двухимпульсный маневр в двараза экономичнее одноимпульсного, а в остальных случаях— более чем в два.− 1)︃,Рис. 1. a. Схема одноимпульсного маневра поворота с импульсом, приложенным вточке с истинной аномалией, b. Схема одноимпульсного маневра поворота с импульсом,приложенным в точке с истинной аномалией, c. Схема двухимпульсногоманевра поворота


Моделирование движения малого спутника, оснащенного оптическим датчиком ориентации 39Литература1. Гобец Ф.У., Долл Дж.Р. Обзор импульсных траекторий // Журнал американскогоинститута аэронавтики и космонавтики «Ракетная техника и космонавтика».1969, май. — Т. 7, № 5.УДК 519.876.5Моделирование движения малого спутника, оснащенногооптическим датчиком ориентацииА.А. Дегтярев 1 , В.Н. Максименков 21 Институт прикладной математики им. М.В. Келдыша РАН2 Московский физико-технический институт (государственный университет)В учебно-исследовательской Лаборатории «Управление и динамика сложныхинформационно-механических систем», созданной на базе кафедры теоретическоймеханики МФТИ, создан лабораторный стенд, предназначенный для моделированияработы звездного датчика ориентации [1], [2].В настоящей работе представлены результаты моделирования движения аппарата,оснащенного оптическим датчиком ориентации. Для моделирования наблюдаемойчасти пространства проводится интегрирование орбитального и относительного движенияспутника под действием гравитационного момента с программно-задаваемыминачальными условиями, параметрами системы и элементами орбиты. В соответствиис модельным полем зрения оптического датчика определяется «наблюдаемая»частьпространства (рис. 1).В программе, написанной в среде MatLab, реализован удобный пользовательскийинтерфейс. Начальные условия относительного движения (углы ориентации и компонентывектора абсолютной угловой скорости) могут задаваться как в инерциальной,так и в орбитальной системах координат. Это позволяет наглядно верифицироватьрезультаты численного анализа на классических аналитических результатах движенияспутника в гравитационном поле. В программном комплексе также реализованпростейший алгоритм распознавания наблюдаемых звездных конфигураций (рис. 2).Представленные результаты могут найти применение как в задаче созданияаппартно-программного комплекса моделирования работы оптических датчиков ориентации,так и в учебно-методическом процессе как средство наглядной иллюстрацииосновных принципов работы сенсоров.Работа поддержана грантом Президента Российской Федерации для государственнойподдержки молодых российских ученых — кандидатов наук (МК–2020.2010.1).


40 Д.С. Иванов, С.О. КарпенкоРис. 1. Моделирование наблюдения оптического датчикаРис. 2. Распознавание звездной конфигурацииЛитература1. Мыльников Д.А., Дегтярев А.А., Ткачев С.С. Лабораторный стенд для отработкимакета звездной камеры // 2-я Всероссийская научно-техническая конференция«Современные проблемы ориентации и навигации космических аппаратов»(тезисы докладов). — 2010. — С. 33–34.2. Дегтярев А.А., Ткачев С.С., Мыльников Д.А. Лабораторный стенд для отработкимакета звездного датчика ориентации малых спутников: препринт ИПМ им.М.В. Келдыша РАН. — М., 2010. — № 67. — 32 с.УДК 629.7.072.1Определение относительного положения и ориентацииспутников в групповом полете с использованием видеосъемкиосвещенного Солнцем космического аппаратаД.С. Иванов 1 , С.О. Карпенко 21 Институт прикладной математики им. М.В. Келдыша РАН2 Инженерно-технологический центр «СканЭкс»Для определения относительного состояния аппаратов в групповом полете всечаще используется обработка видеоизображений, получаемых при съемке одного аппаратас помощью видеокамеры, установленной на другом аппарате. Тут возможнынесколько вариантов использования такого подхода к определению относительного


Определение относительного положения и ориентации спутников в групповом полете с использованиемвидеосъемки освещенного Солнцем космического аппарата 41состояния. Один из них предусматривает установку на один из аппаратов в некоторыхточках светодиоды. Другой подход не требует установки дополнительных светящихсяточек, но использует информацию об отражающих свойствах поверхностейаппаратов. Оба подхода основаны на распознавании на снимке некоторых точек аппарата(так называемых реперных точек), положение которых известно в системе отчета,связанной с этим аппаратом. Далее вычисляется относительное положение двухаппаратов и матрица поворота системы координат, связанной с одним аппаратом,относительно системы координат, связанной с другим аппаратом. Таким образом,происходит навигация транспортных кораблей, подлетающих к МКС: для ближнегонаведения на этапе причаливания используются видеоизмерители, которые посылаютлазерные импульсы на прикреплённые к стыковочному узлу отражатели [1]. Аметод определения относительного состояния по снимкам освещенного Солнцем аппаратауспешно используется на аппаратах миссии PRISMA [2].В настоящей работе рассматривается алгоритм определения относительного состоянияспутников в групповом полете, основанный на обработке изображений. Исследуетсяточность определения в зависимости от параметров снимающей камеры,направления освещения, дальности до второго аппарата и размеров реперных точек.Исследуемый алгоритм планируется применить для определения относительногодвижения микроспутника «Чибис-М» после отделения от грузового корабля«Прогресс» с помощью обработки видеоизображения, полученного с видеокамеры,установленной на грузовом корабле [3]. В качестве реперных точек рассматриваютсянаконечники антенн, которые обладают подходящими отражающими свойствами,вызволяющими их распознать на снимке рис. 1.Работа выполнена при поддержке РФФИ (грант № 09-01-00431-a) и Президентскогогранта поддержки ведущих научных школ (№ НШ 6700.2010.1).Рис. 1. Спутник «Чибис-М» и возможные реперные точкиЛитература1. http://sci-lib.com/article32.html2. http://www.prismasatellites.se3. Иванов Д.С., Карпенко С.О., Овчинников М.Ю., Ролдугин Д.С., Ткачев. С.С.Лабораторные испытания алгоритмов управления ориентацией микроспутника«Чибис-М»: препринт / ИПМ им. М.В. Келдыша РАН. – М., 2011. – № 40. – 29 с.


42 Д.О. Нуждин, С.С. ТкачевУДК 629.7.072.1Дистанционная лабораторияД.О. Нуждин 1 , С.С. Ткачев 1,21 Московский физико-технический институт (государственный университет)2 Институт прикладной математики им. М.В. Келдыша РАНВ современном мире развитых сетевых технологий большое внимание уделяетсядистанционному обучению. Если дистанционные теоретические курсы уже приобрелидостаточно широкое распространение, то практические занятия обычно требуюточного присутствия человека. С развитием Интернета и быстрых каналов передачиаудио- и видеоинформации появляется возможность проводить и лабораторныезанятия удаленно. Это может потребоваться, например, при проведении лабораторнойработы на стенде, находящемся на недоступно большом расстоянии. Кроме того,в случае необходимости испытания разработанных алгоритмов не обязательно находитьсянепосредственно в месте расположения стенда. Рассматриваемая системадистанционного управления позволяет отрабатывать алгоритмы на стенде без личногоприсутствия.На кафедре теоретической механики МФТИ создан стенд для лабораторных работпо алгоритмам управления ориентацией тела, подвешенного на струне [1], [2](рис. 1). С помощью сетевых технологий и Интернета появляется возможность работатьна стенде удаленно.Стенд состоит из имитатора магнитного поля и макета тела, подвешенного наструне. Макет представляет собой автономный прибор, включающий в себя системуэлектропитания, систему определения ориентации, систему управления ориентациейи систему связи со стационарным компьютером. Схема макета изображена на рис. 2,сам макет изображен на рис. 3.Система связи состоит из устройства Wi-Fi и БК. Устройство Wi-Fi позволяетобмениваться файлами со стационарным компьютером, к которому также подключеноустройство Wi-Fi. Посредством обмена файлами происходит считывание с БКрезультатов вычислений, а также управление ПО БК.Учитывая комплектацию макета твердого тела, подвешенного на струне, представляетсявозможным подключить его напрямую к Интернету, что позволит запрограммироватьалгоритм управления ориентацией и провести лабораторные испытанияалгоритма дистанционно. Установленный на борту программатор позволяет запрограммироватьнужный алгоритм работы на контроллеры, находящиеся на борту.Для наблюдения за проведением эксперимента устанавливаются веб-камеры, направленныена стенд. Но для увеличения быстродействия канала управления былорешено использовать отдельные каналы для управления и для аудио-видео передачиданных. Так, было решено использовать камеру Foscam fi8918w. Данное устройствопозволяет не только наблюдать за процессом, но и управлять углом зрения имасштабом картинки по отдельному интернет-каналу. Также имеется возможностьподключить не одного, а нескольких наблюдателей эксперимента. Таким образом,появляется возможность наблюдать лабораторные опыты в реальном времени.


О динамике космического лифта 43Рис. 1. Внешний вид стенда на кафедре теоретической механики МФТИРис. 2. Схема макетаРис. 3. Внешний вид макетаЛитература1. Ткачев С.С., Овчинников М.Ю. Компьютерное и полунатурное моделированиединамики управляемых систем: препринт/ ИПМ им. М.В. Келдыша РАН. – М.,2008. – № 50. – 28 с.2. Нуждин Д.О., Ткачев С.С. Определение ориентации КА на солнце, посредствомсолнечных батарей с использованием микроконтроллера Atmega8535// <strong>Труды</strong>52-й научной конференции МФТИ «Современные проблемы фундаментальныхи прикладных наук»–2009. — Т. 1. – С. 137–139.УДК 629.7.087О динамике космического лифтаА.Б. НуралиеваИнститут прикладной математики им. М.В. Келдыша РАНКосмический лифт представляет собой систему, один конец которой прикрепленк поверхности Земли, а другой простирается за пределы геосинхронной орбиты. Трос


44 И.В. Безруковудерживается в вертикальном положении центробежной силой вращения Земли. Будучиреализованной, такая система представляет собой постоянную магистраль, связывающуюЗемлю с ближним космосом.В докладе рассматриваются некоторые задачи базовой динамики такой конструкции,определяющие ее основные черты, о которых только и можно говорить на современном,еще предварительном этапе ее исследования. Это в первую очередь динамикасамой несущей конструкции, включающей сверхдлинный трос и уравновешивающуюмассу на его конце. Интерес к такой динамике связан с некоторыми ее уникальнымиособенностями: сверхдлинный (порядка 100 000 км), сверхпрочный (разрывнаядлина порядка 10 000 км) трос в сильно переменном по координате (в т. ч. меняющемзнак) внешнем силовом поле. Кратко упоминаются некоторые особенности статикитакой конструкции в рабочем состоянии, главное внимание уделено динамике поперечныхколебаний. Описывается ряд динамических моделей, начиная от простейшеймодели невесомого троса с сосредоточенной на конце массой до нелинейной модели сгибким нерастяжимым тросом. Проводится в возможных пределах сравнение результатов,определяемых разными моделями, выделяются различные режимы движенияот малых колебаний, которые допускают более детальное исследование с помощьюлинеаризации, до движений с большой амплитудой, которые нередко завершаютсяразрушением (падением) конструкции. Отмечено несколько сценариев движений,приводящих к падению, один из них исследован более подробно с помощью аналитическогорешения модельной задачи. Рассматриваются также некоторые особенностипродольных колебаний.Литература1. Pearson J. The orbital tower: a spacecraft launcher using the Earth’s potential energy// Acta Astronautica. — 1975. — V. 2. — N 10. — P. 785–799.2. Edwards Bradley C. Design and Deployment of a Space Elevator // Acta Astronautica.— Nov. 2000. — V. 47, Iss. 10. — P. 735–744.3. Ryotaro Ohkawa, Kenji Uchiyama, Hironori A. Fujii. The effect of disturbances onspace elevator dynamics with flexibility // 61st International Astronautical Congress,Prague, CZ. IAC-10-D4.4.5.УДК 531.355Движение спутника на круговой орбите под действиемаэродинамического и гравитационного моментовИ.В. БезруковМосковский физико-технический институт (государственный университет)Важным методом исследования динамических свойств спутника является нахождениеи анализ его стационарных режимов вращения. В [1] подобный подход примененк исследованию стационарных вращений тела, движущегося в плотных слояхатмосферы. В [2] проведено моделирование спутника, находящегося на круговойорбите и движущегося под действием гравитационного и аэродинамического моментов.Однако предложенная в ней модель не учитывает пропеллирующую компонентуаэродинамического момента, которая может действовать на тело специальной формысо стороны набегающего потока. Качественный характер движения спутника сучетом пропеллирующего момента рассмотрен в [3] при анализе движения спутниковсерии «Протон», для которых необходимость такого рассмотрения обусловленаналичием кососимметрично установленных солнечных батарей.


Движение спутника на круговой орбите под действием аэродинамического и гравитационногомоментов 45В работе рассматривается спутник на низкой круговой орбите, на который помимогравитационного моментаM g = 3ω 2 0a 3 × ^Ia 3действует аэродинамический момент видагдеM a = d × F a − 1 2 ρV 2 DSL[︂k d (ω x i + ω y j) +F a = − 1 2 ρV DS(c x V Dx i + c y V y j + c z V Dz k))︂ ]︂Vz(︂p D0 + p 1 ω z k ,V m— аэродинамическая сила лобового сопротивления, d — смещение центра давленияспутника относительно его центра масс.Ориентация спутника относительно орбитальной системы координат задается угламиЭйлера. Проводится исследование движения спутника относительно его центрамасс с целью нахождения стационарных вращений вида: ˙ψ = 0, ˙θ = 0, ˙φ = const ≠ 0.В работе анализируется число возможных стационарных режимов в зависимостиот значений параметров системы. Для некоторых частных случаев стационарныережимы найдены в явном виде; некоторые из них также исследуются на устойчивостьпо линейному приближению. При этом применяется критерий Рауса—Гурвица.Для проведения математического моделирования используется программа численногоинтегрирования уравнений движения спутника, разработанная в средеMATLAB с применением встроенной функции, реализующей метод Рунге—Куттычетвертого порядка. Выводы, сделанные при аналитическом исследовании устойчивостинекоторых стационарных режимов, проиллюстрированы результатами численногомоделирования.Для примера приведем полученные данные для устойчивого режима ψ = 0,θ = π/2 при начальном отклонении порядка 0.1 ω 0 , где ω 0 — угловая скорость орбитальногодвижения спутника (рис. 1).Рис. 1. Моделирование режима, устойчивого по линейному приближению. По осиординат отложен угол ψ в радианах, по оси абсцисс — время в секундах


46 А.В. ЧерновЛитература1. Мирер С.А., Тимофеев В.А. Авторотационное движение твердого тела в атмосфере.Вертикальный режим: препринт / ИПМ им. М.В. Келдыша АН СССР. — М.,1991. — № 51. — 25 с.2. Дегтярев А.А., Дуарте Е.К., Мирер С.А., Сарычев В.А. Исследование равновесийспутника, подверженного действию гравитационного и аэродинамическогомоментов: препринт / ИПМ им. М.В. Келдыша РАН. — М., 2004. — № 49. — 28 с.3. Белецкий В.В. Оценка характера взаимодействия аэродинамического потока соспутником по анализу движения спутника «Протон-2» относительно центра масс// Космические исследования. — М.: Наука, 1970. — Т. 8, № 2.УДК 517.19О динамике космического лифта в окрестности рабочегосостоянияА.В. ЧерновМосковский физико-технический институт (государственный университет)Космическим лифтом называют систему, состоящую из следующих элементов:троса, устройства, с помощью которого трос удерживается на поверхности планеты,орбитальной станции, к которой прикреплен другой конец троса, и устройства (кабинылифта), которое осуществляет доставку грузов на орбиту, двигаясь по тросу отпланеты к орбитальной станции и обратно. Собственно, доставка грузов на орбиту ис неё обратно на поверхность планеты и есть основное назначение космического лифта.Космический лифт является одним из вариантов тросовой системы, некоторыерезультаты исследований которых можно найти, например, в [1].В работе [2] изучается динамика троса такого лифта. При этом предполагается,что трос абсолютно гибкий и нерастяжимый и движется по круговой орбите. Кромеэтого, на трос действует только гравитационная сила.В орбитальной системе координат уравнения движения имеют следующий вид:∂∂ 2 x∂∂t 2= 2∂∂y ∂∂t ω + ω2 x − μ x r 3 + 1ρS + λ a∂∂T x∂∂s ;∂∂ 2 y∂∂t = −2∂∂x2 ∂∂t ω2 y − μ y r + 1 ∂∂T y3 ρS + λ a ∂∂s ;(︂ )︂ 2 (︂ )︂ 2 ∂∂x ∂∂y+ = 1.∂∂t ∂∂tКраевые условия записываются в следующем виде:(︂∂∂ 2 x∂∂t − 2 ∂∂y2 ∂∂t ω + ω2 x − μ x r + T )︂⃒x ⃒⃒⃒s=R+L= 0; (x − R)| 3 s=R = 0;m(︂∂∂ 2 y∂∂t − 2 ∂∂x2 ∂∂t ω + ω2 y − μ y r + T )︂⃒y ⃒⃒⃒s=R+L= 0; y| 3 s=R = 0.mЗдесь s — линейная координата на тросе, ω — угловая скорость вращения планеты,T x и T y — проекции силы натяжения, действующей на точку троса на осисистемы координат, m — масса, закрепленная на свободном конце троса, μ — гравитационныйпараметр, r — расстояние от центра притяжения до точки s троса, L —


О динамике космического лифта в окрестности рабочего состояния 47длина троса, ρ — плотность троса, S — площадь сечения троса, λ a — линейная плотностьполезной нагрузки троса. Назовем рабочим состоянием троса конфигурациюx(s) = s; y(s) = 0 . Рабочее состояние троса будет равновесной конфигурацией, еслидля площади сечения троса S(s) выполняется следующее условие:S(s) = C exp(︂(︂− μ )︂s + (sω)2 × ρ )︂− λ a2 σ ρ ; C = (μ − ω2 (R + L) 3 )m.(R + L) 2 σДалее изучалась динамика троса в окрестности рабочего состояния. Предполагается,что в окрестности рабочего состояния сила натяжения, действующая на элементтроса прямо пропорциональна его площади, коэффициент пропорциональностиравен σ, а площадь остается неизменной. После линеаризации уравнений движенияв окрестности рабочего состояния из данной системы выделилась краевая задачаШтурма—Лиувилля:(︂dSs 2 d (︁ u)︁ )︂ (︂+ λ2 ρds ds s σ s S + λ )︂au = 0,ρduu| s=R = 0;ds + λ2 u(R + L)mS(s)σ ⃒ = 0.s=R+LФундаментальная система решений данной краевой задачи имеет следующий вид(I —- тождественный оператор):⎛y k (s, λ) = exp ⎝(−1) k iλ∫︁ sR√︀Ω(s)ds⎞⎠ (Ω(s)) −1/4 (︀ s 2 S )︀ −1/2Ω(s) = 1 +λ aρS(s) , Af = i df2 (Ω(s))−1/2 ds + i ∫︁ sq(˜s)d˜s,2R)︂q(s) =(︂(Ω(s)) −1/4 d 2ds 2 (Ω(s))−1/4 − (Ω(s)) −1/2 h(s) ,h(s) = 1 (︂ )︂ d/ds(s 2 2S)+ 1 d4 s 2 S 2 ds(︂ d/ds(s 2 S)(︂I − (−1) k 1 λ A )︂ −1, (1)s 2 S(︁)︁ −1Условие существования обратного оператора I − (−1) k 1A λ и совместностькраевых условий позволяют решить исходную задачу Штурма—Лиувилля.Литература)︂.1. Белецкий В.В., Левин Е.М. Динамика космических тросовых систем. — М.: Наука,1990.2. Чернов А.В. О динамике космического лифта в окрестности рабочего состояния// Информационные технологии: модели и методы. — М.: МФТИ, 2010. — С. 4–11.


48 С.Л. Бабичев, А.К. Коньков, К.А. КоньковСекция информатикиУДК 537.322.2Автоматизированный анализ проблем синхронизациипараллельных алгоритмов в вычислительных системахс общей памятьюС.Л. Бабичев, А.К. Коньков, К.А. КоньковМосковский физико-технический институт (государственный университет)Предлагается подход к статическому анализу параллельных алгоритмов, связанныйс синтезом сети Петри и последующим её анализом для программ, состоящих изпараллельно исполняющихся потоков и использующих для синхронизации примитивыMutex и Event. Используется модель исполнения программы, преобразованная вэквивалентную модель сети Петри.Определение отсутствия тупиков в модели разбивается на следующие этапы:1. Описание потоков управления и примитивов синхронизации на некотором промежуточномязыке описания модели.2. Преобразование языка описания модели в эквивалентную сеть Петри.3. Анализ сети Петри.Первый пункт может быть выполнен как автоматизированным способом, путём анализатекста программы, так и ручным, при проектировании структуры потоков.Второй пункт выполняется автоматически с использованием базы знаний с описаниямисемантики примитивов синхронизации [2]–[4].Третий пункт сводится к решению задачи математического программирования[1]. Для этого используются понятия сифонов (siphons) и ловушек (traps).В данном случае решалась задача математического программирования:G MP = Minimize ∑︁ p∈Pν p ,гдеT — множество переходов сети Петри,F ⊆ (P × T ) ∪ (T × P ) — есть множество направленных дуг,ν p = 1{p /∈ S},z t = 1{t /∈ S ∙ },z t ∑︀ ν p − | ∙ t| + 1∀, t ∈ T,p∈ ∙ tν p z t ∀(t, p) ∈ F,ν p , z t ∈ {0, 1},M = M 0 + CY,M 0,Y 0.Выражение M = M 0 + CY суть уравнение состояния сети.Сеть Петри не содержит тупиков, если G MP = |P |.


Автоматизированный анализ проблем синхронизации параллельных алгоритмов в вычислительныхсистемах с общей памятью 49Данный метод использовался, в частности, для решения задачи по оптимизациипула вычислительных потоков. По описанию пула была синтезирована сеть Петри,показанная на рис. 1.Доказано, что синтезированная сеть Петри не содержит тупиков.Рис. 1. Модель сети Петри пула вычислительных потоковЛитература1. Chu F., Ian Xie X. Deadlock analysis of Petri nets using siphons and mathematicalprogramming // IEEE Transactions of Robotics and Automation. — Dec. 1997. —V. 13. — N 6.2. Vallejo F. [et al.] Shared Memory Multiprocessor operating System with an ExtendedPetri Net Model // IEEE trans. on parallel and distributing systems. — July 1994. —V. 5. — N 7.3. Kavi K.M., Moshtaghi A., Chen. D. Modeling multithreaded application using Petrinets // International Journal of Parallel Programming. — October 2002. — V. 30,Iss. 4.4. Lester B.P. Detection of control flow errors in parallel programs at compile time //International Journal of Distributed and Parallel Systems. — Nov. 2010. — V. 1, N 2.


50 М.В. Муратов, В.И. ГолубевУДК 519.63Численное моделирование волновых откликов трещиноватыхгеологических пластов и их анализМ.В. Муратов, В.И. ГолубевМосковский физико-технический институт (государственный университет)В настоящее время сейсморазведка является одним из наиболее надежных методовподготовки пород к глубокому бурению [1]. Проводимые при этом исследованиянаправлены на определение структуры геологических пород, залегающих под дневнойповерхностью. В силу сложности и высокой стоимости полевых экспериментовчисленное моделирование может быть использовано для разработки методик интерпретацииданных с сейсмоприёмников.При обработке данных, полученных при сейсморазведке, необходимо иметь методику,позволяющую отличить волны, отражённые от различных геологическихструктур. Так, например, актуальной задачей является идентификация кратныхволн, многократно переотражённых от границ раздела сред, и отклика трещинногокластера. Практически важной оказывается также задача о восстановлении посейсмограмме полной структуры кластера субвертикальных трещин. Неправильнаяинтерпретация данных сейсморазведки приводит к ошибкам в определении геологическойструктуры среды. Связанные с этим переоценки запасов нефти или уровнягрунтовых вод могут иметь негативные экономические и промышленные последствия.Проблема численного моделирования волновых процессов в трещиноватой средеуже исследовалась в работах [2], [3]. В статье [2] рассмотрено поведение волновогофронта при распространении упругой волны в трещиноватой среде. В работе [3]предложена методика замены кластера субвертикальных трещин однородным включениемс некоторыми эффективными упругими характеристиками. В данной работерассмотрена задача определения структуры кластера субвертикальных трещин попоказаниям сейсмоприёмников, расположенных на дневной поверхности. Проведенаоценка характеристик кластера, таких как его вертикальная и горизонтальная протяжённость,а также расстояние между соседними трещинами. Данные параметрымогут быть использованы для оценки запасов нефти и газа при выборе методикиразработки реальных месторождений. Также исследована проблема идентификацииоткликов от контактных границ при наличии геологической среды со слоистой структуройи кластера субвертикальных трещин.Литература1. Шерифф Р., Гелдарт Л. Сейсморазведка. История, теория и получение данных.— Т. 1. — М.: Мир, 1987. — 447 с.2. Willis M.E., Burns D.R., Rao R., Minsley B., Toksoz M.N., Vetri L. Spatialorientation and distribution of reservoir fractures from scattered seismic energy //Geophysics. — 2006. — V. 71, N 5. — P. 43–51.3. Агаханов С.Н., Квасов И.Е., Панкратов С.А. Численное исследование осредненныхмоделей неоднородных сред в задачах геофизики сеточно-характеристическимметодом // Сборник научных трудов «Информационные технологии: модели иметоды». — М.: МФТИ, 2010. — С. 12–21.


Вытесняющая дисковая планировка в ядре ОС Windows 51УДК 517.977.5Вытесняющая дисковая планировка в ядре ОС WindowsВ.С. ФедоровМосковский физико-технический институт (государственный университет)В докладе рассмотрен один из видов привилегированного планирования: в системевыделяются несколько источников запросов, причем права у них не равные.Главная цель планирования — сохранение производительности дисковой подсистемыдля важных системных компонент и приложений в условиях использования дисковогоканала менее важными (фоновыми) запросами, то есть необходимо сохранитьработоспособность системы, ее отклик. В теории ОС это называется вытесняемостью(preemptability). Так, например, исполнение одного процесса останавливаетсядля того, чтобы исполнить другой или обработать важное системное прерывание.Дисковая подсистема имеет ряд важных отличий от других ресурсов ОС. В отличиеот процессора здесь нет квантования, невозможно прервать исполнение операции,передать управление. В отличие от сети — нет четко установленной шириныканала. Общая пропускная способность может сильно изменятся в зависимости отупорядоченности запросов, количества одновременных потоков, топологии устройства,особенностей контроллера.В текущей работе предложен метод планировки, названный вытесняющим. В егооснове лежит добавление сдерживающих пауз после выполнения запросов. Во времяпаузы дисковая подсистема находится в простое, ожидая новый важный системныйзапрос и запуская новый фоновый запрос только после истечения интервала ожидания.Основной в рассмотрении является модель синхронного фонового потока и асинхронногослучайного потока запросов серверного приложения. Анализ данной моделипозволил сделать важные изменения в механизмах планировки, описанных выше.Главный параметр планировки — время задержки после каждой операции. Он адаптивноизменяется в зависимости от нагрузки на дисковый канал за определенныйпромежуток времени. Это позволило, с одной стороны, поддержать производительностьфонового потока, например дефрагментации или синхронизации файловогокэша, и обеспечить серверное приложение, например базу данных, возможностьюпочти монопольного доступа к диску в случае таковой необходимости, сохраняя общеевремя отклика и производительности сервера.Так же подобную модель можно распространить и на большее количество потоков,вводя меру важности одного потока относительно всех других, что позволяетдобавлять в рассмотрение большее количество потоков, в том числе своп.Кроме всего, данный планировщик адаптивно использует основную особенностьустройства современных жестких дисков, существенно влияющую на его производительность— дисковый кэш. Доступ к данным, записанным в кэш диска, ограничиваетсятолько скоростью шины, что на много порядков быстрее обычного доступа,сопряженного с долгим поиском нужного сектора на диске. Неэффективное использованиекэша может существенно снизить общую производительность дисковойсистемы. В докладе предложена модель вероятностного описания дискового кэша,которая позволяет оценить итоговую скорость доступа к тем или иным данным надиске.По описанной выше модели был разработан и протестирован при различных видахнагрузок драйвер уровня ядра ОС Windows, реализующий планировку на уровнеблочного устройства диска.


52 Д.И. ПономаревЛитература1. Руссинович М., Соломон Д. Внутреннее устройство Microsoft Windows: WindowsServer 2003, Windows XP и Windows 2000. — 4-е изд. — СПб.: Питер, 2006. — 992 с.2. Бовет Д., Чезати М. Ядро Linux. — 3-е изд.— М.: BHV, 2007. — 1104 с.3. Eggert L., Touch J. Idletime scheduling with preemption intervals // ACM SIGOPSOperating Systems Review. — 2005. — V. 39, N 5. — P. 249–262.4. Tsakalozos K. [et al.] Adaptive disk scheduling with workload-dependent anticipationintervals // The Journal of Systems and Software. — 2009. — V. 82. — P. 274–291.УДК 519.876Использование алгоритма ожидания и максимизацииправдоподобия в марковской модели непрерывного профилядля синхронизации сигналов манипулятораД.И. ПономаревМосковский физико-технический институт (государственный университет)Рассматривается задача восстановления управляющего сигнала манипулятора,чувствительными элементами которого являются MEMS-акселерометры. Для решенияданной задачи используется марковская модель непрерывного профиля, параметрыкоторой оцениваются при помощи алгоритма ожидания и максимизации правдоподобия[1].Предполагается, что существует скрытая последовательность, ¯z = (z 1 , z 2 , ..., z M ),каноническое представление набора зашумленных входных данных. Любой временнойряд из данного набора моделируется как неравномерно во времени формируемаяверсия скрытой последовательности, к которой применены локальные преобразованиямасштаба. Каждое состояние из последовательности скрытых состояний состоитиз состояния времени и состояния масштаба: πik → {τi k , φ k i }. Распределение вероятностиэлемента x k i : A π ki(x k i |¯z) ≡ p(x k i |πi k , ¯z, σ, u k ) ≡ N(x k i ; z τ kiφ k i u k , σ 2 ). Вероятностьперехода: Tπ k j ,π i≡ p(π i |π j ) = p(φ i |φ j )p k (τ i |τ j ). Распределения вероятности переходовиз одного состояния в другое для состояний времени и состояний масштаба являютсяполиномиальными.Для оценки параметров модели используется алгоритм ожидания и максимизацииправдоподобия (EM-алгоритм) [2]. На E-шаге используется алгоритм прямой иобратной рекурсии. На M-шаге оцениваются параметры модели. Логарифм правдоподобияK наблюдаемых временных рядов, ¯x k , задается выражением: L P ≡ L + P ,где L — логарифм правдоподобия в скрытой марковской модели, и вычисляется посредствомалгоритма прямой и обратной рекурсии, P — логарифм правдоподобия,отвечающий за априорные ограничения, наложенные на модель. Выражения для составляющихлогарифма правдоподобия:(︃)︃K∑︁N∑︁N∑︁L ≡ log p(π 1 ) + log A πi (x k i |¯z) + log Tπ k i−1 ,π i,k=1i=1∑︁τ−1P ≡ −λ (z j+1 − z j ) 2 +j=1i=2K∑︁log D(d k ν|{ην}) k + log D(s ν |{η ν}).′k=1


Использование алгоритма ожидания и максимизации правдоподобия в марковской модели непрерывногопрофиля для синхронизации сигналов манипулятора 53Обозначим через S общее число возможных состояний, тогда ожидаемый полныйлогарифм правдоподобия:< L P > π = P +... +K∑︁K∑︁k=1 s=1S∑︁S∑︁γs k (1) log T0,s k +S∑︁N∑︁k=1 s=1 s ′ =1 i=2K∑︁S∑︁k=1 s=1 i=1N∑︁γs k (i) log A s (x k i |¯z) + ...ξS,S k ′(i) log T S,S k ′, (1)где T0,s k ≡ p(π 1 = s), γs k (i) и ξS,S k ′(i) — условные вероятности, определенные посредствомалгоритма прямой и обратной рекурсии. Оценки значений параметров моделиполучаются взятием производных по данным параметрам от математического ожиданиялогарифма правдоподобия и приравниванием их к нулю.Сигналы, получаемые от двух независимых акселерометров, прошли процедурувыравнивания при помощи марковской модели непрерывного профиля (рис. 1).Скрытая последовательность для данного набора из двух сигналов показана нарис. 2.График зависимости логарифма правдоподобия от номера итерации показан нарис. 3.После обучения модели при помощи алгоритма ожидания и максимизации правдоподобияпроизведена синхронизация сигналов при помощи алгоритма Витерби [3].Результат синхронизации сигналов изображен на рис. 4.Рис. 1. Временные зависимости проекции ускорения, полученные для двух независимыхдатчиков. Точками обозначен сигнал с первого акселерометра, а пунктиром ––со второгоРис. 2. Зависимость скрытой последовательности от времени


54 А.В. ФаворскаяРис. 3. Зависимость логарифма правдоподобия от числа итерацийРис. 4. Результат выравнивания сигналовЛитература1. Listgarten J., Neal R.M., Roweis S.T., Emili A. Multiple alignment of continuoustime series / Ed. by Saul L.K., Weiss Y., Bottou L // Advances in Neural InformationProcessing Systems. — Cambridge, MA: The MIT Press. — 2005. — V. 17. — P. 5–13.2. Dempster A.P., Laird N.M., Rubin D.B. Maximum likelihood from incomplete datavia the EM algorithm // Proceedings of the Royal Statistical Society. — 1976. —P. 1–38.3. Витерби А. Границы ошибок для сверточных кодов и асимптотически оптимальныйалгоритм декодирования // Некоторые вопросы теории кодирования. — М.:Мир, 1970. — С. 142–165.УДК 519.63Сеточно-характеристический метод на иерархических сеткахА.В. ФаворскаяМосковский физико-технический институт (государственный университет)В прикладных задачах, например, при численном моделировании в сейсмологиии сейсморазведке, необходимо корректное описание волновых процессов, происходящихв сложных гетерогенных средах, к примеру, в земной коре, с учетом многочисленныхнеоднородных включений (трещины, слоистость, карстовые образования идр.). Детальное описание волновых процессов вблизи всех имеющихся неоднородностейтребует использования достаточно подробной сетки. Чем меньшие неоднородныевключения мы хотим исследовать, тем больше придется сделать шагов по времени,а также операций на каждом временном слое. Однако обычно неоднородности локализованыв достаточно небольшом объеме внутри области интегрирования. Приданной постановке задач целесообразно применять иерархические сетки, сгущающиесяв месте расположения неоднородностей.Но размер шага интегрирования по времени напрямую зависит от размера минимальногошага по пространству. Поэтому количество шагов по времени использованияобычных иерархических сеток не сократит, оно сократит только число операцийна каждом временном слое.


Постановка задачи численного моделирования динамических процессов в сплошной линейноупругойсреде с анизотропией сеточно-характеристическим методом 55Как показали проведенные исследования, применение именно сеточно-характеристическихметодов позволяет использовать специальные иерархические сетки с кратнымшагом. Имеется возможность делать кратный шаг не только по пространству,но и по времени и таким образом сокращать не только число операций, необходимыхдля интегрирования задач на каждом временном слое, но и сокращать числовыполняемых шагов по времени в той части области интегрирования, где используетсяболее крупная сетка. На рис. 1 приведено схематическое изображение такойиерархической сетки с кратностью шага, равной трем.Проведено численное исследование на примере решения одномерных гиперболическихсистем уравнений с постоянными коэффициентами с использованием разработанныхиерархических сеток сеточно-характеристическим методом. Проведенатеоретическая разработка двумерного и трехмерного аналогов с использованием треугольныхи тетраэдральных сеток.Рис. 1. Иерархическая сетка с кратным шагомЛитература1. Магомедов К.М., Холодов А.С. Сеточно-характеристические численные методы.– М.: Наука, 1988.2. Петров И.Б., Лобанов А.И. Лекции по вычислительной математике. – М.:Интернет-университет информационных технологий, 2006.УДК 519.63Постановка задачи численного моделирования динамическихпроцессов в сплошной линейно-упругой среде с анизотропиейсеточно-характеристическим методомА.В. ФаворскаяМосковский физико-технический институт (государственный университет)Ввиду того, что в настоящее время сейсморазведка является одним из наиболеенадежных методов подготовки пород к глубокому бурению, возникает потребность вусовершенствовании методов моделирования распространения волн в неоднороднойгеологической среде. Численные эксперименты позволяют значительно оптимизироватьпроцесс нефтедобычи, поэтому моделирование волновых процессов в гетерогенныхсредах становится всё более актуальной задачей механики твёрдого тела.


56 И.Е. Квасов, А.В. Санников, А.В. ФаворскаяВ настоящее время появляется практический интерес к исследованию влиянияанизотропии геологических сред на прохождение в них сейсмических волн. Математическоймоделью анизотропной геологической среды является гиперболическаясистема уравнений сплошной линейно-упругой среды с анизотропией [1]. В настоящеевремя при ее решении применяются приближенные методы, для которыхне нужно детальное исследование системы уравнений. Но преимущества сеточнохарактеристическогометода связаны с использованием свойств решаемой гиперболическойсистемы уравнений. В связи с этим возникает необходимость математическогоисследования параметров данной системы с анизотропией, которые не всегда имеютаналитическое выражение, и разработки специальных сеточно-характеристическихметодов.В данной работе выполнено исследование характеристических свойств этой системыуравнений для различных видов анизотропии: орторомбической, вертикальнотрансверсальной,горизонтально-трансверсальной и для общего случая [1]–[4].Предложена учитывающая особенности данной системы модификация сеточнохарактеристическогометода. Она разработана как для структурированных сеток,так и для неструктурированных треугольных и тетраэдральных сеток. Для решениядвумерных задач предложен приближенный метод численного интегрирования, основанныйна решении системы уравнений сплошной линейно-упругой среды без анизотропиисеточно-характеристическим методом на неструктурированных треугольныхсетках.Литература1. Lisitsa V., Vishnevskiy D. Lebedev scheme for the numerical simulation of wavepropagation in 3D anisotropic elasticity // Geophysical Prospecting. — 2010. — N 58.— P. 619–635.2. Thomsen L. Elastic anisotropy due to aligned cracks in porous rock // GeophysicalProspecting. — 1995. — N 43. — P. 805–829.3. Hsu C.-J., Schoenberg M. Elastic waves through a simulated fractured medium //Geophysics. — 1993. — V. 58, N 7. — P. 964–977.4. Thomsen L. Weak elastic anisotropy // Geophysics. — 1986. — V. 51, N 10 — P.1954–1966.УДК 519.63Численное моделирование пространственных динамическихпроцессов в гетерогенных средахсеточно-характеристическим методомна высокопроизводительных вычислительных системахИ.Е. Квасов, А.В. Санников, А.В. ФаворскаяМосковский физико-технический институт (государственный университет)Для решения пространственных динамических задач, требующих детального описанияволновой картины в сложных гетерогенных средах, необходимо применениенеструктурированных тетраэдральных сеток в сочетании с корректным описаниемграничных условий. Примером таких задач являются задачи сейсмологии по моделированиюземлетрясений в земной коре и их действию на жилые и промышленныесооружения, а также задачи сейсморазведки по моделированию месторождений углеводородов.В данных задачах в земной коре имеются многочисленные негомогенныевключения (полости, каверны, трещины и т.д.). Так как математическая модель


Численное моделирование пространственных динамических процессов в гетерогенных средахсеточно-характеристическим методом на высокопроизводительных вычислительных системах 57сплошной линейно-упругой среды описывается гиперболической системой уравнений[1], целесообразно применение сеточно-характеристических методов [2] с использованиеминтерполяции [3] высоких порядков на неструктурированных тетраэдральныхсетках. Интерполяция с ограничителями позволяет избавиться от нефизичныхосцилляций при использовании полиномов высоких порядков. Также рекуррентноеразбиение тетраэдров позволяет существенно сократить расход ресурсов на построениеи хранение сетки.В работе предложены усовершенствованные высокоточные сеточно-характеристическиеметоды на неструктурированных тетраэдральных сетках, предназначенныедля пространственного численного моделирования распространения волн в сложныхгетерогенных средах. Получены критерии оптимальности тетраэдральных сеток дляданных методов.В связи с повышающимися объемами данных по сравнению с двумерным случаемтребуется применение высокопроизводительных вычислительных систем. Алгоритм,соответствующий разрабатываемым методам, распараллелен на вычислительныйкластер с оптимальным использованием системных ресурсов.В разработанном программном комплексе предусмотрено использование четырехграничных условий: заданной внешней силы, заданной скорости границы, смешанныхграничных условий и неотражающих граничных условий, основанных наравенстве нулю выходящих характеристик. С использованием корректора заданнойскорости реализовано контактное условие полного слипания. А контактное условиесвободного скольжения вычисляется с помощью корректора смешанных граничныхусловий. На рис. 1 приведен пример тетраэдральной сетки с контактной границей,разделяющей две области с разными параметрами среды.Рис. 1. Пример тетраэдральной сетки с контактной границейЛитература1. Кондауров В.И., Фортов В.Е. Основы термомеханики конденсированной среды.– М.: МФТИ, 2002.2. Магомедов К.М., Холодов А.С. Сеточно-характеристические численные методы.– М.: Наука, 1988.


58 В.И. Голубев, И.Е. Квасов3. Петров И.Б., Лобанов А.И. Лекции по вычислительной математике. – М.:Интернет-университет информационных технологий, 2006.УДК 519.63Определение геометрических характеристик геологическихпластов на основе методов быстрой оптимизацииВ.И. Голубев, И.Е. КвасовМосковский физико-технический институт (государственный университет)Знание свойств и типов геологических пород, залегающих под дневной поверхностью,представляет большой интерес при выборе площадок под строительство стратегическиважных объектов, таких как атомные станции. Для получения этой информациииспользуются методы зондирования на основе распространения акустическихволн. Это позволяет избежать дорогостоящих методов разведки (бурение скважин)и ускорить процесс оценки пригодности данного участка для строительства.В данной работе изучается обратная задача численного моделирования: требуетсяопределить количество и мощности пластов, залегающих под заданным участкомземной поверхности. Рассматривается упрощённый вариант данной задачи: имеетсянабор слоёв (от одного до трёх) с известными упругими характеристиками.Тогда вектор z неизвестных параметров, определяющих задачу, содержит от двухдо четырёх компонент: количество слоёв N = 1, 2, 3 и мощность каждого слояH min h k H max , k = 1, 2, 3.Одной из особенностей данной задачи является то, что информацию можно получатьлишь из экспериментальных измерений, для получения которых используетсяакустическое зондирование. На поверхности земли в точках x i располагается сериясейсмоприёмников, на которых в моменты времени t j фиксируются вертикальныекомпоненты скорости частиц ˜V y (x i , t j ) в отраженной волне. Ищется такое значениеz, чтобы численно моделируемый отклик V y (z, x i , t j ) наименьшим образом отличалсяот экспериментального. Для численного моделирования в работе используетсясеточно-характеристический метод [1], учитывающий физические особенности задачии позволяющий ставить граничные и контактные условия в корректной форме.Таким образом, рассматриваемая задача формулируется как оптимизационнаязадача наименьших квадратов:min I(z), z ∈ {1, 2, 3} × [H min , H max ] {1,2,3} , (1)I(z) = ∑︁ i∑︁[V y (z, x i , t j ) − ˜V y (x i , t j )] 2 . (2)jФункция (2) не имеет аналитического представления, и получение ее значенийсвязано с проведением трудоемких численных экспериментов. Для решения задачи(1)–(2) применяется ряд быстрых методов глобальной оптимизации [2], разработанныхдля подобного класса сложных многоэкстремальных задач.Литература1. Квасов И.Е., Петров И.Б., Челноков Ф.Б. Расчет волновых процессов в неоднородныхпространственных конструкциях // Математическое моделирование. —2009. — Т. 21, № 5. — С. 3–9.


Виртуальный кластер 592. Сергеев Я.Д., Квасов Д.Е. Диагональные методы глобальной оптимизации. — М.:Физматлит, 2008. — 352 с.УДК 519.687Виртуальный кластерА.Ю. Субботина, Д.В. Лунев, А.В. Николаев, А.Л. ЧуличковМосковский физико-технический институт (государственный университет)В современном магистральном пути развития ИТ-отрасли можно выделить дваосновных направления: облачные среды и виртуализацию. Развитие облаков нацеленопрежде всего на предоставление дешевых и качественных услуг для более широкогослоя клиентов. Виртуализация позволяет гибко управлять ИТ-ифраструктуройпосредством создания программных решений, максимально независимых от компьютернойплатформы, на которой они работают. Постоянно востребованным ИТсервисомявляются высокопроизводительные вычисления (HPC), интеграция которыхв облака и под виртуальную среду сделает их поддержку и использование болеедоступным.Сформулируем желаемые свойства виртуального кластера для HPC:1. выделенный для каждой группы пользователей, собранный под ее потребности,с полным набором необходимого ПО;2. совместим с ПО для реальных кластеров и иметь схожий интерфейс;3. легко масштабируем;4. максимально абстрагировать вычислительный ресурс;5. не должен привносить существенных потерь производительности.Последние два требования являются по сути противоречивыми. Поэтому их одновременноедостижение невозможно на современном уровне развития ИТ, но возможенкомпромисс прежде всего в отношении вида виртуализации вычислительныхузлов. Рассмотрим варианты такого компромисса. Полная виртуализация и паравиртуализацияузлов дает большие потери в производительности, что является критичным.Виртуализация на уровне ОС хотя и вносит некоторые ограничения, затоне дает существенных потерь в производительности, позволяет сохранять и восстанавливатьсостояние параллельных приложений средствами ОС, мигрировать их. Витоге разумным выходом представляется некоторое совмещение второго (решение встиле паравиртуализации для мастера) и третьего вариантов для узлов, т.е. нужномодифицировать существующее ПО, чтобы оно могло работать в «виртуальномпространстве».Управление физическим кластером предлагается осуществлять тем же программнымстеком, что и в «классическом кластере», но роли клиентов здесь играют виртуальныекластеры, а задачами являются контейнеры, содержащие в себе параллельноеприложение виртуального кластера. Узлы содержат образы виртуальных систем,соответствующие каждому из вариантов виртуальных кластеров, что дает нам возможностьвыполнения первого условия. Виртуальный мастер содержит в себе такойже набор ПО, что и «классический мастер», но планировщик «паравиртуализирован».По проведенным тестам потери производительности составляют не более 2%. Втаблице (рис. 1) приведены результаты замеров производительности двух виртуальныхузлов на основе теста HPL.Таким образом, можно утверждать, что сочетание «паравиртуализованного»,планировщика и узлов с виртуализацией на уровне ОС позволит добиться макси-


60 А.В. Васюковмальной эффективности. Виртуальный кластер в таком исполнении можно будетлегко интегрировать с облачными сервисами.Рис. 1. max(CentOS)-min(OVZ)/min(OVZ)≈ 2%; max(CentOS)-max(OVZ)/max(CentOS)≈ 0.7%Литература1. Regola, N., Ducom, J.-C. Recommendations for Virtualization Technologies in HighPerformance Computing // IEEE Second International Conference (CloudCom) —2010. — P. 409–416.УДК 519.63О решении задач динамической прочности трубопроводовпод давлением с использованием параллельной версиисеточно-характеристического численного методана неструктурированных сеткахА.В. ВасюковМосковский физико-технический институт (государственный университет)Одной из актуальных задач изучения динамической прочности трубопроводовпод давлением является анализ условий образования и распространения трещин какв радиальном, так и в осевом направлении. Наиболее принципиальным вопросом сточки зрения практики является зависимость возможности роста и остановки трещиныот свойств материала и учет раскрытия стенки трубопровода.Задача является принципиально динамической, поэтому для ее решения используютсясеточно-характеристические численные методы, позволяющие учесть гиперболическиесвойства определяющей системы уравнений в частных производных. Дляпрактического применения необходимо проводить расчёты в трёхмерных областяхсложной геометрической формы. В связи с этим необходима реализация методовна неструктурированных (тетраэдрических) сетках, так как неструктурированныесетки позволяют точно задать сложную геометрию области, а также обеспечиваютменьшую анизотропию численного решения.В работе рассматривается разработка параллельной реализации сеточно-характеристическогочисленного метода для решения поставленной задачи и вопросы эффективностираспараллеливания метода. Приводятся тесты производительности параллельнойверсии по сравнению с однопроцессорной. Показаны результаты моделированияроста трещины в осевом направлении и раскрытия стенки трубопровода.


Система безопасности для распределенного файлового хранилища TorFS 61Литература1. Работнов Ю.Н. Механика деформируемого твёрдого тела. — М.: Наука, 1988.2. Магомедов А.М., Холодов А.С. Сеточно-характеристические численные методы.— М.: Наука, 1988.3. Петров И.Б., Холодов А.С. Численное исследование некоторых динамическихзадач механики деформируемого твёрдого тела сеточно-характеристическим методом//Ж. выч. матем. и матем. физ. — 1984. — Т. 24. — № 5. — С. 722–739.4. Федоренко Р.П. Введение в вычислительную физику. — М.: Издательство Московскогофизико-технического института, 1994.УДК 004.056Система безопасности для распределенного файловогохранилища TorFSЛ.И. ИваничкинаМосковский физико-технический институт (государственный университет)В настоящее время широкое распространение получили облачные системы храненияинформации, в связи с этим становится актуальным вопрос создания системыбезопасности для распределенного хранилища информации. Особенностями такойсистемы являются отсутствие доверенного центра и предположение о том, что всесерверы и каналы передачи данных являются потенциально небезопасными. Следствиемтакого подхода является перенос защиты информации с серверов на клиентов.Целью работы является реализация системы безопасности для TorFS на основаниимоделей, описанных в [1], [2] и [3], которая базируется на следующих компонентах:инфраструктуре открытых ключей GPG ring, необходимой для сопоставленияидентификаторов пользователей и их публичных ключей, списках контроля доступаи криптографической библиотеке cryptlib. Списки контроля доступа существуют длякаждого файла в системе и содержат идентификаторы пользователей, имеющих правочтения или записи в файл, а также ключи для доступа к файлу, зашифрованныеключами этих пользователей.В ходе работы над проектом TorFS были проанализированы модели контролядоступа, описанные в [2] и [3], на их основании была построена модель, в которойвместо пары открытый и секретный ключ используется один симметричный ключ.Эта модель позволяет сократить расходы на генерацию ключей и уменьшить размерсписков контроля доступа, но в ходе анализа было выяснено, что в ней нарушаютсятребования к безопасности системы, в частности, из права на запись в файл следуетправо на чтение. Данное нарушение может быть устранено при использованиисимметричного ключа при расшифровке (доступ на чтение) и хэш-функции от этогоключа при шифровании (доступ на запись).Литература1. Обернихин В.А. Построение полностью децентрализованной системы контролядоступа на основе криптографических алгоритмов: дис. ... канд. физ.-матем. наук.05.13.18 : М., 2004. — 104 c. — РГБ ОД, 61:05–1/113.2. Тормасов А.Г., Обернихин В.А. Контроль доступа с протоколированием измененийв распределенной децентрализованной файловой системе (TorFS) // Электронныйжурнал «Исследовано в России». — 2004. — № 203. — С. 2156–2165.


62 А.В. Храбров, Ю.В. Рубанова3. Тормасов А.Г., Обернихин В.А. Схема контроля доступа для распределенной одноранговойфайловой системы (TorFS) // Безопасность информационных технологий— 2005. — № 3. — С. 68–74.УДК 004.7Система распределенного выполнения задач nacloudЮ.В. ГоршенинМосковский физико-технический институт (государственный университет)На сегодняшний день в крупных компаниях, институтах и в личном распоряжениипользователей имеется большое количество неиспользуемых вычислительныхмощностей: компьютеры пользователей, которые не нагружены большуючасть суток, кластеры, которые не постоянно заняты расчетами или просто «лишние»вычислительныересурсы.Так же всегда есть пользователи, нуждающиеся в вычислительных ресурсах длярешения задач, таких как: вычислительные задачи, пакетные задания (batch jobs),хранилища данных, прокси-серверы, веб-хостинг. Потребителями ресурсов могут являтсякак отдельные пользователи, так и организации.Трудность состоит как в нахождении поставщиками ресурсов и потребителямиресурсов друг друга, так и в оптимальном распределении ресурсов.Целью проекта nacloud является создание системы, которая позволяет решатьследующие задачи.1. Получение от поставщиков ресурсов информации о свободных ресурсах.2. Получение от потребителей ресурсов информации о роде задач, которые требуетсявыполнить, оценка количества ресурсов, которое потребуется для выполнениязадач.3. Распределение ресурсов среди потребителей.4. Предоставление средств для исполнения и контроля пользовательских задач.5. Гарантированное исполнение пользовательских задач.Основную сложность представляют решение задачи распределения ресурсов, котораяв общем случае является NP-полной, и реализация системы исполнения большогоколичества задач на кластере, которая представляет собой технически сложнуюзадачу, т.к. пользовательские приложения не должны нанести ущерб как операционнойсистеме, так и оборудованию.Литература1. Таненбаум Э., ван Стеен. М. Распределенные системы. Принципы и парадигмы.— СПб.: Питер, 2003. — 880 с.УДК 004.451.1Мониторинг дисковой активности в ОС WindowsА.В. Храбров, Ю.В. РубановаМосковский физико-технический институт (государственный университет)Доклад посвящен мониторингу дисковой активности в операционных системах(далее ОС) Windows. Рассмотрены основные проблемы ввода-вывода (далее I/O) инекоторые пути их решения. Возможный способ их решения в Windows — создание


Применение высокопроизводительных вычислений на GPU для решения задач криптографии 63альтернативного планировщика I/O, реализация которого приводит к задаче мониторингаI/O подсистемы в ядре этой ОС.Рассмотрены проблемы I/O в параллельных вычислительных системах, которыемогут стать главным препятствием для роста производительности: малые пропускныеспособности дисков, нерациональное использование ресурсов, плохая масштабируемостьсуществующих I/O систем. Основной путь решения состоит в созданиипромежуточного уровня оптимизации и планирования между приложениями и системамиI/O.Обсуждаются проблемы серверных ОС, а также проблема мультимедийных приложений— поддержание заданной скорости чтения. В Linux для их решения используютсяразнообразные планировщики I/O. В новых версиях Windows (начинаяс Vista) введены квоты на ширину канала I/O и приоритеты I/O операций.Для планирования I/O нужна система мониторинга, предоставляющая полнуюинформацию о запросах и их инициаторах. Для увеличения быстродействия и упрощенияработы с файлами созданы механизмы кэширования и отображаемых в памятьфайлов. Их использование часто приводит к невозможности установить, какойпроцесс в системе является реальным инициатором файловой операции. В докладекратко объясняется устройство I/O подсистемы Windows и на примере некоторыхсценариев I/O демонстрируется проблема потери информации об инициаторе запроса.Для ее восстановления предлагается сохранять (хешировать) запросы на раннихэтапах обработки, а сам планировщик реализовать при помощи задержки запросов.Сложность создания систем мониторинга и планирования I/O в Windows состоитв закрытости кода этой системы. Рассмотрены основные средства модификацииповедения этой ОС: драйверы-фильтры, перехватывающие запросы к другим драйверам(в частности, к драйверу файловой системы), а также хуки функций ядра (впервую очередь, функций менеджера виртуальной памяти и менеджера файловогокэша).Литература1. Руссинович М., Соломон Д. Внутреннее устройство Microsoft Windows: WindowsServer 2003, Windows XP и Windows 2000. — 4-е изд. — СПб.: Питер, 2006.2. Rajeev Nagar. Windows NT File System Internals. — O’Reilly, 1997.3. Лав Р. Разработка ядра Linux. — 2-е изд. — М.: ИД «Вильямс», 2006.4. Cloud R. Problems in Modern High Performance Parallel I/O Systems. — TheUniversity of Alabama at Birmingham, 2011.УДК 004.056.55Применение высокопроизводительных вычислений на GPUдля решения задач криптографииМ.А. ХламовМосковский физико-технический институт (государственный университет)Криптография — часть системы безопасности, разрешающая доступ к чему-либоодним людям и не разрешающая другим. Блочные шифры являются одной из фундаментальныхсоставляющих систем шифрования. Они применяются к блокам текстафиксированной длины. Текущее поколение блочных шифров работает с блоками текстадлиной 128 бит. Открытый и шифрованный текст имеют всегда один и тот же размер.Блочный шифр является обратимым, то есть существует функция, которая по


64 В.А. Давыдовшифрованному тексту выдает исходный. Таким, например, является AES(AdvancedEncryption Standard). Также он является так называемым round-алгоритмом, то естьпредставляет собой несколько последовательных применений алгоритма.Одним из преимуществ алгоритма AES можно считать то, что каждый шаг алгоритмасостоит из нескольких операций, которые могут выполняться одновременно,что облегчает создание высокоскоростных его реализаций.Предполагается реализация AES при использовании нескольких технологий высокопроизводительныхвычислений на GPU: CUDA, OpenCL.Сам термин GPU(Graphics Processing Unit) был впервые использован корпорациейNvidia для обозначения того, что графический ускоритель, первоначально используемыйтолько для ускорения трехмерной графики, стал мощным программируемымустройством, пригодным для решения широкого класса задач, никак не связанных сграфикой.GPU выступает в роли массивно-параллельного сопроцессора к CPU. Программана CUDA, OpenCL задействует как CPU, так и GPU. При этом обычный (последовательный)код выполняется на CPU, а для параллельных вычислений соответствующийкод выполняется на GPU как набор одновременно выполняющихся нитей.Соответственно стандартная программа для GPU выглядит так:1. Выделяем память на GPU.2. Копируем данные из памяти CPU в выделенную память GPU.3. Осуществляем запуск ядра (или последовательно запускаем несколько ядер) -функций, которые будут параллельно исполняться каждой нитью.4. Копируем результаты вычислений обратно в память CPU.5. Освобождаем выделенную память на GPU.Литература1. Фергюсон Н., Шнайер Б. Практическая криптография / пер. с англ. — М.: ИД«Вильмс», 2005. — 424 с.2. Боресков А.В., Харламов А.А. Основы работы с технологией CUDA. — М.: ДМК-Пресс, 2011. — 232 с.УДК 004.451.44Ограничение использования ресурса процессора группамипроцессов при иерархическом планировании задач в ОС LinuxВ.А. ДавыдовМосковский физико-технический институт (государственный университет)ООО «Параллелз Рисерч»Благодаря бурному развитию интернет-технологий за последнее десятилетие всебольшую популярность приобретают облачные сервисы, т.е. предоставление ресурсов,таких как хранилища данных и вычислительные мощности, на удаленных серверах,«в облаке». Поскольку предоставить каждому пользователю такого «облака»физическийсервер было бы слишком дорого, а позволить приложениям несколькихпользователей работать на одном сервере — небезопасно, для обеспечения работыоблачных сервисов используют виртуализацию: каждому пользователю предоставляетсявиртуальный сервер, сбой в работе которого не может повлиять на функционированиедругих виртуальных серверов, работающих на том же физическом сервере.


Ограничение использования ресурса процессора группами процессов при иерархическом планированиизадач в ОС Linux 65Наиболее распространенная сегодня, гипервизорная технология виртуализациихотя и не налагает практически никаких ограничений на тип гостевой ОС, не являетсяоптимальной, когда необходимо максимизировать эффективность физическогосервера, потому что требует загрузки в память образа и данных каждой гостевойОС. Альтернативой гипервизорной является контейнерная виртуализация [1], являющаясялогическим продолжением контейнеров ресурсов [2], суть которых заключаетсяв распределении ресурсов не между процессами, как это обычно имеет место вбольшинстве ОС, а между группами процессов. Виртуальный сервер в контейнернойвиртуализации — это набор контейнеров для каждого из ресурсов, предоставляемыхОС. Несмотря на то, что контейнерная виртуализация налагает жесткие ограниченияна тип гостевой ОС — ее ядро должно совпадать с ядром ОС физического сервера, —она позволяет значительно увеличить емкость физического сервера по сравнению сгипервизорной виртуализацией.Одним из важнейших ресурсов в вычислительных системах является ресурс процессора.Традиционно единицей планирования в большинстве ОС является процессили нить исполнения. Однако в связи с наметившейся тенденцией к контейнернойвиртуализации начинают появляться средства группового планирования процессов.Так, в версии 2.6.24 ОС Linux появились иерархический планировщик и возможностьгруппировать процессы [3], [4] что предоставило базовый набор средств дляорганизации контейнерной виртуализации в этой ОС. Новый планировщик позволилпланировать группы процессов, предоставляя каждой группе процессорное времяпропорционально ее приоритету. Однако в нем отсутствовала возможность жесткоограничивать потребление процессорного времени той или иной группой. Между темтакая возможность является востребованной [5], например, когда необходимо зарезервироватьпроцессорное время для критического по времени приложения, ограничивпри этом остальные приложения. Также она необходима провайдерам облачныхуслуг для ограничения доступа к ресурсам в зависимости от платы (pay-per-use).В рамках данной работы реализована возможность ограничения потребления процессорноговремени группами процессов на мультипроцессорных системах для иерархическогопланировщика процессов ОС Linux.Литература1. Soltesz S., Potzl H., Fiuczynski M.E., Bavier A., Peterson L. Container-basedOperating System Virtualization: A Scalable, High-performance Alternative toHypervisors // Proceedings of EuroSys 2007. – 2007. – P. 275–288.2. Banga G., Druschel P., Mogul J.C. Resource Containers: A New Facility for ResourceManagement in Server Systems // Proceedings of the 3rd Symposium on OperatingSystems Design and Implementation. – 1999. – P. 45–58.3. Eckermann M.G., Tobey B. Effective Linux Resource Management. – URL:http://www.novell.com/connectionmagazine/2010/09/effective_linux_resource_management.html4. Kumar A. Multiprocessing with the Completely Fair Scheduler. – URL: http://www.ibm.com/developerworks/linux/library/l-cfs/5. Rao B.B. CPU hard limits. – URL: https://lkml.org/lkml/2009/6/4/24


66 А.А ТемниковаУДК 519.63Расчет взаимодействия упругой волны с пористой средойА.А ТемниковаМосковский физико-технический институт (государственный университет)С ростом уровня жизни и запросов современного общества возникает необходимостьв развитии и расширении производства, что неотвратимо влечет за собой необходимостьв добыче в значительных объемах таких ресурсов, как нефть и газ. Именноэтот факт увеличивает значимость сейсморазведки. Однако количество неисследованныхи неоткрытых месторождений этих ресурсов в слоистых средах вблизи поверхностиземли стремительно уменьшается, что требует разработки новых видовисточников и новых способов их поиска. Большой интерес в связи с этой задачейпредставляет собой трещиновато-кавернозные резервуары. Это зоны скопления микропустот,в большей или меньшей степени связанные сетью микротрещин и трещин[1]. Если размеры микропустот колеблются от долей миллиметра до десятков сантиметров,то зоны их скоплений характеризуются существенно большими размерами:от первых сотен метров до километра и более. При этом распределение в пространствемикрокаверн носит незакономерный характер, а их концентрация неравномерна.В настоящее время численные эксперименты являются одним из самых перспективныхи надежных способов исследования свойств пород. Компьютерное моделированиесреды и получение картины распространения волн в ней позволяют установитьстепень ее однородности и, в случае наличия полостей, их параметров и характеристиксодержащихся в них веществ. Подробнее об этом в [2]. В основе доклада лежитработа [3]. В данной работе представлена двумерная модель пористой среды, в которойразмер каверн порядка десятых долей миллиметра. Такие области характерныдля некоторых газонасыщенных пород, для глубинных пластов, для которых наиболеехарактерным заполнителем является гидрат, а также для илистого дна мелководныхакваторий. Для описания свойств среды была использована модель идеальногоизотропного линейно-упругого материала. Различаются два сорта пористых пород:газонасыщенные и флюидонасыщенные. В данной работе отдельно исследуются обавида. Для изучения свойств пористой среды исследуется ее взаимодействие с упругойволной (рис. 1). Часть волны отражается от скопления каверн, причем коэффициентотражения в значительной степени зависит от пористости и типа заполнителя. Приэтом прошедшая волна постепенно затухает. Коэффициент затухания и его зависимостьот содержимого пор и степени пористости также является объектом интересав данной работе.Рис. 1. Взаимодействие упругой волны с пористой средой. Волновая картина в различныемоменты времениЛитература1. Челноков Ф.Б. Численное моделирование деформационных динамических процессовв средах со сложной структурой: дис. канд. физ.-матем. наук.


Определение состояний гонки в языке программирования Go 672. Левянт В.Б., Петров И.Б., Челноков Ф.Б. Кластерная природа отклика сейсмическойэнергии, рассеянной от зоны диффузной кавернозности и трещиноватостив массивных породах // Геофизика. — 2005. — № 6. — С. 5–19.3. Темникова А.А. Расчет взаимодействия упругой волны с пористой средой: выпускнаяквалификационная работа на соискание степени бакалавра физикоматематическихнаук. — в печати.УДК 004.4’233Определение состояний гонки в языке программирования GoМ.Н. Пименов 1,2 , Т.Р. Исходжанов 1,2 , Д.С. Вьюков 21 Московский физико-технический институт (государственный университет)2 GoogleВ 2007 компания Google начала разрабатывать новый язык программированияGo [1]. Одной из ключевых особенностей языка является то, как в нём реализованаподдержка параллельного программирования (англ. concurrent programming). АвторыGo принимают в качестве основной парадигмы несколько измененную модельвзаимодействующих последовательных процессов [2], предложенную Ч. Хоаром , чтопозволяет достичь высокой производительности параллельных программ.Параллельное программирование — это довольно сложная область деятельности,а потому ошибки неизбежны. Их обнаружение (и соответственно исправление) затрудненотем, что они могут появляться и исчезать в зависимости от того, в какомпорядке различные параллельные процессы получали доступ к общим ресурсам, ипорядок этот может меняться от одного запуска к другому.Одним из наиболее распространённых и опасных типов ошибок в параллельныхпрограммах является так называемое состояние гонки (data race), автоматизированномупоиску которых в программах на языке Go и посвящена данная работа. Мыбудем использовать следующее определение: состоянием гонки называется ситуация,при которой два или более потока обращаются к одной и той же переменной одновременно,причём хотя бы один из потоков осуществляет запись. Понятие одновременностиобсуждается в статьях [3], [4].Существует множество инструментов, автоматизирующих поиск состояний гонкив параллельных программах, написанных на других языках программирования.Одним из них является ThreadSanitizer [4], который мы и используем в качестве вспомогательнойпрограммы. Мы изменили код компилятора Go таким образом, чтобыпри каждом обращении памяти в программе порождалось сообщение об этом обращениив доступном для ThreadSanitizer формате. Во время исполнения подключаемыепрограммные библиотеки (также изменённые нами) порождают сообщения обиспользовании механизмов синхронизации. Полученные сообщения обрабатываютсяс помощью ThreadSanitizer, и на их основе инструмент делает вывод о присутствиисостояния гонки в исполненном коде.Мы также описываем тонкости реализации перехвата тех или иных операций вязыке Go с целью порождения вышеупомянутых сообщений и результаты проверкинекоторых типичных правильных и неправильных параллельных программ.Литература1. Язык программирования Go. — http://golang.org.2. Хоар Ч. Взаимодействующие последовательные процессы / пер. с англ. — М.:Мир, 1989. — 264 с.


68 Д.И. Петров, П.О. Тихомиров3. Lamport L. Time, Clocks and the Ordering of Events in a Distributed System //Communications of the ACM. — 1978. — V. 21, N 7. — P. 558–565.4. Serebryany K., Iskhodzhanov T. ThreadSanitizer: data race detection in practice// WBIA’09 «Proceedings of the Workshop on Binary Instrumentation andApplications». — 2009. — P. 62–71.УДК 004.056.2Разработка прототипа программно-аппаратной системыбыстрого реагирования автоматизированного сбораи публикации информации от разнообразных датчиковв Internet и децентрализованных сетей ZigBeeдля последующего резервирования данныхД.И. Петров, П.О. ТихомировМосковский физико-технический институт (государственный университет)Задача поддержания целостности данных на физическом уровне имеет первостепенноезначение для современных бизнес-систем. Как показывает статистика, отсутствиесистемы быстрого реагирования на форс-мажорные обстоятельства, как-то:пожары, злой умысел, резкое изменение микроклимата — влечёт за собой значительныеубытки.Существующие на данный момент системы не в полной мере обеспечивают предупреждениеподобных ситуаций.Предлагается комбинированный метод защиты дата-центров, основанный на децентрализованнойсети разнообразных датчиков, оповещающих серверы резервногокопирования в режиме реального времени. Система позволит защитить данные, резервируяих на внешние серверы, при выявлении критических значений определенныхфакторов.В данной схеме можно выделить пять компонент.1. Система датчиков для обнаружения потенциальной опасности.2. Защищаемые серверы баз данных.3. Модуль коммуникации системы датчиков с серверами баз данных и серверамирезервного копирования.4. Серверы резервного копирования.5. Программные решения для оперативного реагирования на поступившую отдатчиков информацию и резервного копирования.Важным свойством реализации системы является её масштабируемость:устанавливаются только те датчики, которые необходимы. Если понадобятся другиедатчики в будущем, можно легко добавить их в готовую систему.Принципиально предлагается использовать два способа коммуникации.1. Беспроводные сети, использующие семейство протоколов ZigBee. Основная задачаэтого варианта — получить возможность свободно размещать датчики и иметьк ним защищенный удаленный доступ. При этом использование модулей беспроводнойсвязи Xbee накладывает повышенные требования к шифрованию сети с цельюпредотвращения вмешательства извне.2. Публикация данных датчиков на сервере, используя Internet, и отправка оповещенийпо почте, на телефон и тому подобное. Этот подход даст решение для задачи


Декоррелирующие клеточные преобразования 69масштабируемости. Здесь несколько серверов-подписчиков смогут получать показанияс датчиков и в зависимости от нее координировать свою работу.Литература1. Юров В.И. Assembler: учебник для вузов. — 2-е изд. — СПб.: Питер, 2008.2. Карпов В.Е., Коньков К.А. Основы операционных систем: курс лекций. — М.:ИНТУИТ.РУ, 2005.УДК 004.627Декоррелирующие клеточные преобразованияО.О. ЕвсютинТомский государственный университет систем управления и радиоэлектроникиПод декоррелирующим преобразованием в контексте задачи сжатия цифровыхизображений подразумевается приведение элементов изображения (пикселей) к виду,когда между ними отсутствует пространственная корреляция и наличествует лишьстатистическая.Классическим примером такого преобразования является преобразование Фурье,служащее для представления исходной вещественной функции в виде суммы элементарныхсоставляющих — гармонических функций различных частот, амплитудыкоторых задаются комплексной функцией, называемой фурье-образом. ПреобразованиеФурье рассматривается как переход из пространственной области в частотную,поэтому значения фурье-образа называют частотными составляющими [1].В современных методах сжатия цифровых изображений разложение элементовданных на частотные составляющие осуществляется посредством дискретного косинусногопреобразования и дискретного вейвлетного преобразования.В общем случае декоррелирующие преобразования строятся на основе некоторогобазиса, и это позволяет говорить о возможности построения базисов декоррелирующихпреобразований на основе нового математического аппарата, такого, как теорияклеточных автоматов [2].Классический клеточный автомат представляет собой совокупность компонентCA = ⟨Z n , (N 1 , ..., N n ), A, Y, σ⟩,где Z n — это n-мерное пространство целочисленных координат клеток решетки;(N 1 , ..., N n ) — вектор, задающий размеры решетки; A — конечное множество значенийотдельно взятой клетки, называемое алфавитом внутренних состояний и обычнопредставляющее собой некоторый отрезок ряда неотрицательных целых чисел; Y —окрестность, в свою очередь представляющая собой вектор-строку длины l относительныхиндексов и определяющая одинаковые для каждой клетки количество и порядокрасположения соседей, то есть тех клеток, текущие значения которых влияютна значение данной клетки в следующий момент времени; σ — локальная функцияперехода, одновременное применение которой ко всем клеткам решетки определяетдинамику клеточного автомата [3].Построение базиса декоррелирующего преобразования из состояний развитияклеточного автомата осуществляется следующим образом: задается начальное состояниерешетки автомата и выбирается нужное количество состояний из соответствующейистории развития, после чего значения клеток решетки заменяются коэффициентамииз заранее определенного множества.


70 А.В. ТретьяковИспользование базиса, построенного из состояний развития клеточного автомата,в качестве основы декоррелирующего преобразования подразумевает наличие уданного базиса свойства ортогональности, а также способности разделять преобразуемыеэлементы данных на частотные составляющие. Первое условие должно бытьдостигнуто на этапе построения базиса, в то время как для подтверждения второго,а также для сравнения между собой отдельно взятых базисов с точки зренияхарактеристик сжатия необходим экспериментальный путь.Дальнейшее исследование включает в себя вопросы построения базисов декоррелирующихпреобразований с использованием различных множеств коэффициентов,построения базисов, приближенных к ортогональным, и исследования возможностиих использования в рамках задачи сжатия цифровых изображений.Литература1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. – М.: Техносфера, 2005.2. Евсютин О.О., Росошек С.К. Использование клеточных автоматов для решениязадач преобразования информации // Доклады Томского государственного университетасистем управления и радиоэлектроники. — 2010. — № 1(21). — Ч. 1. —С. 173–174.3. Аладьев В.З., Бойко В.К., Ровба Е.А. Классические однородные структуры. Теорияи приложения. — Гродно: ГрГУ, 2008.УДК 004.4’24Автоматизация составления расписаний для системреального времениА.В. ТретьяковМосковский физико-технический институт (государственный университет)Институт системного программирования РАНВ качестве целевой системы реального времени [1], [2] в работе рассматриваетсябортовая система автоматического управления самолётом, поскольку для решаемыхею задач (измерение микроклиматических условий окружающей среды, автомат тяги,автопилот, управление подкрылками самолёта и т.п.) является критичным, чтобыони выполнялись в заданные временные рамки. В авионике эти операционныесистемы, работающие по стандарту ARINC 653 [3], играют ключевую роль в решениипроблемы распределения ресурсов (в первую очередь процессорного времени).В таких системах задачи (процессы) запускаются планировщиком строго по заранеесоставленному расписанию. Для больших систем составление такого расписанияпредставляет существенную сложность. Для решения этой проблемы был разработанинструмент, используемый в авионике, который решает эту задачу точно, либоавтоматизирует процесс составления оптимального расписания, сведя ручное вмешательствок минимуму.К системе, которая рассматривается в этой работе, предъявляются следующиетребования:— несколько процессов периодически запускаются на одном процессоре;— каждый процесс может быть прерван в любой момент времени;— каждый процесс должен запускаться со строго заданным периодом;— суммарное время работы процесса в каждом периоде фиксировано;— каждый процесс должен завершаться до запуска своей следующей итерации, откудаследует, что выбранная система является системой реального времени;


Автоматизация составления расписаний для систем реального времени 71— в построенном расписании число прерываний задач должно быть минимальным.Относительный сдвиг по времени между первыми итерациями процессов не фиксирован,и его, в частности, должен определить алгоритм построения расписаний.Однако не для любого набора процессов возможно построить расписание. В работедоказываются некоторые необходимые условия его существования. Если хотябы одно из них нарушается, инструмент выдаёт соответствующее сообщение.Можно показать, что из-за требования строгой периодичности запуска процессовзадача построения расписания с минимальным числом прерываний является NPтрудной(к ней сводятся NP-трудные задачи, рассмотренные в [4] и [5]). Алгоритм,решающий задачу точно, использует метод ограниченного перебора и годится толькодля небольших систем с небольшим числом процессов (рис. 1). Поэтому был выбрандругой подход.Для больших систем, когда алгоритм работает очень долго, разработанный механизмвремя от времени выводит промежуточные, но не оптимальные результаты(т.е. корректные расписания, но число прерываний может быть не минимальным) вграфическом виде. И в тот момент, когда ответственному персоналу покажется, чтополученное расписание уже приемлемо или его легко довести до оптимального, онможет остановить работу алгоритма и сохранить промежуточный результат.Поскольку промежуточное расписание может быть неоптимальным, то предоставляетсявозможность ручного редактирования расписания (добавление, удалениеили изменение фрагментов непрерывной работы процесса).Так как при ручном редактировании расписания может быть допущена ошибка,инструмент позволяет найти её, проверив корректность окончательного вариантарасписания — соответствие заданным значениям периодов старта процессов и длительностиих выполнения.Работа выполнена в ИСП РАН при сотрудничестве с ГосНИИАС.Рис. 1. Графическое представление расписания. Периодические процессы, работающиена отдельных и на одном общем процессореЛитература1. Mohammadi A.G., Akl S.G. Scheduling Algorithms for Real-Time Systems. –Technical Report N 2005–499. — School of Computing, Queen’s University, 2005.2. Сорокин С. Системы Реального Времени // СТА. — 1997. — N 2. — С. 22–29.3. Операционные системы реального времени для авионики: обзор.underline(http://rnd.cnews.ru/reviews/index_science.shtml?2008/05/05/299461_1).4. Leung J.Y.-T., Merrill M.L. A Note on Preemptive Scheduling of Periodic, Real-TimeTasks // Information Processing Letters. — 1980. — V. 11, N 3. — P. 115–118.5. Georges L., Muhlethaler P., Rivierre N. A Few Results on Non-Preemptive Real timeScheduling // Rapport de recherche. — 2000. — N 3926.


72 Д.А. Подлесных, А.И. ФедорчукУДК 004.272.23Cистема быстрого развёртывания и тестирования GPUкластераД.А. Подлесных, А.И. ФедорчукМосковский физико-технический институт (государственный университет)В настоящее время активно развиваются вычисления на графических картах. Этопроисходит благодаря тому, что видеоадаптеры, поддерживающие OpenCL, работаютв большинстве современных компьютеров, а по соотношению производительности кэнергопотреблению GPU являются зачастую более экономичными, чем центральныепроцессоры [1].К сожалению, быстро не только проверить работоспособность, но и оценить производительностьвидеокарты при покупке компьютера сложно. Типичные тестовыепрограммы, например, memtest, рассчитаны на центральный процессор и его память.LiveCD редко комплектуются проприетарными драйверами NVidia, необходимымидля поддержки CUDA. Для запуска простейших тестов на производительность процессоратребуется с нуля устанавливать и настраивать операционную систему [2].В связи с этим возникает задача: создать загрузочный образ USB Flash, позволяющийне только протестировать работу видеоадаптера при вычислениях, но и запуститьпростейшие тесты производительности, чтобы появилась возможность сразуоценить производительность узла ещё до сборки кластера [3].В качестве основы был взят дистрибутив Arch Linux — один из наиболее популярныхв настоящее время. К его достоинствам приписывают простоту в использовании,а также скорость и стабильность работы. Систему, основанную на этомдистрибутиве, можно легко модифицировать и подстраивать для использования вконкретных целях (от рабочей станции до разнообразных серверов). Если же такуюсистему установить без привязки к конкретному аппаратному обеспечению нанебольшой переносной носитель, то можно также получить Live-сборку. Настройкасборок для тестирования и восстановления «железа», разработки(в том числе и дляGPU), и «переносного кабинета» имеют непринципиальные отличия. В таком контекстеданные сборки можно обьединить в одну, которая будет удовлетворять сразунескольким требованиям.Драйверы для видеадаптеров от всех производителей практически невозможносочетать в одной сборке. В связи с этим сделать одну сборку для всех устройствне представляется возможным, но использовать одну c драйверами, имеющими открытыйкод, для большинства графических ускорителей и другую, использующуюпроприетарные драйвера от компании Nvidia, необходимые для корректной работыпрограмм основанных на CUDA, получилось.Были созданы 2 сборки. Одна из них использует набор свободных драйверов длявидеоадаптеров различных производителей и библиотеки OpenCL реализации компанииAMD, которая работает на практически любом компьютере. Вторая же болееспецифичная и собрана на проприетарных драйверах от компании Nvidia, а такжевключает в себя пакет Nvidia Cuda Toolkit, что позволяет пользователю оптимальноработать с видеоадаптерами от компании Nvidia.В обе сборки включён набор утилит для тестирования возможностей, работоспособностии производительности компьютера, менеджер рабочего стола Gnome 3, набормультимедийных приложений, текстовый процессор OpenOffice, кроссплатформеннаясреда для разработки приложений QtCreator. Этот комплект позволяет сразуобработать полученнные результаты.


Cистема быстрого развёртывания и тестирования GPU кластера 73В качестве тестового пакета выбран классический High Perfomance Linpack, покоторому составляются авторитетные международные рейтинги, в частности, Top500[4].В одном случае он был собран с поддержкой CUDA, в другом — HPL-GPU длякарт ATI.Сборки тестировались на компьютерах отдела вычислительной техники МФТИ,а также ноутбуках студентов и сотрудников. Возможно их применение для выполнениястудентами домашних заданий по курсам, связанным с Linux (3 семестр) ипрограммированием на GPU, а в перспективе — загрузка на группе компьютеровчерез PXE и формирование из них кластера.Литература1. Быстрый Р.Г. Тестирование гибридных вычислительных систем для примененияметодов молекулярной динамики // <strong>Труды</strong> 52-й научной конференции МФТИ«Современные проблемы фундаментальных и прикладных наук». — М., 2009. —С. 18–20.2. Карпов В.Е., Лобанов А.И., Подлесных Д.А. Сравнительные характеристики кластеровна базе процессоров Xeon и Istanbul для реальной вычислительной задачи// Материалы 9-й международной конференции-семинара «Высокопроизводительныевычисления на кластерных системах». — Владимир, 2009. — С. 208–209.3. Алексеенко А.Е., Казённов А.М., Подлесных Д.А., Цыбулин И.В. Создание вычислительногокластера на основе видеокарт NVidia Tesla // Информационныетехнологии: модели и методы: cборник научных трудов. — М.: МФТИ, 2010. —С. 162–167.4. Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. — СПб.: БХВ-Петербург, 2002. — С. 162–167.


74 А.В. СеливерстовСекция предсказательного моделированияи оптимизацииУДК 519.146Об оптимизации на множестве вершин многомерного кубаА.В. СеливерстовИнститут проблем передачи информации им. А.А. Харкевича РАНОптимизация многочлена второй степени на кубе является, вообще говоря, алгоритмическитрудной задачей. Эффективные алгоритмы, например метод псевдобулевапрограммирования [1], применимы лишь в частных случаях. Интересно найтиограничения на взаимное расположение оптимальных вершин куба. Напомним, чтодля многочленов второй степени, имеющих достаточно много членов, доля вершинкуба, в которых этот многочлен принимает фиксированное значение, стремится кнулю с ростом размерности куба [2]. Новые результаты показывают, что вершины,где достигается оптимум, не могут образовать слишком рыхлую конфигурацию.Рассмотрим n-мерный вещественный куб, координаты вершин которого равнынулю или единице. Вес вершины куба равен числу её координат, равных единице.Параллелепипед меньшей размерности вложен в куб, если каждая вершина параллелепипедаявляется вершиной куба. Квадрикой называется множество нулей многочленавторой степени, может быть приводимого. Квадрика f = 0 называется пустой,если в каждой вершине куба многочлен f принимает неотрицательное значение.Теорема. Дано целое число 2 w n − 1. Если каждая вершина веса 0 илиw лежит на пустой квадрике, то все остальные вершины n-мерного куба такжележат на этой квадрике.На пустой квадрике, заданной уравнением∑︁x i x j = 0,лежат все вершины веса 0 или 1 и только они. На пустой квадрикеi>jn ·(︃n∑︁n∑︁)︃ 2(x i ) 2 − x i = 0i=1i=1лежат антиподальные вершины веса и и только они. Поэтому границы для веса втеореме нельзя улучшить. Теорема верна также при ограничении на любой параллелепипед,вложенный в куб, если вес каждой вершины определять относительнопараллелепипеда, то есть в координатах, связанных с его рёбрами.Литература1. Береснев В.Л. Дискретные задачи размещения и полиномы от булевых переменных.— Новосибирск: Издательство института математики, 2005. — 408 с.


Задача консолидации разноточных данных 752. Costello K.P., Vu V.H. The rank of random graphs // Random Structures andAlgorithms. — 2008. — V. 33, N 3. — P. 269–285.УДК 519+651Задача консолидации разноточных данныхА.А Зайцев 1,3 , Е.В. Бурнаев 1,2,3 , Е.Р. Капушев 11 Московский физико-технический институт (государственный университет)2 Институт проблем передачи информации им. А.А. Харкевича РАН3 DatadvanceРассматривается задача консолидации разноточных данных. Регрессионная модельy(x) — отображение из пространства входных переменных x ∈ R m в пространствоy ∈ R. Известны грубое f c (x) и точное f f (x) приближения истинной моделиy(x). Задана выборка значений грубой модели D c = {f c (x i ), x i } nci=1 и точной моделиD f = {f f (x j ), x j } n fj=1 . При этом n f


76 М.Е. Панов, Е.В. Бурнаев, И.А. КоноваленкоУДК 519.651Сравнительный обзор методов адаптивного планированияэксперимента для построения аппроксимацииМ.Е. Панов 1,2,3 , Е.В. Бурнаев 1,2,3 , И.А. Коноваленко 31 Институт проблем передачи информации им. А.А. Харкевича РАН2 Datadvance3 Московский физико-технический институт (государственный университет)В работе рассматривается задача восстановления регрессии. Пусть y = f(x) —некоторая неизвестная функция со входом x ∈ X ⊂ R n и выходом y ∈ R. ПустьD = (︀ X, Y )︀ = {︀(︀ x i , y i = f(x i ) )︀ , i = 1, . . . , N }︀ — обучающая выборка. Задача состоитв построении аппроксимации ˆy = ˆf(x) = ˆf(x|D) для исходной зависимости y = f(x)по обучающей выборке D. Если предположить, что рассматриваемая функция f(x)является реализацией гауссовского процесса с нулевым математическим ожиданиеми известной ковариационной функцией K(x, x ′ ), то для такого процесса можноподсчитать оценку апостериорного среднего ˆf(x|D) и дисперсии ˆσ 2 (x|X) [1], которыеиспользуются для прогноза неизвестного значения и оценки точности этого прогноза.Во многих инженерных задачах количество вычислений целевой функции f(x)существенно ограничено по причине очень большого времени, требуемого для одноговычисления, и/или его высокой стоимости. В связи с этим крайне важной являетсязадача построения методов выбора обучающей выборки D ограниченного объема Nтаким образом, чтобы максимизировать качество аппроксимации [2].Одним из наиболее популярных в литературе подходов является метод адаптивногопланирования эксперимента [2], общая схема которого представлена ниже.1. Строим начальную выборку D.2. Строим аппроксимацию ˆf(x|D).3. Если мы добились требуемого качества аппроксимации или исчерпали количестводопустимых вычислении целевой функции, то останавливаемся, иначе переходимк шагу 4.4. Получаем новые точки, используя D, ˆf(x|D) и ˆσ 2 (x|X):X new = g(D, ˆf(x|D), ˆσ 2 (x|X)),где g — некоторый метод адаптивного планирования эксперимента, X new — множествоточек, которые добавляются в обучающую выборку на текущем шаге.5. D = D ∪ D new , где D new = (︀ X new , Y new)︀={︀(︀x ∈ Xnew , y = f(x) )︀}︀ .6. Возвращаемся к шагу 2.В работе сравнивается несколько способов адаптивного планирования эксперимента:– Выбор точки с максимальной неопределенностью предсказания:X new = arg maxx∈X ˆσ2 (x|X);– Выбор точки, обеспечивающей∫︀минимальную среднюю дисперсию предсказания:X new = arg maxx∈Xv∈X ˆσ2 (v|X ∪ x);– Выбор точки, максимизирующей минимальное расстояние между точками в обучающейвыборке: X new = arg max min d(v, w), где d(v, w) — расстояние междуx∈X w≠v∈X∪xточками v и w в некоторой метрике.Для сравнения рассматриваемых методов используется большой объем реальныхи модельных данных.


О способах введения расстояния при моделированиии ковариационной функции гауссовскогопроцесса 77Литература1. Rasmussen C.E., Williams C.K.I. Gaussian Processes for Machine Learning. — TheMIT Press, 2006.2. Chen R.J.W., Sudjianto A. On sequential sampling for global metamodeling inengineering design // Proceedings of DETC’02: ASME 2002. — Design EngineeringTechnical Conferences And Computers and Information in Engineering ConferenceMontreal, Canada. — September 29–October 2, 2002.УДК 519.651О способах введения расстояния при моделированиииковариационной функции гауссовского процессаМ.Е. Панов 1,2,3 , А.А. Зайцев 2,31 Институт проблем передачи информации им. А.А. Харкевича РАН2 Московский физико-технический институт (государственный университет)3 DatadvanceВ работе рассматривается задача восстановления регрессии. Пусть y = f(x) —некоторая неизвестная функция со входом x ∈ X ⊂ R n и выходом y ∈ R. ПустьD = (︀ X, Y )︀ = {︀(︀ x i , y i = f(x i ) )︀ , i = 1, . . . , N }︀ — обучающая выборка. Задача состоитв построении аппроксимации ˆy = ˆf(x) = ˆf(x|D) для исходной зависимости y = f(x)по обучающей выборке D. Если предположить, что рассматриваемая функция f(x)является реализацией гауссовского процесса с нулевым математическим ожиданиеми известной ковариационной функцией K(x, x ′ ), то для такого процесса можноподсчитать оценку апостериорного среднего ˆf(x|D) и дисперсии ˆσ 2 (x|X) [1], которыеиспользуются для прогноза неизвестного значения и оценки точности этого прогноза.Для моделирования ковариационной функции используется экспоненциальное семейство:K(x, x ′ ) = σ 2 exp(−d(x, x ′ )), где d(x, x ′ ) — расстояние между точками xи x ′ , σ ∈ R. Заметим, что в регрессии на основе гауссовских процессов формуладля аппроксиматора может быть представлена следующим образом [1]: ˆf(x) == ∑︀ Ni=1 α iK(x, x i ), где α i ∈ R, i = 1, ..., N. Таким образом, выбор расстояния, используемогов ковариационной функции, непосредственно влияет на вид аппроксимации.В работе рассматриваются несколько различных способов введения расстояния, основанныхна обобщении понятия евклидова расстояния:– Евклидово расстояние с масштабирующим коэффициентом: d(x, x ′ ) = a ∑︀ 2 ni=1 (x i−−x ′ i) 2 , где a ∈ R;– Взвешенное евклидово расстояние: d(x, x ′ ) = ∑︀ ni=1 a2 i (x i − x ′ i) 2 , где a i ∈ R, i == 1, . . . , n;– Расстояние Махалонобиса [2]: d(x, x ′ ) = (x i − x ′ i) T A(x − x ′ ), где A ∈ R n×n — некотораяположительно определенная матрица.Для случая расстояния Махалонобиса введена специальная параметризация ковариационнойфункции, которая позволяет получать более точные результаты приобучении. Также в работе рассмотрены способы введения байесовской регуляризациина параметры ковариационных функций, которые позволяют увеличить качество иустойчивость аппроксимации [3]. Для сравнения рассматриваемых методов используетсябольшой объем реальных и модельных данных.


78 М.Г. Беляев, А.Д. Любин, Е.В. БурнаевЛитература1. Rasmussen C.E., Williams C.K.I. Gaussian Processes for Machine Learning. — TheMIT Press, 2006.2. Mahalanobis P.C. On the generalised distance in statistics // Proceedings of theNational Institute of Sciences of India. — 1936.— P. 49–55.3. Панов М.Е., Бурнаев Е.В., Зайцев А.А. О способах введения байесовской регуляризациив регрессии на основе гауссовских процессов // Доклады 15-й Всероссийскойконференции «Математические методы распознавания образов». —Петрозаводск, 2011.УДК 519+651Методика формирования функционального словаря в задачеаппроксимации многомерной зависимостиМ.Г. Беляев, А.Д. Любин, Е.В. Бурнаев1 Московский физико-технический институт (государственный университет)2 Институт проблем передачи информации им. А.А. Харкевича РАН3 DatadvanceЗадача построения аппроксимации неизвестной зависимости получила достаточноширокое распространение, в частности, ее решение активно используется в метамоделировании[1]. Наиболее типичные методы, которые используются для решениязадачи аппроксимации, — это линейная регрессия, однослойная нейронная сеть, радиальныебазисные функции [2]. Все эти методы основываются на разложении:p∑︁f (X, Θ) = α i ψ i (X, Θ) + α 0i=1искомой функции по словарю {ψ i (X, Θ)} p i=1 в общем случае нелинейных функций,где {ψ i (X, Θ)} p i=1 и определяет тип аппроксиматора (линейная регрессия, нейроннаясеть и т.д.).В данной работе рассматривается построение аппроксиматора с помощью разложенияпо словарю параметрических функций {ψ i (X, Θ)} p i=1 разного типа.Очевидно, что состав оптимального набора функций разного типа значительнозависит от свойств решаемой задачи. Поэтому в данной работе предложен метод выбораоптимального подмножества из словаря нелинейных параметрических функцийразного типа, который позволил бы получить более высокое качество приближения,чем аппроксиматоры на основе функций только одного типа.Обычно для оценки весовых коэффициентов при базисных функциях {α i } p i=0 используетсяметод наименьших квадратов, минимизирующий сумму квадратов невязок.Для борьбы с переобучением в функционал Q (X, Θ) вводят добавку в видештрафа на весовые коэффициенты, решая задачу гребневой регрессии:N∑︁p∑︁Q(X, Θ) ridge = (Y i − f(X i , Θ)) 2 + λ αi 2 .i=1Выбор λ часто производится согласно критерию обобщенной кросс-проверки [2]. Впредложенном методе отбора регрессоров предлагается ввести независимые значения{λ i } p i=0 для каждого весового коэффициента:N∑︁p∑︁Q(X, Θ) localRidge = (Y i − f(X i , Θ)) 2 + λ i αi 2 .i=1i=0i=0


Сглаживание сплайнов с натяжением 79В таком виде предлагается минимизировать критерий обобщенной кросс-проверкидля каждого λ i в отдельности и на основе полученных значений λ i производить отборрегрессоров, удаляя регрессоры с большими значениями λ i .В работе получены формулы явной минимизации критерия обобщенной кросспроверкипо параметрам {λ i } p i=0 , проведены тесты на реальных и искусственныхданных. Сравнение с существующими методами отбора регрессоров, такими как регрессияметодом включения-исключения, жадные алгоритмы набора регрессоров покорреляции с невязками, LASSO-регрессия, показало хорошие результаты для разработанногоалгоритма, робастность на выборках большой размерности и возможностьработы с базисными функциями различной природы.Литература1. Forrester A., Sobester A., Keane A. Engineering Design via Surrogate Modelling. APractical Guide. — New Yjrk: Wiley, 2008. — 238 p.2. Hastie T., Tibshirani R., Friedman J. The elements of statistical learning: data mining,inference, and prediction. — Berlin: Springer, 2008. — 763 p.УДК 519.651Сглаживание сплайнов с натяжениемЕ.А. Крымова, Е.В. БурнаевИнститут проблем передачи информации им. А.А. Харкевича РАНDatadvanceРассматривается задача аппроксимации одномерной функции, заданной значениямина дискретном множестве точек x 1 . . . , x n . Известно, что для задачи одномернойинтерполяции метод сплайнов с натяжением [1] позволяет избежать эффектаГиббса (осцилляции приближения вблизи точки особенности функции), которыйприсущ классическим сплайнам. Необходимо обобщить метод сплайнов с натяжениемдля задачи аппроксимации.Сплайны с натяжением определяются из решения следующей вариационной задачи.S(x) = argming:g(x i )=f(x i )∑︁[︂ ∫︁ xk+1[g ′′ (x)] 2 dx + σk2kx k∫︁ xk+1x k]︂[g ′ (x)] 2 dx .Если значения σk 2 , k = 1, . . . , n − 1, равны нулю, то S(x) является кубическимсплайном, а если все σk 2 , k = 1, . . . , n − 1, велики, то S(x) приближается к линейномусплайну.Одним из способов обобщения сплайнов с натяжением на случай аппроксимацииявляется решение соответствующей вариационной задачи с использованием локальногоприближения сплайнов с натяжением [2]. Этот способ приводит к блочнотрехдиагональнойсистеме, из которой методом прогонки находятся значения приближенияи производной приближения в исходных точках x i , i = 1, . . . , n. Однакорешение системы осложнено тем, что для его устойчивости необходимо диагональноедоминирование матрицы системы, что далеко не всегда выполняется.В данной работе для решения задачи аппроксимации предлагается использоватьсвертку интерполяционных сплайнов с натяжением с ядром Епанечникова. Это ядро


80 М.Г. Беляев, Ю.А. Яновичявляется локально-оптимальным в смысле среднеквадратичной ошибки [3]. Вычислениезначения аппроксимации в некоторой точке u состоит из суммирования свертокпо пересечениям отрезков [x i , x i+1 ] с областью положительных значений ядра[u−h, u+h], где h — ширина ядра. Результаты показывают устойчивость вычисленийаппроксимации предложенным методом и эффективность метода для аппроксимациибольших объемов данных (больше 10 тысяч точек).Литература1. Renka R.J. Interpolatory tension splines with automatic selection of tension factors// SIAM J. Sci. STAT. COMPUT. — May 1987. — Vol. 8, N 3. — P. 396–415.2. Pruess S. An Algorithm for Computing Smoothing Splines in Tension. —Computing. — April 1977. — N 19. — P. 365–373.3. Benedetti J.K. On the Nonparametric Estimation of Regression Functions // Journalof the Royal Statistical Society. — 1977. — N 39. — P. 248–253.УДК 519.237.5Сглаживание суррогатных моделейМ.Г. Беляев, Ю.А. ЯновичМосковский физико-технический институт (государственный университет)Институт проблем передачи информации им. А.А. Харкевича РАНDatadvanceВ последние годы стали развиваться математические модели, основанные на данных— результатах натурных и/или вычислительных экспериментов, проведенныхс различными объектами рассматриваемого класса, с минимальным привлечениемзнаний из предметной области (физики процессов) [1]. Такие адаптивные моделииногда называют также метамоделями (модели над моделями) или суррогатнымимоделями (Surrogate Models). Основным методом построения суррогатных моделейявляется метод аппроксимации многомерных зависимостей по обучающей выборкеконечного объема. В работах [2] и [3] предложен универсальный алгоритм построениясуррогатных моделей.Для решения оптимизационных задач с использованием таких моделей методаминенулевого порядка необходимо вычислять градиенты моделей. При этом важно,чтобы модель и ее градиент обладали определенными свойствами «гладкости».К другому видению проблемы приводит то, что большинство рассматриваемых напрактике функций являются зашумленными. Обычно шум вызван многими причинами,например, конечной точностью физических экспериментов или неточностямичисленного моделирования. Алгоритмы построения суррогатных моделей не восстанавливаютточные значения функции в обучающих точках, так как в зависимостиот используемого алгоритма модель является некоторой регуляризованной аппроксимациейисходных данных, отражающей априорные знания о восстанавливаемойзависимости.Задача суррогатного моделирования не сводится к построению наиболее общегоалгоритма аппроксимации, и полезно предоставить возможность управлять «гладкостью»модели. Например, если известно, что исходная зависимость непрерывна,непрерывная суррогатная модель может существенно снизить уровень шума, содержащегосяв данных. Напротив, ввиду присутствия разрывного шума, «универсальная»суррогатная модель, хорошо повторяющая исходные данные, теряет свойстванепрерывности и не отражает поведение физического процесса.


Эффективное снижение размерности на основе аппроксимации гауссовскими процессами 81Существующие методы аппроксимации не позволяют одновременно получить решениедвух взаимосвязанных задач (кроме тривиальных случаев) — гарантироватьи точность модели, и ее «гладкость». Поэтому предложен новый алгоритм построениясглаженных суррогатных моделей. Он гарантирует не только близость исходнойфункции и ее аппроксимации, но и «гладкость» градиента аппроксимации.Разработанный алгоритм предназначен для автоматического построения сглаженныхсуррогатных моделей, которые могут быть использованы для аппроксимациисглаженной (избавленной от шума) зависимости и ее градиента.Литература1. Kuleshov A.P., Bernstein A.V. Cognitive technologies in adaptive models of complexplants // Keynote papers of 13th IFAC Symposium on Information Control Problemsin Manufacturing (INCOM’09). – Moskow, 2009. – P. 70–81.2. Burnaev E.V., Belyaev M.G., Prihodko P.V. Approximation of multidimensionaldependency based on an expansion in parametric functions from the dictionary //Proceedings of 9th International Conference Computer Data Analysis and Modeling:Complex Stochastic Data and Systems. — Minsk, 2010.3. Burnaev E., Belyaev M., Prihodko P. About hybrid algorithm for tuning of parametersin approximation based on linear expansions in parametric functions // Proceedingsof the 8th International conference «Intelligent Information Processing». — Republicof Cyprus, Paphos, 2010.УДК 519.651Эффективное снижение размерности на основеаппроксимации гауссовскими процессамиП.Д. Ерофеев, П.В. ПриходькоИнститут проблем передачи информации им. А.А. Харкевича РАНDatadvanceЗадача аппроксимации многомерных данных широко распространена в различныхвысокотехнологичных и трудоемких отраслях промышленности, таких как самолетостроениеи машиностроение. Сложность решения этой задачи обусловленанесколькими аспектами, среди которых выделяется большая чувствительность алгоритмоваппроксимации к размерности входных данных. Обычно мощность обучающейвыборки, которая используется для оценки параметров модели, сильно ограничена.И в реальной жизни проведение достоверных экспериментов для пополнениявыборки данных является или дорогостоящим, или затратным по времени, или вообщене осуществимым процессом. Поэтому возникает вопрос наиболее эффективногоиспользования имеющихся данных. Более того, сами данные могут иметь некотороесжатое представление, в котором содержится вся информация о регрессии. В такихслучаях применение эффективного снижения размерности является обоснованными иногда позволяет значительно повысить точность и/или снизить время обучениямодели без потери точности.Задача эффективного снижения размерности ставится следующим образом [1].Предположим Y ∈ R m – вектор целевых переменных, а X ∈ R p – вектор регрессоров.Пусть существует условное распределение F Y|X целевых переменных Y при заданномX с условным математическим ожиданием E[Y|X]. Подпространство S ⊂ R p ,


82 П.Д. Ерофеев, П.В. Приходькогде p < d называется пространством сжатой размерности для условного математическогоожидания, если Y ⊥ E[Y |X]|P S X, где P S – некоторая ортогональная проекцияна подпространство S. Если пересечение всех пространств сжатой размерноститакже является пространством сжатой размерности для условного математическогоожидания, то оно называется центральным средним подпространством и обозначаетсяS E[Y|X] . Задача эффективного снижения размерности состоит в отысканиитакой ортогональной матрицы ˜P , что ‖P T S (I − ˜P )‖ → min.Существует множество подходов к решению этой задачи, среди котрых наиболееэффективным оказывается метод, основанный на нахождении пространства собственныхвекторов для градиента математического ожидания аппроксимируемой зависимостив исходном пространстве [2]. Можно показать, что это подпространство вточности совпадает с S E[Y|X] [2]. В данной работе предлагается разновидность описанногоподхода, основанная на аппроксимации исходной зависимости гауссовскимипроцессами [3], и проводится сравнение с другими методами эффективного сниженияразмерности на искусственных модельных данных. Во всех проведенных экспериментахпредложенный алгоритм оказался наиболее эффективным по сравнению с другимиалгоритмами поиска подпространства S E[Y|X] с точки зрения восстановленияматрицы P S и с точки зрения повышения точности регрессии.Литература1. Li K-C. Sliced Inverse Regression for Dimension Reduction // Journal of the AmericanStatistical Association. — 1991. — V. 86. — P. 316–327.2. Wu Qiang, Mukherjee S. Variable selection and dimension reduction by learninggradients // Tech Report, ISDS. — Duke University. — August 2008.3. Бурнаев Е.В. и др. Моделирование нестационарной ковариационной функциигауссовского процесса на основе разложения по словарю базисных функций //Доклады 34-й конференции молодых ученых и специалистов ИППИ РАН. — 2–7октября 2011.УДК 519.651Применение техники эффективного снижения размерностив задаче оптимизации крыла самолетаП.Д. Ерофеев, П.В. ПриходькоИнститут проблем передачи информации им. А.А. Харкевича РАНDatadvanceОдной из задач, возникающих при проектировании самолета, является оптимизацияпрофиля крыла с целью получения конфигурации, обеспечивающей минимальноелобовое сопротивление. Профиль крыла может быть достаточно полно описан60-мерным вектором ординат точек на поверхности (X ∈ R 57 ). Задача заключаетсяв том, чтобы минимизировать коэффициент лобового сопротивления (C d ) при фиксированномчисле Маха (M) и небольшой вариации угла атаки (α) и коэффициентаподъемной силы (C l ):⎧⎪⎨min C d(X, α, M) s.t.X,α⎪⎩C minl C l (X, α, M) C minl ,α min α α min ,X min X X min ,AX b.


Разделимость переменных в оптимизационной задаче при построении аппроксимации 83Здесь C l (X, α, M) и C d (X, α, M) нелинейные функции, заданные в виде “черных ящиков”(CFD кодов), матрица A и вектор b задают дополнительные линейные ограниченияна профиль крыла, связанные с некоторыми естественными соображениями.Ввиду сложности оптимизации в 60-мерном пространстве предлагается предварительноиспользовать методы снижения размерности описания профиля и проводитьминимизацию в пространстве меньшей размерности. Для этого были рассмотреныдва подхода:– линейное снижение размерности на основе метода главных компонент [1];– эффективное снижение размерности [2] на основе аппроксимации гауссовскимипроцессами [3], учитывающее информацию о регрессии E[C L , C d |X].Оба метода предполагают переход к новому вектору ˜X путем домножения исходноговектора на ортогональную матрицу, т.е. ˜X = B T X, и отличаются различнымподходом к получению матрицы B, которая оценивается по некоторой исходной выборке.Эксперименты проводились следующим образом. В качестве выборки для построенияматриц снижения размерности использовалось 206 профилей. Результатыэкспериментов с различными начальными точками для одного и того же алгоритмаоптимизации при использовании различных техник снижения размерности и без нихпоказали:– использование эффективного снижения размерности позволяет повысить качествооптимизации (найти точки с меньшим значением целевой функции C d привыполнении ограничений);– при ограниченном временном ресурсе применение эффективного снижения размерностив среднем приводит к более оптимальному решению.Литература1. Li K-C., Gorban A.N., Balzs K., Wunsch D.C., Zinovyev A. // Principal Manifoldsfor Data Visualization and Dimension Reduction (1st ed.). — Springer PublishingCompany, Incorporated, 2007.2. Wu Qiang, Mukherjee S. Variable selection and dimension reduction by learninggradients // Tech Report, ISDS. — Duke University. — August 2008.3. Бурнаев Е.В., Зайцев А.А., Панов М.Е., Приходько П.В., Янович Ю.А. Моделированиенестационарной ковариационной функции гауссовского процесса на основеразложения по словарю базисных функций // Доклады 34-й конференциимолодых ученых и специалистов ИППИ РАН. — 2–7 октября 2011.УДК 519.651Разделимость переменных в оптимизационной задачепри построении аппроксимацииМ.Г. Беляев, А.Д. ЛюбинИнститут проблем передачи информации им. А.А. Харкевича РАНDatadvanceМосковский физико-технический институт (государственный университет)В рамках данной работы под аппроксимацией подразумевается приближенноевосстановление функции по порожденной ею выборке данных S = {x i , y i }, f (x i ) == y i , i = 1 . . . N. Задача заключается в построении аппроксимации ˆf (x), которая


84 М.Г. Беляев, А.Д. Любинблизка к исходной функции: f (x) ≈ ˆf (x). В качестве меры близости в точке ˆf к(︁f можно использовать квадрат невязки: Q S, ˆf)︁(x) = ∑︀ (︁Ni=1y i − ˆf(x2i ))︁. Будемискать аппроксимацию ˆf (x) как разложение по словарю параметрических функций:ˆf (x) =p∑︁α j ψ j (θ j , x) + α 0 = ψ (Θ, x) α, α = {α j } p j=0 , Θ = {θ j} p j=1 .j=1Естественный способ выбора параметров (︁ Θ и α — это минимизация функционалакачества на обучающей выборке Q S, ˆf)︁(x) по параметрам аппроксимирующейфункции ˆf (Θ, α). Цель работы — улучшить стандартные подходы к решению этойоптимизационной задачи.Воспользуемся разделимостью переменных, под которой будем понимать специфичныйвид зависимости целевой функции от части параметров. Действительно,зависимость Q от коэффициентов разложения α квадратична, и при зафиксированныхΘ минимизация сводится к решению задачи линейной регрессии Y = Ψ (Θ) α.Тогда оптимальное значение α может быть найдено с помощью метода наименьшихквадратов:(︁−1α (Θ) = Ψ (Θ) T Ψ (Θ))︁Ψ (Θ) T Y. (1)Рассмотрим новую целевую функцию: R (Θ) = Q (Θ, α (Θ)) . Выпишем формулы дляпервых и вторых производных этой функции: R Θ = Q Θ + Q α α Θ = Q Θ + 0α Θ = Q Θ ;R ΘΘ = Q ΘΘ + Q Θα α Θ . Опустив преобразования, выпишем итоговую формулу дляматрицы вторых производных:R ΘΘ ≈ J T J − (︀ J T Ψ )︀ (︀ Ψ T Ψ )︀ −1 (︀J T Ψ )︀ T. (2)Отметим, что в формулах (1) и (2) используется обращение матрицы (︀ Ψ T Ψ )︀ , которая,вообще говоря, может быть вырождена. Добавим к матрице Ψ T Ψ положительноопределенную матрицу λI p , где I p — это единичная матрица, а λ > 0 — константа.(︁)︁ −1Тогда формула (1) примет вид α (Θ) = Ψ (Θ) T Ψ (Θ) + λI p Ψ (Θ) T Y. Использованиетакой формулы эквивалентно минимизации модифицированной функции ошибки:˜R (Θ) = R (Θ) + λα (Θ) T α (Θ) . Отметим, что значение λ играет важную роль вописанном алгоритме. Например, его можно выбирать исходя из уровня обусловленностиматрицы (︀ Ψ T Ψ )︀ [1]. Вывод формул производных измененной функции ˜R (Θ)можно провести по аналогии с обычной функцией R (Θ).Для оценки предложенного подхода были проведены численные эксперименты нанаборе тестовых задач, в которых сравнивались две целевые функции: стандартнаяфункция ошибки Q (Θ, α) и модифицированная с учетом разделимости переменныхи использования регуляризации ˜R (Θ); для минимизации применялся демпфированныйметод Ньютона. Эксперименты показали, что предложенный подход позволяетувеличить точность аппроксимации в среднем в 2.2 раза и сократить время обученияв среднем в 3.1 раза.


Разреженные гауссовские процессы 85Литература1. Беляев М.Г., Бурнаев Е.В. Адаптивная регуляризация в задаче аппроксимациимногомерных зависимостей // <strong>Труды</strong> конференции «Информационные технологиии системы». — 2009. — С. 431–435.2. A. Pinkus Approximation theory of the MLP model in neural networks // ActaNumerica. — 1999. — N 8. — С. 143–195.УДК 519.237.5Разреженные гауссовские процессыЕ.В. Бурнаев, Ю.А. ЯновичМосковский физико-технический институт (государственный университет)Институт проблем передачи информации им. А.А. Харкевича РАНDatadvanceОдной из основных задач метамоделирования (построения моделей, основанныхна данных) является построение аппроксимации неизвестной зависимости на основеданных [1], [2], [3]. Одним из популярных подходов для решения этой задачи являетсямодель гауссовских процессов. В [4] и [5] предложены эффективные алгоритмы построениятаких моделей. Однако время работы данных алгоритмов зависит от числаобучающих прецедентов (известных пар вход-выход аппроксимируемой зависимости)кубически. Это затрудняет построение моделей при числе прецедентов, равном тысяче,и делает фактически невозможным при числе прецедентов, равном десяткутысяч. Однако ясно, что расширение обучающего множества увеличивает информациюо моделируемой зависимости, что должно улучшать качество построенноймодели.Возможным подходом к расширению области применимости гауссовских процессовявляется переход к разреженным гауссовским процессам [6], [7]. Их основнойидеей является аппроксимация обратной матрицы ковариации с помощью введениянекоторого (меньшего, чем число прецедентов) числа новых входов, например, изчисла прецедентов.Разработан алгоритм для автоматического построения разреженных гауссовскихпроцессов. Экспериментальные результаты показали значительное улучшение качествамодели при увеличении размера обучающей выборки за максимально допустимую(из-за ограниченных вычислительных возможностей) для обычных гауссовскихмоделей. Дальнейшие исследования предполагается сосредоточить на добавлении кмодели разреженных гауссовских процессов неслучайного тренда.Литература1. Kuleshov A.P., Bernstein A.V. Cognitive technologies in adaptive models of complexplants // Keynote papers of 13th IFAC Symposium on Information Control Problemsin Manufacturing (INCOM’09), 2009. — P. 70–81;2. Бернштейн А.В., Бурнаев Е.В., Кулешов А.П. Интеллектуальный анализ данныхв метамоделировании // <strong>Труды</strong> 17-го Всероссийского семинара «Нейроинформатикаи ее приложения к анализу данных». — Красноярск, 2009. — С. 23–28.3. Forrester A., Sobester A., Keane A. Engineering Design via Surrogate Modelling. APractical Guide. — New York: Wiley, 2008. — P. 238.4. Nielsen H.B. DACE. A Matlab Kriging Toolbox. —ttp://www2.imm.dtu.dk/∼hbn/dace


86 А.В. Нехаев, М.Г. Беляев5. Панов М., Бурнаев Е., Зайцев А. О способах введения байесовской регуляризациив регрессии на основе гауссовских процессов: сб. докладов // 15-я Всероссийскаяконференция «Математические методы распознавания образов». — Петрозаводск,2011.6. Foster L., Waagen A., Aijaz N., Hurley M., Luis A., Rinsky J., Satyavolu C., WayM.J., Gazis P., Srivastava A. Stable and Efficient Gaussian Process Calculations //Journal of machine learning research 10. — Massachusetts, 2009. — P. 857–882.7. Snelson E., Ghahramani Z. Sparse Gaussian Processes using Pseudo-inputs // NeuralInformation Processing Systems 18 (NIPS). — Vancouver, 2006. — P. 1257–1264.УДК 519.651Сравнение алгоритмов выбора размера скрытого слояпри аппроксимации нейронными сетямиА.В. Нехаев 1,2,3 , М.Г. Беляев 1,21 Институт проблем передачи инфомации им. А.А. Харкевича РАН2 Datadvance3 Московский физико-технический институтЗадача аппроксимации состоит в приближенном восстановлении некоторой функцииf(x) по порожденной ею выборке: S = {x i ; y i }, f(x i ) = y i , i = 1 . . . N.В качестве модели будем использовать нейронную сеть с одним скрытым слоем:ˆf(x) = ∑︀ pj=1 α jψ j (x, θ). Данная статья посвящена сравнению алгоритмов выбораколичества функций ψ j (x; θ), используемых в модели. Выделяются два основныхподхода к решению этой задачи: Pruning и Constractive approach.Pruning. Предполагается, что исходная сеть имеет большое число нейронов, нонекоторые малозначимые из них все же можно вырезать. Существуют два основныхметода реализации алгоритмов pruning’а.Based on Modifying the Error Function. В данном методе подбираются специальныефункции для оценки ошибки аппроксимации. Подбираются они таким образом,чтобы при минимизации этой ошибки во время обучения сети малозначимые связимежду нейронами вырезались [1].Based on Sensitivity Measures. Метод основан на измерении чувствительности сетик ее отдельным элементам. Общая идея этого метода состоит в том, чтобы оценить«важность» элемента нейронной сети и, если элемент маловажен в данном контексте,удалить его. Конкретные оценки и реализации алгоритма можно найти в [1],[2].Construstive approach. Основная идея этого подхода состоит в постепенномдобавлении нейронов к небольшой сети. Краткое описание нескольких алгоритмов,реализующих данный подход.Upstart Algorithm. При наличии в процессе обучения сети значимой ошибки к нейронудобаляются определенным образом два дочерних нейрона с целью исправитьверный ответ. При необходимости, эта процедура повторяется, т.е. строится некотораядревовидная структура [1].Cascade Correlation. Основан на каскадном добавлении нейронов. Добавленныенейроны обучаются при замороженных связях прежней системы. После, если ошибкаостается высокой, связи размораживаются, нейроны снова обучаются. Если ошибкаопять остается высокой, добавляются новые элементы. Подробнее в [1].Sequential Network Construction. Идея заключается в добавлении нейронов блокамии образовании некоторой последовательности вложенных нейронных сетей. Ней-


О выборе регрессионных моделей 87роны добаляются блоками фиксированного размера C, а их связи выбираются достаточномалыми [3].Проведенные численные эксперименты показали высокую эффективность подходаPruning. Методы на его основе позволяют получить более качественную аппроксимацию,чем техники из Constractive approach. Однако необходимо отметить, чтонаша модель имеет один скрытый слой, в то время как Constractive approach можетлучше работать в многослойных нейронных сетях.Литература1. Bebis G., Georgiopoulos M. // Optimal Feed-forward Neural Network Architectures.2. Hasabi B., Stork D.G. // Second order derivatives for network pruning. — 1993.3. Moody J. // Prediction Risk and Architecture Selection for Neural Network. —Statictics in Neural Network: Theory and Pattern Recognition Applications. — 1994.УДК 519.651О выборе регрессионных моделейИ.И. Панин 1,2 , Е.В. Бурнаев 1,2,3 , П.В. Приходько 2,31 Московский физико-технический институт2 Институт проблем передачи информации им. А.А. Харкевича РАН3 DatadvanceПусть Y = f(X), X ⊂ R n , Y ⊂ R — неизвестная функциональная зависимость,заданная на обучающей выборке T rain = {(X i , Y i = f(X i ))} N T raini=1 . Для этой неизвестнойзависимости строится семейство аппроксимирующих функций H(T rain) == { ˆf(X, p j ), j = 1, ..., J}, отличающихся значением некоторого параметра p, которыйхарактеризует сложность модели. Качество аппроксимаций наиболее точно оцениваетсяпо средней ошибке на независимой от обучающей репрезентативной тестовойвыборке T est = {(X i , Y i = f(X i ))} N T esti=1 .Задача состоит в том, чтобы найти критерий, позволяющий по обучающей выборкекак можно точнее оценить качество аппроксимации и отсеять явно плохие(в смысле средней ошибки на тестовой выборке) аппроксимации.Существует ряд основных подходов к решению задачи выбора модели, а именно:– критерии со штрафом на сложность модели, например, байесовский информационныйкритерий [1] и др.;– перекрестная проверка [2].В работе предложен новый метод выбора регрессионной модели, который не требуетдополнительного обучения аппроксиматоров и не использует предположенийо структуре модели и распределении входных данных. Метод позволяет определитьявно плохие регрессионные модели на основании степени их изменчивости и отклоненияот кусочно-линейной аппроксимации. Вычислительные эксперименты на модельныхзадачах показали перспективность разработанного подхода.Литература1. Schwarz G.E. Estimating the dimension of a model // Annals of Statistics. — 1978. —Vol. 6, N 2. — P. 461–464.2. Hastie T., Tibshirani R., Friedman J. The elements of statistical learning: data mining,inference, and prediction. — New York: Springer, 2008.


88 О.А. Зверков, К.Ю. Горбунов, А.В. Селиверстов, В.А. ЛюбецкийУДК 519.168Кластеризация белков с учётом их доменной структурыО.А. Зверков, К.Ю. Горбунов, А.В. Селиверстов, В.А. ЛюбецкийИнститут проблем передачи информации им. А.А. Харкевича РАННа примере белков рассматриваются три подхода к кластеризации данных, каждыйиз которых показал хороший результат на соответствующем типе данных.Важные белки имеют несколько субъединиц, каждая из которых имеет несколькодоменов. Число субъединиц, доменов и взаимное расположение доменов могутзначительно различаться даже у близких белков. Информацию о субъединицах иих доменах можно получить в базах данных. Субъединицы и домены имеют разныестепени консервативности, которые определяются стандартными методами, илиони просто указаны в базе данных Pfam. Например, в составе β-субъединицы РНКполимеразыбактериального типа имеются семь доменов, хотя в отдельных видахнекоторые из них могут отсутствовать [1].В докладе будут рассмотрены две тесно связанные между собой задачи о кластеризацииданного набора белков и о качестве некоторой уже полученной кластеризации.Для их решения предлагаются три подхода, по существу применимые к любымданным, не обязательно к белкам. Будем считать, что белки изображаются точкамиконечномерного банахового пространства, а для простоты изложения качествокластеризации оценивается только двумя значениями: 1 («да») и 0 («нет»). Каждыйдомен соответствует определённой координате этих точек, поэтому размерностьпространства равна максимальному числу различных доменов у рассматриваемыхбелков.Первый подход. Назовём «хорошей» кластеризацию, для которой выполняетсяследующее: для любых двух её кластеров эллипсоиды минимального объёма, описанныеоколо них, не пересекаются. Такой эллипсоид (называемый эллипсоидом Левнера)определяется однозначно в соответствующем подпространстве [2]. Эллипсоиды— это аффинные многообразия, заданные многочленами второй степени с положительноопределённой квадратичной формой. Объём эллипсоида зависит только отнормы на координатных осях.Второй подход. Близость двух белков как точек пространства определяетсянормой — суммой модулей координат («метрикой L 1 »). «Сжатый ортоплекс» — шарв этой метрике, сжатый вдоль части координатных осей. Назовём кластеризацию«хорошей», если для любых двух кластеров сжатые ортоплексы минимального объёма,описанные около них, не пересекаются. Мы предложили простые алгоритмыпроверки, является ли данная кластеризация «хорошей» для подходов 1–2.Третий подход. Здесь кластеры строятся следующим образом. Фиксируем нормув исходном пространстве. Для заданного r определим r-граф: его вершины — всеn точек пространства, которым заранее сопоставлены белки; две вершины соединеныребром, если расстояние между ними не больше r. С небольшим шагом увеличиваемr от нуля и определяем функцию f(r) в точках сетки, равную числу связных компонентв r-графе. Эта функция невозрастающая, меняется от n до 1. Ищем максимальнодлинный отрезок, на котором f(r) остаётся постоянной или медленно меняется.На этом отрезке можно выбрать точку, для которой связные компоненты r-графасоответствуют кластерам. Такая процедура зависит от параметров, которые можноуспешно подбирать.Вместо связных компонент нами рассматривались двусвязные компоненты (чтопозволяет выделить два кластера даже в случае, когда они соединены тонкой «перемычкой»).Вместо числа компонент нами рассматривалось число: пусть x — одна


Приближенное вычисление обратной матрицы и ее детерминанта в гауссовских процессах 89из точек, обозначим |x| — число элементов в компоненте, содержащей x; положимf(r) равным среднему значению |x| по всем точкам x. Эта функция неубывающая,меняется от 1 до n (что позволяет с ростом r присоединять маленькие кластеры кподходящим большим кластерам). Мы предложили эффективный алгоритм такойкластеризации.Литература1. Cramer P., Bushnell D.A., Kornberg R.D. Structural basis of transcription: RNApolymerase II at 2.8 angstrom resolution // Science. — 2001. — V. 292. — P. 1863–1876.2. Загускин В.Л. Об описанных и вписанных эллипсоидах экстремального объёма// Успехи математических наук. — 1958. — Т. 13, № 6. — С. 89–93.УДК 519.237.5Приближенное вычисление обратной матрицыи ее детерминанта в гауссовских процессахД.С. КононенкоМосковский физико-технический институт (государственный университет)Институт проблем передачи информации имени А.А. Харкевича РАНDatadvanceРассматривается задача восстановления регрессии.Пусть D = (︀ X, Y )︀ = {︀(︀ x i , y i = f(x i ) )︀ , i = 1, . . . , N }︀ — обучающая выборка. Задачасостоит в построении аппроксимации ˆy = ˆf(x) = ˆf(x|D) для исходной зависимостиy = f(x) по обучающей выборке D. Если предположить, что рассматриваемаяфункция f(x) является реализацией гауссовского процесса с нулевым математическиможиданием и известной ковариационной функцией k(x, x ′ ), то можно вычислитьоценку апостериорного среднего ˆf(x|D) и дисперсии ˆσ 2 (x|X) [1], которые используютсядля прогноза неизвестного значения и оценки точности этого прогноза.Ковариционную функцию часто моделируют в виде некоторого параметрическогосемейства k(x, x ′ ; θ). Одним из самых распространных способов выбора параметровθ является метод максимума правдоподобия [1]. Для решения задачи оптимизацииградиентными методами требуется вычисление правдоподобия и его производныхпо параметрам θ. Для этого необходимо обращать ковариационную матрицуC = {k(x i , x j ; θ), i, j = 1, . . . , N}, а также вычислять ее детерминант. Для точноговычисления этих величин, например, с помощью преобразования Холецкого, требуетсяO(N 3 ) операций. Это затрудняет построение аппроксимации при длине выборки,равной тысяче, и делает фактически невозможным при длине выборки, равнойдесятку тысяч.В работе [2] предлагается способ приближенного обращения ковариационной матрицыза O(N 2 ) операций с помощью численной минимизации квадратичного функционалаQ(u) = uT Cu− u t y. Функционал минимизируется методом квазиньютона с2формулой BFGS:˜C k+1 = ˜C k +(︃1 + qT k ˜C k q kq T k p k)︃p k p T kp T k q k− p kq T k ˜C k + ˜C k q k p T kq t k p k, (1)где ˜C k — приближение обратной матрицы на k-й итерации, p k = u k+1 − u k , q k == ▽Q(u k+1 )−▽Q(u k ). В ходе итерационной процедуры максимизации правдоподобия


90 Е.В. Любецкая, К.Ю. Горбунов, А.В. Селиверстов, В.А. Любецкийкаждый раз известна обратная матрица на предыдущей итерации, которая являетсяхорошим приближением для инициализации алгоритма оптмизации квадратичногофункционала. В работе предлагается критерий остановки алгоритма минимизации икритерий проверки качества обращения матрицы за O(N 2 ) операций. В продолженииэтого исследования в работе [3] предлагается способ приближенного вычислениядетерминанта ковариационной матрицы за O(N 2 ) операций с помощью разложенияв степенной ряд и рандомизированной оценки следа матрицы.В данной работе предлагается процедура вычисления детерминанта за O(N 2 )операций, совмещенная с методом обращения, также основанная на формуле BFGS.Формула для обновления ковариационной матрицы, аналогичная (1):C k+1 = C k + q kq T kq T k p k− C kp k (C k p k ) Tp T k C kp k,где C k — приближение ковариационной матрицы на k-й итерации. Отметим, что выполненоточное равенство ˜C k C k = I, I — единичная матрица. С помощью леммы одетерминанте матрицы можно получить следующее выражение:det(C k+1 ) = det(C k)(qk T p k + qk T C kq k )p T k C kp k (1 + qk T ˜C.k q k )Таким образом, мы можем одновременно получать приближение для обратной матрицыи детерминанта за O(N 2 ) операций, причем вычисление детерминанта не вноситдополнительной ошибки в вычисления, в отличие от подхода [3]. Предложенныйметод показал хорошие результаты на ряде модельных и реальных данных.Отметим, что рассмотренный метод может использоваться как способ приближенноговычисления детерминанта произвольной симметричной положительно определеннойматрицы за O(N 2 ). В этом случае в качестве начального приближенияобратной матрицы следует взять единичную, в этом случае метод квазиньютона сформулой BFGS показывает хорошую сходимость.Литература1. Rasmussen C.E., Williams C.K.I. Gaussian Processes for Machine Learning // TheMIT Press. — 2006.2. Leithead W.E., Zhang Yunong, Leith D.J. Efficient Gaussian Process based on BFGSupdating and logdet approximation // Proc IFAC. — 2005.3. Leithead W.E., Zhang Yunong, Leith D.J., Walshe L. Log-det approximation basedon uniformly distributed seeds and its application to Gaussian process regression //Journal of Computational and Applied Mathematics. — 2008.УДК 519.168Дифференциальные уравнения, описывающие клеточныйпроцессЕ.В. Любецкая, К.Ю. Горбунов, А.В. Селиверстов, В.А. ЛюбецкийИнститут проблем передачи информации им. А.А. Харкевича РАНДана сеть, каждой ее вершине приписан какой-то ген g i и две связанные с нимфункциональные переменные: g i (t), которая указывает концентрацию белка, и g ′ i(t),которая указывает концентрацию мРНК, полученных с этого гена, в момент времени


Дифференциальные уравнения, описывающие клеточный процесс 91t. Обозначим ¯g(t) — вектор, составленный из этих концентраций ..g i .., ..g ′ i.. Процесс,протекающий в сети, описывается системой дифференциальных уравнений, котораяв некотором приближении отражает процессы репрессии и активации транскрипции,трансляции, деградации белков и РНК, инактивации белков. Рассмотрим простейшуютакую систему:dg idt = c ∑︁ig i ′ − d i g i − g i r j g j , dg′ idt = −s ig i ′ + ∑︁j≠ilk l g l + ∑︁ l,jr lj g l g j .В левом уравнении первый член учитывает трансляцию, второй — деградацию, третий— белковую инактивацию. В правом уравнении первый член отражает деградацию,второй — репрессию или активацию транскрипции каким-то фактором, третий— репрессию или активацию транскрипции путем кооперативного связывания двухфакторов. Назовем аттрактором множество предельных точек вида lim ¯g(t k ), гдеk→∞t k → +∞ (если предел существует). Изолированные точки аттрактора будем искать,приравнивая нулю левую часть системы уравнений. При отсутствии инактивациибелков получим уравнение dg i= cdt i g i ′ − d i g i , решение которого при постоянном значенииg i ′ имеет вид: g i = c id ig i ′ + c · exp(−d i t). В пределе по t получим g i = c id ig i, ′ т.е. встационарном состоянии величины g i и g i ′ пропорциональны. Это позволяет по отношениямконцентраций мРНК находить отношения соответствующих концентрацийбелков. Предложенный подход не обязательно относится к генам и белкам, а можетбыть применен к любым данным.В качестве примера рассмотрим сеть из пяти генов (рис. 1, [1]), связанных с метаболизмомазота: ntcA, glnA, glnN, gifA и gifB, у которых концентрации соответствующихбелков зависят от параметра а, равного относительной концентрации аммония вклетке. Ген ntcA кодирует транскрипционный фактор, активирующий транскрипциюгенов ntcA, glnA, glnN и репрессирующий транскрипцию gifA и gifB, а белки GifA(IF7) и GifB (IF17) инактивируют каждый из ферментов GlnA и GlnN. Применивнаш подход, найдем зависимость концентраций различных белков от параметра a,показывающую, что при увеличении концентрации аммония в клетке концентрациибелков GlnA и GlnN убывают, а концентрации белков GifA и GifB возрастают. Такимобразом, наша модель подтверждается биологическими данными [2].


92 Е.В. Любецкая, К.Ю. Горбунов, А.В. Селиверстов, В.А. ЛюбецкийРис. 1. Регуляторная сеть генов, связанных с метаболизмом азота. Черные стрелки —белок-ДНКовые взаимодействия, серые стрелки — белок-белковые взаимодействияЛитература1. Лопатовская К.В., Селиверстов А.В., Любецкий В.А. Регулоны NtcA и NtcB уцианобактерий и хлоропластов водорослей отдела Rhodophyta // Молекулярнаябиология. — 2011. — Т. 45(3). — С. 570–574.2. Garcia-Domingues M., Reyes J.C., Florencio F.J. NtcA represses transcription ofgifA and gifB, genes that encode inhibitors of glutamine synthetase type I fromSynechocystis sp. PCC 6803 // Molecular Microbiology. — 2000. — V. 35(5). —P. 1192–1201.


Применение математического аппарата самоорганизующихся карт при разработке системытехнического зрениядля вращающихся печей 93Секция проблем интеллектуальногоанализа данных, распознаванияи прогнозированияУДК 004.896+681.518Применение математического аппарата самоорганизующихсякарт при разработке системы технического зрениядля вращающихся печейД.А. Юдин, В.З. МагергутБелгородский государственный технологический университет им. В.Г. ШуховаВ промышленности строительных материалов анализ визуальной информации опроцессе обжига сырья во вращающихся печах позволяет снизить избыточный расходтоплива и повысить качество конечного продукта (например, цементного клинкераили керамзитового гравия). Необходимость решать интеллектуальную задачуобработки и распознавания изображений требует применения систем техническогозрения (СТЗ) в составе систем мониторинга и оперативного управления печами [1].Для решения проблемы создания математического обеспечения СТЗ разработанспособ распознавания изображений, который основан на математическом аппаратесамоорганизующихся карт и аппарате нечеткой логики.Основные этапы обработки и распознавания видеоизображения процессов в печиприведены на рис. 1.На видеоизображениях процессов в печи отсутствуют естественные контуры, отделяющиематериал от пламени, материал от футеровки печи. Поэтому для их распознаванияцелесообразно применить текстурный анализ с использованием самоорганизующихсякарт [2]. Входным вектором для самоорганизующейся карты являетсявектор «энергетических» характеристик Q = {Q 1 , Q 2 . . . Q r } для каждой из областейизображения, здесь d = 1 . . . r — расстояние между парами пикселей для каждойиз строк области изображения. Каждый элемент вектора Q вычисляется на основематрицы смежности M d по формулеQ d = ∑︁ ∑︁Md 2 (i, j).i jТекстурный анализ позволяет выделить на изображении различные сегменты,например, «материал», «пламя», «футеровка», «корпус печи» и др. Затем, вычисливс помощью разработанной специальной системы нечеткого вывода информативныепоказатели для каждого сегмента, можно сделать вывод о признаках процесса (ихвыделено восемь), которые необходимы для выработки технологических рекомендацийи непосредственного мониторинга вращающей печи.


94 Р.Г. БерезовскийРис. 1. Этапы обработки и распознавания видеоизображения процессов во вращающейсяпечиЛитература1. Юдин Д.А. Интеллектуальная система мониторинга и оперативного управлениявращающимися печами обжига с применением технического зрения // Научныеисследования, наносистемы и ресурсосберегающие технологии в промышленностистроительных материалов: сб. докл. Междунар. науч.-практ. конф. — Белгород,5–8 окт. 2010 г. / Белгор. гос. технол. ун-т. — Белгород: Изд-во БГТУ, 2010. —Ч. 3. — С. 320–325.2. Кохонен Т. Самоорганизующиеся карты / Т. Кохонен; пер. 3-го англ. изд. — М.:БИНОМ. Лаборатория знаний, 2010. — 655 с.УДК 004.81Целенаправленное поведение интеллектуальных агентовсо знаковой картиной мираР.Г. БерезовскийМосковский физико-технический институт (государственный университет)Институт системного aнализа РАНИсследование целенаправленного поведения интеллектуальных агентов являетсяодним из наиболее динамично развивающихся направлений в работах по искусственномуинтеллекту. Одним из вариантов задания цели агенту является постановканекоторой задачи, описываемой начальной и целевой ситуациями и, возможно, некоторымнабором действий, которые могут пригодиться в ходе решения этой задачи.Исследованию механизмов решения таких задач агентами и их коалициями и посвященаданная работа. В качестве архитектуры агента взята архитектура, разрабатываемаяс использованием способа комплексного представления ситуаций и действийв них на основе знаковой модели отражения.В работе рассматриваются механизмы образования коалиций только для решенияуже известных задач, без выдвижения новых. Исследование было разбито наследующие три этапа:• описание деятельности одного агента для решения некоторой задачи;• рассмотрение различных случаев образования коалиций агентов, описание механизмаобразования коалиции;• описание деятельности коалиции агентов в процессе решения некоторой задачи.Знаковая картина мира интеллектуальных агентов описывается с помощью формальноймодели знака, понятия семантической сети и производного от него понятиясемиотической сети.


Объектно-ориентированный веб-поиск с логическими ограничениями 95В ходе деятельности агент использует накопленный им опыт, описанный в видебазы прецедентов. Была выделена её структура и построены механизмы её пополненияи поиска по ней. В описании деятельности одного агента для решения некоторойзадачи приведён набор действий, с помощью которого строится план решения задачи.При этом активно используется знаковая структура картины мира агента иописанная база прецедентов.Коалиции агентов образуются на основе имеющегося у агентов опыта для коллективногорешения задач и для обмена опытом. Образование коалиции представляетсобой поиск аналогичной задачи в базе прецедентов и подбор агентов, обладающихнужными навыками.Рассмотрены два метода коллективного решения задач: метод доски объявленийи улучшение имеющегося решения.Если рассмотреть решение задачи группой агентов, ни один из которых не решалданную задачу прежде, то удобным методом совместного решения задачи являетсяметод доски объявлений. В работе приведено описание деятельности коалицииагентов в этом случае.Для случая, когда агент уже умеет решать некоторую задачу, но требуется добитьсялучших результатов, приведено описание действий коалиции агентов дляулучшения имеющегося решения задачи.Для каждого из них описан набор действий, совершаемых агентами.Также в работе произведена оценка сложности поиска по базе прецедентов, решениязадачи одним агентом и группой агентов для каждого из двух методов коллективногорешения задач.Литература1. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия,психология, информатика. — М.: Эдиториал УРСС, 2002. — 352 с.2. Weiss G. (ed.) Multiagent Systems. A modern approach to distributed artificialintelligence // The MIT Press. — Cambridge: Massachusets, 1999. — 619 с.УДК 004.8527Объектно-ориентированный веб-поиск с логическимиограничениямиН.В. СпиринМосковский физико-технический институт (государственный университет)В последнее десятилетие поисковые системы достигли повсеместного распространения,являются безоговорочным средством поиска новой информации и используютсядля множества различных сценариев, таких как навигация к известным вебресурсам,поиск новых фактов, объектов и их атрибутов. Единственным свойством,объединяющим все сценарии, является то, что в качестве ввода пользователи используютключевые слова, а в результате получают ссылки на веб-страницы. Однакодостаточно очевидно, что для некоторых типов запросов (факты о реальныхобъектах и их атрибутах) данная модель входа и выхода не является оптимальной.Например, пользователю более интуитивно указать логические ограничения на желаемыйрезультат, так же, как в SQL, а в результате получить не «10 синих ссылок», аранжированный список реальных объектов, удовлетворяющих структурированному


96 Н.В. Спиринзапросу. Реальная потребность в поддержании структурированных запросов подтверждаетсяанализом логов поисковых систем [1], [2]. Разрешение проблемы о несоответствиипользовательских нужд и современной парадигмы построения поисковыхсистем является предметом настоящей работы. В частности, данная статья являетсяпредварительным анализом и исследует возможности применения стандартныхметодов машинного обучения и информационного поиска к решению данной проблемы.Стоит отметить, что рассматриваемый подход решения указанной проблемыявляется кардинально новым и ортогональным к ранее предложенным.Существующие подходы к построению объектно-ориентированного поиска с логическимиограничениями основаны на методах извлечения информации из неструктурированныхисточников, когда данные извлекаются из веб-страниц с помощью интеллектуальных«скальперов», а далее сохраняются в базу данных с заранее заданнойсхемой. В процессе поиска структурированные запросы пользователя преобразуютсяв соответствующие SQL-запросы и исполняются над базой данных. Однакоданный подход имеет ряд недостатков, связанных с трудозатратами по созданиюи поддержанию интеллектуальных «скальперов» для всего Интернета, а также егомасштабируемостью. Мы предлагаем альтернативный подход, при котором решаетсязадача классификации с использованием «легких, быстрых» признаков (посколькунам нужно лишь узнать выполнимость ограничений), а не «тяжелая» задача извлеченияинформации. В частности, данное решение позволяет осуществлять расширяемостьмножества поддерживаемых предметных областей поиска лишь с незначительнымзатратами на построение обучающего множества. Стоит подчеркнуть, чтообучающее множество строится именно для предметных областей, а не для каждоговеб-сайта в отдельности. Задача представляет собой предсказание метки класса дляпары запрос—документ, исходя из выполнимости логического условия, указанного вструктурированном запросе. Например, для веб-страницы, содержащей фотоаппаратCanon с 14 MP, и запроса «фотоаппарат, Resolution 12» алгоритм должен сгенерироватьметку 1 (ограничение выполнено).Формально требуется построить отображениеA : F(q, d) → {0, 1},где F — оператор извлечения признаков, A — классификатор, и {0, 1} — пространствометок. Структура обучающего множества стандартная для задачи классификации ипредставляет собой набор векторов признаков (описывающих пары запрос-документ)и меток классов. Данное множество строится на основе размеченного корпуса вебстраницс указанными атрибутами объектов. Для экспериментов, проделанных внашей работе, использовались 300 размеченных вручную веб-страниц, продающихфотоаппараты. Для каждой страницы указывалось 5 атрибутов: бренд, модель, разрешение,зум, цена.Предварительные эксперименты исследуют возможность применения стандартногопредставления веб-страницы (вектор слов, взвешенных согласно TFIDF) и признаков(бинарное или целочисленное вхождение слова из запроса в документ, биграммы,скалярное произведение векторов запроса и документа, статистическая языковаямодель; только для числовых атрибутов: существование, частота и доля чисел,удовлетворяющих запросу, последовательности слов и чисел («#number MP»или «price : #number») и т.д.). В качестве алгоритма классификации используесяSVM. Согласно эксперименту качество классификации ограничений на бренд 100%,что является ожидаемым результатом. Однако остальные «атрибуты» являются более«сложными», и точность колеблется на уровне 60–70%. В результате анализа


Методы машинного обучения в задаче автоматического извлечения информации из электронныхполнотекстовых документов 97экспериментов было решено, что требуются более изощренные методы автоматизированногосинтеза признаков для повышения качества классификации и удовлетворениядополнительных ограничений, преследуемых в данной работе и проекте вцелом.Литература1. Ireson N., Ciravegna F., Califf M.E., Freitag D., Kushmerick N., Lavelli A. Evaluatingmachine learning for information extraction // ICML’05.2. Agichtein E., Cucerzan S., Brill E. Analysis of factoid questions for effective relationextraction // SIGIR’05.УДК 004.89Методы машинного обучения в задаче автоматическогоизвлечения информации из электронных полнотекстовыхдокументовА.В. Артемов 1 , Н.В. Спирин 21 Московский государственный университет им. М.В. Ломоносова2 Московский физико-технический институт (государственный университет)Создание каталогов электронных полнотекстовых документов (далее — ЭПД) —это весьма ресурсоемкая и затратная по времени задача. Сегодня системы управлениякаталогами ЭПД позволяют производить поиск документов непосредственно потексту документа, но, тем не менее, одну из важнейших ролей играет т.н. метаописаниедокумента, которое зачастую недоступно. Метаописание представляет собойнабор текстовых полей, так или иначе описывающих имеющийся в коллеции документ.Решением этих проблем могут стать автоматизированные программные системы,способные с помощью методов машинного обучения и анализа текстов автоматическипроизводить извлечение метаописания непосредственно из текста документа. В даннойработе представлены результаты разработки программного модуля, решающегозадачи автоматического извлечения метаописания и категоризации для каталогаЭПД на русском языке.Для решения задачи автоматического извлечения метаописания применялся алгоритмSVM, описанный в [1]. Данный алгоритм согласно опубликованным результатампоказывает одни из наилучших результатов среди алгоритмов автоматическогоизвлечения информации и доступен в виде готовых программных решений.Входным множеством алгоритма SVM являлось множество строк документа, изкоторых согласно некоторым правилам извлекались числовые признаки. Выходныммножеством являлся набор классов, каждый из которых соответствует некоторомуполю метаописания. Использовалась последовательная схема классификации, в которойвначале каждая строка классифицируется в один из классов, а затем итеративнопереклассифицируется с учетом меток классов соседних строк. В ходе решения даннойзадачи как следствие высокой разнородности коллекции документов возниклапроблема распознавания жанра документа как фиксированной структуры метаописания.Обе задачи были успешно решены, причем распознавание жанра документапроисходит с точностью не ниже, чем 95%, а извлечение каждого из полей метаописаниядокумента — с точностью от 55% до 100%, в зависимости от поля и жанрадокумента.


98 А.А. РоманенкоОптимальные параметры классификатора (ядро, margin и т.п.) выбирались так,чтобы обеспечить наивысшее качество работы на обучающей выборке. Далее подбиралисьтакие параметры, как вес положительных точек, также с целью повыситьточность классификации.В ходе работы над проектом реализован программный модуль на языке python.Литература1. Han H., Giles C., Manavoglu E., Zha H., Zhang Z., Fox E. Automatic DocumentMeta-data Extraction using Support Vector Machines // Proceedings of JointConference on Digital Libraries. — 2003.УДК 519.216.3Применение агрегирующего алгоритма В. Вовка в задачепрогнозирования при несимметричном функционале потерьА.А. РоманенкоМосковский физико-технический институт (государственный университет)Задачи прогнозирования временных рядов при несимметричном функционале потерьвозникают во многих приложениях, в частности, при прогнозировании объёмовпродаж. Известно несколько подходов для решения таких задач [1], [2]. В даннойработе предлагается метод построения композиций алгоритмов прогнозирования, основанныйна теоретико-игровой парадигме [3].Будем рассматривать задачу прогнозирования, в которой элементы временногоряда (x 1 , ..., x T ) лежат в некотором отрезке числовой оси: x t ∈ [Y 1 , Y 2 ], t = 1, ..., T ,Y 1 , Y 2 ∈ R, алгоритмом прогнозирования называется функция A : R * → R, котораяпо конечной последовательности (x 1 , ..., x T ) ∈ R * выдает прогноз x T ˆ +1 следующегоеё элемента x T +1 : ˆx T +1 = A(x 1 , ..., x T ); функция ошибки алгоритма при прогнозе элементавременного ряда x t значением ˆx t имеет вид λ(x t , ˆx t ) ={︃k 1 (ˆx t − x t ) 2 , x t < ˆx t ;k 2 (ˆx t − x t ) 2 , x t ˆx t .Потери от прогнозирования последовательности (x 1 , ..., x T ) определяются процессом∑︀потерь Loss A (T ) = T λ(x t , ˆx t ).t=1Будем строить композицию N базовых алгоритмов прогнозирования A 1 , ..., A N ,агрегируя их прогнозы. Агрегирующий алгоритм AA прогнозирует следующее значениевременно ряда x t+1 , используя в каждый момент времени прогнозы базовых алгоритмов:AA(x 1 , ..., x t , ˆx (1)t+1, ..., ˆx (N)t+1) = ˆx t+1 , где ˆx (j)t+1 — прогноз j-го алгоритма. Агрегирующийалгоритм В. Вовка [3] получает на вход начальное распределение весов алгоритмовp 0 = (p (1)0 , ..., p (N)0 ), параметр взвешивания весов β ∈ (0, 1) и подстановочныйфункционал S : [Y 1 , Y 2 ] [Y 1,Y 2 ] → [Y 1 , Y 2 ]. На каждом шаге t алгоритм взвешивает в экспоненциальномпространстве ошибки прогнозов базовых алгоритмов. Затем с помощьюподстановочного функционала формируется предсказание следующего элемен-)︃(︃N∑︀та последовательности ˆx T +1 = S(g T (x)), где g T (x) = log βj=1β Loss A j(T )+λ(x,^x (j)T +1 ) p (j)0Временная сложность построенной композиции O(NT ), без учёта времени работы базовыхалгоритмов, где N — количество базовых алгоритмов, а T — длина временногоряда..


Критерий точности комбинаторных оценок вероятности переобучения 99В работе доказано, что при p (i)0 = 1 , i = 1, N, ограничениях на параметрNвзвешивания β e − 2k(Y 2 −Y 1 ) 2 , k = min(k 1 , k 2 ), и на подстановочный функционалSλ(Y 1 , S(g T )) ∈ [0, g T (Y 1 )], λ(Y 2 , S(g T )) ∈ [0, g T (Y 2 )] справедлива оценка процесса потерьагрегирующего алгоритма:Loss AA (T ) min Loss Ai (T ) + λ(Y 2, Y 1 )ln(N).i=1,N2В экспериментах на реальных рядах продаж в розничной сети магазинов эта оценкабыла подтверждена, и показано, что предложенный алгоритм обладает более высокойточностью прогнозов по сравнению с базовыми алгоритмами, а также простымиалгоритмами композиции.Литература1. Постникова Е. Квантильная регрессия. — НГУ. — 2000. — 34 с.2. Коваль А.С. Прогнозирование временных рядов при несимметричной функциипотерь: прогнозирование плотности распределения и квантильная регрессия //XVI Международная научная конференция студентов, аспирантов и молодых учёных«Ломоносов-2009», секция «Вычислительная математика и кибернетика». —2009. — С. 37.3. Vovk V. A game of prediction with expert advice // Journal of Computer and SystemSciences. — 1998. — N 56. — P. 153–173.УДК 004.852+519.156Критерий точности комбинаторных оценок вероятностипереобученияН.К. ЖивотовскийМосковский физико-технический институт (государственный университет)Оценивание обобщающей способности обучаемых алгоритмов — одна из важнейшихзадач теории вычислительного обучения. Cовременным подходом к решениюэтой проблемы являются результаты, полученные в комбинаторной теории переобучения[1].Подход заключается в рассмотрении лишь конечной генеральной выборки объектовX и всех ее разбиений на обучающую выборку X ⊂ X, |X| = l и контрольную¯X = X ∖ X, | ¯X| = k. Основное предположение — на множестве всех C l l+k разбиенийгенеральной выборки задано равномерное распределение вероятностей, что являетсяаналогом независимости элементов генеральной выборки. Также считаем, что заданоконечное множество алгоритмов A. Алгоритм a ∈ A сопоставляет объекту x егокласс. В нашей задаче распознавания два класса, поэтому вводится бинарная функцияпотерь I : A × X → {0, 1}, где (I(a, x) = 1) ↔ (a допускает ошибку на объекте x).Таким образом, алгоритмам сопоставляются булевы векторы ошибок длины l + k,между которыми определено отношение порядка: ∀a, b ∈ A, (a b) ↔ (I(a, x) I(b, x)∀x ∈ X), причем (a < b) ↔ (a ≠ b, a b), (a ≺ b) ↔ (a < b, ρ(a, b) = 1), гдеρ — Хэммингово расстояние между соответствующими векторами ошибок. Для алгоритмаa множество X a = {︀ x ∈ X ⃒ ⃒ ∃b ∈ A: a ≺ b, I(a, x) < I(b, x)}︀назовем порождающиммножеством, а множество X ′ a = {︀ x ∈ X ⃒ ⃒ ∃b ∈ A: b < a, I(b, x) < I(a, x)}︀— запрещающим. Также задан метод обучения μ, который обучающей выборке X


100 Н.К. Животовскийсопоставляет некоторый алгоритм μX ∈ A. Полагается, что метод обучения — пессимистичнаяминимизация эмпирического риска [1].Одной из основных задач является получение точных либо верхних оценок вероятностипереобученияQ ε (μ, X) = P [︀ δ(μX, X) ε ]︀ , ε ∈ (0, 1),где величина отклонения частоты ошибок на контроле и обучении δ(a, X) = ν(a, ¯X)−−ν(a, X) называется переобученностью алгоритма a.Теорема 1. (Оценка расслоения-связности [1])Q ε (μ, X) ∑︁ a∈AC l−qL−q−rC l L(︀H m−r,l−q lL−q−r(m − εk))︀ ,Lгде m — число ошибок алгоритма a на X, q = |X a |, r = |X a|, ′ L = l + k, H m,lL (z) =∑︀⌊z⌋Cm =s Cl−s L−m.s=0C l LКак известно из [1], для некоторых модельных семейств алгоритмов эта оценкаможет быть точна. Следующая теорема дает описание всех множеств алгоритмов,для которых оценка точна.Теорема 2. Пусть l 2 max |X a| и k 2 maxa∈A a∈A |X′ a|. Оценка расслоения–связноститочна тогда и только тогда, когда ∀a, b ∈ A, (a ≠ b) → ([X a ∩ X b ′ ≠ ∅] + [X′ a ∩ X b ≠≠ ∅] 1), где [ ] — индикатор события.Графом расслоения-связности [2] множества алгоритмов A будем называть направленныйграф G = ⟨A, E⟩ с множеством ребер E = {(a, b) : a ≺ b}. Каждомуребру в графе можно сопоставить некоторый объект x ∈ X такой, что соединяемыеим алгоритмы отличаются только тем, что они по-разному классифицируют этотобъект.Теорема 3. Пусть в условиях теоремы 2 G — грaф расслоения-связности множестваA. Оценка расслоения-связности точна тогда и только тогда, когда1) ∃ a, b ∈ A : ∀c ∈ A, a c b,2) если a — произвольная вершина G, x 1 , . . . , x n — объекты X, соответствующиевыходящим из нее ребрам, то G содержит направленный n-мерный куб с истоком a,построенный с помощью ребер, соответствующих x 1 , . . . , x n .Литература1. Vorontsov K.V. Exact combinatorial bounds on the probability of overfitting forempirical risk minimization // Pattern Recognition and Image Analysis. — 2010. —Vol. 20, N 3. — P. 269–285.2. Vorontsov K.V., Ivahnenko A.A. Tight Combinatorial Generalization Bounds forThreshold Conjunction Rules // Lecture Notes in Computer Science. — New York:Springer-Verlag. — 2011. — P. 66–73.


Оценивание скрытого профиля компактности в задачах обучения методом ближайшего соседа 101УДК 519.2Оценивание скрытого профиля компактности в задачахобучения методом ближайшего соседаЮ.А. ЯновичМосковский физико-технический институт (государственный университет)Вычислительный центр им. А.А. Дородницына РАНМетод ближайшего соседа — это алгоритм классификации, который относит произвольныйобъект к тому классу, которому принадлежит ближайший к нему объектобучающей выборки. Этап обучения в простейшем случае сводится к запоминаниюобучающей выборки. Однако, если выборка имеет избыточно большой объем илисодержит ошибочные (шумовые) объекты, возникает задача отбора из обучающейвыборки подмножества эталонных объектов. Кроме того, метрика (функция расстояниямежду объектами) может быть известна с точностью до параметров, и тогдавозникает задача оптимизации метрики.Для отбора эталонов и обучения метрики предлагается минимизировать критерийполного скользящего контроля CCV [3]. Это — средняя частота ошибочных классификацийна контрольной выборке, притом что усреднение производится по всем возможнымразбиениям заданной полной выборки на обучающую и контрольную. Теоретическикритерий CCV характеризует обобщающую способность алгоритма обучения.Существуют эффективные комбинаторные формулы, позволяющие по известнойполной выборке вычислять CCV для метода ближайшего соседа либо через вкладыотдельных объектов [2], либо через профиль компактности выборки [1]. Профилькомпактности R(m) — это доля объектов выборки, у которых m-й сосед относитсяк другому классу.Непосредственная минимизация функционала CCV может приводить к переобучению,поскольку контрольная выборка предполагается известной. В данной работеизучается связь профилей компактности полной выборки и ее случайной обучающейподвыборки. Предлагается метод поточечного доверительного оценивания профилякомпактности полной выборки по профилю компактности наблюдаемой обучающейподвыборки. Выводится точное выражение для математического ожидания профилякомпактности обучающей подвыборки через профиль компактности полной выборки.Строится пример, показывающий, что для дисперсии аналогичного точноговыражения не существует. В то же время вычислительные эксперименты на реальныхданных показывают, что профили компактности полной выборки и ее случайнойобучающей подвыборки достаточно близки, причем доверительные интервалы слабозависят от выбора эталонов и метрики. Данный факт позволяет объяснить, почемув экспериментах непосредственная минимизация функционала CCV все же не приводитк переобучению, даже несмотря на то, что контрольная выборка полностьюизвестна.Литература1. Воронцов К.В. Комбинаторный подход к оценке качества обучаемых алгоритмов// Математические вопросы кибернетики / под ред. О.Б. Лупанова. —М.: Физматлит, 2004. — Т. 13. — С. 5–36.2. Ivanov M.N. Prototype sample selection based on minimization of the complete crossvalidation functional // Pattern recognition and image analysis. — New York, Inc.:Springer-Verlag. — 2010. — V. 20, N 4. — P. 427–437.


102 Г.Б. Сологуб3. Mullin M., Sukthankar R. Complete cross-validation for nearest neighbor classifiers //Proceedings of international conference on machine learning. — 2000. — P. 639–646.УДК 51.77Применение байесовских сетей для моделирования знанийстудентов в интеллектуальной системе тестированияГ.Б. СологубМосковский авиационный институт (государственный технический университет)Основным компонентом интеллектуальных обучающих и тестирующих системявляется модель студента, которая содержит текущее представление его знаний икомпетенций в рассматриваемой предметной области [1].Предлагается строить эту модель методом наследования на основе фреймовой семантическоймодели учебного предмета, описывающей темы произвольного уровнявложенности, компетенции, вопросы, их семантические элементы, а также взаимосвязимежду этими компонентами знаний.Для наглядного представления и эффективной обработки таких моделей можноиспользовать математический аппарат байесовских сетей [2].Предлагается следующая структура байесовской сети для моделирования знанийстудента (рис. 1). Узлы T , C, Q, S байесовской сети представляют собой бинарныеслучайные величины, соответствующие темам, компетенциям, вопросам и их семантическимэлементам. При этом T , C и Q являются скрытыми переменными, а S —наблюдаемыми.Параметрами байесовской сети являются: P (T |pa(T )) — условные байесовские вероятностизнаний тем, P (C) — априорные байесовские вероятности владения компетенциями,P (Q|pa(Q)) — условные байесовские вероятности умения отвечать на вопросы,P (S) — априорные байесовские вероятности правильности заполнения семантическихэлементов вопросов.В процессе тестирования при ответах на вопросы студентом некоторые из переменныхS принимают конкретные значения, а распределения вероятностей остальныхпеременных пересчитываются по правилам байесовского вывода. Таким образом,решается основная задача тестирования — построение оценок знания тем и владениякомпетенциями.Предложенная модель ближе всего по своей структуре к байесовской сети, описаннойв работе [3], но отличается от неё потенциально неограниченной вложенностьютем, выделением элементарных компетенций в качестве базовых элементов знания,а также введением дополнительного уровня семантических элементов вопросов, чтопозволяет использовать современные методы коллаборативной фильтрации для инициализациисети.


Метод формирования начальных приближений в вероятностном латентном семантическом анализе103Рис. 1. Байесовская сеть для моделирования знаний студентаЛитература1. Foundations of intelligent tutoring systems / ed. by M.C. Polson, J.J. Richardson. —Hillsdale, NJ: Lawrence Erlbaum, 1988. — 296 p.2. Pearl J. Probabilistic Reasoning in Expert Systems: Networks of Plausible Inference.— San Francisco: Morgan Kaufmann Publishers, Inc., 1988.3. Millan E., Perez-de-la-Cruz J.L. A Bayesian Diagnostic Algorithm for StudentModeling and its Evaluation // User Modeling and User-Adapted Interaction. — 2002.— N 12. — P. 281–330.УДК 519.237Метод формирования начальных приближенийв вероятностном латентном семантическом анализеО.О. ИсуповаМосковский государственный университет им. М.В. ЛомоносоваВероятностный латентный семантический анализ (probabilistic latent semanticanalysis, PLSA) применяется для выявления неизвестного (латентного) множестватем по коллекции текстовых документов [1]. Модель данных основана на предположении,что вероятность появления термина w ∈ W в документе d ∈ D описываетсясмесью распределений p(d, w) = ∑︀ p(t)p(d|t)p(w|t), где T — множество тем, Dt∈T


104 К.В. Павлов— коллекция документов, W — словарь терминов. По матрице F = {f dw } d∈D,w∈W ,где f dw — число вхождений слова w в документ d, восстанавливаются тематическиепрофили документов {p(t|d)} t∈T и слов {p(t|w)} t∈T . Для этого ставится задача максимизацииправдоподобия ∑︀ d,wf dw p(d, w), которая решается с помощью EM-алгоритма.Это итерационный процесс, скорость сходимости которого и качество восстановленияпрофилей существенно зависит от выбора начального приближения профилей. В литературеэтой проблеме уделяется недостаточно внимания, и в качестве начальногоприближения, как правило, берут случайные векторы.В данной работе предлагается способ формирования начальных приближенийпрофилей, использующий входную информацию. Будем считать, что если словавстречаются в существенно разных множествах документов, то они соответствуютразным темам. Просматривая все столбцы f w = {f dw } d∈D матрицы F по убываниювстречаемости слов w в коллекции, выберем |T | эталонных слов, E ⊆ W существенноотличающихся друг от друга по встречаемости в документах. Будем полагать, чтослово w существенно отличается от эталонного слова w ′ , если корреляция междустолбцами f w и f w ′ меньше некоторого порога θ. В качестве начального приближенияпрофиля каждого документа d ∈ D возьмём подстроку f d = {f dw } w∈E матрицыF .Качество восстановления профилей и скорость сходимости EM-алгоритма в даннойработе измеряется на модельных данных. Задаются модельные профили иаприорные распределения, по ним генерируется матрица F , по которой затем EMалгоритмвосстанавливает исходные профили. Качество восстановления измеряетсясреднеквадратичным отклонением между исходными и восстановленными профилями.В экспериментах сравнивается число итераций и достигнутое значение среднеквадратичнойошибки при формировании начальных приближений случайным образоми предложенным методом. Показывается, что предложенный метод обеспечиваетболее быструю сходимость и меньшее значение среднеквадратичной ошибки.Литература1. Hofmann T. Probabilistic Latent Semantic Indexing // In Proceedings of the 22ndAnnual ACM Conference on Research and Development in Information Retrieval. —Berkeley, California. — August 1999. — P. 50–57.УДК 519.711.2Алгоритм выбора многоуровневых моделей в задачевосстановления логистической регрессииК.В. ПавловМосковский физико-технический институт (государственный университет)Данная работа посвящена проблеме выбора и настройки моделей логистическойрегрессии в задачах классификации. Автор предлагает новый подход, заключающийсяв совместной кластеризации объектов и выборе признаков многоуровневыхмоделей. Его результатом является набор моделей оптимальной сложности.Известные подходы к выбору моделей заключаются в использовании шаговойрегрессии, итеративного перевзвешивающего метода наименьших квадратов [1], порождениянелинейных регрессионных моделей.


Алгоритм выбора многоуровневых моделей в задаче восстановления логистической регрессии 105Для построения моделей предлагается использовать EM-алгоритм [1]. На E-шагепроисходит отнесение объектов к моделям на основе оценки правдоподобия многоуровневоймодели. На M-шаге происходит выбор наиболее вероятных параметровмодели по объектам, которые к ней отнесли.В логистической регрессии вероятность принадлежности объекта к первому классувыражается через сигмодиную функцию:p(y = 1 | x, w) = σ(x T w) =11 + exp(−x T w) . (1)Способы нахождения наиболее вероятных параметров w хорошо описаны в литературе[2]. Рассмотрим ситуацию с несколькими моделями, когда при решении задачиклассификации для объекта нужно выбрать соответствующую ему модель. Этоможно сделать на основе её правдоподобия. Вероятность того, что объект (x i , y i ) былпорожден моделью f k :p(f k | x i , y i ) = p(f k, x i , y i )p(x i , y i )= p(y i | f k , x i )p(f k , x i ). (2)p(x i , y i )Априорная вероятность объекта p(x i , y i ) одинакова для всех моделей. Величинаp(f k , x i ) называется априорной вероятностью модели. Предположим, что заранее нетникаких предпочтений в выборе моделей и априорные вероятности их равны. Еслимы предполагаем, что объект относится к наиболее вероятной модели, то принципмаксимума правдоподобия модели можно представить в виде задачи оптимизации:k * = arg maxk∈{1...l} p(y i | f k , x i ). (3)Класс объекта неизвестен, в этом случае будем рассматривать наихудший вариант:объект имеет класс, доставляющий минимум p(y i | f k , x i ):k * = arg maxkmin p(u | f k, x i ). (4)u∈{0,1}Вероятности принадлежности объектов к классам выражаются через логистическуюфункцию, перепишем решающее правило:Преобразуем выражение:k * = arg max min{σ(x T i w k ), σ(−x T i w k )}. (5)kk * = arg max σ(−|x T i w k |) = arg min |x T i w k |. (6)kkТем самым получено решающее правило отнесения объекта к модели на E-шаге алгоритма.Преимуществом данного подхода по сравнению с логистической регрессией являетсяего способность описывать принципиально многомодельные выборки и сегментироватьобъекты в соответствии с используемыми моделями.Литература1. Bishop C. Pattern recognition and machine learning. – Springer: Information Scienceand Statistics, 2006. — 749 с.


106 К.В. Чувилин2. Павлов К.В., Стрижов В.В. Выбор многоуровневых моделей в задачах банковскогокредитного скоринга // Доклады 15-й Всероссийской конференции «Математическиеметоды распознавания образов». — 2011. — C. 158–161.УДК 004.85Автоматический синтез и статистическая оценка качестваправил коррекции документов в формате LaTeXК.В. ЧувилинМосковский физико-технический институт (государственный университет)Многие конференции и издательства принимают материалы от авторов в форматеLaTeX. Обычно авторские тексты содержат значительное количество типографическихошибок, связанных с несоблюдением требований к оформлению, исправлениекоторых производится корректорами вручную. Можно минимизировать рутиннуюработу с помощью правил для автоматической коррекции. Но ручное описание такихправил приведёт скорее к увеличению трудозатрат.В данной работе рассматривается способ автоматического синтеза правил коррекции[2] по обучающей выборке, составленной из пар документов «черновик–чистовик», и анализируется качество на основе статистики найденных ошибок и общегочисла срабатываний.Файлы формата LaTeX обладают естественной древовидной структурой (синтаксическимдеревом), исследуя которую можно получить всю необходимую информациюдля описания корректорской правки. Узлы этой структуры называются токенами.Правила замены можно формулировать именно для деревьев.Для выявления различий между синтаксическими деревьями документов используетсяалгоритм, основанный на алгоритме Zhang–Shasha [1]. Рассматриваются деревья,обладающие следующими свойствами: каждая вершина содержит ключ (элементиз заранее определенного набора), выбрана вершина, которая является корнемдерева, вершины, имеющие общего родителя, упорядочены. К дереву разрешаетсяпоследовательно применять следующие операции: удаление вершины (все ее потомкипереходят родителю), вставка новой вершины в произвольное место, изменениеключа вершины. Алгоритм Zhang–Shasha позволяет вычислять редактирующее расстояние(минимальное количество операций) между двумя деревьями и, кроме того,определять, какую операцию нужно применить к каждой вершине для реализациитакого расстояния.Если для терминальных токенов синтаксического дерева в качестве ключа выбратьтекст, которому они соответствуют, а для нетерминальных — тип, то оно будетполностью удовлетворять условиям применимости алгоритма Zhang–Shasha.Но правки, совершаемые корректорами, не могут быть заданы тремя вышеописаннымидействиями: требуется иметь возможность изменять родительский токен.Для выделения подобных перемещений набор команд был расширен операциями поднятия(передача дочерних вершин родительскому токену) и опускания (передачадочерних вершин самому правому потомку). Для конструктивного поиска отображенияс учетом введения новых операций было доказано следующее утверждение.Теорема 1. Если сначала применять алгоритм поиска отображения, реализующегоредактирующее расстояние, для операций удаления, вставки и изменениявершин, а после найти все поднятые и опущенные вершины, то полученное отображениебудет соответствовать наименьшему расстоянию среди всех отображений


Автоматический синтез и статистическая оценка качества правил коррекции документов в форматеLaTeX 107между двумя заданными деревьями, которые могут быть получены этими пятьюоперациями.После построения различия между «черновиком» и «чистовиком» требуется выделитьнабор правил, которые преобразут дерево первого в дерево второго. Каждоепостроенное правило характеризуется шаблоном (последовательностью соседних токеновс общим родителем) и типом локализатора (токена, к потомкам которого применяетсяшаблон).Для токенов синтаксического дерева документа выбираются шаблоны, тип локализаторовкоторых совпадает с типом рассматриваемого токена. Среди потомковтокена ищется цепочка соседних, совпадающая с шаблоном по следующим правилам:— для всех измененных токенов из шаблона соответствующие потомки должныиметь такие же ключи,— для всех остальных токенов из шаблона соответствующие потомки должны иметьтакие же типы.Сразу после того как совпадение найдено, выполняется соответствующая операция.Дальнейший поиск происходит в уже измененном дереве.Для оценки качества синтезированных шаблонов проводился эксперимент, в которомиспользовались 135 пар «черновиков» и «чистовиков», вошедших в сборниктрудов конференции ИОИ-8. Обучающая выборка включала от 5 до 135 пар статейи для каждого количества генерировалась случайных образом 45 раз. Определялоськоличество синтезированных шаблонов и количество мест в чистовиках, удовлетворяющихшаблонам (количество срабатываний).В среднем количество найденных шаблонов при анализе одной пары «черновик–чистовик» равнялось 18,7. Общее количество найденных шаблонов постепенно увеличивалосьпо мере увеличения длины обучающей выборки и стабилизировалось последостижения половины количесва всех пар статей, равняясь в среднем 228,5. Это согласуетсяс тем, что наиболее часто встречающиеся типографические ошибки могутбыть охарактеризованы конечным числом статей.Количество срабатываний на «чистовиках» (то же, что и количество неверныхсрабатываний на «чистовиках») не уменьшалось по мере увеличения количества найденныхшаблонов и достигло 269,6. Но «чистовики» не должны быть подверженыправкам, и для корректных шаблонов это количество должно стремиться к нулюпри увеличении числа статей, используемых для обучения. Поскольку с построеннымишаблонами такого не произошло, это означает, что они содержат неточности,что дает направление дальнейшим исследованиям, связанным с их модификацией.Литература1. Zhang K., Shasha D. Simple fast algorithms for the editing distance between trees andrelated problems // SIAM Journal of Computing. — 1989. — N 18. — P. 1245–1262.2. Чувилин К.В. Синтез правил коррекции документов в формате LaTeX с помощьюсопоставления синтаксических деревьев // Математические методы распознаванияобразов. — 2011. — № 15.


108 А.В. Каменев, Ф.Ф. ПащенкоУДК 519.86Интеллектуальный анализ данных для прогнозированиятранспортного потокаА.В. Каменев, Ф.Ф. ПащенкоИнститут проблем управления им. В.А. Трапезникова РАНЦель данной работы — разработать часть системы поддержки принятия решений(СППР), которая отвечает за моделирование и прогнозирование поведения слабоформализуемогообъекта и сигналов, действующих на объект, на примере транспортногопотока на участке дороги.Для краткосрочного моделирования и прогнозирования транспортного потока нагородских магистралях предлагается адаптивная гибридная система, основанная нанечетких правилах [1], [2]. Модель использует генетический алгоритм для настройкифункций принадлежности в реальном времени в соответствии с преобладающимиусловиями движения. За основу взята нейро-нечеткая модель Такаги (Takagi) и Сугено(Sugeno), именуемая TS-моделью:R θ : если y(t − 1) есть Y θ1 , ..., y(t − r) есть Y θr ,u(t) есть U0 θ , ..., u(t − s) есть Us θ ,r∑︁s∑︁то y θ (t) = a θ 0 + a θ l y(t − l) + b θ l u(t − l), θ = 1, ..., n.l=1Рассмотрены вопросы моделирования и управления транспортных потоков в городскихусловиях. Идентификация параметров модели и правил вывода осуществляютсягибридным алгоритмом.Этапы работы гибридного алгоритма.1. Задание начальных условий экспертом.2. Анализ данных — определение количества правил.3. Нахождение оптимальных коэффициентов.Данный блок является центральным в алгоритме. Нахождение оптимальных параметровмодели осуществляется рекуррентным методом наименьших квадратов длянечетких множеств по имеющимся статистическим данным. В качестве критерия минимизациииспользуется усредненный квадратичный критерий:l=0I(c) = M{Φ(e, c)} = 1 TT∑︁(y(t) − ˆy(t, c)) 2 , где Φ(e, c) = e 2 (t).t=14. Оптимизация функций принадлежности.В блоке изменяются функции принадлежностей с помощью генетического алгоритма,который позволяет найти оптимальный вариант.5. Увеличение порядка нечеткой динамической модели.Эффективность алгоритма продемонстрирована на модельном примере — участоктранспортной сети, а также проведен анализ сравнения нового алгоритма состатистическими методами предсказания.Показана возможность описания поведения транспортных потоков с достаточнойточностью. Результаты имитационного моделирования показали, что прогнозированиена 5 минут вперед с помощью статистических методов дают примерно одинаковыйрезультат, но при прогнозировании на 30 минут вперед (рис. 1) гибридныйалгоритм сохраняет точность в отличие от статистических методов.


Методы выделения терминов и тематической классификации текстовых документов 109Рис. 1. Прогнозирование с помощью гибридного алгоритмаЛитература1. Кудинов Ю.И., Кудинов И.Ю., Суслова С.А. Нечеткие модели динамических процессов:монография. — М.: Научная книга, 2007.2. Пащенко Ф.Ф. Введение в состоятельные методы моделирования систем. Ч. 2.Идентификация нелинейных систем. — М.: Финансы и статистика, 2007. — 288 с.УДК 519.688Методы выделения терминов и тематической классификациитекстовых документовН.В. Спирин, А.Н. ФирстенкоМосковский физико-технический институт (государственный университет)Доклад посвящен сравнению методов тематической классификации текстовыхдокументов. Под темой понимается множество слов, часто совместно встречающихсяв достаточно узком подмножестве документов.Пусть задана коллекция документов D = {d 1 , ..., d l } и словарь терминов W == {w 1 , ..., w n }. Требуется выделить множество тем в указанном выше смысле.Для решения данной задачи использовались два существенно различных методамашинного обучения.Первый метод основан на алгоритме индукции ассоциативных правил APRIORY[1]. Он находит наборы слов, неслучайно часто совместно встречающиеся в некоторыхподмножествах документов, затем отбирает из них наилучшие в смысле соответствующеймеры интересности [2].Второй метод основан на байесовской модели вероятностного латентного семантическогоанализа PLSA [3] и использует EM-алгоритм [4].


110 В.В. ШейнинВычислительный эксперимент проводился на текстовой коллекции Reuters-21578.Темы сравнивались между собой как «top-k» списки с помощью обобщений расстоянийСпирмена и Кендалла [5], а два множества тем сравнивались на основаниидвух расстояний между множествами — расстояния Хаусдорфа и расстояния, котороеопределялось как минимальная по всем возможным соответствиям между двумямножествами сумма расстояний между соответствующими парами терминов из разныхмножеств.Основной результат — алгоритмы демонстрируют значительную непохожестьформируемых тем. Причинами этого явления может быть неудачный выбор начальногоприближения в PLSA или несогласованность управляющих параметров двухметодов. Следующим шагом в исследовании является подбор параметров обоих методовпо критерию согласованности их результатов и использование ассоциативныхправил, найденных первым методом, в качестве начального приближения для второгометода.Литература1. Agrawal R., Srikant R. Fast algorithms for mining association rules // Proc. 20th Int.Conf. Very Large Data Bases. — 1994. — P. 487–499.2. Wu T., Chen Y., Han J. Association mining in large databases: A re-examination ofits measures // Knowledge Discovery in Databases: PKDD. — 2007. — V. 4702. —Lecture Notes in Computer Science. — P. 621–628.3. Hofmann T. Probabilistic latent semantic analysis // In Proc. of Uncertainty inArticial Intelligence. — UAI’99. — 1999. — P. 289–296.4. Dempster A.P., Laird N.M., Rubin D.B. Maximum likelihood from incomplete datavia the em algorithm. – Journal of the royal statistical society, series b. — 1977. — V.39(1). — P. 1–38.5. Fagin R., Kumar R., Sivakumar D. Comparing top k lists // In Proceedings of theACM-SIAM Symposium on Discrete Algorithms. — 2003. — P. 28–36.УДК 519.237.8Ранговый метод решения задач тематической кластеризацииВ.В. ШейнинМосковский физико-технический институт (государственный университет)Задача кластеризации интересов пользователей социальной сети заключается втом, чтобы сгруппировать по темам те ключевые слова или фразы, которыми пользователихарактеризуют свои интересы. Пользователи, испытывающие интерес к одними тем же темам, могут конкретизировать их с помощью различных слов. Представлениеинтересов пользователей темами является более общим и одновременно болеекомпактным, что позволяет улучшить качество рекомендаций и поиска. Заметим, чтоаналогичные задачи возникают при тематической кластеризации документов или новостныхпотоков. Проблема заключается в том, что методы, успешно применяющиесядля решения этих задач (например, [1]), дают довольно низкую точность для задачикластеризации интересов пользователей социальных сети.Пусть задано множество интересов Q, на котором определена функция близостиL : Q × Q → R со следующими свойствами: ∀x, y ∈ Q : L(x, y) = L(y, x)и ∀x, y ∈ Q : L(x, x) L(y, x). Требуется найти множество тем T и функциюp : Q × T → [0; 1] выражающую степень отношения интересов к темам. При этом


Ранговый метод решения задач тематической кластеризации 111темы могут перекрываться, то есть ставится задача нечеткой кластеризации. Решениеданной задачи основано на двух гипотезах: (1) близкие интересы попадают водин тематический кластер, (2) для каждого интереса найдётся хотя бы одна тема, ккоторой он относится. Введём функцию близости L на множестве интересов, например,следующим образом: L(q 1 , q 2 ) = |Uq 1 ∩Uq 2p√ |, где U q — множество пользователей,|Uq1 |·|U q2 |указавших интерес q, p — параметр. Различные варианты функций близости дляподобных задач подробно рассмотрены в [2].Предлагается решать задачу в три этапа. На первом этапе строится множествоT , и для каждой темы определяется непустое множество «характерных» интересов,относящихся к данной теме со степенью, близкой к 1. Пусть интерес q 2 являетсяi-м соседом интереса q 1 по близости L; тогда будем говорить, что ранг интереса q 2относительно интереса q 2 равен i : r(q 1 , q 2 ) = i. Также введём понятие взаимногоранга: ¯r(q 1 , q 2 ) = ¯r(q 2 , q 1 ) = r(q 1,q 2 )+r(q 2 ,q 1 ). В основе алгоритма первого этапа лежит2ранжирование пар интересов по близости и построение кластеров, основанное на минимизациимаксимального взаимного ранга интересов внутри кластера при заданноймощности кластера. На втором этапе для каждой темы подбирается множество«опорных» интересов, что сводится к стандартной задаче дискретной оптимизации.Выбирается некоторый ранговый функционал качества, например DCG [3], и ищетсянабор интересов, при котором по результатам третьего этапа алгоритма достигаетсяоптимум данного функционала. На третьем этапе для каждой темы независиморешается задача нечеткой одноклассовой классификации на основе множества «опорных»интересов.Для оценивания качества кластеризации предлагается использовать экспертныеданные. Эксперт, просматривая результаты первого этапа алгоритма, по «характерным»интересам легко может определить семантическое содержание тем, какие темыбыли построены ошибочно (случаи, когда «характерные» интересы на самом делеоказались семантически не связаны друг с другом), какие интересы были ошибочнозанесены в «характерные» для данного класса. Также эксперт может предложитьсписок интересов, которые должны быть отнесены к данной теме со степенью, близкойк 1. В силу того что обычно информации о положительных прецедентах (данныйинтерес действительно принадлежит данной теме) гораздо больше, чем отрицательных,целесообразно оценивать не конкретные оценки близости интересов к темам, аточность ранжирования интересов по их близости к данным темам с помощью техже функционалов, что используются на втором этапе алгоритма. Также экспертнуюинформацию можно использовать для улучшения работы алгоритма, искусственнозавышая или занижая ранги интересов относительно друг друга.Литература1. Киселев М.В., Пивоваров В.С., Шмулевич М.М. Метод кластеризации текстов,учитывающий совместную встречаемость ключевых терминов, и его применениек анализу тематической структуры новостного потока, а также ее динамики //Междунар. сб. науч. раб.: Интернет-математика 2005: автоматическая обработкавеб-данных. — М.: Яндекс, 2005.2. Spertus E., Sahami M., Buyukkokten O. Evaluating Similarity Measures: A Large-Scale in the orkut Social — Proceedings of the Eleventh ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining (KDD-2005), 2005.3. Маннинг К. Д., Рагхаван П., Шютце Х. Введение в информационный поиск. —М.: ИД «Вильямс», 2011.


112 А.И. АвраменкоСекция синергетики и вычислительнойнанофизикиУДК 538.94+517.938О классификации нелинейных структур, описываемыхуравнением Гросса—Питаевского с периодическимпотенциаломА.И. АвраменкоНациональный исследовательский университет«Московский государственный институт электронной техники»Доклад посвящен уравнениюψ xx + (ω − U(x))ψ − ψ 3 = 0, (1)где U(x) — π-периодическая функция, U(x) = U(x + π) и ω — действительный параметр.Уравнение (1) используется для описания стационарных мод Ψ(t, x) = e iωt ψ(x)в конденсате Бозе–Эйнштейна (КБЭ) в приближении среднего поля при наличииотталкивающих взаимодействий между частицами [1], [2]. Такое описание основываетсяна уравнении Гросса–Питаевского (УГП), которое в безразмерном виде впространственно-одномерном случае имеет видiΨ t = −Ψ xx + U(x)Ψ + Ψ|Ψ 2 |. (2)Основные результаты работы можно сформулировать следующим образом.1. Показано, что «большая часть» решений уравнения (1) сингулярно, т.е. существуетнекоторое значение x 0 , такое, что lim ψ(x) = ∞. Это следует из асимптотическогоразложения решения в фиксированной точке x 0x→x0:ψ ∼√2δ + A 1δ + A 2 δ 2 + A 3 δ 3 ln δ + C ln δ 3 + A 4 δ 4 + o(δ 4 ), (3)где δ ≡ x − x 0 , C ∈ R — свободный параметр и U(x) = U 0 + U 1 δ + U 2 δ 2 + U 3 δ 3 + o(δ 3 ),√ √ √ √ (︂ )︂2U0 2U1 2U2 2 U0 U 1A 1 = ; A 2 = ; A 3 = ; A 4 =645 6 12 − U 3 .2. Проведено численное исследование уравнения (1) с модельным потенциаломU(x) = A cos 2x с целью выявления множества начальных данных (ψ(0), ψ ′ (0)), таких,что соответствующее решение не является сингулярным. Результаты этого исследованияпоказывают, что в некотором диапазоне параметров A и ω — это множествоявляется фрактальным. На примере четных решений: ψ ′ (0) = 0 показано,каким образом этот результат может быть использован для кодировки стационарныхструктур, описываемых УГП.


Генерация кода приложений численного моделирования на основе системы компьютерной алгебрыSymbalg 113Литература1. Питаевский Л.П. Конденсаты Бозе–Эйнштейна в поле лазерного излучения //Успехи физических наук. — 2006. — Т. 176. — № 4. — С. 345–364.2. Pitaevskii L., Stringari S. Bose-Einstein condensation. — Oxford: Clarendon Press,2003.УДК 004.42Генерация кода приложений численного моделированияна основе системы компьютерной алгебры SymbalgС.А. ЖдановМосковский физико-технический институт (государственный университет)Данная работа посвящена ускорению цикла разработки приложений численногомоделирования за счет автоматической генерации высокоэффективного исходногокода на основе численной схемы, заданной в терминах системы компьютерной алгебрыSymbalg [1].Предлагаемый подход позволяет сосредоточиться на реализации численной схемыв символьном виде на языке Python с применением аппарата компьютерной алгебры,что в частности дает возможность создавать высокоэффективный код для приложенийчисленного моделирования, в том числе на основе локально-рекурсивныхнелокально-асинхронных (LRnLA) алгоритмов [2].Алгоритмы LRnLA обеспечивают экстремально высокую производительностьприложений численного моделирования, но разработка на их основе очень трудоемкаи занимает большое количество времени. Предполагается, что внедрение системыSymbalg позволит использовать алгоритмы LRnLA широкому кругу пользователейв различных задачах численного моделирования.Система компьютерной алгебры Symbalg выбрана из-за того, что она позволяетрешать важные задачи символьных вычислений непосредственно на языке высокогоуровня Python, традиционно применяющимся для создания интерфейсов, генерируяна выходе исходный код на языке С++ и отчет с результатами в формате LaTeX.Предлагаемая концепция позволяет ускорить этап разработки приложений численногомоделирования без потери производительности генерируемого кода, в отличииот традиционных систем компьютерной алгебры (Maple, Mathcad и т.д.).На основе системы компьютерной алгебры Symbalg была разработана модель заданиялокального шаблона в синтаксисе языка Python. Модель позволяет задаватьлокальный шаблон в виде секций с упрощенным заданием граничных условий (в томчисле граничных условий типа поворот и отражение). Была реализована генерациякода с использованием традиционного обхода, а также с применением алгоритмаLRnLA; созданная библиотека опробована на примере явной схемы Эйлера для решенияуравнения диффузии и для метода FDTD для решения системы уравненийМаксвелла [3].Литература1. Котельников Д.В. Система символьных вычислений SYMBALG: диссертационнаямагистерская работа. — М.: МФТИ, 2008. — 19 с.2. Левченко В.Д. Асинхронные параллельные алгоритмы как способ достиженияэффективности вычислений // Информационные технологии и вычислительныесистемы. — 2005. — № 1.


114 М.Ю. Кудрявцев3. Yee K. Numerical solution of initial boundary value problems involving Maxwell’sequations in isotropic media // IEEE Transactions on Antennas and Propagation. —1966.— V. 14. — P. 302–307.УДК 517.958+536Численное моделирование стохастического резонансав системах с различными статистикамиС.А. ХилковМосковский физико-технический институт (государственный университет)Стохастический резонанс — это немонотонная зависимость отклика системы в зависимостиот уровня шума. Этот эффект проявляется в самых разных задачах [1]: отклиматических до задач разработки новых типов детекторов и фильтрации сигналов.До недавнего времени ошибочно предполагалось, что стохастический резонанс возникаеттолько в системах с двумя положениями равновесия при совпадении частотысигнала и частоты перескоков между положениями равновесия. П.С. Ланда с соавторамипоказали, что стохастический резонанс также возникает в ангармоническихосцилляторах (с кубическим потенциалом) с единственным положением равновесия.Стохастический резонанс в осцилляторных задачах исследовали в системах сбольцмановским равновесным распределением. В нашей работе мы не ограничиваемсясистемами с распределением Больцмана. Для описания эволюции функции распределениясистем с равновесными распределениями Бозе и Ферми мы используемследующее феноменологическое уравнение типа Фоккера–Планка:∂∂f(t, v, x)∂∂t+ v ∂∂f∂∂x − ∂∂U ∂∂f∂∂x ∂∂v = γ ∂∂ ∂∂v[︂T ∂∂f∂∂v + vf(1 ± f) ]︂. (1)В уравнении (1) f — функция распределения, U — внешний потенциал, T — температура,γ — модельный параметр, отвечающий за скорость релаксации, знак плюссоответствует статистике Бозе, а минус — Ферми. Мы провели серию расчетов подуправлением системы RACS [2]. Были получены отклики при различных параметрахсистем.Литература1. Landa P.S., Neimark Y.I., McClintock P.V.E.Changes in the effective parameters ofaveraged motion in nonlinear systems subject to noise // J. Stat. Phys. – 2006. –V. 125. – P. 593.2. Иванов А.В. Система контроля результатов и алгоритмов для задач численногомоделирования // Автоматизация и современные технологии. — 2007. — № 12. —С. 1–19.УДК 519.876.5Агентно-ориентированное моделирование фондового рынкана примере модифицированной модели Сато—ТакаясуМ.Ю. КудрявцевМосковский физико-технический институт (государственный университет)В данной работе рассмотрена проблема моделирования динамики фондового рынкапри помощи агентных моделей. Подходы традиционной экономической теории и


Агентно-ориентированное моделирование фондового рынка на примере модифицированной моделиСато—Такаясу 115технического анализа [1], хотя и являющиеся до сих пор самыми используемыми инструментамидля интерпретации тех или иных событий на рынке, оказались неспособныобъяснить многие важные свойства временных рядов, порождаемых на торговыхплощадках. Таким свойством являются, например, «тяжелые хвосты» распределениялогарифмической доходности [2]. Также финансовые временные ряды демонстрируютсвойства фрактальности [3] и рассматриваются эконофизиками как рядыдинамической системы, обладающей большим числом степеней свободы [4]. Для объясненияэтих и других фактов на стыке экономики, физики и прикладной математикив последние десятилетия возникло целое направление агентно-ориентированногомоделирования [5].В рамках этого подхода естественно рассматривать фондовый рынок как площадкудля взаимодействия большого числа агентов, не обладающих полной информациейо системе, и поведение которых ограниченно рационально. Таким образом, описавправила игры на фондовом рынке, и определив тем или иным способом стратегииагентов, мы получим агентную модель. При этом целью является не воспроизведениевсех (или даже большинства) особенностей реального фондового рынка, а минимальныйнабор правил, при котором глобальная динамика движения цен будет похожапо статистическим и эмпирическим критериям на реально наблюдаемые факты.Одной из известных агентных моделей фондового рынка является модель Сатои Такаясу [5]. Замечательным свойством этой модели является то, что из чрезвычайнопростых правил для агентов на микроуровне, получается ценовая динамика,воспроизводящая очень многие «сложные» свойства финансовых временных рядовна макроуровне.В данном докладе рассмотрена модификация модели Сато и Такаясу, устраняющаянекоторые ее недостатки, и вводящая в рассмотрение иерархию игроков, вместес иерархией временных горизонтов, на которых игроки осуществляют свои действия.Демонстрируются различные режимы функционирования модели и проводится сопоставлениестатистических свойств получаемых временных рядов цен с реальнымифинансовыми данными.Литература1. Шарп У., Александер Г., Бэйли Дж. Инвестиции. — М.: ИНФРА-М, 2001.2. Gopikrishnan P., Meyer M., Amaral L.A.N., Stanley H.E. Inverse cubic law for thedistribution of stock price variation // Eur. Phys. J. B. — 1998. — V. 3. — P. 139–140.3. Mantegna R.N., Stanley H.E. Scaling behavior in the dynamics of an economic index// Nature. — 1995. — V. 376. — P. 46–49.4. Mantegna R.N., Stanley H.E. An introduction to econophysics. Correlation andComplexity in Finance. — Cambridge: Cambridge Univ. Press, 2000.5. Sato A.H., Takayasu H. Dynamic numerical models of stock market price: frommicroscopic determinism to macroscopic randomness // Physica. A. Statistical.Mechanics and its Applications. — 1998. — P. 231–252.


116 А.Ю. ПерепёлкинаУДК 519.688Численное моделирование плазмы в канале холловскогодвигателяА.Ю. ПерепёлкинаИнститут прикладной математики им. М.В. Келдыша РАННа современном этапе развития космической техники в составе двигательныхустановок широко применяются холловские двигатели (ХД).В целях улучшения конструкции ХД варьируют топологию магнитного поля, величинунапряжения между анодом и катодом, материалы стенок канала, общую геометриюсистемы. Однако до сих пор не существует точного теоретического описанияплазменных процессов в канале холловского двигателя, и поэтому большинство наработокв улучшении двигателей сделано за счет экспериментальных исследований.Остается ряд проблем, решение которых невозможно без привлечения теоретическихисследований, и это приводит к необходимости численного моделирования длярешения актуальных инженерных задач [1].Один из наиболее интересных для численного исследования процессов, происходящихв плазме внутри канала холловского двигателя, — аномальная проводимость.Среди возможных причин ее возникновения выделяют пристеночные эффекты,столкновения и плазменные неустойчивости. На основе гипотезы, что возникновениеплазменных неустойчивостей является основной причиной аномальной проводимости,была разработана трехмерная полностью кинетическая самосогласованнаямодель замагниченной плазмы.Так как основной целью является ранее недостижимая трехмерная модель плазмыхолловского двигателя, особое внимание уделено стремлению к достижениюмаксимальной эффективности вычислений. Во-первых, для хранения данных используютсяне стандартные многомерные массивы, а локально-рекурсивный массивcubeLR. Второе используемое средство повышения эффективности вычислений – этолокально-рекурсивный обход графа зависимости в соответствии с версией алгоритмаLRnLA [2] – ConeFold. Ускорение, достигаемое при помощи этого алгоритма, объясняетсялокальностью последовательно обрабатываемых данных. Для повышения эффективностивычислений для периодических структур используется векторизация.Алгоритм вычисления в соответствии с выбранной численной схемой долженбыть записан в функциях минимального ранга алгоритма ConeFold. Вычислительныеформулы внутри области моделирования отличаются от тех, что на границе, подстановкойграничных условий. С учетом этого при трехмерном локально-рекурсивномразбиении получается около 27 фунцкий, до 10 000 строк кода. Так как ручное написаниеи отладка такой программы невозможны, используется автоматическая генерациякода на языке Python.Исходя из тестирования времени вычислений в разработанных моделях и оценокпараметров холловского двигателя показано, что трехмерное полностью кинетическоемоделирование для сектора канала холловского двигателя осуществимо задопустимые сроки на персональном компьютере без использования параллельныхвычислений. При переходе на параллельную реализацию трехмерное моделированиевозможно для полной системы.Литература1. Иришков С.В. Численное моделирование динамики плазмы в холловском двигателе.— М.: Исследовательский центр им. М.В. Келдыша, 2006.


Моделирование столкновительных процессов в плазме холловского двигателя 1172. Левченко В.Д. Ассинхронные параллельные алгоритмы как способ достиженияэффективности вычислений // Информационные технологии и вычислительныесистемы. — 2005. — № 1. — C. 68.УДК 519.688Моделирование столкновительных процессов в плазмехолловского двигателяА.А. ЧесноковНаучно-исследовательский ядерный университет«Московский инженерно-физический институт»Задача моделирования столкновительных процессов в плазме ХД (холловскогодвигателя) является одной из приоритетных для совершенствования современныхэлектрореактивных установок. От решения этой задачи напрямую зависят такие параметрыдвигателя, как КПД и ресурс.Основной зоной рассматриваемых плазменных столкновений является разрядныйканал ХД, в котором катодные электроны ионизируют нейтральный газ.Для выбора методов моделирования рассмотрена следующая классификация наиболеезначимых столкновительных процессов в плазме:1. Кулоновские (электрон-электрон, электрон-ион, ион-ион) столкновения;2. Упругие (электрон-нейтрал, ион-нейтрал, нейтрал-нейтрал) столкновения;3. Неупругие (электрон-нейтрал возбуждение, электрон-нейтрал и электрон-ионионизация, двойная ионизация и др.) столкновения.Проведена оценка по длинам пробега взаимодействующих частиц приоритетноститого или иного столкновительного процесса для ожидаемых параметров плазмы (см.рис. 1).Для моделирования столкновительных процессов создается программный модульдля комплекса CFhall, разрабатываемого в ИПМ им. М.В. Келдыша РАН. Моделированиестолкновений будет проводиться с помощью нескольких методов. Одним изних является вариация метода Монте-Карло:1. Определяется вероятность столкновений P (∆l) = 1 − exp(−∆l/L), где ∆l — расстояние,пройденное электроном за последний шаг, L — длина свободного пробегаэлектрона.2. Зная значения сечений с помощью генератора случайных чисел, определяетсявид столкновения.Во время моделирования накапливается статистика столкновений, средняя энергияэлектронов и т.д.


118 А.В. Закиров, В.Д. ЛевченкоРис. 1. Длины пробегов частиц плазмы между столкновениями разных типовЛитература1. Ткачев А.Н., Яковленко С.И. Моделирование формирования плазмы в прикатодномслое разряда эффективных эксиламп // ЖТФ. — 2003. — Т. 73, вып. 2.2. Смирнов Б.М. Атомные столкновения и элементарные процессы в плазме. — М.:Атомиздат, 1968. — 363 с.3. Трубников Б.А. Теория плазмы. — М.: Энергоатомиздат, 1996. — 461 с.УДК 519.688Интерфейс задания параметров и обработки результатовпрограммного комплекса LRnLA/Nano для моделированиязадач нанооптикиА.В. Закиров, В.Д. ЛевченкоМосковский физико-технический институт (государственный университет)Институт прикладной математики им. М.В. Келдыша РАНДля моделирования современных устройств нанооптики, а также численного решенияразличного рода задач электродинамики используются пакеты программ, обладающихнизкой эффективностью либо неудобным интерфейсом задания моделисреды.Программный комплекс LRnLA/Nano [1] основан на локально-рекурсивныхнелокально-асинхронных алгоритмах, обладающих на данный момент наилучшейэффективностью среди существующих алгоритмов численного моделирования. Численноемоделирование базируется на схеме FDTD. Интерфейс программы позволяетиспользовать широкий набор моделей среды, граничных условий, источников сигнала,а также создавать собственные задачи на достаточно низком уровне. В связи сэтим программный комплекс может быть использован как в режиме обучения людей,мало знакомых с тематикой задач нанооптики, так и для промышленных нуждмоделирования сложных оптических систем и современных наноматериалов.Литература1. Закиров А.В., Левченко В.Д. Реализация высокоэффективного кода для трехмерногомоделирования эволюции электромагнитного поля в актуальных задачахэлектродинамики: препринт / ИПМ РАН. — М., 2009. — № 28.


К вопросу о подборе наилучшей разностной схемы для решения уравнения Ландау—Лифшица 119УДК 519.688К вопросу о подборе наилучшей разностной схемыдля решения уравнения Ландау—ЛифшицаЕ.В. Зипунова 1,2 , А.В. Иванов 21 Московский физико-технический институт (государственный университет)2 Институт прикладной математики им. М.В. Келдыша РАНМоделирование магнетиков играет ключевую роль для создания устройств спинтроники,использование которых позволит повысить производительность вычислительныхсистем, устройств хранения информации и оперативной памяти нового типа(MRAM), которая поможет достичь более высоких значений плотности хранения информации,энергоэффективности и скорости доступа.Для моделирования магнетиков наиболее адекватным является микромагнитныйподход, при котором эволюция магнитного момента описывается системой уравненийЛандау–Лифшица [1]. Целью настоящей работы является выбор оптимальнойчисленной схемы для решения таких систем уравнений.Рассмотрена задача эволюции магнитных моментов для двух бесконечных подрешеток,связанных обменным взаимодействием. В силу симметрии начальных условий(считается, что магнитные моменты для каждой подрешетки в начальный моментвремени совпадают) поведение модели описывается двумя векторными дифференциальнымиуравнениями. Для таких уравнений в бездиссипативном случае (дисспацияв реальных магнетиках на два-три порядка меньше, чем прецессия [1]) сохраняетсяугол между магнитными моментами разных подрешеток и полная энергия системы.Работа содержит результаты исследования производительности (число тактов нашаг) и точности численных схем Рунге–Кутта 2-го и 4-го порядка, а также их модификаций,использующих расщепление по физическим процессам [2], при разныхвнешних полях и начальных условиях. Точность решения оценивается по максимальному(за время расчета) отклонению от начального значения энергии и угла междумагнитными моментами подрешеток.Литература1. Звездин А.К., Звездин К.А., Хвальский А.В. Обобщённое уравнение Ландау–Лифшица и процессы переноса спинового момента в магнитных наноструктурах// Успехи физических наук. — 2008. — T. 178, № 4. — С. 436–442.2. Иванов А.В. Кинетическое моделирование динамики магнетиков // Математическоемоделирование. — 2007. — T. 19, № 10. — C. 89–104.УДК 519.688Моделирование процесса напыления тонких магнитныхпленок методами молекулярной динамикиЕ.П. ГусевМосковский физико-технический институт (государственный университет)Численное моделирование методами молекулярной динамики позволяет детальноизучить различные аспекты процесса напыления тонких магнитных пленок, чтопредставляет большой интерес для наноэлектроники и нанофизики в целом.Каждая частица моделируемой системы характеризуется координатой, импульсоми магнитным моментом. Взаимодействие частиц описывается потенциаломЛенарда–Джонса. Эволюция магнитных моментов частиц описывается уравнением


120 Е.П. ГусевЛандау–Лифшица, в эффективном поле учитывается внешнее однородное магнитноеполе и обменный интегралом с феноменологической зависимостью от расстояниямежду частицами:J(r ij ) = J 01r ijexp[1 + r ij ].В качестве начальных условий в систему помещается некоторое число частиц, образующихподложку, для каждой из которых вводится дополнительный трехмерныйгармонический потенциал. Чтобы корректно ввести температуру системы, в уравнениядвижения частиц подложки введены дополнительные диссипативный и стохастическийчлены. В системе присутствует источник частиц с заданной интенсивностью.Модель реализована в виде высокопроизводительного программного кода, написанногона языках C++ и Python. Для интегрирования уравнений движения частициспользована численная схема Верле.Построенная модель протестирована на ряде тестовых задач, обнаружена зависимостьэффективности напыления пленки от величины и знака интеграла обменноговзаимодействия, а также от температуры системы.Также были проведены расчеты для железа с эмпирическим потенциалом межчастичноговзаимодействия Пака–Доямы:U(r ij ) = −0, 19(r ij − 1, 83) 4 + 1, 70(r ij − 2, 51) 2 − 0, 19 эВ.Была получена зависимость макропараметров — намагниченности, теплоемкостии т.п. — от температуры.Литература1. Rapaport D.C. The Art of Molecular Dynamics Simulation. — 1996.2. Lennard-Jones J.E. // Proc. Roy. Soc. — 1924. — V. A 106. — P. 463.3. Иванов А.В. Кинетическое моделирование динамики магнетиков // Математическоемоделирование. — 2007. — Т. 19, № 10. — С. 89–104.


Поисковая система Кортекс 121Секция систем математическогообеспеченияУДК 004.032.2Поисковая система КортексА.А. Домунян, А.М. Михайлов, М.Н. СергийчукМосковский физико-технический институт (государственный университет)Общая характеристика индексной поисковой системы Кортекс– Высокая степень параллелизма: разные запросы обрабатываются на разныхпроцессорах, и в то же время один запрос обрабатывается на многих процессорах;последнее достигается за счет разделения индекса на многочисленные части.– Архитектура основана на использовании большого количества ординарных, дешевыхПК;В результате система обеспечивает нужную производительность, имея стоимостьмного меньше, чем системы подобной производительности, построенные на мощныхсерверных станциях.Общая характеристика решаемой задачиРассматривается задача поиска в базе данных, в которой обработка каждого запросатребует большого количества вычислений, такого как чтение сотен мегабайтданных и выполнения нескольких миллиардов процессорных команд. Обработка пиковогообъема, характеризуемого тысячами запросов в секунду, могла бы потребоватьиспользования дорогостоящих суперкомпьютерных вычислительных систем.Вместе с тем использование большого количества дешевых, быстро заменяемых ПКи программного обеспечения, позволяющего находить вышедшие из строя компьютеры,позволяет решить эту задачу значительно дешевле, чем путем использованияменьшего числа дорогостоящих серверов.Поскольку система легко распараллеливается, что позволяет увеличивать ее производительностьлинейно, то такой показатель, как пиковая пропускная способностьявляется менее важным, чем критерий цена/производительность. Таким образомКортекс — это специализированная система, ориентированная на задачи, связанныес массовой обработкой большого числа однотипных входов.Обратные множестваДля конечного набора конечных множеств {f}n, n ∈ N, набор обратных множеств{n}f, f ∈ F , был определен в [2] как {n}f = {n : f ∈ {f}n, n ∈ N} и названиндексом образов. Здесь N — это множество имен образов, а область определения Fиндекса образов — это объединение F = ∪n{f}n, n ∈ N, элементов исходных конечныхмножеств. Мы называем элементы f исходных множеств признаками образов, анижние показатели n ∈ N именами образов.Задача поискаПусть F n , n ∈ N, — это конечный набор конечных множеств. Для заданного конечногомножества U требуется найти имя m, такое что D(F m , U) == min D(F n , U).Здесь D(F m , U) — это расстояние между множествами F n и U. Мы будем использо-


122 А.А. Бездушныйвать расстояние Танимото, которое определяется как DT (A, B) == |A∆B|/|A ∪ B|или DT (A, B) = ∑︀ (an XOR bn)/ ∑︀ (an OR bn).Диапазон значений расстояний будет ограничен единичным интервалом [0, 1]. Вэтом случае расстояние 1 означает, что множества F n и U не имеют общих элементов,а расстояние 0 говорит об идентичности сравниваемых множеств: F n = U.Общая характеристика вычислительного процесса поиска идентификаторовТрудности при машинной реализации процесса поиска связаны с большим объемомданных. Индекс абзацев подразделяется на части, каждая из которых содержитсоответствующую часть данных. При этом каждая часть индекса абзацев размещаетсяв оперативной памяти отдельной машины. Центральный сервер передает запроспо сети Ethernet одновременно на все машины. Каждая машина возвращает списокочков, набранных максимально подходящими абзацами вместе с номерами этих конкурирующихабзацев. После этого центральный сервер выбирает абзацы-победителив соответствии с набранными ими очками. Если одна из машин выходит из строя, тоэто событие идентифицируется с помощью центрального сервера, устанавливающегофакт отсутствия списка как такового, а вышедшая из строя машина заменяетсяобщей резервной машиной.Рис. 1. Архитектура поисковой системы КортексЛитература1. Mikhailov A. Biologically inspired artificial neural cortex architecture and itsformalizm // World Academy of Science, Engineering and Technology. — August 2009.— Vol. 56. — ISSN 2070–3724.2. Brin S., Page L. The Anatomy of a large-scale hypotextual web search engine. —Stanford University, Stanford, CA, 94305, USA.УДК 519.685.7Автоматизация разработки интернет-информационныхсистем на базе OWL-онтологийА.А. БездушныйМосковский физико-технический институт (государственный университет)Целью работы является разработка технологии, ориентированной на автоматизациюпроектирования и реализации информационных web-систем и приложений.Основными направлениями автоматизации являются:— Создание и настройка визуального представления данных. Зачастую реализуемаясистема должна обладать некими стандартными стилем и дизайном, соблюдаемымиво всем приложении. Система должна упрощать как смену дизайна целиком,так и отдельных его частей.


Автоматизация разработки интернет-информационных систем на базе OWL-онтологий 123— Обеспечение минимальной функциональности манипулирования данными. Посформулированной модели данных предметной области необходимо генерироватьфрагменты системы/приложения, реализующие основные операции работы с данными,а именно: создание и удаление объектов, просмотр и изменение свойствобъекта, а также поиск по атрибутам объекта.— Предоставлять набор операций упрощающих создание пользовательского интерфейсаинформационной системы.Предлагаемое решение определяет три этапа моделирования приложения: описаниеструктуры данных (модель предметной области), создание модели взаимодействия спользователем и определения ограничений целостности данных.Структура данных описывается с помощью языка OWL. Выразительность моделиданных OWL существенно богаче выразительности модели ООП.Модель визуального представления данных, должна обеспечивать упомянутое вначале работы требование о соблюдении общего дизайна приложения. Это требованиереализуется заданием набора типовых шаблонов визуализации. Шаблоны обеспечиваюткомпоновку визуальной среды пользователя и представление в ней данных.Подсистема определения ограничений позволяет задавать языково-зависимые выражениядля атрибута. Таким образом можно расширить семантику атрибута науровне объекта.В качестве платформы для реализации описанного выше решения, была выбранаweb- платформа на базе языка Java. Визуализация (отображение) данных предметнойобласти для этой платформы определяется «типом отображения», «шаблономотображения» и «каркасом отображения».Каркас отображения определяет компоновку визуальной среды пользователя,может использоваться для отображения любого класса, определенного в моделипредметной области.Шаблон отображения определяет визуализацию конкретного атрибута или классацеликом (например, атрибут типа строка может быть визуализирован в виде полеввода или же простым текстом).Тип отображения определяет соответствие между атрибутами хранимых классови шаблонами отображения.По умолчанию, определены четыре типа отображения данных: на просмотр, наредактирование, на поиск и списком. На основе этих метаданных о визуализации длякаждого хранимого класса генерируются стандартные страницы: индекс, просмотр,поиск и редактирование.Таким образом, задав в схеме шаблоны и описав метаданные о визуализации класса,мы получаем сгенерированные страницы просмотра/редактирования/поиска.Помимо генерации стандартных страниц система автоматизирует созданиепользовательского интерфейса информационной системы (пользовательских webстраниц).Эта автоматизация определена в рамках модели прикладной логики. Каждойweb-странице соответствует объект прикладной логики, который определяет:структуру данных — набор объектов из модели предметной области, ограниченияна данные — набор пользовательских ограничений используемых вместе с ограничениямииз модели предметной области, прикладную логику web-страницы — наборфункций, определяющих логику работы с данными.Система обеспечивает автоматическую привязку введенных пользователем данныхк указанным объектам предметной области, а также проводит проверки указанныев объекте прикладной логики.


124 К.А. КузнецовЛитература1. Rossi Gustavo, Pastor Oscar, Schwabe Daniel, Olsina Luis. Web Engineering:Modelling and Implementing Web Applications. — Heidelberg: Springer, 2007.2. Михеев П.Н., Меденников А.М., Бездушный А.Н. Проектирование информационныхвеб-порталов в ИСИР. — http://www.elbib.ru/index.phtml3. Бездушный А.А. Применение интерактивных web-интерфейсов в системе Научныйинститут РАН // <strong>Труды</strong> 53-й научной конференции МФТИ «Современныепроблемы фундаментальных и прикладных наук». — 2009. — T. 2. — C. 121–122.УДК 519.688Публикация данных ЕНИП РАН в пространстве Linked OpenDataК.А. КузнецовМосковский государственный университет им. М.В. ЛомоносоваВ настоящий момент концепция Semantic Web принимается на вооружение всебольшим и большим числом приложений из различных областей науки и техники.Происходит формирование пространства Linked Data, позволяющего машинам совместноиспользовать связанные структурированные данные, подобно тому, как людипользуются обычными гипертекстовыми документами. Включение набора данных вэто пространство повышает доступность данных, их связанность с другими наборамиданных и структурированность, облегчает их потребление. В связи с этим представляетсяразумным разработать систему для публикации данных РАН в пространствеLinked Data. Принципы работы таких систем и рекомендации по их построению разработаныв рамках проекта Linked Open Data.В основе системы лежат наработки проекта ЕНИП РАН. Онтология данныхЕНИП разработана на основе распространенных в пространстве Linked Data словарей,ее модульная структура согласуется с рекомендациями по публикации связанныхданных. Каждый узел типа НИ РАН дополняется специальным модулем,который отвечает за публикацию терминов онтологии этого узла и предоставлениеRDF-документов по URI-ресурсам из пространства имен узла.На центральном узле системы размещаются подсистема извлечения и сбора данных,подсистема интеграции данных, подсистема связывания данных и подсистемапубликации данных. Подсистема извлечения и сбора данных содержит специальныекомпоненты, краулеры, которые осуществляют анализ документов на естественномязыке и семантическое аннотирование этих текстов терминами из системной онтологии.Извлеченные из текстов RDF-данные затем попадают в хранилище системы.Хранилище данных видится подсистемой интеграции данных одним из источниковтипа НИ РАН. Подсистема интеграции данных предоставляет пользователям и программнымагентам формулировать единые поисковые запросы к набору данных системына языке SPARQL в терминах системной онтологии. Эти запросы поступают отподсистемы публикации данных либо же напрямую приходят к системной SPARQLточке доступа. Подсистема интеграции данных позволяет подключать произвольныеисточники структурированных данных. Подсистема связывания и служит для автоматическогои ручного связывания объектов, хранящихся в системе, с объектамиконтролируемых типов из наборов Linked Data. Также подсистема устанавливает иподдерживает связи между ресурсами внутренних источников данных системы.


Прототипирование электронной платежной системы 125Рис. 1. Общая архитектура системыЛитература1. Heath T., Bizer C. Linked Data: Evolving the Web into a Global Data Space. – Morgan& Claypool, 2011. — 136 p.2. Бездушный А.А., Бездушный А.Н., Серебряков В.А., Филиппов В.И. Интеграцияметаданных Единого научного информационного пространства РАН. — М.:Вычислительный центр им. А.А. Дородницына РАН, 2006. — 238 с.3. Бездушный А.А., Бездушный А.Н., Нестеренко А.К., Серебряков В.А., СысоевТ.М., Теймуразов К.Б., Филиппов В.И. Информационная web-система «Научныйинститут» на платформе ЕНИП. – М.: Вычислительный центр им. А.А. ДородницынаРАН, 2007. — 248 с.4. Бездушный А.А. Математическая модель интеграции данных на основе дескриптивнойлогики. – М.: Московский физико-технический институт, 2008. — 100 с.УДК 004.9Прототипирование электронной платежной системыИ.В. МашинцевМосковский физико-технический институт (государственный университет)Платёжная система — совокупность правил, процедур и технической инфраструктуры,обеспечивающих перевод стоимости от одного субъекта экономики другому.Платёжные системы являются одной из ключевых частей современных монетарныхсистем. Расширенными формами платёжных систем (включая физическую или электроннуюинфраструктуру и связанные с ними процедуры и протоколы) являютсяпроведение финансовых транзакций с помощью банкоматов, платёжных киосков,POS-терминалов. Некоторые платёжные системы включают в себя кредитные механизмы,однако их следует рассматривать вне аспекта платёжных систем.Электронные платёжные системы являются подвидом платёжных систем, которыеобеспечивают осуществление транзакций электронных платежей через сети (например,Интернет) или платёжные чипы.Разработку прототипа системы можно разделить на несколько этапов.— Изучение и анализ информации о предметной области.— Концептуальное моделирование предметной области (UML, OWL).— Описание функциональных возможностей, принципов работы с внешними и внутреннимимодулями системы.— Построение архитектуры системы.


126 А.А. Каленкова— Разработка программного кода системы.Для концептуального моделирования была выбрана OWL-онтология. Она позволилаописать объекты, необходимые структуры данных, условия их целостности ивзаимосвязи, логических правил вычисления недостающих данных (рис. 1).По построенной онтологии описаны функциональные возможности системы, примерыее взаимодействия с конечным пользователем. С учетом функциональных требованийк системе построена клиент-серверная архитектура. Для разработки программногокода был выбран стек Java- и web-технологий: Java Enterprise Edition 6,Hibernate, JSF 2.0, PrimeFaces, HTML, CSS, JavaScript.Рис. 1.Литература1. Эванс Э. Предметно-ориентированное проектирование: структуризация сложныхпрограммных систем. – М.: ИД «Вильямс», 2011. — 540 с.2. Муромцев Д.И. Онтологический инжиниринг знаний в системе Protege: методическоепособие. – СПб.: СПбГУ ИТМО, 2007. — 62 с.3. Дейт К. Дж. Введение в системы баз данных. – М.: ИД «Вильямс», 2006. —1328 с.УДК 519.688Интеграция геоинформационных ресурсов и ресурсовэлектронных библиотекА.А. КаленковаВычислительный центр им. А.А. Дородницына РАНПространственные данные — это цифровые данные о пространственных объектах,включающие сведения об их местоположении и свойствах, пространственных инепространственных атрибутах [1]. В последние годы идет поиск механизмов, которыепозволили бы различным организациям работать вместе в направлении разделенияи обмена своими пространственными данными и ресурсами для предоставленияэффективных информационных сервисов различным пользователям [2]. Это обуславливаетвнесение ряда инициатив. Одна из них — инфраструктура пространственныхданных (ИПД) (Spatial Data Infrastructure, SDI) берет свое начало с ранних девяностых[3], когда предложение по развитию национальной инфраструктуры пространственныхданных получило общественное признание, признание частного сектораи сообщества пользователей. В соответствии с определением, представленным в [4],[5], ИПД — информационно-телекоммуникационная система, обеспечивающая доступграждан, хозяйствующих субъектов, органов государственной и муниципальной властик распределенным ресурсам пространственных данных, а также распространение


Информационно-аналитическая система месторождений металлов 127и обмен данными в общедоступной глобальной информационной сети в целях повышенияэффективности их производства и использования. С развитием Интернета,Всемирной паутины и географических информационных систем (ГИС) [5], [6] приложения,в которых используются распределенные системы географической информации,получили существенное развитие. Распределенная географическая информацияпредставляет собой всеобщее распространение географической информации во множествеформ, включая карты, снимки, наборы данных, операции по анализу и отчеты[7]. Интеграция средств Интернета и географических информационных системоткрывает новые области исследований.Кроме того, в силу специфики своей предметной области участники процессаинтеграции обладают данными и метаданными, дополняющими пространственнуюинформацию: это могут быть публикации, включающие набор метаданных и полныйтекст, музейные экспонаты, представленные метаданными и медиа-объектами, самостоятельныемедиа-объекты, такие как фотографии, видео- и аудиозаписи. Интеграцияразнородной информации, предоставляемой несколькими источниками, позволитмаксимально составить описание территории, провести анализ, выявить взаимосвязи,получить принципиально новые возможности поиска: ресурсы, даже хранящиесяв разных системах, представляются связанными друг с другом единой системой навигации.Системой, которая позволяет интегрировать пространственные и другие (в частности,библиотечные и музейные) метаданные, используя стандартные форматы ипротоколы обмена, и является представленная в этой работе Система интеграциипространственных данных и ресурсов электронных библиотек — MultiMeta.Литература1. Cловарь по естественным наукам. Глоссарий.ру.http://slovari.yandex.ru/dict/gl_natural/article/97/097_214.HTM2. CIDOC CRM Home page.http://cidoc.ics.forth.gr/index.html.3. Groot R., McLaughlin J. Geospatial Data Infrastructure Concepts, Cases and GoodPractices. — NY.: Oxford University Press, 2000.4. ГОСТ Р 52438-2005. Географические информационные системы. Термины и определения.5. Майкл Н. Географические информационные системы основы. — М.: Дата+, 1999.6. Томлинсон Р. Думая о ГИС. Планирование географических информационныхсистем: руководство для менеджеров / пер. с англ. — М.: Дата+, 2004.7. Plewe B. GIS Online Infromation Retrieval, Mapping, and the Internet. — NM.:Onward Press, 1997.УДК 004.65Информационно-аналитическая система месторожденийметалловВ.В. КостинUltimetaВведениеНа сегодняшний день существует спрос на анализ экономической эффективностидобычи полезных ископаемых, в частности редких металлов, в отвалах место-


128 В.В. Костинрождений. В работе рассматривается инициатива по реализации информационноаналитическойсистемы месторождений редких металлов.OWL-онтологияС этой целью совместно с прикладными специалистами на основе работ [1] и [2]были проанализированы сущности, определена четкая система понятий. В ходе работывыделены ключевые с точки зрения анализа сущности. Ввиду неоднозначнойтрактовки различных терминов в среде геологических специалистов формализованывсе понятия и составлены полные словари экземпляров сущностей. Предложенаонтологическая (owl) спецификация понятий, их свойств и связей предметной области.Заданы ограничения целостности сущностей. Определены и заданы мощностисвязей.Пополнение и обмен информациейОптимальным вариантом работы системы представляется следующая организация— центральный, ключевой, сервер с хранилищем данных и системой оперативногоанализа. К данной инициативе может присоединиться специалист любой области,который, с одной стороны, может передавать новые данные, а с другой — получитьдоступ к уже имеющимся и результатам их анализа. Специалисты разных областейформируют разносторонний взгляд на одни и те же объекты и процессы. Такие специалисты(или группы специалистов) формируют удаленные элементы системы изимеющейся у них информации. Информация хранится в наиболее удобном виде, адля обмена информацией необходимо создать «адаптер» — инструмент, позволяющийпреобразовать информацию из имеющегося у специалиста формата в форматсетевой онтологии центрального сервера.OLAP-анализИспользуя схему онтологии, реализованы хранилище данных, среда визуальногоанализа сведений о месторождениях, позволяющая смотреть многомерные срезыOLAP-куба. Создан дружественный интерфейс работы со средой. Имеется возможностьграфически рассматривать 2- и 3-мерные срезы системы и задавать фильтрына другие измерения. Имеется возможность рассматривать иерархическую структуру.Система предоставляет возможность рассматривать и более многомерные срезыкуба в виде сводных таблиц. Проведен OLAP-анализ месторождений. Выделены закономерностив зависимостях расположения крупных месторождений лития и геологическиххарактеристик. Отдельно проведен анализ в геоэкономическом аспекте,проанализирована экономическая целесообразность добычи редких элементов в отвалахдругих месторождений. В систему интегрирован инструмент, позволяющийпреобразовывать информацию из таблиц хранилища данных в тройки «субъект» —«предикат» — «объект» сетевой онтологии и обратно.Машина выводаОпираясь на работу [3], проведен анализ имеющихся машин вывода. В онтологиидля работы с этими данными была интегрирована и настроена машина вывода Pellet(См. [4]). Заданы таблицы фактов и сформулированы логические правила. Проведенлогический анализ, получены новые истинные данные (по системе условий целостности).На основе этих данных проведен визуальный OLAP-анализ и получен ряддостоверных фактов о соотношениях сущностей системы.ЗаключениеСистема, созданная в ходе данной работы, продемонстрировала высокую эффективность.Проведенные испытания показали эффективность при поиске скрытыхвзаимосвязей характеристик месторождения и при оценке экономической эффективностидобычи. В случае использования на более крупных массивах данных система


Моделирование документооборота и делопроизводства 129позволит выделить скрытые взаимосвязи между характеристиками месторожденийи спрогнозировать экономическую эффективность ведения добычи как первичных,так и вторичных полезных ископаемых.Литература1. Усова Т.Ю., Архипова Н.А., Калиш Е.А., Комин М.Ф., Ключарев Д.С. Редкиеметаллы — сырьевое обеспечение инновационных технологий. — М.: ФГУП «ИМ-ГРЭ».2. Вершинин А.В., Дьяконов И.А., Ряховский В.М., Шкотин А.В. Архитектурараспределенной геоинформационной среды на основе формальных онтологиипространственных данных и сервисов // Геоинформатика. — 2008. — № 2.3. Bock J., Haase P., Ji Q.,Volz. Benchmarking OWL Reasoners // In: Proc. of theARea2008 Workshop, 2008.4. Sirin E., Parsia B., Cuenca-Grau B., Kalyanpur A., Katz Y. Pellet: A practical OWL-DL reasoner // Journal of Web Semantics. — 2007.УДК 681.3.06Моделирование документооборота и делопроизводстваФ.В. Яременко, А.Н. БездушныйВычислительный центр им. А.А. Дородницына РАНВведениеВ работе описана попытка моделирования отрасли деятельности документооборотаи делопроизводства. Структурная и целостная составляющие описаны с помощьюOWL-онтологий (OWL — Web Ontology Language) [1], функциональная —потоков работ в виде диаграмм BPMN (Business Process Model and Notation) [2]. Мырассчитываем, что использование этих двух аппаратов позволит формализовать делопроизводство,даст возможность гибко изменять поведение системы электронногодокументооборота (СЭД) в соответствии с регламентами, бизнес-процессами организации.Разработанная модель позволит описать документационное обеспечение управленияпредприятия, которое осуществляется с помощью разнообразных, сложныхсхем движения документов. Большинство существующих СЭД не содержат механизмисполнения таких схем, другие обеспечивают выполнение произвольных процессовдокументооборота с существенными ограничениями. Формальная и стандартная спецификацияowl-онтологий и бизнес-процессов обеспечивает возможность взаимодействияи, как следствие, поддерживает интеграцию систем и масштабируемость.ОбзорВ работе представлены две модели. Первая описывает предметную область документооборотаи делопроизводства. Вторая модель определяет функции и сущностиСЭД как автоматизированной системы.Документооборот играет важнейшую роль в деятельности предприятия, так какдокументы являются инструментом управления. С помощью документов производитсявзаимодействие между должностными лицами, подразделениями, они содержатинформацию о всех управленческих решениях. Маршруты движения документовотображают последовательность исполнения управленческих и производственныхбизнес-процессов. Система электронного документооборота позволяет автоматизироватьпроцесс управления движением документов, а значит, в том числе позволяетавтоматизировать процессы предприятия, а также контроль за их исполнением.


130 Ф.В. ЯременкоДля того чтобы спроектировать, реализовывать и внедрять систему электронногодокументооборота в деятельность предприятия, необходимо выявить, проанализироватьи смоделировать его бизнес-процессы и потоки движения документов, затемих формализовать и описать (специфицировать). Перед описанием бизнес-процессовнеобходимо задать объекты, над которыми будут производиться действия в этихпроцессах. Объекты, например организационная структура любой сложности илииерархически связанные документы, описаны в модели с помощью owl-онтологий. Наоснове модели объектов предприятия создаётся конфигурация системы нормативносправочнойинформации, которая является важным компонентом СЭД. Описаниебизнес-процессов строится с помощью семантических элементов предметной области,которые раскрываются в подпроцессы нотации BPMN 2.0 [2]. Нотация BPMN2.0 формализует описание бизнес-процессов на уровне детализации, позволяющемисполнять их на программных платформах, поддерживающих этот стандарт моделирования.Описание процессов документооборота с помощью семантических элементов даётвозможность разрабатывать и изменять бизнес-процессы не только программистам,но и специалистам по документообороту и управляющим.ЗаключениеИспользуемый в работе подход позволяет быстро изменять описание предметнойобласти, выраженное в виде owl-онтологий. Также предоставляется возможностьлегко менять описание бизнес-процессов делопроизводства, проектироватьсложные бизнес-процессы организации и интегрировать в делопроизводство смежные/граничныебизнес-процессы. Одним из итогов работы является создание СЭД,в основе которой лежит платформа управления бизнес-процессами. Полученная модельпозволяет реализовать шлюзы, с помощью которых консолидируется работаразличных СЭД, имеющих различные системы понятий, операции и интерфейсы.Эти шлюзы можно применять, например, в территориально-распределённых организацияхи межведомственном взаимодействии.Литература1. OWL Web Ontology Language Semantics and Abstract Syntax / ed. by Deborah L.McGuinness, Frank van Harmelen —http://www.w3.org/TR/2004/REC-owl-features-20040210/2. Business Process Model and Notation. Version 2.0 —http://www.omg.org/spec/BPMN/2.0/УДК 681.3.06Формализация федерального закона о государственныхзакупках с помощью потоков работФ.В. ЯременкоВычислительный центр им. А.А. Дородницына РАНВведениеВ работе рассматривается попытка выражения требований Федерального Закона№ 94 «О размещении заказов на поставки товаров, выполнение работ, оказаниеуслуг для государственных и муниципальных нужд» (94-ФЗ) [1] в виде формальногоописания соответствующих бизнес-процессов, специфицированных в виде BPMN


Формализация федерального закона о государственных закупках с помощью потоков работ 131потоков работ (workflow). Модель процессов 94-ФЗ разработана с целью упрощенияавтоматизации их реализации в государственных и коммерческих структурах. Формализацияправовых актов позволяет выявить неточность, неясность, неполноту ипротиворечивость законодательства.Актуальность задачиНа сегодняшний день большое количество торгов по государственным заказампроисходит в электронной форме. Основным документом, положившим начало появленияэлектронных торговых площадок и описывающего процедуры осуществлениязакупок для государственных и муниципальных нужд, стал Федеральный закон №94-ФЗ. Разработчики автоматизированных информационных систем, опирающихсяна нормативно-правовые акты, имеют различные интерпретации законодательства,ограниченные возможностями этих систем. Разработка спецификации законодательствав нотации BPMN 2.0 (Business Process Model and Notation) [2]даёт возможностьполучить единый набор формальных моделей, описывающий нормативно-правовыеакты, предназначенный для многократного использования и исключающий двойственностьинтерпретации. Описание бизнес-процессов российского законодательствапозволит строить автоматизированные информационные системы, применимыеи в государственных, и в коммерческих организациях.ЗаключениеБизнес-процессы, полученные при формализации Федерального закона № 94-ФЗ,были применены в разработке электронной торговой площадки для задания порядкаторгов, их контроля и мониторинга. Были внесены поправки в модели в соответствиис изменениями в законодательстве и протестирована площадка, оцененакорректность работы. В будущем планируется использовать описанный подход дляформализации различных федеральных законов и других законодательных актах.Литература1. Федеральный Закон № 94 «О размещении заказов на поставки товаров, выполнениеработ, оказание услуг для государственных и муниципальных нужд» от 21июля 2005 г. — URL:http://www.consultant.ru/online /base/?req=doc;base=LAW;n=1005962. Business Process Model and Notation. Version 2.0 — URL:http://www.omg.org/spec/BPMN/2.0/


132 А.А. Пантелеймонов, А.В. Гапон, Ю.Н МанойлоСекция системного программированияи программной инженерииУДК 519.688Подход к масштабированию систем комплексной обработкисобытийА.А. Пантелеймонов, А.В. Гапон, Ю.Н МанойлоИнститут кибернетики им. В.М. Глушкова НАН УкраиныЗадача обработки потоков данных с низкими задержками эффективно и с высокойстепенью масштабируемости решается в рамках парадигмы комплексной обработкисобытий (Complex Event Processing, CEP [1]). Причем этот подход достаточноуниверсален. Он применим к информационным потокам разной природы и не зависитот предметной области. Обеспечивается такой универсализм прежде всего засчет декомпозиции процессов обработки на элементарные логические блоки, обменивающиесямежду собой сообщениями (событиями) [2].Высокая степень масштабируемости реализуется в первую очередь за счет перестраиваемойтопологии графа обработки событий. Причем обмен событиями можетпроисходить как локально, так и с использованием траспорта удаленных вызовов.Исходя из самой концепции обмена событиями, наиболее эффективно будет работатьасинхронный транспортный слой, так как процесс доставки является односторонним.Тем не менее это не снимает с транспортного протокола задач контроля успешной доставкисобытий с возможностью перенаправления событийного потока с отказавшихузлов на исправные.Распределенная модель обработки, допускающая встраивание различных транспортов,скрыта на уровне CEP-каналов. Такой подход позволяет на уровне конфигурацииуправлять поддерживаемыми транспортными протоколами индивидуальнодля каждой пары связанных узлов в топологии CEP. Допускается одновременнаяподдержка нескольких типов транпорта. Изначально были реализованы транспортыпо протоколам RMI [3], CORBA [4] и SOAP [5].Наиболее эффективным в условиях гомогенной архитектуры показал себя транспортRMI. Однако для задач с повышенными требованиями к пропускной способностии рассчитанных на экстремально низкие задержки прохождения событийныхпотоков внутри графа в случае распределенной топологии потребовался еще болеебыстрый транспорт, который помимо прочего должен еще обладать низким показателемгенерируемого объектного мусора.Для оптимизации межсерверного обмена сообщениями был опробован протоколQTP, удовлетворяющий выдвинутым требованиям, реализация которого входит вбиблиотеку с открытым исходным кодом QDS (Quick Data Signaling) [6]. Были произведенызамеры производительности передачи сообщений, которые в выбранноймодели тестирования показали в среднем улучшение на 30% по сравнению с RMIтранспортом как в пропускной способности за счет сжатия и более компактной се-


Локальное планирование движения на основе случайных деревьев 133риализации передаваемых данных, так и во временных задержках прохождения событийза счет асинхронного характера доставки.Таким образом, существующая система обработки событий дополнена еще однойреализацией транспортного уровня, обладающей к тому же наилучшими скоростнымипоказателями. Полученные результаты справедливы для режима передачи событийпо протоколу QTP поверх TCP/IP. В случае низлежащего протокола HTTP,выбор которого может быть продиктован особенностями изоляции сетей, в которыхрасположены источник и приемник событий, результаты не столь однозначны и требуютдополнительных исследований.Литература1. Luckham David. The Power of Events: An Introduction to Complex Event Processingin Distributed Enterprise Systems. – Addison-Wesley, 2002. — 400 p.2. Пантелеймонов А.А., Гапон А.В., Манойло Ю.Н., Щетинин Д.И., Черевко О.В.Комплексная обработка событий // <strong>Труды</strong> 52-й научной конференции МФТИ.Современные проблемы фундаментальных и прикладных наук. Часть VII. — М.:МФТИ, 2009. — C. 34–35.3. Grosso William. Java RMI. — O’Reilly Media, 2001. — 574 p.4. Slama Dirk, Russell Perry, Garbis Jason. J. Enterprise Corba. — Prentice Hall Ptr,1999. — 464 p.5. Snell James, Tidwell Doug, Kulchenko Pavel. Programming Web Services with SOAP.— Prentice Hall Ptr, 2001. — 262 p.6. Quick Data Signaling. URL:http://sourceforge.net/projects/qds/УДК 004.023Локальное планирование движения на основе случайныхдеревьевВ.А. Золотов 1 , К.С. Петрищев 1,21 Институт системного программирования РАН2 Московский физико-технический институт (государственный университет)Задачи планирования движения возникают в различных предметных областях,связанных с робототехникой, анимацией, логистикой. Особый интерес задачи планированиявызывают в контексте применения систем управления проектами с учетомпространственно-временных факторов. Подобные системы обеспечивают визуальноемоделирование и анализ проектных планов с позиций технологической корректности,предполагающей наличие бесконфликтных маршрутов для устанавливаемых объектоввозводимых конструкций. С математической точки зрения классическая задачапланирования движения формулируется как поиск траектории для перемещаемоготвердого тела, которая бы исключала столкновения с неподвижными препятствиямипространственно-трехмерной сцены.Известно множество подходов к решению этой задачи, такие как диаграммы Вороного,графы видимости, обобщенные конусы, конфигурационные пространства,пространственная декомпозиция, методы потенциальных полей. Важное место в теориии практике планирования движения занимают методы, основанные на случайномсемплировании пространства и, в частности, на RRT- и PRM-деревьях. Данные алгоритмы,как правило, не требуют трудоёмкого предварительного анализа сцены испособны работать в конфигурационных пространствах высокой размерности.


134 В.А. Золотов, К.С. ПетрищевПредставленная работа посвящена исследованию и развитию семейства RRTалгоритмов.Классические алгоритмы этого семейства основаны на так называемыхоперациях «extend» и «connect», которые обеспечивают добавление новых вершиндерева на основе случайного выбора и целенаправленного продвижения к опорнымточкам соответственно. Сочетание этих двух операций порождает семейство алгоритмов,наиболее известным представителем которого является алгоритм «extendconnect».Чередование операций для деревьев, одновременно проращиваемых от начальнойи конечной точек пути, обеспечивает равномерное покрытие конфигурационногопространства и дополнительные преимущества в эффективности. Вместе стем расширение деревьев только на основе случайного выбора новых вершин приводитк их большим размерам и избыточному количеству тестов на столкновения спрепятствиями сцены.В представленной работе предлагается модификация обсуждаемого RRT-алгоритма,принимающая во внимание габариты объектов сцены и применяющая болееосмысленную стратегию выбора перспективных вершин, нацеленную на прохождениевстреченных препятствий. В частности, предусматривается выбор вершин в плоскости,перпендикулярной к текущему направлению движения, на расстоянии, соразмернымс габаритами встреченного препятствия. В случаях сложной конфигурациипрепятствий и неудачного применения описанной стратегии алгоритм возвращаетсяк классической схеме случайного выбора вершин.В работе обсуждаются особенности и преимущества предложенного алгоритма, атакже приводятся результаты проведенных вычислительных экспериментов.Рис. 1. Схема работы операции EXTENDЛитература1. Steven M. Algorithms. — Cambridge: Cambridge University Press, 2006. — 1020 с.2. Steven M. LaValle, James J. Kuffner Jr RRT-Connect: An efficient Approach toSingle-Query Path Planning // IEEE Conference on Robotics and Automation. —2000.


Верификация времени исполнения распределенных систем 135УДК 004.052.2+004.75Верификация времени исполнения распределенных системГ.А. Дубовик, В.А. ПетрухинМосковский физико-технический институт (государственный университет)Распределённые системы играют значительную роль в разработке и функционированиисовременного программного обеспечения. Несмотря на это, задача верификациираспределённых систем остаётся нерешённой.Существует несколько причин, по которым традиционные методы верификациимонолитного программного обеспечения теряют эффективность в случае распределённыхсистем. Во-первых, ввиду своего параллельного исполнения, гетерогенностиэлементов и недетерминированности среды передачи сообщений, модели распределённыхсистем обладают большим пространством состояний, что затрудняетиспользование методов проверки модели [1]. Средства автоматического доказательстватеорем могут преодолеть высокую сложность распределённых систем, однако ихприменение требует особой организации процесса разработки [2] или же проведенияинтерактивной верификации [3]. Как показывает практика, частично проблему верификацииможет решить тестирование, в частности юнит тесты, хотя часто они неспособны обнаружить проблемы, связанные с параллельным исполнением элементовраспределённой системы [4]. В то же время в случае высокораспределенных системсистемное тестирование может быть дорогостоящим, трудоёмким и малоэффективным.В отличие от традиционных методов верификации мониторинг, или верификациявремени исполнения, не позволяет предотвратить возникновение ошибок в поведениипрограммной системы. Средства мониторинга призваны обнаруживать возникшиеаномалии, что позволяет локализовывать ошибки, а также проводить мероприятияпо восстановлению системы [5].Основное преимущество верификации времени исполнения по сравнению с методамипроверки модели или тестированием заключается в том, что в каждый моментвремени системе мониторинга необходимо исследовать поведение целевой системы вокрестности текущего состояния, текущей трассы. Тем самым решаются проблемысложности и недетерминированности верифицируемой системы. Тем не менее средствамониторинга вынуждены решать ряд новых проблем, не возникающих в ходетрадиционной верификации.Одной из таких проблем является неустойчивость сетевого окружения. Системамониторинга исполняется в том же окружении, что и целевая система. Следовательно,она должна корректно обрабатывать всевозможные сетевые аномалии: недетерминированныезадержки, потери, искажения и повторы пакетов.В ходе нашего исследования нам удалось разработать распределённый алгоритммониторинга, обладающий гарантированными свойствами в средах с сетевыми аномалиями.Нами было доказано, что он обеспечивает полноту верификации автоматныхспецификаций в средах с гарантированной доставкой сетевых сообщений и корректностьверификации в средах с аномалиями [6].Литература1. Leucker M., Schallhart C. A brief account of runtime verification // J. Log. Algebr.Program. — 2009. — N 78(5). — P. 293–303.2. Wang A., Loo B.T., Liu C., Sokolsky O., Basu P. A theorem proving approach towardsdeclarative networking // In Proc. of 22nd International Conference on TheoremProving in Higher Order Logics. — 2009.


136 А.Е. Бобков, С.В. Клименко3. Win T.N. Theorem-proving distributed algorithms with dynamic analysis // Master’sthesis. — Massachusetts: MIT. — 2003.4. Rushby J. Just-in-time certification // In Proc. of 12th IEEE International Conferenceon the Engineering of Complex Computer Systems. — 2007. — P. 15–24.5. Patterson D. [et al.] Recovery Oriented Computing (ROC): Motivation, Definition,Techniques, and Case Studies // Computer Science Technical Report. — Berkeley:U.C. Berkeley, 2002.6. Дубовик Г.А. Мониторинг высоко распределённых многоагентных систем // Магистерскаяработа. — М.: МФТИ, 2010.УДК 004.92Исследование и разработка методов добавления деталейк модели рельефаА.Е. Бобков, С.В. КлименкоМосковский физико-технический институт (государственный университет)В современных геоприложениях используются спутниковые и аэрофотоснимкис разрешением 0.5 метра и больше. Этого достаточно, чтобы разглядеть важныедетали в режиме полёта на высоте несколько десятков или сотен метров. Но в режимепрогулки, при движении на уровне земли, снимок начинает расплываться. Такжестановится существенной вертикальная ошибка высотных данных, которая можетдостигать 10 м и больше, что приводит, например, к наклону поперечного профилядорог [1]. Возникает необходимость добавления к рельефу деталей с масштабом ∼1см и корректировки высоты рельефа в заданных местах.Цель данной работы — исследование и разработка способов задания деталей, источниковданных для деталей, необходимых видов деталей и инструментария длявизуализации этих деталей.Корректировка рельефа необходима двух типов: выравнивание областей по заданнойвысоте, выравнивание поперечного профиля линий с заданной шириной. Впервом случае это используется для водоемов и площадок под зданиями. Во второмслучае — для тропинок, дорог, рек.Детали, которые можно добавлять к рельефу: дороги с текстурой асфальта, сознаками дорожного движения, растительность, 3D-модели зданий, любые другие искусственныесооружения.Каждую деталь можно создавать вручную, например, модели зданий или отдельныхзначимых деревьев. Другие проще генерировать программно по образцу:дороги, множество однотипных деревьев, траву [2]. В этом случае необходимо задатьгеометрический примитив (точку, линию, область), описывающий данную деталь, идобавить метаданные, описывающие интерпретацию данного примитива: параметрыдороги, тип деревьев. Метаданные удобно хранить в виде тегов. Каждый тег — этопара «ключ» — «значение».Для задания базовой геометрии для деталей можно использовать формат KML.KML позволяет добавлять свои произвольные метаданные к геометрии. Например,вот метаданные для дороги:


Регрессионное тестирование технологической цепочки компиляторов GCC для новой архитектурыпроцессоров 1372.0Для быстрого задания большого числа деталей можно использовать и данные изпроекта OpenStreetMap, где они хранятся похожим образом.Далее при загрузке файла с данными в приложение можно в зависимости от теговгенерировать нужные детали [3].В рамках данной работы разработан модуль для приложения «Виртуальная Земля»для спрямления областей и создания дорог и деревьев. Модуль генерирует дорогизаданной ширины с текстурой асфальта, разметкой, знаками дорожного движенияи деревьями по краям дороги. Модуль позволяет также размещать индивидуальныедеревья по точкам и заполнять области случайно расставленными деревьями (рис. 1).В дальнейшем планируется реализовать загрузку данных OpenStreetMap и добавитьболее разнообразные детали.Рис. 1. Территория вокруг Ленинградской атомной электростанцииЛитература1. Cozzi Patrick, Ring Kevin. 3D Engine Design for Virtual Globes. — CRC Press, 2011.2. Whatley D. Toward photorealism in virtual botany // GPU Gems. — V. 2. — P. 7–25.3. Carucci F. Inside geometry instancing // GPU Gems. — 2005. – V. 2.УДК 681.3.068Регрессионное тестирование технологической цепочкикомпиляторов GCC для новой архитектуры процессоровС.П. Прохоров 1 , Т.И. Сергеева 21 Институт системного программирования РАН2 Институт точной механики и вычислительной техники РАНВ связи с большим разнообразием вычислительных систем возникает проблемаэффективного использования аппаратных ресурсов многоядерных архитектур процессоров,которые существуют уже много лет, но до сих пор не имеют адекватныхметодов программирования, учитывающих особенности архитектуры. Для любой новойархитектуры необходимо написать специфичные для данной архитектуры служебныепрограммы, операционную систему, разработать компиляторы с использованиемосновных языков программирования.


138 С.Н. НечуйвитерПри традиционном подходе разработка программного обеспечения требует значительныхвременных затрат и затрат по сопровождению. Для решения проблемы впоследнее время стали активно применять Open Source разработки (разработки с открытымисходным кодом), в том числе GNU/Linux. Помимо операционной системыGNU включает в себя большое число служебных программ и набор компиляторовдля различных языков программирования — GNU Compiler Collection.Применение Open Source-разработки GNU GCC упрощает задачу переноса компиляторовна новые архитектуры, экономит время и ресурсы, однако остается проблематестирования программного продукта, его соответствия заявленным спецификациям.Эта задача решается с помощью системы регрессионного тестирования длякомпиляторов. Регрессионное тестирование — это основная задача верификации компиляторов,программных компонент, являющихся составной частью любой архитектуры.Главными целями регрессионного тестирования являются поддержка качестваи надежности существующего программного продукта после внесения изменений [1].Регрессионное тестирование проводится с целью проверки корректности работы программыпосле добавления новых функций, улучшений и исправленных дефектов длягарантии того, что существующая функциональность продукта не была повреждена,и исправления не повлекли за собой ошибки в работе программы. Регрессионноетестирование часто используется для оценки качества полученного результата[2]. Например, при прогоне регрессионных тестов для проверки функциональностикомпилятора рассматривается размер получаемого кода, скорость его выполнения ивремя компиляции каждого из тестовых примеров.В данной работе предлагается новый подход к регрессионному тестированию компиляторов,учитывающий специфические особенности разрабатываемой новой архитектуры.В процессе разработки модифицируется система команд и используетсясвободно распространяемая многоплатформенная система компиляции. Из-за постоянныхизменений и обновлений программного продукта возникает необходимость отслеживаниясистемы компиляторов на регрессию. Данный подход предусматриваетразработку новой методики распределенного тестирования компиляторов, включающийвозможность распараллеливания различных вычислительных задач через системуgrid Condor, и реализацию системы автоматизации регрессионного тестированиякомпиляторов. Преимуществами данного подхода являются повышение скоростии надежности тестирования, возможность повторного использования и выполнениятестов в полном объеме.Литература1. Кичигин Д.Ю. Метод редукции тестового набора для регрессионного интеграционноготестирования. – M.: Программирование, 2009. — 59 c.2. Липаев В.В. Тестирование компонент и комплексов программ. — М.: СИНТЕГ,2010. — 392 с.УДК 519.226О возможности аддитивной агрегации шахматных рейтинговС.Н. НечуйвитерФизико-технический учебно-научный центр НАН УкраиныВ докладе рассматривается возможность организации аддитивной агрегации шахматныхрейтингов. Актуальность этой задачи обусловлена тем, что хотя методы рей-


О возможности аддитивной агрегации шахматных рейтингов 139тингования развиваются уже более 50 лет, быстрый рост числа играемых в год шахматныхпартий обеспечивает необходимость поиска более быстрых и масштабируемыхалгоритмов.С 1970 года система рейтингов Эло принята международной шахматной федерациейFIDE за основу при решении вопросов, связанных с присвоением званийгроссмейстера и международного мастера, комплектованием отборочных и другихтурниров и так далее. На основании байесовского подхода и анализа имеющейсяистории шахматных партий в 2001 году была предложена система Gliko, а в 2005году — Chessmetrics соответственно. В феврале 2011 года FIDE и консалтинговаякомпания Deloitte разместили на сервере задач по интеллектуальному анализу данныхkaggle.com условия соревнования по созданию более точной системы шахматныхрейтингов, пообещав весомое вознаграждение победителям [1]. И, хотя среди новыхалгоритмов и присутствуют более быстрые и точные решения, чем ранее, ни один изних не решает проблему масштабируемости.В данном докладе автор предлагает использовать предложенную в [2] концепцию«опыта»для построения процедуры аддитивной агрегации шахматных рейтингов.Это позволит вычислять локальные рейтинги игроков, а потом просто складыватьих в один глобальный рейтинг.В докладе рассматриваются две процедуры агрегации: по абсолютному значениюрейтингов и по разнице в рейтингах игроков. Обе процедуры учитывают наличиеинформации о неопределенности знания рейтингов игроков. Для построения локальныхрейтингов использовался алгоритм Glicko [3]. Также рассматривается смешанныйалгоритм, часто чередующий вычисление промежуточных результатов Glicko сих агрегацией.Сравнение алгоритмов проводилось по точности абсолютных величин, полученныхв результате агрегации рейтингов, по точности расстояний между рейтингамии по информационному расстоянию Кульбака—Лейблера между истинным и результатирующимраспределением вероятностей исходов партий [4].С помощью моделирования на модельных данных показано, что позиционная агрегацияточнее, чем агрегация по разнице в рейтингах; а предложенный гибридныйалгоритм агрегации по всем критериям в разы лучше, чем исходный Glicko, для случаяс объединения игроков в группы, близкие по рейтингу. Именно такая ситуацияимеет место на практике при организации шахматных турниров.Литература1. Deloitte/FIDE Chess Rating Challenge [Электронный ресурс]. — Режим доступа:http://www.kaggle.com/c/ChessRatings22. Нечуйвитер С.Н. Восстановление и агрегация экспертного опыта // Вычислительныйинтеллект (результаты, проблемы, перспективы): Материалы 1-й Международнойнаучно-технической конференции (10–13 мая 2011 года, Черкассы).— Черкассы: Маклаут, 2011.3. Glickman M.E. Parameter Estimation in Large Dynamic Paired ComparisonExperiments // Journal of the Royal Statistical Society: Series C (Applied Statistics).— 1999. — Vol. 48, N 3. — P. 377–394.4. Клир Д. Системология. Автоматизация решения системных задач / пер. с англ.— М.: Радио и связь, 1990. — 544 с.


140 А.Н. ЧернодубУДК 681.513.7Метод смешивания мнений экспертов комитета нейронныхсетей на основе расширенного фильтра Калмана для задачипрогнозирования временных рядовА.Н. ЧернодубИнститут проблем математических машин и систем НАНУПрогнозирование временных рядов является актуальной научной задачей, имеющеймножество применений в экономике, физике, теории управления и других отраслях.Хорошим практическим методом решения задачи прогнозирования временныхпоследовательностей являются нейронные сети. Нейронная сеть может быть обученана известных примерах моделируемой последовательности и затем использоватьсядля прогнозирования на новых, ранее не виденных нейросетью примерах данных.Популярным способом повышения качества работы нейросетей является использованиекомитетов экспертов [1]. В этом случае система прогнозирования состоит изнескольких нейронных сетей-экспертов, функционирующих параллельно, и обобщающегомодуля, который принимает финальное решение. Использование комитетовэкспертов обычно дает небольшой, порядка 1–5%, прирост качества работы системы,однако и такое улучшение может быть очень существенно. Например, именноиспользование комитетов нейронных сетей обеспечило команде из Швейцарии победув соревновании «German Traffic Sign Competition» на конференции IJCNN’11 засчет улучшения в 0.42% по сравнению с результатом, полученным на одиночной нейроннойсети [2]. Мы предлагаем новый алгоритм смешивания мнений экспертов длякомитета нейронных сетей на основе использования расширенного фильтра Калмана,который выполняет перевзвешивание весов обобщающего модуля в режиме онлайн, ипроводим экспериментальное исследование этого алгоритма. Экспериментально устанавлено,что качество прогнозирования повышается примерно на 2% по сравнению снаилучшей одиночной нейросетью из множества обученных сетей в количестве 1000штук. Это в 1.5–2 раза лучше, чем обычные методы усреднения по комитету и взятиямедианного значения. Такое повышение качества прогнозирования объясняется, вопервых,фактическим дообучением комитета на выборке данных в ходе его работыи, во-вторых, эффективностью алгоритма расширенного фильтра Калмана, которыйфункционирует как оптимизационный метод второго порядка.Для проведения экспериментов был использован стандартный для данного типазадач процесс Маккея–Гласса [3].


Система трекинга для оценки 3D-восприятия в спорте 141Рис. 1. Деление процесса Маккея–Гласса на обучающую (TRAIN), тестовую (TEST)и валидационную (VALIDATION) последовательностиЛитература1. Хайкин С. Нейронные сети: полный курс. — М.: ИД «Вильямс», 2006. — С. 458.2. Ciresan D.C., Meier U., Masci J., Schmidhuber J. A Committee of Neural Networksfor Traffic Sign Classification // Proceedings of IEEE International Joint Conferenceon Neural Networks - USA, San Francisco, July 31 – August 5, 2011. — P. 1918–1921.3. Alessandri A., Cuneo M., Pagnan S., Sanguineti M.On the convergence of EKFbasedparameters optimization for Neural Networks // Proceedings of the 42nd IEEEConference on Decision and Control - Maui, Hawaii, USA, December 2001. — V. 6. —P. 6181–6186.УДК 004.923Система трекинга для оценки 3D-восприятия в спортеВ.П. Алешин 1,2 , В.М. Кулиев 21 Московский физико-технический институт (государственный университет)2 ЗАО «Меркурий»Актуальность визуального восприятия для спорта рассмотрена в [1],[3]. На мировомрынке существуют системы трекинга, но они являются коммерческими разработкамикрупных компаний, и алгоритмы их работы недоступны. Существующиенаучные исследования в области отслеживания предметов по точности, требованиямк оборудованию сильно отстают от закрытых коммерческих проектов. Тема актуальнав наше время по причине широкого распространения электроники в спорте ирассмотрена в [2].В данной работе алгоритмы трекинга рассматриваются на примере каретки горнолыжноготренажера.Свойства, используемые для определения координаты отражения светодиода:• большая яркость;• малые размеры.Алгоритм нахождения координат светодиода:• слабое размытие с целью убрать шум;


142 В.П. Алешин, В.М. Кулиев• cреднецветовое размытие для получение изображения фона;• вычитание фона из изображения, в результате которого остается яркая точкаотражения светодиода;• получаем распределение ярких точек по осям x, y для предыдущего изображенияи размываем его;• находим наиболее яркую точку для каждой оси;• определяем границу изображения отражения светодиода по уровню 0.5 длякаждой оси;• получаем точные координаты отражения, как центр масс распределений, длякаждой оси.Рис. 1. Горнолыжный тренажерЛитература1. Williams A.M., Davids K., Williams J.G. Visual perception and action in sport. —London, E & FN Spon, 1999. — P. 1–468.2. Rauschenbach B.V., «Perspective systems in art. The general theory of perspective»,Moscow, Nauka, 1986. — P. 1–256. (in Russian).3. Visual 3d perception of the ski course and visibility factors at virtual space. VladimirAleshin, Valery Afanasiev, Alexander Bobkov, Stanislav Klimenko, Senior MemberIEEE and ACM, Vitaly Kuliev, Dmitry Novgorodtsev // Proc. Of InternationalConference. SYBERWORDS 2011 Banff, Canada. — P. 222–228.


Интеллектуальные системы аутентификации, авторизации и аудита как метод обеспечения сетевойбезопасности информационных систем на примере системы Mосковского физико-техническогоинститута 143УДК 681.3.06Интеллектуальные системы аутентификации, авторизациии аудита как метод обеспечения сетевой безопасностиинформационных систем на примере системы Mосковскогофизико-технического институтаЯ.В. Гевличев, М.Н. Данилин, А.В. БалашовМосковский физико-технический институт (государственный университет)Обеспечение безопасности информационных систем можно разделить на две группыпроблем: безопасность компьютера и сетевая безопасность. Здесь под сетевой безопасностьюпонимают все вопросы, связанные с взаимодействием устройств в сети.Главными направлениями обеспечения сетевой безопасности являются вопросы защитыданных в момент передачи информации по линиям связи и защита от несанкционированногодоступа в сеть. Именно ко второму направлению и относятся сервисыAAA (Authentication, Authorization, and Accounting).Необходимость данных сервисов в любой современной информационной системеявляется очевидным фактом. Аутентификация предотвращает доступ к сети нежелательныхлиц и разрешает вход легальным пользователям. Аутентификация — этопроцедура доказательства пользователем того, что он есть тот, за кого себя выдает.Обычно она подразумевает использование логина и пароля. Авторизация позволяетконтролировать доступ легальных пользователей к ресурсам системы, предоставляякаждому из них именно те права, которые ему были определены администратороминформационной системы. Аудит — фиксация в системном журнале событий, связанныхс доступом к защищаемым системным ресурсам.Любая современная компания, естественно, имеет необходимость в использованиисервисов AAA [1]. Однако часто из-за недостаточной интегрированности сервисоввозникают проблемы, связанные с большим числом «информационных барьеров».Под «информационным барьером» здесь понимается любая форма авторизации, которуюпользователь встречает при работе в системе.Рассмотрим плюсы и недостатки сервисов AAA на примере реализованной общеинститутскойсистемы авторизации Московского физико-технического института.Система контроля доступа к сети Интернет построена на основании принциповконтроля доступа и обеспечения сетевой безопасности и в полной мере реализует последовательнуюаутентификацию и авторизацию пользователей, а также обеспечиваетобезличенное логгирование данных доступа, то есть их учет. Система обладаетследующими достоинствами:— многомерная аутентификация — упрощение аутентификации за счет использованияединой процедуры доступа (single sign-on) из любой точки сети. Даннаясистема использует профили абонентов для предоставления высококачественныхуслуг, настроенных на потребности каждого пользователя;— интеграция на оперативном уровне (operational integration0 — упрощение управлениясетью, используемое для доставки множества услуг;— интегрированная система управления правилами (policies) — эта функция позволяетдинамически менять параметры QoS для каждого абонента. Распространениеинтеллектуальных функций на сетевую периферию повышает масштабируемостьи эффективность управления правилами.Система не в полной мере реализует принцип глубокой интегрированности сервисов.Также система в некоторой мере исключает один из «информационных барье-


144 А.А. Манаенкова, Т.В. Пустовойров» — необходимость регулярной авторизации в системе, что может служить какположительным критерием в оценке системы, так и пробелом в безопасности.Но стоит заметить, что введенная система авторизации обеспечивает широкуюсовместимость с разными платформами и построена на открытых стандартах (DHCP[2], RADIUS [3] и прочих), что позволяет системе выступать в качестве открытойинтеграционной точки, объединяющей функции управления сервисами и сетями, атакже сокращающей до минимума необходимость межсетевых операций. Все это позволяетсосредоточиться на быстром внедрении новаторских услуг. Это обеспечиваетвозможность модернизации и расширения системы.Рис. 1. Схема системы авторизации доступа в сеть Интернет Московского физикотехническогоинститутаЛитература1. Kaufman С., Perlman R., Speciner M.Network Security: Private Communication in aPublic World (2nd Edition) – Prentice Hall PTR, 2002. — 471 c.2. RFC2131 – Dynamic Host Configuration Protocol –http://tools.ietf.org/html/rfc21313. RFC2865 – Remote Authentication Dial In User Service (RADIUS) –http://tools.ietf.org/html/rfc2865УДК 004.912Модуль шаблонной генерации документовперсонализированной образовательной среды SIMLearnА.А. Манаенкова 1 , Т.В. Пустовой 21 Московский физико-технический институт (государственный университет)2 Физико-технический учебно-научный центр НАНУPLE SIMLearn — персонализированная образовательная среда, реализующая концепциистандартов образовании третьего поколения и предназначенная для содействияорганизации персонализированного, компетентностно-ориентированного учебногопроцесса [1].Одной из задач, с которой сталкиваются участники учебной и научной деятельности,является необходимость создания и заполнения различных стандартизированныхдокументов, например, индивидуальный план, заявление на работу и т. д.Зачастую заполнять эти документы приходиться вручную, неоднократно вводя однуи ту же информацию и допуская ошибки.Для решения этой проблемы была разработана гибкая система шаблонной генерацииразличных документов. В тесной интеграции с основной базой данных PLESIMLearn она позволяет на основании собранной о пользователях информации автоматическиформировать большую часть документов. Если данные, необходимые для


Особенности интеграции персонализированного образовательного пространства вузов в коммуникационноепространство виртуального Сколково 145формирования каких-либо документов, отсутствуют, то пользователю предоставляетсявозможность ввести необходимые данные, которые в дальнейшем могут бытьиспользованы для формирования документов, содержащих схожие данные.Ключевой частью платформы является система преобразования шаблонов. Шаблоныдокументов сверстаны в формате LaTeX. На выходе работы системы, мы можемполучить документы в различных форматах (PDF,PNG и другие).Для модуля были подготовлены шаблоны основных документов, с которыми сталкиваютсяобучаемые в процессе образовательного процесса.Благодаря способу реализации в виде отдельного модуля, система шаблонной генерациидокументов может быть повторна интегрирована в различные проекты, гденеобходима гибкая генерация бумажных документов по множеству данных.Рис. 1. Механизм работы системыЛитература1. Манаенкова А.А., Пустовой Т.В. SIMLearn – система поддержки дистанционногои смешанного обучения с учетом стандартов третьего поколения // <strong>Труды</strong>52-й научной конференции МФТИ «Современные проблемы фундаментальных иприкладных наук». — 2009. — Ч. 7. — Т. 2 — С. 26–28.2. Manaenkova Anna, Pustovoy Taras PLE SIMLearn: Russian Approach to PersonalLearning Environments with the Support of 3rd Generation Educational Standards// Proceedings of World Conference on Educational Multimedia, Hypermedia andTelecommunications. — 2010. — P. 1023–1027.УДК 004.72Особенности интеграции персонализированногообразовательного пространства вузов в коммуникационноепространство виртуального СколковоТ.В. ПустовойФизико-технический учебно-научный центр НАНУОдной из целей, которую ставит перед собой проект «Сколково», является построениепартнерских взаимовыгодных отношений в высшими образовательными учреждениямикак в реальной, так и в виртуальной сфере. С этой целью была запущенаинновационная коммуникативная площадка на базе платформы Telligent. В рамкахэтой платформы разрабатывается ряд инструментов, которые дают возможностьпартнерам и участником интегрироваться в инфраструктуру виртуального Сколково.Наиболее ценной информацией, в обмене которой заинтересованы и вуз, и Сколково,является информация об «активностях» учащегося. Под «активностями» тутподразумевается множество релевантных действий в контексте организации, в которойэти действия совершаются. Примером таких действий со стороны вуза может


146 А.А. Шумилинбыть информация об участии в научных проектах, результатах сдачи экзаменов поконкретной дисциплине, результатах защиты дипломной работы. Со стороны Сколковопримерами «активностей» может быть участие студента в рабочих группах,проектах, стартапах, информация о трудоустройстве и т.д. Для передачи подобнойинформации каждой из сторон должно быть разработаны программные интерфейсы.УДК 004.451.42Виртуализация в высокопроизводительных вычислениях.Исправление кода гипервизора Palacios для использованиярежима Unrestricted Guest процессоров IntelА.А. ШумилинМосковский физико-технический институт (государственный университет)Институт системного программирования РАННесколько лет назад в архитектуре x86 (x86_64) появилась поддержка аппаратнойвиртуализации, что в теории даёт возможности для гибкого управления большимивычислительными ресурсами при сравнительно низких накладных расходах(overhead). Иными словами, вместо содержания множества разных серверов (см. терминcollocation), которые большую часть времени нагружены менее чем на половину,а при пиковых нагрузках могут и оказаться недостаточными, можно создавать датацентры,в которых будут стоять одинаковые серверы с большим количеством процессоров,большим объёмом оперативной памяти и дискового пространства, при этомкаждый клиент имеет возможность устанавливать и использовать тот набор программногообеспечения (ПО) и даже ту операционную систему (ОС), которую хочетдля своих нужд, оплачивать при этом ровно то количество ресурсов, которое нужно всреднем, при этом ещё и иметь возможность динамически (без перезапуска ПО) увеличивать/уменьшатьэто количество, реагируя на возрастающую/уменьшающуюсянагрузку.В сфере т.н. высокопроизводительных вычислений (High Performance Computing,HPC) такие возможности так же интересны, ибо вместо аренды целого кластера накакое-то время или написания ПО для использования в составе специальной средывыполнения (с учётом ОС и ПО, использованного на конкретном кластере) можнополучить ровно то количество вычислительных узлов и ту конфигурацию (подразумеваетсяколичество процессоров + объём оперативной памяти, приходящиеся наодин узел), которые нужны для конкретной задачи, и использовать при этом свойкомплект ПО без необходимости существенной адаптации. Кроме того, можно будетплатить только за те часы, в течение которых запускались задачи на выделенныхресурсах, а не за все 24 часа в тех сутках, на которые были получены ресурсы. Крометого, становится возможным повышать отказоустойчивость системы в целом: можнопрозрачно для гостевого ПО организовать миграцию между физическими серверами.Но в HPC среди прочего становится заметным и более важным один аспект:«шум» от других гостевых окружений (наборов ОС+ПО, запущенных другими клиентами),а так же самого гипервизора (программа, которая и следит за распределениемресурсов и изоляцией между т.н. гостевыми окружениями). Задержки (каквеличины, так и их распределение) могут очень серьёзно понизить общую производительностьвыделенной вычислительной системы. И если от «шума» других гостевыхокружений можно уйти, просто не выделяя разным гостям одни и те же процессорыи банки памяти, то с задержками (на перестройку таблиц страниц, на обработку прерыванийот физических устройств и преобразования полученной информации в то


Виртуализация в высокопроизводительных вычислениях. Исправление кода гипервизора Palaciosдля использования режима Unrestricted Guest процессоров Intel 147что должны выдать гостевой ОС виртуальные устройства и т.д.), вносимыми самимгипервизором можно бороться только специальным образом проектируя и реализуяего.Есть несколько связок такого ПО, которое можно удобно использовать в ролигипервизора. Примеры (управляющая ОС + модуль виртуализации) : Linux + KVM,Linux + XEN, KittenOS + Palacios. Последний из перечисленных представляет большойинтерес, т.к. разработчики стараются придерживаться идеи легковесного ядра(Lightweight Kernel, LWK), которое бы не содержало ничего, кроме самого необходимогофункционала, и как можно меньше мешало гостевым ОС. Некоторые тесты (задеталями лучше обратиться к сайту разработчиков http://www.v3vee.org/palacios/)показывают, что такая связка действительно имеет более низкий шум, чем другие. Нотак как это ПО разрабатывается практически с нуля, то имеет пока много недоработок.В частности, из-за того, что аппаратная виртуализация от AMD (SVM) намногопродуманнее и «изящнее» (речь идёт прежде всего об удобстве программирования,т.е. использования в составе ПО гипервизора), чем от Intel (VT, VMX), то сначала вPalacios появилась поддержка SVM, а потом уже стали пытаться приложить к этомуподдержку VMX, кроме того, полученный код недостаточно тестировался мягкоговоря недостаточно.Об одном из исправлений для улучшения этой поддержки и пойдёт речь в этомдокладе. Эти патчи разрабатываются очень небольшой командой (студентов и аспирантов)ИСП РАН и в ближайшее время будут посылаться (а некоторые уже былиотправлены) разработчикам.В силу ограниченности объёма и содержания тезисов, фрагменты исходного кодаи комментарии к ним находятся в полной версии статьи (pdf на сайте конференции).Надеюсь, этот доклад дал некоторую интересную информацию как о прикладномиспользовании аппаратной виртуализации в целом, так и о palacios и использованииbochs в частности. Быть может, изложение не очень хорошее, но это первый подобныйопыт для меня.Литература1. Intel® 64 and IA-32 Architectures Software Developer’s Manual. V. 2B.2. Intel® 64 and IA-32 Architectures Software Developer’s Manual. V. 3B.


Научное издание<strong>Труды</strong>54-й научной конференции МФТИПроблемы фундаментальных и прикладных естественных и технических наукв современном информационном обществеУправление и прикладная математика. Том 2Составители:А.Е. Алексеенко, А.В. Гасников, А.М. Казённов, Е.Г. Молчанов, Е.Ю. ЧиркинаРедакторы:В.А. Дружинина, И.А. Волкова, О.П. Котова, Л.В. СебоваНабор и вёрстка:А.Е. Алексеенко, Е.А. Аникушкина, А.М. Казённов, Д.М. Казённова,Е.А. Казённова, Н.Г. Петракова, Е.В. Пруцкова, Е.С. Шубина, Н.Д. ШуваловПодписано в печать 21.11.2011. Формат 60 × 84 1 ⁄16Усл. печ. л. 18,5. Уч.-изд. л. 17,0. Тираж 100 экз. Заказ № 120.Федеральное государственное бюджетное образовательноеучреждение высшего профессионального образования«Московский физико-технический институт(государственный университет)»141700, Московская обл., г. Долгопрудный, Институтский пер., 9Отдел оперативной полиграфии «Физтех-полиграф»141700, Московская обл., г. Долгопрудный, Институтский пер., 9

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!