Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями

Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями

Автор: Румянцев, Дмитрий Станиславович

Автор: Румянцев, Дмитрий Станиславович

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2009

Место защиты: Москва

Количество страниц: 139 с. ил.

Артикул: 4313778

Стоимость: 250 руб.

Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями  Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями 

Оглавление
Список основных обозначений
Введение
1 Оптимизация стохастических систем с информационными ограничениями
1.1 Постановка задачи оптимального управления стохастически
ми системами диффузионною типа при наличии информационных ограничений
1.2 Достаточные условия оптимальности
1.3 Локальные условия оптимальности первого порядка.
1.4 Техническое описание системы управления.
1.5 Выводы
2 Оптимизация квазилинейных стохастических систем
2.1 Постановка задачи.
2.2 Условия оптимальности.
2.3 Оптимизация квазилинейных стохастических систем
при наличии случайных погрешностей вектора состояния
и реализации управления.
2.4 Обобщение на случай стохастических возмущений матриц
коэффициентов линейной системы
2.5 Выводы
3 Численные методы синтеза стратегий оптимального управления стохастическими системами с информационными ограничениями
3.1 Численные методы поиска.
3.2 Управление скоростью сходимости.
3.3 Теоремы об улучшении критерия.
3.4 Квазилинейные задачи с квадратичным критерием.
3.4.1 Способы решения уравнения 2.
3.4.2 Алгоритмы численных методов оптимизации
стратегии управления
3.5 Примеры
3.6 Выводы
4 Программное обеспечение для расчта оптимального управления квазилинейными стохастическими системами
4.1 Общие сведения о программе
4.2 Диалоговый интерфейс
4.3 Выводы.
5 Примеры задач оптимального управления
летательными аппаратами
5.1 Задача демпфирования колебаний спутника Земли
с гравитационной стабилизацией
5.2 Задача о стабилизации орбиты искусственного спутника ЗемлиПЗ
5.3 Выводы
Заключение
Литература


М. при изучении проблемы оптимального управления частично наблюдаемым диффузионным процессом и получивший дальнейшее развитие в его работах по стохастическим дифференциальным играм с неполной информацией [1, 2]. Этот подход состоит в использовании совокупности функций, аналогичных вектор-функциям Ляпунова в теории устойчивости. С одной стороны, их применение так же, как функций Ляпунова, подменяет проблему изучения поведения траекторий динамической системы изучением поведения этих функций вдоль траекторий системы. С другой - они являются нелинейными нелокальными аналогами классических множителей Лагранжа, предназначенными для полного снятия ограничений. В связи с такой двойной ролыо эти функции были названы вектор-функциями Ля ну нова-Лагранжа [1, 2]. Важным результатом применения векторных функций Ляпунова-Лагранжа является снятие всех нелокальных ограничений, в том числе и информационных, доведение условий оптимальности до совокупности уравнений (или неравенств) для этих функций и семейства конечномерных экстремальных задач, решаемых в фиксированный момент времени локально в каждой точке пространства состояний, аналогично тому, как это делается в условиях принципа максимума Поитрягина Л. С. или динамического программирования для классической задачи оптимального управления. Фундаментам для метода Ляпунова-Лагранжа послужили работы Поитрягина Л. С. (3|, Веллмана Р. Кротова В. Ф. [5], Гурмана В. И. [б], в которых встречались тс или иные фрагменты метода. Различные аспекты метода исследовались в [7]-[] и более поздних работах []. Близкий методу функций Ляпунова-Лагранжа подход предлагается в []. Для описания динамической системы составляется ее математическая модель. В результате возникает задача оптимизации с информационными ограничениями. Традиционно уделяется большое внимание методам решения задач оптимизации динамических систем, позволяющим определять непрерывное управление либо как функцию от начальных условий и времени (программное управление) [3], либо как функцию времени и текущих фазовых координат системы (синтез управления) [4]. Как уже отмечено, на практике существует обширный класс динамических систем, в которых информация о положении в фазовом пространстве является неполной и ограничена измерительным устройством, которым располагает система. Возможности управления такими системами существенно зависят от той информации, которая может быть получена путем измерения и обработки наблюдений. Поэтому в теории стали развиваться направления, связанные с решением задач оптимизации динамических систем в условиях неопределенности, например: управление пучками траекторий [)-[|; управление стохастическими системами [|-[]; управление системами с распределёнными параметрами, в том числе, с неполной информацией []-[]; децентрализованное управление []-[]; управление в антагонистических и коалиционных играх []-||; управление дискретными системами [6],[]-[| и т. Проведем обзор известных методов оптимизации систем управления с точки зрения доступности информации об объекте. При наличии неопределенности в динамической системе есть три пути решения задачи синтеза стратегии управления. В первом случае отыскивается управление, являющееся функцией наблюдаемых переменных. В этом случае находится структура стратегии управления, которая непосредственно зависит от наблюдаемого сигнала. Второй путь связан с нахождением оптимального закона управления, который использует оценку состояния динамической системы. Эта оценка делается на основе имеющейся информации путём дополнительного построения фильтров (идентификаторов состояния). Именно она используется при построении управления в работах []-[5]. Третий путь является комбинаций первого и второго. В этом случае решается задача совместного отыскания оптимальной стратегии управления и оптимального фильтра, задающего оценку состояния динамической системы. В данной работе принята постановка задачи, соответствующая первому пути. Пусть для некоторой математической модели динамической системы с состоянием х ? Г временем I ? Я1 требуется синтезировать стратегию управления и = м(? При этом известно, что наблюдается лишь часть компонент вектора х.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.239, запросов: 244