Оглавление
Введение
I Вспомогательные сведения из теории позиционных диф-
ференциальных игр
1. Дифференциальная игра
2. Метод выпуклых сверху оболочек
II Оптимизации гарантии при запаздывании в управлении
3. Постановка задачи
4. Вспомогательная дифференциальная игра
5. Приближенное решение задачи
6. Пример
III Случай позиционного показателя качества
7. Позиционный показатель качества
8. Каскад вспомогательных дифференциальных игр
9. Разрешающая процедура
10. Примеры
IV Редукция разрешающей процедуры
11. Предварительные построения
12. Редуцированная процедура
13. Связь между процедурами
14. Вспомогательные утверждения
15. Доказательство теоремы 12.
16. Примеры
Заключение
Литература
Введение
Реальные процессы управления протекают обычно в условиях неопределенности, неконтролируемых помех со стороны окружающей среды или же под влиянием сознательного противодействия. Целью управления часто является достижение некоторого качества процесса, которое во многих случаях удобно описывать с помощью подходящего показателя. Возникают задачи о формировании такого управления, которое обеспечивает показателю качества оптимальный гарантированный результат. Математической теорией, в рамках которой формализуются такие задачи, является теория дифференциальных игр.
Теория дифференциальных игр активно развивается с начала 1960-х годов. Становление этой теории в первую очередь связано с именами
Н.Н.Красовского, Л.С.Понтрягина, Б. Н. Пшеничного, R.Isaacs, W.H.Fleming и A.Friedman (см., например, [1,24,25,28,52—55,92 94,102]). Свой вклад в развитие теории дифференциальных игр внесли
Э.Г.Альбрехт, В.Д.Батухтин, В.И.Жуковский, А.Ф.Клейменов,
A.Н.Красовский, А.В.Кряжимскнй, А.Б.Куржанскнй, Н.Ю.Лукоянов,
B.И.Максимов, А.А.Меликян, Е.Ф.Мищенко, М.С.Никольский, Ю.С.Осипов, В.С.Пацко, H.H.Петров, Л.А.Петросян, Е.С.Половинкин,
A.И.Субботин, H.H.Субботина, А.М.Тарасьев, В.Е.Третьяков,
B.И.Ухоботов, В.Н.Ушаков, А.Г.Ченцов, Ф.Л.Черноусько, А.А.Чикрий,
C.В.Чистяков, M.Bardi, E.N.Barron, Т.Basar, L.D.Berkovitz, P.Bernhard, A.Blaquiere, A.Bryson, P.Cardaliaguet, R.J.Elliot, L.C.Evans, M.Falcone, Y.C.Ho, H.Ishii, N.J.Kalton, G.Leitmann, J.Lewin, J.Lin, P.-L.Lions, M.Quincampoix, E.Roxin, P.Saint-Pierre, P.E.Souganidis, P.Varaiya, и этот список далеко не полный (см., например, работы [2,4,11,13,15,17,21, 22,26,28-31,33-38,40-49,51,57-67,71-74,78-80,82,83,85,87,89,90,98,102, 104,105,107,108,110,116-118] и библиографию к ним). В результате этих исследовании были сформулированы основные теоретические положения строгой математической формализации рассматриваемых задач, изучены характеристические свойства функции цены игры (величины оптимального гарантированного результата), определена структура оптимальных стратегий, намечены основные способы их построения. В том числе, в ра-
ботах Н.Н.Красовского и его учеников (см., например, [25,28,60,102,117]) была предложена и развита концепция позиционных дифференциальных игр, в рамках которой выполнена данная диссертация.
В диссертации рассматривается следующая задача об управлении с оптимальным гарантированным результатом. Движение динамической системы, подверженной воздействиям полезного управления и неконтролируемой помехи, описывается линейными по фазовому вектору дифференциальными уравнениями. Воздействия управления и помехи стеснены известными геометрическими ограничениями. Промежуток времени процесса управления зафиксирован. Целью управления является минимизация значения показателя качества, включающего в себя оценку нормы совокупности отклонений движения системы в заранее заданные моменты времени от заданных целевых точек. Такая по существу нетерминальная структура показателя качества, то есть присутствие в нем оценки состояния динамической системы не только в конечный, но и в промежуточные моменты времени, составляет первую особенность рассматриваемой задачи. Вторая особенность заключается в наличии в системе запаздывания в управлении.
Нетерминальные показатели упомянутой структуры используются для оценки качества во многих реальных процессах управления (см., например, [5-7]). Позиционные дифференциальные игры с такими показателями качества изучались Н.Н.Красовским и А.Н.Красовским (см. монографию [102] и приведенную в ней библиографию). Ими были заложены теоретические основы исследования этих задач. Были выделены различные типы показателей качества и для каждого из них указаны подходящие классы позиционных стратегий игроков, в которых соответствующие дифференциальные игры имеют цену и седловую точку. Отдельно были изучены показатели качества, имеющие так называемую позиционную структуру [102, р. 41]. Типичными примерами таких показателей являются, например, суммарное или максимальное отклонение движения системы в заданные моменты времени от заданных целевых точек, а также евклидова норма совокупности таких отклонений. Были намечены основные подходы к приближенному решению рассматриваемых задач.
Эффект запаздывания в управлении характерен для многих приклад-
и стратегии управления первого и второго игроков
UAk(t,z,e), Удk(t,z,e), (t, z) € [ф,$] X Kd, £ > 0.
В качестве непосредственного следствия из теоремы 2.1, применяемой к дифференциальной игре (4.10), (4.11), и теоремы 4.1 получаем следующий результат.
Теорема 5.1 Для любого числа £ > 0 можно указать такое число 5 > 0, что, каковы бы ни были начальная позиция (to, хо,Ро(')) € К и разбиение Ak вида (3.3), (5.1) с диаметром 8k ^ 8, будет справедливо неравенство
|ei(w(*o,xo,po(-))) “ r«(*o,zo,Po(-))l ^ ф
где Г))(-) величина оптимального гарантированного результата (3.5), w(-) — информационный образ (4.9).
В согласии с соотношениями (4.13) рассмотрим следующие стратегии управления и формирования помехи
UAk(t,x[t0[-]t],p(-),£) = UAk(t,v(t,x[t0[-}t},p(-)),E),
VAk(t,x[to[-}t],p(-),e) = г;д,(^^(^,ж[ф[ф],р(-)),£),
x[to[-]t € C[t0,t], р(-) G V, е > 0.
Теорема 5.2 Для любого числа £ > 0 найдутся такие число г* > О и функция 8Де) > 0, £ е (0, £*], что, каковы бы ни были начальная позиция (to,xo,po(-)) € К, значение параметра точности £ G (0, £*] и разбиение Ak вида (3.3), (5.1) с диаметром ф. ^ Ф(е), законы управления {UAlc(-),£,Ak} и формирования помехи {РдД), в, Ад,} будут С,-оптимальными.
Доказательство. По числу С > 0, применяя теорему 2.2 к вспомогательной дифференциальной игре (4.10), (4.11), выберем число £, > 0 и функцию <5*(е) > 0, £ € (0, £*]. Пусть (to,X0,Po(-)) € К, £ € (0, £*] и Ak — разбиение вида (3.3), (5.1) с диаметром ф ^ ф(е).
Рассмотрим движение ж[ф[-]^] системы (3.1), порожденное из позиции (to, Хо,Ро(')) законом управления {UAk(-),£, ДД в паре с допустимой реализацией помехи гфо[-]$). Обозначим через иДДД) соответствующую