+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Оптимальное управление в повторяющейся биматричной игре с конечной памятью и в поведенческой модели фирмы

  • Автор:

    Семенищев, Алексей Андреевич

  • Шифр специальности:

    05.13.18

  • Научная степень:

    Кандидатская

  • Год защиты:

    2001

  • Место защиты:

    Екатеринбург

  • Количество страниц:

    144 с.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

Оглавление
0.1 Введение
1 Повторяющаяся биматричная игра типа «дилемма заключенного»
с конечной памятью
1.1 Биматричная игра «дилемма заключенного»
1.2 Повторяющаяся дилемма заключенного с конечной памятью игроков
1.3 Иерархическая постановка повторяющейся «дилеммы заключенного»
с конечной памятью
1.4 Оптимальное разбиение области Р в игре с одношаговой памятью
1.5 Оптимальное разбиение области Р в игре с двухшаговой памятью
2 Поведенческая модель фирмы
2.1 Постановка задачи
2.2 Множество точек, оптимальных по Парето
2.3 Управление системой с дискретным временем
2.4 Управление системой с непрерывным временем
2.5 Задача о приведении на множество Парето-оптимальных точек
2.6 Управление с использованием типов поведения, не являющихся нормальными

0.1 Введение
Во многих технических, экономических и социальных процессах возникают задачи принятия решения, и которых важное место занимают игровые постановки. Основы теории статических игр были разработаны в 30 - 50-х гг. в трудах Дж. фон Неймана и О. Мор-генштерна [16], Дж. Нэша [17], X. Штакельберга [48] и других исследователей (см. также [20, 5, 14]).
В конце 50-х - начале 60-х гг. в работах Р. Айзекса [1] были сформулированы первые задачи антагонистических динамических игр и были предложены методы их решения. В дальнейшем эти задачи исследовались многими отечественными и зарубежными учеными. Фундаментальный вклад в построение теории антагонистических дифференциальных игр принадлежит научным школам академиков H.H. Красовского и Л.С. Понтрягина. Этому направлению посвящены исследования Р. Айзекса, H.H. Красовского, А.Н. Красовского, A.B. Кряжимского, А.Б. Куржанского, Е.Ф. Мищенко. М.С. Никольского, Ю.С. Осипова, Л.А. Петросяна, Л.С. Понтрягина, Б.Н. Пшеничного, А.И. Субботина, У. Флеминга, А.Г. Немцова и других авторов [1, 9, 10, 39, 11, 12, 13, 19, 21, 23, 24, 25].
Большое внимание исследователей уделяется математическим моделям, формализуемым в рамках теории неантагонистических позиционных дифференциальных игр. Такие модели возникают при описании динамических задач управления механическими, экономическими, биологическими системами, когда управление осуществляется разными участниками. При этом интересы участников не являются полностью противоположными, каждый из них оптимизирует собственный показатель качества и имеет свой собственный ресурс управления. В этом случае задача состоит в выработке, управления, приемлемого для всех сторон, участвующих в игре. Основополагающие результаты в этом направлении были получены в работах Ю.Б. Гермейера, А.Ф. Кононенко, Л.А. Петросяна, Т. Башара, Дж. Лейтмана, Дж. Круза, Э.Мулена, В.И. Жуковского, А.Ф. Клейменова и других исследователей [3, 8, 21, 15, 4, 6]. Одна из основных проблем в неантагонистической игре состоит в выборе понятия решения, адекватного содержанию задачи. В соответствии с различными принципами оптимальности выделяются равновесные но Нэшу решения [17], решения по Штакельбергу [48], кооперативное решение по Парето [16].
Важным частным случаем неантагонистических динамических игр являются повторяющиеся биматричные игры [14, 27, 42]. Среди них отметим бесконечно повторяющуюся

игру, на каждом шаге которой разыгрывается известная биматричная игра «дилемма заключенного», предложенная А.У. Таккером (см., напр., [14]). В исходной игре этого типа каждый игрок имеет две стратегии, а именно кооперироваться с партнером (стратегия С - cooperate) или отклоняться от сотрудничества (стратегия D - defect). При взаимной кооперации каждый игроки получает выигрыш р+, при взаимном отклонении выигрыш р~. Если же один из игроков кооперируется в то время, как другой отклоняется, то кооперирующийся получает выигрыш р~~, а его партнер выигрыш р++. Величины выигрышей связаны соотношением
р < р~ < р+ < р++
Сущность дилеммы заключается в том, что индивидуальный рационализм каждого игрока приводит к тому, что в игре реализуется ситуация (D,D), в которой игроки получают меньший выигрыш, чем если бы они кооперировались.
Активность, с которой изучается «дилемма заключенного» в последние годы, объясняется большим количеством ее интерпретаций с точки зрения социологии, психологии, биологии, экономики, политики, философии [14, 22, 27, 40, 42, 43, 44, 47, 51). Основной вопрос, возникающий при анализе этой игры, следующий:какие условия необходимо создать игрокам, чтобы они проявили стремление к сотрудничеству [27]. Первым необходимым условием возникновения кооперации является бесконечное повторение игры, так как в случае ее конечного повторения легко доказывается [14], что оптимальной стратегией каждого игрока в смысле максимизации гарантированного выигрыша является отклонение на каждом шаге.
Наиболее известным экспериментом, в ходе которого эмулировалось бесконечное повторение игры, стали два компьютерных турнира, описанные в [27]. Участниками турнира являлись программы, реализующие некоторые решающие правила в повторяющейся игре. Эффект бесконечного повторения достигался за счет того, что была задана вероятность w продолжения игры, одна и та же для каждого шага. Таким образом, средняя продолжительность игры составляла N(w) = шагов, а выигрыш игрока вычислялся по формуле / = где /, £ {р ,р~,р+,р++} - выигрыш на г-ом шаге.
Турнир проводился по круговой схеме: каждая программа играла с каждой и, кроме того, со своей копией. В процессе принятия решения на программу не накладывалось никаких ограничений за исключением того, что ей не был известен алгоритм, по кото-

стратегии /г| , не означает, что ведомый может гарантированно получить выигрыш 5г(р). Ведомому нужно решить задачу нахождения стратегии Л?- Е 'Н, такой что выполняются следующие условия:
/2(Лу.Лу'Р) >52(ЛР), ре Р?
Если подходящая стратегия ведомого существует, то на самом деле происходит улучшение стратегии лидера в области РР стратегия Щ становится его текущей оптимальной стратегией в этой области.
Докажем, что из (1.20) - (1.21) следует, что на всех циклах г Е Z(hp ^у)> лиДеР1 также как и ведомый, получает один и тот же выигрыш.
Действительно, из (1.20) следует, что для любого цикла г € Z(h}j,h^j) выполнено 5*2(.2*,р) ^ 5г(?,р). С другой стороны, из (1.21), а также из формулы для определения выигрыша ведомого (1.13) следует, что для любого цикла г £ выполнено нера-
венство 5г(г*,р) ^ 5г(г,р). Отсюда вытекает, что на всех циклах множества Z{hj,Щ) ведомый (и, следовательно, лидер) получает один и тот же выигрыш.
Заметим, что при построении оптимального разбиения для игр с одно- и двухшаговой памятью во всех подобластях разбиения оптимальные стратегии лидера и ответы ведомого были таковы, что все множества Z{hJ, Щ) содержали ровно по одному циклу.
На этом шаге алгоритма нужно проанализировать каждую пару (1гр Р) из списка Ь и попытаться найти подходящую стратегию ведомого Щ. Каждый раз, когда эта задача будет успешно решаться, результат необходимо фиксировать. Таким образом, будет получен список Ь* С Ь, такой что для каждой пары (Л);, Р) £ Ь* существует стратегия ведомого, удовлетворяющая (1.21). Если список Ь* не пуст, текущее разбиение можно улучшить в области Р, = и(Л1.,Р?)6ш Р-
Процедура 1.
При анализе цикла г* £ текущее разбиение было улучшено в области Рг С Р*
(естественно, при условии, что список Ь* не пуст). Если не выполняется равенство Рг = Р*, вернемся к Процедуре 1.1.2 и рассмотрим другой цикл г, принадлежащий рассматриваемому семейству циклов и проверим, можно ли с помощью него улучшить разбиение в
области Р*Р

Рекомендуемые диссертации данного раздела

Время генерации: 0.093, запросов: 967