+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Динамические игры с оптимальной остановкой

Динамические игры с оптимальной остановкой
  • Автор:

    Панова, Светлана Викторовна

  • Шифр специальности:

    01.01.09

  • Научная степень:

    Кандидатская

  • Год защиты:

    1998

  • Место защиты:

    Чита

  • Количество страниц:

    103 с.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"
ГЛАВА 1. Теоретико-игровая модель покера 
§3. Решение задачи для произвольного N


ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ

ГЛАВА 1. Теоретико-игровая модель покера

§1. Многошаговая модель покера

§2. Решение задачи в случае А

§3. Решение задачи для произвольного N

§4. Асимптотический варианг

§5. Результаты моделирования

ГЛАВА 2. Задачи выбора партнера и места питания


§1. Задача наилучшего выбора со случайным числом наблюдений и неизвестным законом распределения наблюдений

§2. Игровая задача выбора с неизвестным законом распределения наблюдений


§3. Эволюционно-устойчивые стратегии в задаче миграции животных
ГЛАВА 3. Теоретико-игровая задача взаимного выбора
§1. Игровой вариант задачи наилучшего выбора с дисконтированием
§2. Решение задачи наилучшего выбора в случае фиксированного числа шагов
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
Приложение

ВВЕДЕНИЕ
В работе исследуются игровые задачи на правило остановки случайных процессов. Особенностью задач направило остановки является наличие у игроков в каждый момент времени самое большее двух возможностей: прекратить или продолжать наблюдения за траекторией некоторого случайного процесса. Предполагается, что при этом определено фазовое пространство процесса наблюдений и имеется вероятностный '’механизм", переводящий из одного состояния в другое по известному, частично известному или неизвестному вероятностному закону.
Исторически первая задача оптимальной остановки была предложена А.Кэли более 100 лет назад, где была рассмотрена задача типа лотереи (формулировку этой задачи можно найти в [9]). Систематическое изучение задач оптимальной остановки началось значительно позднее и было связано с пионерскими работами А.Вальда по последовательному анализу и статистическим решающим функциям [5]. Общая постановка задачи оптимальной остановки случайных процессов с дискретным временем была сформулирована в работе Снелла [7-5]. Общая теория изложена в монографиях Роббинса. Сигмунда и Чао [21] и Де Гроота [8].
Приведем постановку задачи оптимальной остановки процессов с дискретным временем. Пусть (0,Д, Р) - некоторое вероятностное пространство, Т С Т-2 С ... неубыващая последовательность под-ст-алгебр Т и “ последовательность случайных вели-
чин таких, что Хп измеримы относительно Хп,п = 1,2
довательностью. Тп интерпретируется как совокупность событий, которые могут быть наблюдены к моменту п, а Хп - как выигрыш, который мы получаем при прекращении наблюдений в момент п. Правилом остановки называется случайная величина т со значен-

ниями 1,2,
если т = п, п = 1, 2,
представляет собой выигрыш, который мы получаем при прекращении наблюдений в случайный момент г, а математическое ожидание МХГ (если оно существует) трактуется как средний выигрыш, соответствующий правилу остановки т. Цена V стохастической последовательности {Хп.Хп} определяется как вирМХг, где супремум берется по множеству всех правил остановки, для которых это математическое ожидание существует. Задача оптимальной остановки состоит в нахождении оптимального правила остановки, для которого средний выигрыш равен г. В случае конечного числа наблюдений конструктивно находить оптимальное правило нередко помогает метод обратной индукции.
Изучение задачи остановки марковского случайного процесса было начато в работе Дынкина [10]. Результаты исследований в этом направлении подитожены в монографии Ширяева [23].
Одна из прикладных задач на правило остановки - задача выбора наилучшего объекта, она имеет много других названий, среди прочих такие, как задача о секретаре, задача о выборе жениха или невесты. Формулировка этой задачи следующая. Имеется п объектов, упорядоченных по качеству. Объекты поступают в моменты времени 1, 2,
если т

В табл. 1.8.-1.13. представлены решения системы (1.14) для различных У. В последней строке каждой таблицы даны предельные значения решений согласно формулам (1.19).
Как и в случае роста ставок в арифметической прогрессии в приведенных выше примерах наблюдается та же особенность асимптотики порогов (в зависимости от четности индекса порога).
Опять же увеличение к при постоянном А ведет к увеличению выигрыша второго игрока (табл. 1.8., 1.10.. 1.11., 1.13.). Увеличение А| при постоянном к тоже ведет к росту выигрыша второго игрока (табл. 1.12., 1.13.).

Рекомендуемые диссертации данного раздела

Время генерации: 0.141, запросов: 967