Методы и модели игры

Автор работы: Пользователь скрыл имя, 03 Декабря 2012 в 21:46, курс лекций

Описание работы

Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.
Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.
Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

Содержание работы

Часть I МАТРИЧНЫЕ ИГРЫ 59
1. Равновесная ситуация 60
2. Смешанные стратегии 65
Основные определения 65
Основная теорема матричных игр 68
Основные свойства оптимальных смешанных стратегий 68
3. Методы решения матричных игр 69
Итерационный метод решения матричных игр 77
Сведение матричной игры к задаче линейного программирования 79
4. Примеры задач, сводимых к матричным играм 81
Несколько слов в заключение 84
6. О классификации игр 85
Часть II ПОЗИЦИОННЫЕ ИГРЫ 86
1. Структура позиционной игры 86
2. Нормализация позиционной игры 88
3. Позиционные игры с полной информацией 97
Несколько слов в заключение 100
3.6 Принятие решений и теория игр. Примеры. 101
3.6.1. Оптимальное решение игры двух лиц с нулевой суммой 102
Упражнения 3.6,а 103
3.6.2. Решение матричных игр в смешанных стратегиях 105
Упражнения 3.6,b 107
Упражнений 3.6,с 110
3.7. Заключение 111
Литература 112
Комплексные задачи 112

Файлы: 1 файл

методы и модели игры 32.doc

— 1,021.50 Кб (Скачать файл)

 

Решение.

1-й шаг. Все элементы платежной матрицы положительны.

2-й шаг. Строим решения обеих задач линейного программирования, пользуясь графическим методом. В результате получаем, что

3-й шаг.

4-й шаг.

 

4. Примеры  задач, сводимых к матричным  играм

 

В чистом виде антагонистические конфликты встречаются редко (разве только в боевых действиях и в спортивных состязаниях).  Однако довольно часто конфликты» в которых интересы сторон противоположны, при допущении, что множество способов действия сторон конечно, можно моделировать матричными играми.

Рассмотрим несколько  конкретных ситуаций.

Пример 10. «Планирование поема». Сельскохозяйственное предприятие имеет возможность выращивать две культуры — А1 и А2. Необходимо определить, как сеять эти культуры, если при прочих равных, условиях их урожаи зависят от погоды, а план посева должен обеспечить наибольший доход (прибыль от реализации выращенной культуры определяется полученным объемом). В зоне рискованного земледелия (а таковой является большая часть России) планирование посева должно осуществляться с учетом наименее благоприятного состояния погоды.

Таким образом, одной из сторон выступает сельскохозяйственное предприятие, заинтересованное в том, чтобы получить наибольший доход (игрок А), а другой стороной — природа, способная навредить сельскохозяйственному предприятию в максимальной степени (от нее зависят погодные условия) и преследующая тем самым прямо противоположные цели (игрок В).

Принятие природы  за противника равносильно планированию посева с учетом наиболее неблагоприятных условий; если же погодные условия окажутся благоприятными, то выбранный план даст возможность увеличить доход.

Налицо антагонистический  конфликт, в котором у игрока А две стратегии — А1 и А2, а у игрока В три — В1 (засушливое лето), В2 (нормальное лето) и В3 (дождливое лето).

В качестве выигрыша игрока А возьмем прибыль от реализации и будем считать, что расчеты прибыли сельскохозяйственного предприятия (в млрд руб.) в зависимости от состояний погоды сведены в следующую матрицу

.

Нетрудно заметить, что седловой точки у этой матрицы  нет. Поэтому оптимальная стратегия  игрока А будет смешанной. Применяя графический метод, получаем

.

Замечание. Здесь мы столкнулись со сравнительно редкой ситуацией, когда оптимальная смешанная стратегия одного из игроков допускает так называемую «физическую» реализацию. Полученное решение сельскохозяйственное предприятие может использовать так:

на  всех площадей выращивать культуру А1,

на  всех площадей выращивать культуру A2

и получать прибыль в размере, не меньшем  млрд руб.

 

Пример 11. «Переговоры о заключении контракта между профсоюзом и  администрацией». Рассмотрим фирму, администрация которой ведет переговоры с профсоюзом рабочих и служащих о заключении контракта.

Предположим, что платежная матрица, отражающая интересы договаривающихся сторон, имеет следующий вид

Выплаты указаны  в центах в час и представляют собой среднюю зарплату служащего фирмы вместе со всеми добавками. Тем самым, заданная матрица описывает прибыль профсоюза (игрок А) и затраты администрации фирмы (игрок В).

Ясно, что профсоюз стремится максимизировать  доходы рабочих и служащих, в то время как администрации хотелось бы минимизировать собственные потери.

Нетрудно заметить, что седловой точки у платежной матрицы  нет. Кроме того, для дальнейшего  анализа существенными являются лишь стратегии А1 и А4 игрока А и стратегии В3 и В4 игрока В (в этом нетрудно убедиться, воспользовавшись правилом доминирования стратегий). В результате соответствующего усечения получим матрицу

.

Элементы матрицы

связаны с элементами предыдущей матрицы  соотношениями

65 + 5 х 4 + 45,   45 = 5 х 4 + 45,   50 = 5 х 1 + 45,   55 = 5 х 2 +45.

Воспользовавшись графическим  методом, в итоге получим

Тем самым, профсоюзу следует выбирать стратегию А1 в 20 % случаев и стратегию А4 в 80 %. Что касается администрации, то ей следует выбирать стратегию В3 с вероятностью 0,4 и стратегию В4 с вероятностью 0,6. При этом ожидаемая цена игры равна 53.

Замечание. Следует отметить, что если процесс переговоров будет повторяться много раз, то среднему должно сходиться к ожидаемому значению 53. Если же переговоры пройдут лишь единожды, то реальный результат подучится при выборе каждым игроком некоторой своей чистой стратегии. Поэтому один из игроков, профсоюз или администрация, будет неудовлетворен.

 

Пример 12. «Локальный конфликт». Рассмотрим войну между двумя небольшими государствами А и В, которая ведется в течение 30 дней.

Для бомбардировки небольшого моста  — важного военного объекта страны В — страна А использует оба имеющихся у нее самолета. Разрушенный мост восстанавливается в течение суток, а каждый самолет совершает один полет в день по одному из двух воздушных маршрутов, соединяющих эти страны. У страны В есть два зенитных орудия, при помощи которых можно сбивать самолеты страны А. Если самолет собьют, то некая третья страна в течение суток поставит стране А новый самолет.

Страна А может послать самолеты либо по одному маршруту, либо по разным. Страна В может поместить либо обе зенитки на одном маршруте, либо по одной зенитке на каждый маршрут.

Если один самолет летит по маршруту, на котором расположена одна зенитка, то этот самолет будет сбит. Если два самолета летят по маршруту, на котором расположены две зенитки, то оба самолета будут сбиты. Если два самолета летят по маршруту, на котором расположена одна зенитка, то сбит будет только один самолет. Если самолет доберется до цели, то мост будет уничтожен.

У страны А есть две стратегии:

послать самолеты по разным маршрутам  — А1,

послать самолеты по одному маршруту — А2.

У страны В — также две стратегии:

поместить зенитки на разных маршрутах — В1,

поместить зенитки на одном маршруте — В2.

Если страна А выберет стратегию А1, а страна В — стратегию В1, то страна А получит нулевой выигрыш, так как ни один из самолетов не достигнет цели.

Если страна А выберет стратегию А2, а страна В — стратегию В1, то хота бы один самолет достигнет цели и вероятность разрушения моста будет равна 1.

Если страна А выберет стратегию А1, а страна В — стратегию В2, то вновь хотя бы один самолет достигнет цели и вероятность разрушения моста будет равна 1.

Если страна А выберет стратегию А2, а страна В — стратегию В2, то страна А с вероятностью 1/2 выберет маршрут, на котором установлены зенитки, и, следовательно, цель будет уничтожена с вероятностью 1/2.

Оформим результаты проведенного анализа  в стандартной игровой форме:

При помощи графического метода получаем оптимальные смешанные стратегии  игроков и цену игры

Это означает, что если страна А будет посылать самолеты по разным маршрутам в течение десяти дней из тридцати, отпущенных на войну (и, значит, по одному маршруту в течение двадцати дней), то в среднем страна А будет иметь 66,7 % удачных случаев (мост будем находиться в нерабочем состоянии). Воспользовавшись для своих зениток предложенным выбором, страна В не позволит бомбить мост чаще, чем в 66,7 % случаев.

 

Несколько слов в заключение

Матричные игры моделируют конфликтные  ситуации, в которых каждая из сторон-участниц делает свой ход одновременно со второй стороной. При этом наибольший интерес представляет случай, когда игра не заканчивается сразу же после совершения игроками одной такой пары одновременных ходов, а повторяется многократно. Причем считается, что перед каждым возобновлением игры игроки не получают никаких новых сведений ни о конфликте, ни о возможных действиях противной стороны. Иными словами, при многократном повторении матричной игры каждая из сторон всякий раз оказывается перед выбором некоторой стратегии из одного и того же множества стратегий, неизменного у каждого из игроков.

Тем не менее, в таких  многократно повторяющихся обстоятельствах  большую роль играет анализ игры, как  предварительный, так и промежуточный.

В результате разумно проведенного предварительного анализа матричной игры заинтересованная в анализе сторона может определить свою линию поведения (правило выбора стратегий) на всю серию игр. Разумеется, описанный нами выше максиминный подход является далеко не единственным средством. Однако не следует забывать, что принципиальной особенностью этого подхода является то обстоятельство, что игрок, придерживающийся выводимого на его основе правила выбора стратегий, заранее может довольно точно оценить нетривиальные размеры своего гарантированного выигрыша. Кроме того, максиминный подход позволяет сводить задачу поиска решения игры к рассмотрению сравнительно несложных задач линейного программирования и, тем самым, получать эффективные рекомендации по тому, как лучше выбирать стратегии в конкретной игре при многократном ее повторении.

Если игра повторяется  много раз, то некоторые дополнительные сведения — какие именно стратегии  выбирает противная сторона и  какими правилами выбора стратегий  она руководствуется — игрок  все же получает. На основании этих сведений и результатов предварительного анализа игры он может довольно точно оценить противника и, если тот не придерживается компромиссного максиминного подхода, внести соответствующие изменения в собственную линию поведения и увеличить выигрыш.

6. О классификации  игр

Реальные конфликтные ситуации приводят к различным видам игр. К настоящему времени общепризнанной классификации игр пока не сложилось. Тем не менее, легко заметить, что  игры различаются по целому ряду признаков: по количеству участвующих в них игроков, по количеству возможных стратегий, по характеру взаимоотношений между игроками, по характеру выигрышей, по виду функций выигрышей, по количеству ходов, по характеру информационной обеспеченности игроков и т. д.

Остановимся на этих различиях чуть подробнее.

В зависимости от количества игроков  определяют игры трех типов: игры одного  игрока (в теории игр, как правило, не рассматриваются), игры двух игроков (наиболее  изученный класс игр) и игры n игроков (успехов в изучении которых сравнительно немного вследствие возникающих принципиальных трудностей).

По количеству стратегий игроков  игры делятся на конечные (каждый из игроков  имеет конечное число  возможных стратегий) и бесконечные (где хотя бы один из игроков имеет  бесконечное количество возможных  стратегий).

По характеру взаимоотношений  между игроками игры делятся на бескоалиционные (в которых игроки не имеют права вступать в соглашения и образовывать коалиции), коалиционные (в которых игроки могут вступать в соглашения и образовывать коалиции) и кооперативные (в которых соглашения, связывающие игроков, определены наперед и обязательны):

По характеру выигрышей различают  игры с нулевой суммой (общий капитал игроков не изменяется, а просто перераспределяется между игроками в зависимости от получающихся исходов) и игры с ненулевой суммой.

Игру двух игроков с нулевой суммой часто называют антагонистической, вследствие того, что цели игроков в них прямо противоположны: выигрыш одного из игроков происходит только за счет проигрыша другого.

По виду функций выигрышей игры делятся на: матричные игры (рассмотренные выше), биматричные игры, игры типа дуэлей, непрерывные игры, выпуклые игры и др.

По количеству ходов игры делятся  на одношаговые (завершающиеся после одного хода каждого из игроков) и многошаговые, которые, в свою очередь, делятся на позиционные игры (каждый из игроков может последовательно во времени делать несколько ходов), стохастические игры (где при выборе новых позиций имеется определенная вероятность возврата на предшествующую позицию), дифференциальные игры (в которых допускается делать ходы непрерывно и подчинять поведение игроков условиями, описываемыми дифференциальными уравнениями), игры типа дуэлей (характеризующиеся моментом выбора хода и вероятностями получения выигрышей в зависимости от времени, прошедшего от начала игры до момента выбора).

По характеру информационной обеспеченности игроков различают игры с полной информацией (на каждом ходе игры каждому игроку известно, какие выборы были сделаны ранее всеми игроками) и игры с неполной информацией (если в игре не все известно о предыдущих выборах).

Существуют, разумеется, и другие виды игр.

В зависимости от вида игры разрабатывается  и метод ее решения. Однако читатель, видимо, уже заметил, что структура  предложенного выше описания основных направлений различения игр не является древовидной: одни и те же виды игр оказываются в разных классах.

Информация о работе Методы и модели игры