Методы и модели игры

Курс лекций, 03 Декабря 2012, автор: пользователь скрыл имя

Описание работы

Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.
Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.
Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

Содержание работы

Часть I МАТРИЧНЫЕ ИГРЫ 59
1. Равновесная ситуация 60
2. Смешанные стратегии 65
Основные определения 65
Основная теорема матричных игр 68
Основные свойства оптимальных смешанных стратегий 68
3. Методы решения матричных игр 69
Итерационный метод решения матричных игр 77
Сведение матричной игры к задаче линейного программирования 79
4. Примеры задач, сводимых к матричным играм 81
Несколько слов в заключение 84
6. О классификации игр 85
Часть II ПОЗИЦИОННЫЕ ИГРЫ 86
1. Структура позиционной игры 86
2. Нормализация позиционной игры 88
3. Позиционные игры с полной информацией 97
Несколько слов в заключение 100
3.6 Принятие решений и теория игр. Примеры. 101
3.6.1. Оптимальное решение игры двух лиц с нулевой суммой 102
Упражнения 3.6,а 103
3.6.2. Решение матричных игр в смешанных стратегиях 105
Упражнения 3.6,b 107
Упражнений 3.6,с 110
3.7. Заключение 111
Литература 112
Комплексные задачи 112

Скачать архив (367.10 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

методы и модели игры 32.doc

— 1,021.50 Кб (Скачать файл)

	B₁	B₂	…	B_n
A₁	a₁₁	a₁₂	…	a₁_n
A₂	a₂₁	a₂₂	…	a₂_n
. . .	. . .	. . .	. . .	. . .
A_m	a_m₁	a_m₂	…	a_mn

Такое представление матричной игры означает, что если игрок А использует стратегию i, а игрок В — стратегию j, то платеж игроку А составляет а_ij и, следовательно, игроку В — – а_ij.

3.6.1. Оптимальное решение игры двух лиц с нулевой суммой

Поскольку игры берут свое начало в конфликте интересов, оптимальным решением игры является одна или несколько таких стратегий для каждого из игроков, при этом любое отклонение от данных стратегий не улучшает плату тому или другому игроку. Эти решения могут быть в виде единственной чистой стратегии или нескольких стратегий, которые являются смешанными в соответствии с заданными вероятностями. Рассматриваемые ниже примеры демонстрируют перечисленные случаи.

Пример 3.6-1

Две компании А и В продают два вида лекарств против гриппа; Компания А рекламирует продукцию на радио (A₁), телевидении (А₂) и в газетах (А₃) – Компания В, в дополнение к использованию радио (B₁), телевидения (В₂) и газет (В₃), рассылает также по почте брошюры (B₄). В зависимости от умения и интенсивности проведения рекламной кампании, каждая из компаний может привлечь на свою сторону часть клиентов конкурирующей компании. Приведенная ниже матрица характеризует процент клиентов, привлеченных или потерянных компанией А.

	B₁	B₂	B₃	B₄	Минимумы строк
A₁	8	–2	9	–3	–3
A₂	6	5	6	8	5← Максимин
A₃	–2	4	–9	5	–9
Максимумы столбцов	8	5	9	8
	Минимакс

Решение игры основано на обеспечении наилучшего результата из наихудших для каждого игрока. Если компания А выбирает стратегию А₁, то, независимо от того, что предпринимает компания В, наихудшим результатом является потеря компанией А 3% рынка в пользу компании В. Это определяется минимумом элементов первой строки матрицы платежей. Аналогично при выборе стратегии А₂ наихудшим исходом для компании А является увеличение рынка на 5% за cчет компании В. Наконец, наихудшим исходом при выборе стратегии А₃ является потеря компанией А 9% рынка в пользу компании В. Эти результаты содержатся в столбце "Минимумы строк". Чтобы достичь наилучшего результата из наихудших, компания А выбирает стратегию А₂, так как она соответствует наибольшему элементу столбца "Минимумы строк".

Рассмотрим теперь стратегии компании В. Так как элементы матрицы являются платежами компании А, критерий наилучшего результата из наихудших для компании В соответствует выбору минимаксного значения. В результате приходим к выводу, что выбором компании В является стратегия В₂.

Оптимальным решением игры является выбор стратегий А₂ и В₂, т.е. обеим компаниям следует проводить рекламу на телевидении. При этом выигрыш будет в пользу компании А, так как ее рынок увеличится на 5%. В этом случае говорят, что цена игры равна 5% и что компании А и В используют стратегии, соответствующие седловой точке.

Решение, соответствующее седловой точке, гарантирует, что ни одной компании нет смысла пытаться выбрать другую стратегию. Действительно, если компания В переходит к другой стратегий (B_l, B₃ или В₄), то компания А может сохранить свой выбор стратегии А₂, что приведет к большей потере рынка компанией В (6% или 8%). По тем же причинам компании А нет резона использовать другую стратегию, ибо если она применит, например, стратегию А₃, то компания В может использовать свою стратегию В₃ и увеличить свой рынок на 9%. Аналогичные выводы имеют место, если компания А будет использовать стратегию А₁.

Оптимальное решение игры, соответствующее седловой точке, не обязательными должно характеризоваться чистыми стратегиями. Вместо этого оптимальное решение может требовать смешивания случайным образом двух или более стратегий, как это сделано в следующем примере.

Пример 3.6-2

Два игрока А и В играют в игру, основанную на подбрасывании монеты. Игроки одновременно и независимо друг от друга выбирают герб (Г) или решку (Р). Если результаты двух подбрасываний монеты совпадают (т.е. ГГ или РР), то игрок А получает один доллар от игрока В. Иначе игрок А платит один доллар игроку В.

Следующая матрица платежей игроку А показывает величины минимальных элементов строк и максимальных элементов столбцов, соответствующих стратегиям обоих игроков.

Максиминная и минимаксная величины (цены) для этой игры равны – 1 доллар и 1 доллар соответственно. Так как эти величины не равны между собой, игра не имеет решения в чистых стратегиях; В частности, если игрок А использует стратегию А_Г, игрок В выберет стратегию В_Р, чтобы получить от игрока А один доллар. Если это случится, игрок А может перейти к стратегии А_Р, чтобы изменить исход игры и получить один доллар от игрока В. Постоянное искушение каждого игрока перейти к другой стратегии указывает на то, что решение в виде чистой стратегии неприемлемо. Вместо этого оба игрока должны использовать надлежащую случайную комбинацию своих стратегий. В рассматриваемом примере оптимальное значение цены игры находится где-то между максиминной и минимаксной ценами для этой игры:

максиминная (нижняя) цена ≤ цена игры ≤ минимаксная (верхняя) цена.

Следовательно, в данном случае цена игры должна лежать в интервале [–1,1], измеряемом в долларах.

Упражнения 3.6,а

1. Определите решение, определяемое седловой точкой, соответствующие чистые стратегии и цену игры для следующих игр, в которых платежи заданы для игрока А.

а)

	B₁	B₂	B₃	B₄
A₁	8	6	2	8
A₂	8	9	4	5
A₃	7	5	3	5

	B₁	B₂	B₃	B₄
A₁	4	–4	–5	6
A₂	–3	–4	–9	–2
A₃	6	7	–8	–9
A₄	7	3	–9	5

2. В следующих играх заданы платежи игроку А. Укажите область значений для параметров р и q, при которых пара (2, 2) будет седловой точкой в каждой игре.

а)

	B₁	B₂	B₃
A₁	1	q	6
A₂	p	5	10
A₃	6	2	3

	B₁	B₂	B₃
A₁	2	4	5
A₂	10	7	q
A₃	4	p	6

3. Укажите область, которой принадлежит цена игры в каждом из следующих случаев, предполагая, что платежи заданы для игрока A.

а)

	B₁	B₂	B₃	B₄
A₁	1	9	6	0
A₂	2	3	8	4
A₃	–5	–2	10	–3
A₄	7	4	–2	–5

	B₁	B₂	B₃	B₄
A₁	–1	9	6	8
A₂	–2	10	4	6
A₃	5	3	0	7
A₄	7	–2	8	4

	B₁	B₂	B₃
A₁	3	6	1
A₂	5	2	3
A₃	4	2	–5

	B₁	B₂	B₃	B₄
A₁	3	7	1	3
A₂	4	8	0	–6
A₃	6	–9	–2	4

4. Две фирмы производят два конкурирующих товара. Каждый товар в настоящее время контролирует 50% рынка. Улучшив качество товаров, обе фирмы собираются развернуть рекламные кампании. Если они не будут этого делать, то существующее состояние рынка не изменится. Однако если какая-либо фирма будет более активно рекламировать свои товары, то другая фирма потеряет соответствующий процент своих потребителей. Исследование рынка показывает, что 50% потенциальных потребителей получают информацию посредством телевидения 30% – через газеты и 20% – посредством радио.

а) Сформулируйте задачу в виде игры двух лиц с нулевой суммой и выберите подходящие средства рекламы для каждой фирмы.

b) Укажите интервал значений, которому принадлежит цена игры. Может ли каждая фирма действовать с единственной чистой стратегией?

5. Пусть a_ij – (i, j)-й элемент платежной матрицы с m стратегиями игрока A и n стратегиями игрока В. Элементы платежной матрицы представляют собой платежи игроку А. Докажите, что

3.6.2. Решение матричных игр в смешанных стратегиях

Решение матричных игр в смешанных стратегиях может быть найдено либо графически, либо методами линейного программирования. Графический метод применим для решения игр, в которых хоть один игрок имеет две чистые стратегии. Этот метод интересен в том плане, что графически объясняет понятие седловой точки. Методами линейного программирования может быть решена любая игра двух лиц с нулевой суммой.

Методы и модели игры

Описание работы

Содержание работы

Файлы: 1 файл

методы и модели игры 32.doc

3.6.1. Оптимальное решение игры двух лиц с нулевой суммой

Упражнения 3.6,а

3.6.2. Решение матричных игр в смешанных стратегиях

Информация о работе Методы и модели игры

Связанные документы

Методы и модели теории игр

Методы теории игр

Модель: «Теория игр»

Методы решения матричных игр

Модели и методы менеджмента

Модели и методы принятия решений

Модели и методы менеджмента

Виды методов и моделей менеджмента

Игра как метод обучения и воспитания

Модели и методы принятия решений

Модели и методы принятия решения

Модели и методы решения задач

Похожие темы

Модели и методы решений

Методы и модели в экономике

Математические модели и методы