Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Решение игры 2х2 в смешанных стратегиях аналитическим методом
Рассмотрим игру с размерностью платежной матрицы 2 х 2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение - это пара чистых стратегий, соответствующих этой точке. Для игры, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий и Для того чтобы их получить, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии RA*, то его средний выигрыш будет равен цене игры V, какой бы активной стратегией ни пользовался игрок В. Для игры 2 x 2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) - случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрока А (оптимальная стратегия) будет равен V и для l-й, и для 2-й стратегии противника. Пусть игра задана платежной матрицей Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В - чистую стратегию В1 (это соответствует l-му столбцу платежной матрицы Н ), равен цене игры V: Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т .е. Учитывая, что , получаем систему уравнений для определения оптимальной стратегии RA* и цены игры V:
Решая эту систему уравнений, получим аналитические выражения для вычисления вероятностей оптимальной смешанной стратегии
и цену игры
. Применяя теорему об активных стратегиях при отыскании SB*- оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (R1 или R2 ) средний проигрыш игрока В равен цене игры V, т.е.
Тогда вероятности применения оптимальной стратегии SB(q1*, q2*)определяется по формулам:
Пример 3. Применим полученные результаты для отыскания оптимальных стратегий для игры, имеющей следующее вербальное описание. Игра «поиск». Игрок А может спрятаться в одном из двух убежищ (I или II). Игрок В ищет игрока А. Если найдет, то получает штраф 1 ден.ед, в противном случае - платит игроку В 1 ден. ед. Необходимо получить решение игры.
Решение. Определим стратегии игрока A: - стратегия A1 – игрок A прячется в убежище I; - стратегия A2 – игрок A прячется в убежище II. Определим стратегии игрока В: - стратегия В1 – игрок В ищет игрока А в убежище I; - стратегия В2 – игрок В ищет игрока А в убежище II; Если игрок А принял стратегию А1 (прячется в убежище I) и игрок В принял стратегию В1 –(отыскивает игрока А в убежище I), то игрок В обнаруживает игрока А и игрок А платит штраф игроку В 1 д.. ед, т.е. а11 = -1. Аналогично получается а22 = - 1. Очевидно, что стратегии (А1, В2) и (А2, В1) дают игроку А выигрыш в 1 д. ед, т.е. а12 = а21 = 1. Получаем платежную матрицу вида .
Вычислим нижнюю α и верхнюю β цену игры: α = - 1; β = 1. Вывод: игра не имеет седловой точки, решения в чистых стратегиях нет и его необходимо вычислять в смешанных стратегиях. Используя полученные формулы, произведем расчеты вероятностей, использования стратегий: = Подставляя значения коэффициентов aij из платежной матрицы в остальные формулы, получим: p2* = q1* = q2* = ½. V = 0. Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы применять свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью 1/2, при этом средний выигрыш (средний проигрыш) будут равны 0. Задание 2. В соответствии с номером фамилии в журнале решить игру с заданной платежной матрицей аналитическим методом. Дать интерпретацию полученных результатов. Вариант 1. H = . Вариант 2. H = Вариант 3. H = . Вариант 4. H = . Вариант 5. H = . Вариант 6. H = . Вариант 7. H = . Вариант 8. H = . Вариант 9. H = Вариант 10. H = . Вариант 11. H = . Вариант 12. H = . Вариант 13. H = . Вариант 14. H = . Вариант 15. H = .
|