Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Решение игры в чистых стратегиях
Пусть дана матрица игры (игра в нормальной записи):
где A и B – участники игры. Участник A выбирает стратегию. а участник B выбирает стратегию Стратегии выбираются участниками независимо друг от друга. Выбору соответствует исход с платежом . Он равен сумме выигрыша, который получает участника A и сумме проигрыша, который платит частник B. Естественным образом возникает вопрос: как найти лучшую стратегию для игрока A и для игрока B? Понятие наилучшего (оптимального) решения является сложным понятием. Для того, чтобы утверждать, что какое-то решение является оптимальным, нужно знать, что именно мы понимаем под словом «оптимальный». Например, фирма, при выборе своих управленческих решений, может руководствоваться следующими соображениями: § максимизация прибыли; § минимизация издержек; § завоевать место на рынке; § стремиться к минимизации хозяйственных рисков; § и др. Каждое из этих соображений приводит к определенному критерию оптимальности. Решения, которые оптимальны с точки зрения одного критерия, могут быть неоптимальными с точки зрения другого. Например, если фирма выбрала в качестве критерия оптимальности принцип достижения наибольшей прибыли, то может оказаться, что решение, которое обеспечивает наибольшую прибыль, приводит к появлению высоких хозяйственных рисков. Одним из критериев оптимальности является критерий гарантированного результата. Этот критерий заключается в том, что наилучшим решением (оптимальной стратегией) будет такое решение, которое даёт игроку определённый (гарантированный) выигрыш (или проигрыш) независимо от действий других участников игры. В соответствии с критерием гарантированного результата игрок A для каждой своей стратегии находит наихудший для себя, а значит наилучший для соперника исход, т.е. игрок . Следовательно – столбец самых плохих результатов. Далее игрок A выбирает такое значение i, которое соответствует . Иными словами, игрок A решает задачу или задачу максимина. Игрок B для каждой стратегии находит наихудший результат, т.е. находит Следовательно получает строку Далее игрок B решает задачу нахождения минимума . Другими словами, игрок B решает задачу нахождения или задачу минимакса. Значение называется нижним значением игры (нижняя цена игры); значение называется верхним значением игры (верхняя цена игры).
Теорема 1. Для любой матричной игры выполняется неравенство (1.2) То есть нижняя цена игры не больше чем верхняя цена игры. Доказательство. Зафиксируем значение i=1, 2…, m и найдем наименьший элемент строки {ai1, ai2, …, ain}, который обозначим ail(i). Таким образом l(i) (1.3) Обозначим akl(k) наибольшее из чисел {a1l(1), a2l(2), …, aml(m)}, тогда akl(k)= (1.4) Зафиксируем значение j=1, 2…, n и найдем наибольший элемент столбца {a1j, a2j, …, amj}, который обозначим ap(j)j. Таким образом ap(j)j = (1.5) Обозначим ap(q)q наименьшее из чисел { ap(1)1, ap(2)2, …, ap(n)n }, тогда ap(q)q = (1.6) Из (1.3) следует неравенство ail(i)≤ aij, верное для всех i=1.2…., m и j=1.2…, n. Подставляя в него i=k, получим неравенство α =akl(k)≤ akj (1.7) Из (1.5) следует неравенство ap(j)j≥ aij, верное для всех i=1.2…., m и j=1.2…, n. Подставляя в него i=k, получим неравенство ap(j)j≥ akj. Итак получаем α =akl(k)≤ akj≤ ap(j)j≤ ap(q)q=β, что и требовалось доказать. Если первый игрок стремится получить гарантированный результат, то он выбирает из своего множества стратегий стратегию k, для которой наименьшее значение выигрыша равно нижнему значению игры α. Тогда при любом выборе вторым игроком стратегии j будет верно неравенство aij≥ α, то есть α является гарантированным выигрышем первого игрока. Аналогично, если второй игрок стремится получит гарантированный результат, то он выберет стратегию q, для которой наибольшее значение проигрыша будет равно верхнему значению игры β. Тогда при любом выборе первым игроком стратегии i будет верно неравенство aij≤ β, то есть β является гарантированным верхним значением проигрыша второго игрока. Будет ли исход игры, реализующийся при стратегиях k и q, равновесным зависит от того, равны или нет числа α и β. Если верхняя цена равна нижней цены игры, т.е. выполняется равенство: (1.8) то число называется чистой ценой игры. Пусть платёжная матрица удовлетворяет уравнению (1.8). Это значит, что существует её элемент alk, для которого верно равенство (1.9) Исход достигается, когда игрок A выбирает стратегию l, а игрок B – стратегию k. В этом случае стратегия k называется оптимальной минимаксной стратегией игрока B, а элемент называется седловой точкой (седлом) платёжной матрицы. Совокупность (цена игры оптимальной стратегии) называется решением игры в чистых стратегиях. Теорема 2. Если один участник игры выбирает свою оптимальную (максиминную/минимаксную) стратегию, то лучшим выбором для другого участника будет своя (минимаксная/максиминная) стратегия. Доказательство. Пусть игрок A выбрал свою оптимальную стратегию , тогда для любых стратегий игрока B будет справедливо неравенство . Для оптимальной стратегии игрока B будет выполняться неравенство , следовательно для , а для . Из этого следует, что наилучшей стратегией для игрока B будет стратегия . Аналогично доказывается обратная зависимость. Итак, если платёжная матрица имеет седловую точку, то ни одному участнику игры не выгодно в одностороннем порядке отказываться от своей оптимальной (максиминной/минимаксной) стратегии. Другими словами в cедловой точке наблюдается баланс интересов, поэтому эту точку называют точкой равновесия. Если платёжная матрица имеет седловую точку, то: 1) Игрок A имеет оптимальную максиминную стратегию; 2) Игрок B имеет минимаксную стратегию; 3) Применение оптимальных стратегий даёт ситуацию равновесия, которая оказывается равновесием в чистых стратегиях. 4) Игра имеет решение , где . - оптимальные стратегии. . Пример. Найти решение игры.
Решение. Игрок A руководствуясь принципом гарантированного результата. Для этого он в каждой строке ищет минимальный элемент, затем максимальное значение в полученном столбце минимумов
Игрок B: . - решение в чистых стратегиях предопределяющее исход игры для различных игроков. Если верхняя и нижняя цены игры принимают различные значения, то согласно теореме 1 справедливо строгое неравенство α < β. В этом случае применение первым игроком максиминной стратегии дает возможность второму игроку сделать свой проигрыш меньшим, чем число β, если он откажется от минимаксной стратегии. И наоборот, применение вторым игроком минимаксной стратегии дает возможность первому игроку сделать выигрыш большим, чем число α, если он откажется от максиминной стратегии. Тогда исход, который реализуется при максиминной и минимаксной стратегиях, не будет равновесным. Других равновесных исходов также не существует, следовательно игра без седловой точки не имеет решения в чистых стратегиях. Пример. Найти решение игры.
Решение. Чистой цены не существует. Равновесия в чистых стратегиях нет. Пример. В платёжной матрице найти точку равновесия.
Точкой равновесия будет являться точка 6. Пример. Посёлок Паново состоит из одной улицы. Два предпринимателя решили разместить свои киоски с продовольственными товарами. Других продовольственных магазинов в посёлке нет. Будем считать, что: 1. Оба киоска продают один и тот же ассортимент товаров по одним и тем же ценам; 2. Плотность жителей равномерно распределена по длине улицы. Найти положение киосков, исходя из того, что каждый предприниматель стремится к наибольшей выручке. Решение. Возьмём длину улицы за 1, тогда весь посёлок расположится на отрезке (Рис.1) Рисунок 1
Обозначим x – координата первого киоска; y – координата второго киоска. Очевидно, что Найдём выручку X первого киоска. Цену товара возьмём за 1. – середина расстояния между x и y.
Первый предприниматель решает задачу , а второй соответственно . Таким образом, получаем игру с постоянной суммой, равной 1. Применим принцип гарантированного результата. Первый предприниматель ожидает, что второй будет выбирать такое значение y, чтобы выручка первого была минимальной, то есть он исходит из пессимистических ожиданий: 1-й выбирает такой x, чтобы:
2-й выбирает такой y, чтобы: Найдём оптимальные стратегии: Аналогично Таким образом, лучшими стратегиями будет размещение киосков на середине улицы спиной друг к другу. Это равновесие не выгодно жителям посёлка, но обеспечивает равновесие между предпринимателями. В примере два конкурента фактически борются за долю, превышающую , т.е. за выигрыш , где – функция платежа, если – выигрыш x – выигрыш y. Равновесие: .
|