Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Модели матричных игр со смешанными стратегиями игроков. Свойства смешанных стратегий
Рассмотрим матричную игру:
Обозначим через , …, вероятности, с которыми игрок А использует чистые стратегии , …, . В силу свойств вероятностей: . (6.3) Упорядоченное множество р = (, …, ), элементы которого удовлетворяют условиям (6.3), полностью определяют характер игры игрока А и называется его смешанной стратегией. Итак, смешанной стратегией игрока А является полный набор вероятностей применения его чистых стратегий. Множество смешанных стратегий определяется случайным выбором чистых стратегий. Любая его чистая стратегия А может рассматриваться как частный случай смешанной стратегии, i -я компонента которой равна 1, а остальные равны нулю: р = (0; …; 1; …; 0). Упорядоченное множество q = (, …, ), элементы которого удовлетворяют соотношениям , называются смешанной стратегией игрока В. Применение смешанных стратегий p и q игроками А и В означает, что игрок А использует стратегию с вероятностью , а игрок В – стратегию с вероятностью . Поскольку игроки выбирают свои стратегии случайно и независимо друг от друга, то вероятность выбора комбинации стратегий (, ) будет равна . При использовании смешанных стратегий игра приобретает случайный характер, поэтому случайными будут и выигрыши игрока А и проигрыши игрока В. Следовательно, можно вести речь лишь о средней величине (математическом ожидании) выигрыша (проигрыша). Эта величина является функцией смешанных стратегий p и q и определяется по формуле: .
Функция f (p; q) называется платежной функцией игры с матрицей . Смешанные стратегии , назовем оптимальными смешанными стратегиями игроков А и В, если они удовлетворяют неравенству: (6.4) для любых стратегий и . Значение платежной функции при оптимальных стратегиях определяет цену игры v, т. е. . В седловой точке платежная функция достигает максимума по смешанным стратегиям игрока и минимума по смешанным стратегиям игрока . Рассмотрим игру с матрицей и предположим, что и – оптимальные смешанные стратегии игроков и – цена игры. Проверку того, что набор является решением, можно провести при помощи теоремы 6.2. Теорема 6.2. Для того, чтобы смешанные стратегии и , были оптимальными для игроков А и В в игре с матрицей и ценой v, необходимо и достаточно выполнения неравенств:
Кроме того, смешенные стратегии удовлетворяют еще следующим теоремам. Теорема 6.3. В смешанных стратегиях любая конечная матричная игра имеет седловую точку. Теорема 6.4. Если один из игроков придерживается своей оптимальной смешанной стратегии, то его выигрыш остается неизменным и равным цене игры независимо от того, какую стратегию применяет другой игрок, если только тот не выходит за пределы своих активных стратегий. Активные стратегии – это чистые стратегии игрока, входящие в оптимальную смешанную стратегию с вероятностями, отличными от нуля. Из теоремы 6.2 вытекает принципиальное решение матричной игры: надо найти неотрицательное решение (, , …, , , , …, , v) системы линейных неравенств и линейных уравнений: ; . Отметим, что число активных стратегий игроков не превышает наименьшего из чисел m и n. Решение матричной игры можно упростить, если воспользоваться доминированием одних стратегий над другими. Говорят, что стратегия доминирует над стратегией , если элементы k -й строки не меньше соответствующих элементов s -ой строки: , . Выигрыш игрока А в этом случае (при стратегии ) больше чем при стратегии , какой бы стратегией не воспользовался игрок В. Стратегию назовем доминирующей, а стратегию – доминируемой. Аналогично и для столбцов: если элементы l -го столбца не превосходят соответствующих элементов r -го столбца: , , то игроку В выгоднее применять стратегию , чем , так как он будет проигрывать меньше. Поэтому стратегия доминирует над стратегией . Стратегия называется доминирующей, стратегия – доминируемой. Если , , или , , то стратегии и , и называются дублирующими. Пример 6.3. Выполнить возможные упрощения платежной матрицы:
Решение. Элементы первой и третьей строки соответственно равны. Поэтому одну из них можно удалить. Элементы второй строки не превышают соответственно элементов первой строки, поэтому удаляем вторую строку и приходим к матрице Элементы первого столбца преобразованной матрицы больше соответствующих элементов второго столбца, элементы второго столбца больше соответствующих элементов третьего столбца; элементы третьего столбца больше соответствующих элементов четвертого столбца. Поэтому доминируемые первый, второй и третий столбцы опускаем. В результате получаем матрицу . Сравнивая строки полученной матрицы, заключаем, что элементы первой строки больше соответствующих элементов второй строки. Следовательно, первая строка является доминирующей. Опуская вторую строку, получаем матрицу , из которой следует, что наилучшей стратегией для игрока является чистая стратегия . Опуская доминируемую стратегию игрока , получаем матрицу . Итак, получили матицу, состоящую из одного элемента. Это объясняется тем, что рассматриваемая матричная игра имеет седловую точку , а полученный элемент 4 является седловым элементом: . Таким образом, в результате упрощения платежной матрицы нашли решение игры: . Такой же результат получим, если вместо стратегии рассмотреть стратегию , поскольку эти стратегии являются дублирующими. Следовательно, оптимальными чистыми стратегиями для игрока являются стратегии или , а для игрока - стратегия , обеспечивающие наибольший выигрыш для игрока , равный 4, и наименьший проигрыш игрока . Теорема 6.5. Пусть и – оптимальные смешанные стратегии игроков А и В в игре I с матрицей и ценой v. Тогда и будут оптимальными и в игре I' с матрицей и ценой , где . Воспользовавшись этой теоремой матрицу:
можно упростить. Сначала разделить элементы матрицы на 100, а затем прибавить к полученным значениям 2:
элементы последней матрицы получены по формуле:
.
|