КАТЕГОРИИ:

Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Модели матричных игр со смешанными стратегиями игроков. Свойства смешанных стратегий

⇐ ПредыдущаяСтр 14 из 45Следующая ⇒

Рассмотрим матричную игру:

			…		…
			…
			…		…
…	…	…	…	…	…	…	…
			…		…
…	…	…	…	…	…	…	…
			…		…
			…		…

Обозначим через , …, вероятности, с которыми игрок А использует чистые стратегии , …, . В силу свойств вероятностей:

. (6.3)

Упорядоченное множество р = (, …, ), элементы которого удовлетворяют условиям (6.3), полностью определяют характер игры игрока А и называется его смешанной стратегией. Итак, смешанной стратегией игрока А является полный набор вероятностей применения его чистых стратегий. Множество смешанных стратегий определяется случайным выбором чистых стратегий. Любая его чистая стратегия А может рассматриваться как частный случай смешанной стратегии, i -я компонента которой равна 1, а остальные равны нулю: р = (0; …; 1; …; 0).

Упорядоченное множество q = (, …, ), элементы которого удовлетворяют соотношениям , называются смешанной стратегией игрока В.

Применение смешанных стратегий p и q игроками А и В означает, что игрок А использует стратегию с вероятностью , а игрок В – стратегию с вероятностью . Поскольку игроки выбирают свои стратегии случайно и независимо друг от друга, то вероятность выбора комбинации стратегий (, ) будет равна . При использовании смешанных стратегий игра приобретает случайный характер, поэтому случайными будут и выигрыши игрока А и проигрыши игрока В. Следовательно, можно вести речь лишь о средней величине (математическом ожидании) выигрыша (проигрыша). Эта величина является функцией смешанных стратегий p и q и определяется по формуле:

Функция f (p; q) называется платежной функцией игры с матрицей .

Смешанные стратегии , назовем оптимальными смешанными стратегиями игроков А и В, если они удовлетворяют неравенству:

(6.4)

для любых стратегий и .

Значение платежной функции при оптимальных стратегиях определяет цену игры v, т. е. .

В седловой точке платежная функция достигает максимума по смешанным стратегиям игрока и минимума по смешанным стратегиям игрока .

Рассмотрим игру с матрицей и предположим, что и – оптимальные смешанные стратегии игроков и – цена игры. Проверку того, что набор является решением, можно провести при помощи теоремы 6.2.

Теорема 6.2. Для того, чтобы смешанные стратегии и , были оптимальными для игроков А и В в игре с матрицей и ценой v, необходимо и достаточно выполнения неравенств:

Кроме того, смешенные стратегии удовлетворяют еще следующим теоремам.

Теорема 6.3. В смешанных стратегиях любая конечная матричная игра имеет седловую точку.

Теорема 6.4. Если один из игроков придерживается своей оптимальной смешанной стратегии, то его выигрыш остается неизменным и равным цене игры независимо от того, какую стратегию применяет другой игрок, если только тот не выходит за пределы своих активных стратегий.

Активные стратегии – это чистые стратегии игрока, входящие в оптимальную смешанную стратегию с вероятностями, отличными от нуля.

Из теоремы 6.2 вытекает принципиальное решение матричной игры: надо найти неотрицательное решение (, , …, , , , …, , v) системы линейных неравенств и линейных уравнений:

; .

Отметим, что число активных стратегий игроков не превышает наименьшего из чисел m и n.

Решение матричной игры можно упростить, если воспользоваться доминированием одних стратегий над другими.

Говорят, что стратегия доминирует над стратегией , если элементы k -й строки не меньше соответствующих элементов s -ой строки: , . Выигрыш игрока А в этом случае (при стратегии ) больше чем при стратегии , какой бы стратегией не воспользовался игрок В. Стратегию назовем доминирующей, а стратегию – доминируемой.

Аналогично и для столбцов:

если элементы l -го столбца не превосходят соответствующих элементов r -го столбца: , , то игроку В выгоднее применять стратегию , чем , так как он будет проигрывать меньше. Поэтому стратегия доминирует над стратегией . Стратегия называется доминирующей, стратегия – доминируемой.

Если , , или , , то стратегии и , и называются дублирующими.

Пример 6.3. Выполнить возможные упрощения платежной матрицы:

Решение. Элементы первой и третьей строки соответственно равны. Поэтому одну из них можно удалить. Элементы второй строки не превышают соответственно элементов первой строки, поэтому удаляем вторую строку и приходим к матрице

Элементы первого столбца преобразованной матрицы больше соответствующих элементов второго столбца, элементы второго столбца больше соответствующих элементов третьего столбца; элементы третьего столбца больше соответствующих элементов четвертого столбца. Поэтому доминируемые первый, второй и третий столбцы опускаем. В результате получаем матрицу

Сравнивая строки полученной матрицы, заключаем, что элементы первой строки больше соответствующих элементов второй строки. Следовательно, первая строка является доминирующей. Опуская вторую строку, получаем матрицу , из которой следует, что наилучшей стратегией для игрока является чистая стратегия . Опуская доминируемую стратегию игрока , получаем матрицу . Итак, получили матицу, состоящую из одного элемента. Это объясняется тем, что рассматриваемая матричная игра имеет седловую точку , а полученный элемент 4 является седловым элементом: . Таким образом, в результате упрощения платежной матрицы нашли решение игры: . Такой же результат получим, если вместо стратегии рассмотреть стратегию , поскольку эти стратегии являются дублирующими. Следовательно, оптимальными чистыми стратегиями для игрока являются стратегии или , а для игрока - стратегия , обеспечивающие наибольший выигрыш для игрока , равный 4, и наименьший проигрыш игрока .

Теорема 6.5. Пусть и – оптимальные смешанные стратегии игроков А и В в игре I с матрицей и ценой v. Тогда и будут оптимальными и в игре I' с матрицей и ценой , где .

Воспользовавшись этой теоремой матрицу:

можно упростить. Сначала разделить элементы матрицы на 100, а затем прибавить к полученным значениям 2:

элементы последней матрицы получены по формуле:

⇐ Предыдущая 9 10 11 12 131415 16 17 18 Следующая ⇒

Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.013 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал