Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Матричная игра как модель антагонистического конфликта.
Антогонистическим называется конфликт, в котором интересы участников противоположны. H2(S) = -H1(S); H1(S) + H2(S) = 0 Если каждый из игроков имеет конечное число стратегий, то игра называется матричной. Пусть 1й игрок имеет m стретегий, i=1..m 2й имеет n. j=1..n Выбор каждого из игроков его стратегии приводит в формированию игровой ситуации. H1(i, j) = aij - выигрыш первого игрока Числа aij в совокупности образуют матрицу А размером mxn, это матрица игры (или платежная матрица). Она содержит всю информацию о ПР. Задача первого состоит в максимизации его выигрыша. 2-го - минимизации выигрыша 1го. Игроки решают противоположные задачи (матрица симметричная или нет?) Средство достижения игроком цели – выбор его возможной стратегии. Для их оценки необходимы критерий, позволяющий сравнивать исходы ПР. Обычно выбор критерия, по которому находят оптимальное решение, определяется количественной и качественной информацией. Матрица игры – предельный? случай полного отсутствия информации о действиях другой стороны: каждый из них знает стратегии другого, но не знает, какая будет выбрана. Рационально ориентироваться на наихудший вариант исхода событий. (тут типа матрица А с элемантами aij и размерностью m на n) Рассмотрим первого игрока (с его стратегиями связаны строки). i-ю стратегию он оценивает наименьшим выигрышем, который гарантируется ему при любых действиях 2-го игрока. alphai = min aij, j=1..n. Будет выбрана та, стратегия, которая удовлетворяет максимуму гарантированного выигрыша. alpha = max alphai = max min aij Это максиМин, или нижняя цель игры. Стратегия, где достигается нижная цель игры, называется максиминной.
Рассмотрим второго игрока.Оценивается развитие конфликта по наихудшему варианту второго игрока. Вычисляют betaj = max aij; i=1..m. Будет выбрана та, стратегия, которая составляет минимум гарантированного выигрыша. Beta = min betaj = min max aij // минимаксная стратегия второго игрока. Минимаксная и максиминная стратегии игроков – это их оптимальные стратегии и образуют ситуацию равновесия. Т.е. ситуация равновесия тогда, когда минимальный элемент в своей строке соответствует максимальному элементу в столбце, а Alpha = Beta. Если alpha < beta, 1й игрок может обеспечить себе выигрыш alpha, а второй позволит выиграть ему не больше beta. Вопрос о разделе разницы остается открытым (beta – alpha > 0). В подобных ситуациях игроки будут искать дополительные стратегические возможности получения большей четкости разницы. В таких случаях (осущ возможностей) логично переходить к смешанным стратегиям, которые ассоциируются со случайным выбором игроком своих индивидуальных стратегий. Такие действия: 1) Обеспечить наибольшую скрытность выбора стратегии. 2) При разумном построении механизма случайного выбора, смешанные стратегии оказываются оптимальными, т.е. составляют ситуацию равновесия. 9. Методы решения матричных игр: равновесие в чистых стратегиях, доминирование стратегий, смешанные стратегии. Если alpha < beta, 1й игрок может обеспечить себе выигрыш alpha, а второй позволит выиграть ему не больше beta. Вопрос о разделе разницы остается открытым (beta – alpha > 0). В подобных ситуациях игроки будут искать дополительные стратегические возможности получения большей четкости разницы. В таких случаях (осущ возможностей) логично переходить к смешанным стратегиям, которые ассоциируются со случайным выбором игроком своих индивидуальных стратегий. Такие действия: 3) Обеспечить наибольшую скрытность выбора стратегии. 4) При разумном построении механизма случайного выбора, смешанные стратегии оказываются оптимальными, т.е. составляют ситуацию равновесия. Пусть 1й игрок – m чистых стратегий. Его смешанная стратегия называется вектор X = (x1, x2,.., xm) – компоненты которого интерпритируются как вероятности выбора первым игроком его чистых значений xi> =0, сумма компонентов = 1. Второй игрок – то же самое, только игреки (Y). При переходе к смешанных стратегиям, любая игровая ситуация рреализуется с вероятностью xi*yj и является случайным событием. Средний ожидаемый выигрыш 1го игрока – платежная функция H(X, Y) = Sum(i=1to m)Sum(j=1 to n) [aij * xi * yj] Если в матрице H??? элемента почти никогда не существует, то функция игры имеет седловую точку H(X*, Y*). H(X, Y*)< = H(X*, Y*) < = H(X*, Y) – седловая точка соотв максимуму Х и минимуму по Y. (X*, Y*) – наз оптимальными стратегиями 1го и второго игрока и в совокупности формируют ситуацию равновесия. Значение функции игры H(X*, Y*)= v = цена игры. Совокупность ситуаций равновесия и цен игры составляют решения игры. Оптимальные смешанные стратегии всегда можно найти как решение задач линейного программирования.
Размерность задач лучше снизить.
Пусть игра определяется матрицей А(mxn) = {aij} 1й игрок: стратегия i > k если при любом j=1..m существует aij > = aki и aij > aji
2й игрок: стратегия j > l(L) если при любом i=1..m существует aij > = ail и aij > ajl
Доминирующие стратегии входят в оптимальные смешанные стретгии с нулевой вероятностью и из дальнейшего рассмотрения мб исключены.
|