Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Матричные игры.
Игроки-участники игры. N - множество игроков. Стратегии -решения, принимаемые игроками. В некоторых играх игрокам имеет смысл объединяться и действовать совместно, такие объединения называют коалициямидействий - Кд. Для каждого игрока должны быть определены возможные действия, которые определяют множество допустимых стратегий, которые принято называть чистымистратегиями. При произвольном выборе стратегий может сложиться ситуация, которая не разрешается правилами игры, т.е. запрещеннаяситуация. Ситуация, разрешаемая правилами игры, называется допустимой. S0 - мн-во допустимых исходов. В зависимости от предпочтительности исходов игрокам имеет смысл объединяться в коалиции интересов - Ки. Сравнивать исходы между собой в общем случае можно с помощью отношения предпочтения ≥. Удобнее использовать численную оценку каждого исхода, т.е. критерий эффективности, который в игре принято называть функцией выигрыша. {N, Кд, Ки, {Ui}i Î Ки, S0, {≥ }} ({Ui}i Î Ки - множество чистых стратегий i - го игрока). Оптимальная стратегия -стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш. Смешанная стратегия - вероятностное распределение на множестве чистых стратегий. Совокупность смешанных стратегий определяет множество смешанных стратегий, которое является расширением множества чистых стратегий. Антагонистическая игра. Бескоалиционная игра двух лиц (т.е. не допускается каких-либо коалиций) с нулевой суммой (g1+g2=0, где g1, g2 - функции выигрыша игроков) в нормальной форме (т.е. в игре стратегии представляют собой разовый выбор) называется антагонистической игрой. {X, Y, F(x, y)}X - мн-во чистых стратегий 1-го игрока, Y - мн-во чистых стратегий 2-го игрока, F(x, y) - вещественно - значная функция выигрыша одного игрока в ситуации (x, y). Поведение игроков в антагонистической игре определяется принципом гарантированного результата. Границы возможностей игроков определяется значением нижней
2. 1. k1, k2-угловые коэффициенты qj10=1 qj0=0, для любого j≠ j1 3. бесконечное множество решений для первого игрока, для второго - qj0=1 Для n х 2 аналогично (но находиться верхняя огибающая, ищется точка min). Метод Шепли-Сноу. При решении игр 2 x m (n x 2) было обнаружено св-во: у второго игрока (у первого) существует оптимальная стратегия, которая также содержит не более двух четных. Это свойство в обобщенном виде справедливо и для игры n x m. Множество оптимальных смешанных стратегий игроков представляет собой выпуклые, замкнутые, ограниченные многогранники, а многогранник определяется конечным числом своих крайних точек, т.е. вершин, поэтому, чтобы определить мн-во оптимальных стратегий, Д найти крайние точки мн-ва оптимальных стратегий. Th Шепли-Сноу: все крайние оптимальные стратегии p0, q0 и цена игры с платежной матрицей А должны удовлетворять какому-либо из уравнений: S(s=1, r)aij+p0i=V, t=1, r; S(t=1, r)aij+p0j=V, s=1, r; Матрица (aisjt) получается из матрицы А вычеркиванием некоторого количества строк и столбцов. Причем, р0i=0 (для вычеркнутых строк) для любого i принадл. 1, …, n\{i1, i2, …, ir}q0j=0 (для вычеркнутых столбцов) для любого j принадл. 1, …, m\{j1, j2, …, jr}.При этом, если V≠ 0, то матрица (aisjt) невырожденная. Алгоритм нахождения оптимальных стратегий методом Ш-С: целесообразно, если это возможно, уменьшить размерность матрицы, при этом, если ищется полное решение, то вычеркиваются только строгодоминируемые строки и столбцы в полученной матрице перебрать все квадратные подматрицы не ниже второго порядка, для каждой из них решить соответствующую систему уравнений, при этом, если V≠ 0, то соответствующая система имеет единственное решение, либо не имеет решений из 2-го пункта следует, что ситуация простая в случае невырожденности матрицы А, поэтому исходную игру следует свести к игре с заведомо ≠ 0 цене игры а! ij= аij+μ μ > max{| аij |: аij ≤ 0}4)полученное решение проверить на неотрицательность и на выполнение условия оптимальности h(p0, j)≥ V, h(I, q0)≤ V 5. найденные решения являются оптимальными, но не обязательно крайними, т.к. Th является Н условием крайности. Полный перебор квадратных подматриц приводит к нахождению оптимальных стратегий, включающих в себя и крайние 6.выпуклая оболочка всех найденных оптимальных стратегий дает нам множество оптимальных стратегий игроков. Метод Брауна. Метод дает приблизительное решение. Идеи метода: разыгрывается мысленный эксперимент, в котором игроки А и В применяют друг против друга свои стратегии. Начинается эксперимент с того, что один из игроков, скажем А, выбирает произвольно одну из своих чистых стратегий, например i1, противник отвечает той своей стратегией j1, которая уменьшает выигрыш игрока. дальше очередь А: он отвечает на стратегию игрока В той своей стратегией i2, которая дает максимальный средний выигрыш при стратегии j1. затем очередь В: он отвечает на стратегии i1 и i2 той стратегией j2, которая дает наименьший средний выигрыш при этих двух стратегиях и т.д. на каждом шаге итерационного процесса каждый игрок отвечает на каждый ход противника той своей стратегии, которая является оптимальной относительно всех его предыдущих шагов рассмотренных как смешанная стратегия, в которой чистые стратегии представляются в пропорциях соответствующих частоте их применения.V=(V*+V*)/2 - средний выигрыш; V*=(V*(k))/k - min накопленный выигрыш за n партий; V*=(V*(k))/k - max накопленный выигрыш за n партий; k - число шагов При увеличении числа итераций V, V*, V* будут приближаться к цене игры. Преимущества метода: объем и сложность вычислений сравнительно слабо возрастают по мере увеличения числа стратегий. Сходимость данного итерационного процесса очень медленная, не монотонная, поэтому задают точность решения, т.е. выбирают " +" ε и прекращают процесс, если разность между min V*(k) и max V*(k)≤ 2ε. Связь матричных игр с линейным программированием. Прямая и двойственная задача, теорема двойственности. Решение матричной игры с платежной матрицей А=(аij) аij> 0, i=1, …, m, j=1, …, n эквивалентно решению пары двойственных ЗЛП следующего вида: min∑ xi xi≥ 0(i=1, …, m) ∑ aijxi≥ 1 (j=1, …, n) max∑ yj yj≥ 0(j=1, …, n) ∑ aijyj≤ 1 (i=1, …, m) Другими словами, если х0=(х01, х02, …, х0n), y0=(y01, y02, …, y0n) - решение соответствующей ЗЛП, то V=1/∑ x0i =1/∑ y0j; p0=Vx0, q0=Vy0 - решение матричной игры. Если p0, q0- оптимальные стратегии игроков, V- цена игры, то x0=p0/V, y0=q0/V- решение двойственной задачи.Любой ЗЛП, которую будем считать прямой или исходной можно поставить в соответствие другую, которую двойственной. Обе эти задачи образуют пару двойственных задач.Th двойственности (она позволят установить взаимосвязь между оптимальными решениями пар двойственных задач, используя их можно решить любую задачу из пары и не решая вторую сразу указать ее оптимальное решение и оптимальное значение или установить отсутствие оптимального решения) если одна из пары двойственных задач имеет оптимальное решение, то и двойственная к ней также имеет оптимальное решение, причем значение целевых функций на обоих оптимальных решениях совпадают. Если одна из пары двойственных задач не имеет решения ввиду несовместности системы ограничений, то вторая задача не имеет решения в виду неограниченности целевой функции и наоборот.
|