Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Глава 1 Статические игры с полной информацией

Оглавление

Предисловие 5

Введение 9

1 Статические игры с полной информацией 23

1.1 Способы задания бескоалиционных игр............. 23

1.2 Игры в нормальной форме......................... 26

1.3 Доминируемые стратегии.......................... 30

1.4 Последовательное удаление слабо доминируемых стратегий....... 33

1.5 Рационализуемые стратегии........................ 38

1.6 Равновесие по Нэшу......................... 41

1.7 Равновесие по Нэшу в смешанных стратегиях............... 44

1.8 Модель дуополии по Курно.......................... 49

1.9 Равновесие по Нэшу в дуополии по Курно как результат обучения. 51

1.10 Дуополия по Бертрану....................... 52

1.11 Пример " Проблема общего"......................... 54

1.12 Равновесие " дрожащей руки"....................... 55

1.13 Дополнение: Антагонистические игры................... 57

1.14 Дополнение. Решение биматричных игр 2x2............... 62

1.15 Задачи...................................... 79

2 Динамические игры с полной информацией 83

2.1 Позиционная форма игры...................... 83

2.2 Обратная индукция и конечные игры с совершенной информацией……….. 93

2.3 Совершенное под-игровое равновесие по Нэшу......... 94

2.4 Примеры.................................... 101

2.5 Повторяющиеся игры.............................105

2.6 Задачи......................................115

Статические игры с неполной информацией 121

3.1 Байесовы игры.................................121

3.2 Альтернативный взгляд на смешанные стратегии.............127

3.3 Замечание о коррелированном равновесии.................130

3.4 Примеры....................................132

3.5 Задачи......................................136

Динамические игры с неполной информацией 139

4.1 Совершенное Байесово равновесие.....................139

4.2 Последовательное равновесие........................153

4.3 Сигнальные игры...............................155

4.4 Задачи.....................................167

Элементы эволюционной теории игр 169

5.1 Обучение и эволюция.............................169

5.2 Эволюционно устойчивые стратегии....................176

Элементы теории кооперативных игр 183

6.1 Классические кооперативные игры.....................183

6.2 Игры без побочных платежей........................199

6.3 Нечеткие коалиции..............................205

6.4 Приложения кооперативных игр.......................214

6.5 Дополнение. Существование и единственность вектора Шепли.....225

6.6 Выпуклые игры................................229

6.7 Задачи......................................234

Литература 234

 


Предисловие

В настоящее время огромный интерес привлекает теория игр, которая, с одной стороны, наряду с математическими моделями общего равновесия и теорией социального выбора, сыграла ключевую роль в создании современной экономической теории, а с другой, является одним из важнейших инструментов анализа огромного многообразия задач, возникающих не только в экономике, но и политике, социальных науках, военном деле, биологии и др.

Суть теории игр (с экономической точки зрения) в том, чтобы помочь экономистам понимать и предсказывать то, что может происходить в экономических ситуациях, и сейчас вряд ли можно найти область экономики или дисциплины, связанной с экономикой, где основные концепции теории игр не были бы просто необходимыми для понимания современной экономической литературы.

В настоящий момент, если говорить об экономических приложениях, речь идет уже не только о применении теоретико-игровых методов к ставшим достаточно традиционными проблемам теории организации промышленности, но и, по сути дела, ко всему многообразию экономической проблематики. Теорию игр следует понимать как инструмент экономического анализа, который:

1) дает ясный и точный язык исследования различных экономических ситуаций;

2) дает возможность подвергать интуитивные представления проверке на логическую согласованность;

3) помогает проследить путь от " наблюдений" до основополагающих предположений и обнаружить, какие из предположений действительно лежат в основе частных выводов.

При этом, как уже отмечалось выше, в настоящий момент область применения теории игр гораздо шире, чем только экономика.

 

 

Предлагаемый вниманию читателя вводный курс теории игр написан на основе лекций по теории игр, которые читались авторами на протяжении ряда лет на факультете экономики Европейского университета в Санкт-Петербурге, студентам кафедры экономической кибернетики Санкт-Петербургского государственного университета и студентам Новгородского государственного университета имени Ярослава Мудрого.

В данном пособии мы не ставили перед собой задачу детального и формального изложения различных аспектов теории игр. Наша главная цель состояла в том, чтобы познакомить студентов экономических специальностей с основами теории игр, представить им " первый набросок панорамной картины", представляющей основные идеи и методы современной теории игр, на простых (порой даже примитивных) моделях продемонстрировать возможности теоретико-игрового моделирования различных экономических ситуаций и дать, тем самым, в руки ключ к двери, за которой простирается широчайшее многообразие теоретико-игровых моделей. Мы сознательно стремились минимизировать формализм, достаточно часто избегая формулировок соответствующих теорем или их доказательств. В то же время в дополнительных разделах к некоторым главам мы приводим достаточно подробно ряд важных, на наш взгляд, результатов, которые, безусловно, будут полезны тем, кто захочет более детально " прочувствовать" предмет.

К настоящему моменту написано огромное количество учебников по теории игр самого разного уровня, ориентированных на различных читателей. Многие из них приведены в списке литературы. Мы упомянем здесь пять, которые представляются нам наиболее удачными для тех, кто захочет познакомиться с гигантским айсбергом теории игр, лишь крохотную часть которого мы попытались представить в настоящем пособии. Это учебник выдающегося ученого и методолога, основателя советской теоретико-игровой школы — Николая Николаевича Воробьева, многие годы читавшего курс теории игр на экономическом факультете Ленинградского государственного университета (Воробьев, 1985). Далее это учебники Роберта Гиббонса (Gibbons, 1992), Мартина Осборна и Ариэля Рубинштейна (Osborn, Rubinstein, 1994), Дрю Фуднеберга и Жана Тироля (Fudenberg, Tirole, 1991) и, наконец, учебник Андрэ Мас-Колелла, Майкла Уинстона и Джерри Грина (Mas-Colell, Whinston, Green, 1995)[1]. Целый ряд задач и примеров в тексте заимствован нами именно из этих учебников.

Мы хотели бы выразить глубокую признательность нашим студентам, которые помогали нам своими вопросами, комментариями и замечаниями и благодаря которым это пособие было написано.

Мы выражаем также глубокую благодарность Институту " Открытое Общество", в рамках мегапроекта которого " Развитие образования" стало возможным появление этого пособия.

 

 

ВВЕДЕНИЕ

В последние три десятилетия наблюдается стремительное повышение интереса к теории игр и значительное возрастание ее роли. Во многом это объясняется, тем, что без нее в настоящее время уже немыслима современная экономическая теория, причем область применения теории игр постоянно расширяется. Теория игр прошла путь от весьма формализованной теории, представлявшей интерес в первую очередь для математиков и ставшей источником целого ряда работ чрезвычайно глубо­кого математического содержания, до одного из важнейших инструментов анализа огромного многообразия задач, возникающих в экономике, политике, социальных науках и т. д. (разумеется, не утратив при этом своего математического содержания).

1. Первыми исследованиями игр в экономической литературе, по-видимому, следует считать статьи Курно (Cournot, 1838), Бертрана (Bertrand, 1883) и Эджворта (Edgeworth, 1897), в которых рассматривались проблемы производства и ценообра­зования в олигополии. Правда, они рассматривались тогда как весьма специфические модели, и в некотором смысле существенно опередили свое время.

Анализ различных салонных игр проводился еще в Древнем Китае, но, видимо, первые работы, в которых нахождение оптимальных стратегий в играх формулировалось как математическая задача, появились только в XVII веке (Bachet de Mezirak, Lyon, 1612). Первым серьезным математическим результатом в этом направлении явилась работа Э.Цермело 1912 г. " О применении теории множеств к шахматной игре" (см. сб. " Матричные игры", под. ред. Н.Н.Воробьева, М., 1961. С. 137-153). В ней он доказал, что в каждой позиции шахматной партии один из игроков может форсированно выиграть или обеспечить себе ничью, выбирая " правильные" ответы на любой ход противника. Хотя именно эта работа считается первой работой по теории игр, общепризнанным " годом рождения" теории игр стал 1944 г.

В 1944 году вышла в свет основополагающая монография Джона фон Неймана и Оскара Моргенштерна " Теория игр и экономическое поведение" (von Neu-mann/Morgenstern, 1944), которая, по существу, заложила фундамент общей теории игр и обосновала возможность анализа огромного массива экономических вопросов с помощью теоретико-игровых моделей. А в 1950 г. Джон Нэш (будущий Нобелевский лауреат по экономике 1994 г.) ввел понятие ситуации равновесия, названной впоследствии его именем, как метода решений бескоалиционных игр (т. е. игр, в ко­торых не допускается возможность создания коалиций). Ситуация, образующаяся в результате выбора всеми игроками некоторых своих стратегий, называется равновесной, если ни одному из игроков невыгодно изменять свою стратегию при условии, что остальные игроки придерживаются равновесных стратегий. Именно равновесие по Нэшу и его модификации признаются наиболее подходящими концепциями решения для таких игр.

За прошедшие с момента появления книги Дж. фон Неймана и О. Моргенштерна немногим более чем полвека теория игр прошла различные этапы своего развития и пережила несколько волн интереса к ней. Примерно 40-45 лет назад казалось, что теория игр дает чрезвычайно большие обещания экономике, однако эти обещания, увы, оказались тогда во многом лишь обещаниями, хотя в то же время был получен целый ряд очень глубоких математических результатов, представляющих значительный интерес даже вне экономических приложений. 30 лет назад " теорию игр" можно было найти разве лишь в предметном указателе некоторых учебников по теории организации промышленности[2] при рассмотрении олигополии по Курно, по Бертрану или по Штакельбергу. Однако за последние 20-25 лет произошел гигантский шаг вперед, и теперь вряд ли можно найти область экономики или дисциплины, связанной с экономикой, такой, скажем, как финансы, маркетинг..., в которых основные концепции теории игр не были бы просто необходимыми для понимания современной литературы.

Среди многочисленных определений того, что есть теория игр и каковы ее задачи, которые можно найти в различных статьях, учебниках и монографиях (см., например, Воробьев (1984, 1985), Aumann (1989), Dixit/Nalebuff (1991), Fuden-berg/Tirole (1992), Myerson (1991), Rasmussen (1989) и многие другие) упомянем лишь четыре. Первые два — это определения теории игр, которые с некоторыми вариациями, по-видимому, наиболее часто встречаются в литературе и достаточно точно характеризуют общую проблематику, охватываемую теорией игр: " Теория игр — это теория рационального поведения людей с несовпадающими интересами" (Aumann, 1989), и " Теория игр — наука о стратегическом мышлении" (Dixit/Nalebuff, 1991). Третье подчеркивает математическую природу теории игр: " Теория игр — это теория математических моделей принятия оптимальных решений в условиях конфликтов" (Воробьев, 1984). Наконец, четвертое определение выделяет роль теории игр именно в экономическом моделировании: " Суть теории игр в том, чтобы помочь экономистам понимать и предсказывать то, что будет происходить в экономическом контексте" (Kreps, 1990). В настоящий момент, если говорить об экономическом контексте, речь идет уже не только о применении теоретико-игровых методов к ставшим достаточно традиционными проблемам организации промышленности, но и, по сути дела, ко всему многообразию экономической проблематики. Так, например, на микроуровне — это модели процесса торговли (модели торга, модели аукционов). На промежуточном уровне агрегации изучаются теоретико-игровые модели поведения фирм на рынках факторов производства (а не только на рынке гото­вой продукции, как в олигополии). Теоретико-игровые модели возникают в связи с различными проблемами внутри фирмы. Наконец, на высоком уровне агрегации, с международной экономикой связаны модели конкуренции стран по поводу тарифов и торговой политики, а макроэкономика включает модели, в которых, в частности, стратегическое взаимодействие рассматривается в контексте монетарной политики. " Аппарат теории равновесия и теории игр послужил основой для создания современных теорий международной торговли, налогообложения, и общественных благ, монетарной экономики, теории производственных организаций" (Полтерович, 1997, с. 11).

Разумеется, следует иметь ввиду, что в настоящий момент область применения теории игр гораздо шире, нежели только экономический контекст (который для нас представляет, естественно, особый интерес). Это и политический и социальный контексты, это и биология, и военное дело, и многое другое (см., например, Дюбин/Суздаль (1981), Shubik (1984), Moulin (1983, 1986), Ordeshook (1986), Rawls (1971), Maynard Smith (1974) и др.). Скажем, теоретике- игровой подход к изу­чению формирования коалиций — это уже своего рода традиция в социальных и политических науках (см., например, Riker (1962), Riker/Ordeshook (1973), De Swan (1973), Ordeshook (1978, 1992), Van Deemen (1997)). Здесь же следует упомянуть, например, книгу Game Theory and the Law (D.Baird, R. Gertner, C. Picker (1994)), в которой аппарат теории игр впервые применятся к анализу того, как законы влияют на поведение людей, партий и т. д.

2. Теория игр делится на две составные части: одна — это теория бескоалиционных (некооперативных) игр, а вторая — теория кооперативных игр. Это базовое деление, хотя подчас оно достаточно расплывчато, основано на том, что в бескоалиционной теории основной единицей анализа является (рациональный) индивидуальный участник, который старается сделать " максимально хорошо" себе в соответствии с четко определенными правилами и возможностями. Если происходит так, что индивиды принимают действия, которые можно было бы расценить как " кооперацию" в обычном смысле этого слова, то это делается потому, что такое кооперативное поведение оказывается в интересах каждого из индивидов: каждый опасается " расплаты" в случае нарушения кооперации (как это происходит, например, в повторяющихся играх).

В противоположность этому, в теории кооперативных игр основная единица анализа — это, как правило, группа участников, или коалиция; если игра определена, то частью этого определения является описание того, что каждая коалиция игроков может получить (чего она может достичь), без указания на то, как исходы или результаты будут влиять на конкретную коалицию.

Однако это деление ни в коем случае не следует рассматривать как исключающее: кооперативный и бескоалиционный подходы — это, если угодно, два взгляда на одну и ту же проблему. Как образно заметил И. Розенмюллер, игра — это " идеал", двумя " тенями" которого являются кооперативный и бескоалиционный подходы.

Бескоалиционная теория стратегически ориентирована. Она изучает то, что, как мы ожидаем, будут делать игроки в игре. Кооперативная теория, с другой стороны, изучает исходы, которые мы ожидаем (см. Aumann (1997)). При кооперативном подходе мы смотрим непосредственно на пространство исходов, а не на то, каким образом они были достигнуты. Бескоалиционная теория — это своего рода микротеория; она включает детальное описание того, что происходит. В кооперативной теории нас интересует то, чего игроки могут достичь, то есть нас интересуют возможные (допустимые) исходы[3]. То есть принимается во внимание все, что игроки могут получить, даже если у них нет соответствующих побудительных мотивов. Игроки могут вступать в коалицию и договариваться о совместных действиях, а значит, и относительно исходов; предполагается, что игроки должны соблюдать свои обязательства. Мы можем предполагать, что существует некий механизм типа суда, который форсирует выполнение контрактов, так что должны быть рассмотрены все возможные исходы.

Идея противопоставления кооперативного и бескоалиционного относится к началу 50-х годов, однако к концу 60-х годов это противопоставление начало сглаживаться. И если бескоалиционный подход можно сравнивать с микротеорией, то кооперативный (коалиционный) подход изучает игры с " макро" точки зрения, фокусирующейся на возможных исходах, которые можно получить при обязывающих соглашениях.

Более того, в последнее время появляется все большее число работ, " наводящих мосты" между бескоалиционной и кооперативной теорией (см., например, Gul (1989), Greenberg (1997), Hart, Mas-Colell (1995), Mas-Colell (1997), Reny (1997), Vohra (1997)).

3. Остановимся теперь чуть подробнее на проблемах приложения бескоалиционных игр, которые к настоящему времени занимают, пожалуй, большее место в экономическом моделировании[4]. (Мы не приводим здесь формальные определения, которые будут даны ниже, а на интуитивном уровне прокомментируем лишь некоторые моменты).

Бескоалиционная теория игр — это способ моделирования и анализа ситуаций, в которых оптимальное решение каждого игрока зависит от его представлений или ожиданий от действий (игры) его оппонентов (партнеров). Важнейшей чертой этой теории является то, что она " настаивает" на том, что игроки не должны иметь произвольных представлений относительно игры своих оппонентов. Напротив, каждый игрок должен пытаться предсказать игру своих оппонентов, используя свое знание правил игры и предположения, что его оппоненты рациональны, и поэтому пытаются сделать свои предсказания и максимизировать свои выигрыши.

Напомним, что цель теории игр — помочь нам понимать и предсказывать экономические феномены. Если применим критерий доминирования, то своего рода негласным соглашением является то, что агенты не будут выбирать стратегии, которые являются доминируемыми (т.е. те стратегии, которые хуже). И до тех пор, пока мы исходим из справедливости этой гипотезы, критерий доминирования дает четкий путь для предсказаний.

С равновесием по Нэшу, к сожалению, все обстоит несколько хуже. В некоторых ситуациях достаточно очевиден некоторый вполне определенный способ действия.

Рассмотрим две приведенные таблицы, игровой смысл которых состоит в следующем. У первого игрока (игрок 1) есть возможность выбрать либо стратегию (ход) u (первая строка), либо стратегию d (вторая строка). Второй игрок (игрок 2) может выбрать либо стратегию l (первый столбец), либо стратегию r (второй столбец). Они делают свои ходы одновременно и независимо. После этого они получают свои выигрыши, которые указаны в соответствующих клетках: если, например, игрок 1 выбрал u, а игрок 2 выбрал r, то в случае А оба они получат по 2 рубля (доллара, фунта,...), а в случае В — первый получит — 5, а второй — 4.

В случае А, по-видимому, совершенно очевидно, что " играть" надо левую нижнюю клетку (т.е. выбирать, соответственно, d и l), тогда как совершенно не понятно, что нужно играть во втором случае. И одна из возможностей состоит в разрешении предварительных переговоров. Но если бы понятие равновесия по Нэшу можно было оправдать, апеллируя только к предварительным переговорам, то значение этого понятия было бы достаточно низким, поскольку центральным становился бы вопрос о " силе договоренности". Однако " оправдание" равновесия по Нэшу исходит из ряда других соображений, на которых мы остановимся, в частности, в главе 1. Мы не будем пытаться приводить сложные модели, а лишь упомянем некоторые возможные приложения. Рассмотрим следующую игру

Ситуации подобного рода достаточно часто возникают в экономических рассмотрениях. Представим себе, например, две фирмы, продающие один и тот же (точнее, однородный) продукт. Каждая из фирм может рекламировать свой товар, скажем предлагая его на распродаже, что может увеличить ее прибыль и уменьшить прибыль конкурента, при данном фиксированном способе действия конкурента. Если обе фирмы рекламируют, то чистая прибыль каждого из конкурентов может уменьшиться. (Пример такого рода ситуации дает конкуренция между Airbus и Boeing. Хотя реклама в этом случае не была существенным элементом, в то же время ценовые уступки играли важную роль). Второго рода пример - две страны, являющиеся торговыми партнерами. Каждая из стран может использовать различные виды протекционистских мер, что в ряде случаев может приводить к выгоде своей страны, при данных фиксированных действиях второй страны. Если обе страны занимаются протекционистской политикой, общее благосостояние стран может снижаться.

В этом примере (мы впоследствии будем неоднократно возвращаться к такого типа игре) равновесие по Нэшу определяется стратегией d первого игрока и r — второго игрока. Действительно, если первый игрок выбрал стратегию d, то второму игроку невыгодно отклоняться от стратегии r, так как он вместо 0 получит выигрыш — 1. Аналогично, если второй игрок придерживается стратегии r, то первому невыгодно вместо d играть u, так как он также вместо 0 проиграет 1.

В тоже время " хорошая" ситуация (u, l), когда игрок 1 выбирает u, а второй — l, не является ситуацией равновесия по Нэшу, так как, например, игроку 1 выгодно (при условии, что второй играет l) отклониться от a и сыграть d, поскольку вместо 5 он выиграет 6.

На этом простом примере мы видим, что ситуации равновесия по Нэшу могут приводить к тем исходам, которые представляются весьма неудачными. Однако здесь возникает целый ряд интересных возможностей, в частности, связанных с введением динамики, позволяющих уходить от таких " неудач". Однако об этом нам предстоит подробнее говорить ниже.

Безусловно, следует специально подчеркнуть, что большая роль теории игр в экономике во многом объясняется тем, что теория игр дает язык для моделирования и технику анализа специфического динамического конкурентного взаимодействия. Скажем, в достаточно простом варианте это можно проиллюстрировать на следующем примере (см., Kreps (1990)). Представим себе монополиста (в классическом смысле), производящего некоторый товар для продажи. Для простоты будем считать, что спрос определяется кривой х = 13 - р. Структура затрат монополиста также весьма проста: с(х) = 6.25 + х. Стандартная теория предсказывает, что монополист, максимизирующий прибыль, будет выпускать 6 единиц готовой продукции и получит прибыль 29.75 (при цене 7). В то же время, если в данной ситуации рассмотреть возможность входа новичка (с такими же характеристиками), то ответ будет уже совершенно другим: укоренившийся монополист, предвидящий возможность входа, будет производить 7 единиц готового продукта (при цене 6), теряя несколько в прибыли в данном периоде, но обеспечивая себе большую прибыль в длительном периоде, поскольку новичок, считающий, что укоренившаяся фирма будет продолжать выпускать тот же объем продукции, воздержится от входа, так как его вход принесет ему нулевую прибыль.

Разумеется, здесь возникает, например, такой вопрос. А почему собственно новичок должен верить в то, что монополист будет продолжать выпускать такой-то объем готовой продукции, если новичок все-таки " осмелится" войти в отрасль? Этот вопрос, безусловно, существенен для этой истории. Хотя простейшая модель не дает ответа на этот вопрос, тем не менее, более сложные модели входа со сложной динамикой, которые используют многошаговые игры, уже позволяют анализировать ситуации входа с различными гипотезами о поведении агентов. Скажем, если мы будем рассматривать двухпериодную модель, то уже появляется возможность рассматривать более сложное поведение. Например, возможен вариант, когда монополист в первом периоде выбирает технологию. Он может, к примеру, за счет высоких фиксированных затрат снизить предельные затраты. Высокие фиксированные затраты и низкие предельные затраты делают поведение монополиста более агрессивным во втором периоде. Далее монополист может в первом периоде предпринимать действия, порождающие " потребительскую лояльность" (скажем, снижать цены) и т. д. и т. п. Известны многочисленные вариации на тему входа. Основной характеристикой соответствующих моделей является то, что в первом периоде монополист совершает действие, которое изменяет природу " дальнейшей игры", если новичок появляется, и которое может либо предотвратить вход совсем, либо позволит монополисту " подготовиться" к входу так, чтобы иметь преимущество в образующейся впоследствии дуополии (см.: например, Dixit (1980)).

Другая вариация на эту тему — это рассмотрение ситуации, когда новичок не имеет точного знания характеристик монополиста. Например, новичок не знает структуры затрат монополиста. В этом случае он может воспринимать низкую цену в первом периоде как сигнал, говорящий о низких предельных затратах укоренившейся фирмы, а стало быть воздержаться от входа. Монополист, понимая это, может, даже в случае высоких предельных затрат, назначить достаточно низкую цену, сигнализируя тем самым о, якобы, низких затратах.

Следующий момент, который необходимо отметить — это момент, связанный с тем, что теория игр дала возможность моделировать ситуации, когда речь идет о том, верить или не верить тем или иным обещаниям или угрозам. Здесь речь идет о моделировании репутации (скажем работодатель и работник).

Следующий классический пример, связанный с повторяющимся взаимодействием участников — неявный сговор в олигополии. Он базируется на так называемой Folk Theorem (" народной теореме", " фольклорной теореме" — см. гл.2), которая утверждает, что любые выигрыши двух фирм, которые дают каждой из фирм больше максиминного выигрыша и в сумме меньше, чем монопольная прибыль (за период) может поддерживаться в равновесии, если будущее ценится фирмами достаточно высоко. Как и во многих случаях, здесь возникает неприятный момент множественности равновесия, который, увы, оказывается весьма существенным и вынуждает пытаться вводить различные модификации равновесия по Нэшу.

Равновесия по Нэшу — это " согласованные" предсказания того, как игра будет разыгрываться, в том смысле, что если все игроки предсказывают, что возникнет определенное равновесие, то ни у одного из игроков не будет стимулов для отклонения. Таким образом, равновесие по Нэшу, и только оно, может обладать свойством, таким что игроки могут предвидеть его, их оппоненты предвидеть его и т. д. Напротив, предвидение того, что возникнет неравновесная ситуация, влечет за собой то, что по крайней мере один игрок сделает " ошибку", либо в своем предсказании, либо в оптимизации своего выигрыша. Естественно, вряд ли можно считать, что такие ошибки никогда не возникают.

4. В то самое время, когда теория бескоалиционных игр становится стандартным инструментом в экономике, она подвергается значительной критике со стороны как теоретиков так и экспериментаторов. Бескоалиционная теория игр, подобно неоклассической экономике, базируется на двух " героических" предположениях: МАКСИМИЗАЦИИ (каждый экономический агент рационален и ясно представляет себе мир); и СОГЛАСОВАННОСТИ (представления агента, и, в частности, его ожидания относительно поведения остальных агентов правильны). Эти два предположения, по сути дела и оправдывают то, что общие образцы индивидуального оптимизирующего поведения формируют равновесие по Нэшу.

Основная проблема, с которой в настоящее время столкнулись теоретики — это проблема " неотразимого" обоснования этих двух предположений, ибо традиционные обоснования отнюдь не являются неотразимыми. В то же время без такого обоснования использование теории игр в приложениях становится проблематичным. Использование теории игр требует понимания того, когда эти предположения осмысленны, а в каких случаях — нет. Основной упрек, часто адресуемый экономической методологии, касается центральной роли гипотезы максимизации. Общий неформальный аргумент в пользу максимизации состоит в том, что любой не максимизирующий агент, и в частности, любая фирма, не максимизирующая прибыль, будет выдавлена рыночными силами. Это эволюционный аргумент, и как таковой, хорошо известен. Однако, работает ли такое оправдание? Является ли равновесие по Нэшу, или какое-либо связанное с ним понятие, хорошим предсказанием?

Аналогия между бескоалиционной теорией игр и неоклассической экономикой очевидна, но она не абсолютна. Конечно, вопрос о том, максимизируют ли агенты, по существу один и тот же. Более того, предположение согласованности появляется также в неоклассической экономике как предположение о том, что цены очищают рынок. Однако фундаментальное различие между неоклассической экономикой и бескоалиционной теорией игр в том, что многочисленные равновесия в конкурентной экономике почти всегда разделяют многие из свойств (скажем, эффективность или ее отсутствие), тогда как многочисленные равновесия в игре могут иметь существенно различные свойства. Неоклассическая экономика не ставит вопроса о выборе равновесия, теория же игр обязана это делать.

В настоящее время очень стремительно развивается эволюционная теория игр.

Большинство работ по эволюционной теории игр мотивированы двумя основными вопросами: 1. Действительно ли агенты играют равновесие по Нэшу? 2.Если агенты играют равновесие по Нэшу, то какое?

Эволюционная теория игр формализует и обобщает эволюционный аргумент, предполагая, что более успешное поведение имеет тенденцию превалировать. В канонической модели популяция игроков взаимодействует во времени, причем их поведение приспосабливается во времени в ответ на их выигрыши (полезности, прибыли и т. д.), к которым исторически приводил их выбор. Эти игроки могут быть работниками, потребителями, фирмами и т. п. В центре внимания находится динамическое поведение системы. Ключевыми предположениями являются предположения о том, что имеется популяция игроков, эти игроки взаимодействуют, и что поведение игроков наивно (в двух смыслах: игроки не верят, не понимают, что их собственное поведение потенциально влияет на будущее поведение их оппонентов, и игроки, типично, не принимают во внимание возможность того, что их оппоненты подобным же образом вовлечены в приспособление своего собственного поведения). Здесь важно заметить, что успешное поведение становится превалирующим не только по­тому, что рыночные силы производят отбор, исключая неуспешное поведение, но и потому, что агенты имитируют успешное поведение.

Поскольку эволюционная теория игр изучает популяции, " играющие в игры", она также полезна при изучении социальных норм и конвенций. Эволюция конвенций и социальных норм является примером игроков, обучающихся играть равновесие. Примеры включают популяцию потребителей, которые должны решить, какой тип товара покупать; популяцию работников, которые должны решить, какие усилия прилагать, и т. д.

Эволюционная теория игр дает положительный ответ на первый вопрос: во многих постановках игроки действительно играют равновесие по Нэшу. Таким образом, это дает оправдание равновесного анализа тогда, когда осмысленны эволюционные аргументы. Равновесие лучше всего рассматривать как устойчивое состояние сообщества, члены которого близоруко группируются " по направлению" к максимизирующему поведению. И это существенно контрастирует с более ранним взглядом (у которого нет достаточного фундамента), в соответствии с которым теория игр и равновесный анализ представляют исследование взаимодействия ультрарациональных агентов с " большим запасом" знаний.

Вопрос о том, какое равновесие играется, широко обсуждается особенно в литературе, касающейся " уточнений" (или " утончений") равновесия. Однако проблема их обоснования также относится к ним. Можно представить себе, например, что допускается пред-игровое общение, которое приводит к тому, что определяется, какое равновесие играется (скажем, все работники прикладывают максимум усилий, или, напротив, минимум, если, к примеру, общий выпуск определяется минимальным (среди всех работников) уровнем усилий). Такое оправдание равновесия, конечно, возможно и применимо к ряду приложений. Но это не покрывает все возможности, тем более, что неизбежны ситуации, когда договор может нарушаться, или, что просто может не быть возможности предварительного общения.

Второе оправдание самоосуществляющегося предсказания может проходить примерно следующим образом: если теоретически единственным образом предсказанное поведение игроков известно игрокам в игре, то она должна предсказывать равновесие по Нэшу. Трудность здесь в том, что такое оправдание требует теории, которая однозначно предсказывает поведение игроков, а в этом-то проблема как раз и состоит.

Оправдание с помощью " фокальной точки" (Т. Шеллинг) можно формулировать примерно так: " если есть очевидный путь играть в игре (либо в силу специфики постановки, либо в силу специальной структуры), то игроки будут знать, что будут делать другие игроки".

Наконец, игроки могут научиться играть некоторое равновесие. Для того, чтобы научиться играть некоторое равновесие, игроки должны иметь возможность повторять розыгрыш этой или, по крайней мере, близкой, игры, чтобы иметь возможность получать нужный опыт. Если только игроки узнали, как играют их оппоненты, и если игроки максимизируют, то они должны оказаться в равновесии по Нэшу. В этой истории с обучением есть два момента. Первый — игроки максимизируют. Второй — это то, что при условии максимизирующего поведения игроков, игроки могут узнать поведение своих оппонентов. Это включает в себя дополнительные нюансы обучения. Даже если игрок знает, как его оппоненты играли, они могут не знать, каково было наилучшее действие. Наконец, само обучение меняет обстановку, которую агенты пытаются узнать, причем процесс обучения весьма тонок.

Мы остановились здесь на некоторых моментах, которые представляются нам важными, и на которых мы считали необходимым остановиться в преддверии формального изложения теории.

 

 


Глава 1 Статические игры с полной информацией

1.1 Способы задания бескоалиционных игр

 

Основная часть курса будет посвящена теории бескоалиционных игр. Это ни в коей мере не означает, что отсутствует интерес экономистов к " некооперативному поведению". Напротив, в настоящее время заметен существенный интерес к попыткам объяснить, каким образом кооперация может возникнуть как результат поведения индивидов, преследующих свои цели. Наконец, есть целый ряд важных задач, где роль теории кооперативных игр весьма существенна. Им мы посвятим заключительную часть курса.

Теория бескоалиционных игр — это способ моделирования и анализа ситуаций, в которых оптимальные решения каждого участника (игрока) зависит от его представлений (или ожиданий) об игре его оппонентов. Как уже говорилось во введении, важнейшим моментом теории является акцент на то, что игроки не должны придерживаться произвольных представлений об игре своих оппонентов. Напротив, каждый игрок должен пытаться предсказать игру своих оппонентов, используя свои знания правил игры и исходя из предположений, что его оппоненты — сами рациональны, а потому пытаются сами также предсказать игру своих оппонентов и максимизировать свои собственные выигрыши.

Есть два способа задания игры. Первый — это позиционная форма[5] игры. Позиционная форма задает: (1) порядок ходов, (2) " альтернативы" (выбор), доступные игроку тогда, когда наступает очередь его хода; (3) информация, которую игрок имеет на каждом из его ходов; (4) выигрыши (всех) игроков, как функцию выбранных ходов; (5) вероятностные распределения на множестве ходов Природы.

Позиционная форма представляется деревом игры, которое можно рассматривать как обобщение дерева принятия решений, используемое в теории принятия решений, на случай нескольких игроков. Формальное определение мы приведем в гл. 2. " Древесная структура" описывает, какая вершина следует за какой, какой игрок имеет ход, в соответствующей вершине. Информация, которую имеют игроки, описывается с помощью информационных множеств (см. рис. 1). Если две вершины лежат в одном информационном множестве, то это означает, что игрок (в данном случае 3) не может сказать, какое из двух действий (Л или П) в действительности произошло (в этом смысле игрок не различает вершины дерева, лежащие в одном информационном множестве).

 

Рис. 1. Информационные множества отмечены пунктиром.

1, 2, 3 — номера игроков, имеющих право хода (здесь не указаны выигрыши в концевых вершинах дерева).

 

На рисунках 2 и 3 изображены недопустимые информационные множества: информационные множества не могут пересекаться (не различая вершины одного информационного множества и вершины другого информационного множества, которое пересекается с первым, игрок тем самым не различает вершины, лежащие в объединении этих информационных множествах); в вершинах одного информационного множества — множества доступных игроку альтернатив должны совпадать (иначе игрок сможет различать вершины информационного множества, а стало быть, различать действия, предшествовавшие его ходу).

 

Рис 2 Рис.3.

Рис. 4. В концевых вершинах указаны выигрыши игроков.

 

Приведем элементарный пример. Рассмотрим следующую игру: первый игрок выбирает одну из трех цифр — 1, 2 или 3. Затем второй игрок, не зная выбора первого игрока, также выбирает одну из трех цифр — 1, 2, 3. Если сумма выбранных цифр четна, то первый игрок выигрывает у второго один рубль (доллар, фунт...). Если сумма — нечетная, то наоборот — выигрывает второй. Дерево соответствующей игры изображено на рис. 4.

На рис.5 изображена модификация этой игры, в которой второму игроку становится известно либо, что первый игрок выбрал цифру 2, либо, напротив, что цифру 2 он не выбрал.

Рис. 5.

 

Мы вернемся к позиционной форме в гл. 2 (поскольку в этой главе нас интересуют статические игры с полной информацией, для которых позиционная форма — это некоторое излишество), а теперь перейдем ко второй возможной форме представления игры — нормальной или стратегической форме, которая " суммирует" позиционную игру в трех элементах: множестве игроков I, множестве стратегий каждого игрока и функции выигрышей, ставящей в соответствие каждому набору стратегий игроков соответствующие выигрыши игроков.

1.2 Игры в нормальной форме

 

Итак, игра в нормальной (или стратегической) форме[6] — это тройка {I, S = Пi{Si}iÎ I u = (u1, …, un)}, где I = {1,..., n} — множество игроков, Si — множество стратегий (ходов)[7], доступных игроку i = 1,..., n,

ui: S = ПiÎ I Si ® R1 — функция выигрышей игрока i, ставящая в соответствие каждому набору стратегий s = (s1,..., sn), называемому также ситуацией, выигрыш этого игрока[8].

Стандартный пример здесь — дуополия по Бертрану и по Курно, когда стратегии

 

— это цены или объемы выпуска, соответственно, а выигрыши — это прибыль (см. п. 1.8-1.10).

Важным предположением, которое играет ключевую роль в теории, состоит в предположении, что все игроки рациональны, в том смысле, что каждый игрок рассматривает имеющиеся в его распоряжении альтернативы, формирует представления относительно неизвестных параметров, имеет четко определенные предпочтения и выбирает свои действия в результате некоторого процесса оптимизации (максимизации своей целевой функции). Более того, не менее существенным является факт общеизвестности (общего знания)[9] рациональности игроков, т. е. все игроки не только рациональны, но и знают, что другие игроки рациональны, что все игроки знают, что все игроки знают, что они рациональны и т. д. Формальное определение общеизвестности см. Aumann (1976).

Замечание 1.2.1. В последние годы появилось значительное число работ, посвященных исследованию моделей ограниченной рациональности. Основная мотивация этих работ — неудовлетворенность теорией, оперирующей с " совершенно рациональным человеком", поскольку мы является свидетелями весьма частого несоответствия реального поведения людей предположению " совершенной рациональности". Идея моделирования ограниченной рациональности восходит к работам Герберта Саймона (Simon (1955, 1956), см. также Simon (1972, 1976)). Обсуждение проблем, связанных с моделировнием ограниченной рациональности можно найти, например, в книге Rubinstein (1998). Различные взгляды на проблемы моделирования рациональных и ограниченных рациональных игроков изложены в работах Binmore (1987, 1988), Auman (1996).

Обратимся к тому случаю, когда I = {1, 2} и множества стратегий каждого из двух игроков — конечны. В этом случае игру можно " изобразить" с помощью матрицы (см. рис.6), где М = ï Siï — число возможных стратегий игрока 1, К =ï S2ï —число возможных стратегии игрока 2,

, , k = l,..., K, m = 1,..., M.

Эту же игру можно представить в виде двух матриц (поэтому такие игры называются часто биматричными), элементами которых являются элементы аmk и bmk, соответственно.

Для конечной антагонистической игры, т. е. игры двух лиц такой, что u1(s1, s2) = -u2(s1, s2) для всех siÎ Si, i = 1, 2, справедливо равенство аmk = -bmk, для всех m и k,

 

Рис. 6.

 

а поэтому такая игра может быть задана только одной матрицей (аmk) m=1,..., M, k=1,..., К и поэтому конечные антагонистические игры называются матричными (см. подробнее Дополнение (Раздел 1.13)).

Смешанная стратегия[10] si — это вероятностное распределение на множестве чистых стратегий Si. (Мотивацию введения смешанных стратегий мы оставляем на будущее). Рандомизация каждым игроком своих стратегий статистически независима от рандомизаций его оппонентов, а выигрыши, соответствующие профилю (набору) смешанных стратегий — это ожидаемое значение выигрышей соответствующих чистых стратегий (т.е. речь здесь идет об ожидаемой полезности). Одна из причин, по которой мы сосредотачиваемся на конечном случае — стремление избежать " осложнений", связанных с теорией меры.

Будем обозначать пространство смешанных стратегий i-ого игрока через Si, а si(s i) — вероятность того, что выбирается стратегия s;. Пространство наборов смешанных стратегии

элементы которого мы будем обозначать через s. Носитель смешанной стратегии si — это множество тех чистых стратегий, которым " приписана" положительная вероятность.

Определение 1.2.1. Если Si — конечное множество чистых стратегий игрока i, то смешанная стратегия si: Si ® [0, 1] ставит в соответствие каждой чистой стратегии siÎ Si вероятность si(si) ³ 0 того, что она будет играться, причем

(Обратим внимание на то, что индекс i означает здесь, что речь идет о стратегии игрока i. Поэтому, если мы будем говорить о разных стратегиях игрока i, то мы будем обозначать их si, s'i, s" i,...).

Нетрудно заметить, что множество смешанных стратегий игрока i — это (ki - 1)-мерный симплекс, где ki — число чистых стратегий i-го игрока.

Выигрыш игрока i, соответствующий профилю (набору) стратегий s, есть

(2.1)

(поскольку на наборах чистых стратегий значения этой функции совпадают со значениями исходной функции выигрышей ui, мы сохраняем то же обозначение).

Важно отметить, что выигрыш i-ого игрока есть линейная функция от вероятностей si, а также является полиномом от профиля, а потому непрерывен. Наконец, чистые стратегии являются вырожденными смешанными стратегиями, приписывающими вероятность 1 данной чистой стратегии и вероятность 0 — остальным.

Определение 1.2.2. Смешанным расширением игры Г = {I, S, u} называется игра

а, u(s), где sÎ S, определяется равенством (2.1).

Пример. Рассмотрим игру, изображенную на рис. 7.

L M R

Рис. 7.

Пусть s1 = (1/3, 1/3, 1/3) (это означает, что смешанная стратегия игрока 1 приписывает ему играть стратегии u, m и d с вероятностями 1/3), s2 = (0, 1/2, 1/2) (эта смешанная стратегия игрока 2 предписывает играть стратегии М и P с равными вероятностями и не играть стратегию L вовсе). В данном случае мы получаем

+ 1/3× (0× 2 +1/2*8 + ½ *3) + 1/3× (0*3 + ½ *9 +1/2*2) = 11/2,

 

u2(s) = 27/6.

1.3 Доминируемые стратегии

 

Посмотрим внимательно на приведенную выше игру (рис.7). Независимо от того, как играет игрок 1, R дает игроку 2 строго больший выигрыш нежели М. В этом смысле стратегия М строго доминируема, поэтому ясно, что рациональный игрок 2 не должен играть М. Далее, если игрок 1 знает (т.к. он сам рационален и знает, что другой рационален...), что 2 не будет играть М, то для него и будет лучше, чем га или d. Наконец, если игрок 2 знает, что игрок 1 знает, что игрок 2 не будет играть М, то игрок 2 знает, что 1 будет играть и, а тогда 2 должен играть L. Этот процесс — последовательное удаление строго доминируемых стратегий (мы дадим позднее строгое определение и соответствующий экономический пример). Вопрос, естественно возникающий здесь: " А не зависит ли множество стратегий, выдержи­вающих такое исключение доминируемых стратегий, от порядка исключения? " К счастью, нет, и дело здесь в том, что если стратегия si строго хуже чем s' для всех стратегий оппонента из множества D, то она хуже чем s' и для любого подмножества множества D.

Посмотрим теперь на следующую игру (см. рис. 8)

Рис. 8.

Здесь М не доминируется строго стратегией u, и М не доминируется строго стратегией D. Однако, если игрок 1 играет u с вероятностью 1/2 и D — с вероятностью 1/2, он обеспечивает себе выигрыш 1/2 независимо от того, как играет игрок 2. Следовательно, чистая стратегия может строго доминироваться смешанной стратегией, даже если она не доминируется строго никакой чистой стратегией.

Введем следующие обозначения: пусть iÎ I, тогда через s-i Î S-i будем обозначать набор стратегий игроков из I\{i}, (s'i, s-i) обозначает набор стратегий (s1, …, si-1, s'i, si+1, …, sn). Аналогично, для смешанных стратегий (s'i, s-i) — это (s1, …, si-1, s'i, si+1, …, sn). (Заметим, что в этих обозначениях s = (si, s-i)).

Определение 1.3.1 Чистая стратегия Si игрока i в игре Г строго доминируема (строго доминируется), если существует другая чистая стратегия s'i такая, что

(3.1)

для всех s-i Î S-i.

В этом случае говорят, что стратегия s'i доминирует стратегию si. Стратегия si. слабо доминируется, если существует такая s'i, что (3.1) выполняется как нестрогое неравенство, но хотя бы для одного набора s-i - неравенство строгое.

Аналогично определение и для смешанных стратегий:

Определение 1.3.2. Смешанная стратегия si строго доминируется в игре ; если существует другая стратегия s'i такая, что для всех s -iÎ S-i выполняется

Стратегия si называется строго доминирующей стратегией для игрока i в игре , если она строго доминирует любую другую стратегию из Si.

Заметим, что для того, чтобы проверить, что si строго доминируется стратегией s'i, нам нужно посмотреть на " поведение" этих двух стратегий против чистых стратегий оппонентов игрока i.

Формально:

тогда и только тогда, когда

Действительно: рассмотрим разность

Тогда если (В), то (А), т.к. все [ui(s'i, s-i) — ui(si, s-i)] > 0. (В) следует из (А), т.к. s-i — вырожденный случай s-i.

Задача. Докажите, что если чистая стратегия si является строго доминируемой, то таковой же является и любая стратегия, использующая si с положительной вероятностью.

Однако смешанная стратегия может быть строго доминируемой даже, если она использует с положительной вероятностью чистые стратегии, которые даже не слабо доминируемы. Действительно, рассмотрим следующую игру (рис.9).

Рис. 9.

 

Стратегия первого игрока (1/2, 1/2, 0) дает ожидаемый выигрыш вне зависимости от того, что играет игрок 2, а следовательно, строго доминируется стратегией D.

Естественно, что строго доминируемые стратегии надо удалять. Если игра разрешима в смысле последовательного удаления строго доминируемых стратегий, т. е. каждый игрок остается с единственной стратегией, как в нашем первом примере, то, получившаяся ситуация будет хорошим кандидатом для предсказания того, как будет проходить игра.

Вернемся к игре, изображенной на рис. 7. Нетрудно убедиться в том, что здесь в результате последовательного удаления строго доминируемых стратегий остается пара стратегий (u, L). На первом шаге удаляется стратегия М (она доминируется стратегией R). Затем удаляется стратегия m (доминируемая стратегией u).На третьем шаге удаляется стратегия d (доминируется стратегией u). Наконец, на последнем шаге удаляется R.

Но, даже если такие ситуации представляют собой хорошие кандидатуры, все не обязательно произойдет в соответствии с их " предписанием", особенно если выигрыши могут принимать " экстремальные" значения.

Рассмотрим, например, следующую игру (рис. 10).

Рис. 10.

 

Очевидно, что здесь стратегия L доминируется стратегией R, а потому ситуация (D, R) является хорошим кандидатом. Но... Проигрыш игрока 1 в ситуации (_D, L) слишком велик, поэтому вполне можно допустить, что игрок 1 может не рискнуть сыграть стратегию d (допуская, например, возможность случайной ошибки игрока 2).

Все, конечно, изменится, если игроки могут договориться до того, как принять решение. В этом случае, конечно, все уже будет зависеть от " силы" договоренности.

1.4. Последовательное удаление слабо доминируемых стратегий

 

Рассмотрим следующую известную игру " Море Бисмарка". Предыстория события такова: 1943г. Адмирал Imamura получил приказ доставить подкрепление по морю Бисмарка на Новую Гвинею. В свою очередь адмирал Кеnnеу должен был воспрепятствовать этому. Imamura должен был выбрать между Северным (более коротким) и Южным маршрутами, а Кеnnеу — решить куда посылать самолеты, чтобы разбомбить конвой. Причем в течение одного дня самолеты могут бомбить лишь на одном из двух направлений — либо на Северном, либо на Южном маршрутах (но не на двух). Поэтому, если Кеnnеу посылает самолеты в сторону неправильного маршрута, то они могут вернуться, но число дней, когда возможна бомбежка, уменьшается. Описываемая ситуация моделируется следующей игрой. Считаем, что Северный маршрут займет 2 дня, а Южный — 3. (См. рис. 11).

Рис. 11.

 

Вообще говоря — это матричная игра, т. е. антагонистическая игра с конечным множеством стратегий у каждого игрока. Ни один игрок не имеет доминирующей стратегии. Но здесь можно говорить о слабом доминировании: для Imamur'ы стратегия Юг слабо доминируема, так как для любой стратегии Кеппеу проигрыш Imamur'ы (число дней, когда конвой будет подвергаться бомбордировкам) не меньше для Ю, чем для С, но для стратегии Кеnnеу Ю — проигрыш при С строго меньше, чем при Ю.

Последовательное (итерированное) удаление слабо доминируемых стратегий проходит следующим образом: исключается одна из слабо доминируемых стратегий одного из игроков, затем из оставшихся стратегий исключается одна из слабо доминируемых стартегий и т. д.

Представим себе, что Кеnnеу понимает это и считает, что Imamura выберет Север. В этой новой ситуации Кеnnеу имеет уже доминирующую стратегию — Север. Это и дает нам равновесие при последовательном удалении доминируемых стратегий. (В действительности, так и случилось: 2-5марта 1943 г. ВВС США и Австралии атаковали японский конвой, который шел по Северному пути и потопили все транспортные корабли и 4 эсминца: из 7000 чел. до Новой Гвинеи добрались 1000.)

Процедура последовательного удаления слабо доминируемых стратегий аналогична удалению строго доминируемых стратегий. Однако здесь есть одно весьма значительное отличие. А именно, множество стратегий, которые выдерживают последовательное удаление слабо доминируемых стратегий (то есть остаются) может зависеть от порядка удаления стратегий.

Действительно, рассмотрим следующую игру (рис. 12).

Рис. 12.

 

Если вначале удаляется u (слабо доминируется М), а затем L (слабо доминируется R), то мы приходим к исходу (2, 1) (второй игрок выбирает R). Если же вначале удаляется D (слабо доминируется М), а затем R (слабо доминируется L), то мы приходим к исходу (1, 1).

 

Рассмотрим несколько примеров. Мы начнем со знаменитой Дилеммы Заключенного — в некотором смысле чрезвычайно простой игры, которая в разных формулировках встречается в большинстве учебников по теории игр, которая приводится едва ли не в самом начале каждого курса и которую многие сразу же вспоминают, когда слышат словосочетание " теория игр".

Дилемма Заключенного. Ставший почти хрестоматийным сюжет этой стилизованной истории таков. Двое подозреваемых в совершении тяжкого преступления арестованы и помещены в одиночные камеры, причем они не имеют возможности передавать друг другу какие-либо сообщения. Их допрашивают поодиночке. Если оба признаются в совершении преступления, то им грозит, с учетом их признания, тюремное заключение сроком по 6 лет каждому. Если оба будут молчать, то они будут наказаны за совершение какого-то незначительного преступления и получат в этом случае по 1 году тюремного заключения. Если же один из них сознается, а другой — нет, то первый, за содействие следствию, будет вовсе освобожден от наказания, тогда как второй будет приговорен к максимально возможному за данное преступление наказанию — 10-летнему тюремному заключению.

Описанная история может быть представлена следующей игрой (рис. 13).

Рис. 13.

 

Здесь нетрудно убедиться в том, что стратегия " молчать" является строго доминируемой для каждого игрока (еще раз напомним, что они рациональны), поэтому каждый игрок выберет стратегию " сознаться". В результате оба заключенных получат по 6 лет тюремного заключения.

Как мы увидим ниже ситуация (" сознаться", " сознаться"), естественно, является ситуацией равновесия по Нэшу. При этом мы сразу же сталкиваемся с бросающейся в глаза проблемой: получающийся исход очень плохой — он дает максимальный суммарный срок заключения (разумеется, мы подчеркиваем это еще раз, не следует забывать предположение о рациональности игроков, поскольку здесь исключаются из рассмотрения проблемы предательства, и т. д.). Это послужило толчком к многочисленным исследованиям этой игры, поскольку, например, естественным желанием было бы получить в качестве исхода этой игры (или ее модификаций) ситуацию (" молчать", " молчать"), дающую каждому заключенному лишь по одному году заключения.

Следующая игра имеет уже ярко выраженный экономико-политический подтекст, хотя разделяет с дилеммой заключенного упомянутую выше специфику, поэтому мы позволим себе сохранить то же название:

" Дилемма заключенного - 2 ". Рассмотрим две страны добывающие нефть, которые мы назовем, скажем, А и В. Эти две страны могут кооперироваться, договариваясь об объемах ежедневной добычи нефти, ограничиваясь, к примеру, добычей 2 млн. баррелей нефти в день для каждой страны. С другой стороны, страны могут действовать некооперативно, добывая, скажем, по 4 млн. баррелей в день. Такая ситуация может быть представлена следующей игрой, в которой указаны прибыли стран, в зависимости от их объемов добычи нефти (рис. 14).

Рис. 14.

 

Эта картина достаточно типична для картеля, когда у каждого из членов картеля есть стимул отклониться от договора, чтобы за счет увеличения объемов продаж получить дополнительную прибыль.

Легко видеть, что и здесь у каждого из игроков есть доминирующая стратегия — " не кооперироваться". В результате страны получают прибыль 32 и 24 (млн. долларов в день), что гораздо меньше, нежели в ситуации кооперативного поведения.

Феномен, с которым мы столкнулись в этом примере, аналогичен дилемме заключенного, и именно поэтому второй пример мы также назвали " дилеммой заключенного ": оба игрока играют свои доминирующие стратегии, максимизируя тем самым свои выигрыши, но в то же время исход для каждого из них хуже, нежели в ситуации, когда оба следуют доминируемым стратегиям.

Можно ли достичь " кооперативного поведения" в дилемме заключенного? Как мы увидим в следующей главе — да.

Здесь мы ограничимся лишь еще одним примером на эту же тему.

 

" Дилемма заключенного - 3". Предположим, что есть 2 работника, которые могут " работать" (si = 1) и " увиливать" (si = 0) (si — уровень усилий, которые прикладывает работник i). Суммарный выпуск " команды" 4(s1+s2) делится поровну между работниками. Каждый работник несет издержки равные 3, если работает, и равные 0, если увиливает. Соответствующая матрица изображена на рис. 15.

Рис. 15.

" Работать" — строго доминируемая стратегия для каждого работника.

Аукцион второй цены. У продавца есть одна единица неделимого товара. Есть п потенциальных покупателей, которые оценивают товар, соответственно, в 0 < v1 < … < vn и эти оценки являются " общеизвестными". Покупатели одновременно делают свои заявки (назначают цену) siÎ [0, +¥). Назначивший максимальную заявку получает товар и платит вторую цену, т. е. если игрок i выигрывает (si > ), то его полезность есть u i = vi, а остальные ничего не получают и ничего не платят (т. е. u j = 0). Если несколько покупателей назначают высшую цену, то товар распределяется случайным образом (например, равновероятно).

Легко убедиться в том, что стратегия назначения своей оценки (si = v i) слабо доминирует все остальные. Действительно, пусть ri = . Пусть si > vi. Тогда, если ri ³ si, то r -ый участник получает 0, что он получил бы и при si = vi. Если ri £ vi, то он получает vi - r i, что он опять же получает, назначив vi. Если теперь vi < r i < s i, то его полезность vi - r i < 0, а если бы он назвал vi, то он бы получил 0. Аналогично и для si < vi: если ri£ si или ri ³ vi, то он получает ту же полезность, назвав viвместо si. Если же si < r

<== предыдущая лекция | следующая лекция ==>
 | 
Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.06 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал