Имя материала: Институциональная экономика

Автор: Антон Николаевич Олейник

Лекция № 6 повторяющиеся игры

 

6.1. Смешанные стратегии

Обратимся к более подробному анализу повторяющихся игр. Когда игроки попадают в определенную ситуацию выбора неоднократно, то их взаимодействие существенным образом усложняется. Они могут позволить себе комбинировать стратегии, максимизируя общий выигрыш. Покажем это с помощью модели, описывающей отношения между Центральным банком (ЦБ) и экономическим агентом в связи с проводимой ЦБ кредитно-денежной политикой. К слову, эта ситуация интересна еще и в качестве примера использования теории игр для анализа конкретных экономических проблем. Итак, ЦБ ориентируется либо на жесткую кредитно-денежную политику, стремясь поддержать инфляцию на фиксированном уровне (7i0), либо на эмиссию и, следовательно, повышение темпов инфляции (п{). В свою очередь, экономический агент действует на основе своих инфляционных ожиданий ле (устанавливает цены на свою продукцию, решает вопросы о приобретении товаров и услуг и т.д.), которые могут либо подтверждаться, либо не подтверждаться в результате проводимой ЦБ политики. В случае если п{ > яе, ЦБ получает прибыль от сеньоража и от инфляционного налога. Если 7ie= 7ij, то в проигрыше оказывается и ЦБ из-за сокращения поступлений от сеньоража, и экономические агенты, которые продолжают нести тяжесть инфляционного налога6. Если яе = 7i0, то сохраняется статус-кво и в проигрыше никто не оказывается. Наконец, если яе > я0, то проигрывают только экономические агенты: производители — из-за потери спроса на необоснованно подорожавшую продукцию, потребители — из-за создания неоправданных запасов.

Предложенная модель практически идентична по своей структуре базовой модели VIII: при однократном взаимодействии у агентов нет доминирующих стратегий, отсутствует и равновесие по Нэшу. При повторяющемся многократно взаимодействии, а именно такое взаимодействие и характерно для реальных ситуаций, оба участника могут использовать и ту, и другую имеющуюся у них в распоряжении стратегии. Позволяет ли игрокам чередование стратегий в определенной последовательности максимизировать свою полезность, т. е. достичь равновесия по Нэшу в смешанных стратегиях1: исхода, при котором ни один участник не может увеличить свой выигрыш, изменяя в одностороннем порядке свою стратегию? Предположим, что ЦБ проводит жесткую кредитно-денежную политику с вероятностью Рх (в Рх \% случаев), а с вероятностью (1 — Рх) — инфляционную политику. Тогда при выборе экономическим агентом неинфляционных ожиданий (7ie = 7i0) ЦБ может рассчитывать на получение выигрыша, равного EU(ЦБ) = = Рх 0 +, 1 (1 — Рх) = 1 — Рх. В случае инфляционных ожиданий у экономического агента выигрыш ЦБ составит EU(ЦБ) = Рх0 + + (1 — Рх)(—2) = 2РХ - 2. Теперь допустим, что экономический агент имеет неифляционные ожидания с вероятностью Р2 (в Р2 \% случаев), а инфляционные ожидания — с вероятностью (1 — Р2). Отсюда ожидаемая полезность ЦБ в итоге составит Еи(ЦБ) = Р2( - Рх) + (1 - Р2)(2РХ - 2) = ЗР2- ЪРХ Рг+2РХ - 2. Аналогичные расчеты для экономического агента дадут £1/(э.а.) = Р{(Р2 - 1) + (1 - РХ)(-Р2-2) = 2РХ Р2 + Рх- Р2- 2. Если мы перепишем данные выражения в следующей форме EU(UB) = Рх(2-ЪР2) + ЪР2-2 и EU(э.а.) = Р2(2РХ - 1) + Я, - 2, то нетрудно заметить, что при Р2 — 2/3 выигрыш ЦБ не зависит от его собственной политики, а при Рх — 1/2 выигрыш экономического агента не зависит от его ожиданий.

Иными словами, равновесием по Нэшу в смешанных стратегиях будет формирование экономическим агентом в 2/з случаев неинфляционных ожиданий и проведение ЦБ в половине случаев жесткой • кредитно-денежной политики. Найденное равновесие достижимо при условии, что экономические агенты формируют ожидания рациональным образом, а не на основе инфляционных ожиданий в предыдущий период, скорректированных на ошибку прогноза предыдущего периода8. Следовательно, изменения в политике ЦБ влияют на поведение экономических агентов только в той степени, в которой они неожиданны и непредсказуемы. Стратегия ЦБ в 50\% случаев проводить жесткую кредитно-денежную политику, а в 50\% — мягкую как нельзя лучше соответствует созданию атмосферы непредсказуемости. Интересно, что и России 90-х годов господствовал адаптивный тип инфляционных ожиданий9, не обеспечивающий минимизацию проигрыша для экономических агентов при данных заложенных в модель условиях.

 

6.2. Эволюционно-стабильная стратегия

Разновидностью повторяющихся игр являются ситуации, когда индивид многократно попадает в определенную ситуацию выбора, но его контрагент не постоянен, а в каждом периоде индивид взаимодействует с новым визави. Поэтому вероятность выбора контрагентом той или иной стратегии будет зависеть не столько от конфигурации смешанной стратегии, сколько от предпочтений каждого из контрагентов. В частности, предполагается, что из общего числа N потенциальных контрагентов п (n/N\%) всегда выбирают стратегию А, а т (m/N\%) — стратегию Б. Тем самым создаются предпосылки для достижения нового типа равновесия, эвол/оционно-стабильных стратегий. Эволюционно-стабиль-ной (ESS — Evolutionarily Stable Strategy) становится та стратегия, при которой если все члены определенной популяции используют ее, то никакая альтернативная стратегия не может ее вытеснить посредством механизма естественного отбора ,0. Рассмотрим в качестве примера простейший вариант проблемы координации: разъезд на узкой дороге двух автомобилей (ситуация близка по некоторым параметрам и к модели I, и к модели IV). Предполагается, что в данной местности лево- и правосторонний стандарты движения равноправны (или же Правила дорожного движения просто не всегда выполняются)11. Автомобилю А движутся навстречу несколько автомобилей, с которыми ему нужно разъехаться. Если оба автомобиля принимают влево, въезжая на левую обочину по ходу движения, то они разъезжаются без проблем. То же самое происходит, если оба автомобиля принимают вправо. Когда же один автомобиль принимает вправо, а второй — влево и наоборот, то разъехаться они не смогут:

Итак, автомобилисту А известен приблизительный процент автомобилистов Б, систематически принимающих влево (Р), и процент автомобилистов Б, принимающих вправо (1 - Р). Условие для того, чтобы стратегия «принять вправо» стала для автомобилиста А эволюционно-стабильной, формулируется следующим образом: (вправо) > EU(влево), или 0Р+ 1(1 - Р) > 1Р+ 0(1 - Р), откуда Р< 1/2. Таким образом, при превышении доли автомобилистов во встречном потоке, принимающих вправо, уровня 50\% эволюционно-стабильной стратегией становится «принять вправо» — сворачивать на правую обочину при каждом разъезде.

 

- Эволюционно-стабильная стратегия — такая стратегия, что если ее использует^ббльшинство индивидов, то никакая альтернативная стратегия не может ее вытеснить посредством механизма естественного отбора, даже если последняя более эффективна по Парето,

 

В общем виде требования к эволюционно-стабильной стратегии записываются следующим образом12. Стратегия I, используемая контрагентами с вероятностью /?, является'эволюционно-стабильной для игрока тогда и только тогда, когда выполняются следующие условия: EU(l, р) > EU(J, /?), что тождественно />{/(!, I) + (1 — p)U(f, J) > pU(J, I) + (1 - p)U(J, У). Из чего следует:

U(I, I) > U(J, I) или

£/(/, /) = U(У, /) и [/(/, У) > U(J, У),

где — £/(/,/) выигрыш игрока при выборе стратегии /, если контрагент выбирает стратегию /; (/(У, /) — выигрыш игрока при выборе стратегии У, если контрагент выбирает стратегию /, и т. д.

Можно представить эти условия и в графической форме. Отложим по вертикальной оси ожидаемую полезность выбора той или иной стратегии, а по горизонтальной — долю индивидов в общей популяции игроков, выбирающих обе стратегии. Тогда мы получим следующий график (значения взяты из модели разъезда двух автомобилей), изображенный на рис. 6.1.

Из рисунка следует, что и «принять влево», и «принять вправо» имеют равные шансы на то, чтобы стать эволюционно-стабильной стратегией до тех пор, пока ни одна из них не охватила больше половины «популяции» водителей. Если же стратегия перешагивает этот рубеж, то ойа постепенно, но неизбежно вытеснит другую стратегию и охватит всю популяцию водителей. Дело в том, что,

если стратегия перешагивает рубеж 50\%, для любого водителя становится выгодным использовать ее в маневрах, что, в свою очередь, еще больше увеличивает привлекательность данной стратегии для остальных водителей. В строгой форме данное утверждение будет выглядеть следующим образом: dp/dt = G [EU(/,/?) — EU(У, р)], 00.

Главным результатом анализа повторяющихся игр является увеличение числа точек равновесия и решение на этой основе проблем координации, кооперации, совместимости и справедливости. Даже в дилемме заключенных, как мы уже упоминали в предыдущей лекции, переход к повторяющемуся взаимодействию позволяет достичь оптимального по Парето результата («отрицать вину»), не выходя за рамки нормы рациональности и запрета на обмен информацией между игроками. Именно в этом смысл «всеобщей теоремы» (folk theorem): любой исход, устраивающий индивида индивидуально, может стать при переходе к структуре повторяющейся игры равновесным І3. В ситуации дилеммы заключенных равновесным исходом при определенных условиях может стать и простая стратегия «не признавать», и множество смешанных стратегий. В числе смешанных и эволюционных стратегий, помимо Tit for Tat («зуб за зуб»), отметим следующие: Tit-For-Two-Tats — начинать с отрицания вины и признавать вину, только если в два предшествующих периода кряду контрагент признавал вину; DOWING — стратегия, исходящая из предположения о равновероятном использовании контрагентом стратегий «отрицать вину» и «признавать» в самом начале игры. Далее каждое отрицание вины со стороны контрагента поощряется, а каждое признание — наказывается выбором стратегии «признавать вину» в следующий период; TESTER — начинать с признания вины, и если контрагент тоже признает вину, то в следующем периоде отрицать вину (т. е. извиниться) и далее использовать стратегию «зуб за зуб» — Tit for Tat14.

Выводы. Подведем общие итоги обзора теории игр и вариантов ее использования в институциональном анализе. Главный аргумент в пользу того, чтобы строить модели институтов с помощью теории игр, заключается в интересе теории игр к ситуациям взаимозависимости действий индивидов, проблемам координации и согласования действий. Ведь именно институты призваны .решить эти проблемы. С позиции теории игр функцию института можно определить как создание предпосылок (структурных, когнитивных, организационных) для фиксации одного из исходов игры в качестве равновесного. Эта задача особенно актуальна, если равновесие по Нэшу отсутствует или оно не единственно. Достижение равновесия с помощью институтов подразумевает15:

увеличение числа точек равновесия через формирование смешанных и эволюционных стратегий; формирование репутации игроков, в которой фиксируется вся информация о его поведении в прошлом; задание «удовлетворительных» критериев выбора альтернатив 16;

выбор единственного равновесия из нескольких равновесных исходов с помощью соглашений и «фокальных точек»; задание критериев выбора альтернатив на основе ценностей; изменение структуры предпочтений индивида.

 

□  Учебно-методические материалы к теме 3

 

Практическое занятие

Основная форма работы в ходе практического занятия заключается в моделировании реальной экономической или просто часто встречающейся в повседневной жизни ситуации. При этом мы проходим все этапы разработки институциональной модели.

Обсуждение реальной ситуации и определение проблемы для анализа.

Разработка модели, обоснование величины выигрышей, соответствующих каждому из исходов игры.

Анализ модели: поиск всех видов равновесных исходов.

4.         Поиск и обсуждение институциональных решений выявлен-

ных проблем.

5.         Корректировка модели с учетом институциональных решений.

Рассмотрим в качестве примера взаимодействие между преподавателем и студентом по поводу текущего контроля работы студента. Хотя данная ситуация не имеет экономического содержания, к ней достаточно близка по структуре модель «менеджер — наемный работник», которая будет подробнее рассмотрена при обсуждении внутренней структуры фирмы. Итак, анализируемая проблема заключается в неочевидном характере стимулов для студента систематически готовиться к семинарам (читать рекомендуемую литературу, выполнять практические задания и т.д.). Следовательно, две стратегии студента, принимаемые здесь во внимание, — «добросовестно готовиться к занятиям» и «недобросовестно готовиться к занятиям». Со своей стороны преподаватель может либо контролировать работу студента (проводя опросы, тесты, контрольные работы), либо отказаться от контроля, который к тому же связан для него с издержками времени и усилий. Предположим, издержки на подготовку к семинару для студента равны 1 и издержки осуществления контроля для преподавателя тоже равны 1. Преподаватель получает максимальную полезность, равную 2, если студент готовится. Студент получает максимальную полезность, если спокойный ход его жизни не нарушается ни подготовкой, ни проверками знаний. Учитывая, что сессия еще далеко, санкции преподавателя за выявленную неготовность студента к занятию минимальны.

Формальный анализ сконструированной подобным образом модели дает следующие результаты: доминирующие стратегии у обоих игроков отсутствуют, равновесие по Нэшу отсутствует. Равновесием по Штакельбергу, когда первым принимает решение студент, является исход (1, 2), а когда преподаватель — исход (1, 1). Исход (1, 2) одновременно является и равновесием по Парето. Существует в данной модели и равновесие по Нэшу в смешанных стратегиях. Чтобы найти его, предположим, что преподаватель иногда контролирует студентов (с вероятностью Р2), а иногда — нет. В свою очередь студент тоже готовится не всегда, а только в Рх \% случаев. Тогда ожидаемая полезность студента от подготовки составит EU(готовиться) = Р2 + (1 — Р2) — 1, а ожидаемая полезность студента в противном случае EU(wt готовиться) = 2 — 2Р2. В целом ожидаемая полезность студента от игры составит EU(студент) = />,+ (! - Р{)(2 - 2Р2) = Р{ (2Р2 - 1) + 2 - 2/>2, т. е. при Р2 = 1/2 студент не может в одностороннем порядке увеличить свою полезность. Аналогичные расчеты для преподавателя дадут Рх = 1/2. Иными словами, равновесие по Нэшу в смешанных стратегиях достижимо, если студент готовится через раз, а преподаватель не проверяет с периодичностью через раз.

Симметричным образом можно изменить и систему стимулов для преподавателя.

Отсутствие «чистого» равновесия по Нэшу свидетельствует о наличии в данной модели проблемы совместимости, т. е. прямой противоположности интересов преподавателя и студента. Следовательно, институциональные решения должны в первую очередь касаться решения проблемы совместимости. Первое решение заключается в обязательности осуществления контроля для преподавателя. Например, кафедра или руководство факультета принимает соответствующее решение. Второе решение связано с возникновением репутации преподавателя и студента. Так, о строгости и требовательности преподавателя в студенческой среде из «поколения в поколение» могут передаваться легенды, позволяющие ему добиться добросовестного отношения студентов, даже не прибегая часто к контролю. Наконец, можно попытаться изменить институциональные рамки обучения в целом, реформировав систему образования и создав стимулы для студентов к получению знаний (через платность образования и льготы по оплате для успевающих, например, на хорошо и отлично). В этом случае изменятся полезности студента и появится равновесие по Нэшу:

Вопросы для повторения

1.         Почему институциональная теория «говорит» на языке

теории игр, а не традиционного для неоклассики математического

аппарата?

Какие основные проблемы взаимодействия индивидов моделируются с помощью теории игр?

Какие новые типы равновесных исходов возникают в динамическом аспекте? Что лежите основе их возникновения?

Какую форму принимают институциональные рамки в моделях теории игр? Приведите пример рассмотрения института с помощью аппарата теории игр.

Какие нормы, образующие конституцию рынка, описывает поведение игроков (на примере одной из базовых моделей теории игр)? Сводится ли поведение игроков к одной-единственной норме рациональности?

Какая из базовых моделей теории игр наилучшим образом иллюстрирует идею «фокальной точки»?

 

Основная литература

Гальперин В., Игнатьев С, Моргунов В, Микроэконо-мика-2. СПб.: Экономическая школа, 1998. Т. 2. Приложение 1а. Оуэн Г. Теория игр. М., 1971.

Schotter A. Microeconomics. A Modern Approach. N.Y.: Harper Collins, 1994. Ch. 7. P. 204-247.

 

Дополнительная литература

Льюис P., Райфа X. Игры и решения. М.: Изд-во иностранной литературы, 1951.

Guerrien В. La theorie des jeux. Paris: Economica, 1995.

Kreps D. Game Theory and Economic Modelling. Oxford: Oxford University Press, 1990.

 

Примеры решения задач

1. Всегда ли существует равновесие по Штакельбергу? Да. Нет.

Ответ. Да. В отличие от равновесия по Нэшу, которое может не существовать, равновесие по Штакельбергу существует в любой игре. Его существование обусловлено временным лагом в принятии игроками решений.

Предположим, в игре существует два равновесных по Нэшу исхода. О какой проблеме идет речь?

 

Совместимости. Б. Координации.

Справедливости. Г. Кооперации.

Ответ. Б. Речь идет о проблеме координации.

Возможна ли ситуация, в которой игроки имеют доминирующие стратегии и, следовательно, существует равновесие доминирующих стратегий, а равновесие по Нэшу отсутствует?

Да. Нет.

Ответ. Нет. Такая ситуация исключена. Доминирующая стратегия означает достижение игроком максимального выигрыша вне зависимости от действий другого. Равновесие по Нэшу предполагает, что игроки не могут увеличить свою полезность в одностороннем порядке. Следовательно, находясь в точке равновесия доминирующих стратегий, игроки не смогут изменить свою стратегию таким образом, чтобы увеличить выигрыш.

Без следования какой норме не может обойтись игрок при достижении равновесного по Штакельбергу исхода?

 

Норме доверия. Б. Норме эмпатии.

Норме утилитаризма.

Ответ. Б. Если игрок не способен поставить себя на место партнера, то ему не удастся предугадать реакцию последнего на выбор той или иной стратегии.

Найти все типы равновесных исходов и указать проблему, иллюстрируемую следующей моделью:

Игрок 2

 

 

Стратегия А

Стратегия Б

Стратегия А

2, 3 St{i Р]

-* -

•-   1, 2[Я2] і

 

Стратегия Б

3, -I

 

0, 0

 

Ответ. Равновесия доминирующих стратегий нет, равновесия по Нэшу нет, равновесие по Штакельбергу для первого игрока (2, 3), для второго игрока — (1,2). Равновесие по Парето — исход (2, 3). Модель иллюстрирует проблему совместимости, так как в ней отсутствует равновесие по Нэшу.

6. Найти такое значение X, чтобы в данной модели:

А. Равновесие по Нэшу было единственным.

Б. Существовало два равновесных по Нэшу исхода.

Ответ. А. Учитывая заданные направления двух стрелок, единственным равновесием по Нэшу может быть исход (3, 3). Для этого требуется, чтобы выполнялось неравенство X < 3.

Б — исходя из направления двух стрелок, двумя равновесными исходами могут быть (2, X) и (X, 2). Для этого требуется, чтобы выполнялось неравенство X > 3.

7. Найти такое соотношение X и К, чтобы в данной модели существовало лишь одно равновесие по Нэшу (X > О, К> 0):

 

Игрок

 

Ответ. Единственным равновесием по Нэшу может быть либо исход {Х- К/2, Х~ К/2), либо исход (0, 0). Чтобы исход (0, 0) был единственным равновесием по Нэшу, должны выполняться следующие неравенства:

 

Х- Y/KX,

Х- К<0            Х< К

Чтобы исход (X— К/2, X — К/2) был единственным равновесием по Нэшу, должны выполняться следующие неравенства:

Х- У/2>Х,

Х- К> 0 {0}

Сноски к теме 3

1          Kreps D. Game Theory and Economic Modelling. Oxford: Oxford University Press, 1990. P. 10-26.

2          Эта ситуация, иногда ее называют игрой Штакельберга, очень подробно рассматривается в теории игр: Guerrien В. La theorie desjeux. Paris: Economica, 1995. P. 11-16; Kreps D. Op. cit. P. 45-48.

3          Walliser B. A Simplified Taxonomy of 2x2 Games//Theory and Decision. 1989. Vol. 25. № 2.

4          См. лекцию № 1.

5          SchotterA. The Economic Theory of Social Institutions. Cambridge: Cambridge University Press, 1981. P. 22-24; Walliser B. Theorie des jeux et genese des institutions//Recherches Economiques de Louvain. 1989. Vol. 55. № 4. P. 344-345.

6          Havrylyshyn O., Miller M., Perraudin W. Deficits, Inflation and the Political Economy of Ukraine//Economic Policy. 1994. Vol. 19. P. 360-362.

7          Guerrien B. Op. cit. P 44-46.

8Дорнбуш P., Фишер С. Макроэкономика. M.: Изд-во МГУ, 1997. С. 245— 252; Havrylyshyn О., Miller М., Perraudin W. Op. cit. P. 366.

^Воронцова О., Яковлев А. Обобщающий анализ ценовой политики и инфляционных ожиданий на микроуровне. М.: Высшая школа экономики, 1995.

10        Maynard J. Smith. Evolution and the Theory of Games. Cambridge: Cambridge

University Press, 1982. P. 10. Обилие биологических терминов в определении

(популяция, естественный отбор) объясняется тем, что эволюционный под-

ход в теории игр поначалу был предложен для моделирования биологической

эволюции.

11        При всем умозрительном характере данного допущения оно вполне

реально. Например, в Австрии 30-х годов каждая из земель имела свой стан-

дарт движения и на границах земель нередки были встречи двух стандартов

движения (Konrad К., Thum М. Fundamental Standards and Time Consistency//

Kyklos. 1993. Vol. 46. Fasc. 4. P. 550—552). Отдельного разговора требуют

ситуации, когда ПДД являются лишь одним из факторов организации дорож-

ного движения, ыаряду с маркой и мощностью машины, профессией находя-

щегося за рулем и т. д.

12        BoyerR., Orlean A. How Do Conventions Evolve?//Evolutionary Economics.

1992. № 2. P. 167-169.

13        Guerrien B. Op. cit. P. 65.

l4Axelrod R. The Evolution of Co-operation. London: Penguin Books, 1990. P. 34, 39-46.

15 Walliser B. Theorie des jeux et genese des institutions//Recherches Economiques de Louvain. 1989. Vol. 54. № 4. P. 349-355.

16См. лекцию № 2 о содержании понятия неполной рациональности и замену принципа оптимизации принципом удовлетворительности.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 |