Имя материала: Микроэкономика Том 2

Автор: В.М. Гальперин

Приложение на

 

Стратегическое поведение и теория игр

В последние два-три десятилетия теория игр стала использоваться как эффективный инструмент анализа взаимодействия небольшого числа субъектов, называемых участниками игры или просто игроками. В роли последних могут выступать предприятия (в теории организации промышленности), наниматели или работники (в экономике труда), отдельные страны (в мировой экономике). Широкое применение теория игр получила не только в экономике, но и в ряде других общественных наук (политологии, психологии), а также в эволюционной биологии. Цель настоящего Приложения в том, чтобы, оставаясь в рамках микроэкономической теории и не нарушая логики курса, дать начальные представления об основах теории игр и возможностях ее применения при изучении поведения предприятий-олигополистов в последующих курсах организации (экономики) промышленности, экономики труда, а также продвинутых курсах микроэкономики, подобных курсу Д. Крепса.1

Модели кооперированной или некооперированной олигополии могут быть представлены как игры стратегий или действий, таких, например, как установление цен, размеров выпуска, определение расходов на рекламу или на продвижение товаров на рынок, и т. п. Оли-гополистические игры предполагают наличие двух (в случае дуополии) или большего числа предприятий, рассматриваемых как игроки, стремление каждого из них к максимизации прибыли или (шире) выигрыша (англ. payoff) и осознание каждым игроком зависимости его выигрыша от поведения других игроков. Именно осознание этой взаимозависимости отличает олигополию от рынков совершенной конкуренции и монополии, делает возможным рассматривать поведение олигополистов как игру стратегий.2

1          Kreps D. A Course in Microeconomic Theory. New York et al., 1990.

2          Использование теории игр для анализа олигополии фактически стало следствием выявления М. Шубиком связи между моделями Эджуорта и теорией некооперативных игр (Shublk М. Edgeworth Market Games // Contribution to the Theory of Games. Vol. 4. Annals of Mathematical Studies. N 40. Ed. by Luce R., Tucker A., Princeton Univ. Press. 1959. P. 267-278.

3          Neuman J. von, Morgemtern O. Theory of Games and Economic Behaviour. Princeton Univ. Press, 1944 (русский перевод: Нейман Дж. фон, МоргенштернО. Теория игр и экономическое поведение. М., 1970).

Джон (Янош) фон Нейман (1903-1957) — математик. Окончил университет в Будапеште (1926), преподавал в университетах Берлина (с 1927 г.) и Гам-

После публикации в 1944 г. фундаментального труда Дж. фон Неймана и О. Моргенштерна8 стало традиционным различение теории кооперативных и теории некооперативных игр. Первая исследует поведение групп игроков, максимизирующих общий выигрыш группы, который затем распределяется между ее участниками. Вторая исследует поведение отдельных участников игры, не связанных какими-либо соглашениями и максимизирующими свои индивидуальные выигрыши. Вплоть до начала 70-х гг. ведущее положение в теоретико-игровых исследованиях занимала теория кооперативных игр, впоследствии же ведущее положение перешло к теории некооперативных игр.

И кооперативные, и некооперативные игры могут быть представлены в двух формах: экстенсивной (или расширенной) и стратегической (или нормальной). Экстенсивной формой представления игры называют наиболее полное, подробное ее описание. При этом детально описываются все стадии (этапы) взаимодействия, информация, которой на каждой стадии игры располагают ее участники, мотивация их действий. Стратегическая форма представления игры имеет более общий характер. Многие детали, присутствующие в экстенсивной форме представления, здесь опускаются. Внимание концентрируется на стратегическом аспекте игры, тогда как ее временная структура исчезает.

бурга (с 1929 г.), в 1930-1933 гг. читал лекции в Принстонском университете. В 1933-1954 гг. профессор Института перспективных исследований в Принстоне, с 1954 г. член комиссии по атомной энергии, член Национальной академии наук США с 1937 г. В годы войны был консультантом ряда военных проектов, в том числе по созданию первой атомной бомбы. Разработал модель расширяю щейся экономики. Оказал большое внияние на развитие линейного программирования.

Оскар Моргенштерн (1902-1977) — экономист. Окончил Венский университет (1925). В 1929-1938 гг. преподавал экономическую теорию и статистику в Венском университете, в 1931-1938 гг. директор Австрийского института по изучению экономических циклов, в 1938-1970 гг. руководил программой экономических исследований и вел преподавательскую деятельность в Принстоне. С 1970 г. почетный профессор Нью-Йорского университета.

В зависимости от их продолжительности игры делятся на однопе-риодные (англ. single-period, single-stage) и многопериодные (англ. multi-period, multi-stage). Классические модели дуополии с этой точки зрения могут рассматриваться как примеры однопериодных, или статичных, игр, в которых игроки сталкиваются лишь однократно. В таких играх долгосрочные аспекты взаимодействия (рекламирование, продвижение товара на рынок, репутация фирмы) не учитываются. Напротив, в многопериодных, или динамических, играх разные аспекты долгосрочной стратегии приобретают едва ли не первостепенное значение. Поскольку многопериодные игры охватывают несколько периодов взаимодействия, их еще часто называют повторяемыми (англ. repeated) или супериграми (англ. supergame).

Практически для представления игры в стратегической форме достаточно перечня игроков, списка стратегий и матрицы выигрышей.

Если множество игроков обозначить / = {1,2,...,/} , то любой игрок может быть индицирован как tel. Естественно, что в случае двух игроков / = {1,2}, а игроки могут быть обозначены как І, и 1,.

Стратегией в теории игр называют завершенный план действий каждого игрока. Определение «завершенный» означает здесь, что этот план должен предусматривать определенный ответ данного игрока на любое возможное действие других участников игры. Если все множество доступных /-му игроку стратегий обозначить S,, то каждый его элемент, одна из доступных стратегий, будет st є S,. Обозначим далее выигрыш і-го игрока, получаемый им при использовании стратегии 8, р,(з). Игра представлена в стратегической форме, если заданы множество игроков /, множество стратегий S, и функция выигрышей (или платежная функция) р,(з) для каждого участника игры tel.

Если в игре с двумя игроками один из них имеет т, а другой п доступных стратегий, так что Sj = {8},8?,...,зр} и S2 = {e^,e|,...,ejj, матрица выигрышей будет иметь размер тх п . Положив т = п = 2 , мы получим матрицу вида, представленного табл. НАЛ.

В каждой из четырех клеток таблицы показаны выигрыши обоих игроков ( />!<•), р2()) при разных комбинациях выбираемых ими стратегий, причем выигрыш игрока 1 (Pj(-)) предшествует выигрышу игрока 2 (р2()). Нижние индексы в подлежащем и сказуемом таблицы соответствуют индексу игрока, верхние — индексу стратегии.

С точки зрения выигрышей различают игры с постоянной и переменной суммой. В играх с постоянной суммой величина выигрыша не зависит от характера выбранных игроками стратегий. Например, в играх с нулевой суммой выигрыш одного всегда предполагает равновеликий проигрыш другого. Игра двух лиц с нулевой суммой может быть представлена как

Рі(«і.*г) + Р2(«і.«2) = О для всех s1eSl и s2€S2, так что

Pi(ava2) = -Pi(ava2)-

Поэтому выигрышу одного игрока в матрице вида НАЛ будет соответствовать равный по модулю проигрыш другого. Такие игры нередко называют антагонистическими. В играх с переменной суммой последняя варьирует вместе с изменением выбора стратегий. В таких играх выигрыш одного не означает проигрыша другого. «То, что выглядит как конфронтация, можно, проявив немного доброй воли, превратить во взаимовыгодную игру с ненулевой суммой», — пишет британский биолог Докинз.4

Равновесие в игре с двумя участниками представляет такую комбинацию стратегий (s*,sj), что

р, («*,«*) ^ Pi(si>sl) Для всех s1eS1 . (НАЛ)

P2«.s*J ^ Р2(«Г,«2)  для всех s2eS2. (НАЛ*)

(11.А.1) требует, чтобы «і было наилучшим ответом на s*, а (НАЛ*) требует, чтобы sj было наилучшим ответом на з[. Выполнение этих условий означает оптимальность и совместимость комбинации стратегий s* и s*. То же справедливо и для игр с большим числом участников.

 

НАЛ. Равновесие доминирующих стратегий

Понятие лучшего ответа, использованное выше для определения равновесия, предполагает знание одним игроком возможного поведения соперника, а для этого нужно представлять его функцию выигрышей. Существует, однако, тип игр, в которых наилучший ответ на действия другого игрока можно найти и без этого, если в доступном данному игроку множестве стратегий есть такая, которая окажется лучшим ответом на любую возможную комбинацию стратегий других игроков. Замечательным примером такой игры является игра под названием «Дилемма заключенных».5

4 Докинз Р. Эгоистичный ген. М., 1993. С. 202.

6 Ее обычно приписывают Э. Такеру (см.: Лъюс Р. Д., Райфа X. Игры и решения. Введение и критический обзор. М., 1961. С. 133).

Сюжет, положенный в основу этой игры, прост. Двое задержаны по подозрению в соучастии в совершении преступления. Следствие, однако, не располагает достаточными уликами, позволяющими передать дело в суд и потому провоцирует их на добровольное признание. Каждому из задержанных предлагается сделка такого рода. Если вы оба сознаетесь, каждый получит по 5 лет тюрьмы. Если один сознается, а другой нет, первый получит год заключения, а второй 10 лет. Если же не сознается ни один, дело будет невозможно закончить и оба, скорее всего, будут осуждены на 2 года заключения.

Этот сюжет легко переводится на язык теории игр. В стратегической форме такая игра предполагает I = {1,2}, каждый задержанный имеет множество допустимых стратегий: S, = {C,N}, S2 = {C,N}, где С — «сознаться» {англ. confess), а N — «не сознаваться» (англ. поп confess). Матрица выигрышей имеет структуру, представленную в табл. 11А.2.

Если бы заключенные могли договориться о солидарном непризнании и если бы каждый из них был абсолютно убежден в верности другого такому сговору, они получили бы по 2 года, что (с учетом предварительного заключения) было бы не худшим исходом. Но они не только находятся в разных камерах и не могут поэтому общаться, что, впрочем, и не столь важно для исхода игры, но и не доверяют друг другу, что гораздо важнее. Поэтому каждый из них думает, что соблазн облегчить свою участь признанием будет для другого велик и побудит того сознаться, а это обречет его самого на суровое наказание. Так что, вероятнее всего, оба арестованных угодят в тюрьму на 5 лет, т. е. исходом игры станет комбинация стратегий (С, С). Она и представляет собой то, что называют равновесием доминирующих стратегий.8

6 Всестороннему обсуждению «Дилеммы заключенных» посвящена глава 12 названной книги Р. Докинза. (См. примеч. 4). Настоятельно рекомендуем вам прочесть ее.

Парадокс решения игры «Дилемма заключенных» — а ее часто и называют «Парадоксом заключенных» — в том, что здесь равновесие доминирующих стратегий (С, С), очевидно, доминируется другим исходом — (N, N), означающим согласованный двухсторонний отказ от признания. Эта игра, таким образом, иллюстрирует ситуацию, часто встречающуюся в экономике и социальной жизни вообще, когда сотрудничество, кооперирование улучшает положение кооперирующихся субъектов, будь то физические или юридические лица. Такому сотрудничеству, кооперированию препятствует, как и в игре «Дилемма заключенных», взаимное недоверие, а также отсутствие механизма принуждения субъектов к выполнению (ненарушению) достигнутых договоренностей. В принципе такой механизм включает, с одной стороны, право, а с другой — правосознание. Но и то и другое могут быть неразвитыми. В условиях же скрытого сговора — а в него наши заключенные могли вступить еще до того, как их поместили в изолированные камеры — на роль такого механизма могло бы претендовать обычное честное слово. Честь, личная или корпоративная, является и единственным механизмом принуждения к выполнению взаимодоговоренностей во всех сделках, не регулируемых правом. С другой стороны, попытки усилить принуждение к исполнению договоренностей, часто именуемые укреплением правопорядка, а то и просто порядка, обычно вырождаются в принудительно заключаемые сделки.

Во всяком случае, если бы наши заключенные могли найти способ выработки единой общей стратегии и, что еще более важно, способ принудить друг друга придерживаться ее, их выигрыш был бы большим, чем в рассмотренной нами ситуации, когда каждый из них действовал (играл) независимо, на свой страх и риск. Последний аспект любой общей стратегии — принуждение (англ. enforsement) — крайне важен, ибо в отсутствие его интересам каждого из заключенных отвечает не выполнение соглашения, а наоборот, его скрытое нарушение, предательство (англ. finking).7

Прежде чем дать более общее и строгое определение равновесия доминирующих стратегий, введем еще одно обозначение, ранее не использовавшееся. Пусть

 

означает стратегию, доступную всем другим игрокам, кроме i-ro, а (5, s_t) представляет профиль (множество) стратегий 8l,...,sl_l,St,al+lt...,8f. Тогда стратегия steSt называется доминирующей стратегией 1-го игрока, если

p((5,,s_() 2 p((s,,s_,) для всех s,eSt и s^eSL,        (НА.2)

и равновесием доминирующих стратегий всех игроков будет

$ = *i>52,...,5f. (11А.2*)

7 В американском сленге fink — штрейкбрехер.

Можно показать, что всякая доминирующая стратегия является максиминной стратегией, хотя не всякая максиминная стратегия является доминирующей. Выбор максиминной, или осторожной, стратегии означает, что игрок решил довольствоваться гарантированным, хотя и не самым большим выигрышем (убедитесь в этом сами, еще раз обратившись к матрице выигрышей, табл. НА.2). Важной особенностью максиминной стратегии является независимость ее выбора игроком от информации о возможных выигрышах партнеров. Все, что нужно і-му игроку для определения максиминной стратегии, — это знание своего вероятного выигрыша и представление о доступных другим участникам игры стратегиях. Никаких размышлений по поводу мотивации других игроков и их функции выигрыша не требуется.

Игра «Дилемма заключенных» свидетельствует, что в некоторых играх существуют стратегии, являющиеся лучшим ответом на любую комбинацию стратегий других игроков, или, если можно так сказать, годные на все случаи жизни. В играх подобного типа их участники будут разыгрывать такую доминирующую стратегию. Игры типа «Дилемма заключенных» часто используются в микроэкономике для анализа поведения олигополистов (сговор, ценовое лидерство, ломаная кривая спроса).

 

11А.2. Равновесие Нэша

Обсуждение игры «Дилемма заключенных» позволило нам сформулировать понятие равновесия доминирующих стратегий. Возможна, однако, и даже более вероятна такая ситуация, когда наилучший ответ одного игрока на действия других не предопределен, а зависит от характера их действий, т. е. варьирует в зависимости от поведения других участников игры. Рассмотрим, например, другой тип игры, известный под названием «Конфликт полов» (англ. battle of sexes).

Присмотримся к паре I (Он, Она), желающей провести вместе вечер. Она предпочитает при этом пойти с ним в театр (Т), а Он — пойти с ней смотреть состязания боксеров (Б). Но все же и Он и Она предпочитают провести этот вечер вместе, а не порознь. Матрица выигрышей этой пары представлена табл. 11А.З. Из нее сразу же видно, что им было бы несколько лучше, если бы Она пошла в театр, а Он на бокс, чем наоборот. Но здесь нет доминирующих стратегий. Лучшим его ответом было бы пойти в театр, если Она решила пойти туда, и пойти на бокс, если бы Она решила пойти именно туда. То же справедливо и в отношении ее лучшего ответа.

Ясно, что в этой игре нет доминирующей стратегии, а значит, ее исходом не может быть и их равновесие. В то же время, если Она и Он выберут свои максиминные стратегии (Т, Б), сулящие им, как следует из табл. 11А.З, гарантированный, хотя и не наибольший из возможных, выигрыш, т. е. Она пойдет в театр, а Он на бокс, это будет не наилучшим, а скорее наихудшим исходом конфликта. Не будет это и наилучшим ответом одного из партнеров на действия другого.

В этом случае лучше всего воспользоваться концепцией равновесия Дж. Нэша,8 которую мы уже ввели в разделе 11.2, определив равновесие Нэша как такое состояние рынка, когда ни одно предприятие не хочет изменить свое поведение в одностороннем порядке. Теперь мы можем дать более общее его определение. Комбинация стратегий s*e S представляет равновесие Нэша, если

p,(s*) > p,(s,,s!,)  для всех steS, и tel. (11А.З)

Иначе говоря, равновесие Нэша — это профиль стратегий, при котором стратегия каждого игрока является ответом на действия других не худшим из доступных ему стратегий.

Для игры с двумя участниками равновесием Нэша будет пара стратегий (8}, sj), если для каждого 1-го игрока (1 = 1, 2)

А(*Г.**)* А(*<>**) для всех s,eS,. (11А.4)

Соответственно для каждого 1-го игрока з* должно быть решением максимизационной задачи:

maxp((s,,s,*). (11А.5)

К сожалению, для участников «Конфликта полов» это определение малозначимо. Ведь, как следует из матрицы их выигрышей, конфликт может разрешиться одним из двух равновесий Нэша — (Т, Т) и (Б, Б). Ясно, что, если Она пойдет в театр, ему следует сопровождать ее, а если Он пойдет на бокс, ей следует пойти вместе с ним. Но предпочтения конфликтующих сторон в отношении двух равновесий Нэша различны. Ведь

Л(Т,Т)> А(Б,Б),

р2(Т,Т)<р2(Б,Б). (11А-6)

8 Nash «Л: 1) Equilibrium Points in n-personal Game // Proceedings of the National Academy of Sciences USA. 1950. Vol. 36. P. 48-49; 2) Noncooperative Games // Annales Math. 1951. Vol. 54. P. 286-295.

Поэтому действительный исход конфликта — (Т, Т) или (Б, Б) — остается неопределенным. В этом и подобных случаях неединственности равновесия Нэша его понятие дает лишь слабую концепцию «разумного исхода». Возможно, нашей паре следует сегодня провести вечер в театре, а завтра пойти на бокс. Но что все же делать сегодня, а что отложить до завтра? Чтобы попробовать ответить на данный вопрос, нужно перейти от статичной, однопериодной к многопериод-ной версии этой игры.

Карл Поппер использовал чуть модифицированный вариант игры «Конфликт полов», чтобы показать, что «этот конфликт не может быть разрешен любовью, и он, скорее, будет тем сильнее, чем больше любовь. Из него существует только два выхода. Один состоит в том, чтобы использовать эмоции и в конечном счете насилие, а другой — в использовании разума, беспристрастности, разумного компромисса».9

Несравненно удобнее (и продуктивнее) ситуация, когда равновесие Нэша единственно. Можно, в частности, убедиться в том, что создатели классических моделей дуополии, прежде всего О. Курно, предвосхитили концепцию равновесия Нэша и, более того, получили те же результаты, отказавшись от критикуемой многими концепции предполагаемых вариаций.

 

11А.З. Равновесия Курно, Бертрана и Штакельберга как частные случаи равновесия Нэша

Равновесия классических моделей дуополии могут быть переинтерпретированы в терминах теории игр, а их исходы могут быть представлены как особые случаи равновесия Нэша. Известно несколько различных вариантов такой переинтерпретации, подробное изложение которых выходит за рамки данного курса. Все же приведем некоторые из них.

9          Поппер К. Открытое общество и его враги. Т. 2. Время лжепророков: Гегель, Маркс и другие оракулы. М., 1992. С. 273.

10         Daugherty A. Reconsidering Cournot: the Cournot Equilibrium Is Consi-

stent // Rand Journ. Econ. 1985. Vol. 16, N 2. Другие теоретико-игровые переин-

терпретации дуополии Курно см.: Gibbons ft A Primer in Game Theory. New

York, 1992. P. 14-21.

Начнем с одной простой переинтерпретации модели дуополии Курно. Допустим, что дуополист 1 выбирает свой прибылемаксимизи-рующий выпуск исходя из некоего своего представления о стратегии дуополиста 2. Эти представления дуополиста 1 о стратегии дуополиста 2 служат основой для представления дуополистом 2 стратегии дуополиста 1 и т. д. Таким образом, дуополист 1 думает о размышлениях Дуополиста 2 примерно так: «Я думаю, что он думает, что я думаю, что он думает, что я думаю, что...». Исходя из подобных бесконечных обратных рассуждений, каждый дуополист выбирает свою величину выпуска. Как показал Э. Догерти, результатом такой игры стратегий является равновесие Курно—Нэша.10

Покажем теперь несколько подробнее одну из переинтерпретаций модели Бертрана для случая неоднородной дуополии. Если дуополисты 1 и 2 выбирают для своих товаров цены, спрос на продукцию 1-го дуополиста (/—1,2) будет

Яі(Рі,Р-,) = а- Рі+Ьр^,, (11А.7)

где Ъ > 0 выражает степень заменяемости продуктов. Положим также, что предельные затраты неизменны и равны с, причем с < а , а дуополисты совершают свой выбор одновременно (последнее предположение, как уже отмечалось, более реалистично для модели Бертрана, чем для модели Курно). Пространство стратегий доступных 1-му дуополисту будет S_( = [0, оо), т. е. возможна в принципе любая неотрицательная цена. Под функцией выигрыша будем, естественно, понимать функцию прибыли. Если фирма / выберет цену р, для своей продукции, а ее соперник цену р_( для своей, то прибыль 1-го дуополиста составит

л,{Р„Р-,) = Я,(Р,,Р-,)(Р, -с) = (а- pt +bp_t)(pt - с). (11А.8)

Следовательно, пара цен (р*,р!() явится равновесием Нэша, если для каждого 1-го дуополиста его цена р* (р*_,), будет решением следующей максимизационной задачи:

max x,(pt, ptt) = max (а - р, + bp*t)(pt - с).           (НА.9)

Ее решением для 1-го дуополиста будет

A* =(a+bplt +с).            (НА.10)

Таким образом, если пара цен ( р[, р) есть равновесие Нэша, должны выполняться условия

a + bpl+c     ,    a + bp*. + с

Pi =      2          ' Pz =   2          •

Их решение дает

а + с

Рі=Р2=~2^Ь~- (ИА.П)

Из (НА.11) следует, в частности, что, для того чтобы цены р = р были неотрицательны, необходимо выполнение требования Ь < 2 .

Модель дуополии Штакельберга, рассмотренная в разделе 11.2.1.3, как и модель Курно, предполагает выбор дуополистами величины выпуска, но не одновременно (как в модели Курно), а последовательно. В этом смысле ее можно интерпретировать как динамическую игру.

Основная проблема динамических игр — доверяемостъ (англ. credibility). Пояснить ее содержание поможет так называемая «Игра с гранатой» (англ. grenade game), в которой выделяются две стадии (или два этапа). Сначала игрок 1 выбирает между тем, дать ли игроку 2 тысячу долларов или не давать. А затем игрок 2 видит действие игрока 1 и решает, взорвать ли ему или не взорвать гранату, жертвами которой станут оба игрока.

Допустим теперь, что некий вымогатель-террорист (игрок 2) требует у намеченной им жертвы (игрока 1) тысячу долларов, угрожая гранатой. Если игрок 1 считает угрозу правдоподобной, его наилучший ответ — отдать вымогателю спрашиваемую им сумму. Но игрок 1 может не поверить в реальность угрозы, он может счесть ее неправдоподобной: ведь если, дать игроку 2 возможность реализовать угрозу, тот, оберегая свою жизнь, вероятно, откажется от ее реализации, а следовательно, игрок 1 ничего и не должен ему отдавать.

«Игра с гранатой» относится к классу игр с полной и совершенной информацией. Основные особенности динамических игр такого рода заключаются в следующем. Во-первых, действия игроков осуществляются последовательно, во-вторых, все предыдущие их действия наблюдаемы до выбора следующего хода в игре, наконец, в-третьих, выигрыши от каждой возможной комбинации действий (или ходов) общеизвестны. Игры такого рода решаются посредством обратной индукции (англ. backward induction). Когда игрок 2 должен делать свой ход на второй стадии игры, он сталкивается с задачей максимизации своего выигрыша р2, зная предыдущий ход партнера по игре а1еА1, где А, — доступное игроку 1 множество действий, т. е.

max р2(а„а2). (11А.12)

Допустим, что для каждого а, є Ах задача (НА.12) имеет единственное решение и обозначим его /^(а,). Это и есть наилучший ответ, или реакция игрока 2 на ход игрока 1. Поскольку игрок 1 может решить задачу игрока 2 точно так же, как и тот сам, игрок 1 предвосхищает ответ игрока 2 на каждый ход а,, который тот может сделать, задача игрока 1 на первой стадии состоит в том, чтобы

maxp^AjK)). (11А.12*)

аіЄАі

Допустим, что и эта задача имеет единственное решение, которое обозначим ах . Результатом игры на основе обратной индукции будет тогда

K.HjK)). (11А.12**)

Этот результат не включает неправдоподобной угрозы в «Игре с гранатой». Игрок 1 предвосхитит, что игрок 2 будет реагировать оптимально на любое действие ах, которое он может совершить, играя R2(^). Поэтому игрок 1 не поверит угрозе игрока 2, т. е. в то, что тот будет действовать не в своих собственных интересах, когда настанет вторая стадия игры.

Теперь мы можем вернуться к теоретико-игровой переинтерпретации динамической модели Штакельберга. Последовательность ее такова. Сначала дуополист 1 выбирает величину выпуска д, £ 0, затем дуополист 2, узнав величину , выбирает величину своего выпуска д2 > 0 . Выигрыш /-го дуополиста (/ — 1, 2) задан функцией прибыли

fi(9i.9-i) = 9«(^(Q)-c). (11А.13)

где P(Q) = а - Q — рыночная цена продукции дуополии (Q = q, + q_t ); с — неизменные предельные затраты.

Чтобы определить исход игры на основе обратной индукции, сначала найдем наилучший ответ дуополиста 2 на произвольный выпуск дуополиста 1. R2(q1) является решением задачи

max^-2(gj,g2) = m&xq2(a-qi -q2 - с),

 

откуда

Д»(3і)= ""а"6 (11А.14)

в предположении, что gj < (а - с).

Поскольку дуополист 1 может решить задачу, стоящую перед дуополистом 2 так же, как и тот сам, он может предвосхитить выпуск 9j , который вызовет ответ -R2(9j). Поэтому задача дуополиста 1 на первой стадии игры состоит в том, чтобы приравнять

тахя-^.Д^д,)) = maxq1(a-q1 -R2(q1)-c) = max^ —Ц—-,

 

откуда ас

ЯІ = —2~ -

(11А.15)

^(9?) = ^.

что и есть исход дуопольной игры Штакельберга на основе обратной индукции.

Обратите внимание, что в знаменателе (НА. 15) в отличие от (11.46) и (11.47) отсутствует множитель Ь. Это связано с тем, что здесь для упрощения в линейной функции спроса (11.6) Ь = 1. Если же в функции рыночного спроса Р = a -bQ положить Ь ф 1 и сопоставить (11.13) с (11.46) и (11.47), то станет очевидным, что равновесный выпуск Курно больше равновесного выпуска последователя Штакельберга, но меньше выпуска лидера. Действительно,

а-са-са-с

-2Г>^Г>-4Г- <11АЛ6>

То, что положение дуополиста 2 в модели Штакельберга хуже, чем в модели Курно, иллюстрирует важное отличие в принятии решений одним и несколькими субъектами. В теории принятия «единоличных» решений обладание большей информацией не может ухудшить положения принимающего решения. В теории игр — а это и есть теория взаимозависимых межличностных (англ. interactive) решений — обладание большей информацией (точнее, знание другими игроками того, что некий игрок обладает большей информацией) может ухудшить положение принимающего решения субъекта.11

Как явствует из (НА.15) и (НА.16), в равновесии Курно— Нэша выпуск каждого дуополиста (при Ъ = 1) составит (о - с)/3 , а их совокупный выпуск будет, следовательно, Qc = 2(о - с)/3 , тогда как совокупный выпуск дуополистов Штакельберга будет равен сумме правых частей (НА.15), т.е. Q, =3(о-с)/4 (см. с. 198). Таким образом, Qs > Qc , и, следовательно, соотношение равновесных рыночных цен будет противоположным, рв < рс. Но, как мы помним из раздела 11.2.1.3, в модели Штакельберга дуополист 1 может выбрать выпуск Курно, (о - с)/3 , на что дуополист 2 может ответить своим выпуском Курно. Таким образом, в игре Штакельберга, дуополист 1 может получить прибыль Курно, но сделать это по-иному, так что в итоге его прибыль в игре Штакельберга окажется выше, чем в игре Курно. Но поскольку р, < рс и с = const, (tTj + тсг), < (кх + к2)с, то лучшее положение дуополиста 1 означает, что положение дуополиста 2 будет хуже в игре Штакельберга, чем в игре Курно.

В игре Штакельберга основной информационный вопрос связан с величиной выпуска дуополиста 1 (qx). Дуополист 2 знает значение д, и, что существенно, дуополист 1 знает, что дуополист 2 знает величину . Чтобы понять значение этой информированности дуополиста 1, рассмотрим модифицированную игру с последовательными ходами, в которой дуополист 1 сначала выбирает выпуск q} , после чего дуополист 2 выбирает свой выпуск q2, не зная при этом величины д,.

11 Gibbons Я. A Primer in Game Theory. P. 63.

Если дуополист 2 полагает, что его соперник выбрал q[ = (о - с)/2 , его наилучшим ответом будет Д^(д*) = (о - с)/4, что соответствует (НА. 15). Но если дуополист 1 предвосхищает, что его соперник имеет такие предположения и на их основе выбирает свой выпуск, то он предпочтет в качестве ответа на (о-с)/4, скажем, 3(о-с)/8, скорее, чем свой выпуск Штакельберга (о - с)/2 . Поэтому дуополист 2 не верит, что дуополист 1 выбрал свой выпуск Штакельберга. Единственным равновесием Нэша этой модифицированной игры с последовательными ходами будет выбор обоими дуополистами равновеликих выпусков 9j* = ql = (о - с)/3 , т. е. равновесие Курно—Нэша в игре с одновременными ходами.

 

11А.4. «Дилемма заключенных» н сговор

Субъекты рынка имеют как общие, так и противоположные интересы. Общий интерес продавцов в том, чтобы продавать товары подороже, но их личный интерес в том, чтобы не потерять своих покупателей, свою долю рынка. Общий интерес покупателей в том, чтобы покупать товары подешевле, но их личный интерес в том, чтобы эти дешевые товары реально можно было бы купить. И продавцы, и покупатели придерживаются, как правило, противоположных мнений относительно уровня цен, а с другой стороны, они имплицитно понимают, что означает для тех и других взаимовыгодность добровольного обмена, и заинтересованы в том, чтобы он имел место.

Теория игр предлагает метод анализа таких ситуаций, которые представляют смесь общих и противоположных интересов субъектов рыночного хозяйства, в частности олигопольного рынка. Используем игру типа «Дилемма заключенных» для анализа поведения олигопо-листов. Допустим, что доступные им стратегии заключаются в большом и небольшом объеме выпуска, а в качестве выигрышей выступают соответствующие тому или иному выпуску размеры прибыли (табл. НА.4). Приведенные в матрице цифры можно рассматривать как миллионы, а если хотите, как миллиарды рублей прибыли.

Как будут вести себя дуополисты при данной матрице выигрышей? Если дуополист 1 полагает, что соперник выберет большой выпуск, то он максимизирует свою прибыль, выбирая тоже большой выпуск (2 > 1 ). Но и в том случае, если дуополист предполагает, что соперник выберет небольшой выпуск, он тоже выберет большой выпуск (4 > 3 ). То же самое справедливо и в отношении дуополиста 2, который так же будет максимизировать свою прибыль, выбирая большой объем выпуска, независимо от выбора дуополиста 1. Так что выбором обоих дуополистов окажется большой объем выпуска, что даст каждому из них прибыль 2 (левая верхняя клетка матрицы выигрышей).

Однако, с точки зрения обоих монополистов вместе, этот результат отнюдь не самый лучший. Если бы они смогли сговориться и ограничиться небольшими размерами выпуска, то каждый получил бы прибыль не 2, а 3 (правая нижняя клетка матрицы выигрышей). Проблема в том, что, как и в классической «Дилемме заключенных», если бы оба дуополиста достигли бы такого соглашения, у каждого из них появился бы стимул надуть другого, изменив соглашению. Если дуополист 1 заметит, что соперник придерживается соглашения и ограничивает свой выпуск небольшим объемом, у него появляется интерес к тому, чтобы увеличить свой выпуск, нарушив договоренность, и получить таким образом большую прибыль, 4 вместо 3. Такая же заинтересованность появится и у дуополиста 2, если он заметит, что дуополист 1 ограничивает свой выпуск небольшим объемом, соблюдая достигнутое соглашение. И лишь в том случае, когда дуополисты окажутся в равновесии Нэша, ни один из них не будет заинтересован в изменении своей стратегии.

В определенных обстоятельствах, однако, оба или один дуополист могут все же улучшить свое положение. Допустим, что им приходится взаимодействовать не однократно, как заключенным в известной уже нам игре, а неограниченно долго. Предположим, дуополист 1 полагает, что его соперник сначала выберет небольшой выпуск и будет верен этому выбору до тех пор, пока он будет располагать свидетельством того, что и дуополист 1 в предыдущем периоде тоже выбрал небольшой объем выпуска. То же самое предполагает и дуополист 2 о поведении дуополиста 1. Тогда оба дуополиста будут считать друг друга верными кооперативному решению (низкий выпуск). Каким будет в этом случае равновесие?

Если дуополист 1 выбирает небольшой выпуск, он ожидает того же и от соперника и, таким образом, предвосхищает прибыль 3 в каждом последующем периоде. Если же, наоборот, дуополист 1 нарушит соглашение, его прибыль достигнет 4. Но по предположению дуополист 2 выбирает в последующем периоде большой выпуск. Следовательно, и дуополист 1 выберет в последующем периоде большой выпуск и получит прибыль не 3, а лишь 2.

Если дуополисты заинтересованы в будущих прибылях, они не сочтут такое отступление выгодным и никогда не нарушат достигнутого соглашения. То же справедливо и в отношении другого дуополиста, и потому равновесие будет характеризоваться небольшими объемами выпуска каждого дуополиста в каждом периоде. В этом случае говорят, что дуополисты следуют стратегии спускового крючка (англ. trigger strategy). Если каждый из них верит в то, что другой следует стратегии «спускового крючка», оба будут выбирать небольшой объем выпуска в каждом периоде и ни у одного из них не будет оснований менять свои предположения в отношении поведения (стратегии) другого. Таким образом, при определенных предположениях, — а именно при убеждении одной стороны в том, что другая сторона следует стратегии «спускового крючка», — сговор может поддерживаться и без формального соглашения.

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 |