Ситуация «невидимая рука» и «дилемма заключённых»

2019-05-24

785

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 1 2 3 4 5 6 7 89

Два преступника задержаны по подозрению в ограблении банка, однако против них недостаёт улик. Они могут получить небольшой срок – один год за те проступки, в отношении которых против них имеются улики (например,
за хранение оружия). Задача следователя, ведущего дело, – заставить преступников сознаться в совершении преступления. Он разработал два альтернативных плана проведения допроса (табл. 2, 3).

Таблица 2 План А «Невидимая рука»

		Преступник В
		Сознаться	Молчать
Преступник А	Сознаться	-5; -5	-10; 0
Преступник А	Молчать	0; -10	-1; -1

Если один из преступников признался в совершении преступления, а другой смолчал, то признавшийся получает максимальный срок – 10 лет тюремного заключения, а тот, кто не сознался, будет выпущен на волю. Если сознаются оба преступника, они получают по 5 лет заключения. Если оба молчат, каждый получает по 1 году заключения за ношение оружия. Каждый из игроков в данной ситуации принимает решение, не имея информации о выборе другого игрока. Выигрыши представлены в матрице игры, где числа означают величину отрицательной полезности, которая определяется количеством лет, проведённых
в тюрьме. Соответственно (-5) означает, что преступник приговорён к 5 годам тюремного заключения, (-1) –
1 году тюремного заключения, (-10) – 10 годам тюремного заключения и (0) – преступник выпущен на свободу.

Доминирующая стратегия игрока А в данной ситуации – молчать: ведь если игрок В тоже молчит, то А получает 1 год тюрьмы, а если В сознается, то А вообще выходит на волю. У В также есть доминирующая стратегия: для него лучше молчать независимо от того, какую стратегию выберет А. Результат, когда оба преступника молчат, является стабильным; это означает, что каждый игрок останется доволен своим выбором после того, как узнает о выборе другого игрока. Такой стабильный результат имеет название «равновесие по Нэшу».

Следователь не смог достичь своей цели – добиться от преступников признания – и придумал другой план.

Таблица 3 План В «Дилемма заключённых»

		Преступник В
		Сознаться	Молчать
Преступник А	Сознаться	-5; -5	0; -10
Преступник А	Молчать	-10; 0	-1: -1

Преступники снова могут выбирать одну из двух стратегий. Оба знают: если никто из них не сознается, они получат минимальный срок – 1 год тюремного заключения за незаконное ношение оружия. Если сознаются оба, то каждый получает по 5 лет. Если признается лишь один из них, тогда тот, кто даст показания, выходит на волю, а тот, кто все отрицает, получает 10 лет тюремного заключения.

В этой игре у каждого преступника есть доминирующая стратегия – сознаться. Равновесием по Нэшу в этой игре будет набор стратегий {сознаться; сознаться}, которые выбирают игроки. В игре «дилемма заключённых» следование каждым игроком личной выгоде приводит к неэффективному для группы результату. Если бы оба преступника молчали, они были бы в лучшем положении – эффективном по Парето. Здесь равновесие по Нэшу неэффективное, ведь преступники могли бы получить по 1 году, а получили по 5 лет. Но стимулы, действующие в этой игре, настолько сильны, что можно представить себе ситуацию, когда оба преступника сознаются в совершении преступления, даже если оба невиновны.

Может быть, это стабильное неэффективное равновесие возникает потому, что преступники не смогли договориться между собой, не скоординировали свои действия? Но даже если бы они обменялись информацией и скоординировали свои показания на допросе у следователя, результат был бы тем же. Никто из них не мог быть уверен в том, что другой в последний момент не захочет получить одностороннее преимущество за счёт другого игрока. Причиной того, что игроки оказываются в неэффективном равновесии, является отсутствие надёжного, заслуживающего доверия обязательства со стороны каждого из игроков.

Обязательство будет надёжным, если одна из сторон видит, что другая сторона лишена возможности нарушить своё обязательство.

Обязательство может быть надёжным в императивном или мотивационном смысле. Обязательство будет надёжным в императивном смысле, если игрок не может поступить иначе, потому что его принуждают к такому поведению или он лишён свободы действий.

Подобно Одиссею, приказавшему привязать себя к мачте корабля, чтобы услышать пение сладкоголосых сирен, которые увлекали мореплавателей на острые прибрежные скалы, но при этом проплыть невредимым мимо них. Обязательство Одиссея не покидать корабль, и не направлять его в сторону скал было надёжным, т.к. он был физически лишён возможности нарушить его.

Обязательство является надёжным в мотивационном смысле, если игроку выгодно выполнить его.

Томас Шеллинг, лауреат Нобелевской премии по экономике 2005 г., следующим образом иллюстрирует подобное обязательство. Похититель намеревался получить выкуп за похищенную жертву, но внезапно испугался и хочет отпустить её. Однако очевидно, что как только жертва получит свободу, она сразу же сообщит
о похищении в полицию. Конечно, жертва клянётся, что будет молчать. Но надёжно ли её обещание? Вряд ли, и поэтому похитителю придётся её убить. Но можно ли избежать такого исхода, сделав каким-то образом обещание молчать со стороны жертвы надёжным? Шеллинг предлагает следующий выход: если жертва в прошлом совершила какое-либо преступление, она должна сообщить об этом похитителю; если же она не совершала никакого преступления, она должна это сделать в присутствии похитителя. В этом случае жертве, которая не лишена физической возможности пойти в полицию, будет невыгодно делать это: она будет опасаться, что похититель сообщит полиции о её преступлении и ей придётся нести наказание.

Планы А и В, разработанные следователем, представляют собой разные типы социального взаимодействия. В плане А индивидуального следования личной выгоде достаточно для достижения эффективного результата. Равновесие по Нэшу в этой игре эффективно по Парето. Игрокам не нужно обмениваться информацией, сотрудничать до начала игры, принуждать другого игрока и т.д. Чтобы достичь Парето-эффективного результата в этой игре, не требуется никакого взаимодействия. Мы не случайно назвали данный сценарий допроса «невидимая рука».
Эта ситуация прекрасно описывается словами А. Смита, который утверждал, что индивид, стремящийся исключительно к собственной выгоде, направляется невидимой рукой к результату, который не входил в его намерения. Этим результатом является удовлетворение интересов общества.

В плане В («дилемма заключённых») следование личной выгоде приводит
в социальную ловушку. Индивидуальный и коллективный интересы здесь находятся в конфликте.

Социальная ловушка – это особая ситуация, отличающаяся прямым конфликтом между частными стимулами и общественными интересами.

Достичь эффективного для данной группы преступников результата можно, лишь заставив игроков выбрать стратегию, которая не кажется им привлекательной. Если заставить каждого игрока выбрать такую альтернативу, группа в целом выиграет. В этой ситуации возникает институт, который принуждает игроков выбрать непривлекательную для них стратегию, чтобы они смогли достичь эффективного для группы результата. Применительно к данному криминальному сообществу таким институтом может быть правило, действующее в мафиозной организации. Принадлежность к последней преступников А и В меняет их выигрыши.
Если член мафии даёт показания против своего сообщника, ему грозит смерть. Мафиози А и мафиози В сравнят
10 лет тюремного заключения с возможностью быть убитым (в тюрьме или на воле), и каждый из них предпочтёт молчание как более привлекательную стратегию, хотя выбор стратегии «молчать» приносит выигрыш в виде
10 лет тюремного заключения. А не сознается, так же как и В, и потенциальный смертный приговор, вынесенный мафией, поможет им достичь эффективного для данной группы преступников результата – получить по одному году тюремного заключения вместо 5 лет, предсказанных планом «дилемма заключённых».

Институт, который позволяет достичь эффективного для группы результата в ситуации «дилемма заключённых», содержит механизм принуждения
к соблюдению правил. Чтобы понять, что представляет собой этот механизм, рассмотрим следующую игру (табл. 4).

Таблица 4 Игра «Два пулемётчика»

		Пулемётчик В
		Сражаться	Дезертировать
Пулемётчик А	Сражаться	1; 1	-2; 2
Пулемётчик А	Дезертировать	2; -2	-1; -1

Два пулемётчика на двух изолированных позициях должны отразить атаку врага. Каждый может выбрать одну из двух стратегий: сражаться или дезертировать.

Если оба останутся на своих позициях и будут сражаться, атака будет отбита. Если оба дезертируют, враг сможет прорваться, и они попадут в плен. Если один из них останется на позиции, а другой дезертирует, то тот, кто будет сражаться, даст возможность другому благополучно убежать, затем враг прорвётся, и сражающийся пулемётчик будет убит.

Выигрыши обоих игроков представлены в матрице игры. Ситуация представляет собой классическую дилемму заключённых. Результат игры – оба пулемётчика дезертируют и попадают в плен – неэффективен не только с точки зрения интересов командования и страны, которую они защищали, но и с точки зрения их собственных интересов. Каким образом можно лишить стратегию дезертирства её привлекательности? Как сделать так, чтобы она не была доминирующей для каждого из игроков?

В этой ситуации возможны следующие решения:

• Заминировать подходы к позициям. Это изменит выигрыши в игре, и взаимная солидарность будет обеспечена

Таблица 5 Игра «Два пулемётчика» с минированием подходов

		Пулемётчик В
		Сражаться	Дезертировать
Пулемётчик А	Сражаться	1; 1	-2; -2
Пулемётчик А	Дезертировать	-2; -2	-2; -2

• Ввести строжайшую дисциплину в подразделении, где служат пулемётчики. Знание о том, что подразделение дисциплинированное, создаст
у каждого солдата уверенность в другом игроке. Угроза наказания перевесит соблазн дезертировать. В этом случае игра будет иметь такой же вид, как и
в первом случае.

• Иногда наиболее эффективным механизмом принуждения может быть представление о чести, которое есть у игроков. В данном случае действует внутренний механизм принуждения, и матрица игры принимает следующий вид.

Таблица 6 Игра «Два пулемётчика» с самопринуждением игроков

		Пулемётчик В
		Сражаться	Дезертировать
Пулемётчик А	Сражаться	1; 1	-1; -2
Пулемётчик А	Дезертировать	-2; -1	-2; -2

Дезертир обесчестил своё имя, поэтому его выигрыш в случае, если ему удалось благополучно бежать, составит не 2, как в случае, когда механизм внутреннего принуждения не действует, а (-2). Оставшийся пулемётчик погибает, но становится героем, поэтому его выигрыш равен (-1). Если оба пулемётчика дезертируют и попадают в плен, выигрыш каждого из них равен (-2), т.к. оба
в плену и их имена покрыты позором.

В ситуации «дилемма заключённых» неэффективность равновесия, являющегося результатом игры, вызывает потребность в институте, который принуждал бы игроков выбирать непривлекательную для них стратегию
для достижения эффективного для группы результата.

В жизни дилемма заключённых как ситуация, которая возникает единожды, не повторяясь, встречается очень редко. Многие ситуации подобного типа – повторяющиеся, когда игроки постоянно встречаются друг с другом (например, в международных отношениях). Поведение игроков в повторяющихся ситуациях отличается от одношаговой игры. В повторяющихся (кооперативных) играх идёт процесс обучения, игроки узнают постепенно тип поведения, который они могут ожидать друг от друга, каждый из игроков имеет возможность наказать партнёра за его отказ от сотрудничества в прошлом, и на этой основе возникают разделяемые всеми игроками нормы поведения, конвенции, институты, позволяющие избежать выигрышей, предсказанных одношаговой игрой.

Ситуация координации

Примером института, возникающего в ситуации координации, служат правила движения на дорогах (правостороннее или левостороннее).
Это простейший институт – конвенция, который сокращает неопределённость и координирует действия людей. Рассмотрим его на примере игры.

Таблица 7 Координационная игра

		Водитель В
		Правая	Левая
Водитель А	Правая	1; 1	0; 0
Водитель А	Левая	0; 0	1; 1

Два автомобиля движутся по дороге навстречу друг другу. Если они едут
по разным сторонам дороги (каждый по своей правой или левой), то оказываются на одной полосе, и для того чтобы разъехаться, водителям нужно остановиться и провести переговоры, чреватые издержками, поэтому в данном случае
их выигрыши равны нулю. Если оба водителя выбирают правую сторону дороги, или же оба выбирают левую, они благополучно разъезжаются, и их выигрыши составляют по 1. Интересы водителей в этой игре не противоречат друг другу, они совпадают, поэтому здесь нет необходимости в принуждении игроков
к выбору той или иной стратегии. Но проблема возникает в связи с тем, что здесь появляются два равноценных равновесия по Нэшу, и нужно сделать выбор из этих двух равноценных результатов. Для того чтобы игроки скоординировали свой выбор, нужна какая-то подсказка, которая приведёт их в одно из равновесий.

Равновесие в координационной игре, выбираемое всеми участниками взаимодействия на основе некоторого общего знания, находящегося за рамками этой игры и помогающего игрокам скоординировать свой выбор, называется фокальной точкой.

Это понятие ввёл Т. Шеллинг, который проводил эксперименты с девятью типами координационных игр, и игрокам часто удавалось скоординировать свои действия во всех этих играх. В одних случаях логика, в других – воображение подсказывало правильный выбор. И в повседневной жизни люди время
от времени оказываются в ситуации, когда, не имея возможности сговориться заранее, должны найти общее решение, и часто им это удаётся. Помогают здесь некие символические детали, подсказывающие фокальные точки, где происходит совмещение ожиданий сторон.

Откуда берётся это общее знание, которое позволит в нашей игре водителям, стоящим перед выбором стороны дороги, скоординировать свои действия и попасть в фокальную точку? В качестве такого знака и возникает социальная норма правостороннего (или левостороннего) движения, представляющая собой простейшую форму института – обычай.

Каким образом возникает этот институт? Возможны два основных пути его появления.

Во-первых, он может быть установлен в централизованном порядке – указом властей. Примером может служить декрет, изданный после Французской революции 1789 г., который предписывал экипажам, запряжённым лошадьми, ездить по правой стороне дороги. До этого декрета действовало правило левостороннего движения: экипажи ездили по левой стороне, а пешеходы ходили по правой. Изменение правила имело символический смысл: движение по левой стороне было политически некорректным, потому что ассоциировалось с привилегированными классами, движение по правой стороне было привычным для простого человека, поэтому считалось более демократичным.

Во-вторых, данная социальная норма может возникнуть эволюционным путём. Так, в Англии не было какого-либо заметного события, которое породило бы господствующую норму левостороннего движения. Она возникла как местный обычай, а потом распространялась от одного региона
к другому. Это и есть второй путь появления социальной нормы: в периодически повторяющейся координационной игре, найденное удачное решение, которое затем повторяется, становится нормой. В данном случае фокальная точка является результатом некоторого жизненного опыта. Причём нельзя сказать заранее, какая из норм возникнет. Но чем больше игроков следуют определённой норме, тем более укоренившейся она становится.

Эти два способа не являются взаимоисключающими. Часто общество пользуется стихийно возникшей нормой, которая затем подкрепляется законом. Так, во многих европейских странах до начала XX в. правила дорожного движения не были законодательно установлены, принятый закон лишь подтвердил действующий обычай.

Ситуация неопределённости может снова возникнуть, например, когда одна страна оккупирует другую, а правила дорожного движения в этих странах разные. Такое положение складывалось при оккупации армией Наполеона европейских стран, где преобладающим было правило левостороннего движения. Схожая ситуация возникла в 1938 г. в связи с аншлюсом Австрии, где господствовало правило левостороннего движения, Германией – страной с правосторонним движением. Выходом из подобной ситуации может стать декрет оккупационных властей, который провозгласит, какое из двух возможных равновесий следует выбирать, и тем самым устранит неопределённость.

Институты с непосредственно экономическим значением, которые координируют действия людей, – это, например, деньги и кредит, промышленные и технологические стандарты, типовые договоры. Американский экономист Э. Шоттер выдвинул гипотезу о том, что деление времени на недели возникло
с целью решить проблему координации обмена на рынке. Деление времени
на недели, по его мнению, – это социальная условность, конвенция. Он рассматривает гипотетическое аграрное общество, в котором время недифференцированно и делится только на дни, и в котором ещё нет деления времени на недели. В этом обществе продукты труда необходимо обменять на рынке в городе. Возникшая проблема – чисто координационная: чтобы совершить обмен, все экономические агенты должны прибыть в город в один и тот же день. Возникает некоторая регулярность в поведении, которую Шоттер называет социальным институтом. Дни между двумя рыночными днями – это и есть неделя. Косвенное подтверждение своей гипотезы Шоттер видит в названии дней недели в Бразилии – «первый рыночный день», «второй рыночный день».

Другим примером проблемы координации может служить ситуация,
в которой оказываются люди, желающие совершить обмен при оккупации одной страны другой и не знающие, какая из валют – оккупационной страны или оккупируемой – является законным платёжным средством. Возникшая неопределённость и замешательство могут на некоторое время даже нарушить нормальный обмен и привести к возникновению бартера. Ситуацию прояснит постановление оккупационных властей, которое укажет, какое платёжное средство является законным. Тогда даже патриоты оккупированной страны будут пользоваться валютой оккупационной державы и не будет необходимости
в применении специального механизма принуждения, т.к. интересы людей в этом случае совпадут и им просто нужно найти единое для совершения обмена решение.

В ситуации координации институт необходим вследствие множественности возможных равновесий. Институт, возникающий в этой ситуации, не нуждается в специальном механизме принуждения, людям нужна лишь подсказка, некий знак, сигнал о том, какое из равновесий им выбрать, ведь
в ситуации координации они заинтересованы в нахождении единого решения.

2019-05-24

785

Обсуждений (0)

0.00 из 5.00 0 оценок

⇐ Предыдущая 1 2 3 4 5 6 7 89

Обсуждение в статье: Ситуация «невидимая рука» и «дилемма заключённых»

Обсуждений еще не было, будьте первым... ↓↓↓