Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПЛОТИНСКИЙ.doc
Скачиваний:
80
Добавлен:
30.11.2018
Размер:
7.93 Mб
Скачать

15.2. Модель эволюции кооперации

Рассмотрим модель "Дилеммы заключенного" в динамике, пред­полагая, что социальное взаимодействие носит не разовый харак­тер, а может неоднократно повторяться в будущем. В так назы­ваемой итеративной дилемме заключенного предполагается, что стороны, принимая решения, учитывают опыт прошлых взаимо­действий и прогнозируют возможное поведение партнеров в буду­щем. При этом таблица выигрышей остается неизменной.

Исследованию этой модели посвящена книга P. Аксельрода "Эволюция кооперации" [5], центральной проблемой которой яв­ляется выявление и анализ механизмов, формирующих коопера­тивное поведение среди эгоистических индивидов без какого-ли­бо принуждения или указаний свыше. Ясно, что кооперативные механизмы возникают только при определенных условиях. При-

276

мерами являются взаимодействие государств на международной арене, компромиссы, достигаемые сторонниками противоборст­вующих партий в парламенте, соблюдение неписаных правил по­ведения в бизнесе и т.д.

Анализ дилеммы заключенного, проведенный в § 15.1, по­казал, что следование принципам индивидуальной рациональ­ности заставляет "разумных" игроков отказываться от коопе­рации, выбирая вариант (D; D). Что же меняется, если с данным партнером социальные взаимодействия могут повторяться? До­пустим, стороны знают, что игра повторится ровно десять раз. Казалось бы, целесообразно перейти к взаимному сотрудничес­тву (вариант С; С), приносящему существенно больший вы­игрыш. Однако игрок А считает иначе. Он думает, что парт­нер В будет все время выбирать кооперацию и решает попытаться выиграть, обманывая в последней, десятой иг­ре. Также рассуждает игрок В. Понимая, что оба в послед­ней игре выберут альтернативу D, игроки, обдумывая свою стратегию в девятой игре, приходят к тому же выводу и т.д. Таким образом, рациональной вновь оказывается стратегия D — отказ от сотрудничества. Каждому из игроков эта стра­тегия принесет по 10 руб., тогда как сотрудничество дало бы каждому по 30 руб. Противоречие между индивидуаль­ной и коллективной рациональностью сохранилось.

Ситуация коренным образом меняется, если игроки не зна­ют, когда закончится игра. Какой же стратегии целесообразно придерживаться в данном случае?

Дать теоретически обоснованный ответ на этот вопрос до­вольно трудно, и Аксельрод предложил своим коллегам выявить лучшую стратегию в честном спортивном соревновании. Веду­щие специалисты, занимающиеся этой проблематикой,— пси­хологи, экономисты, математики, социологи — прислали ak-сельроду свои варианты стратегии данной игры, реализованные в виде компьютерных программ. В турнире участвовали 63 про­граммы. Каждая пара программ проводила друг с другом серии по 200 игр. Точное число игр авторам программ не сообщалось. Присланные программы содержали как простые стратегии, так и весьма изощренные, использующие методы прогнозирования и искусственного интеллекта. Победителем объявлялась про­грамма, набравшая в турнире больше всего очков. Удивитель­но, что чемпионом оказалась самая короткая программа, при­сланная А. Рапопортом, реализующая самую простую стратегию "Зуб за зуб" (TIT FOR TAT, сокращенно TFT).

277

Стратегия TFT на первом ходу выбирает кооперацию, а затем просто повторяет ходы партнера. Если он в предыдущей игре выбрал обман (D), то TFT также выбирает обман. Если партнер в предыдущей игре предпочел кооперацию (С), то TFT также счита­ет необходимым его поддержать.

Стратегия "Зуб за зуб" была хорошо известна еще в древ­ние времена. Ей соответствует "золотое правило" Конфуция и нравственные императивы многих религий. Исследования по­казывают, что в эволюционном плане именно такая стратегия оказывается наиболее эффективной, постепенно обучая соци­ум механизмам кооперации*.

Отметим, что эволюционно эффективная стратегия не обяза­тельно побеждает в каждом поединке с другими стратегиями. Бо­лее того, очевидно, что стратегия обмана, отказа от сотрудничества в каждой игре в принципе не может проиграть ни одного поедин­ка. Но и очков эта стратегия приносит немного. Особенность тур­нира состоит в том, что лучше проиграть поединок со счетом 500:600, чем выиграть со счетом 200:100 очков. В этом случае понятно, что победить в турнире может стратегия, проигравшая абсолютно все личные поединки; это произойдет, если другие стратегии, встреча­ясь между собой, наберут относительно немного очков.

Анализ хода партий показал, что обычно стороны за первые I несколько десятков ходов пытаются понять партнера, варьируя I выбор альтернатив. Затем стороны выходят на стационарное со- I стояние, т.е. выбирают один из вариантов (С;С либо D;D) и еле- I дуют ему до конца поединка. Ясно, что победителем турнира I оказывается программа, быстрее других обучающая партнеров I действовать кооперативно. Именно такой оказалась стратегия "Зуб I за зуб", несмотря на то, что многие участники турнира специ- I ально готовились к борьбе с ней. I

Аксельрод считает, что из результатов турнира следуют пра- I вила житейской мудрости: I

• не будь завистлив; I

• не обманывай первым; I

• проявляй взаимность и в сотрудничестве и в обмане; I

• не будь слишком умным. I

Отношение к социальному взаимодействию, как к игре с нуле- I

вой суммой (сколько один выиграл, столько другой проиграл) яв- I

* Это утверждение верно при условии, что вероятность повторной встречи I

партнеров близка к 1. Кроме того, должно выполняться соотношение I

R > (T+S)/2. I

278 I

ляется достаточно распространенным стереотипом. Однако в реаль­ной жизни часто встречаются ситуации, в которых следование эгои­стическим стратегиям неэффективно, что и доказывает исследова­ние модели "Дилемма заключенного" для двух партнеров. Еще более интересные ситуации возникают при участии в играх п лиц.

В июне 1983г. Д.Хофстадтер озадачил читателей журнала "Scientific American", предложив им сыграть в игру с призовым фондом 1 млн (106 ) долларов. Участники игры должны были при­слать в редакцию журнала открытку с указанием какого-либо одного числа. Победителем будет тот, кто пришлет открытку с наиболь­шим числом. Игра "Наибольшее число" имеет очень любопытное правило награждения: победитель, назвавший наибольшее число N, получает выигрыш, равный, 106 /N. Остальные же участники не получают ничего. Если победителей будет двое, то выигрыш делит­ся пополам. Таким образом, выигрыш вычисляется по следующей формуле: P/Nm, где Pпризовой фонд, Nнаибольшее названное число, т—число участников, выбравших число N.

В игре приняло участие около 1000 читателей. Почти все при­слали открытку с числом 1. Если бы так поступили все, то выиг­рыш каждого составил бы примерно 1000 долларов. Однако более предприимчивый читатель рассуждал иначе. Он считал, что боль­шинство пришлют числа 1, 2, может быть, 3 и поставил в открыт­ке число 10, рассчитывая получить 100 000 долларов, оставив остальных с носом. Но таких предприимчивых оказалось доволь­но много. Более того, 33 человека прислали число 106 , надеясь получить хотя бы 1 доллар. Однако несколько энтузиастов при­слали числа порядка 10100 , сделав выигрыш исчезающе малым.

Моделям игр с участием п лиц посвящена обширная литера­тура, в которой исследуются механизмы кооперирования, обра­зования коалиций, процессы самоорганизации [1, 3, 6, 8]. В этих моделях исследуются условия возникновения социального по­рядка в условиях, когда участники не имеют полной информа­ции о предпочтениях друг друга.

Задачи и упражнения

1. Постройте теоретико-игровые модели наиболее крупных конфлик­тов последних лет.

2. Постройте модель взаимодействия социальной системы и инди­вида.

3. Предположим, что на одном сегменте рынка действуют две кон­курирующие фирмы. Каждая фирма может выбрать одну из двух аль­тернатив: С — разработать и внедрить инновацию; D — имитировать

279

продукт, созданный другой фирмой (см. гл. 9). В данной модели пред­полагается, что имитация приносит больший доход, так как фирма не несет затрат, связанных с разработкой и внедрением инновации. Рас­смотрим игру со следующей таблицей выигрышей [9]:

Какие стратегии в этой модели являются рациональными?

4. Сформулируйте определение эволюционно эффективной страте­гии.

5. Авторы [7] присвоили имена некоторым стратегиям, разработан­ным для итеративной дилеммы заключенного: Сталина — стратегии постоянного отказа от сотрудничества, Ганди — стратегии постоянного сотрудничества, альтруизма, независимо от поведения партнера. Ка­ким стратегиям можно присвоить имена Макиавелли, Чингисхана, На­полеона, современных политиков?

6. Проверьте сплоченность своей студенческой группы с помощью игры "Наибольшее число". Как поведут себя участники, если игру по­вторить несколько раз?