欢迎来到天天文库
浏览记录
ID:54376458
大小:535.92 KB
页数:8页
时间:2020-05-01
《合作的逻辑:基于强欺骗策略的演化分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第16卷第9期管理科学学报V01.16No.92013年9月JOURNALOFMANAGEMENTSCIENCESINCHINASep.2013合作的逻辑:基于强欺骗策略的演化分析①黄璜(北京大学政府管理学院,北京100871)摘要:如何解释非亲缘关系之间的合作现象?合作演化(evolutionofcooperation)研究在多人囚徒困境博弈模型基础上提出一系列理论上的解释.作者利用”基于主体建模”方法建立了基于惩罚策略的合作演化模型.模型中有两种惩罚策略.一种是强合作策略,即合作且惩罚不合作者;另一种是强欺骗策略,即不合作且惩罚不合作者.模拟结果说明,虽然强合作策略在个体层面有利
2、合作,却可能在宏观上破坏合作秩序;强欺骗策略在微观上不利于合作,但在整体上,即使是在较大规模的社会中,可能有助于社会合作的形成,因为该策略主体在形成不稳定联盟或多个联盟时会导致出现合作与非合作并存的混合策略均衡,也即虽然不能在最优水平,却在次优水平上实现稳定的社会合作.关键词:合作演化;惩罚;强欺骗策略;不稳定联盟;大规模社会合作中图分类号:N945.12;0225文献标识码:A文章编号:1007—9807(2013)09—0001—080引言文献对该模型进行了修正-12].互惠模型在较大规模社会中的作用有限,有“囚徒困境”博弈以极其简单的逻辑证明了效地“惩罚”更具解释力,因为惩罚能
3、降低不合作个人理性与集体理性发生冲突的可能性.然而现者的净福利,从而使“不合作”成为得不偿失的选实社会中却能观察到大量合作现象.早期“亲缘择_1.“强互惠(strongreciprocity)”理论提出“强选择(kinselection)”理论认为,合作是基因延续互惠者”不仅会与其他人合作,而且愿意支付成的需要J.“互惠”理论认为,在非亲缘条件下合本来惩罚不合作者.计算机模拟实验揭示在作是为了保证在长期交往中能够实现持续的互“公共产品博弈”(多人重复“囚徒困境”博弈)实惠_2J.Axelrod的计算机模拟实验证明,“一报还验中,强互惠者在一定条件下有利于合作的演一报(titforta
4、t)”,即“互惠”,是“演化稳定策略化¨.不过“强互惠”策略不是演化稳定策略,因(evolutionstablestrategy)”u4J.直接“互惠”无法解为它同时支付合作和惩罚的成本.强互惠理论将释一次性合作,“间接互惠”理论则提出,陌生人“强互惠”动机归结于“利他性”,试图证明这种之间的合作是一条合作链,你帮助我,是因为他曾“利他性”的生理存在L】.另一些模型则将动机帮助你,或因为我会帮他;人们为维护“声誉”、归因于对自身得失的反应_1-19].在“强互惠”理“地位”而与陌生人合作.也有人指出,合作是论基础上提出了“文化与基因共演化(cultureand一种用于表明自己质量和动
5、机的高成本信号_6j.geneCO-evolution)”理论、“双继承(dualin.Nowak等的模拟实验证明,当个体数量较少时heritance)”理论等,从社群差异与竞争的角度可以通过“间接互惠”实现合作均衡.其后一系列解释“大规模社会”中的合作演化[2。].①收稿日期:2011一O6—20;修订日期:2013—03—03.基金项目:国家社会科学基金资助项目(09CZZO09).作者简介:黄璜(1978一),男,江苏南通人,博士,副教授.Email:huanghuang@pku.edu.cn——,)——管理科学学报惩罚本身也面临合作困境,那些没有承担惩表1基于“惩罚”的策略选
6、择矩阵Table.1Thestrategyselectionmatrixbasedofpunishment罚成本的人搭了便车.这便涉及又一轮“惩罚”与合作欺骗“合作”,这样便形成循环:在每次“循环”中,个体惩罚强合作强欺骗都需要选择新策略,而每次选择意味着又有新策略的出现.虽然研究证明,这种多次循环有利于维惩罚刺合作弱欺骗持合作稳定,不过实证研究并不支持.此外“奖赏”在合作中的作用曾被认为逊色于“惩1合作演化的模型罚”【,但近来也有不同观点.“奖赏”实质j是一种“瓦惠”,有鉴别的奖赏即为惩罚.有实假设存在完全封闭的“社会一空间系统”,包验证明,为保证互惠,人们会增强在公共产品合作含若
7、干个体和环境.个体共同生产某种公共资源,中的投入以保持声誉’.收益在所有个体间均分.个体可参加(合作)或不合作演化研究已在国内学界引起关注.参加(不合作)生产.假设个体数量为Ⅳ(~≥2),若卜模型证明个体问关系不对称性或合作者网络其中合作者为n.生产中个人投入成本c(常数),有助于维持合作关系的稳定.基于演化博弈收益为F().公共资源供给模型为建立的收益和惩罚共享博弈模型对群体工作中合L=1一(1一PC)(1)作行为进行多智能体模拟研究.此外有学者提其中P
此文档下载收益归作者所有