欢迎来到天天文库
浏览记录
ID:42206134
大小:138.15 KB
页数:8页
时间:2019-09-10
《“石头剪刀布制胜策略”的研究,是浪费钱吗?》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、u石头剪刀布制胜策略”的研究,是浪费钱吗?Ent发表于2014-05-06昨天,一篇来自浙江大学、浙江工商人学和中科院理论物理研究所的论文公布在了预印木网站上。根据媒体的宣传,研究者“找到了石头剪刀布的制胜策略”。口然而然地,很多网友的反应是:“这还需耍你研究?”中国科学家通过实驹发现石头剪刀布的制曲策略「盍环刃罠於评论量新评论卸彌人帕与1评论21273条
2、区服网中国冋友:手机用户发衰曰期:2014/05/031612©分国获合发的¥顾干这名堂掩理【心“】1凹蔓1»J十民眼网中国网妄:手机用户发養曰默:2014/08AX316
3、12妙}中囘的科学家原来只会研究这个。国之悲哀!笊荐[9154]
4、回夏
5、爲制凤限冋北时舷,于机用户发衰曰期:2014/05/53!€:!31£齐中匡J科学家研究这巴暖话!怪不心瘠若推禄【5191】
6、回理1變制凤凰冈北空布网友:手讥用户岌衣曰期:2014/05/031<>12科学靈闱的玉疼。雄禅[457$]1
7、農觀【网友评论截图。图片來源:凤凰网】但是只需扫一眼就会发现,研究者不幸又被标题党坑了。他们寻找的不是怎样玩赢剪了包袱锤,而是通过人们在剪了包袱锤里的行为来判断哪一种理论更能预测人类——是传统博弈论的纳什均衡,还是演化博
8、弈论。因此,我打算从我熟悉的演化博弈论角度來越俎代庖,尝试解读这项研究为什么不是在浪费钱。为了帮助理解它,我会讲四个故事。这四个故事从易到难,如果你匕经对这个领域很熟悉了,可以跳过前面的几个故事。第一个故事:囚徒困境…个有钱人被发现死于家中。警方抓获了两个犯罪嫌疑人并査获了赃物,但两人辩称说他们只是小偷,进屋时那个人已经死了。没有更多证据,调查陷入僵局。于是警方把两人分开,分别对他们说:如果你俩都不认罪,我只能判你盗窃,一年了事;如果你招了他没招,你算作立功,不用坐牢,而他得十五年。如果如果他招了你没招,那反过来。但如果他和你
9、都认了,谋杀罪每人十年。嫌疑人X心想:如果丫不招,那么我也不招的话会判一年,我招了无罪释放。招了更划算。而如果Y招了,那我不招的话十五年,招了只有十年。还是招了更划算。显然我应该招啊。而嫌疑人丫当然也是这么想的。结果,两人都判了I年。任何一人改策略都只会让自己处境更糟,这便是一个纳什均衡。可是,如果从整体上看,最好的结果显然是两人都不招,各判一年。双方都是理性考虑谋求自己的最大利益,结果却是两人都遭遇了坏场景;无论是整体授好场景(各判一年)还是个人最好场景(直接禅放)都不可能发生。这就是为何囚徒困境是个“困境”。每个人都很精明
10、,最后怎么弄了这么个烂摊子?prisonerB境招供(背叛沉默(合作)<」euosud年•,丄X—【囚徒困境示意图(或者,“收益矩阵”)。图片来源:EncyclopaediaBritannica]按照囚徒困境术语,不招的行为算作“合作”(和你的狱友合作,不是和警方合作),而招认的行为算作“背叛”。双方都合作最好,双方都背叛则两败俱伤。按照这个故事,合作根本不可能出现啊。现实屮类似囚徒困境的场呆帘常出现。但是,更多的结局似乎是合作,而不是背叛。为什么?可能的原因是,困境不止这一次。第二个故事:重复囚徒博弈如果嫌疑人X和Y是陌生人
11、,那么两人的下场都是十年。但是他们也许是两肋插刀的好哥们,或者冇血亲,或者属于同一个纽织一一总而言Z,用博弈论的术语,他们以前也许打过交道,将來还很可能继续打交道。这时,“合作”就不是什么难以想彖的事情了吧。因此,•位名叫罗们特•阿克斯罗徳的政治学家在上世纪80年代初做了•个名垂青史的实验。他在计算机里摆了一场锦标赛,有很多名虚拟的参赛选手,双方捉对嘶杀——哦不,是捉对进行重复仄1徒博弈。按照博弈的结果记分,你背叛他合作,则你得5分他得0分,双方都合作各得3分,双方都背叛各得1分。然后,他向全世界征集策略,每一个得到的策略变成
12、一个参赛选手。提交的策略共有14个,來自经济学、社会学、政治学和数学等等领域,再加上一个“完全随机”的对照策略,共15“人”进行比赛。这里面有些策略极其复杂极其精妙,比如有-个策略用马尔科夫过程为对方的行为建立模型,然后用贝叶斯推断最好的选择。但是,最后得分最高的竞然是所有提交策略里最简单的一个——“-•报还一报”(TFT,titfortat)o这个策略一共只有两条规则:(1)第一步先合作,(2)从第二步开始,对方上一轮出的是什么,我就出什么。提交这个策略的是维也纳的安纳托•拉们波特,他写这个策略只用了4行BASIC代码。阿克
13、斯罗徳发表了锦标赛的分析结果,并邀请人家吸取经验教训提交新一轮策略——这次他获得了62个策略,不但冇上面提到的领域,还包括了演化生物学、物理学和计算科学等新学科。只有一个人厚颜无耻地原样提交了上次的卫冕冠军,那就是拉伯波特本人。你猜对了。他又一次获得了胜利。TFT这个“报仇者
此文档下载收益归作者所有