Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】

ID：474825

大小：25.50 KB

页数：4页

时间：2017-08-08

Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】_第1页

Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】_第2页

Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】_第3页

Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】_第4页

资源描述：

《Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、毕业论文文献综述理论物理Prisoner'sDilemma演化博弈中的自适应行为摘要：本文简要简绍了博弈理论、演化博弈理论以及复杂网络的基本概念和发展过程，介绍了囚徒困境模型以及此模型的研究进展和近年来的研究状况。最后提出了本人的研究方向。关键词：“囚徒困境”、复杂网络、演化博弈、自适应博弈论是指个人或组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自选择的行为或是策略进行选择并加以实施，并各自取得相应结果或收益的过程。现代博弈理论起源于数学家冯·诺依曼和经济学家摩根斯坦的合著《博弈理论和经济行为》，此著作奠定了现代博弈理论的基础，并且形成了理论体系。此后经过了许

2、多科学家的共同努力，尤其是纳什提出并证明了纳什均衡的存在，目前，博弈理论已经形成比较完善的理论体系，成为一门横跨各个领域的交叉科学，是非常重要的分析工具。近几十年来，许多研究博弈理论的科学家，如Nash、Selten、HarSanyi、Aumann、Schelling等都先后被授予了诺贝尔经济学奖，由此可见博弈理论已经受到了越来越多的重视，也得到了广泛的承认。经典博弈理论跟演化博弈理论博弈论有以下一些主要的要素：（1）局中人（players）：就是指那些参与博弈的个体。（2）策略（strategies）：再每一局博弈中，每个局中人都可以有不同的选择，所有的这些选择就成为策略。（3）收

3、益（payoffs）：每个局中人做出一定的选择后，在每局博弈结束后，都会有一个结果，这个结果就称为收益。（4）顺序（orders）：每个局中人并不是同时做出决定，而且在一局博弈中可能不止做出一个决定，因此就出现了顺序问题，顺序不同，博弈的结果也就不同。经典博弈论有两个重要特征：一是参与博弈的个体是完全理性的，二是参与博弈个体间的目标或利益是相互冲突的。经典博弈论就是想表明：在所有参与博弈的博弈个体都想获胜或者希望收益最大化的情况下，博弈个体可以通过借助博弈理论分析计算后找到一种最好的方法。但是，在现实世界里，所有个体都完全理性是做不到的，并且，个体做决定时还要受其它很多因素的影响，比

4、如亲情、遗传、以后的发展等等。一般的演化博弈理论是把随着时间变化的某一种群作为研究对象的，把试图理解种群演化的动态过程，并解释为何这一种群会达到这一状态以及是如何达到的作为研究探索的目的。影响群体变化的因素是多方面的，既包括一些随机的，突变产生的因素，又包括通过演化过程中的选择机制而呈现出来的规律的因素。大部分演化博弈理论的预测力在于具有一定惯性的群体选择过程，但是同时，这个过程也应该具有突变的动力，这样才能不断更新种族特征。“囚徒困境”模型的研究进展（1）囚徒困境模型囚徒困境的原始模型是两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是非常困难的。具

5、体的“囚徒困境”模型说的是，两个犯罪嫌疑人甲和乙作案后被抓后，分别被警察关在不同的屋子里审讯。警察告诫他们:如果他们两个人都认罪，各判3年;如果两个人都保持沉默，各判1年(可能是由于证据不足);如果其中一个认罪另一个沉默，认罪的放出去，不认罪的判刑5年。甲沉默甲认罪乙沉默二人同服刑1年乙服刑5年，甲即时获释乙认罪甲服刑5年，乙即时获释二人同服刑3年上述表格给出了“囚徒困境”博弈矩阵。这里，每个囚徒有两种策略:沉默或认罪。在这个模型中，如果甲沉默，那么乙认罪比沉默所获的罪刑少；如果甲认罪，那么乙还是认罪获刑比沉默获刑较少。也就是说无论甲做出什么样的选择，对于乙来说他的最优策略是认罪。同

6、样的，对于甲来说他的最优策略也是认罪。也就是说在这个“囚徒困境”博弈中，双方都认罪是纳什均衡。从“囚徒困境”博弈中我们很容易发现，如果两个人都沉默，各判一年，比两个人都认罪，各判3年好。但是由于他们都从自身的利益处分，所以并没有选择对双方都有利的策略。所以，“囚徒困境”模型反映了个体理性与集体理性的矛盾。（2）网络结构在一个系统中，或者在多人参与的演化博弈中，个体间总是相互作用的。那怎样描述个体间的相互关系呢？网络成为描述博弈个体间相互作用的做好方法。就博弈论而言，局中人就可以抽象表示为网络中的节点；而局中人之间的相互关系便可以抽象为网络的边。我们通常只考虑节点之间有没有相连，忽略边

7、的长度以及节点间的相互位置。我们把网络这种不依赖于节点的具体位置和边的其体形态就能表现出来的性质叫做网络的拓扑性质，相应的结构叫做网络的拓扑结构。（3）规则格子对于“囚徒困境”模型的空间博弈的影响Nowak和May率先研究了扩展的囚徒困境博弈模型，他们将参与局中人置于二维方格上，每个局中人与直接相邻的4个最近邻进行博弈，并且累计收益，然后开始更新策略。更新规则是：一个局中人与它的最近邻比较本轮的收益，并将收益最高者的策略作为下一轮博弈的策略，直到网络演化到

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】

Prisoner's Dilemma 演化博弈中的自适应行为【文献综述】

相关文章

相关标签