博弈策略的生活解

博弈策略的生活解

ID:42007530

大小:235.00 KB

页数:49页

时间:2019-09-06

博弈策略的生活解_第1页
博弈策略的生活解_第2页
博弈策略的生活解_第3页
博弈策略的生活解_第4页
博弈策略的生活解_第5页
资源描述:

《博弈策略的生活解》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、博弈策略的生活解读主讲人:黄春建电话:18639715222走近博弈论对于许多非数学专业和经济学专业人士来说,博弈论应该是一个极为陌生的概念。但在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具之一。博弈之道是古已有之,但博弈思想的系统化、数学化却是近几十年发展起来的。正是因为博弈科学是一门新学科,我国管理界、经济界对博弈论与信息经济学的研究还是停留在引进介绍层面上,他们发表的成果大多是堆砌庞杂的数学算法与令人眩目的数学模型。我们学习博弈的目的就是通过博弈相关知识及著名的博弈案例,诸如囚徒困境、智猪博弈、斗鸡博弈等等,研究人们如何进行决策,以及这种决策如何达

2、到均衡的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。这门课在一定程度上,是为了提高在校大学生感性认识和理性认识的融合,明白做人做事的道理,掌握分析和处理一些事情的方法和技巧。一、博弈基础知识博弈的定义:一些个人、团队或其他组织,面对一定的环境条件、在一定的规则约束下,依靠所掌握的信息,同时或先或后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈的构成要素:1、博弈要有2个或2个

3、以上的参与者(Player)。2、博弈要有参与各方争夺的资源或收益(Resources或Payoff)。3、参与者有自己能够选择的策略(Strategy)。4、参与者拥有一定量的信息(Information)。博弈的分类:1、分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。2、分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零。常和博弈则是指所有博弈方的得益总和等于非零的常数。变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。3、分为静态博弈与动态博弈。

4、所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。4、分为完全信息博弈与不完全信息博弈。纳什均衡定义:在给定别人最优的情况下,自己最优选择达成的均衡。假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(StrategyProfile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双

5、方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。二、囚徒困境两个共同偷窃的犯罪嫌疑人甲和乙被带进警察局。警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察同伴的选择。警方怀疑他们作案,但手中并没有掌握确凿证据,于是明确地分别告知两名犯罪嫌疑人:对他们犯罪事实的认定及相应的量刑完全取决于他们自己的供认。如果其中一方坦白,而另一方抵赖,供认方将不受惩罚,无罪释放,另一方会被重判10年;如果双方都供认,各被判5年;而如果双方均不认罪,因为警方找不到其他证据,

6、则无罪释放。乙抵赖乙供认甲抵赖二人无罪释放甲判10年,乙无罪释放甲供认甲无罪释放,乙判10年甲乙各判5年体现囚徒困境基本精神——背叛形成囚徒困境的机制——担心自己成为傻瓜(处于囚徒困境时,两害相权取其轻)启示:囚徒困境这个模型,几乎是博弈论的代名词。两个基于“坦白从宽,抗拒从严”审讯的囚徒,从理性的角度出发,会产生怎样的结局?结果却是,从个人理性并追求个人利益最大化,那么二人皆坦白,也就是背叛。这在四种策略中并不占优,那为什么不采用集体最优策略而合作呢?很简单的集体优化,必然侵害个人利益的最大化。当然这一切前提是理性假设,也就是著名的经济人假设:经济学中的人都是“小人”(管理

7、学则认为人是“君子”)。破解这一困境的途径则是打破信息孤立,而执法者的反制则是维持孤立或者加强威胁。无论背叛还是合作,谁在这里面坚持到最后,谁将取胜。三、重复博弈—合作的开始重复博弈是一种特殊的博弈,在博弈中,同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”(stagegames)。在每个阶段博弈中,参与人可能同时行动,也可能不同时行动。因为其他参与人过去的行动的历史是可以观测的,因此在重复博弈中,每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。对未来的预期是影响我们行为的重

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。