《课数学建模博弈模型》PPT课件

《课数学建模博弈模型》PPT课件

ID:36922473

大小:735.10 KB

页数:132页

时间:2019-05-11

《课数学建模博弈模型》PPT课件_第1页
《课数学建模博弈模型》PPT课件_第2页
《课数学建模博弈模型》PPT课件_第3页
《课数学建模博弈模型》PPT课件_第4页
《课数学建模博弈模型》PPT课件_第5页
资源描述:

《《课数学建模博弈模型》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、博弈模型第一部分、博弈论基本概念宇宙间处处存在矛盾、冲突、争斗、合作、共生等现象,这些现象很很早就引起各类学者的重视。数学被认为是科学的语言,能否用数学语言描述各种带有矛盾因素的模型或现象?博弈论便是这样一种处理各类带有矛盾因素的模型的数学工具,现在已被数学、经济学、社会学、军事学、生物学等专家广泛应用于讨论各类带有冲突、矛盾、合作、竞争、进化等问题及相关模型之中。博弈论已成为人们分析复杂系统与作重大决策时的有力工具。一、引言数学研究的方法是从大量的同类现象中抽象出基本要素,进步构造出能描述这类现象的模型。许多冲突模型在游戏中就存在,博弈论早期就是由研究国际象棋

2、开始的,所以被命名为GameTheory。人们很快认识到此种理论可用于经济、政治、军事等领域,所谓“世事纷争一棋局”,正说明其中一些道理。1944年冯·诺曼(John,VonNeumann)和奥·摩根斯特恩(OskerMor-gentern)合著的《竞赛论与经济行为》(TheoryOfGSmesandEconomicBehavior)问世,总结了初期研究成果,奠定了博弈论的基础。由于该理论主要讨论在复杂的矛盾冲突等活动中,局中人(Player)采取何种合理的策略(strategy)而能处于“优越”的地位,以便取得较好效益,所以将它译为博弈论。博弈论(Gameth

3、eory)可以被定义为是对智能的理性决策者之间冲突与合作的数学模型的研究。博弈论为分析那些涉及两个或更多个参与者且其决策会影响相互间的福利的局势提供了一般的数学方法。就此而论,博弈论便为社会科学各分支的学者和实际的决策者提供了非常重要的视角。博奕理论家所研究的局势,不仅仅是“游戏(Game)”一词所不幸表示的消遣活动,“冲突分析”或“相互影响的决策理论”或许是描述博弈论更为准确的术语。常见的游戏如棋类,两人对奕,此两人便称为局中人,他们各有一套棋路,或善于用马,或长于用炮。在每次轮到一方走子时,他可能有许多走法,这些走法依赖于当时棋局形势以及棋手想要达到的目的,

4、以及他惯用的走法,从而形成他走棋的指导思想。对奕时指导棋手行动的思想便称为策略。对局终了可能有三种结局:甲胜;乙胜;和局。如果用数量表示各种结局,例如胜家赢得彩金若干(设所得彩金由输家付给,则输家当然失去若干),和局时都不能取得彩金,此种表示结局的数称为支付(payoff)。局中人、策略、支付是博弈论中常见的基本概念。有些游戏中并无“机会”(chance)因素,而是全凭局中人的技艺。但某些游戏如“桥牌”、“打百分”等,“机会”却有较大作用,分发到游戏者手中的牌是随机的,它们情况要复杂一些。游戏并非只有双方,可以有多方,如三人玩的跳棋便有三个局中人。一般只有两个局

5、中人的称为两人博奕(或二人对策),有二个局中人的称为n人博弈。在博弈论的语言中,一个博弈(game)指的是涉及到两个或更多个参与人的某个社会局势。博弈所涉及的参与人被称为局中人(players)。正如前面博弈论的定义所述,博弈理论家一般要对局中人做两个基本的假设:他们都是理性的和他们都是智能的。这两个形容词在这里都是技术性术语,所以需要对其逐一解释。如果一个决策者在追逐其目标时能前后一致地做决策,我们就称他是理性的(rational)。在基于决策理论的基本结论而建立起来的博弈论中,我们假设每个局中人的目标是追求其个人期望支付值的最大化,支付则是用某个效用(Uti

6、lity)尺度来度量的。理性决策者应该按使自己的期望支付最大化的方式去做决策的思想,至少可以追溯到伯努里(Bernoull,1738),但这个思想在近代被辨明为是正当的,则应归功于冯·诺依曼和摩根斯特恩(1947)。借助关于理性决策者应该如何行动方面所做的一些非常弱的假设,他们证明了,对任一理性的决策者,一定存在某种方式对他所关心的各种可能结果赋予效用数值,使其总是选择最大化自己的期望效用。我们称这一结论为期望效用最大化定理(expected-utilitymaximizationtheorem)。二、博弈论概述1、博弈论几个经典的例子2、博弈论的基本概念3、博

7、弈论与经济学1、博弈论几个经典的例子两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一个人招认犯罪,否则警方无充分证据将他们按罪判刑。警方把他们关入不同的牢室,并对他们说明不同行动带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱1个月;如果双方都坦白,根据案情两人将被判入狱6个月;如果一个招工而另一个拒不坦白,招认者因有主动认罪立功表现将立即释放,而另一人将被判入狱9个月(所犯罪行判6个月,干扰司法加判3个月)。例一囚徒困境囚徒困境问题可以用图1-1所示的双变量矩阵的形式来描述。在此博弈中,每个囚徒有两种战略可供选择:坦白(

8、或招认)、不坦白(或沉默

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。