欢迎来到天天文库
浏览记录
ID:21762257
大小:626.00 KB
页数:72页
时间:2018-10-20
《第3节 博弈论与决策管理》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、博弈论与决策斯大林时代的苏联,一个乐队指挥坐火车时看乐谱,两个克格勃军官以为是密码,就将他抓了起来,他说那是柴可夫斯基的乐谱,但无无济于事。第二天,克格勃告诉他,已把他的同伙柴可夫斯基也抓起来了,正在招供。他们俩面临一种艰难的选择:如一方招供另一方不招,坦白者从宽判1年,抗拒者从严判25年;如果双方都招供,则各以间谍罪判10年;如双方均不招供,克格勃无法定罪,各自坐牢3年。他们分别关押,请问应该招、还是不招?招还是不招?这是个问题可能的思想斗争:坦白的原因1、可能会被判的很轻2、最坏的结果-10,-1,比-25,-3要好抵赖的原因1、我没犯罪,不愿意招2、双方抵赖各-
2、3,比双方坦白各-10好3、人云:坦白从宽牢底坐穿,抗拒从严回家过年1、博弈论简介博弈论(GameTheory)又名对策论,游戏论失火了,屋里人很多,你往哪个门跑—这就是博弈你的行动结果不仅取决于你的策略选择,同时也取决于他人的策略选择。它研究个体或组织之间存在利益冲突情况下如何进行最优决策。博弈论是40年代数学家冯·诺依曼和经济学家奥斯卡·摩根斯坦首先提出的。在经济学政治学、社会学获得了巨大的应用。1994年诺贝尔经济学奖颁发给了3位博弈论专家:纳什、泽尔腾、哈桑尼。博弈论是关于社会,而不是关于自然的。中国人研究博弈论是有优势的《三国演义》、《孙子兵法》、《三十
3、六计》、《厚黑学》都是博弈论教材,如何在人与人的博弈中取得成功。1994年诺贝尔经济学奖获得者:美国数学家JohnF.Nash;德国经济学家ReinhardSelten;美籍匈牙利经济学家JohnC.Harsanyi。1928年Nash出生于美国,1950年获Princeton大学数学博士学位,曾先后任教于MIT和Princeton大学。其博士论文《非合作博弈》首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的纳什均衡概念。2002年《美丽心灵》共获得最佳影片、最佳导演、最佳改编剧本和最佳女配角4项奥斯卡奖。1930年Selten出生于现属于波兰的德国城市,196
4、1年获法兰克福大学数学博士学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。Selten的主要贡献是首次对分析动态策略交互作用深化了Nash均衡的概念。1920年Harsanyi出生于匈牙利,1947年获布达佩斯大学博士学位,后逃亡澳大利亚,再到美国,1954年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于2000年去世。Harsanyi研究和分析了不完全信息博弈,从而为信息经济学提供了一个理论基础。1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)获诺贝尔经济学奖。2001
5、年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为该年度的诺贝尔经济学奖得主。2005年诺贝尔经济学奖授予罗伯特·奥曼和托马斯·谢林,以表彰他们“运用博弈论的分析方法对现实的政治、经济问题进行分析,改变了我们对冲突与合作的理解”。博弈的规则或研究框架(1)博弈参与者(player),博弈论分析假定参与者都是理性的(追求个人利益最大化)。(2)策略空间,博弈参与者必须知道他自己及其对手的策略(strategy)或行动选择范围。(3)决策行为结果。博弈论用数字表示这类结果(可评价优劣
6、高下),并称之为收益(payoff、支付)。博弈的分类一、静态博弈与动态博弈参与者行动的先后顺序,静态博弈是同时作出决策(不了解对手的决策方案),动态博弈是参与者先后作出决策(后行动的人知道先行动者的行动方案)。二、完全信息博弈与不完全信息博弈对其他参与者收益支付信息的掌握程度。不完全信息博弈中至少有一人不能确切了解其它决策者收益函数。三、合作博弈与非合作博弈能否达成一个有约束力的协议,合作博弈强调集体理性。(经济学主要讨论非合作博弈)四、一次性博弈与重复博弈博弈重复多次进行。(注意区分动态博弈)严格地讲,博弈论并不是经济学的一个分支,它是一种方法,应用范围除经济学外
7、,还包括政治学、军事学、外交学、国际关系学、犯罪学等。但为何博弈论受到经济学的重视呢?主要原因有:⑴博弈论在经济学中得到最广泛、最成功的应用,尤其在寡头市场理论中得到直接的应用。⑵博弈论的许多成果也是借助于经济学的例子来发展的,经济学家对博弈论的贡献最大。⑶博弈论与经济学的研究模式一样:理性人在给定约束条件追求自己的效用最大化。由于上述原因博弈论逐渐成为主流经济学最重要的组成部分。2、博弈论基本模型囚徒困境(完全信息静态博弈)(A、B共同犯罪被抓,警察分开审问)BA坦白不坦白A=10年A=25年B=10年B=1年A=1年A=3年B=25年B=3年坦白
此文档下载收益归作者所有