对“博弈论”的浅思考

对“博弈论”的浅思考

ID:26073647

大小:46.00 KB

页数:6页

时间:2018-11-24

对“博弈论”的浅思考_第1页
对“博弈论”的浅思考_第2页
对“博弈论”的浅思考_第3页
对“博弈论”的浅思考_第4页
对“博弈论”的浅思考_第5页
资源描述:

《对“博弈论”的浅思考》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、对“博弈论”的浅思考当今社会是一个激烈竞争的社会,是一个各方利益明争暗斗和各方势力此消彼长的社会。面对错综复杂的社会关系和日益功利的社会环境,如何在不对等情况和不公平背景下以弱制强,以少胜多是我们必须深思的问题。那么,如何在面对各种对自己不利的博弈中胜出呢?我想多少了解一点博弈论对自己是有好处的。博弈是智慧的较量,互为攻守却又相互制约。有人的地方就有竞争,有竞争的地方就有博弈。人生充满博弈,若想在现代社会做一个有成就,就必须懂得博弈的运用。在博弈论中,有以下几种博弈:囚徒困境(引申出来的有“旅行者困境”)、纳什均衡、智

2、猪博弈、猎鹿博弈、酒吧博弈、枪手博弈、警察与小偷博弈、斗鸡博弈、协和博弈、海盗分金博弈、讨价还价博弈和路径依赖博弈等。如果我们可以将博弈论的原理和规则运用到自己的人生实践中,那么面对问题并可作出理性选择,一定程度上避免盲目行动。“博弈论”属于应用数学的一个分支,那么它最完美的表示方式自然是数学符号。下面给出“纳什均衡”定义的数学表达式:在博弈G={S1,…,Sn:u1,…,un}中,如果由各个博弈方的各个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*

3、i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个“纳什均衡”。解释一下其中符号的表示意义:i、j表示参与人,si*表示参与人i的某个策略,Si表示参与人i所有可能的策略集合,s表示某一次特定的博弈,u表示参与人的收益,ui(si*,…,sn*)表示参与人i的收益,其收益由所有参与人的策略组合决定,s*-i表示除了i外其他参与人的策略。从

4、这一点可以看出,数学表达式的意义非同寻常。纳什均衡常用来研究非合作博弈中的均衡,因此也叫做非合作博弈均衡。根据“纳什均衡”我们知道,在一次博弈中并不只有一个均衡,可能出现多个均衡但有好坏之分。这样就有了严格优势策略(在某次博弈中,如果参与人i选择某个策略si*时,无论参与人j怎么选择策略sj*,他的收益总是比对方多,那么si*是严格由于sj*的)和严格劣势策略之分,我们在做选择时就是绝对不选择严格劣势策略。举一个简单例子,高中同学聚会,如果你和自己班的某一个同学正在谈恋爱,那么同学聚会必然会引起一场博弈。为了对这次博弈

5、达到抽象化目的,我们姑且除去道德因素吧。下面给出这个博弈的具体收益:在同学聚会上,恋爱双方如果都是本班同学,那么成为“热点人物”或者“公众人物”的可能性很大,基本上会成为同学的“调侃对象”,如果在这里我们假定其他同学这么做会使双方利益受损,那么恋爱双方会有以下选择:去或者不去!假定双方原来的感情为(1,1)如果双方都不去,可以免于被“调侃“,但双方都会因为不能和同学聚会而感到不快,这样双方获得的收益为(0,0);如果一方选择去,另一方选择不去,去的一方不仅可以免于被调侃,而且还能增进同学友谊,那么去的一方收益为3,而不

6、去的一方也免于被调侃,同时又会因为对方高兴而满意度增加,但却因为不能见到老同学而闷闷不乐,因此收益为2;如果双方都选择去这样都与同学聚了,但是却会遭遇调侃,这样双方得失相抵,收益为1.这样我们得到了以下矩阵图:女方去不去男方去(1,1)(3,2)不去(2,3)(0,0)我们看到对于双方而言存在两个“纳什均衡”(1,1)和(0,0),但显然理性人在追求自己个人利益最大化时,不考虑其他因素。在四种策略组合中,显然双方都选择去对自己最有利。无论男女,选择去获得的平均收益为2,;选择不去获得的平均收益为1,这样选择去对于双方都

7、是严格优势策略,如果双方不进行沟通或者没有意外,双方都会不约而同的选择去。这种情况与现实生活不谋而合,显然在这场博弈中没有人会做出让步。那么现在说一下“囚徒困境”:在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只

8、有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的矩阵。囚徒困境博弈B坦白抵赖A坦白(8,8)(0,10)抵赖(10,0)(1,1)对A来

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。