最新10非零和博弈报告课件PPT.ppt

最新10非零和博弈报告课件PPT.ppt

ID:62256748

大小:403.00 KB

页数:37页

时间:2021-04-23

最新10非零和博弈报告课件PPT.ppt_第1页
最新10非零和博弈报告课件PPT.ppt_第2页
最新10非零和博弈报告课件PPT.ppt_第3页
最新10非零和博弈报告课件PPT.ppt_第4页
最新10非零和博弈报告课件PPT.ppt_第5页
资源描述:

《最新10非零和博弈报告课件PPT.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、进入夏天,少不了一个热字当头,电扇空调陆续登场,每逢此时,总会想起那一把蒲扇。蒲扇,是记忆中的农村,夏季经常用的一件物品。  记忆中的故乡,每逢进入夏天,集市上最常见的便是蒲扇、凉席,不论男女老少,个个手持一把,忽闪忽闪个不停,嘴里叨叨着“怎么这么热”,于是三五成群,聚在大树下,或站着,或随即坐在石头上,手持那把扇子,边唠嗑边乘凉。孩子们却在周围跑跑跳跳,热得满头大汗,不时听到“强子,别跑了,快来我给你扇扇”。孩子们才不听这一套,跑个没完,直到累气喘吁吁,这才一跑一踮地围过了,这时母亲总是,好似生气的样子,边扇边

2、训,“你看热的,跑什么?”此时这把蒲扇,是那么凉快,那么的温馨幸福,有母亲的味道!  蒲扇是中国传统工艺品,在我国已有三千年多年的历史。取材于棕榈树,制作简单,方便携带,且蒲扇的表面光滑,因而,古人常会在上面作画。古有棕扇、葵扇、蒲扇、蕉扇诸名,实即今日的蒲扇,江浙称之为芭蕉扇。六七十年代,人们最常用的就是这种,似圆非圆,轻巧又便宜的蒲扇。  蒲扇流传至今,我的记忆中,它跨越了半个世纪,也走过了我们的半个人生的轨迹,携带着特有的念想,一年年,一天天,流向长长的时间隧道,袅10非零和博弈报告概要非零和博弈的矩阵形式

3、及其基本概念严格控制及其应用博弈平衡的定义关键结果:任何有限博弈都存在平衡合作与非合作之间的区别连续性博弈及相应方法复习:零和博弈的矩阵形式m11m12m21m22mij=A玩家的回报,如果A玩家遵循纯策略i,并且B玩家遵循纯策略j。示例的作用虽然简单,但此例子可模拟很多不同的实际情况,在这些场合中参与者获得类似的奖励。合作:俩人做同一个项目。每个人可选择努力工作或休息。如果A勤奋工作后就宁肯去休息了,但俩人工作要比俩人休息有一个好的结局。双巨头:两家公司竞争生产同一产品,并且都想使利润最大化。他们能制定两种价格

4、,高价与低价。如果两公司都选择高价,则他们都实现利润1000块。如果他们都选低价,则他们都实现薄利600块。否则,高价公司盈利1200块,而低价公司损失200块。军备竞赛、机器人探测、公共财产使用、……非零和博弈的矩阵形式供罪不供罪供罪-5,-50,-10不供罪-10,0-1,-1BA这不是零和博弈。玩家的收益(回报)不再是相反的了。假设俩玩家都是理性的,每位玩家遵循的最佳策略是什么?控制性策略供罪不供罪供罪-5,-50,-10不供罪-10,0-1,-1BA不管B选怎样的策略,A供罪的回报比不供罪的大。A不需要考

5、虑不供罪,因为这不可能带来更高的回报。控制性策略供罪不供罪供罪-5,-50,-10不供罪-10,0-1,-1BA对B也是同样道理:不管A选怎样的策略,B供罪的回报比不供罪的大。B不需要考虑不供罪,因为这不可能带来更高的回报。控制性策略供罪不供罪供罪-5,-50,-10不供罪-10,0-1,-1BA一个策略是严格控制性(占优)的,是指在应对对手每步可能的行动上,该策略比任何其它策略产生的回报都高。关键结果:如果俩玩家都有严格控制性的策略,则他们为对弈提供了一个解,即预测对弈的结局。一种控制性策略的平衡。供罪是A的一

6、个严格控制性策略供罪是B的一个严格控制性策略因此,(供罪,供罪)是解。IIIIIIIVI3,04,15,95,6II5,35,89,79,0III3,38,46,36,3IV2,83,12,34,5迭代消去受控策略更一般性结论:能安全地消去任何严格受控策略。即,绝不会选这样的策略为博弈的一个解,因为在应对对手的每步可能的行动上,该策略比任何其它现存策略产生的回报都低。迭代消去受控策略是简化与求解博弈过程的第一步。此方法充分吗?IBIIBIIIBIA-1,66,-15,4IIA6,-1-1,65,4IIIA4,54

7、,57,7控制性策略怎样玩此博弈?在此场合,不能保证俩人,甚至一人有一个控制性策略。仍能用迭代消去法来简化博弈:消去严格受控策略,因为决不能选它们作为解。然而,需要更一般方法来寻找博弈的解,即预测有理性的人怎样博弈。需要一个定义来推广零和博弈的定义。IBIIBIIIBIA-1,66,-15,4IIA6,-1-1,65,4IIIA4,54,57,7怎样玩此博弈?对于A的任何策略X,uA(IIIA,IIIB)uA(X,IIIB)对于B的任何策略Y,uB(IIIA,IIIB)uB(IIIA,Y)(IIIA,IIIB

8、)是一种平衡,因为:在B采用IIIB策略下,A不能找到一个比IIIA更好的策略了。同样,在A采用IIIA策略时,B也不能找到比IIIB一个更好的策略。俩玩家以上能直接将俩人的形式扩展到更多人。如有n个玩家,则需要定义n个回报函数ui,i=1,…,n。回报函数ui把一个n元组策略转换为玩家i的相应回报。ui(s1,…,sn)=玩家i的回报,如果玩家1,…,n采用纯策略s1,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。