数学论文--几个常见理性双矩阵经济博弈的期望均衡分析

数学论文--几个常见理性双矩阵经济博弈的期望均衡分析

ID:35588716

大小:408.50 KB

页数:9页

时间:2019-03-30

数学论文--几个常见理性双矩阵经济博弈的期望均衡分析_第1页
数学论文--几个常见理性双矩阵经济博弈的期望均衡分析_第2页
数学论文--几个常见理性双矩阵经济博弈的期望均衡分析_第3页
数学论文--几个常见理性双矩阵经济博弈的期望均衡分析_第4页
数学论文--几个常见理性双矩阵经济博弈的期望均衡分析_第5页
资源描述:

《数学论文--几个常见理性双矩阵经济博弈的期望均衡分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、几个常见理性双矩阵经济博弈的期望均衡分析摘要:关于完全信息静态博弈,有纯Nash均衡,混合Nash均衡和相关均衡等概念。如果每个局中人除了博弈的结构以外其他一无所知是全体局中人的共同知识(称为完全静态的),那么期望均衡是在极大熵准则是全体局中人的共同知识的条件下的一种均衡。本文首先介绍理性对策及其期望均衡的概念,然后由此分析了在文献中经常出现的一些经典博弈的期望均衡的结果,并与混合Nash均衡结果进行比较。说明对于完全静态博弈,当局中人比通常情况下聪明(极大熵准则是他们的共同知识)的时候,其决策结果比混合Nash均衡更为确定和具有理性。关键词:极大熵准则,完全静

2、态博弈,混合Nash均衡,期望均衡1.引言传统的完全信息静态博弈假定(1)局中人的集合,(2)每个局中人的行动集合和(3)博弈的效用函数是全体局中人的共同知识[1]。但是并不要求全体局中人的共同知识的集合中不含有其他成分。如果这种博弈不含有其他成分,那么就称为完全静态博弈[2-4]。如果局中人的共同知识集合中有并且仅仅有(1),(2),(3)和(4)极大熵准则[5]:如果局中人对于可能发生的随机事件仅仅有一部分信息,那么他在决策时应该选择使得不知道的信息的不确定性达到最大的策略,那么这个博弈称为理性博弈[2-4]。文献[2,7]关于理性博弈引进了期望均衡的概念,

3、并且给出其算法。文献[2]对于经典的博弈问题——囚徒困境、夫妻争执和鹰-鸽博弈用期望均衡的概念进行了探讨,所得结论是经典均衡无法得到的,并且更符合实际。本文首先介绍理性对策及其期望均衡的概念,然后由此分析了在文献中经常出现的一些经典博弈的期望均衡的结果,并与混合Nash均衡结果进行比较。说明对于完全静态博弈,当局中人比通常情况下聪明(极大熵准则是他们的共同知识)的时候,其决策结果比混合Nash均衡更为确定和具有理性,且均衡的计算非常简洁。2、理性双矩阵博弈设1和2是两个局中人,和分别是局中人1和2的行动集合。和分别是局中人1和2的支付矩阵,即当剧中人1和2分别采

4、用行动和时,局中人1和2分别得到效用和。设单纯形,分别是局中人2和1的判断集合[9],即表示局中人2判断局中人1以概率选择行动,表示局中人1判断局中人2以概率选择行动。设是可能取值为1,2,……,n的随机变量,其概率分布列为,,那么对于不同的概率分布列,随机变量取值的不确定性可能不同.例如对于三个服从0-1分布的随机变量,;,;,,的不明确性最小:几乎必然取1;的不明确性次之,而的不明确性最大:以同样的可能性取0和1.给定随机变量的分布列,,我们用符号表示其不明确性.1948年,Shannon证明了[10],这里规定,式中的是正常数,通常可以取作1.称为Shan

5、non熵.对于取定的底,记.随机变量的Shannon熵是这个随机变量在一次试验中究竟取什么值的不明确性或“模糊度”的度量,也就是要准确判定这个随机变量究竟取什么值所需要的平均信息量.定理1[11](1),(2)当且仅当存在着使得,(3)当且仅当.定义1一个双矩阵对策称为完全静态的,如果局中人1,2的共同知识集合为。极大熵准则(PME):对于完全静态博弈,局中人1(或2)判断局中人2(或1)以概率(或)的随机变量(或)的Shannon熵最大。定义2一个双矩阵对策称为理性的,如果局中人1,2的共同知识集合为。给定理性双矩阵对策,因为局中人1(或2)判断对方以概率(或

6、)采取行动(或),所以当局中人1(或2)采取行动(或)时,其赢得的主观期望为(或)。局中人1(或2)应该选择使得其主观期望(或)最大的行动(或)。定义3称为理性博弈的期望均衡集合。显然期望均衡集合总是存在的并且可交换的,所以总可以实现。3.小偷-守卫博弈[8]一个小偷欲偷窃有一个守卫看守的仓库。如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。设小偷被抓住后要坐牢,负效用为。守卫睡觉而未遭偷窃有的正效用。因睡觉被解雇的负效用为。如果小偷不偷,则他既无得也无失。守卫不睡觉意味着出一分力挣一分钱,也无得失。则赢

7、得矩阵为。这个例子出现在文献[8](pp.94),起源于Selten,R教授于1996年3月在上海的一次演讲,作者用图解法分析了这个博弈的混合Nash均衡。显然,这个对策没有纯Nash均衡。按照传统方法,可得混合Nash均衡和失盗的概率分别为,。解释:是固定的。当较大时,对于守卫失盗后果严重时(比如守卫知道自己被解雇以后再也找不到待遇与现工作相当的新工作,而只能比现工作差,则守卫必然珍惜现有工作,尽职尽责不睡觉)是双方的共同知识。小偷在行窃的时候就要谨慎行事,故行窃的概率较小。当固定,较小时,小偷被抓住的惩罚相对于仓库里的物品较轻是双方的共同知识,那么守卫就会知

8、道小偷偷的可能性较大,从

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。