资源描述:
《博弈论(第四讲)理性是共同知识时的博弈求解》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、理性是共同知识时的博弈求解YangLing13898801325基本概念:理性、信念、混合策略与期望效用博弈求解:参与者是理性的博弈求解:参与者是理性的且参与者知道参与者是理性的博弈求解:理性成为共同知识定位博弈合伙人博弈第4讲理性是共同知识时的博弈求解4.1基本概念4.1.1基本概念——理性当一位参与者尽可能使自己的支付最大化并采取行动时,就认为这位参与者是理性的。参与者有足够的能力对自身的处境进行判断参与者有足够的能力对其他参与者的行为进行预期参与者有足够的能力对各种行动方案进行评估参与者以自身支付最大化原则采取行动理性意味着仅仅追求自身的利益,而不管这些利益是如何被定义的。
2、偏好4.1基本概念4.1.2基本概念——信念信念是参与人对其他参与人行为的主观判断。从数学上看,参与人i的信念是关于其他参与人的策略的一个概率分布,用μ-i来表示,μ-i∈ΔS-i,其中ΔS-i是指除了参与人i的其他所有参与人所采取策略的概率分布集合。在两方博弈中(-i=j),假定每个参与人都有有限数量的策略。参与人i对于参与人j所采取策略的信念是一个函数μj∈ΔSj,其中对于参与人j的每一个策略sj∈Sj,μj(sj)表示参与人i认为参与人j可能采取sj的概率。μj性质:对于每一个sj∈Sj,有μj(sj)≥0且Σsj∈Sjμj(sj)=1比如,参与人j的策略有A,B,C三种,
3、μj(A)=1/3,μj(B)=1/6,μj(C)=1/2。4.1基本概念4.1.3基本概念——混合策略一个参与人的混合策略是指这个参与人根据一个概率分布来随机选择策略的行为。参与人i的混合策略用σi表示,σi∈ΔSi,ΔSi为参与人i的混合策略集合。比如,一个参与人可以在U和D两种策略之间进行选择,他选择U的概率为1/2,选择D的概率也为1/2,则他的混合策略为(1/2,1/2)。σi性质:σi中的每个元素不小于0,各元素之和为1.混合策略包括了纯策略,纯策略是混合策略的一种特殊情况。4.1基本概念基本概念——期望效用(上)一个参与人的期望效用是指这个参与人采取策略si,而其他
4、人根据μ-i采取行动时的“平均”得益。以右图所示的博弈为例,假设参与人1相信参与人2采取策略L的可能性为1/2,采取策略M和R的可能性都是1/4。即μ2(L)=1/2,μ2(M)=1/4,μ2(R)=1/4。这个信念简写为(1/2,1/4,1/4)。如果参与人1选择U,他的期望效用为:4.1基本概念基本概念——期望效用(下)当在博弈中有参与人使用混合策略时,参与人的支付也使用期望效用来计算。仍以右图所示的博弈为例,假设参与人2选择M,参与人1采取混合策略(1/3,1/3,1/3),那么参与人1的支付为:u1(σ,M)=(1/3)*0+(1/3)*1+(1/3)*2=1参与人2的支
5、付为:u2(σ,M)=((1/3)*2+(1/3)*2+(1/3)*3=7/3【小练习】试计算参与人1采取混合策略(1/3,1/3,1/3),参与人2采取混合策略(0,1/2,1/2)时,双方的支付情况。4.1基本概念基本概念——最优反应(上)假设参与人i对于其他参与人采取的策略具有信念,μ-i∈ΔS-i,参与人i的策略si∈Si如果对于任何s’i∈Si都满足ui(si,μi)≥ui(s’i,μi),那么si是一个最优反应。以右图所示的博弈为例,假设参与人1相信参与人2采取策略L的可能性为1/3,采取策略C的可能性为1/2,采取策略R的可能性为1/6.这个信念可表示为(1/3,1
6、/2,1/6)。参与人1采取策略U、M、D的期望效用分别为:4.1基本概念基本概念——最优反应(下)仍以右图所示的博弈为例,假设参与人2对参与人1所采取的策略具有信念(1/2,1/4,1/4)。参与人2采取策略L、C、R的期望效用分别为:【要点说明】1.最优反应是一个集合,其元素不一定只有一个。2.根据对其他人策略的信念相应采取最优反应策略本身并不是一种策略行为,可看作理性动物的一种本能。3.采取行动的最关键部分在于信念中所包含的信息。获得博弈的成功常常取决于你对于对手的了解是否超过对手对你的了解。4.2博弈求解:参与者是理性的严格优于(strictlydominates):无论
7、其他对手的策略是什么,若策略s产生的支付(收益)严格高于s’产生的收益,那么策略s为严格优于策略s’。4.2博弈求解:参与者是理性的弱优于(weaklydominates):无论其他对手的策略是什么,若策略s产生的支付(收益)不低于s’产生的收益,那么策略s为弱优于策略s’。4.2.2博弈求解:参与者是理性的——弱优于4.2博弈求解:参与者是理性的4.2.2博弈求解:参与者是理性的——占有策略歌剧《托斯卡》的博弈情景反映了个人理性与集体理性之间的重要区别。占优策略(dominan