资源描述:
《博弈2:完全信息静态博弈》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第二讲 完全信息静态博弈与纳什均衡主要内容一、博弈的标准式和纳什均衡二、纳什均衡应用实例三、混合策略纳什均衡四、纳什均衡的存在性五、多重纳什均衡一、博弈的标准式和纳什均衡1、博弈的标准式表述博弈的参与人集合I:i∈I={1,2,…,n},参与人i的策略集(纯策略空间)为Si,i∈I,每个参与人的支付函数为ui(s1,s2,…,sn),si∈Si,则将该博弈记为:G={S1,S2,…,Sn;u1,u2,…,un}。为简单起见,记S-i表示除i外其他I-1个局中人策略集的笛卡尔集,s-i表示除i外其他i-1个局中人所采用的策略向量。于是,(si,s-i)即表示(s1,s2,
2、…si-1,si,si+1,…,sn)。2、标准式博弈的要素参与人:博弈中的决策主体,有时包括“自然”作为“虚拟参与人”。策略:是参与人在给定信息集情况下的行动规则,它规定参与人在什么时候选择什么行动。在静态博弈中,策略和行动是等价的。支付:指在一个特定策略组合下参与人得到的确定(期望)效用水平。均衡:是所有参与人最优策略的组合,通常记为s*=(s1*,s2*,…,sn*),即均衡策略。3、标准式博弈中的均衡(1)占优策略均衡在博弈G={S1,S2,…,Sn;u1,u2,…,un}中,si*称为参与者i的占优策略,如果对其他参与者每一个可能的策略组合s-i,si*是i的
3、严格最优选择。即:ui(si*,s-i)>ui(si,s-i),s-i∈S-i,sisi*,si∈Si如果对所有参与者i,si*都是参与者i的占优策略,则称s*=(s1*,s2*,…,sn*)为占优策略均衡。(2)重复剔除严格劣策略均衡在博弈G={S1,S2,…,Sn;u1,u2,…,un}中,令si’和si”代表参与者i的两个可行策略(即在Si中),如果对其他参与者每一个可能的策略组合s-i,i选择si’的收益都小于其选择si”的收益,则称策略si’相对于策略si”是严格劣策略。即:ui(si’,s-i)<ui(si”,s-i),s-i∈S-i策略组合s*=(
4、s1*,s2*,…,sn*)称为重复剔除的占优均衡,如果它是重复剔除(严格)劣策略后剩下的唯一的策略组合。如果这种唯一的策略组合是存在的,则称该博弈是重复剔除占优可解的(它与剔除次序无关)。(3)纳什均衡在博弈G={S1,S2,…,Sn;u1,u2,…,un}中,如果策略组合s*=(s1*,s2*,…,sn*)满足对每一参与者i,si*是他针对其他参与者所选策略s-i*=(s1*,s2*,…si-1*,si+1*,…,sn*)的最优反应策略,则称策略组合s*=(s1*,s2*,…,sn*)为该博弈的一个纳什均衡。即:ui(si*,s-i*)≥ui(si,s-i*),s
5、i∈Si或者si*是以下最优化问题的解:si*∈argmaxui(s1*,s2*,…si-1*,si,si+1*,…,sn*),si∈Si,i=1,2,…,n.。注意:纳什均衡的精髓就在于“单独偏离没有好处”!二、纳什均衡应用实例构建博弈模型的分析方法Cournot寡头垄断模型Bertrand寡头垄断模型Hotelling价格竞争模型公共地悲剧公共物品的私人自愿供给最后要价仲裁构建博弈模型的分析方法(1)把问题的非正式描述转化为博弈的标准式表述;(2)求解该博弈的纳什均衡;(3)解释问题。纳什均衡及其求法称策略组合s*=(s1*,s2*,…,sn*)为纳什均衡,若ui
6、(si*,s-i*)≥ui(si,s-i*),si∈Si或者si*是以下最优化问题的解:si*∈argmaxui(s1*,s2*,…si-1*,si,si+1*,…,sn*),si∈Si,i=1,2,…,n.。对最优化问题的求解,是用一阶条件方法:对每一个式子求一阶导数,令其等于0,得到n个反应函数再求解这个n元方程组,其解即为纳什均衡。1、Cournot寡头垄断模型-产量竞争寡头竞争模型:Cournot,1838模型含义:两个企业选择各自产量市场决定出清价格企业的支付是其利润函数Cournot模型假设令q1、q2分别表示两寡头企业1、2生产的同质产品的产量,则市场
7、中该产品的总供给Q=q1+q2,令P(Q)代表逆需求函数,Ci(qi)代表成本函数。则第i企业的利润函数为:i(q1,q2)=qiP(q1+q2)-Ci(qi),i=1,2则(q1*,q2*)是纳什均衡意味着:q1*∈argmax1(q1,q2*)=q1P(q1+q2*)-C1(q1)q2*∈argmax2(q1*,q2)=q2P(q1*+q2)-C2(q2)一阶条件对每个企业的利润函数求一阶导数,得:1/q1=P(q1+q2)+q1P’(q1+q2)-C1’(q1)=02/q2=P(q1+q2)+q2P’(q1+q2)