资源描述:
《CH02混合策略(博弈论,张醒洲)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、2021/12/13张醒洲,大连1混合策略找到不确定情况下的最优反应定义在一个n人博弈的标准式表述中,参与人的策略空间为,收益函数为,我们用表示此博弈。2021/12/13张醒洲,大连2纳什均衡博弈的标准式和纳什均衡2021/12/13张醒洲,大连3举例:猜硬币模型两个参与人{1,2}每个参与人的策略空间为{H,T}收益零和试着找到纳什均衡参与人2参与人1正面背面正面-1,11,-1背面1,-1-1,1两个男孩各自有一个硬币并且他们必须选择将硬币的正面朝上还是背面朝上。如果两个硬币朝上的面相同(即都是正面或都是背面),则参与人2将赢得参与人1的硬币;否则,参与人1将赢得参与人2的
2、硬币。猜硬币如果参与人的策略一致——(正面,正面)或(反面,反面)—则参与人1会偏向于改变策略;但是如果两者策略不一致—(正面,反面)或(反面,正面)—则参与人2偏向于改变策略。参与人2正面背面正面-1,11,-1参与人1背面1,-1-1,1没有一组策略满足(NE)2021/12/13张醒洲,大连5石头-剪刀-布博弈此博弈也不存在纳什均衡无论参与人1选择哪个纯策略,参与人都可以打败他。参与人2石头剪刀布石头0,01,00,1参与人1剪刀0,10,01,0布1,00,10,02021/12/13张醒洲,大连6猜对方策略猜硬币博弈一个非常突出的特点是每个参与人都试图猜中对方的策略。任
3、何这一类都没有纳什均衡至少不存在1.1.C节所定义的纳什均衡因为这一类博弈的解包含了一个参与人对其他参与人行为的不确定。现在我们介绍混合策略2021/12/13张醒洲,大连7纯策略,混合策略考虑标准式博弈G={S1,····,Sn;u1,····,un}此后我们定义Si中的策略为参与人i的纯策略在本节的完全信息同时行动博弈中,一个参与人的纯策略就是他可以选择的不同行动;例如,在猜硬币的博弈中,Si包含两个纯策略:正面和背面。参与人i的一个混合策略是在其策略空间Si中的(一些或全部)策略的概率分布。2021/12/13张醒洲,大连8概率和信念随机事件事件有明确定义.我们可以区分不同
4、的事件.在进行观察或试验前,我们不能肯定的说一个具体的事件会出现.我们可以判断哪些事件有可能出现,并且能判断每一个事件出现的可能性大小.概率事件的概率是对一次随机试验中该事件出现的可能性的度量如果对可能性的度量以某种客观规律或物质属性为基础,我们就用“概率”一词如果对可能性的度量以个人经验、主观判断为基础,就用“主观概率”、“信念”、“置信度”等术语2021/12/13张醒洲,大连9概率分布样本空间:Ω={ω1,ω2,…,ωn,…}试验中可能出现的所有基本结果ωi的集合事件由基本结果组成,是样本空间的子集。如果在试验中事件A中的一个