欢迎来到天天文库
浏览记录
ID:53750196
大小:205.72 KB
页数:7页
时间:2020-04-23
《时滞系统在博弈中的应用研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第34卷第2期数学理论与应用Vo1.34No.22014年6月MATHEMATICALTHE0RYANDAPPLICAT10NSJun.2014时滞系统在博弈中的应用研究吴克睛冯兴来(江西理工大学理学院,赣州,341000)摘要演化博弈理论解决策略均衡问题是目前比较认可的好方法.对于博弈方的经验行为,还未曾研究.本文以非对称2×2的博弈问题为研究对象,建立起带有时滞的博弈系统,通过动力学相关知识,分别研究了两类系统下博弈参与者策略的稳定状态.数值模拟分析了延时给决策带来的影响.实验表明,时滞作用不改变策略的稳定状态,改变
2、的仅是达到稳态的速率.关键词演化博弈;时滞系统;策略均衡;稳定性ApplicationofTimeDelaySystemsinGamesWuKeqingFengXinglai(CollegeofScience,JiangxiUniversityofScienceandTechnology,Ganzhou341000,China)AbstractEvolutionarygametheoryisregardedasacommontheorytosolvethestrategyequilibriumproblemingames
3、,whiletheexperienceofthegameparticipantsisnotconsidered.Inthispaper,westudytheasymmetric2×2gamesystemwithtimedelay.Thestablestrategiesofthegameparticipantsintwokindsofsuchsystemarestudiedbyapplyingthedynamicmethod.Theefectoftimedelayonthedecision—makingisanalyzed
4、bynumericalsimulation.Itisshowedthatthetimedelaydoesnotchangethestablestrategies,buttheconvergentratetothem.KeywordsEvolutionarygameTimedelaysystemStrategyequilibriumStablestrategy1引言演化博弈是一门交织数学、计算机等多门学科的理论,主要研究的是决策如何均衡的问题.自其理论形成以来,深受国内外学者青睐,应用领域越来越广泛,其理论也日趋成熟.对于
5、演化博弈模型,其稳定性解反映的是未来决策的稳定性,是通过不断地调节当前的决策来达到的结果.然而,对于有限理性的博弈参与者,在博弈过程中,往往会吸取先前经验进行预判,不盲目效仿调节,即博弈过程中会考虑先前决策的情况.本文通过时滞作用刻画了参与者国家自然科学基金资助项目(61364015)收稿日期:2014年6月9日数学理论与应用决策思考的过程,建立起带有时滞的演化博弈模型,并研究分析决策的稳定性状态2演化博弈模型的建立及稳定性本文主要针对2×2的非对称博弈展开讨论,先建立演化博弈模型,然后研究模型的解的稳定性.2.1演化博
6、弈模型以2×2的非对称博弈为研究对象.假设博弈的所有参与者都不是完全理性的,其收益矩阵如下表1所示,表中的参数0,b,C,d,e,g,h表示不同参与者在不同决策下的收益值.如参数。,b表示当博弈者甲选择策略A、博弈者乙选择策略。时,甲和乙分别获得的收益.表1两博弈者的收益矩阵设博弈者甲选择策略A。的概率为,选择策略的概率为1一;博弈者乙选择策略。的概率为y,选择策略B的概率为1一Y.根据进化博弈论的相关知识知,甲选择策略A。的收益为=口·Y+e·(1一Y),(1)选择策略:的收益为Ul一=C·Y+g·(1一Y),(2)因
7、此甲的平均收益为U=·+(1一)·U1一,从而,甲选择策略,的复制动态方程为塞=·(一)=戈.(1一)·[(n—e—c+g)·Y+e—g].(3)类似可得,乙选择策略B的复制动态方程为:=Y.(1一,,)·[(6一d一厂++d—h3.(4)因此,甲和乙选择策略的博弈模型为时滞系统在博弈中的应用研究57f鲁=(1-[(口一e—c+g)。),+e—g],(5)=y.(1·E(b—d一厂++d一然而,在博弈模型(5)中,博弈参与者F一步的决策仅与当前决策情况有关,但买际上还应该与博弈过程中积累的经验有关.较为合理的做法是根据对
8、方先前的决策动态信息进行预判,这可理解为对方的信息有一个滞后作用.假设博弈参与者甲对乙滞后,乙对甲滞后r.这样,甲和乙选择策略的演化博弈模型变为f=(1一)·[(口一e—c+g)‘y()+e—g],J(6)【=y.(1一y).[(6一d一厂+)f一丁:)+d一显然,模型(6)为一个时滞系统,它与模型(5)都是本文所要
此文档下载收益归作者所有