基于博弈论的软件动态调控策略的研究与实现

ID：22484813

大小：54.50 KB

页数：6页

时间：2018-10-29

资源描述：

《基于博弈论的软件动态调控策略的研究与实现》由会员上传分享，免费在线阅读，更多相关内容在工程资料-天天文库。

1、基于博弈论的软件动态调控策略的研究与实现关键词：1.研究的背景与意义近年来，软件的监控和管理问题引起了越来越多的关注。这主要有二个原因：首先，随着计算机X络的高速发展，诸如电子商务，社交X络以及各行各业的专业应用等等，这些在国民经济与个人生活中的作用日益突出。其次，各种在线系统、X络系统以及其他分布式系统的结构变得庞大，功能变得复杂，对稳定性、安全性和友好性有着极高的要求。这种对传统软件的扩展，打破了原有软件结构静态、封闭的局限。另外，由于需求多样，软件必须要在长周期内使用，需要不断的演化和持续。因此，对于现代软件，不能按照

2、传统的软件的思路即事后管理维护、监控运行等，而是要进行动态监控与调控，实现可信性控制。2.动态调控策略调控技术是软件系统调整和控制的重要手段，包括静态调控和动态调控技术。目前动态、开放的环境导致软件系统的规模越来越大、功能越来越复杂，仅仅由管理人员手动在线调控已经变得非常困难，软件系统需要在开放的运行环境中“把握”和“调整”，因此引入策略来帮助软件系统来完成在线动态调控。策略是行动明确的目标，过程式方法的指导，以及现在和未来的决定，是用来做出决定和指导行动的一种声明性表达。策略是调控的基础，是引导系统行为的手段，可以辅助管理

3、人员调控复杂的软件系统，也是软件系统自我调控的依据。3.博弈论概述博弈论(gametheory)又称对策论，起源于本世纪初。近30年来博弈论作为分析解决冲突与合作的工具，在管理科学、国际政治、生态学等领域得到了广泛的应用。在经济学领域中，博弈论经常用来解决实体之间的冲突和矛盾，它是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。针对动态调控中策略内发生冲突的现象，本文探讨引入经济学中的博弈论来解决此问题。4.基于博弈论的调控策略的选取对于复杂的软件系统而言，调控策略之间的关系是非常复杂的。调控策略之间除了一

4、个策略的执行引发另一个策略的简单关系之外，还可能存在策略之间的冲突。策略冲突一般具有以下两种类型的策略冲突：（1）策略内冲突，两条或两条以上策略同时满足策略触发条件，并且每条策略动作不能与其它策略动作同时执行；（2）策略间的冲突，两条或两条以上策略同时应用于相同目标对象时发生冲突，如策略P1给agentl访问数据库的权利，而策略P2策略禁止agent2访问数据库。在所有满足条件的策略当中，有些策略可能在执行的代价方面比其它策略要优越，有些策略可能在执行的有效性方面具有优势，因此可以把触发一条最优策略看成是不同策略之间博弈的结

5、果。利用博弈的效用评估函数计算每条策略的期望收益，通过比较每条策略的期望收益来决定具体触发哪条策略。本文设计出以下模型：（1）博弈模型博弈论模型的基本要素如下：参与者：Pi,Pj表示博弈过程的参与者;双方的战略空间：执行与不执行;博弈的次序：博弈的双方是同时进行的，不存在先后顺序;得益：Upi,Upj表示博弈双方在一次博弈结束后的收益。根据以上建立如表1所示的博弈模型。表1软件调控策略的博弈模型其中Pi、Pj为同一策略事件触发的两条不同的调控策略，各自拥有两种行动方式执行和不执行。Ri表示在执行Pj策略的情况下执行Pi策略给

6、Pi策略带来的收益，Rj表示在执行Pi策略的情况下执行Pj策略给Pj策略带来的收益；Ki表示在不执行Pj策略的情况下执行Pi给Pi策略带来的收益，Kj表示在执行Pi策略的情况下不执行Pj策略给Pj策略带来的损失；Li表示在执行Pj策略的情况下不执行Pi策略给Pi策略带来的损失，Lj表示在不执行Pi策略的情况下执行Pj策略给Pj策略带来的收益；Ci,Cj表示两者都不执行的情况下给Pi、Pj带来的损失。通过简单的画线法可以看出该博弈模型存在混和策略纳什均衡。现假定Pi策略执行的概率为x，则不执行的概率为1-x，Pj策略执行的概率

7、为Y，则不执行的概率为1-y。可以求得Pi策略的期望收益为：对公式4-1求偏导数可得：从而可以解得：同理可求得Pj策略的期望收益为：综合以上步骤，可以得出：Pi策略执行的混和策略的概率为：Pj策略执行的混和策略的概率为：以上计算仅仅解决了调控策略以什么的样概率执行的问题，由于调控策略的可信等级的高低程度会影响着策略的执行，策略每次执行时的具体决策还需要考虑策略本身的信任等级和对方策略的执行概率。因此在策略执行之前必须预测调策略在各信任等级的概率，设p1、p2、p3、p4调控策略信任等级落在非常信任、比较信任、基本信任、不信任

8、等级的概率，调控策略Pi在信任等级为k时选择执行的期望收益为：同理可以求得Pj在信任等级为k时选择执行的期望收益为：上式求得的是策略Pi在信任等级为k时的收益情况，若想得到策略Pi总体获利情况，需要对策略所有信任等级进行加权求和，Pi的总体收益如下：同理可求得Pj总体收益为：当E(Pi)0

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 6



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于博弈论的软件动态调控策略的研究与实现

基于博弈论的软件动态调控策略的研究与实现

相关文章

相关标签