资源描述:
《 基于动态规划模型的部队返程问题优化应用研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于动态规划模型的部队返程问题优化应用研究基于动态规划模型的部队返程问题优化应用研究基于动态规划模型的部队返程问题优化应用研究基于动态规划模型的部队返程问题优化应用研究基于动态规划模型的部队返程问题优化应用研究基于动态规划模型的部队返程问题优化应用研究基于动态规划模型的部队返程问题优化应用研究刘臣杰,张卫春,王冉冉,周东阳(1.军事交通学院研究生管理大队,天津300161;2.62197部队,湖北广水432722)摘要:简要介绍了动态规划的多阶段决策过程,最优性原理和最优性定理,并以某军区打靶部队返程运输为例,建立动态规划模型,优化运输计划,达到以
2、尽可能小的代价完成部队返程运输保障的目的,为解决同类问题提供思路.关键词:运输费用;动态规划;模型;返程问题中图分类号:E234;O221.3文献标识码:A文章编号:1672-3953(2011)04—0028—031动态规划简介[卜]1.1多阶段决策过程动态规划是运筹学中解决多阶段决策过程最优化问题的一种方法.自1951年开始,由美国人贝尔曼(R.Bellman)为首的学派将该方法发展起来.多阶段决策过程通常是把复杂问题按时间或者空间分成若干阶段,每个阶段都需作出不同的决策,以得到整个问题的最优结局.由于在每个阶段采取的决策是随着时间或空间的不同
3、而不断变动的,这就是”动态”的含义.处理该动态问题的方法亦称为动态规划方法.1.2最优性原理和最优性定理动态规划的应用十分广泛,在经济管理,军事,工程技术等方面都有涉及,其核心是”最优化原理”,所有动态规划问题的递推关系都是以此原理为基础建立起来的.最优性原理:”作为整个过程的最优策略具有这样的性质,即无论过程过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略.”简而言之,就是最优策略的任何一部分子策略也必须是最优的.然而,最优性原理不是对任何决策过程都是普遍成立的,与动态规划的基本方程也不是无条件等价的,两者之间不存
4、在确定的蕴含关系.而最优性定理则能够反映动态规划基本方程,它是策略最优性的充要条件,而最优性原理仅仅是策略最优性的必要条件,它是最优性定理的收稿日期:2011-03—14作者简介:刘臣杰(1984一).男,硕士研究生,研究方向为军事运筹chenmoyelang@qq.corn推论.在求解最优策略过程中,更需要的是充分条件.由此可以看出,动态规划的基本方程或者说最优性定理才是动构造动态规划的数学模型.一般可归纳为以下五个步骤:①根据问题实际将其按时间或空间次序划分为若干阶段;②正确选择状态变量;③确定决策变量d及允许决策变量集合D(z);④根据状态变
5、量之间的递推关系,写出状态转移方程外一T(x,d(z));⑤建立指标函数,通常用仇(z,d)表示阶段效应,(z)表示k—TI阶段的最优策略函数;⑥建立动态规划基本方程:f(西)一∈DI(){(,())+A1(m1))1.l(1)一c,k—,一1,…,1国防交通工程与技术囵20ll第4期?研究与设计?基于动态规划模型的部队返程问题优化应用研究刘臣杰等3动态规划模型在部队返程问题中的应用3.1部队运输问题描述与条件假设兵马未动,粮草先行.运输装载训练是部队作战训练的一项重要内容,运输装载计划安排的合理与否将直接影响作战训练的效果与战斗力的发挥.当前,部
6、队担负的处突,维稳等非战争军事行动越来越多,消耗开支也越来越大,如何以最少的费用解决部队运输问题是部队建设的一项重要课题.某部执行任务完毕之后拟采用铁路输送方式返回驻地,按计划方案该部可以分为29列进行输送.根据任务安排,铁路运输费用不通过部队自身安排,因而只需要考虑集结部队所需费用,因而以最少的集结费用在7d之内(忌一7)完成返程输送任务是本文的最终目标.由于任务需要,已经有2列部队提前在货场集结,故此部队无需额外集结费用.为不影响地区经济的平稳发展,目标货场在未来7d内的发出能力(列)和每一列集结所需费用C(万元)如表1所示.如何合理地安排部队
7、运输计划,使部队能够更好更快地完成运输任务是当前面临的一项难题,现用动态规划模型将该部队的输送问题进行优化.为了便于讨论和处理,又能使模型刻画所研究问题的本质,进一步明确求解问题的条件,在这里我们通过引进假设条件的方式,对实际部队返程问题进行必要的规范,简化和抽象.(1)有限时段假设.由于铁路运输装载具有连续性,不存在明确的初始状态和终止状态.从这个方面来考虑,这属于无限离散系统问题.在实际执行过程中,前一个状态对后一个状态具有传递性影响,理论上不可能求出全局最优解.但在限定的考察时段内运输一定数量的部队,存在最优解.为此,这里引进有限时段假设:①
8、假定某部队执行非紧急作战任务,运输时限定为7d(假定一7);②考察时段定为一个时间窗,前一个时间窗结束时,自动构成第2天预