欢迎来到天天文库
浏览记录
ID:46583088
大小:356.84 KB
页数:6页
时间:2019-11-25
《基于Matlab的动态规划问题》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第22卷第5期重庆工学院学报(自然科学)2008年5月V01.22No.5JournalofChongqingInstituteofTechnology(NaturalScience)May2008---●_-_--●_●-●--__●__-_●__-_____lIll_______-__________●___-_●_●●_-_●__●●-●I-_-_●_●●-l_--__-●●●●_-●-__●-__---_-基于Matlab的动态规划问题+郑怡,赵海良,徐永(西南交通大学数学系,成都610031)Matlab-basedDynainicProgrammi
2、ngZHENGYi,ZHAOHai—liang,XUYong(DepartmentofMathematics,SouthwestJiaotongUniversity,Chengdu610031,China)Abstract:Thispaperintroducesthebasictheoryofdynamicprogramming,includingthebasiceonceptsandbasicideas,analyzestheallocationofresourcesindynamicprogrammingwithMatlab,andeonducmproce
3、duredesignsandcomputationwithMaflab,simplifyingcomplexissuesandavoidingtheeulnbersomecalculationstomakemoreconvenientsolutionstoproblems.Keywords:dynamicprogramming;allocationofl'esoul把es;Matlablanguage动态规划是解决多阶段决策过程最优化问题的一种方法.该方法是由美国数学家贝尔曼(R.Bellm肌)等人在20世纪50年代初提出的.他们针对多阶段决策问题的特点,提出
4、了解决这类问题的最优化原理,并成功地解决了生产管理、资源分配等方面的许多实际问题,从而建立了运筹学的一个新分支——动态规划⋯1.动态规划是现代企业管理中的一种重要决策方法,可用于解决最优路径、资源分配、生产计划与库存、投资、装载、排序等问题,还可用于生产过程的最优控制等.由于它有独特的解题思路,因而在处理某些优化问题时,比线性规划或非线性规划方法更有效.而Mat.1ab是一个功能强大的用于基于矩阵运算的强大数值计算软件[2
5、.将Matlab语言应用到动态规划中去,对实际问题进行程序设计和计算,可以达到计算简便的目的.1动态规划的基本理论1.1动态规划的基本概念
6、使用动态规划方法解决多阶段决策问题,首先要将实际问题写成动态规划模型,此时要用到·收稿日期:2008—03—06作者简介:郑怡(1983一),男,浙江衢州人,硕士研究生,主要从事模糊智能控制、优化与决策研究;赵海良(1962一),男,教授,主要从事模糊控制与智能控制、模糊信息处理研究.郑怡,等:基于Matlab的动态规划问题153以下概念:1)阶段.将所给问题的过程,按时间或空间特征分解成若干互相联系的阶段,以便按次序去求解每阶段的解,每个阶段就是一个子问题,常用字母k表示阶段变量.2)状态.各阶段开始时的客观条件叫做状态.描述各阶段状态的变量称为状态变量,常
7、用甄表示第k阶段的状态变量.状态变量s。的取值集合称为状态集合,用S^表示.3)决策和策略.当各段的状态取定以后,就可以作出不同的决策(或选择),从而确定下一阶段的状态,这种决定称为决策.表示决策的变量称为决策变量,常用‰(吼)表示第k阶段当状态为吼时的决策变量.在实际问题中,决策变量的取值往往限制在一定范围内,称此范围为允许决策集合,常用D&(%)表示第五阶段从状态船出发的允许决策集合,显然有M^∈D&(%).4)状态转移.动态规划中本阶段往往是上一阶段状态和上一阶段的决策进行综合的结果.如果给定了第k段的状态s&,且该阶段决策为‰(札),则第k+1段的状态
8、s&+l也就完全确定.它们的关系可表示为:轧+1=Tk(Sk,Uk)由于上式表示了由k段到k+1段的状态转移规律,所以称该式为状态转移方程.5)指标函数.用于衡量所选定策略优劣的数量指标称为指标函数.一个/7,阶段决策过程,从1到/'t叫作问题的原过程.对于任意一个给定的k(1≤k≤n),从第k阶段到第/'t阶段的过程称为原过程的一个后部子过程.y1.。(s1,Pl,。)表示初始状态为s。采用策略Pl,n时原过程的指标函数值,而既.。(%,以,。)表示在第k阶段,状态为轧采用策略pk,n时后部子过程的指标函数值.最优指标函数记为以(钆),它表示从第k阶段状态船
9、采用最优策略pt。到过程终止时的最佳效
此文档下载收益归作者所有