基本概念与最优化原理ppt课件.ppt

ID：59449426

大小：549.00 KB

页数：33页

时间：2020-09-18

资源描述：

《基本概念与最优化原理ppt课件.ppt》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、4-2动态规划的基本概念和模型一、基本概念DP中描述多段决策过程的基本概念主要有：阶段和阶段变量；状态和状态变量；决策、决策变量和决策序列；状态转移方程；阶段效应和目标函数等。1.阶段和阶段变量把所研究的多段决策过程恰当地划分为若干个相互独立又相互联系的部分，每一个部分就称为一个阶段。事实上一个阶段也就是需要作出一个决策的子问题部分。通常阶段是按照过程进行的时间和空间上的先后顺序划分的，并用阶段变量k表示。阶段数等于多段决策过程中从开始到结束所需要作出决策的数目，划分阶段的目的是便于求解。一次性决策与多阶段决策一次性决策多阶段决策2.状态和状态变量状态是描述系

2、统状况所必须的信息。一般定义为某一个阶段的初始点、初始位置或初始情况。状态变量必须包含在给定的阶段上确定全部允许决策所需要的信息，阶段k的状态表示为xk。比如：在最短路问题中，状态就是网络中的各个节点。状态变量的取值有一定的允许范围，称为状态可能集。状态可能集可以是一个离散取值的集合，也可以是一个连续的区间，视所给问题而定。状态可能集是关于状态的约束条件。状态可能集用相应阶段状态xk的大写字母Xk表示，其中xkXk3.决策、决策变量和决策序列决策就是决策者从本阶段出发对下一阶段状态的选择。多段决策过程的发展是用各个阶段的状态演变来描述的。因为用状态描述的过程具有无后效性

3、，因此在进行阶段决策时，只须根据当前的状态而无须考虑过去的历史。在阶段k如果给出了决策变量uk随状态变量xk变化的函数，称为决策函数，表示为uk(xk)。决策变量的允许取值范围，称为允许决策集合。允许决策集合是决策的约束条件。uk的允许决策集合表示为Uk，ukUk。Uk要根据相应的状态可能集Xk并结合具体问题来确定。决策序列又叫策略。策略有全过程策略和k-子策略之分。全过程策略是整个n段决策过程中依次进行的n个阶段决策构成的决策序列，简称策略，表示为：从阶段k到阶段n依次进行的阶段决策构成的决策序列称为k-子策略，表示为：当k=1时，k-子策略就是全过程策略。在n段决策

4、问题中，各阶段的状态可能集和决策允许集确定了决策的允许范围。特别地，过程的初始状态不同，决策和策略也就不同，即策略是初始状态的函数。4.状态转移方程状态转移方程表示从阶段k到阶段k+1的状态转移规律的表达式。多阶段过程的发展就是用阶段状态的相继演变来描述的。对具有无后效性的多段决策过程，系统由从阶段k到阶段k+1的状态转移方程表示为：即阶段的状态完全由k阶段的状态和决策uk确定，与系统过去的状态x1,x2,…,xk-1及其决策u1(x1)，u2(x2)，…,uk-1(xk-1)无关。如,Tk(xk,uk)称为变换函数或变换算子。变换函数可以分为确定型和随机型两种类型，据此

5、形成确定型动态规划和随机型动态规划。5.阶段效应和目标函数多段决策过程中，在阶段k的状态xk执行决策uk，不仅带来系统状态的转移，而且也必然带来对目标函数的影响。阶段效应就是执行阶段决策时所带来的目标函数的增量。在具有无后效性的多段决策过程中，阶段效应完全由阶段k的状态xk和决策uk决定，与阶段以前的状态和决策无关，表示为多阶段决策过程关于目标函数的总效应是由各阶段的阶段效应累积形成。适于动态规划求解的问题的目标，必需具有关于阶段效应的可分离形式、递推性和对于变元RK+1的严格单调性。k-子过程的目标函数可以表示为:今后要讨论的主要就是这种形式的目标函数。其中表示某种运算

6、，可以是加、减、乘、除、开方等。经济管理领域中最常见的目标函数取阶段效应之和的形式，即：以最短路问题为例熟悉有关的五组概念阶段有四个阶段,做4次决策阶段1:决定由s到a,b,c:状态变量x1取为阶段1所在地：阶段1的决策是下一步走到哪里，取为下一步的所在点:阶段2:决定由a,b,c到d,e,f:状态变量x2取为阶段2所在地：阶段2的决策是下一步走到哪里，取为下一步的所在点:决策允许集合状态可能集合决策允许集合状态可能集合阶段3:决定由d,e,f到h,g:状态变量x3取为阶段3所在地：阶段3的决策是下一步走到哪里，取为下一步的所在点:阶段4:决定由h,g到t:状态变量x4取

7、为阶段4所在地：阶段4无需选择，取为下一步所在点t决策允许集合状态可能集合决策允许集合状态可能集合状态转移方程根据xk和uk的选取方法可知：k+1阶段的状态是在k阶段状态的条件下，经过决策uk选择的结果。uk本身是下一步所到达节点，它同时也就是k+1阶段的状态。阶段效应由阶段k的状态xk经过决策uk到达下一阶段状态xk+1的直接结果是选择了从xk到xk+1所经过的路程的长度。总的目标函数是总路程最短，各阶段所选择的路程的总和就是总目标函数R。阶段——从起点到终点可以划分为4个阶段；总结二、多阶段决策过程的数学模型（DP的建模）

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 33



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基本概念与最优化原理ppt课件.ppt

基本概念与最优化原理ppt课件.ppt

相关文章

相关标签