计算机算法基础(第6章).ppt

计算机算法基础(第6章).ppt

ID:50309530

大小:562.00 KB

页数:101页

时间:2020-03-12

计算机算法基础(第6章).ppt_第1页
计算机算法基础(第6章).ppt_第2页
计算机算法基础(第6章).ppt_第3页
计算机算法基础(第6章).ppt_第4页
计算机算法基础(第6章).ppt_第5页
资源描述:

《计算机算法基础(第6章).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第六章动态规划第6章动态规划6.1一般方法1.多阶段决策问题多阶段决策过程:问题的活动过程分为若干相互联系的阶段,任一阶段i以后的行为仅依赖于i阶段的过程状态,而与i阶段之前的过程如何达到这种状态的方式无关。在每一个阶段都要做出决策,这一系列的决策称为多阶段决策过程(multistepdecisionprocess)。最优化问题:问题的每一阶段可能有多种可供选择的决策,必须从中选择一种决策。各阶段的决策构成一个决策序列。决策序列不同,所导致的问题的结果可能不同。多阶段决策的最优化问题就是:求能够获得问题最

2、优解的决策序列——最优决策序列。2.多阶段决策过程的求解策略1)枚举法穷举可能的决策序列,从中选取可以获得最优解的决策序列2)动态规划20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程的优化问题时,提出了著名的最优化原理(principleofoptimality),把多阶段过程转化为一系列单阶段问题,创立了解决这类过程优化问题的新方法——动态规划。动态规划(dynamicprogramming)是运筹学的一个分支,是求解决策过程(decisionprocess)最优化的数学方法。

3、应用领域:动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。3.最优性原理(PrincipleofOptimality)过程的最优决策序列具有如下性质:无论过程的初始状态和初始决策是什么,其余的决策都必须相对于初始决策所产生的状态构成一个最优决策序列。利用动态规划求解问题的前提1)证明问题满足最优性原理如果对所求解问题证明满足最优性原理,则说明用动态规划方法有可能解决该问题

4、2)获得问题状态的递推关系式获得各阶段间的递推关系式是解决问题的关键。例6.1[多段图问题]多段图G=(V,E)是一个有向图,且具有特性:结点:结点集V被分成k≥2个不相交的集合Vi,1≤i≤k,其中V1和Vk分别只有一个结点s(源点)和t(汇点)。·每一集合Vi定义图中的一段。边:所有的边(u,v)均具有如下性质:若∈E,则该边将是从某段i指向i+1段,即若u∈Vi,则v∈Vi+1,1≤i≤k-1。·每条边(u,v)均附有成本c(u,v)。s到t的路径:从第1段开始,至第2段、第3段、…、最后

5、在第k段终止。路径的成本是这条路径上边的成本和。多段图问题:求由s到t的最小成本路径。12345678910111297324227111181456356425V1V2V3V4V55段图st多段图问题的多阶段决策过程:生成从s到t的最小成本路径是在k-2个阶段(除s和t外)进行某种决策的过程:从s开始,第i次决策决定Vi+1(1≤i≤k-2)中的哪个结点在从s到t的最短路径上。最优性原理对多段图问题成立假设s,v2,v3,…,vk-1,t是一条由s到t的最短路径。●初始状态:s●初始决策:(s,v2),

6、v2∈V2●初始决策产生的状态:v2则,其余的决策:v3,...,vk-1相对于v2将构成一个最优决策序列——最优性原理成立。反证:若不然,设v2,q3,…,qk-1,t是一条由v2到t的更短的路径,则s,v2,q3,…,qk-1,t将是比s,v2,v3,…,vk-1,t更短的从s到t的路径。与假设矛盾。故,最优性原理成立4.动态规划模型的基本要素多阶段决策过程最优化问题的动态规划模型通常包含以下要素:1)阶段阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间特征来划分阶段,以便按阶段的次序解

7、优化问题。阶段变量一般用k=1,2,..,n表示。2)状态状态(state)表示每个阶段开始时过程所处的自然状况。它应该能够描述过程的特征并且具有无后向性,即当某阶段的状态给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关,即每个状态都是过去历史的一个完整总结。通常还要求状态是直接或间接可以观测的。描述状态的变量称状态变量(statevariable)。变量允许取值的范围称允许状态集合(setofadmissiblestates)。用xk表示第k阶段的状态变量,它可以是一个数或一个向量。用Xk表示

8、第k阶段的允许状态集合。状态变量简称为状态3)决策当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(decision)。描述决策的变量称决策变量(decisionvariable)。变量允许取值的范围称允许决策集合(setofadmissibledecisions)。用uk(xk)表示第k阶段处于状态xk时的决策变量,它是xk的函数,用Uk(xk)表示了xk的允许决策集合。决策变量简称

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。