随机型动态规划及软件介绍.ppt

随机型动态规划及软件介绍.ppt

ID:52529242

大小:602.56 KB

页数:26页

时间:2020-04-09

随机型动态规划及软件介绍.ppt_第1页
随机型动态规划及软件介绍.ppt_第2页
随机型动态规划及软件介绍.ppt_第3页
随机型动态规划及软件介绍.ppt_第4页
随机型动态规划及软件介绍.ppt_第5页
资源描述:

《随机型动态规划及软件介绍.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第6章动态规划动态规划的基本理论(2学时)确定型动态规划(2学时)随机型动态规划(1学时)动态规划的软件求解简介(1学时)1第八章动态规划一、离散随机性动态规划随机型的动态规划是指状态的转移律是不确定的,即对给定的状态和决策,下一阶段的到达状态是具有确定概率分布的随机变量,这个概率分布由本阶段的状态和决策完全确定。随机型动态规划的基本结构如下图:sk状态xk决策概率k阶段的收益p1p2pN….k+1阶段的状态sk+1c1c2cN12N第15讲随机型动态规划及软件介绍2第八章动态规划图中N表示第k+1阶段可能的状态数,p1、p2、…pN为给定状态sk和决策xk的前提下,可能达到

2、下一个状态的概率。ci为从k阶段状态sk转移到k+1阶段状态为i时的指标函数值。在随机性的动态规划问题中,由于下一阶段到达的状态和阶段的效益值不确定,只能根据各阶段的期望效益值进行优化。3第八章动态规划例1某公司承担一种新产品研制任务,合同要求三个月内交出一件合格的样品,否则将索赔2000元。根据有经验的技术人员估计,试制品合格的概率为0.4,每次试制一批的装配费为200元,每件产品的制造成本为100元。每次试制的周期为1个月。问该如何安排试制,每次生产多少件,才能使得期望费用最小?(类例教材1:例6-7)4第八章动态规划解:把三次试制当作三个阶段(k=1,2,3),决策变量

3、xk表示第k次生产的产品的件数;状态变量sk表示第k次试制前是否已经生产出合格品,如果有合格品,则sk=0;如果没有合格品,记sk=1。最优函数fk(sk)表示从状态sk、决策xk出发的第k阶段以后的最小期望费用。故有fk(0)=0。生产出一件合格品的概率为0.4,所以生产xk件产品都不合格的概率为,至少有一件合格品的概率为1-,故有状态转移方程为5第八章动态规划用C(xk)表示第k阶段的费用,第k阶段的费用包括制造成本和装配费用,故有根据状态转移方程以及C(xk),可得到6第八章动态规划如果3个月后没有试制出一件合格品,则要承担2000元的罚金,因此有f4(1)=20。当k

4、=3时,计算如下表:x3s3C(x3)+20×f3(s3)x3*012345600——————001201511.29.328.598.568.938.5657第八章动态规划当k=2时,计算如下表:x2s2C(x2)+8.56×f2(s2)x2*0123400————0018.568.147.086.857.116.8538第八章动态规划当k=1时,有x1s1C(x1)+6.85×f1(s1)x1*012300———0016.857.116.466.486.4629第八章动态规划上面三个表中并没有列出xk取更大数值的情况,因为可以证明以后的C(xk)+fk+1(1)的值是对x

5、k单调增加的。因此得到的最优策略是,在第1个阶段试制2件产品;如果都不合格,在第2阶段试制3件产品;如果仍都不合格,则在第3个阶段试制5件产品。该策略得到的最小的期望费用6.46。10第八章动态规划例2不确定性采购问题(类例教材1:例6-8)某厂生产上需要在近五周内必须采购一批原料,而估计在未来五周内原材料的价格是波动的,浮动价格和概率已知。如何采购使其采购价格的数学期望最小,并求出期望值。单价概率5000.36000.37000.411第八章动态规划动态规划的数学模型该问题分成五个阶段,k表示周,k=1,2,3,4,5设Sk表示为第k周的实际价格。决策变量Uk,Uk=1表示

6、为第k周决定采购,Uk=0表示为第k周决定等待。XkE表示为第k周决定等待,而在以后采取最优决策时采购价格的期望值。fk(Sk)表示第k周实际价格为Sk时,从第k周到第5周采取最优策略所得的最小期望值。递推关系式:fk(Sk)=min{Sk,XkE}边界条件:f5(S5)=S5其中:XkE=0.3fk+1(500)+0.3fk+1(600)+0.4fk+1(700)Sk∈{500,600,700}12第八章动态规划f5(S5)=S5S5∈{500,600,700}f5(500)=500f5(600)=600f5(700)=700即在第五周,不论原材料的市场价格如何,都必须购买

7、。当k=5时f4(S4)=min{S4,X4E}X4E=0.3f5(500)+0.3f5(600)+0.4f5(700)=610f4(500)=500f4(600)=600f4(700)=610当k=4时U4=1,当S4=500,600U4=0,当S4=700即在第四周时,当市场价格为500或600时,选择购买原材料。若市场价格为700时,则继续等待。13第八章动态规划当k=3时,f3(S3)=min{S3,X3E}X3E=0.3f4(500)+0.3f4(600)+0.4f4(700)=574f3(5

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。