欢迎来到天天文库
浏览记录
ID:35507035
大小:61.74 KB
页数:9页
时间:2019-03-25
《数理经济学论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、利用动态规划解决生产计划安排问题摘要动态规划是解决多阶段决策过程最优化的一种方法。这种方法是基于将困难的多阶段决策问题变换成一系列互相联系比较容易的单阶段问题的考虑,同吋由于各段决策间有机的联系着,木段决策的执行将影响到下一段的决策,所以决策者在每段决策时不应仅考虑本阶段最优,述应考虑对最终目标的彩响,从而做出对全局來讲是最优的决策。动态规划是现代企业管理中的一项重要决策方法,可用于解决最优路径问题、资源分配问题、成产计划与库存、投资、装载、排序等问题及生产过程的最优控制等。由于它有独特的解题思路,在处理某些优化问题时,比线性规划或非线性规划方法更有效。动态规划模型的分类:1•离散确定型;
2、2•离散随机型;3•连续确定型;4.连续随机型。其中离散确定型是最基本的,本次分析是用离散确定型的动态规划模型来进行最优决策的。近儿十年来,动态规划在理论、方法和应用等方面取得了突出的进展,并在工程技术、经济、工业生产与管理、军事工程等领域得到广泛的应用。利用动态规划对生产计划安排进行决策,可以将长久的生产问题一步步具体化,分步化,使计划更清晰,便于管理层进行决策。关键词:动态规划生产计划决策—・动态规划法的基本概念与方法使用动态规划方法解决多阶段决策问题,首先要将实际问题写成动态规划模型,此时要用到以下概念:(1)阶段(2)状态(3)决策(4)策略(5)状态转移(6)指标函数1•阶段用动
3、态规划求解多阶段决策系统问题时,要根据具体情况,将所给问题的过程,按时间或空间特征分解成若干互相联系的阶段,以便按次序去求每阶段的解,描述阶段的变量称为阶段变量,常用字母R表示。上例分六个阶段,是一个六阶段的决策过程。例中由系统的最后阶段向初始阶段求最优解的过程称为动态规划的逆推解法。2•状态状态表示系统在某一阶段开始时所处的自然状况或客观条件。上例中第一阶段有一个状态,即仏}。第二阶段有两个状态,即{y…,等。过程的状态可用状态变量来描述,某个阶段所有可能状态的全体可用状态集合来描述,如S]={Ao},$2={人1'〃1},归={血‘爲‘环型},…。3.决策某一阶段的状态确定以后,从该状
4、态演变到下一阶段某一状态所作的选择称为决策。第〃阶段的决策与第斤个阶段的状态有关,通常用叫(£)表示第斤阶段处于乙状态时的决策变量,而这个决策又决定了第料+1阶段的状态。如上例中在第k阶段用禺(忑)表示处于状态无时的决策变量。决策变量限制的范围称为允许决策集合。用Dk(X,)表示第k阶段从Xk岀发的决策集合。4•策略由每阶段的决策均(旺)(i=l,2,・・・〃)组成的决策函数序列称为全过程策略或简称策略,用卩表示。即卩(兀])={妁(兀])上2(兀2),…,£(£)}由系统的第R阶段开始到终点的决策过程称为全过程的后部了过程,相应的策略称为后部子过程策略。用pg表示R子过程策略。即(心)=
5、仏(心),你+i(%[),•••,叫(£)}对于每一个实际的多阶段决策过程,可供选取的策略有一定的范围限制,这个范围称为允许策略集合。允许策略集合中达到最优效果的策略称为最优策略。5.状态转移某一阶段的状态变量及决策变量取定后,下一阶段的状态就随之而定。设第k个阶段的状态变量为忑,决策变量为蘇(心),则第k+1阶段的状态忑+「用仏严人(心心)表示从比阶段到比+1阶段的状态转移规律,称它为状态转移方程。6•阶段效益系统某阶段的状态一经确定,执行某一决策所得的效益称为阶段效益,它是整个系统效益的一部分,是阶段状态兀和阶段决策蘇的函数,记为儿(心,妆)。7.指标函数指标函数是衡量全过程策略或子过
6、程策略优的数量指标,指标函数的最优值称之为最优指标函数。系统用某一策略而产生的效益用数量表示,根据不同的实际,效益可以是利润、距离、产量或资源的耗量等。指标函数可以定义在全过程上也可以定义在后部子过程上。二.动态规划的逆序解法及matIab实现fk(耳)=min伉(耳,蘇(无))+人+i(忑+i)I妆wQ(无)}A+1(£+1)=°,无+1=Tk(xk,协),R=弘72—1,…,1称此为动态规划逆序求解的基本方程。可以把建立动态规划模型归纳成以卜几个步骤(1)将问题恰当地划分为若干个阶段;(2)正确选择状态变量,使它既能描述过程的演变,乂满足无后效性;(3)规定决策变量,确定每个阶段允许决
7、策集合;(4)写出状态转移方程;(5)确定个阶段各种决策的阶段指标,列出计算各阶段最优后部策略指标的基本方程。三.动态规划模型的建立基木方程:对于〃阶段的动态规划问题,在求子过程上的最优指标函数时,R子过程与R+1子过程有如下递推关系:fk(»)=min{*(»,耳)+fk+l(忑+])},R=為/I_1,…,2,1、fn+l(兀”+1)=0其屮第一式子里的求最小值是指在吐的状态下,在所有作出的各种决策耳中,取一个第k阶
此文档下载收益归作者所有