欢迎来到天天文库
浏览记录
ID:24819464
大小:2.29 MB
页数:86页
时间:2018-11-14
《最优控制与状态估计7》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第一部分、最优控制什么是最优控制?以下通过例子来说明问题1:电动机的运动方程为(1)其中,为转矩系数;为转动惯量;为恒定的负载转矩;希望:在时间区间[0,tf]内,电动机从静止起动,转过一定角度后停止,使电枢电阻上的损耗最小,求因为是时间的函数,E又是的函数,E是函数的函数,称为泛函。(2)采用状态方程表示,令于是(3)初始状态末值状态控制不受限制性能指标(4)本问题的最优控制问题是:在数学模型(3)的约束下,寻求一个控制,使电动机从初始状态转移到末值状态,性能指标E为最小。问题2:对于问题1中的直流他励电
2、动机,如果电动机从初始时刻的静止状态转过一个角度又停下,求控制(是受到限制的),使得所需时间最短。这也是一个最优控制问题:系统方程为初始状态末值状态≤(5)性能指标(6)最优控制问题为:在状态方程的约束下,寻求最优控制,将转移到,使J为极小。≤最优控制问题的一般性提法为系统状态方程为初始状态为其中,x为n维状态向量;u为r维控制向量;f为n维向量函数,它是x、u和t的连续函数,并且对x、t连续可微。最优。其中是x、u和t的连续函数寻求在上的最优控制或,以将系统状态从转移到或的一个集合,并使性能指标最优控制问
3、题就是求解一类带有约束条件的条件泛函极值问题。第一章、用变分法求解最优控制问题一、泛函与变分1、泛函的基本定义:如果对于某个函数集合中的每一个函数,变量J都有一个值与之对应,则称变量J为依赖于函数的泛函,记作可见,泛函为标量,可以理解为“函数的函数”例如:(其中,为在上连续可积函数)当时,有;当时,有。泛函如果满足以下条件时,称为线性泛函:1),其中c为任意常数;2)对于一个任意小正数,总是可以找到,当时,有就称泛函在处是连续的。2、泛函的变分所谓泛函的宗量的变分是指两个函数间的差。定义:设是线性赋泛空间上
4、的连续泛函,其增量可表示为其中,是关于的线性连续泛函,是关于的高阶无穷小。则称为泛函的变分。3、泛函变分的规则1)2)3)4)泛函的变分等于4、泛函的极值设是在线性赋泛空间上某个子集D中的线性连续泛函,,若在的某邻域内在时,均有≥0≤0或则称在处达到极大值或极小值。为了判别是极大还是极小,要计算二阶变分。但在实际问题中根据问题的性质容易判别是极大还是极小,故一般不计算。定理:设是在线性赋泛空间上某个开子集D中定义的可微泛函,且在处达到极值的必要条件是对于在处必有泛函欧拉方程:定理:设有如下泛函极值问题:其中
5、,及在上连续可微,和给定,已知,,,则极值轨线满足如下欧拉方程及横截条件注意:满足欧拉方程是必要条件,不是充分条件。证明:让自变量函数、在极值曲线、附近发生微小变分、,即上式中是高阶项。于是泛函J的增量可计算如下(以下将*号省去)根据定义,泛函的变分是的线性主部,即对上式第二项作分部积分,按公式可得J取极值的必要条件是等于零。因是任意的,要使上式中第一项(积分项)为零,必有上式称为欧拉——拉格朗日方程。第二项为零,就有二、用变分法求解最优控制问题1末值时刻固定、末值状态自由情况下的最优控制非线性时变系统状态
6、方程为(6)初始状态(7)其中,x为n维状态向量;u为r维控制向量;f为n维向量函数。要求在控制空间中寻求一个最优控制向量,使以下性能指标(8)沿最优轨线取极小值。(性能指标如(8)式所示的最优控制问题,是变分法中的波尔扎问题)引入拉格朗日乘子(9)将性能指标(8)式改写为其等价形式定义哈密顿函数(10)则(11)由(6)式可知为零(12)对(11)式中的第三项进行分部积分,得当泛函J取极值时,其一次变分等于零。即可以变分的量:不可以变分的量:求出J的一次变分并令其为零将上式改写成(13)由于未加限制,可以
7、选择使上式中和的系数等于零。于是有(15)(14)(16)由于是任意的变分,根据变分法中的辅助引理,由(16)式得(17)(14)式称为伴随方程,为伴随变量,(17)式为控制方程。几点说明:1)实际上,(14)式和(17)式就是欧拉方程。(18)因为(19)如果令简记成(20)由欧拉方程得到即(21)可见(21)式和(18)式相同,(22)式和(19)式相同。因此,(14)式和(17)就是欧拉方程,而(7)式和(15)就是横截条件。(22)2)是泛函取极值的必要条件是否为极小值还需要二次变分来判断,则泛函J
8、取极小值。3)哈密顿函数沿最优轨线随时间的变化率在最优控制、最优轨线下,有和(10)式的哈密顿函数对求偏导,结果为由(14)式可得因为减号两边是相等标量(行向量与列向量相乘)(23)(24)这两个等于零的式子代入(23)式,于是即哈密顿函数H沿最优轨线对时间的全导数等于它对时间的偏导数。记为则(25)对上式积分,得到(26)当哈密顿函数不显含t时,由(25)式得初始条件例1系统状态方程为性能指标试求最优控制,使J
此文档下载收益归作者所有