欢迎来到天天文库
浏览记录
ID:28675151
大小:747.00 KB
页数:13页
时间:2018-12-12
《基于伪逆的反复学习控制》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于伪逆的反复学习控制摘要——学习控制是用于一固定时间间隔内重复作用的跟踪控制的有效方法。本文给出一种反复学习控制算法,适用于一些具有扰动和初始误差的非线性非最小相位对象。该算法要求对一线性对象的近似转换而非精确转换。这种方法的一个优点是不需区分对象的输出。渐进轨迹误差的范围通过一精确的试验列出,并且可以看到其随着扰动范围持续的增大。该控制器的结构是这样的,其低频部分的轨迹汇合要比高频部分快。索引术语——反复学习控制,非线性跟踪,伪逆。I.绪论反复学习控制用到了一类自调整控制器,其某一特定任务的系统性能在同一任务先前性
2、能的基础上逐渐改善和完美。学习控制的最常见应用是在工业生产的机器人控制领域,这里要求机器人执行一个单一的任务,比方说反复在一给定轨迹下取放物体。单独一个反馈控制器时,相同的轨迹误差会一直在反复的试验中存在。相反,学习控制器可以利用前一次执行信息来改进下一次轨迹执行的性能。而在一些应用中,多次重复一个轨迹的要求不利于学习,所以我们将注意力集中在别的一些场合,那里来说学习控制是自然的解决方案。本文中我们在[1]提出一种反复学习控制算法的修正以使其适用于带有输入扰动和输出传感噪声的非线性非最小相位对象。在章节II,提出一个在
3、起始位置描述一伪逆线性装置的学习控制器。在章节III,举出仿真例子以展示所提学习控制器的性能。最后,章节IV是全文总结。II.具有扰动的非线性非最小相位对象本节中,我们为非线性系统提出一个鲁棒迭代学习算法。我们仅考虑方(相同的输入和输出)时不变非线性系统。A.系统描述来考察一个在x=0时起始近似稳定(也就是说线性对象的所有特征根都在复平面的左半部分)而且输入稳定的非线性系统这里i为ILC的迭代系数,是输入顺序集合,及,。方程表示系统反复随机的有界扰动;它可以是持续的,非可再生摩擦力,和状态独立的模型误差等等。代表传感器
4、噪声。所期待的轨迹维持在有限的时间域。学习的目的是构建一个输入轨迹的顺序如,这样使系统在[0,T]间“尽可能近的”跟踪轨迹。我们做以下假设:(A1)方程是连续可微的,而是连续的。(A2),这里的是Banach空间的封闭子集。(A3)系统是第一渐进稳定和输入状态稳定。(备注:如果系统不稳定,可以运用我们的方法使其稳定)。(A4)扰动和分别由bw和bv限制(也就是说,且)。(A5)所期待的轨迹非常接近于轨迹,其满足以下方程:针对该系统,在图1.B中给出一个反复学习控制。B.学习控制器的描述本节中,图1所示的学习控制器的一个
5、好的候选者可以这样获得,首先对对象进行线性化,然后用一个伪逆的线性装置作为学习控制器。现代的反复学习控制法则由因式P,线性对象,其伴随矩阵和时域t∈[0,T]组成,也就是:注意到对所有的i如果(注意在图1中,减因子放置在汇合点之前)。定义:由于非线性系统(1)是输入状态稳定(A5)且是连续的(A1),因此这样定义一个因果关系的非线性输入到输出的映射P:。因为P是第一状态渐近稳定的(A5),我们定义一稳定时不变的输入到输出线性因式,需要对系统(1)在内线性化:图1,非线性学习控制系统P:非线性对象,LC:学习控制器,:负
6、因子这里,因此,。由于且A为赫兹【在(4)中】,我们可以用代替而不必改变(4)中定义的输入输出(I_O)映射,因此得到的唯一映射是1—1。定义:考察伴随系统的I—O映射由于A是赫兹,-AT为双曲线的(也就是,所有的特征值都没有零实部),从而(5)式定义了唯一的无关联映射,如Devasia等给出的(参见附录)。。伴随系统满足.定义:忽略较高阶限制,我们可以在方程(1)的解附近获得一个线性对象:这里。因为(4)是稳定的,可以根据李亚普诺夫方法证明,如果有界那么(6)也是有界输入输出稳定的。注意,这里我们也可以用代替(如(4
7、)中)而且没有改变输入输出映射。定义。线性稳定系统(6)有解并且定义了一个线性输入输出映射:。定义:由伪逆【4】的观念启发,我们通过下面的线性因子来定义学习控制器:因为,我们把“近似反转”称为的α-伪逆。为简单起见,下文把α-伪逆称为简单伪逆。在时域下用(4)和(5):因为是稳定的,(8)是具有特征根的双曲线,因此,【2】中且是无关联的。在(8)中解,我们可以看到反向算子为:上面系统的特征根α的连续函数。在极限为双曲线的(因为A为赫兹)。从而我们通常对双曲线选择一个α。系统(9)可以根据Devasia等人的稳定无关解方
8、法解决。因此,学习控制器是伪逆且在时域中给出:Ac是对角块,因此Ac的特征根是(9)和的特征根。由于是α双曲线的,因此Ac为双曲线。从而,及(10)所描述的线性控制器的解可以利用稳定无关解[2]求得。(使用时而不是时的初始条件可以通过控制)。因此跟踪性能可以根据假设和得到改善。C.集中分析定义1:我们为方程定义λ标准:注意意味着和
此文档下载收益归作者所有