资源描述:
《浅谈基于模型集动态优化的鲁棒多模型自适应控制》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
华南理工大学硕士学位论文基于模型集动态优化的鲁棒多模型自适应控制姓名:李锋申请学位级别:硕士专业:控制理论与控制工程指导教师:周有训20040501 摘要摘要传统的单模型自适应控制方法无法适应当前复杂系统越来越高的控制需求,而多模型自适应控制器作为单模型自适应控制方法的自然扩展,被认为是当前自适应控制最重要的发展方向之一。由于多模型自适应控制器能够在更广范围内覆盖系统的不确定性,能够适应系统更剧烈和更复杂的变化,因此得到了理论界和工程界的广泛重视。然而由于对系统不确定度和未建模动态等因素缺乏足够的先验知识或者由于系统动态性能变化过大,现有的多模型自适应控制器存在着模型集过大、模型集优化算法复杂以及控制性能不够理想等问题,因此研究一整套既能简化控制算法,又能提高控制性能的多模型自适应控制解决方案,无论在理论和实际应用中都有非常重要的意义。本文在分析分析前人工作的基础上,首次引入了鲁棒自适应控制器,提高了系统的鲁棒性能;首次提出了一整套以Vinnicombe距离为标准来动态优化模型集的多模型自适应控制器,有效地解决了简化控制算法与优化控制性能之间的矛盾,仿真结果也证明了其优越性。在多模型切换方面,本文也作了比较有益的尝试和改进。引入了滞后切换概念和新型的切换指标函数,初步解决了模型间切换的快速收敛问题;同时本文提出仅在两个自适应模型之间进行切换,相比于传统的模型集直接参加切换的方式可以提高模型间切换的稳定性。关键词:多模型;自适应控制;切换;鲁棒;动态模型集 华南理工大学硕士学位论文AbstractTraditionalsinglemodeladaptivecontrolstrategycan'tmeetmoreandmorecomplexsystem'sneednow,sothemultiplemodeladaptivecontrolstrategyappearsasoneofthemostsignificantdevelopingdirectionsofthesinglemodeladaptivecontrolstrategy.Becausemultiplemodelscancoverthewiderrangesofuncertaintyandcanadaptthemselvestothemorecomplexandseveresituations,sotheoristsandengineersbegintofocusonthem.Butthereisshortoftheinitialinformationofuncertaintyortheknowledgeofsystem'sseveredynamiccharacteristics,therefore,itisimportanttofindasimpleandoutstandingmultiplemodeladaptivecontrolstrategyforboththeoreticalandpracticalstudy.Basedontheformerstudies,thispaperintroducestherobustadaptivecontrollerintomultiplemodeladaptivecontrolstrategyforthefirsttime,whichimprovessystem'srobustperformance.Ontheotherhand,thispaperbringsforwardasystematicintelligencestrategyformultiplemodeladaptivecontrollersbasedontheVinnicombeDistancetooptimizemodelbankdynamically.Thisstrategycanreleasecomputingburdeneffectivelyandimprovecontrolperformance,andnumeroussimulationresultstestifytheadvantagesofthisstrategy.Consideringswitchingstrategybetweenmultiplemodels,thispaperalsomakessomeattemptsandmakessomeproperimprovements.Theswitchingstrategyintroducestheconception,ofhysteresisswitchingandanewtypeswitchingindexfunction.Alltheseimprovementssolvetheproblemofswitchingconvergenceprimarily.Thisstrategyattemptstoswitchonlybetweentwoadaptivecontrollers,therefore,itcanimprovethecontrolperformanceofswitchingstabilizationcomparingwiththetraditionalswitchingstrategy.KeyWords:multiplemodels;adaptivecontrol;switching;robust;dynamicmodelbankn 华南理工大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。渗烤作者签名叮!日期:”‘年‘,u尸日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华南理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在_年解密后适用本授权书。本学位论文属于不保密Do(请在以上相应方框内打“了,’)作者签名:才日期:沙‘年‘月广日导师签名:周伽口日期:7.vq*石月9日 第一章绪论第一章绪论1.1多模型自适应控制的发展历史由于传统的单模型自适应控制算法往往是基于一个参数固定或慢时变的系统,因此越来越无法满足现代的实际复杂系统的控制需求。在这种背景下,控制理论界提出对于具有一定不确定性的系统,用多模型来覆盖、逼近系统的动态性能,再基于多模型设计出多模型自适应控制器,这种控制器对于复杂系统能达到较好的控制精度、跟踪速度以及稳定性。多模型自适应控制最早在本世纪70年代初期时由D.G.Lainiotis等提出,是一种基于后验概率加权的多模型控制算法,即根据模型误差对每个局部模型构成加权值,当前控制器为多个局部模型控制器输出的加权和,目前在此方面以Z.Binder等为主要研究力量。之后理论界又提出了直接多模型自适应控制以及间接多模型自适应控制。直接多模型自适应控制以M.YFu和G.C.Goodwin教授的研究为主,主要特点为根据被控对象不确定空间确定依序建立的多个局部模型以及相应的控制器,控制过程中依次判断局部模型直到能使闭环系统稳定的模型上为止。K.S.Narendra提出了间接多模型自适应控制的概念,这种方案的基本思想为离线建立一组包含有N个固定模型的模型集来近似覆盖对象的不确定空间,另外还有两个自适应模型,一个自由运行,另外一个可以实时赋初值,由自由运行的自适应模型来保证稳定性,而由固定模型集以及实时赋初值的自适应模型来保证系统暂态快速响应的性能。由于这种方案的设计思路简单,并且稳定性证明相对容易许多,因此得到了广泛的应用。这也是本文算法的主要基础。1.2多模型自适应控制的研究现状目前关于多模型自适应控制理论的主要研究领域包括三个基本问题:模型集的建立问题;模型切换系统问题;多模型的结构问题。1.2.1模型集的建立在多模型控制方面,所建立的模型库的好坏直接影响到控制的性能。在控制 华南理工大学硕士学位论文理论领域,很多专家己经开始注意到在这方面理论研究的欠缺,在此方面做了一些有益的尝试,并且得到了一些初步的成果。由于初始建立的模型库并不一定能够消除系统运行时出现的噪声、扰动以及未建模动态等动态因素的影响,而且模型数量过少对动态系统的近似不够精确,模型数量过多又会增加系统的计算负担,所以不良的模型库会引起系统切换不稳定以及切换抖动等现象,因此有必要建立能够实时变化的有效的模型库,以满足系统的各种实时性的要求。在优化模型库方面,控制理论界也提出了各种改进算法,主要包括以下几种方案:①基于K-BN等的建模方法[141,能够在系统运行工作点两侧分别建立两个局部即时近似线性模型,根据这两个线性模型的加权平均得到即时模型对系统控制,并可以在系统运行动态特性变化不大时停止建模过程;②使用多个初始固定模型构成模型库,在线选取几个最为接近系统动态的模型进行加权平均得到近似模型进行控制[161③通过移动模型子集以及不断缩小模型域来达到控制的精度要求[V).④通过在线为模型库添加新模型的同时删除旧模型来保持模型库中模型数量的不变,达到动态更新模型库并且不增加模型数量的目的[IS),或者既可以动态为模型库添加新模型,同时又具有更新模型功能的方案[191。但是上述方案存在计算繁杂以及控制方案不够系统和完备等问题,在复杂系统中以及受到不确定因素的影响时,会出现系统运算负担过重或出现控制性能恶化等情况。1.2.2模型切换系统如果系统受到独立的、随机的、短暂时间的扰动时,是否需要对此扰动进行响应,建立新模型或立即切换到相近模型进行控制?如果是这样的话,系统反而会由于频繁切换引起抖动甚至不稳定的现象。因此我们可以考虑引入滞后切换策略,对系统的稳定运行具有良好的作用。在这方面,也有很多控制领域的专家进行了各方面的深入研究,包括以下几个方面:①由指标函数作为滞后切换的标准[201。设在‘时刻采用控制偶对(M;,c,),‘时刻最小指标函数为r,(t)一‘1711引ii(t)},若i;(t):5Jk(t)十8',则仍采用控制偶对(Mj,cj):若ii(t)>Jk(t)十8,则控制切换到偶对(M,,c),其中S为滞后因子,可以根据实践经验依据不同对象进行调节:②基于预测控制理论[211。根据预测的系统输出值依据一定的指标适当提前切换模型以及相应的控制器,实现比较平缓的切换过程,但是这也仅适合于系统动态性能变化不大的情况。③提出一种比例独立的滞后切换算法[15,221,这种方法在理论分析时非常方便,在实际中也有一定的应用价值。 第一章绪论1.2.3多模型的结构在多模型的结构方面,一般来说,控制理论界多沿用Narendra的方案,即离线建立一组包含有N个固定模型的模型集来近似覆盖对象的不确定空间,另外还有两个自适应模型,一个自由运行,另外一个可以实时赋初值。每个模型都有一个指标函数,在系统运行的每个时刻根据指标函数来对各模型进行比较。当系统判断当前时刻最优指标函数属于某个自适应模型时,则两个自适应模型各自自由运行;而当系统判断当前时刻最优指标函数属于某个固定模型时,把此固定模型的参数赋值给实时赋初值的自适应模型,使其以此参数为起点进行之后的自适应运算。在每个时刻切换入系统的控制器是系统判断得出的最优模型相对应的控制器。这种方案的主要设计思想是针对实际应用中具有一定不确定性的复杂系统,可以由自由运行的自适应模型来保证稳定性,而由固定模型集以及实时赋初值的自适应模型来保证系统暂态快速响应的性能。1.3本课题研究和开发的主要内容在深入研究和分析多模型自适应各个基础问题的不同发展程度的基础上,针对目前多模型自适应控制存在的种种问题,适应当前控制理论的发展需求,本论文对多模型自适应控制在以下几个主要方面作了比较深入和有益的算法改进。1.在建立模型集方面,提出一种新型的在线优化多模型(模型集)的策略。这种方案可以根据已知的先验数据来离线建立一定数量的模型,以保证系统初始运行时的控制性能,模型集中模型的初始数量可以根据先验知识的多少和系统的复杂程度来确定,当先验知识完全未知时,模型集中的模型数量可以为零。在系统运行过程当中,依据各模型的指标函数来判断当前时刻的最优模型。当系统判断当前时刻最优指标函数属于模型集中的某个模型时,则把此模型的参数赋值给实时赋初值的自适应模型;但是如果系统判断当前时刻最优指标函数属于某个自适应模型时,则两个自适应模型各自自由运行的同时根据当前时刻的参数情况判断模型集中与最优模型最为相近的某个模型对于最优模型的距离。当此距离大于某个值时,说明此模型无法良好地控制对象,需要把最优模型的参数作为基准来对模型集建立(添加)一个新模型来适应当前情况;当距离小于某个值时,说明系统在基本稳定运行阶段,系统的动态性能变化不大,无需对模型集进行更新的操作:最后一种情况,当距离在以上两个值之间时,则说明虽然当前模型可以对系统进行良好的控制,但是有可能还没有达到足够精确的程度,因此在这种情况下可以根据最优模型的参数来对最为相近的模型进行一定方式的修改更新。 华南理工大学硕士学位论文对于以上两个模型间距离阀值的设定问题,直接关系到系统的控制性能。当阀值设定过大时,模型集中的模型无法覆盖对象不确定空间或者无法保证系统的稳定性;当阀值设定过小时,会使模型数量急剧增加,系统运算负担也相应急剧增大。因此在此算法中可以通过相近度阀值来控制模型集中模型的数量,并且增加了一种删除冗余模型的算法,以使系统达到良好的控制性能。2在切换系统方面,引入了一种新型的切换指标函数,相对于传统的切换指标函数来说能够提高系统的切换稳定性能。另外,尝试仅在两个自适应模型之间实行切换动作,动态模型集仅实现更加有效地覆盖对象不确定空间以及对实时赋初值的自适应模型进行赋值的功能,这样可以避免当模型集中的模型数量N比较大的情况时在各模型之间进行大幅度的切换而带来的切换抖动或者对整个系统的稳定性等问题。3.在自适应模型结构方面,由于自由运行的自适应模型完全独立运行,不受模型集以及另外一个自适应模型的影响,因此考虑对这个自适应模型进行一定程度的改造。考虑到在系统运行的某个时刻,此自适应模型的参数还需要改造模型集中的模型或者添加模型,因此其结构可以不变,但是关于其相应的控制器可以依据第二章中的鲁棒自适应控制算法进行改造,这样针对同样的结构,可以更加有效地保证系统一定程度上的鲁棒性。综上所述,本文提出了一套完整的基于多模型在线动态优化的鲁棒自适应控制算法,仿真实验也表明了该算法的有效性。在以下各章节中将针对该算法的各个细节问题进行详细的阐述。1.4本文中各章节的内容安排本文第二章主要介绍传统的关于线性系统的单模型自适应控制方法。其中基于对象(过程)参数已知时的极点配置法主要应用于模型集中各模型的控制器设计;关于对象(过程)参数未知时的极点配置法主要应用于可以实时赋初值的自适应模型相应的控制器设计;对于自由运行的自适应模型,其相应的控制器设计为鲁棒极点配置自校正的控制方法。此方法是结合鲁棒自适应控制律和极点配置控制律所得到的,并且在本文中用仿真证明了算法的优越性,该算法也是本文整套多模型自适应控制算法的一个组成部分。第三章中主要阐述模型集的建立问题。引入闭环灵敏度传递函数矩阵和Vinnicomb。距离的概念,并根据由此引出的简化表达式来解决以有限多个模型来精确覆盖受控对象不确定域的问题,并且给出了初始模型集的建立方案。第四章主要介绍了多模型切换系统的一般结构,引入了一种关于比例独立的滞后切换逻辑。 第一章绪论第五章综合以上各章节的分析,提出一套完整的基于模型集动态优化的鲁棒自适应控制方案。包括停止优化模型、更新模型、创建新模型以及删除模型等功能在内的模型集动态优化方案;引入一种新型的切换指标函数并且改进切换方式;改进传统的多模型结构。第六章对本文所提出的基于模型集动态优化的鲁棒自适应控制方案由简单到复杂的情况在Matlab6.5下进行了一系列的仿真研究。 华南理工大学硕十学位论文第二章线性系统的自适应控制本章主要阐述本文的多模型算法中各不同模型所使用的不同的自适应控制方案,以及本文所引入的一种全新的鲁棒极点配置自校正控制方案。2.1传统自适应控制系统在实际的控制方案中,为了解决控制对象参数在大范围区域内变化的情况,以及一般反馈控制、最优控制和采用经典校正方法不能解决的控制问题,参照在日常生活中生物能够通过自觉调整本身参数改变自己的习性以适应新环境的特性,从而提出了自适应控制器的设想。自适应控制器应能够及时修正自己的特性以适应对象和扰动的动态特性变化,使整个控制系统始终获得满意的性能。为此,所构思的自适应控制方法应该能够做到:在系统运行中,依靠不断采集控制过程信息,确定被控对象的当前实际工作状态,优化性能准则,产生自适应控制规律,从而实时地调整控制器结构或参数,使系统始终自动地工作在最优或次最优的运行状态下。自适应控制一般分为两大类:模型参考自适应控制和自校正控制。1.模型参考自适应控制系统MRAC模型参考自适应控制系统的基本结构如图2-1所示。其设计目标是,使系统在运行过程中力求保持被控过程的响应特性与参考模型的动态性能的一致性,而参考模型始终具有所期望的闭环性能。Y.(r(t)可调控制器/uI}(t)JY},fcivXe(t(W)t))E-+Y(t)图2-1模型参考自适应控制系统框图Figure2-1Generalstructureofmodelreferenceadaptivecontrolsystem模型参考自适应控制系统的主要技术问题是实现性能比较和自适应控制器的 第二章线性系统的自适应控制设计。其实际运行可分3个阶段:①比较闭环性能,产生广义误差;②按照自适应规律计算控制器参数;③调整可调控制器。2.自校正控制系统STC典型的自校正控制系统如图2-2所示。自校正控制系统也具有三大要素:①过程信息采集;②控制性能准则优化:③调整控制器。过程信息采集是指在测量过程输入、输出或状态信号基础上,连续确定被控过程的状态。过程模型和参数估计及不可测量信号(如随机噪声信号)估计,取决于信息采集的方法。根据信息采集和估计方法的不同,形成各类自校正控制系统。控制器过程棍型参数计茸在线辨识r(t)Y(t)赢感l}门u(t)/图2-2典型自校正控制系统框图Figure2-2Generalstructureofself-tuningcontrolsystem辨识完全建立在对控制过程输入和输出信号测量的基础上。控制器参数的计算则依据被辨识的过程模型或估计参数,而且辨识和控制器设计算法都是闭环实时在线实现的。性能准则优化是指回路性能计算和决策如何调整自适应控制器。控制器调整是指新的控制器参数计算及控制回路中旧参数的更换。自校正控制系统的设计目标是,在所有输入信号和过程条件下,确定最优化过程模型和获得闭环系统的最优控制品质。在设计中,大多数自校正控制系统使用了分离原理,使过程或信号估计与控制器最优化设计分离进行。在自校正控制系统中,又分为最小方差自校正控制方法和极点配置自校正控制方法等。最小方差自校正控制方法不适合于逆不稳定系统,即不适用于非最小相位系统。虽然连续系统中很少遇到非最小相位系统,但在离散系统中可能会较多地遇到。另外,利用计算机进行控制的连续系统,当采样周期取得不适当时,也可能出现非最小相位系统。而因为极点配置法可以安排闭环系统极点,所以该方法既适用于最小相位系统,又适用于非最小相位系统。因此,在本文的设计中,主要考虑极点配置自校正控制方法。 华南理工大学硕士学位论文2.2极点配置自校正控制2.2.1对象(过程)参数已知时的极点配置设计极点配置的主要目的是找到一个反馈控制律以使得闭环传递函数的极点被配置于期望的位置。本节讨论对象(过程)参数已知情况下的极点配置设计问题。现假设被控制的对象(过程)由以下方程描述:A(q')y(t)=B(q`)u(t)+v(t)(2-1)A(q-1)=1+a,q'+a2qZ+...+a_q-n0B(q')=qe0(bo+b,q`+b2q2+...+bnhgnh)其中,a(t)为控制变量,y(t)为对象的输出,v(t)为扰动量,q,为后移一步算子,A(q-')和B(q-')为后移算子多项式,为简单起见下面直接用A和B表示,一般情况下,需要满足以下两个条件:A为首一多项式以及A和B为互质。心=degA-degB表示过程的时延步数。假设线性控制器的方程表述为Fu=万r一Gy(2-2)F=1+人q-'+几q-2+.二十寿q-rG=Bo+glq'+S2q2+。二+gnpq一ngH二气+气q一1+气q一十⋯十气、hq-nh式中的多项式F,G,H可以借助图2-3来理解,由调整F,G,H中的参数来实现极点配置控制。图2-3控制系统结构Figure2-3Structureofcontrolsystem 第二章线性系统的自适应控制结合式(2-1)和式(2-2),可以得到B万FY二—r十—V(2-3)AF+BGAF+BG上式中的分母AF十BG为闭环特征多项式,如果我们希望配置极点如下式T=1+t,。一‘+tZq2+...+t=q'"(2-4)只需要令AF+BG=T(2-5)但是上式中对象的零点又分为两部分,其稳定的零点是希望被消去的,而不希望对象中不稳定的零点和阻尼很差的零点与控制器的极点相对消。为此,可以将多项式B分解为B=B`B-(2-6)其中B'是由稳定的和阻尼良好的零点所组成的多项式,而且是首一多项式。这些零点可以与控制器的极点相对消;相反B一表示不稳定的零点和阻尼很差的零点,是不可以对消的。当B'=1,表示B中没有任何零点被对消;当B-=1,表示B的所有零点都可以被对消。既然B'被对消,所以B+也是闭环特征多项式的因子。因此(2-5)式可以修改为AF+BG=TB'(2-7)由于A与B互质,由上式知,B+应能整除F,因此有F二F'B'(2-8)AF'+B-G=T考虑另外一种情况,从参考输入;到希望的输出响应Y,=,可以由以下动态方程描述:人入=Bmr(2-9)对比于式(2-3)和式(2-9),为了获得期望的输入一输出响应,必须满足下列条件:凡召刀一人几(2-10)AF+BG.类似于以上的分析,可以得到F二F'B十勺人(2-11)AF’十B-G=其中Ao是指定的观测器多项式,为稳定的首一多项式,在设计中可以事先给定。这样我们得到了两种情况下的Diophantine方程,分别如(z-s)和(2一11)所示。如果两方程中的A,B一互质,则它们都有唯一解,即控制器参数,也即多项式F',G有唯一解。本文中主要以后一种情况为主进行讨论。可以证明〔幻,极点配置设计如果存在因果解,那么它就是物理上可实现的,其必要条件必须满足以下两个不等式: 华南理工大学硕士学位论文deg人一deg氏?degA一degB(2-12)deg人之2degA一deg人一degB+一1(2-13)其中不等式(2-12)的物理意义为在参考模型M=Bm/Am中的相对阶次最低限度必须和对象P=侧A的相对阶次一样大。不等式(2-13)意味着获得一个在物理上可以实现的控制律,观侧器多项式的次数必须充分高。另外根据Diophantine方程有解的条件,可以设degF'=degB--1(2-14)degG=degA一1=na一1综上所述,可以得到当对象(过程)参数己知情况下的极点配置的设计的步骤如下:己知条件:己知A和B,给定人和民第1步:把B因式分解为B=B'B-其中B+是由稳定的和阻尼良好的零点所组成的首一多项式;相反B一表示不可以对消的不稳定的零点和阻尼很差的零点。第2步:由以下不等式degAo?2degA一degA.一degB+一1给定Ao的表达式。第3步:根据Diophantine方程有解的条件degF'=degB--1degG=degA一1=na一1设计F’和G,并且由Diophantine方程AF’十B-G=AA.求得F’和G。第4步:由方程F=F'B'H=人氏/B求得F和Ho第5步:由控制律Fu=Hr一汤求得控制变量“。特殊情况1:所有零点被对消,此时B一=b,B=baB`特殊情况2:没有任何零点被对消,此时 第二章线性系统的自适应控制B'=1B=B-2.2.2对象(过程)参数未知时的极点配置设计当对象(过程)参数未知时,为了使控制器的参数收敛到希望的参数值,需要使其参数实现自校正调节,具有这种性质的调节器称为自校正调节器。自校正调节器的设计思想是把未知参数的估计和控制器的设计分开进行。其中未知参数用递推估计方法在线辨识,辨识出的参数就看作是真参数来用于控制器的设计,即不考虑辨识的不定性,这种原理称为确定性等价原理。需要注意:确定性等价原理适用于采用二次型性能指标的线性系统,对一般的非线性系统并不适用。将递推参数估计算法和极点配置的控制算法结合起来,就得到一种间接的自适应控制算法。间接的意思是指控制器的参数不是直接更新的,而是通过估计过程模型参数而间接实现更新控制器的参数。如果把估计模型重新参数化,就不需要估计过程参数而直接估计控制器参数,由此得到的控制算法称为直接自适应算法。由于间接自校正极点配置方法思路直观,我们在以后的讨论中主要考虑此种方法。间接自校正极点配置直观地估计对象A,B的参数,然后再把这些参数估计用于控制器参数F,G和H的设计。仍然以式(2-1)中描述的过程为考虑对象,考虑确定性的情况,即随机千扰项为零。为了估计参数的方便,仅考虑确定性情况,即,(t)=0,我们可以把式(2-1)以另外一种方式描述:y(t)=OT(t一1)9(2-15)其中,BT二氏,b,,...,b,6,a,o,,,.,a_1OT(t一1)=[u(t一do),...,u(t一do一nb),-y(t一1),。二,-y(t一+})l那么对过程应用具有指数遗忘性质的最小二乘估计器,得到B(t)=B(t-1)+K(t)s(t)(2-16)二(t)=y(t)一OT(t一1)B(t一1)(2-17)K(t)=P(t一1)必(t一1)(A+沪T(t一I)P(t一1)0(t一1))一‘(2-18)P(t)=(I一K(t)OT(t一1))P(t一1)/A(2-19)其中NO为正定矩阵,兄为遗忘因子,一般取A=0.95-1。但是如果在随机情况下如果v(t)#0,那么,最小二乘估计是有偏估计,这时必须采用递推增广最 华南理工大学硕士学位论文小二乘法或递推最大似然法来估计参数。如果加到过程的输入信号是充分激励的,估计模型的结构又是适宜的,那么当闭环系统稳定时,这些估计都将收敛于它们的真值,各种估计方法的收敛性是非常重要的。基于极点配置设计的间接自校正控制器可用以下算法描述。已知数据:希望的闭环脉冲传递函数B.1A.,以及希望的观测器多项式A,o计算步骤第1步:用上述最小二乘法或另一种也能估计多项式的方法,如递推增广最小二乘法或递推最大似然法等方法递推估计对象的多项式A和B的系数。第2步:用第1步得到的估计代替A和B,求解方程AF'+B-G=人人求得F’和G。第3步:由方程F=F'B`H=凡凡/B求得F和H。第4步:由控制律Fu=万r一Gy求得控制变量“。在每个采用周期中重复上述步骤。2.3鲁棒极点配置自校正控制上一节介绍的自校正律和控制算法是基于对象无噪声、无扰动以及无未建模动态的情况的,如果把上述控制算法应用于实际对象,很有可能偏离原来的对象模型,甚至发散。这是由于:①在足够高频段,总是存在未建模动态,想对未建模动态进行建模是徒劳的;②被控过程不能与未知的千扰区分开来。本节将会针对上一节的控制算法提出一种具有鲁棒性的自适应极点配置控制算法[4]来应用于更为复杂的对象模型,包括考虑在实际过程中经常遇到的一大类不确定性情况,以及存在外部干扰的情况。2.3.1自适应控制的鲁棒性问题一个实际的被控对象或者是由于过于复杂,其动态特性还没有被充分了解,或者是为了要获得简单的控制器而有意将高阶对象模型降阶处理,这些原因都会给对象带来不确定性。 第二章线性系统的自适应控制一个控制算法的基本特性应当满足在存在不确定性的条件下,系统仍能够保持稳定,这个特性称为控制算法的鲁棒性。在自适应控制过程中遇到的不确定性问题可以分为两大类:结构化不确定性与非结构化不确定性。结构化不确定性主要表现为标称模型传递函数的零极点位置不准确以及对象参数的变化等情况;非结构化不确定性又简称为未建模动态,主要表现为对象高频动态特性的忽略。自适应控制可以通过在线辨识而不断减小结构化的不确定性,从而达到在一定频率以下可调系统与参考模型的完全匹配。所以经典自适应控制算法难以解决的是非结构化的不确定性,即未建模动态。非结构化不确定性主要分为三类:加不确定性,乘不确定性和稳定因子不确定性。假设实际对象的传递函数为G(s),对象的标称模型或近似模型的传递函数为G,(s)1加不确定性如果G(s)和瑞(s)的关系如下G(s)=Go(s)+A.(s)(2-20)其中△q(s)是稳定的。那么△q(s)称为加不确定性。Oa(s)通常为未知但是在频域内有一定的上界。2.乘不确定性如果G(s)和吼(s)的关系如下G(s)=吼(s)(1+A.(s))(2-21)其中△m(s)是稳定的。那么△.(s)称为乘不确定性。Am(s)通常为未知但是在频域内有一定的上界。3.稳定因子不确定性如果G(s)和G.(s)的关系如下戈(s)+o,(s)No(s)G(s)=G,,(s)=(2-22)几(s)+Az(s)D=(s)其中戈和几为合适的稳定有理传递函数,并且互质,e,(s)和△2(s)是稳定的。那么△,(s)和△'(s)称为稳定因子不确定性。图2-4为以上三种对象模型不确定性的结构框图表示。以上定义的各不确定性△a(s),A.(s).A,(s)和△Z(s)通称为对象模型非结构不确定性。2.3.2鲁棒自适应律本节中,我们将针对具有未建模动态以及有界干扰的高阶对象设计简化的对象模型来设计其鲁棒自适应律。考虑实际的对象可使用以下的高阶对象模型来描述, 华南理工大学硕士学位论文y=吼(s)(1+A.(s))(u+峨)(2-23)其中吼满足上一节的假设条件,即①A(s)为首一多项式且degA己知;OB(s)与A(s)互质且degB0为指定正数,-It为指数衰减因子,d,=sup,队(r)卜同样地s"-`10(=)I‘E(2-28)AP(s)一;(11.11121+11Yr1111)当假设1/AP(s)和△.(S)在Re[s]?-S/2范围内存在解析解以及limB(s)△二(s)二0时,AP(s)上述不等式中的H2,范数是存在的。由于对象传递函数几(s)和G(s)在、*。时趋于零,那么炕△。和BA,=/A,也是趋于零的。假设在某个己知的氏>0时,Am(s)在Re[s]>_-氏/2内有解,那么如果我们设计AP(s)在Re[s]<一氏/2内有解,这样只需令8=氏就有不等式(2-27)和(2-28)。定义m为如下表述,m2=1+11u,1128p+11yr112,%那么m可由如下方程求得,耐=1十n,2,n5二m,·伙8oms+u2+y2,mg(0)一。(2-29)利用上式(2-29)和参数模型(2-26)就可以得到一种广义的鲁棒自适应律[a1:乡=rgo一氏rd 华南理工大学硕士学位论文Z一户Tom2mz=l+n,,嘴=Ms,rim,=-8om,+u2+Ys,m,(0)二0s"之-—y,A,(s)-ff‘.ifIdl<-Malesesasj--l胜‘.Qo(蚤一‘),im,2Mo(2-30)其中,B为e的估计值,Mo>IB1,v,>0并且r=FT>0上述的自适应律可以保证(i)e,en=0,0cL-(ii)£,纸,eES(r/2/m2),O,Z,m各自独立有界【412.3.3极点配置控制律在很多控制问题中,参考输入或设定值r可以用以下模型描述,Q,(s)r=0(2-31)其中Q,(s)为已知首一多项式,degQ,=nq。例如当;=const时,Q,(s)=s。在极点配置自校正控制中,需要满足9(s)与B(s)互质。与2.2节稍有不同,我们考虑控制律Q,(s)F(s)u=-G(s)y+H(s)r(2-32)其中degF=n-1,degG=nq+n-1,degH=nq+n-lo那么可以得到Diophantine方程如下Q,FA+BG=T(2-33)其中T为Hurwitz首一多项式,degT=2n+na-1a2.3.4鲁棒自适应极点配置控制方案设计以下本文把2.3.2中的自适应律和2.3.3中的控制律结合起来,把模型中的未知参数A,B用自适应律在线实时估计的值入和舌代替,然后代入Diophantine方程解得户和d,从而得到需要的实时控制变量“。我们引入的鲁棒自适应极点配置 第止章线性系统的自适应控制控制的详细算法如下所述。1.实际对象A(s)y二B(s)(1+A.)(u+氏)2.对象模型A(s)y=B(s)uA(s)=SD+氏T久-,(s)B(s)=BbTa-1(S)B-[BbT,BT]T3.参考输入信号9(s)r=04.假设(1)对象模型与Q,(s)满足如下假设:O1A(s)为首一多项式且degA己知;②B(s)与A(s)互质且degB0,A,(s)在Re[s]>_-氏/2范围内存在解析解5鲁棒自适应律:基于参数模型z=9T必+r/其中.a',(s)嵘i(s)AD(s)Y,P=t"才一u,-y]TAD“一奇AD[A。二(1+Am)d=]应用鲁棒自适应律0=rfilo一氏re:一BTA,,m2=1十嘴,心=m.,,m2代=一戈m,+u2+y2,m,(0)=0s"之二丫气-Y,AD(s)‘了0,诊..if1C15Mo‘|入曝月.氏-月‘几-︸.刀1>,ifMo<一e卜2M,...氏ifIdl>2M, 华南理工大学硕士学位论文6.控制器参数计算由Diophantine方程9(s)F(s,t)A(s,t)+B(s,t)G(s,t)=T(s)求解户(s,t)二s"-'+IT(t)a_,(s)和d(s,t)=91,(t)久..4-l(s)7.控制律。==((A一PQ.)“一‘(,一;))八8.设计变量(1)A二气Aq,其中A,和A;分别是阶次为n和nq-1的首一Hurwitz多项式,并且其根在Re[s]<一氏/2内;(2)T(s)是阶次为2n十nq-1的首一Hurwitz多项式,并且其根在Re[s]<一戈/2内;(3)Q,(s)是阶次为nq的首一多项式,在虚轴上无重根。2.3.5仿真实例考虑一阶对象y=不a(I+A.(s))u其中一1,b=‘为常数,△二(s)=斋“乘不确定因子,不同的“值表示不同大小的未建模动态△.(s)。使用Simulink仿真工具设计鲁棒自适应极点配置控制算法使对象建模部分(Am(s)=0)的闭环极点配置到T(s)二(s+1)z,y跟踪常值参考输入信号r=1.由图2-5可以看到,当k从0逐渐增加时,输出响应y逐渐变差,当k?0.28时,闭环系统失稳发散。仿真表明,本节引入的鲁棒自适应极点配置控制算法在一定范围内具有鲁棒性。2.4本章小结本章首先介绍了基于线性系统无噪声、无扰动以及无未建模动态等理想情况下的经典极点配置自校正控制策略,之后在考虑上述未知因素的情况下讨论了一种具有鲁棒性的极点配置自校正控制算法,仿真结果证明了其有效性。在本文的 第二章线性系统的自适应控制多模型自适应算法设计中,模型集中各模型相对应的控制器将使用对象(过程)参数己知时的极点配置方法;实时赋初值的自适应模型相对应的控制器将使用对象(过程)参数未知时的极点配置方法:自由运行的自适应模型,其对应的控制器将使用鲁棒极点配置自适应校正算法。k-0.2k=6门k=0Mk=0.01书辉西哥橄贫2468,。12141618如时间(秒)图2一5鲁棒自适应极点配置控制在不同k值时的不同响应曲线Figure2-5Plantoutputresponsefortherobustadaptivepole-placecontrolfordifferentvaluesofk 华南理工火学硕+学位论文第三章多模型覆盖3.1多模型覆盖的研究概况基于多模型的自适应控制是自适应控制领域内最近发展起来的一种比较有效的自适应控制方案。多模型的思想是对于具有一定不确定性的系统,用多模型来覆盖系统的动态性能,再基于多模型设计出多模型自适应控制器,这种控制器对于复杂系统能达到较好的控制精度、跟踪速度以及稳定性。假定未知对象的过程动态性能可由一组简化的近似对象模型集(库)完全覆盖,那么就可以确定一组控制器有限集(库),可以保证对象模型集中的每一个模型都可以由控制器集中的至少一个控制器进行良好的控制。自适应控制算法首先把控制器集中的任意一个控制器定义为初始控制器切入闭环中,按照闭环系统的自适应算法,在线根据控制性能在各控制器中进行切换,直到选择到满意的控制器为止。当然也有可能初始控制器即可达到最佳的控制效果,这种情况下无需进行切换。当选择到较满意的控制器时,如何在之后的控制中不断调节、更新以至切换,始终保持满意的控制效果,这就是本篇论文讨论的主题。在实际应用中首先需要确定控制器为有限集。这是由于考虑到以下各种因素:算法的易实现性;最简化过程的可实现性以及其效率问题;进行稳定分析的可实现性等等。在多模型自适应控制的具体实现方面最基本的一个问题就是如何确定控制器的初始集。另外,考虑到实际实施中计算负担的因素,那么我们需要考虑如何以最小数量的控制器来达到满意的控制效果。所以本章中主要讨论的是其中最为基本的问题:①如何确定未知对象初始的简化近似对象模型集(控制器集)?②需要确定多少控制器才能达到满意的效果又不至于导致较重的计算负荷?在以往的多模型自适应算法的研究中,多着重于系统在运行过程中多模型的切换问题,对多模型建模(多控制器)覆盖的问题重视的比较少,多为基于实际的经验或对象运行的参数区间、工况等因素确定一模型集来进行控制[1,b-9]。目前多模型的建立一般分为以下几个方向:1.根据被控对象参数的变化范围设立多个模型,一般以美国耶鲁大学K.S.Narendra教授提出的多模型方案为典型。其主要思想是多个固定模型加两个自适应模型构成多模型集,两个自适应模型中其中一个是自由运行的普通的自适应模一2Q- 第三章多模型覆盖型,另外一个则是可以实时赋初值的自适应模型,其实时初值为固定模型和自由运行自适应模型中的其中一个性能指标中最优模型的初值。由于这种方案简单易用,证明相对容易,因此本文将以此方案为基础,主要针对固定模型集和自由运行的自适应模型等方面所存在的不足做出相应的改进,提出一种具有一定实用性的多模型建立以及实时停止、增加、删除以及更新模型集的方案。2.根据被控对象模型参数设立多个局部模型,且对应于多个局部模型设立多个局部稳定的控制器,将这些控制器按照从小到大的编号顺序排好,从编号为1的控制器开始作为当前控制器,根据切换函数值判断当前控制器是否为使被控对象稳定的控制器,如果是则继续保留为当前控制器,否则将编号加1的下一个控制器切换为当前控制器;依此类推,最终切换到能使闭环系统稳定的控制器上。这方面的研究以澳大利亚Newcastle大学G.C.Goodwin教授为主。3.基于概率加权和的形式构成控制器,多模型建立的方法可以多样化,主要区别在于根据模型误差对每个局部模型构成加权值,当前控制器为多个局部模型控制器输出的加权和。这也是由D.G.Lainiotis于二十世纪七十年代首先提出多模型控制思想时所使用的一种方案。3.2多模型的存在性本节中主要讨论多固定模型的存在性问题。令P(凡),i=1,2,.,n,A为i的函数(以后为讨论的方便,简写为P(A)),构成以兄为序号的一组对象模型集,此模型集为一紧集,根据兄的不同保持集合的连续性。此连续性会在本节之后的讨论中详细阐述。假定对于每一个A,P(幻都会对应于一个控制器C(幻而对系统达到良好的控制。为了讨论的方便,本节中主要对C(A)为一阶的情况进行分析,二阶的情况可以由一阶扩展而来。那么接下来我们将会研究在何种情况下存在有限的控制器集,对于任意一对象模型P(A)都有至少一个C(凡)可以对其进行良好的控制。在讨论多模型(多控制器)的存在性问题之前,我们首先引入一种称为广义闭环灵敏度传递函数矩阵的概念[101,标记为T(P(A),C(A)),如图3-1所示,定义闭环灵敏度传递函数矩阵为T(P(A),C(A))={P1(A)」[‘一C(A)P(A,一’]!一c‘“,,‘,(3-1)对于线性控制器或对象模型之间的紧密程度可以引入Vinnicombe距离的概念「’“·”]。Vinnicombe距离是一种关于各线性时不变模型之间距离的度量。对于两个具有相同输入输出及维数的对象模型君,凡,其Vinnicombe距离定义为 华南理_1一大学硕士学位论文d=图3-1闭环系统(P(A),C以))Figure3-1Closedsystem(P(A),C(A))式(PI,P2)=一}(I+P,P,*)一,/2(P2一P,)((I+P,'P,)一’,2)I1-(3-2)关于以上形式定义的Vinnicombe距离需要假定满足如下条件det(I+PPZ)(jw)*0,Vw(3-3)wnodet(I+PP2)+i7(P)一O(P2)=0如果不满足等式(3-3),那么S(P,P2)=1。上式中tl(P)表示对象P在复平面右半开平面Re[s]>0的极点数,W)表示对象P在复平面右半闭平面Re[s]。的极点数,wno表示Nyquist曲线在复平面上从左到右半平面绕过月,只的所有虚轴极点的圈数。X'(s)表示共辘复数一XT(-s),在实有理数情况下为XT(-S),IIXII_表示传递函数矩阵X的L范数,即}IXIL=sup-.6-x[x(j,,)],其中q_(X)表示X矩阵的最大奇异值。令F为任一对象模型,如果F满足以下不等式1S(P,尸(元)<(3-4)IIT(P(A),C(A))IL已知C(A)可以稳定对象模型P(A),那么C(A)同样可以稳定P[1010如果有以下不等式成立[121NT(P(A),C(A))II?S(P,P(A))IIV(P,C(A))一T(P(A),C(A))IL、(3-5)1一}ITcPc}),C(a.))Ilws(P,P(}))那么不等式(3-4)在A附近确定一个范围,使在此范围内的P可以被C(A)稳定控制;不等式(3-5)则保证在闭环系统中具有相同的性能,即如果C(幻可以在闭环中稳定控制P(A),那么在P(A)附近也可以确定一个范围,使得C(A)同样可以稳定控制在此范围内的对象。我们可以假定不等式(3-5)能够接受以下的假设形式IIT(P(A),C(A))Ihs,(P,P(A))<_r}T(P(A),C(A))Ilm(3-6)其中r为满足00,存在次E)使得〔LDN(AA)l一[DN((,up)lll_二(3-8)V/c,Ift一川_。区域内都不存在公共零点,那么就可以保证连续性的条件。上面的讨论中,我们为以后本论文算法设计的方便,主要应用第三种形式来进行建模和更新模型集。但是下一节中关于多模型构建问题的理论分析考虑到与本节分析的连贯性以及方便性,仍使用第一种形式。3.3多模型的构建上一节讨论了保证连续性条件的一组模型集P(A)(AEA,A为紧集)覆盖对象不确定空间的存在性问题,本节将主要讨论在3.2节分析的基础上如何构建满足连续性条件的有限模型集的问题。多模型构建的基本问题主要在于如何覆盖对象不确定空间的问题,也就是需要考虑以下两个基本问题:①多模型(多控制器)的数量N为何值才是合理的?②如何确定A,的值?在考虑这两个问题之前首先要明确控制器C(凡)的设计决定着T(P(衣),C(凡)的值及其范数,然而这其中最重要的一点就是对一个固定的对象P(A),当控制器C(A)在一定稳定控制范围内移动选择时,jT(P(A),C(A;)_有一个下界·假设P(A)=N(A)D(A)-',[N,D]为传递函数矩阵P(肋的右既叮约分解,那么有下式〔131N(兄)inf(3-12)c”stab消".A,}·(·(·),·)。一}I-D(兄)其中IH,表示Hankel范数,其值为最大的Hanket奇异值。上式中只要控制器为有限维就可得到最大下确界info我们现在假定n为实域R内的一个有限子集,设定为n=【丸。,A_1,那么可以按照如下的步骤来选择N和A, 第三章多模型覆盖1.对每一个A都使用(3-12)式确定一个合适的C(A)以及}IT(P(A),C(A))IIPoo注意在实际应用中由于P(A)连续的依赖于兄,因此完全可以确定一个有限集P(凡)。可以由(3-8)式中对任意选择的£,都可以确定一个S来选择凡的密度(IA,一川凡时的P(幻,只要s(P(A),P(A)IIT(P(A),C(a,))Ilm‘P考虑到上面的因素,令A=max{a.:S(P(A),P(A))IIT(P(A,),C(A))Ilm‘P,VAE[AJ11然后选择'h以保证所有“E巨司的P(A)都可以得到良好的控制"z一max{a,:s(P(A),P(A))IIT(P(X),c(x)IL‘P,VAEIA=XI}4.接下来选择A;A;=max{A:J(P(A),P(Z;))IIT(P(A,),C(A;))II_<-r",VAE仁,},Xl}A.,=max{A:J(P(A),P(X))IIT(P(A),C(A;Ilm、P,VAE[A'I5当A-。[A;,A;.;」时,令N=‘十,即可。以上计算过程即可保证c(^)可以满意地控制所有当AE[凡-,属]时的P(A)o3.4本章小结本章针对多模型自适应控制领域一直以来存在的理论薄弱环节一一模型集的建模方法做了初步的探讨。指出一个具有参数不确定性的对象,如果其不确定的参数在Vinnicombe距离上满足一定的连续性条件,就有可能找到至少一组模型有限集对对象的不确定域进行完全覆盖,以及找到一组相应的控制器集对不确定的对象进行良好的控制。本章给出了一种寻找有限模型集覆盖参数不确定对象的方法,并给出了寻找模型集的数量上界的方法。当然,如果仅是固定的模型集,对 华南理土大学硕士学位论文于控制复杂系统来说,还是比较机械,因此需要考虑对模型集进行动态优化以满足不同系统的需求。对于具有大的非结构不确定性的对象,本文希望再结合第二章的鲁棒自适应控制的方法来对其进行控制。这些改进的方案将在第五章中进行详细阐述。 第四章多模型切换第四章多模型切换4.1多模型切换理论基础第三章中讨论了多模型自适应控制算法的多模型建立的方法,在控制系统实际运行的过程中,这多个模型是并行运行计算的,如果每一个模型以及其相应的控制器都参加控制过程,将无法得到有效的控制信号。在控制领域内,对于如何在多个模型之中选择及协调的方案主要集中在以下几个方面:①对每一个模型都在线实时确定一个相应的权重系数,系统的控制器设计则是基于各权重系数对各模型相应的控制器进行加权组合而成。这种方法是在七十年代多模型自适应理论建立时最早提出的一种方案。在之后的研究中,又提出K-BN(K-SN,K-NN)方法1141,基于模糊算法确定权重系数的方法,基于神经网络确定权重系数的改进方法等:②每一个模型都实时计算其合适的指标函数,根据指标函数的大小来选择相应的控制器切换入闭环系统中进行控制。同样在此方面的研究也扩展到结合模糊、神经网络等不同的方法来进行优化控制。控制理论界在此方面的研究多基于K.S.Narendra16-81的研究成果进行不同程度的方案以及算法改进。另外一种切换策略是基于稳定条件下的切换,即滑模变结构控制方案。不同的多模型建模方法决定着不同的多模型选择方案,基于第三章中提出的建模方案,我们需要一种合适的切换方案来对其进行选择,对系统进行优化控制。本章的主要目的就在于如何确定一个统一的指标函数,以判断在这多个并行计算运行的模型之中哪一个是与实际的对象最为吻合的,并把这个模型以及其相应的控制器切入闭环系统中去,对系统进行有效的控制。本章中我们将主要对基于监督控制的概念进行切换选择控制器的初步理论成果作一个简要介绍。监督控制中需要用到多模型估计器。由于在实际过程中无法实现由单一模型以及单一控制器对对象进行良好的控制,因此需要引入多个模型并使用切换算法来对实际过程进行模拟及控制。至于在线运行过程当中,哪一个模型最接近真实的对象,这就需要引入在线估计器对各模型进行辨识估计,并根据估计后计算所得的指标函数的大小切换合适的控制器进入闭环系统进行控制,这就是基于估计器的切换控制算法。除了给定的对象以及模型集(控制器集)之外,监督控制系统主要包含三个子系统:多模型估计器,监控信号产生器以及切换逻辑。切换逻辑用来产生切换 华南理工大学硕士学位论文信号,在系统运行的每个时刻确定指标最优的控制器并把它切换入闭环系统中。控制器的计算选择主要是基于监控信号的取值的,而其取值则是由多模型估计器产生的估计误差计算其范数取得。整个切换策略的基本思想主要是根据最小的监控信号值来选择相应的控制器切换入闭环系统中对实际的对象实现有效的控制。监督控制可以进行模块化设计,也就是说其中的三个主要部分一一切换逻辑、多变量估计器以及监控信号产生器的设计都是相互独立的,因此对整个监督控制系统的分析可以基于对其中不同模块的独立分析进行。基于监督控制的方法相对来讲具有更为广泛的应用价值,而且实际上关于监督控制的算法已经应用到一些非线性的对象中去,这也正是我们所要关注的。另外一个方面,监督控制的稳定性证明相对来讲更为容易一些。4.2受控对象分析假设不确定对象为p,存在有界输入扰动d和有界输出噪声信号n,可由单输入单输出可观测的有限维线性模型描述,其控制输入以及可测输出分别为“和y,对象的传递函数可以由以下的一组模型的传递函数覆盖UF(m)其中M为有限序号集,m为在序号集中取值的参数。对于每一个m,F(m)都表示一个传递函数域,可以假设每一个F(m)中都有一个标称模型传递函数、可以覆盖整个域。在以上的分析中,集合M可以代表参数不确定的范围,而对于每一个msM,子集F(m)都可以认为是一个未建模动态,那么对于任意两个数s>o和凡>_o,可以定义F(m):={vm(1+dm)+Do:}lflmilm,}`-S,haallw.},SS},mEM(4-1)其中甘_,、表示传递函数权重为‘A,的H一范数,树一,,}=sup-Rlv(.IW-A)j,△.和△。如2.3节定义,分别为乘不确定性和加不确定性。考虑到第三章中的Vinnicombe距离,我们也可以用另外一种方式来定义F(m)F(m):={兴:IIAd,一,、<-8,IlAZI,一、<-(S},MEM(4-2)其中v.=n./d=,是、的互质因式分解,S可以认为是圆心为、的球F(m)的半径,也可以认为是、的允许未建模动态的边界。(4-2)式比(4-1)式更具有普遍意义,因为它允许标称对象模型传递函数、的极点位置具有一定的不确定性。 第四章多模型切换由于运行环境变化的原因、模块本身的问题以及不同的外部扰动的影响,对上述具有参数不确定性以及未建模动态的系统进行建模会有不可预测的问题出现,也就是说用单一模型无法解决上述系统的调节控制问题。因此需要用一组控制器根据实时有效数据来动态进行切换控制。本章中即将讨论的监督控制其主要原理是用一个高层的控制器一一监督器来在参数化的各控制器间进行协调切换,其中控制器组可以表示为{c4:、。。}(4-3)其中Q为有限序号集,9为在此序号集中取值的参数。我们希望控制器集中的控制器足够多,以使每一个可能的对象模型都可以由其中的某一个控制器进行良好的控制。在本文中,我们主要考虑Q=M的情况。对于每一个meM,都可以取一个控制器对所有F(m)域内动态变化的对象模型进行有效控制,这种情况下要求未建模动态足够小,即F(m)球域的半径足够小。在本文的讨论中,我们把对象进行参数化建模,未参数化的部分作为未建模动态考虑。下一节中我们将针对本节对受控对象的分析进行监督器的设计,未作特别说明我们都考虑控制器集已经给定的情况。4.3监督器原理监督器P-监控信号}切换逻辑产生器e..Y..m....+.._....六T-}图4-1监督控制结构图Figurc4-1Supervisorycontrolarchitecture 华南理工大学硕士学位论文监督器主要分为三个子系统,参见图4-1:1.多模型估计器多模型估计器是一个动态系统,其输入变量为受控对象的实时输入输出数据“和Y,输出变量为夕。,MGM。如果受控对象的传递函数等于标称对象模型传递函数、并且无噪声无扰动时,Ym会渐进收敛于Ya假设第m个对象标称模型有以下形式人(S)Y.=凡(s)u,meM(4-4)其中多项式凡(s)=气Tan-.(S),首一多项式人(s)=s"十B'Ta_,(S),瓦.和气分别为A=,(s)和B.(s)的参数向量,a_,(S)=[5-1,S0-z,,二,S,1]T。那么估计所得的Y。有以下形式Y.=0,,Ta-,(S)u-BTTa-,(S)Y,MEM(4-5)2.监控信号产生器监控信号产生器是一个动态系统,其输入为估计误差em=九一Y,mEM(4-6)输出为ftm,MEM,其中km一般可以定义为估计误差的范数,称为监控信号。Ftm=嵘,MEM(4-7)K.S.Narendra提出了另外一种计算监控信号(指标切换函数)的方法[7.81/um(t)=aem(t)+Q介一“"-"e.2(z)dz,mEM(4-8)其中a?0,刀>0和A>0,均为可以独立设定的参数。a为当前时刻误差的权重,18为过去时刻误差组合的权重,兄表示过去时刻误差的遗忘因子。这种计算监控信号的方法不仅考虑了当前时刻误差的因素,而且把过去不同时刻的不同影响同时计入其中,加入积分环节后,可以保证系统的稳态误差收敛为零。3.切换逻辑切换逻辑是一个切换子系统,其输入为监控信号Etm,MEM,输出为切换信号a,是集合M中选择的一个值,用于选择控制器。一般来讲,切换信号叮可以由以下公式计算而得6=argmm汽(4-9)”口;材在选择好a的值之后,就可以指定控制器中标号叮的控制器切换入闭环系统中参加控制。w为对象的附加输入信号,包括噪声、千扰或者外部参考信号等。4.4滞后切换由于在切换过程中,如果存在如下情况:例如在系统稳定运行情况下有o(t)=3,当前选为序号为3的控制器切入闭环进行控制,但是由于收到非常短暂 第四章多模型切换时间的暂态扰动的影响,在下一时刻经过监督器的算法判断选择得到6(t+1)=5,此时监督器如果立即切换到序号为5的控制器上,经过控制器计算得到的控制信号u并不能良好地控制对象,反而会影响到整个系统的稳定性。上述问题可以采用所谓滞后切换方法,把控制器之间切换的时间适当延长,以避免由于扰动或频繁切换的影响而引发的误切换以及切换抖动等现象,从而保证系统的稳定性。图4-2中是一种称为比例独立的滞后切换逻辑,其切换的主要思想如下:图4-2比例独立的滞后切换逻辑Figure4-2Scale-independenthysteresisswitchinglogic其中,h>0为事先选定的值,称为滞后常数。首先,设定初始时刻〔第0时刻)选择的切换信号初值为。(0)=argmin_,{Ft.(0)}。假设在某个特定的时刻t;,。的值切换到qEM,这时可以把『值一直固定到t,+>>t,,此时有(1+h)min_nr{km(t+1)}‘f2q(tr+}),在ti+,时刻我们就可以设定v(t,+j)=argmin.,{um(t,+A。当argmin值非唯一时,可以在其中任取一值。重复以上步骤,我们会得到一个分段连续的常值信号口。如果对所有的,Um,MEM,其值都小于等于某个正数,那么就可以避免切换速度过快(切换抖动)的现象。实际上,。必须有一个生存时间段【0,T..,在每一个时间段【0,T)内的切换次数均为有限次。我们现在对监控信号#.,MEM进行比例化风(t)=00汽(t),MEM(4-10)其中r为比例因子,是关于时间t的正函数,对切换信号6无影响,因此有“比例独立”的称谓。我们接下来可以假设通过选择x而使比例化的监控信号风,MEM对于参数时间t严格为正并且单调递增。由于具备了以上的性质,为以后理论分析的需要,我们会使用比例化信号风,mem,而事实上在实际使用以及用于切换逻辑的监控信号还是Etm,MEM(这是因为可以证明,,um,meM也具有严格为正并且单调递增的性质)。 华南理工大学硕十学位论文对引理4.1[)s]令M为有限集并且连续,M=11,2,...,NJ,其中N为正整数,的任意给定的‘>to?0,定义N,(t,to)为在时间段(to'0内切换信号。变化(切换)次数,那么有Nu}.(t)No(t,tq)S1+N+了一二,一了,log((4-11)tog(t+n)min-.)7.(t.)以及NO".)E(u"、)(‘·:)一几(,,)(tk))<_N((1+h),um.(t)一黔um(td)(4-12)其中ti0,i=1,---,N(5-4)其中e;(t)为各模型的每一时刻的估计误差,a,刀为权重因子,i表示不同的模型,N为模型的数量。由上式及N个固定模型构成的多模型自适应控制器,对于满足模型参数PC=S的被控对象,如果存在正数T以及函数F4(P,T;J>。满足①等待时间T.=e(O,T);②至少存在一个模型M;,其参数误差满足IIA一Pfl_1个自适应模型构成的多模型自适应控制器,若自适应满足以下辨识条件①②③〔4④气(t)-=-'=--}0则若存在不>0满足T.4oe(0,兀卜那么整个系统的全部信号以及性能指标{去{t),i=1,},从十戈}都一致有界。定理5.3在多固定模型和自适应模型构成的多模型自适应控制器的基础上再添加一个重新赋初值的自适应模型,其他条件如定理5.2,则仍可获得定理5.2的结论。以上定理是基于连续时间情况下的稳定性定理,在离散情况下,同样有以下定理1s1定理5,4多模型自适应控制器作用于时不变被控对象时,辨识器的初值与多个固定模型参数之间将发生有限次切换便停止,且可保证闭环系统是BIBO稳定的,那么被控对象输出将渐进跟踪设定值。由定理5.4可知,多模型自适应控制作用于时不变被控对象,保持了常规自适应控制器的稳定性和收敛性,但由于多模型的存在,尤其是变换初值的自适应模型的存在,加速了辨识参数的收敛,极大的提高了瞬态响应。推论5,1含跳变参数的被控对象在相邻两次参数跳变之间可被看作时不变系统。当多模型自适应控制作用于此被控对象时,由于多模型的存在,加速了参数收敛,若相邻两次参数跳变时间间隔足够长,仍可保证输入输出有界,且输出跟踪设定值,极大地改善控制品质。以上的固定模型集为离线所得,因此在不确定环境下,尤其是在过程控制中,无法根据已知数据建立准确的固定模型集,本文中针对这种情况设计了一种动态一37- 华南理工大学硕士学位论文优化的模型集,可以实时添加和更新模型,满足复杂系统的控制需求。由于系统的稳定性与模型集建立的方式无关,因此之后的讨论将把主要精力集中于建立模型集的方式,关于稳定性的问题将暂不作分析。5.2.3动态优化模型集策略1.更新模型根据以上对固定模型集的分析,我们需要对固定模型集进行不断地更新来满足动态对象不确定性的控制需求。利用己经建立好的固定模型集,我们可以不断总结控制过程中自适应模型M。和M‘中的最优控制模型来表现到模型集的更新上来。选e四择l更ll新|还模叫型|集|信瓜号初始化信号图5-1动态优化模型集更新结构图Figure5-1Dynamicmodelbankupdating动态优化模型集的策略可以参见图5-1所示。两个自适应模型M。和M。的参数Ba(t)和C9,Q)由递推最小二乘算法根据输入输出数据“(t)和Y(t)辨识而即时更新,然后系统由(5-2)式判断两者之中的最优模型的参数B(t)来用于更新模型集,其中。=argminJ,(t),s={a,b}。如果模型M。与模型集中m个模型中的至少一个模型足够接近时,B(t)用于更新这个最为接近的模型;如果m个模型中没有一个模型足够接近模型M。时,氏(t)用于在模型集中创建一个新模型Mm+i。根据第三章的讨论,衡量模型之间距离的标准可以表述为下述形式118(t)-B11,-(1,."M}(5-5)由(5-4)式可以很容易得到模型集中与模型M。距离最小的模型MPP=argnun}e(t)一0,11,s={1,.,m}(5-6)更新模型集的指标参考下式 第五章基于多模型动态优化的鲁棒自适应控制IIB(t)一BPII/一{0,jj!}8(5-7)其中£是任意指定的正数。如果上式成立,说明模型集中的模型M,足够接近模型Mo,那么B(t)用于更新模型M,的参数气,更新的公式见下式=(气气+9(t))/(Np+l),(5-8)=No+1其中N,为模型M,的更新次数参数。模型集中的每一个模型M=s={l,--,m}都有一个更新次数参数戈,S=11,-..,M),它不仅标识各模型更新的次数,而且由上式保证模型逐渐逼近真实对象的某个工作状态。2.创建新模型如果不等式(5-7)式不成立,则需要利用氏(t)来创建一个新模型Mm+}(5-9)由以上分析可见,参数£是动态更新模型集的一个重要指标,同时也是控制模型集中模型数量的一个重要指标。如果E过大,则模型集中每个模型的作用域会非常大,系统控制性能会变差;如果£过小,那么系统运行过程中建立的新模型数量会急剧增加,系统运算负担也会急剧增加。因此£值的大小直接关系到整个动态优化模型集建立的好坏,我们可以根据实际经验合理选取。3.删除模型考虑到某些模型是基于一些随机的大扰动等情况下所即时建立的,因此这些模型在被建立以后即失去作用。如果这种情况比较多时,模型数量急剧增加,无形中大大增加了系统的计算负担,因此考虑引入模型的删除功能。在经过一定长度的时间之后,如果模型没有进行任何优化动作,即可以实施删除动作。根据以上思路,可以对(5-8)式增加两项如下二0=T,+1,s={1,}}},p一1,p+1,一,m}(5-10)其中T,:二{1'...,m}为各模型不作变动时相对应的维持时间。而(5-9)式也需要增加一项几=0(5-11)当满足如下条件时Tg>T,qe‘(5-12)删除模型MQ,其中T-为最大允许维持时间针对不同的系统根据经验设定其不同的值。删除动作如下 华南理工大学硕士学位论文了孔刃N=N改es+(5-13)Jm-s={q,...,m一11爪4.停止优化在以上动态优化模型集策略的基础上,如果系统进入稳态运行阶段,动态性能变化不大时,动态更新模型集反而增加了系统的运算负担,这时可以考虑停止对模型集的优化动作。基于以上考虑,我们要求如果系统满足下述不等式Ilo(t)一0,11/110Pll}e.(5-14)其中0--(5-16)以上讨论的是在某一时刻系统最优模型为某一个自适应模型的情况,而当此时刻系统最优模型为动态模型集中的某一个模型时,则把此模型的参数赋值给氏,自适应模型M。从新获得的Bb开始继续进行递推辨识运算。这样可以有效提高系统对扰动等未知暂态因素的响应速度。需要注意的是,如果在某一时刻系统的最优模型为自由运行的自适应模型M时,自适应模型M,的初值无需由模型M。的参数来赋值,因为在这种情况下已经由模型Ma保证了系统的快速响应以及稳定的性能,完全可以省略M。实时赋初值的操作步骤。这样,根据以上的分析,我们得到了一种比较系统的模型集动态优化的算法,总结以上算法,我们得到以下的动态优化模型集计算步骤:1根据先验知识离线建立初始模型集,模型集中的数量根据先验知识而定,当无先验知识时,模型集中的模型数目可以为零,而仅由两个简化的线性自适应模型经过实时辨识向模型集中增加模型构成动态模型集;2.计算各模型的切换指标函数值来确定最优模型。由于模型集中模型的个数为有限个,所以最优模型一定存在。根据。=argminJ,(t),s={a,b},q=argminJ,(t),s=(a,b,l,...,m},判断如果。#q,则此时刻系统最优模型为动态模型集中的模型M9,令Bb(t)=代,转步骤7,否则继续;3如果。一q,则需要对模型集进行优化; 第五章基于多模型动态优化的鲁棒自适应控制图5-2动态模型集优化算法流程图Figure5-2Blockdiagramofdynamicmodelbankupdatingalgorithm41 华南理工大学硕士学位论文4·给定:>“以及“<‘<:,如果{IB(t)-apll/IIBP卜11,动态模型集保持不变,转步骤7,否则继续;5如果。。,那么根据(5-8)式向模型集中添加一个新模型Mm+i;7自适应模型M。和M。进行实时辨识运算,转步骤20根据以上的计算方法,动态模型集可以根据自适应模型M。和M、进行实时更新,另外模型M。的参数也可以实时赋初值或者进行辨识优化,这样可以保证整个系统对复杂系统的快速响应,使系统具有良好的稳定性,并且可以简化计算,减少系统的运算负担。为了更加清楚的理解这种控制算法,我们可以参考相应的计算流程图5-2e5.3模型切换策略考虑另外一种情况,如果系统受到独立的、随机的、短暂时间的扰动时,是否需要对此扰动进行响应,建立新模型或立即切换到相近模型进行控制?如果是这样的话,系统反而会由于频繁切换引起抖动甚至不稳定的现象。因此我们可以考虑引入滞后切换策略,对系统的稳定运行具有良好的作用。在这方面,也有很多控制领域的专家进行了各方面的深入研究,包括以下几个方面:①由指标函数作为滞后切换的标准[201设在t时刻采用控制偶对(Mj,几),t时刻最小指标函数为Jk(t)一‘男乳{J,(t)},若ii(t)<_Jk(t)+(5,则仍采用控制偶对(Mi,Cj);若J;(t)>Jk(t)十(5,则控制切换到偶对(Mk,Ck),其中9为滞后因子,可以根据实践经验依据不同对象进行调节:②基于预测控制理论(211。根据预测的系统输出值依据一定的指标适当提前切换模型以及相应的控制器,实现比较平缓的切换过程,但是这也仅适合于系统动态性能变化不大的情况。③采用一种比例独立的滞后切换算法【15,221,这种方法在理论分析时非常方便,在实际中也有一定的应用价值,第四章中对此算法作了详细的阐述,本文的滞后切换算法主要基于这种方案来进行深入研究。 第五章基于多模型动态优化的鲁棒自适应控制5.3.1滞后切换参考图4-2,事先选定滞后常数h>0,假设模型集的序列集为M=11,2,...,N),模型的序列MGM。与第四章的讨论稍有不同的是,第四章中的监控信号P在此可以具体化为切换指标函数J。那么滞后切换的具体算法步骤如下:首先,设定初始时刻情况下选择的系统近似模型序号6(0)=argmin_,,{Jm(0)}o其次,假设在某个特定的时刻t;,Q的值切换到qEM,这时可以把6值一直固定到till>t;,此时有(1十h)min_MIJ.(tr+)}5J,(tt+,),在t=,时刻我们就可以设定6(t,.,)=argminim{Jm(t,,小当arg而n值非唯一时,可以在其中任取一值。最后,重复以上步骤,我们会得到一个分段连续的常值信号60如果对所有的Jm,MEM,其值都小于等于某个正数,那么就可以避免切换速度过快(切换抖动)的现象。实际上,。必须有一个生存时间段}QTx},在每一个时间段!0,Tme.)内的切换次数均为有限次。5.3.2先进的切换指标函数切换指标函数选择的好坏直接关系到系统的稳定性能以及系统控制性能的好坏,因此,选择一个合适的切换指标函数对于本文算法的良好实现同样至关重要。假设现采样时刻为k,模型集中共有模型N个。传统的算法是以下形式的不同时段的误差加权平方和作为切换指标函数,即几=叫(、)十刀全。‘嵘(、一,),m一1,2,...,N(5-17)其中,a为现在时刻误差的权重,Q为过去时刻误差组合的权重,遗忘因子B表示性能指标的记忆效应,L为所取的过去时刻误差组合的长度,各模型的预测误差定义为下式em(k)=y.(k)一y(k),m=1,2,...,N(5-18)其中ym(k),m=1,2,...,N表示模型集中N个模型在k时刻的预测输出值,y(k)为被控对象的输出值。由于以上传统的指标函数有可能不能保证模型间切换时的收敛,因此有必要引入一种新型的指标切换函数。在新型的指标函数中定义的模型误差为区(k)一y(k)lem(k)=m=1,2,.-",N(5-19)Iy(k)卜P其中P(0