欢迎来到天天文库
浏览记录
ID:34120443
大小:8.63 MB
页数:154页
时间:2019-03-03
《基于近似动态规划的优化控制研究及在电力系统中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据锌苤昙/J大々UDC、2密级学位论文基于近似动态规划的优化控制研究及在电力系统中的应用作者姓名:指导教师:申请学位级别:学科专业名称:论文提交日期:学位授予日期:评阅人:秦春斌张化光博士学科类别:工学电力电子与电力传动2014年3月论文答辩日期:2014年5月答辩委员会主席:杨光红评阅l、评阅2、评阅3、冯健、王占山东北大学2014年3月万方数据ADissertationinPowerElectronicsandElectricDriveResearchesonOptimalControlBasedonApproximateDynamicProgrammingandItsAp
2、plicationinPowerSystembyQinChunbinSupervisor:ZhangHuaguangNortheasternUniversityMarch2014万方数据独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。学位论文作一:枷额日期:一、他/中,文厂学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校
3、有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年口一年半副两年口学位论文作者签名:胁姒翩签名:签字日期:1pf邙。^I-签字日期:万方数据东北大学博士学位论文摘要基于近似动态规划的优化控制研究及在电力系统中的应用摘要基于近似动态规JZlJ(Approximatedynamicprogramming,ADP)的最优控制问题是近年来控制领域研究的热点之一。结合强化学习思想的近似动态规划是利用函数近似结构来逼近动态规划方程中的代价函
4、数和控制策略,以满足最优性原理,从而获得最优代价函数和最优控制策略。因而,近似动态规划成功避免了动态规划求解最优控制存在的“维数灾”问题而获得广泛的关注。但是,近似动态规划理论及其算法还没有得到完善,利用ADP研究动态系统最优控制的许多理论与技术问题还有待解决。为此,在国家自然科学基金项目“智能电网的动态全局优化与节能控制理论及其应用(50977008)”等的资助下,本文基于近似动态规划理论进一步研究动态系统若干优化控制问题,提出适合不同情形的迭代ADP算法。并将ADP方法应用到电力系统中,扩展了ADP方法的应用范围。本文主要工作和贡献如下:1.针对未知连续线性系统的最优跟踪控制问题
5、,提出了一种新型的基于ADP的最优跟踪控制方案。首先,将原系统的最优跟踪问题转化成一个增广系统的最优调节控制问题。并证明了增广系统的最优控制解等价于原系统的最优跟踪控制问题的标准解。然后,给出了一种新的在线ADP算法来在线求解增广代数Riccati方程,实现了在线求得未知系统的最优跟踪控制器。2.提出了一种基于ADP的自适应最优控制方案,有效解决了一类离散仿射非线性系统的最优控制问题。首先,利用两个神经网络作为在线参数结构来分别近似代价函数和最优控制律,分别被称为评价网络和执行网络。在考虑神经网络近似误差的基础上,通过Lyapunov理论,证明了系统状态和神经网络权值估计误差都是一致
6、最终有界性,并且能够保证所获得的控制输入在最优控制输入的一个小的邻域内。3.针对一类带有外界扰动的离散非线性系统的比控制问题,提出了一个新的在线自适应策略学习方案。利用三个神经网络作为在线参数结构分别设计了评价网络、执行网络和扰动网络,并给出网络权值的在线更新律。在考虑神经网络近似误差的基础上,通过Lyapunov理论,证明了系统状态和所有的网络权值估计误差都是一致最终有界性,并且能够保证所获得的控制输入在最优控制输入的一个小的邻域内。万方数据东北大学博士学位论文摘要4.提出了一种新的迭代两级DHP算法,解决了一类带有饱和执行器的非线性切换系统的最优控制问题。利用一个非二次型泛函解决
7、了执行饱和约束问题,保证了控制函数在饱和执行器内是一个光滑函数,推导出一种新异的迭代两级DHP算法用来求解约束HJB方程。给出严格的数学证明保证了所提出迭代两级DHP算法的收敛性。5.针对一类离散非线性切换系统的最优跟踪控制问题,设计了一种迭代ADP算法来获取最优跟踪混合控制策略。首先,将最优跟踪控制问题转化为一个误差切换系统的最优调节控制问题。其次,给出了一种新的迭代两级ADP算法来求解误差系统的HJB方程。最后给出算法的收敛性分析,保证了得到跟踪混合控
此文档下载收益归作者所有