基于改进强化学习的PID参数整定原理及应用.pdf

ID：50640902

大小：2.00 MB

页数：4页

时间：2020-03-15

资源描述：

《基于改进强化学习的PID参数整定原理及应用.pdf》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、2014୍2ᄅ15ರ现代电子技术Feb.201437ज4௹ModernElectronicsTechniqueVol.37No.41ࠎႿڿࣉ఼߄࿐༝PIDҕඔᆜקჰ৘ࠣႋႨ高瑞娟，吴梅（西北工业大学自动化学院，陕西西安710129）摘要：控制系统的响应特性取决于控制律参数，经典的PID方法难以实现参数的自整定。强化学习能够通过系统自身和环境的交互实现参数的自动调整，但是在控制律参数需要频繁调整的应用场合，常规的强化学习方法无法满足实时性要求，而且容易陷入局部收敛。对传统的强化学习方法加以改进后，加快了在线学习速度，提高了强化学习算法

2、的寻优能力。仿真结果表明，该方法可以在一定范围内快速求得全局最优解，提高控制系统的自适应性，为控制系统参数的自整定提供了依据。关键字：PID；参数整定；强化学习；控制系统中图分类号：TN911⁃34文献标识码：A文章编号：1004⁃373X（2014）04⁃0001⁃04PrincipleandapplicationofPIDparametertuningbasedonimprovedreinforcementlearningGAORui⁃juan，WUMei（CollegeofAutomation，NorthwesternPoly

3、technicalUniversity，Xi’an710129，China）Abstract：Theresponsecharacteristicsofcontrolsystemdependonthecontrollawparameter.TheclassicPIDmethodisdif⁃ficulttoachievetheparameterself⁃tuning.Throughtheinteractionofsystemitselfandtheenvironment，parameterscanbeadjustedautomatica

4、llybyreinforcementlearning.However，intheapplicationoccasionswherethecontrollawparametersrequirestobead⁃justedfrequently，theconventionalreinforcementlearningmethodscannotmeetthereal⁃timerequirements，andiseasytofallin⁃tolocalconvergence.Basedonthetraditionalreinforcement

5、learningmethods，animprovementmethodwhichcanacceleratethelearningspeedandimprovetheoptimizingabilityofreinforcementlearningalgorithmisproposed.Thesimulationresultsshowthatthismethodcangetglobaloptimalsolutionquicklyandimprovetheadaptivityofthecontrolsysteminacertainrang

6、e.Itpro⁃videdabasisfortheimprovementofcontrolsystem’sparameterself⁃tuning.Keywords：PID；parametertuning；reinforcementlearning；controlsystemPID作为工业控制的主要技术，它可以一一解决，这与0引言其优良的性能是分不开的。它的结构简单，鲁棒性好和在现代技术高速发展的今天，反馈的概念已被广泛工作可靠性高且调整方便。因此，如何高效地调整和优应用于自动控制理论中。测量，比较，执行为反馈概念化PID的控制参数

7、成了人们竞相研究的问题。目前，常的三个基本要素。通常来说，输入量先与测量量做比用的PID控制算法有理论计算和工程整定两类，其中，较，得到了系统误差后，相应的指标将通过这个误差来工程整定主要有：临界比例法，反应曲线法和衰减法加以纠正和控制。在过去的几十年里，反馈技术被广等。然而，在复杂控制系统设计中，由于参数优化困难，泛运用于实践中，其中，使用比例积分微分控制技术的PID的效果却有待提高。因此，越来越多的人把目光转发展是最为突出的。如今，在许多高级控制领域里，到[1⁃2]向了自适应控制。如神经网络，模糊，进化等。[1]处活跃着PID控

8、制的身影。本文在分析了各个研究成果的基础上，针对基于强一般的控制理论存在诸多问题（如理论难以实现，化学习的PID控制算法的收敛速度快，实时性好等优或被控对象参数不容易得到，或得不到精确数学模型），点，提出了一种改进的强化算法的PID参

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于改进强化学习的PID参数整定原理及应用.pdf

基于改进强化学习的PID参数整定原理及应用.pdf

相关文章

相关标签