欢迎来到天天文库
浏览记录
ID:57743103
大小:745.82 KB
页数:5页
时间:2020-03-27
《神经网络自适应动态规划在污水处理过程控制中的应用.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第11期刘文波等.神经网络自适应动态规划在污水处理过程控制中的应用神经网络自适应动态规划在污水处理过程控制中的应用刘文波1王霞2李来鸿1薄迎春3(1.胜利油田电力管理总公司河口供电公司,山东东营257200;2.北京钢研新冶电气股份有限公司,北京100094;3.中国石油大学信息与控制工程学院,山东青岛266555)摘要针对污水处理过程的溶解氧及硝态氮浓度控制问题,提出一种基于神经网络的自适应动态规划(Neuralnetwork—basedadaptivedynamicalprogramming,NNADP)方法。该方法采用神经网络逼
2、近当前策略的评价函数以及最优的控制策略。采用梯度下降算法对各神经网络权值进行在线训练。基于污水处理过程国际标准模型BSMl(BenchmarkSimulationModelno.1)对NNADP控制性能进行了测试,结果表明:与PID控制相比,NNADP具有较强的解耦能力,控制精度也有较大提高。关键词自适应动态规划污水处理回声状态网络解耦能力中圈分类号TH862+.6文献标识码A文章编号1000—3932(2012)1l一1437-05好氧区溶解氧浓度及厌氧区硝态氮浓度是活性污泥法污水处理过程的两个重要控制指标¨。1。好氧区溶解氧浓度过
3、低,会抑制生物对有机物的降解,易产生污泥膨胀;而溶解氧浓度过高会加速消耗污水中的有机物,引起活性污泥的老化,从而降低活性污泥的絮凝性能和吸附能力,增加能耗口o。厌氧区硝态氮浓度过低,会影响反硝化过程的速度,而其浓度过高则会降低出水质量。污水处理过程具有较强的非线性,参数时变明显,生化反应过程伴有较大的不确定性,其机理模型难以建立。此外,溶解氧及硝态氮浓度之间存在较强的耦合,所以常规控制难以取得较好的控制效果⋯。近几年来,针对一类模型难以确定的被控过程,自适应动态规划(adaptivedynamicalprogram—ruing,ADP
4、)方法逐渐引起重视H“。。ADP一般由评价和行动两个网络组成,其采用智能化的方法逐步逼近最优的控制策略:首先给定一个初始的控制策略,评价网络对该控制策略的作用结果进行评价;然后,控制网络根据评价结果对控制策略做出相应的调整,这个过程不断重复,直至寻找到最优的控制策略。为解决污水处理过程中溶解氧及硝态氮浓度控制问题,笔者提出了一种基于神经网络的自适应动态规划(Neuralnetwork—basedADP,NNADP)控制方法,并基于污水处理过程国际标准模型BSM1(BenchmarkSimulationModelno.1)"3对NNAD
5、P控制器的有效性进行了测试。1BSMl模型如图1所示,BSMl模型由5个反应池组成,单元1、2为厌氧反应区,单元3~5为好氧反应区。污水经过一系列前置处理措施进入生化反应区,经过一系列硝化一反硝化过程,最终处理后的污水排入受纳水体(河流及湖泊等)。在反应过程中,第5分区溶解氧溶度(S¨)及第2分区硝态氮浓度(S№:)对出水质量有重要影响,将这两个指标维持在合理的水平至关重要。s。.,主要受第5分区的曝气系统注入的曝气量(K。a,)控制,SNo,z受第5分区到第2分区的回流流量(Q。)控制,这使得30,5及SNo,2之间存在较强的耦合作
6、用。2NNADP控制器设计污水处理模型可用一般的离散非线性系统模型描述,即:x(k+1)=F(髫(%),u(%))(1)式中Ⅱ(玉)——控制量;石(k)——系统状态。ADP将上述非线性系统的控制问题转化为一个优化问题H’。根据Bellman优化原理,控制收穗日期:2012-09,12(修改稿)化工自动化及仪表第39卷等图1污水处理工艺流程策略调整的目标是最小化某一性能指标(或成本NNADP实质上是采用神经网络逼近的方式搜索函数),即:式(2)的最优解。所以,NNADP控制器的设计过"(k+1)=argmin(1ly(茗(k))8)(2
7、)其中y(茹(k))是与控制目标相关的成本函数。一般具有如下形式"1:y(x(^))-玉’,-tr(z(川(3)其中r(石(歹))为立即回报(Utility),0<7≤1为回报因子。为了描述方便,令V(并(k))简记为V(k),r(龙(尼))简记为r(后),式(3)可写为:y(k)=r(☆)+yV(k+1)(4)2.1NNADP结构如图2所示,NNADP主要由3个神经网络组成:评价网络(critic),其功能是对当前控制策略产生的控制结果进行评价,即逼近成本函数矿(k);行动网络(actor),其功能是根据当前评价结果y(矗)对控制量
8、“(k)进行调整,从而使成本函数V(k)最终达到最小化;辨识网络(Identifica.tion),由于在控制策略调整的过程中,需要知道系统在下一时刻的状态菇(k+1),所以采用辨识网络预测系统状态戈(k+1)。图2中评
此文档下载收益归作者所有