资源描述:
《基于数据挖掘模型的配电网故障定位诊断》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
天津大学学报第35卷第3期2002年5月JOURNALOFTIANJINUNIVERSITYVol.35No.3May2002基于数据挖掘模型的配电网故障定位诊断廖志伟,孙雅明,杜红卫(天津大学电力自动化与能源工程学院,天津300072)摘要:由于配电网故障定位所依据的故障信息来自于户外的FTU,其运行环境较恶劣,元器件受损或信息丢失的可能性高,易形成变异故障模式,导致故障定位的错判,提出基于粗糙集(RS)理论和遗传算法(GA)相结合的数据挖掘(DM)模型来处理实时输入信息的畸变和实现配电网的故障定位.首先通过RS对变异故障信息域的数据集进行划分,再用GA挖掘出输入信息与故障定位诊断结果间冗余关系及内在关联性规则.经仿真测试证明,基于DM模型的故障定位与基于常规前馈神经网络(FNN)故障定位原理相比,前者具更高的容错性能.关键词:配电网;故障定位;数据挖掘;神经网络;容错性能;粗糙集中图分类号:TM766文献标识码:A文章编号:0493-2137(2002)03-0322-05配电网故障自动定位、隔离及恢复供电,是配电网DM)技术,构造一种综合智能的配网故障定位模型,综合自动化最基本和最重要的功能,对保证供电可靠在不精确、不完整、近似推理的环境实现高容错性推理性、提高供电质量具有重要意义.已有不少关于远方.仿真测试结果证明此模型能有效地克服实时信息畸控制方式配电网故障定位的研究,如文献[1]提出利用变而导致的错误诊断,提高配电网故障自动定位的容电流越限告警信号生成故障判断矩阵来判别和隔离故错性能和实用性.障区段;文献[2]把配电网故障定位转化为整数优化问题,利用遗传算法(geneticalgorithm,简称GA)实现1基于DM配网故障定位原理与模型故障定位;文献[3,4]用基于框架式专家系统和模糊逻辑推理智能原理实现配电网故障定位.当故障定位所DM是人工智能、数据库技术及统计等学科发展依据的实时信息完整、正确时,这些系统大都能得到较和相互结合的产物.它是指从数据中,提取隐含在其为满意的结果.中人们事先未知,但又潜在有用的信息和知识,并将其配电网故障定位所用的信息源大多来自于户外的最终表示成人们可理解模式的高级过程.DM能对历FTU(feederterminalunits),其运行环境恶劣,承受强史数据进行查询和遍历,挖掘出其中隐藏的关于数据的电磁、雷电干扰,且继电器节点故障、FTU元器件损整体特征描述,对发展趋势的预测及决策生成具有重[6][7]坏等因素存在,使得配电网信息受干扰、畸变或丢失的要参考价值的信息.由ZPawlak教授提出的RS可能性较高,易形成变异的故障模式[5].现有的研究是用以处理包含噪音、不确定及不完整信息的数学工方法在处理变异模式时难以保证故障定位的高容错具,它为DM提供了一种新的方法.性,会出现错判或漏判,其实用价值受到一定限制.因基于DM模型的配电网故障定位系统主要是利此,配电网故障定位实现方法必须考虑对故障定位所用RS来提取领域知识,直接将给定变异故障模式集用信息具有容错能力.合换成RS中的决策表,通过辨识矩阵和辨识函数确针对配电网故障定位的故障模式存在不确定性信定配电网故障模式的近似域,并挖掘出该问题中输入息的情况,通过运用基于粗糙集(roughset,简称RS)矢量与输出矢量内在相互关联性规则.为了避免对故理论和GA相结合的数据挖掘(datamining,简称障模式空间作盲目的随机或穷举搜索,本文提出用收稿日期:2002-01-14.基金项目:国家自然科学基金资助项目(59877016).作者简介:廖志伟(1973—),男,博士生. 2002年5月廖志伟等:基于数据挖掘模型的配电网故障定位诊断·323·GA对领域知识作智能式搜索,从故障模式集的信息图3配电网的网络拓扑结构可逻辑等效解耦成数个带中,快速挖掘出其冗余性及内在相关性联系规则.树支的辐射状网和树干网的组合(图4a),而后再将它图1为基于DM模型的配电网故障定位总体框们等效解耦为若干个单一的树干网(图4b所示).当图,由信息处理模块、DM模块、配电网逻辑等效解耦图4a中的树支b1、c1或d1发生故障时,仅该树支和模块及综合决策模块组成.主干线a2、b2上有故障电流,其它树支无故障电流流过.在主干线上发生故障时,所有树支均无故障电流流过.基于上述特征分析,对图4所示的辐射网进行故障定位时,仅需对图4b的三个单一树干网进行分别处理.辐射网逻辑可等效解耦成与其树梢数目相同的多个单一树干网,从而使得故障定位分析模型仅限于简单的树干网,有效地简化配电网故障定位问题,缩短故障判断时间.图1基于DM模型的配电网故障定位总体框图Fig.1OverallmodelofDMbasedFDSsystemforDN图3多电源多分段多联络接线图信息处理模块从SCADA系统接口获取实时数Fig.3Networktopologyofdistributionnetworkswith据,并进行相应的数据转换;综合决策模块对诊断结果multiple-powersupply进行综合比较,给出故障元件的名称和隔离方案.[5]1.1配电网拓扑逻辑等效解耦目前我国中低压配电网的拓扑结构大多为图2所示的双电源单环网和图3所示的多电源多分段多联络辐射网,或由两种典型的网络拓扑组合而成的复杂网络.图4配电网拓扑网络的基本逻辑等效解藕Fig.4BasictopologylogicequivalentuncouplingmodeofDN图2双电源单环网接线图1.2基于RS和GA结合的DM模型Fig.2NetworktopologyofdistributionnetworksRS的基本理论和利用GA求取最佳简约的方法,withdouble-powersupply可参见文献[7~9].图中:ICB为电源进线断路器;SS为分段开关1.2.1决策系统RS是根据已有的知识对给定问题.SSt为联络开关.正常运行状态下,ICB和SS闭合,的论域进行划分.称S=(U,A,{V},)为信息表示SSt状态由运行方式确定.SSt将网络分割成电气上系统.论域U、属性集合A为非空有限集合;Va为属没有任何联系的若干个独立供电区.性∈A的值域;:U→Va为一单值映射,是论域U中的任一元素取属性在Va中的某唯一值.若A由由于配网实际上都采用单电源开环运行方式,故条件属性C集合和结论属性D集合组成,当C、D满 ·324·天津大学学报第35卷第3期足C∪D=A,C∩D=,则称S为决策系统(DS).在[sinSs∩R≠]a×(2)SDS中,可认为U中每一元素对应一条规则,规则的前式(2)的第一项是激励搜索策略朝M中属性组合件由C及其取值所决定,规则的后件由D及其取值所数最小的简约方向搜索,第二项是确保R为简约;参决定.常用(U,C∪{D})表示DS.数a定义为调节因子,作为寻找近似约简用.B的子对于BC,称二元关系:IND(B,{d})={(x,y)集R是以适应函数作为指导,通过进化搜索而得到的∈U×U:d(x)=d(y)}为S的不可辨识关系,x、y为简约;U中的元素.通过不可辨识关系对DS进行划分,称4)遗传操作.以适应函数为目标函数,通过选择、划分后的等价类为不可辨识类,通常用IND(B)来表交叉和变异,实现优化搜索;示不可辨识关系IND(B,{d}).5)收敛判据.当遗传操作一定迭代次数后,适应条件属性集合C的简约是指C的一个非空子集值没有明显改变,或达到了事先给定的最优标准时,算C,它满足:法结束;a)IND(C,{d})=IND(C,{d});6)从简约集中提取规则.b)不存在C"C,使得IND(C",{d})=1.3配电网故障定位的数据挖掘库的构造IND(C,{d}).DM的实质为从数据中找出有意义的模式,用于简约可理解为在不丢失信息的前提下,以最简方挖掘的数据集将直接影响到DM效果,本文根据配电式表示DS的结论属性对条件属性的依赖和关联.所网的拓扑解耦特点和配电网故障定位的广义故障模式有简约的集合记为RED(C).空间出发,构造出故障挖掘数据库,其步骤如下:1.2.2辨识矩阵对信息系统S=(U,C∪{D}),论1)由于辐射网可最终解耦为单一的树干网,配电域∪={x1,x2,⋯xn},辨识矩阵可表示为网故障定位的DM模型都可按树干网为依据,因此故{a∈A:Va(xi)≠Va(xj)}D(xi)≠D(xj)障模式构造和训练具有很强的通用性和开放性的.只cij=0D(xi)=D(xj)i,j=0,1,⋯,n(1)要树干网的线路设备数一样,所用的故障模式就相同,-1Va(xi)=Va(xj)D(xi)≠D(xj)最终的决策规则数据库也相同.故障定位软件包将元由式(1)可知,辨识矩阵包含了决策表中的所有属件个数从1到配网可能的最大数目不等的树干网预先性区分信息.训练好,形成决策规则数据库,根据不同配网的具体网1.2.3基于遗传算法的约简形成随着属性表的增络拓扑等效解耦结果,选择调用相应的决策规则即可大,计算简约的复杂程度将剧增,已证明求取对象的简.故障模式信息组成为:输入矢量为各分段开关的电约组合属于NP完全问题,难以用穷举法来实现.本流越限信息序列,即将分段开关从进线开关(电源)开文所采用GA,利用其能克服局部最优,对领域知识作始顺序排列.位于故障元件之前的所有分段开关均有智能式搜索的特性,求出DS最佳简约.故障电流流过,有电流越限信号用“1”表示;故障线路设M为决策表的辨识矩阵,A={a1,a2,⋯,an}是之后的分段开关无故障电流流过,无电流越限信号用决策表中所有条件属性的集合;S为M中所有属性组“0”表示.输出矢量为线路元件的状态序列,线路处于合的集合,且S中不包含重复项.令S中包含有s个故障状态用“1”表示;正常状态用“0”表示.属性组合,每个属性组合表示为Bi,描述为Bi∈S,Bj2)DM模型所用样本模式的概念不同于传统∈S,Bi≠Bj,(i,j=1,2,⋯,s).令Card(Bi)=m,则BiFNN训练样本模式.FNN是基于隐含知识来构造,中每个条件属性表示为bi,k∈Bi(k=1,2⋯,m).这样,而DM是从可能形成的模式所对应的数据库中挖掘即将从决策表中求取简约的问题转化为在辨识矩阵中出隐含于其中的相关决策规则.在构造出标准的故障求取组合数最小的简约,其步骤如下:模式空间后,还应考虑配电网信息受干扰或丢失的可1)将问题的解编码成染色体,染色体中的0,1组能性,构造出的故障模式样本必须满足实际应用的需成的基因代表着优化空间的一个解;n求.但没有必要构造全样本2去测试,而是应用现实2)随机产生N个染色体,构成初始解群;环境中可能出现的故障模式覆盖程度来衡量,不需测3)选取适应函数,本文中的适应函数f定义如试样本的绝对数目.本文提出配电网故障定位的广义下:故障模式空间,即以可靠性理论为依据,将实际可能出card(B)-card(R)f(R)=(1-a)×+card(B)现故障模式去构造测试的样本空间,从而形成配电网 2002年5月廖志伟等:基于数据挖掘模型的配电网故障定位诊断·325·故障定位数据挖掘库.结果.可见,本文所提出的方法的定位诊断的正确率根据可靠性理论分析在配电网信息形成和传递过要大大高于常规FNN模型.程中信息畸变的原因,如元器件的故障概率,即可推断为了深入探讨在输入实时信息中存在畸变时,发出故障模式的输入矢量信息中出现畸变信息的可能概生误、错判的原因,以6#线发生故障为例,将各信息率.本文按输入信息中出现一位畸变信息来衍生出故畸变所衍生的故障模式形成诊断结果的性质统计结果障模式集,作为广义故障模式空间,形成DM模型的(见表3).数据挖掘库.表1挖掘所得到的最优决策属性的简约及规则按RS应用于DM的概念,整个广义故障模式构Tab.1Theminedoptimumreductsanddecisionrules成DM模型的数据挖掘库成为DS表,其中输入矢量故障属性最优简约决策规则数y1x2x3x411集合为条件属性集合,而输出矢量集合形成决策(结y2x2x3x4x522论)属性集合.y3x1x2x3x4x5x626y4x2x3x4x5x6x732y5x3x4x5x6x7x8322基于DM与FNN原理的配网故障定位模y6x4x5x6x7x8x932型的仿真测试及对比y7x5x6x7x8x9x1032y8x6x7x8x9x1022y9x7x8x9x1014以包含7个进线断路器、48个分段和联络开关、y10x8x9x10848条线路的复杂配电网络作为实例,对基于FNN原理的故障诊断系统和基于DM模型故障诊断系统进表2两种故障模型仿真结果与对比Tab.2Simulationandcomparisonresultoftwomodels行了全面的仿真.为了能清晰地说明研究问题的实输出矢量元基于FNN模型基于DM模型质,从全部仿真中提取一个具有10条线路、9个分段素中不正确故障定位诊断故障定位诊断开关的树干网供电区,其中有一条线路发生故障时的的维数模式数正确率/%模式数正确率/%具体实例来描述.10维都正确5857.48382.11维不正确3736.765.92.1样本模式的构造和规则的求取2维不正确54.951211.9根据构造DM故障模式的原则,此供电区基本故3维不正确11.0000障样本模式应是11个(各表示10条线路故障和无线4维及以上维数不正确0000路故障模式),且故障样本输入矢量由10个元素构成表3含10条线路、9个分段开关的树干网6#线路故障,.考虑可能出现一位元素畸变的原则,每个故障样本一位信息畸变的测试结果和对比模式可衍生出10个变异模式,总计有121个模式.而Tab.3ComparisonofFSDonefaultlineinasingletrunknetworkwithonebitmutationininputvector在全部变异模式中存在有各种重迭的模式(见表3),序故障电流越限信常规FNN数据挖掘模输入矢量元素每衍生的10个变异模式中就有两个是与基本故障模号号判别法输出模型输出型的输出式是一样的(FINN和本文的方法都无法解决,有关研1111111000000000100000000010000000001000020*1111100001#000010000000000#00000000010000究将另文发表),如表3中的序号7与8两项.将上述310*1111100001#1#0001000000000100000000010000重迭的模式剔除后,参加仿真测试和检验的是101个4110*111000001#1#0010000000000#00000000010000模式.51110*110000001#1#01000000000100000000010000611110*100000001#1#10000000000#00000002020000根据文中1.2节提出的基于GA求取RS最优约7111110*000000001#0000000001#0000000001#00000简的算法,用GA在广义故障模式空间中作全局优化81111111*0000000001#0000000001#0000000001#000搜索.其中个体由10位二进制的基因组成,遗传操作911111101*000000011#1#00000000#0000000002020010111111001*000000101#1#000000100000000010000中的交叉率和变异率分别取0.3和0.05,挖掘所得的111111110001*000001001#000000100000000010000配电网故障定位约简和决策规则结果见表1.注:表中的输入元素中“1”表示有电流越限信息,“0”表示无,其2.2仿真和测试结果的分析中标注*的为畸变信息位;表中输出元素表示线路元件状态,“1”表示线路元件故障,为了说明所提方法的有效性,用基于DM模型与“0”表示正常,“2”表示不能得到确定解,给出其置信度,如常规FNN模型的故障定位相比较,其测试结果示于0.75;其中标注#的为错判的元件;表2中.该表是对所测试的树干网供电区任一条线路表中序号1为无信息畸变时的知识样本的输入和输出矢量.发生故障,输入元素中有一位信息发生畸变时的测试 ·326·天津大学学报第35卷第3期由表3可知,常规的故障电流越限信号判别法对一矩阵算法[J].电力系统自动化,1999,23(1):31-33.信息的畸变非常敏感,无容错能力,形成错误和扩大故[2]文福栓,邱家驹,韩桢祥.利用断路器信息诊断电力系统故障的高级遗传算法[J].电工技术学报,1994,11(2):58障判断8次,错判2次;对基于的FNN模型,具有一定-64.的容错能力,漏判4次,错判2次;对DM模型具较高[3]MontakhabMR,AdamsRN.Intelligentsystemforfault的容错能力,错判2次,提示质疑判断2次(给出诊断diagnosisonlowvoltagedistributionnetworks[J].IEE置信度结果).Proceedings:GenerationTransmissionandDistribution,置信度可提醒运行管理人员作进一步的查询判1998,145(5):592-596.断,利用其结果与其相关的信息进行修正,作再次诊断[4]KimCJ,YongTaekOh.Distributionfaultidentification.所以,本文提出的故障定位模型有较强的容错能力usingfuzzylogic-baseddecisionmakingsystem[J].Proc和诊断结论的透明度,因此该故障定位原理具效高的of1996IntemationalConferenceonIntelligentSystem实用价值.ApplicationtoPowerSystems.SeoulKorea,1996:331-335.3结论[5]孙雅明,杜红卫,廖志伟.基于神经逻辑网络冗余纠错和FNN组合的配电网高容错性故障定位[J].电工技术学报2001,16(4):71-75.1)将RS理论的定性分析与GA全局最优解搜索[6]廖志伟,孙雅明.数据挖掘技术及其在电力系统中应用的功能相结合,构造基于DM故障诊断模型,仿真结果综述[J].电力系统自动化,2001,25(13):31-33.表明系统具效高的容错性能,有效解决了配电网信息[7]PawlakZ.Roughsets[J].InternationalJournaloflnfor-畸变而造成的故障定位误判问题.mationandComputerScience,1982,(11):341-356.2)构造了通用性强的决策规则数据库,可根据具[8]廖志伟,孙雅明.基于数据挖掘模型的高压输电线系统故体配网结构任意调用,开放性强,避免了配网故障定位障诊断[J].电力系统自动化,2001,25(15):15-19.软件的二次开发工作.[9]Aleksanderhm.DiscermibilityandRoughSetsin3)根据配电网的拓扑解耦特点和配电网故障定位Medicine:ToolsandApplications[D].PolandNorw-gian:NorwegianUniversityofScienceandTechnolo-的广义故障模式空间,给出故障挖掘库的构造方法,提gy,1999.高了DM的针对性和故障定位的实用性.参考文献:[1]刘健,倪建立,杜宇.配电网故障区段判断和隔离的统ANewApproachforFaultSectionDiagnosisofDistributionSystemBasedonDataMiningModelLIAOZhi-wei,SUNYa-ming,DUhong-wei(SchoolofElectricalEngineeringandEnergy,TianjinUniversity,Tianjin300072,China)Abstract:Consideringtheworkingconditionoffeederterminalunitsinpracticalapplicationoffaultsectiondiagno-sisfordistributionnetworks,thedamageofFTUelementsandthedistortionofinformationareunavoidable,andincorrectdiagnosismaybecausedbydistortedfaultpatterns.Thispaperpresentsadataminingmethod,whichisbasedonthecombinationofroughset(RS)theoryandgeneticalgornhm(GA),todealwithdistortedinformationandcarryoutthefaultsectiondiagnosisofdistributionnetworks.Inthisapproach,RSisusedtoanalyzethegener-alizedfaultknowledgeregionandGAisusedtominetheredundantrelationandinternalrelevantrulesamonginputinformationandfaultsectiondiagnosisresults.Thehighfaultto1eranceperformanceoftheproposedapproachisprovedthroughcomparisonwiththatoffeedforwardneuralnetworksmodelbasedfaultsectiondiagnosis.Keywords:distridutionnetworks;faultsectiondiagnosis;datamining;feedfowardneuralnetworks;fault-to1eranceperformance;roughset