基于流形学习的数据降维技术及工程应用研究.pdf

基于流形学习的数据降维技术及工程应用研究.pdf

ID:50070087

大小:6.22 MB

页数:55页

时间:2020-03-04

上传者:U-56225
基于流形学习的数据降维技术及工程应用研究.pdf_第1页
基于流形学习的数据降维技术及工程应用研究.pdf_第2页
基于流形学习的数据降维技术及工程应用研究.pdf_第3页
基于流形学习的数据降维技术及工程应用研究.pdf_第4页
基于流形学习的数据降维技术及工程应用研究.pdf_第5页
资源描述:

《基于流形学习的数据降维技术及工程应用研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

‘場約葬講萊誕謬、满讀讓繞攀鶏弯续穗;確^,寒難纖或V;義麵繼置審卿.議苗刚辣耀'V巧變:、‘、.、0:-;ti'.产4'vL?■,一;、1‘乂聲*、薄着巧攻装碳丰巧生学位论讀讓義、戸Ifii|’':巧'..:‘,皆帝辨/.巧策y瓣認/.山础於带。'、‘‘>心^气.i:邏誤繊篇(^^j)?稱禱難剛矿奪;'繼I一‘1賴s纖'.*'、''?^’’片.皆敌J、.仲、,表乂呼l.補V献宗^基巧^形学习的数据降维巧韦及王璋f苗;黎是'...'..^v值用硏为:A^纔冷苗综媒矿,:\^若知销IP1議曲库謹薑覇丽.:八、Nri雖聲i盞卷''^■>-01a:43090401/;:'—.-— ̄:.^.>./;;点.讲品於;篇杳.-’八.糾(专业離).;蛛;京^鷄'擊托.’:於、';>:模式识挪义L?、-.V绅究亦畜乾‘;记知,又扣>式9心:豕''’卢壬月海、、诘軒讀療雌导心|:,謂资卿.麥扣賊…,仁直巧廷茲:#炎.心‘:八’、'’..V货,:….V护令,':乃.护背品:法f:,六山竹了‘?.V夺冰';心^纏簾這蘇满齊趕_姆讓瓣I雜禮議悉’纖繪龜隹儀誦藝筹镇麵麵論f’—’一>.二:,:V.二絲若巧巧共社吉:媛志苗钱; 化方工化大学学位论文原创性涛明,本人郑巧奔明:巧呈交的学位论文是本人巧导师的衔导下,独立进行研巧工作所取得的成巧,除义中邑经注明引用的巧容外,木论文不含任倒巧牠个人或堯化己经发袭或探写过的作晶成梁,对本文的研究做出重變質献的个人巧集体,均己在文中W明确巧式孩明*本人完全怠识到本声巧的法律结果由本人承巧,学位论文作者签名:B期:片口年^月/日]学位论文使用授较书学位论发作者完全了解北方工业大学有关保窗巧使用学值论文的规定,即?学:研巧生巧较攻读学位期间论文工作的知识产巧单位属化方工化大学巧杳权傑留并向廬家有关部口或机构送交论文的复印件巧电子版,化许学俭论文被意阅巧借闽;学校可W公布学億论文的全郁或都分内容,可抖化许采用影巧、缩印或其芭复術手段保存、r编学位论文(保密的学位论文在解密房逛用于本授校书),口保巧论义注巧;经本人申巧.学校批准,本学位论义定为保密论文,密级:.巧吸:年,自年月日超至年月日化,解巧房活用本巧化书,b/非保巧论义注稀:本学位论文不属子保密稚围,适巧本授较书。,來扳J,I本人巧名:日期,W绿师巧名:日朋:_4々 北方工业大学硕±学位论文基于流形学习的数据阵维技术及工程应用研究摘要随着人工智能和大数据技术的飞速突破,机器学习和数据挖掘这些人工智能核也研究领域往往会得到普遍呈现出高维、非线性特性的数据。W模巧电路故障诊断为例一,特别是在个高度集成的电路板上进行板级故障定位时,由于元器件数量大且存在容差,导致采集到的数据更倾向于1^^高维数、非线性结构分布。对于这些大规模、高维非线性的数据,人们想要直观的感知隐藏在高维数据下的有一用的知识,难度可想而知。数据降维,是窩维数据维数降低的最有效途径之。。数据降维技术可分为线性降维和非线性降维线性降维技术应用广泛,但对包含大量非线性数据的实际工程应用降维效果较差,这也使非线性降维技术逐渐成为当前的研究热点。为获取高维且难W理解的数据的低维表示,基于流形学习的局部线性嵌入维数约减方法利用局部线性和全局非线性的假设,使其在减少高维数据维数的过程中,仍可保持高维数据的原有结构。这种特性使其成为机器学习研一巧领域的研究热点之。本文研巧使用基于流形学习方法的局部线性嵌入化ocalLinearEmbedding,LLE)技术进行特征降维和特征提取的问题。针对模拟电路故障诊断工程中特征维数高问题一LLE,提出了种基于小波包分解和算法相结合的特征维数约简方案,W两级四运放低通滤波器电路为研究对象,通过基于克隆选择算法的故障诊断研巧了故障将征维数约简技术。实验研究结果验证了本文提出的算法在模拟电路故障诊断特征降维问题的适用性,从而为LLE算法在复杂数据降维的工程应用提供了有用的参考。关键词:流形学习,,,数据降维局部线性嵌入模巧电路故障诊断,小波包分解I 北方工业大学硕±学位论文ResearchonDataDimensionReductionandEngineeringApplicationBasedonManifoldLearningAbstracttttedata化chnooWiththeraiddevelomenofarificialinellienceandlarlgyppgg,machinelearninganddatamininoftheseartificialintelliencecoreresearchareasgg-t化ndtobee打erallshowinhihdimensio打al打o打linearcharaceristicsofthedata.gygg,Takinanalocircuitfaultdianosisasanexamleeseciallinahilinteratedgggp,pyghyg-ttscircuitboardforboardlevelfaullocationduetothelarenumberofcomonen,gpandtheexistenceoftoleranceresultininthedatacollectedmoreinclined化,gh--trt-ihdimensional打onlinearSucuredistribution.Fortheselarescaleg,g,h--tihdimensionalno打lineardataeolewant化intuiivelerceiveusefulg,ppypknow-tttledehidde打inhighdimensionaldaahedificuhcanbeimained.Daag,ygdimensionreductio打isoneofthemo巧efectivewaystoreducethedimensionalityofhighdimensionaldata.Datadimensionreduction化chnologycanbedividedintoamensio打alireconandnonlineardimensionalitreduction.elinearlinerditydutiyTh*dime打sio打alitieductio打kchniueiswidelyusedbuttheefectofreducintheyq,gdsonatofteactuae打ineerinalicaionwihlareamountof打on-lmearime打iliyhlggppttgdataisalsobecomingthehotspotofthecurrentresearch.Inordertoobtainthe--lowdimensio打alrerese打tationofhihdimensionalanddificulttounderstanddatapg,thelocallinearembeddingdimensionreductionmethodbasedonmanifoldlearningusestheassumtio打oflocallinearandglobalno打linearity!:〇reducethedimensionofpt-hidime打sionaldataCansillmaintaintheoriinalstructureofhihdimensionalgh,ggdata.Thisfeaturemakesit0打eof也ehotspotsinthefieldofmachinelearning.I打thisaerwestudtheroblemoffeaturereductio打andfeatureextractionpp,ypusi打ocalLinear£mbeddi打LLEtechniuebasedo打manifoldleami打method.gLg()qgAaheroblemofhihfeaturedimensioninanalocircuitfaultdianosisimingttpgggproectafeaturedimensionreductionschemebasedonWaveletPacketj,Decomos--pitionWPD)andLLEalgorithmisroosed.Thetwostagefouropamp(ppII 北方工业大学硕±学位论文-lowpassfiltercircuitisstudied.ResearchonfaultfeaturedimensionreductionbasedonCloneSelectionAlgorithm(CSA).Theexperimentalresultsverify化eapplicabilityofthealgorithmroo化dinthisa化reducetheroblemoffeaturereductioninpppp巧panalogcircuitfaultdiaosis,whichrovidesausefiilwferenceforLLEalorithm化gnpgreducetheengineeringofcomlexdata.pKeywords:manifoldlearning,datadimensionreduction,locallinearembedding,analogcircuitfaultdiagnosis,waveletpacketdecompositionIII 北方工业大学硕±学位论文目录摘要IAbstract田一第胃绪论11.1课题来源及研究意义11.2流形学习概述21.3工程中的数据降维问题及降维目的41.4流形学习的国内外研巧现状61.5流形学习降维技术在工程上的应用81.6本章小结9第二章模拟电路故陣诊断及其数据降维102.1模拟电路故障诊断现状概述102.2模拟电路故障诊断总体流程102.3模拟电路故障特征提取方法12213.4模拟电路故障诊断工程降维问题214.5智能诊断算法简介2.6本章小结15第H章两种典型的流形学习数据降维方法163.1等度量映射163.2局部线性嵌入173.3算法比较203.4本章小结20第四章模抵电路故障诊断铃征提取214.1通用的特征提取技术214.2系数能量值提取224.3小波特征提取技术实现方案244.3.1小波基函数选择实验254.3.2小波分解层次对比实验:264.227.3小波系数构建故障特征对比实验429.4本章小结第五章流形学习数据降维及模拟电路诊断工程应用301 北方工业大学硕±学位论文5.1实验方案3053.2实验电路图15.3故障注入与数据采集325.4数据预处理345.5实验结果与分析%5.5.1LLE和Isomap数据降维效果对比实验%5.5.2WPD不同分解层数下数据降维效果对比40一5.5.3同数据进行降维效果对比实验41第六章结论与展望436.1主要结论436.2研究展望43参考文献44申请学位期间的研巧成果及发表的学术论文47致谢482 北方工业大学硕±学位论文第一章绪论1.1课题来源及研究患义计算机科学技术的飞速发展,使得机器学习受到了众多研充者的关注。在研,巧模式识别或数据挖掘领域中的实际工程问题时,为了获取有用的数据信息计算机往往要存储并处理大量的高维非线性的数据。如在模拟电路故障诊断、图像处理、文本分类、信息检索和人脸识别等实际工程中,研究人员所获取的数据往往呈现数据量大、维数高和非线性结构的特点。送些特性给数据处理带来了很多W的问题,例如计算效率低下、维数灾难、线性模型失效等。此外,仍有大量的、"感"难W被人类知的知识和规律存在于这些数据中。探索高维数据中的存在的内在规律,对数据进行降维,引起了广大学者的高度关注。一降维技术是模式识别的关键技术之。目前数据降维己成为数据挖掘和机器一学习等相关领域关注的重点研究问题。对高维数据进行有效的降维,用个简略的低维数据进行表示,便提取在高维数据中潜伏的有用的信息也是当数据挖掘一一领域的研究热点么。现有的数据降维技术大致上可|^分为两类,第类是线性降维,如主成分分析(PCA)、线性判别分析(LDA)等。第二类是非线性降维,包括等度量映射和局部线性嵌入等。线性降维技术出现时间早,成果比较多,但一旦在实际工程应用中,当面对数据具备线性可分的理想情况下降维效果最好,面对工程中出现W非线性、流形分布的数据时,线性假设不成立,使得用线性降一维技术进行降维收效甚微,PCA,。WPCA为例是种典型的线性降维技术其一实现降维的方法是通过个线性映射函数,得到高维数据映射在低维子空间中的一坐标,实际上是个坐标变换的过程。但面对高维数据具有非线性结构时,PCA采用的线性变换手段,得到的降维结果不能很好的反映数据本质结构。基于线性降维技术的诸多不足,非线性降维技术应运而生,发展迅速,基于流形学。其中习方法Mani化IdLearnin的数据降维技术,是当前发展较快也相对较为成熟的(g)一非线性降维技术方法,。流形学习理论认为大多数的高维数据都能找到个与之相对应的低维流形结构。在实际工程运用中,面对大规模高维、非线性数据,流形学习方法可W找出空间中嵌套在高维空间中的内蕴低维结构,找到数据点内在的分布规律,,最终实现降维。在使用流形学习处理实际工程中的维数灾难问题时流形学习降维技术克服了线性降维技术的不足,逐渐被广泛的应用在当前机器学1 北方工业大学硕±学位论文习和数据分析相关领域中。本文对基于流形学习方法的数据降维技术进行研究,W期解决模拟电路中,使用小波进行分解提取特征时,特征维数随小波分解层数的增加呈指数形式増长一所造成的维数灾难问题,从而进步提高模巧电路故障诊断工程中的故障诊断率。全文的主要内容概括如下:1)介绍了流形、流形学习及降维的相关概念绍了具体工程中数据降维;介问题及降维目的;介绍了流形学习研究现状及其在工程上的应用。2)介绍了模拟电路故障诊断现状及其发展缓慢的原因;详细分析了基于模式识别技术的模巧电路故障诊断流程主要包括:电路数据采集、故障特征提取、、故障分类算法训练、识别结果等五个主要阶段典型故障特征构建:介绍了模拟电路中常用的特征提取方法:研巧了引起模拟电路特征维数灾难的原因;最后对用于进行验证降维效果的克隆选择诊断算法CSA)进行简单介绍;(3)研巧两种典型的流形学习数据降维算法:等度量映射和局部线性嵌入。通过比较时间复杂度和参数,得出LLE算法运算量小、参数少等优点,为验证实验中选择使用LLE算法在模拟电路故障诊断工程中进行复杂数据降维提供理论依据;4)研巧模拟电路故障诊断中的通用的小波特征提取技术实现方案,并通过实验研究了小波特征提取中如何选择最优小波基、最优分解层数和最优小波分解系数构造特征的H方面内容。5)提出用LLE+WPD+CSA的模拟电路故障诊断框架,实现了典型两级四运放低通滤波器电路故障特征数据降维。实验结果验证了LLE算法在模拟电路故障诊断复杂工程应用中进行复杂数据降维的适用性。1.2潇形学习巧述流形(Manifold,是20世纪最具有代表性的数学理论,它将化何学和拓扑)学等多个数学研巧领域进行有效的联结一,成为现代数学中的个十分重要的概念,R一最早由iemann在博:t论文中使用流形词,随后希尔伯特给出了流形严格的数学定义。为了更清晰准确的描述流形学习的理论和方法,给出流形学习相关数学基础;一一拓扑:假设X是个集合且非空,T是集合X的个子集,若T满足下面H个条件;1)X,0GX;2 北方工业大学硕±学位论文2)如果4、BGT,那么4nBGT;■一"3巨TT"*3)如果TCT,则称!的t拓扑。,那么是AiWT一XT一拓扑空间:若是集合Z的个拓扑,则称集对,是个拓扑空间。()一、同胚;设X7是两个拓扑空间,t是个连续映射,如果f有有逆一个同胚映射映射,并且说X与y同,而且逆映射也是连续的,那么就说f是["胚。一:设XT,如豪斯道夫空间,是个拓扑空间果X中任何两个不相同的点和()-U和的邻域uny=X,都存在的邻域使得0,则称集合X所在的空间jW为豪斯道夫空间。一GM,均存在P的流形:假设M为非空豪斯道夫空间,若对于任意点P一d维的拓开邻域USM与d维欧氏空间的某开子集K同胚,则称M为W一化流形。流推广。在每个很小的局部邻域,。简称d维流形是欧式空间的进W流形和欧氏空间都具备局部平滑性和线性构造,在局部可W赋予坐标。一一SwissRoll是个简单的流形的例子。如图1所示,个长方形在H维空间一卷曲个S曲面,从运个流形上,000个采样点,应用Isom方,形成了取出1巧-C,降到2维后效果如最右侧图1所示。法对采样点进行降维,邻点取12U)A没;C)|}i懷琴穀'-' ̄ ̄ ̄ ̄,°口roS0;T10(A)SwissRoll流形(B)1000个采样点(C)二维嵌入结果-图11SwissRoll流形""流形学习,最早是在19%年由Bregler和Omohundro两位学者提出。在他们分别发表的两篇关于可视化语音识别和数字图像处理的论文中首次提出这个词其严格数学描述是由Silva和Tenenbaum在文献中给出,如下所不:一dd《D流形学习:给定采样于或近似采样于D维空间中某()维的流形3 北方工业大学硕±学位论文0=c阪XM的数据集乂,有X杉=,其中为列向量,代表每个采样样本。流ii巧i一=Cd定的约束条件下寻找X的低维流形坐标表示IR形学习就是在1/{公<巧=1,W=-其中%/为对应采样样本的低维坐标。如图12所示,流形学习示意图。(切,3‘‘/。y图-12流形学习示意图一"流"流形学习是类借鉴了拓扑流形概念的降维算法。形是在局部与欧式空间同胚的空间,换言之,它在局部具有欧式空间的性质,能用欧式距离来计算距离。这给维数降低带来了很大的启发,则数据,若低维流形嵌入到高维空间中样本在高维的分布看上去非常复杂,,,但在局部上仍具有欧式空间的性质因此可容易的在局部建立降维映射关系,然后再设法将局部映射关系推广到全局。0<"降维数学定义=£巧:给定〇个样本数据点乂乂...乂,给{而,2,。}出映射d一dxn一识d《D或给出另种结果^=£沉=...yd《〇。则y,;护1乂,n},=。...称之为X乂…,化,化T2^1峨,2而}的降维1.3工程中的数据降维问题及降维目的高维数据普遍存在于各种实际工程应用问题中。这些数据外在表现为高维,W但其内在仍是低维结构。在高维数据背后隐藏的,有关于事物本质特征的描述依然是人们更想探巧的。根据目前对数据的处理技术上来看,当数据的维数较低、4 北方工业大学硕±学位论文且具有全局线性结构时,传统的线性降维数据处理方法可!^取得较好效果。但当面对实际工程应用,处理高维、非线性数据时,不存在数据线性可分的理想状态,导致线性降维数据处理方式应用受限。例如,在模拟电路故障诊断特征提取时,为了达到预期的泛化能力,会使用小波包分解技术对电路瞬态响应信号进行充分的分解,得到信号所有的高低频部分小波特征系数,但由于小波包分解所得的特""征数据维数会随着小波包分解层数的增加呈指数级增长,引起维数灾难,且数据因为元件容差,,多非线性、流形分布最终导致使用基于模式识别的分类算法计算量大、无法收敛等问题。这些难题也是目前机器学习和模式识别领域处理高维数据所面临的最严峻的挑战。在具体工程研究中,用于度量模式的变量个数越来越多,如何有效的在低一一、,提取出有用的信息维空间中描述模式,是目前需要解决的核屯问题之。个模式识别系统中,基础的因素是用来描述研究对象的特征。若特征与问题关系很,,分类效果都不理想。特征间存在冗余信息弱采用什么样的分类器,也会使分类速度大大减慢一。提取和问题密切相关的特征是模式识别的关键步骤之,因此有必要搞清楚模式识别领域中特征提取和特征选择。一一M特征选择,就是从组数量为W特征中选择出组数量为最化特征W一(M<A〇。送里需要解决两个问题:1)选择种可分性判别作为最优特征选择的标准一一;2)找到个好的算法,来选择出这组最优特征。对个原始特征来说,,特征选择的方案有很多从W维特征中选择出M个特征共有诚—M)\一种选择法,,那种是最佳就要找到个原则来进行指导。特征提取,是通过变换一来突出某模式组中具有代表性特征的种方法,。当要处理高维原始数据时映射或者变换能获得最有效特征,便于表示特征样本,这个实现降维的过程称为特征W提取。通过特征选择方法可W得到最佳的输入特征子集,而通过特征提取方法可W构造和重新组合新的特征向量一。对于般简单的问题,研究者往往会选择优先执行特征提取方法,将特征从感知器的高维数据中提取出来,然后在执行特征选择方法,,将那些鉴别能力低的特征舍弃。在实际工程应用中具体的选用特征提取还是特征选择要根据问题领域和训练集的恃殊性来决定。特征选择可W保持被选W,特征的本质属性这些本质特性往往会更有利于模式的产生。特征提取,通过,相对于特征选择来说,重构的特征,会产生比其选择的产物具有更佳的识别效果W但需要人们注意的是,重构的特征可能会失去原有的物理含义。针对高维数据在分析和处理时的不便,对其进行维数约减并提取最主要的成5 北方工业大学硕±学位论文分就成为高维数据分析的迫切任务。当前,利用数据降维技术对高维数据进行维数约减Jl,总结起来,期望能实现:li下目的1.有效的压缩数据,节约存储空间,减少数据量和计算量,从而有效的降低计算化的开销。2.降低高维数据中的噪声影响。高维数据包含丰富的信息,其中也包括部分噪声信息,对高维数据进行维数约减,提取分类所需的主要成分,删除冗余的噪声维数—,可W定程度上降低高维数据中的噪声信息影响。—""""一3.定程度上解决维数灾难问题。维数灾难问题直制约着传统数据处理与分类方法,通过将高维数据维,使其面对高维数据处理时效果不理想数约简,,然后利用智能算法进行处理将会有效的避免产生维数灾难问题。4.挖掘数据中人类真正感兴趣的知识,实现机器学习良好分类的目标。维数约减,减少在分类问题中不起作用的特征向量,有效地提高分类。5.增强对数据的感性认识。降低高维数据维数,可很直观的观察数据的本质结构,增强高维数据的可视化效果。1.4流形学习的国内外研究现状W流形学习方法的研巧工作始于1984年Hastie在报告中提出主曲面的概念。^随后研究者将其运用在很多实际工程中来处理非线性的数据。Aminian等在研?究模拟电路故障诊断时获取电路响应数据的非线性几何结构;Bregler在语音识"别研究中也发现语音数据存在复杂的非线性结构。同年Bregler首次提出了流"9一"形学习词,并应用在语音识别研究中000eun哺Danielcie。2年Sg在《Snce》上发表的H篇有关流形学习的文章、。文中他们站在神经屯理学的角度提出人类的感知方式^心流行形式存在,并初步给出流形学习的生物学认知基础。流形学习方法目的是找出隐藏在高维数据中的低维流形结构。通常假设样本数据嵌入在高维空间中的低维流形上,因此其可被认为是挖掘数据的低维、非线性所具有的流一W形结构的本质特征的种有效的方法。数据的高维流形分布,使其具有非线性一结构的特性,正是这特性给数据降维的建模研究上带来了很大的困难,U"一Tenenbaum和Roweis提出了种基于局部线性和全局非线性的研究方案。他一个流形上的数据们通过假设分布在同,在维数不同的嵌入之间存在个别特征保一持不变(,达到能够寻找到个可^最大程度上保持这些不变特征的低维最优嵌入,并将问题归结为最优化求解的问题随后构建了等度量映射和局部线性嵌入两种流形学习方法。其中前者能够保持局部长度特征,后者可W实现保持近邻6 北方工业大学硕±学位论文点的线性关系特征。从2000年《Science》杂志上发表了使用LLE与Isomap进行流形学习的算法开始,为流形学习在机器学习领域开辟了新的研巧道路,随后W这两种算法结构为基本的流形学习方法相继问世。随后研究中,研究者又相继提出了很多新的流形学习算法,其中较为常用的有Laplacian特征映射算法(LE)、最大差异展开算法(MVU)、局部切空间排列算法(LTSA)、黎曼流形W学习算法RML等。()为了获得原始数据集的內在结构知识,人们往往会采取分析嵌入的向量集的一特征。嵌入方法所构建的样本与样本之间的复杂关系通常用个矩阵来表示,然后根据频谱分析方法可W得到嵌入向量。根据描述特征数据之间的局部与全局的W。关系的方式不同,W及对嵌入所作的假设不同,可将嵌入方法分为很多类一一等度量映射般是被视为全局方法的代表,局部线性嵌入算法般是局部方法的的还有LE3、LTSA等。此外Weinbere产代表,其他g等提出了半正定嵌入算法-Max〇SemiDefiniteEmbeddingSD巧,随后又将其发展为最大差异伸展算法imum,(VarianceUnfoldingMVU。在MVU算法中,引入半正定规划是该算法的主要蒋,)点之一习方法的主要区别是其将学习问题转向核矩阵凸,该算法和之前的流形学twtw一优化问题,它也经常被视为是种基于核的学习方法。北京大学Lin等提一R出种基于局部切空间递推对准的黎曼流形学习算法(iemannianManifoldLearn。流形学习的线路发展线路如图1-3ing,RML所示。)^等距特征映射Ia2000somp,年)^ ̄XX局部线性嵌入^X的感知(L比,2000年))/、V■….可能^<1流^"方式存拉普拉斯特征映射/\S^\LAXJ(LE.2003年)^\e研巧发现髮出更多ftiS提出流。J^*^流形学(肌U2004音望警資行学习,革)j具有内在N/一词W习算法I低维结构J、VJ局部切空间对齐Vy\(LTSA,2005^)yJ黎曼流形学习(RML,2008年)J图-3流1形学习发展的路线图7 北方工业大学硕±学位论文1.S流形学习降维技术在工程上的应用一种探索高维非线性数据的途径流形学习维数降低技术,提供了,是近期研W一巧的个热点。流形学习方法的非线性、几何直观性和计算可行性,使得它在WU"很多实际工程应用变得越来越广泛。2010年刘新东提出了基于LLE和支持^向量机技术的故障特征降维方法并应用于模拟电路软故障诊断中。廖剑2015一年在模拟电路故障特征的降维处理中,,提出种基于局部线性判别分析降维方法利用数据的局部判别信息来处理非线性数据,克服LDA的小样本问题,在模拟电路故障特征提取中取得较好的效果。尽管流形学习方法对高维、非线性数据有一些的不足很好的降维处理效果,但其在实际工程应用中仍存在,例如对噪声比较敏感、小样本等,经过研究人员的不懈。然而人们对流形学习的探索从未停止一?努力,些针对性的解决算法也相继实现。2006年an提出的鲁棒局,Chg等部线性嵌入算法,消除了原始的LLE算法对噪声敏感的问题。2008年,Li等提出的局部线性判别嵌入算法,有效的克服了小样本和样本外点的问题。当前,流形学习方法的应用包括W下几个方面:1)数据的可视化。若低维流形嵌入到高维空间中,则数据样本在高维空间中的分布虽然看上去非常复杂,,但在局部上仍具有欧式空间的性质,因此可W容易地在局部建立降维映射关系,然后再设法将局部映射关系推广到全局,当降维被降至兰维甚至是二维,,使用基于流形学习,能对数据进行可视化展示因此方法的数据降维技术被很好的应用在手写数字形状、头部姿态和手形等相关研巧的可视化方面。2)信息检索。信息技术的飞速发展,文本信息的应用日益普遍。如何进行有效的管理规模庞大的文本数据库成为当前急需解决的问题。高维大规模和非线性结构是这些文本信息数据的主要特点一一。解决这问题的关键技术之是需要灵活、高效的信息检索策略技术。利用流形学习方法处理信息数据检索,不仅降低W?,还保留数据在原高维空间的近似性。了时空复杂度例如,卢进军等将局部线性嵌入算法成功应用于基于内容的图像检索中,取得了良好的检索结果。3)机器视觉。流形学习降维技术在计算机视觉方面随着信息技术的发展应用越来越普遍。目前基于流形的维数约简技术己经在生产控制、图像和视频数据的处理、视频监控与分析等。4)交通信息。目前基于流形学习方法的数据降维技术己经开始应用于基于车辆信息采集的智能交通控制系统中,对于车牌信息识别、驾驶员饮酒或疲劳状态检测、车型信息采集和交通道路路况预测等得到了较好效果的运用。8 北方工业大学硕±学位论文1.6本章小结、本章中,详细分析课题来源及研究意义,针对工程应用中数据多呈现出髙维非线性的问题,对数据进行有效的维数约简W期得到隐含的内蕴特征变得尤为迫切。在数据不存在理想的线性可分情况下,线牲降维技术无能为力时,研究了非一流形学习降维技术线性降维技术。给出流形学习相关基拙,并介绍了工程中数,通过特征选择和特征提取两个概念说明了数据降维技术据降维问题,并给出数据降维技术在实际工程上的应用及介绍了流形学习相关的研究现状一。在下章节,将详细介绍有关模拟电路故障诊断的研巧工作。9 北方工业大学硕±学位论文第二章模拟电路故障诊断及其数据降维2.1模拟电路故障诊巧现状臟随着电子技术的不断发展,大规模模拟集成电路应用越来越广泛,在这些集成电路中模拟电路所占比例高达80%,因此模巧电路的故障检测与诊断是提高系W3统可靠性的关键。模拟电路故障诊断主要任务是解决在己知电路拓扑、输入信^w号和出现故障时电路的响应时判定电路故障类型、器件和参数的问题。Berowitz于1962年建立了部分元件可解性的必要条件开启了最早模拟电路故障诊断研究,^走十年代后期Navid和Willson发现了线性电阻元件可解性分析的充分条件,奠定了模拟电路故障诊断坚实的理论基础一。这时期故障字典法和参数辨识法得到了比较广泛的研究。八十年代,故障诊断的研究方向从求解全部电路元件转移到部分元件W及多故障诊断,更加重视电路可测性研巧。1985年Bandler和"5^Salama系统论述当时模拟电路故障诊断的主要方法和原理,完善了模拟电路故一时期出现的典型方法包括故障验证法和失效定界法等障理论。这。九十年代,模式识别技术的不断发展,为模拟电路故障诊断提供了新的解决方案。近年来基SWU’W’WWMW’"3于神经网络、遗传算法、小波理论、支持向量机、人工免疫、W克隆选择等模式识别技术的被广泛应用于模拟电路故障诊断领域,并成为迅速研巧热点。由于模拟器件参数容差、输入输出均为连续信号、电路非线性、故障复杂等特性及信号观测手段、征兆提取方法、诊断知识完备程度及诊断经济一直进展缓慢性的制约,使得模拟电路故障检测与诊断研究,直至目前多数模拟电路的故障诊断还都通过人工完成。即使目前智能诊断算法具有不需要求解电路方程,、不需要用户具备电路知识等优点但是该类算法的效果取决于训练出的诊断模型。而这需要覆盖全面故障的海量数据、高效的特征提取算法、良好的分类算法,。目前大量研究多注重神经网络等分类算法对故障特征提取与构建则主要为验证提出的算法根据经验完成,缺乏系统性研究。2.2模拟电路故持诊断总体流程-基于模式识别技术的模拟电路故障诊断的总体框架如图21所示,包括两个阶段:诊断算法训练阶段和故障诊断阶段。两个阶段均包括电路数据采集、故障特征提取、典型故障特征构建、故障分类算法训练、识别结果等五个主要阶段。10 北方工业大学硕±学位论文电路数据采集ss'I典型特征^I信号一j1哀II厨]Nonnar状态特征I|邮[||__一_1I化杰恃冲断l^rmal各节点电压数据集||柄,11.Il1Fault'一^一^^算au特征iFaultl各节点电圧数据集II统征IIFlt2状态1Fault2'Faults寄节祉即空勤I._……職征,(Irt"aultTi态特征I背Ip|!jV迎-/^蘇化各节点电压数据集I阳山I丫么/厂评价与反馈I故__^■一■■IIIAIm暗被测电路、rawi..W、IRir^^^ ̄^^诊状态集征提取征构建诊断结果断I2-图1模拟电路故障诊断的总体框架一第阶段为电路数据采集。在算法训练阶段,该模块要采集故障分类器训练所需要的数据,该模块采集被测电路板的实;在故障诊断阶段际运行状态数据。由于模式识别类算法只能识别所有被训练过的己知故障集,因此诊断算法训练阶段的输入数据是决定算法成败的关键。为此,在训练阶段,不但需要采集电一路正常状态下的激励与响应数据,还要通过人为逐注入各单类故障的方式采集。全部故障集的状态数据为了模拟电路中模拟器件容差的影响,在任意状态下,还需要通过蒙特卡洛仿真等技术手段模拟任一个模拟器件的值发生容差范围偏移的情况,并采集各种偏差情况下状态数据进行训练。模拟电路故障诊断的训练-2所示数据和实测数据的构成如图2。Nodel\Aj\f\J襄Node2讓害 ̄_■I:Z:IIItfNoden\/\/\/\Ii进行各种模拟器件的蒙特I?卡罗仿真,模拟器件容差生成全部可能的状态数据一图2-2电路任状态采样数据示意图11 北方工业大学硕±学位论文从数据来源上区分一,电路状态数据主要有仿真采集和实测采集两种。前种方式是在己知电路原理图的前提下通过电路仿真软件得到大量正常和注入各类故障后的状态数据,通常用来进行故障分类器的训练。实测数据通常是采集被测电路板的实际运行信号,低效,耗时,主要用来进行实板的测试和验证。第二阶段为故障特征提取。该模块无论是在诊断算法训练阶段还是故障诊断阶段,都执行相同的特征提取与构建过程。由于采集的电路状态数据十分庞大,为保证识别算法的成功与效率,在对输入数据进行格式转换等预处理的基础上,必须进行非常巧妙地特征提取与构建,将故障样本数据中具有代表性的特征用少量的数据表示出来W减少分类算法的输入数据维度。第H阶段是典型特征构建,。通过特征提取阶段的处理电路原始状态数据变成一系列特征提取算法的参数集一。为进步压缩数据规模,需要对结果数据进行取舍或降维等数学建构过程,甚至结合领域专家知识,构建出用于诊断的典型特征。为保证诊断效果,该过程要求在诊断算法训练阶段和故障诊断阶段保持相同。第四阶段是分类/诊断算法的训练。此阶段将提取到的故障特征向量作为故障分类器的输入,在神经网络、支持向量机、模糊推理系统等典型分类器训练算法一控制下反复学习直至收敛,得到针对特定电路故障集的诊断知识。旦训练完成,分类器在诊断阶段保持固定不变。一最后个阶段是识别结果与反馈与评价。在训练阶段,反馈评价模块根据分类器输出的中间识别结果调整分类算法训练参数(在分类算法不收敛时,则需要调整故障特征提取参数或改变提取方法);训练完成后该模块给出最终诊断结果。在故障诊断流程中,提取恰当的故障特征是是模拟电路故障诊断的首要任务一和关键环节,3,它决定着智能诊断算法的最终诊断率本章第节更进步的讲解目前在模拟电路故障诊断领域中,应用最为广泛的基于小波分析的模拟电路故障特征的提取方法。2.3模拟电路故持特征提取方法一故障特征选取关系到故障知识库与故障诊断的效果和效率,因此直是故障诊断中最关键的技术,而且在发生。如前文所述,模拟电路响应多为非平稳信号,故障时,因故障信号通常具有极小的信噪比反映故障变化的信息也很容易淹没一。在海量数据中,很难通过常规手段将它检测出来小波变换是种对信号高频和低频部分同时进行处理的精细频带分解与重构方法。小波变换可对模拟电路信号按任意时频分辨率分解,通过小波变换后,待分析信号就投影到时间和尺度二维21 北方工业大学硕±学位论文。向平台上小波变换可利用时间域和空间域局部性的基函数表示非平稳信号,将信号表示为不同分辨率下有限个分量的和。此外每个分量还可W根据需要进行自适应处理,从而能自动适应时頻信号分析的要求,从而可聚焦到信号的任意细节。。到目前为止,小波分析已是故障诊断领域最频繁使用的特征提取技术^常规的小波分解只可1^1将小波分解为低频和高频成分,然后再将低频部分分。解为低频和高频两部分,其中低频成分对应近似系数,高频成分对应于细节系数一此后可对低频进行指定层次的分解。但其缺陷就是此后对每层的细节系数都一不做分解,这就会丢失原始信号的部分特征信息,即如果特征频段恰好存在于高频成分信号中,则容易造成特征信息丢失。而与之对应的小波包分解(WaveletPacketDecomposition,WPD,它可对输入信号髙低频部分同时进行分解从而对)一层的高输入信号中的隐含特征进行充分的挖掘,对低频成分分解的同时,对每。频成分进行同样的分解,得到细节系数变量模拟电路故障信号经过小波包分解一过后,信号高频部分与低频部分得到的分解成分样多,再使用它们构造出来的特征-3,就不会丢失高频成分的有效特征信息了,具有更强的泛化能力。如图2所示-A,小波分解和小波包分解的示意图。在图23中,S表示要处理的信号,表示低频,D表示高频,末尾的序号数表示分解层数。 ̄slT[ ̄ff?DADiAiii。r丄I1▼▼tTf^AA2DA2AA2DA2A0D022I'f^**iiitAAA3DAA3AAA3DAA3ADA3DDA3AAD3DAD3ADD3DDD3图2-3小波分解和小波包分解的示意图2.4横拟电掛致巧谗巧工程巧维问厘在模拟电路故障诊断中,数据的海量特性体现在用于电路诊断训练的电路状态数据千分庞大一20。个简单的例子,按照仅包含个模拟器件的中小等规模的。电路进行测算,如果电路中包含10个采样点假设每个采样节点采集1000个离M一一散数据点表示节点响应数据(如采样频率5,2毫秒)。则电路每种状态的个数据集包括10000个数据(10节点*1000点)。假定电路有80种故障状态(含13 北方工业大学硕±学位论文一-正常状态34种故障),80000080,平均每个器件则个数据集需包括个数据(种*10000个);为了模仿容差的影响需进行蒙特卡洛仿真采集模拟器件不同参数状态进行训练,,假定模拟器件的容差为10%仿真时每次偏差1%进行仿真,则每个器件需要进行21次仿真,共需要420次仿真。则进行算法训练的数据最后*^包含3.36108个数据。在模拟电路发生故障时,其电路瞬态响应多为非平稳信号且含有丰富的故障信息。目前,基于小波变换信号处理技术进行特征提取是当前研究的热点。小波在时域和频域均具有良好局域性和优越的噪声消除能力,尤其适用于非平稳信号的处理。当前,广泛被采用的小波包分解技术在提取故障信息中存在下两点不。"足:1)小波包对模拟电路故障信号的分解层数过少时,故障信息不能够完全析"取出来。很多文献利用DB3小波包对故障信号进行3层分解,并W故障基本"为由,,提取完全,停止小波包分解导致故障信息并没有完全被提取丢失特征信息,导致诊断算法效率低。2)为了增强泛化能力,当分解层数过大时,模巧电路故障信号特征的维数""会随着分解层数的增加呈指数形式增大,从而导致维数灾难的问题。事实上,构建准确高效的故障特征,减少输入数据维度,更能提高分类算法训练的成功概率,并大幅度缩短训练时间,提升算法分类效果。因此提取恰当的故障特征成为模拟电路智能诊断的关键环节与首要任务。小波变换通常需要对故障电路进行连续采样W获取电路状态的特征信息,但经此过程选取得到的故障特征往往都具有维数高、数量大的特点,若直接作为分类器的输入,会导致诊断算法计算量大、收敛速度慢的问题,。因此在故障诊断时对获得的故障特征组合数据进行适当的维数约简变得尤为重要。评价特征提取技术所提取的特征是不是和一问题紧密相关,需要用诊断算法进行诊断,在下节将简单介绍本课题所使用的克隆选择诊断算法。2.5智能诊断?法简介从上世纪九十年代开始,模式识别技术得到快速发展,为模拟电路故障诊断提供了新的解决方案。基于模式识别技术的智能诊断算法的原理是测前先通过对正常与故障状态下大量采样数据的分析,提取各种状态下隐藏的模式,通过各种智能分类算法的训练形成诸如故障字典等诊断知识。需要进行故障诊断时,通过采集电路状态数据、提取故障模式,输入分类器然后得到故障模式识别结果,从14 北方工业大学硕±学位论文而判断有无故障及是何类故障。因此分类算法和特征构建是模式识别算法的两个核也环节,近年来基于遗传算法、神经网络、支持向量机和人工免疫等模式识别技术的被广泛应用于模拟电路故障诊断领域,并成为迅速研究热点。本课题选择M使用基于人工免疫技术的克隆选择作为智能诊断算法,它是已被证明远比神经t"3网络要高效且收敛速度快的诊断算法。在生物免疫学中:,克隆选择被描述为当淋巴细胞完成识别抗原过程后,抗一体和抗原的亲和度会达到某个值。当亲和度超过定的阀值后,生物体内的B细胞被激活,开始不间断地复制生成B细胞的克隆。然后由克隆产生的细胞会经历变异,并产生大量的对抗原具有特异性的抗体,经过变异后的免疫细胞,分U23、化成了效应细胞和记忆细胞两种。其核也为;抗体侵入有机体,免疫细胞会受到抗原刺激,并产生克隆细胞,克隆细胞増殖后,通过变异分化为抗体细胞和记忆细胞。人工免疫算法所依据的免疫学原理主要是免疫系统的特异识别原理,即抗体US3结合抗原的过程。彭良玉等根据人王免疫算法思想实现了人工免疫系统在模拟电路故障诊断工程上的应用,并提出克隆选择算法用于故障诊断大致通过H个阶段完成:1.选择故障训练样本。2、.利用训练样本对系。统进行训练,得到各故障模式的聚类中屯f"33.利用得到的聚类中也对电路的各种故障样本进行分类。,定位故障元件U"王勤勇等在彭良玉的研究基础上对算法中的判决条件中设定统一的判定。半径进行改进,实验结果提高了故障诊断率2.6本章小结本章主要介绍了模巧电路故障诊断现状,说明发展缓慢的原因;详细分析了模拟电路故障诊断流程主要包括:电路数据采集、故障特征提取、典型故障特征构建、故障分类算法训练、识别结果等五个主要阶段;介绍了模拟电路中常用的小波分析特征提取方法:给出了模拟电路引起维数灾难的原因,特征数量大、维数高;最后对要用来进行验证的克隆选择诊断算法进行简单介绍。15 北方工业大学硕±学位论文第H章两种典型的流形学习数据降维方法fw2000年Seun等在《Science》上发表的文章中站在神经屯、理学的角度上g探讨了人类的感知方式,指出其是流形方式存在,并初步推断出流形是人类感W知基础,这也奠定了流形学习的生物学认知基础。同期《Science》杂志上也发表了另外两篇关于流形学习算法的文章,提出了等度量映射和局部线性嵌入。随后研究中,研巧者又相继提出了很多新的流形学习算法,其中较为常用的有Lalacian特征映射算法(LE)、最大差异展开算法(MVU)、局部切空间排列算pW法(LTSA),黎曼流形学习算法(RML)等。本文重点介绍W全局保持特性的Isomap算法和W局部保持特性的LLE算法,通过比较两种算法的主要特化为课题研究内容中所使用的关键降维技术提供理论依据。3.1等度S映射"w一等度量映射算法,是Tenenbaum在2000年提出的种基于流形学习的非W一线性维数约简算法。直W来,等度量映射算法与同年提出的局部线性嵌入算一同被认为是对流形学习研巧的开山鼻祖法。等度量映射算法的出发点认为低维流形嵌入到高维空间之后,直接在高维空间中计算直线距离具有误导性,因为高维空间中的直线距离在低维嵌入流形上是不可达的-(C。如图31)所示,低维嵌一一一一。想象下,只虫子从点爬到另点入流行上两点间的距离是测地线距离,-如果它不能脱离曲面行走,那么图31(A)中的蓝色曲线就是距离最短的路径,即S曲面上的测地线,测地线距离是两点之间的本真距离,显然直接在高维空间中计算直线距离是不恰当的。ABC吃.;铅為;某.巧.d:护I祭咕怒:1:1.II?;之^每诚图3-1低维嵌入流斤上两点间的距离是测地线距离61 北方工业大学硕±学位论文一那么如何计算测地线的距离呢?等度量映射算法采用的观点是,仅对每对样本点之间的测地距离能映射出流形的真实结构。我们还可利用流形在局部上与歐式空间同胚这个性质,对每个点基于欧式距离找出其近邻点,然后就能建立一个紧邻连接图,图中近邻点之间存在连接,而非近邻点之间不存在连接,于是计算两点之间测底线距离的问题,就转为计算紧邻连接图上两点之间的最短路径问题3-1),从图(C中可W看出,基于近邻距离逼近能获取低维流形上测地距离很好的近似。虹smap算法描述如下:|=输入:样本集2)XX…3:;近邻参数1£;^^。{i,2,,巧}低维空间维数…=过程:1:foril2,mdo,,,2:确定Xi的K近邻;3:X与Kjfi邻点之间的距离设置为欧式距离,与其他点的距离设置为无i穷大;4:endfor5:调用最短路径算法计算任意两点之间的距离distOcf,xp:6:diStMDS将(為,句)作为算法输入;7returnMDS:算法输出=....输出:样本集D在低维空间的投影ZZZZ{i,2,,m}:xn的算法时间复杂度分析首先,计算n最短路径距离矩阵,采用迪杰斯特2拉算法时间复杂度为0fcnk)从为近邻数大小)。然后计算应用MDS计算特(gn)31"征分解时]。,由于距离矩阵式稠密的,所1^1特征分解的计算复杂度为0如)等度量映射算法使用时,对于新样本映射到低维空间中,通常采用将要降维的训练样本中的高维空间作为输入一,低维空间中的坐标作为输出,训练个回归W学习器来对新样本的低维空间坐标进行预测。3.2局部线性嵌入局部线性嵌入数据降维技术是在20一00年由Saul和Roweis提出的种基于UW流形学习的非线性维数约简方法。算法思想是将全局非线性转化成局部线性,一个线性或近似线性的局部邻域假定每个数据点与其近邻点位于流形的,在该邻域中数据点可W有其近邻点表示,重建低维流形时,相应的内在低维空间中的数据点保持想同的局部近邻关系一,这样就可W把髙维输入数据映射到全局唯的低w’"’"3维坐标系统中,实现降维。这种想法拓展了人们对于维数降低的认知。也正因此基本思想,让局部线性嵌入算法在进行维数约简后保持原始数据原有的拓17 北方工业大学硕±学位论文扑结构不变。一姐具有嵌入特性的数据集对于,其内在的低维空间和嵌入空间的局部邻域间的关系应该不变。它试图保持邻域内样本间的线性关系。假设样本点X的坐标i能通过它的邻域样本X、Xfc、的坐标通过线性组合表示出来。有:y-XWX+W+W机3-1广yy的k()WM/W,其中,化,为权重系数样本经过LLE维数降低后能得到,在iuy低维空间中的投影对应'XXX'X也能通Xi与;9、fc、分别对应的投影/、fc、/过线性姐合重构出来,即'X^WX+WkXk+WX-2iij/ijiii口)这样,我们希望映射前后Wi,Wifc,Wy得保持。jLLE算法的基本步骤综上可知,线性组合关系只能在邻域附近发挥作用,离样本点距离较远的样本对局部线性组合关系没有影响,这样就可W降低维数约简W的复杂度-。LLE算法的基本步骤如图32所示,。?选取巧本乂邻域点。,?—V0。〇?.、。义4.\?。。?1。0?\?〇0〇■?〇。。。''③.产。jW正"‘C家计算邻?化巧本对。X一.。。>乂/的垂构权倘/。:、全:U?,〇0?/0.■〇,,'—'.保持里构系数将巧本y\W°〇〇映則巧低维蚁入空间@图3-2LLE算法的基本步骤LLE算法可W归结为H步;1)寻找每个样本点的k个近邻点;2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵。3)有该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输出值。18 北方工业大学硕±学位论文LLE先为每个样本X找到其近邻下标集合&?f,然后计算出基于&中的样本点对进行线性重构的系数Wi:Z碟x广i|的lIl;;;:豈^z3-3()S.t.ZEQW=1jiij了=X—X—XWX,均为己知X有闭式解,其中,令Cfcfc),f句i(fj(j)ySCfceQk;jw=y口振岩?LLE在低维空间中保持W不变,于是X对应的低维空间坐标Z可通过下式求fff解:z。-5rj广s)式告片,哨一3-33-5)-式)与(的优化目标同形,唯的区别是(33)中需要的是W,而(f式(3-5)中需要的是对应的低维空间坐标Z。f'dxm令Z=Ze化w=W〇i,2,,()yy,r--M=(/M〇M-(7〇口句3-则式(5)可UjI重写成,nuntrZMZ(Y3-7()r=s义ZZ/'3-7式()可W通过特征值分解求解;M最小的d个特征值对应的特征向量T组成的矩阵即为Z。LLE算法的描述,如下所示:'输入:样本集2)=XX...乂;近邻参杞^^。{l,2,,^1}数低维空间维数=…过程:1;forfl2771do,,,,2;确定X的K近邻;i33-3:从式()求得巨/&;=4:对于g&1^0y,令";5:endfor19 北方工业大学硕±学位论文6-M:35)中求得从式(;7:对M进行特征值分解;8;returnM的最小个特征值对应的特征向量D在=输出;样本集低维空间的投影Z2时间复杂度分析:选择邻域的计算复杂度为〇(0n计算重构矩阵的计算复杂度),22w为0((D+fc)fcn):求解低维嵌入Y的计算复杂度为0(dn)。3.3II法比较比较两种典型的流形学习方法可知,Wlosmap为代表的全局特性保持方法一它是在多维尺度分析基础上提出的种非线性维数约简方法。其核也思想是保持点对在流形上的测地线距离不变,利用其高维观测样本所在流形上的测地距离可W直接由低维嵌入结果来表示,使用多维尺度分析将数据嵌入到低维空间。WLLE为代表的局部恃性保持方法主要通过保持高维观测数据与内在低维空间的局部几何共性来发现嵌入在高维空间的低维流形,选择不同的局部模型和不同的整合排列技术会得到不同的局部特性保持方法,而且相对于Isonm,LLE算法p具有时间复杂度小一、参数少(LLE只需在第步给定K值)等特点,为本文选择使用LLE作为模拟电路故障特征数据降维和特征提取方法提供理论依据。3.4本章小结本章首先探讨了Isomap和LLE两种典型的流形学习方法,介绍了两种流形学习降维算法的基本思想和算法描述,然后对两种算法进行比较,通过比较时间复杂度和参数数目,得出LLE算法运算量小、参数少等优点,为后面验证实验主要使用时LLE算法进行数据降维提供理论依据。此外,本课题重点讨论使用小波包分解结合基于流形学习方法的LLE数据降维技术,来解决模巧电路故障诊断工程中特征维数约简问题一,在下章节主要研究的是模拟电路故障诊断中通用的故障特征提取技术实现方案及使用LLE算法进行优化的方案。20 北方工业大学硕±学位论文第四章模拟电路故障诊断特征提取应用小波分析良好的局部特性,分析和处理模拟电路故障响应非平稳信号,一能够得到很好的特征提取效果,现己成为模拟电路故障特征提取的重要方法之。,细节方面例如但对于通用的小波特征提取技术相关研究中,如何选择最优小波基一些、如何确定最优分解层数和如何选取最优小波系数构造特征等,仍然缺乏理论性的指导,大多依靠专家经验来做实验进行研究。此外,在使用小波分析提,随着小波包分解层数的增加,取故障特征时,特征维数会W指数级别增长对高维特征进斤诊断时,可能会导致计算量大、算法收敛慢和诊断率低的结果。为了一进步得到最优故障特征,本课题对小波分析得到的故障系数特征,结合LLE一算法进行降维处理,进步优化故障特征向量期得到更高的识别率。4.1通用的特征提取技术模拟电路故障诊断,依靠提取出的特征来进行故障识别与定位,因此,故障特征选取的好坏,关系到故障知识库的构建,同时也关系到故障识别效果。因此,一直是模拟电路故障诊断需要突破的难点与关键技术特征提取技术的研巧。模拟电路响应多为非平稳信号,而且在发生故障时,因故障信号通常具有极小的信噪比,反映故障变化的信息也很容易淹没在海量数据中,很难通过常规手段将它检一测出来。小波分析特征提取技术,是种时频分析技术,可W利用时域和频域局,正好迎合了模拟电路响应的非平稳特性部性的基函数表示非平稳的信号。它可将电路响应信号逼近为不同分辨率下,为数不多的几个分量的和。此外,因为每个分量都有自己的需求,小波分析还可1^根据分类的不同需求进行自适应响应。处理,可满足聚焦到信号的任意细节的需求小波分析特征提取技术,依靠小波基函数,在尺度上的进行伸缩,在时域上,来详细的分解故障信息平移操作。依靠这种时频分析方法,适当的选择小波基一函数,就可W使扩张函数具备良好的局部分析特性。Fourier也是种信号分析常用的手段,而且,,但是它只能在频域上是只能对稳定信号进行分析对于模拟电路中的非平稳信号,使用傅立叶分析难取得想要的分析结果。小波分析就是在傅立叶变换的基础上发展起来的,对于模拟电路中的非平稳信号,利用小波分析处理信号,能够很好的规避傅立叶变换不能展开局部分析的不足。应用小波分21 北方工业大学硕±学位论文析良好的局部特性,分析和处理模巧电路故障响应非平稳信号,能够得到很好的一特征提取效果。,现已成为模拟电路故障特征提取的重要方法之一小波分析提取特征值的基本原理:是在某分解尺度上,对信号在不同频带内进行分解;然后对不同频带内的分解系数分别进行重构,提取重构时间序列中的特征值,不同频带内的分解系数重构后会形成不同的时间序列,对这些新组合W好的序列采用时域分析方法,提取不同频带的信号特征。小波变换的实质是函数逼近理论一,基于多分辨率基础将复杂信号分解成些简单的信号一。通常采用合适的母小波基,波经适当的过伸缩和平移变换,得到簇函数群,然后用送族函数来逼近待分析的模拟电路信号或函数,则称送族函数M为小波函数系。2:(t是平方可积函数6L小波变换的定义为设K),即<Kt,如果其傅立叶)(巧变换(Fourier)变换满足下条件:C=垃山<00(4J*())4瓷则称W的为一¥个小波母函数,将的进行伸缩和平移,就得到离散小波W:ab的,4-2()ab£Ra*0。式V其中,,称为小波基函数,a为化的伸缩因,,中ab的b的,,'P的平移因子'F子,b为ab的。参数a和b决定了ab的的形状。当连续变,.化时,称平为连续小波,当b分别离散变化为坤和时,称为离散小波。。1)|4.2系数能11值巧取利用小波包分解技术可在模拟电路故障诊断中把电路输出节点响应信号逐一--层分解,分别得到系列低频带L(Lowpass)与髙频带H(Highpass)部分,这个过程持续进行可将电路输出节点响应信号分解到需要的层次。小波包分解过程中,信号高低频成分的精细程度随分解层数的増加而増加。信号经过N层分解W后,得到信号在所属频段的特征信息。原始电路故障信号的能量被分解到2个频带上,各频带上的能量相加总和等于原始信号的能量。定义Ew为电路故障信号在各频带投影序列的能量:22 北方工业大学硕±学位论文.。==应及df?WW(。命=1224-3M,,,JI3。)()=11W式中,S表示小波包分解第N层,从低频到高频,2个频带成分的系数构w成的特征信号;"d表示分解信号序列S第/个离散点系数;/wM表示分解信号序列S的离散点的个数。w模拟电路故障诊断中,信号各频段的能量包含了丰富的信息。不同的故障引一例外都会反映到频带信号能量值的变化中发的电流电压变化无。因此,本课题""能量…的表示方法实现电路特征提取采用特征,即对小波分解后得到各频带"的小波系数却4-3该频带的能量值E的频带对,按照公式()计算w,送整分解后一可W作为输入信号的特征向量应的能量值组合为,即故障特征向量个向量,就=-为r…WPD各频。1给出了利用,,,其中图4的&,斬]斬为带对应的能量WPD对故障信号进行5层小玻包分解最后得到32个频带的示意图。■y\^TlLLLHLHLLHHHLLHLHHHLHHHIITlLi7lLLH?HHHLHHHH|[I/^>ILLLLLLLLLHHHHHLHHHHH图4-5层小波包分解最后得到32个频带的示意图123 北方工业大学硕±学位论文4.3小玻特征巧取技术实现方案模拽电路故障信号经过适当的小波包分解后,包含大量原始数据的节点波形信息就被转换为仅包含凡个小波分解系数的组合或者构成的能量特征向量,大大减小了数据维度,实现了输入数据的初步压缩和特征提取。然而在进行不同的诊断时,还存在W下问题:1)对模拟电路故障采样数据进行小波分析时,如何选择合适的小波基画数。2)小波分解层数的选择对有效故障信息提取影响重大。分解层次过少,可>,难1体现不同故障的本质区别能导致用于故障诊断的有效信息挖掘不够1^,造成很多故障不能正确判定,,加;分解层次过多则会大大増加输入向量的维数大分类算法的训练难度,降低诊断效率。3)在达到特定分解层次后,如何在众多的结果系数中进行选择或组合1^^1构建合适的故障特征也会对故障特征的提取造成重要的影响。针对上述H方面问题,我们常用的四运放高通滤波器电路为研究对象,电4-2所示10%路示例图如图,试验中,假定电路中所有电容的容差为,所有电阻容差为5%。电路的输入激励信号为理想脉冲信号,其幅度为5V,脉宽为10US的脉冲电压。故障设置方式按照参数在容差范围的变化来设置,若参数在正常容差内变化,视为正常电路状态,参数在正常容差外变化,视为故障电路状态。试一一设置验中需人工每次只对电阻或者电容其个故障,并保证其他的电阻和电容元器件分别保持在±10%、±5%之间变化。设置12种故障模式加上正常模式包括C1t、C1I、R3t、R3i、C2t、C2I、R4t、R4古、R2t、R2i、艮1t、RU、Normal,其中t和i分别代表故障值大于和小于标称值。设置好后便可使用OrCADpSpice10.5仿真软件进行仿真,采集电路输出点电压波形信息,一种故障模式的训练数据和测试数据-2中打印得到每。输出数据采样点选为图4。机所在位置,采样数据为输出电压为了比较不同诊断方案的性能,我们采用了训练后的故障分类器进行故障诊断。评价性能指标为故障诊断率,计算方法为所有测试数据中被正确识别的故障个数与测试数据总数之比。选用诊断分类算法采用了人工免疫技术中最突出的技"t3术的克隆选择算法。24■ 北方工业大学硕±学位论文R26■款R12—^Ie款C1C2II巧III1——W^Cbfeak,-IS味R如*>D4!■Rj灿■化!saa。1画^L^—放户巧6W… ̄—S^—J—?_—&>、^^,.说I嗦左^p巧节著?閱"与i浮:貪—'田?-n心■了Rb ̄k,化巡■說MBKBmar--—c,》?0w一",T^ ̄^5—<**,化绰>.V2^?I阳?g&:jkV32^c?0VDDif^^j12Vcto气>图4-2四运放高通滤波器实验中-2中打印机所在位置的输出电压,采用单点数据采样,采样点为图4,为简化数据一,数据的采样频率为50000Hz(每2^13采个数据,1ms能采样501个点),采样时间为1ms。对12种故障模式及正常模式各进行50次蒙特卡洛分析(采用高斯分布),其中抽取30组数据用于分类器训练,剩余的20组用于诊断测试。按照这种设置,仿真共采集650组状态数据。其中的390次用于进行克隆选择算法训练,剩余260次用进行算法测试。4.3.1小波基函数选择实验一为研究不同小波基的选择对模拟电路故障特征提取的影响,我们进行了第组对比实验。我们选择模拟电路故障诊断中应用频率较高的Haar、Symlets(sys2)、Morlet、MexicanHat(Mexh)和M巧er共5种小波基进行比对,其中Haar、Sys2t为离散小波分解,Morle、Mexh、Meer进行连续小波分解y。为了使提取的故障一,0,离散小波分解使用了特征向量维度与分量数量致根据文献[15层分解,]取每层系数的低频部分,连续小波分解的尺度系数为[12345。分解后的小波]系数经过能量化和归一化处理后组成故障特征向量。故障特征的维度为1维,特征分量个数均为5个。上述5组特征分别输入克隆选择分类算法训练并稳定后进25 北方工业大学硕±学位论文-行诊断测试,测试结果如表41所示。4-表15种小波基提取故障持征的诊断结果对比表被味类劝HaarSvs2MnrietMexhMever化rm65%65%70%85%65%Cl言70%扣%15%10%20%ClI15%0巧%巧%15%R4t巧%20%40%巧%60%R415%20%70%20%巧%C2t巧%巧%40%60%巧%C2i95%95%化%化%30%R3t100%100%70%扣%巧%R3I巧%巧%扣%75%60%R2t100%100%90%的%70%R2I70%70%巧%60%65%R1t10%5%25%30%10%RU5%巧%40%化%巧%总化?巧本巧85%52.69%562%47.69%巧.31%...平巧汝断单巧散!巧27%连续:47.06%-从表41可知,对四运放电路采用我们使用的特征表示方案条件下,选择离散小波基(总体诊断率53.2%)提取故障特征总体效果优于连续小波基(总体诊断率47.06%),能够得到相对较高的诊断率据此选择Haar.小波基进行采用不同系数组合构建故障特征的第二组对比实验。4.3.2小波分解层次对比实验一组对比实验中在第,电路故障特征根据文献10经验选择了五层分解,Harr[]小波取每层系数的低频部分,Morlet小波分解的尺度系数为12345],通过能[一化构建了故障特征量化和归。然而,进行电路诊断时如何确定最终需要进行分一一。解的层次也是个需要研究的重要问题为此,根据第组实验结果,我们选择Haar小波基进行不同层数的分解,得到不同的故障特征;分别对提取的故障特征进行克隆选择分类算法训练后,比较其诊断结果,W找出小波基的尺度系数在模拟电路故障特征提取中的规律。26 北方工业大学硕±学位论文首先进行的是Harr小波分解层次实验。因每个观测点仅采集了1025个采样数据,Haar离散小波分解最多能分解10层。我们分别取取Haar小波的1层、3层一、5层、7层、9层分解的所有低频系数经过能量化、归化的过程,分别组-成5种情况的故障特征数据进行实验。表42给出了实验结果。表4-2Haar小波变换不同系数下诊断正确率对比情况故味类巧1层3层5层7层9层Norm15%30%70%70%70%Clt95%75%90%90%90%ClI100%80%85%85%85%R41015%20%30%30%R4130%45%50%50%50%C2t25%45%45%55%5跳C2;4跳55%70%70%70%R3f95%85%95%100%100%R3100%85%100%100%100%\R2t100%100%100%100%100%R2i80%85%95%95%9跳R1t35%75%95%95%95%R1I10%15%30%45%45%平均S6.2%60.8%72.7%7S.8%75.8%rr实验结果表明,采用Ha小波进行特征提取时,随着分解层次増加,故障诊断率也相应提升,并在分解到第7层时达到最佳效果。4.3.2小波系数构建故障特征对比实验小波基函数和分解层次确定后,如何选择分解后的系数组合或构建成合适的故障特征同样也是影响故障诊断效果的重要因素。为确定小波系数选择对故障特一紀和第二组的实验结果征的影响,我们对每个采样点的电压数据用,根据第H7层一aar小波做分解、化。每个采样,并对分解后小波系数做提取能量值归一点的数据分别分H种情况作为特征向量:A组只取第7层低频系数能量化归化一化的值的值(1个特征值);B组取所有7层低频系数的能量化归(7个特征一化的值值);C姐取全部7层低频系数与高频系数的能量归(14个特征值)。27 北方工业大学硕±学位论文此外,通过观察原始数据,发现每种故障模式下都有不同的非稳定期,但大致经过口个周期后波形都趋于稳定,因此尝试将每种故障下不稳定周期内的数据去掉(舍掉前200个采样数据)后用剩余的平稳部分进行7层Haar小波分解,取。全部的低频与髙频系数构成特征向量,作为D组在其它设畳相同的情况下,故障诊断率结果如表4-3所示。表4-3Haar小波7层变换不同元素下诊断正确率对比故巧类型A組B組C組D組Normal010%70%60%Clt3凯55%90%95%ClI06跳85%85%R415%15%30%15%M\045%日0%40%C2t65%055%60%C215%25%70%65%R3195%95%100%95%R3i100%100%100%100%R2195%100%100%100%R24100%8跳95%9跳R1t015%95%70%R1i010%45%0平均38.5%54.6%75.8%67.7%二4一根据实验结果,对比第列(取全部毛层的低频系数)的5.6%和第列(仅一取第韦层低频系数)的38.5%,说明每个分层层次都包含重要的诊断信息。对比第H列(取全部七层的低频和高频系数)的75.8%和第二列(取全部走层的低频系数)的54.6%,说明本文实验的四运放滤波电路而言,Haar小波变换后髙频系数部分对诊断结果有非常重要的影响。对比第四列(滤掉前期数据处理后)的67.7%和第H列(取全部屯层的低频和高频系数)的75.8%,说明故障前期不平稳的特性也是各故障模式的重要特性,丢弃这些特性也会影响诊断结果。通过W上实验,深入探索了模拟电路故障诊断中,使用基于小波的通用特征、H个方选取方法,研究了包括母小波基选择分解层数选择和最优小波特征选择haa面,得出了对模拟电路故障特征提取具有简单指导性的结论,即使用离散r28 北方工业大学硕±学位论文小波基分解5层或者7层取所有的高低频系数构造特征能够得到更高的故障诊断率。4.4本章小结本章主要讨论了模拟电路故障诊断中通用的小波特征提取技术,得出了对模拟电路故障特征提取具有简单指导性的结论,然而为了得到更好的泛化能力,通常会选择使用小波进行多层分解,这也导致特征维数随分解层数的增长呈指数级増长,出现维数灾难的问题。为了解决维数灾难问题,需要对故障特征进行合适一的降维,优化故障特征,在下章节将进行降维效果验证实验。29 北方工业大学硕±学位论文第五章流形学习数据降维及模拟电路诊断工程应用5.1实验方案当模拟电路发生故障时,必然表现出与之对应的故障征兆症状,如电压、()电流信号发生变化。这些征兆蕴含着大量电路的运行信息和故障信息。因此通过采集反映电路真实运行状态的电压、电流等原始信号,经过恰当的数据分析和模式提取,可W训练出蕴含全部已知故障信息的高精确的故障分类器进行己知故障类型的诊断。模拟电路故障诊断的实质是进行故障分类,找到发生故障的元器件一在电路中的位置,因此其实际上就是个典型的模式识别问题。本课题依据模拟电路的信号特征呈非线性结构的特点,和使用泛华能力强的小波包分解特征提取技术提取的特征维数随分解层数的增长呈指数级増长为出发点,并利用基于流形学习的LLE降维算法在非线性降维上的优势一,提出种将小波包分解、局部线性嵌入相结合的模拟电路故障诊断特征提取及降维优化技术。为了分析诊断方案的性能,我们采用了训练后的故障分类器进行故障诊断。评价性能指标为故障诊断率,计算方法为所有测试数据中被正确识别的故障个数与测试数据总数之比。一智能诊断算法采用了人工免疫技术中最突出的克隆选择算法,这是种被证明具有远超过神经网络方案的快速收敛能力的分类算法。最终,我们设计的方案总共包括三部分,即小波包分解、局部线性嵌入和克隆选择算法,命名为:-WPD+化E+CSA模拟电路故障诊断方案,其故障诊断总体框架如图41所示。该方案模型包括3个模块:仿真模块、特征提取与降维模块、诊断模块。仿真模块主要利用Pspice完成待测电路的正常模式及故障模式仿真,得到采样数据;特征提取与降维模块主要完成Haar小波包对采样数据进行5和7层分解,得到一一系列小波系数,然后用LLE算法对小波包分解后的数据进步挖掘,得到高维数据中的低维结构,实现特征提取与维数约简诊断模块主要完成用CSA算;法进行則练及识别故障。基于WPD+LLE+CSA的模拟电路故障诊断方案具体步骤如下;1)对待测电路在Pspice软件中设置故障,仿真并提取故障的输出响应;2)利用Haar小波包对输出响应信号进行5与7层分解,得到各状态下故障特征样本;3)将各故障特征样本输入LLE算法中进行不同维数降维;4将不同维度的新故障特征样本输入CSA诊断算法进行训练,并诊断故障。)30 北方工业大学硕±学位论文mmmAAft__电路nnii^ij^VVVli碟Ii———'激励L-'———-----JI^(n)去PDiw特征!提取与LLE降维ig麵毒1^1故障分类jI5-图1WPD+LLE+CSA的模拟电路故障诊断方案5.2实验电路图为了验证基于流形学习的局部线性嵌入数据降维技术在实际工程中的特征"模拟"数据降维力度和特征优化效果,本章将采用电路故障诊断项目来进行仿W真实验。对经典的两级四运放低通滤波器电路进行模拟电路故障诊断实验分-析,电路结构如图52所示。31 北方工业大学硕±学位论文巧试—'—'片tw。。^ssn;.'*JH品。冊。/yyy|■IfbMI<(kWkI*一^化一卢诚tfC3巧巧*?巧*,??I化-^,。|。?居正邸。^巧巧.琴甲、I— ̄/.A..t-—*-r-jNsiiSsi巧^a^M,?aVnj^j^'试'"——^=痴26.ft4吃[^^i,,i:kp^f巧-化请設 ̄rv^^L心r沿一、巧i?"化化_-—I__VW^,跳?^丘■" ̄^‘N^,伍麥[咬晏巧。《6巧1^g。A— ̄^n^|||IL!f^告.L*。王 ̄?...〇图5-2两级四运放低通滤波器电路原理图5.3故廣注入与巧据采集在实验电路中,电5%。,设置电容元器件的容差是±10%阻元器件的容差为±电路输入在V4节点,电路的输入激励信号为理想脉冲信号,其幅度为5V,脉宽为10US的脉冲电压,信号周期为20US,上升时间TR为0US,下降时间TF为0US。试验中按照参数在容差范围的变化来设置故障,若参数在正常容差内变化,视为正常电路状态,参数在正常容差外变化,视为故障电路状态。实验中一设置一需人工每次只对电阻或者电容其个故障,并保证其他的电阻和电容元器+一件分别保持在±10%、5%之间变化。设置好后便可进行仿真,得到每种故障模式的训练数据和测试数据。最后,15种故障模式加上正常模式中电阻和电-正常模式包括Norma容的参数值如表51所示。15种故障模式和l、C1t、C2t、C3t、C4t、R3t、R4I、民6t、民7i、R8t、民9t、民16t、R17I、艮19t、R21I、R22t,其中t和i分别代表故障值大于和小于标称值。32 北方工业大学硕±学位论文表-电路中故障模式51故障标称故库故巧标称故障类型值值类型值值NormalR?ilOkQ5.5kDCiT0.01冲0.051冲〇.44故2.2kQC1iF0.02^FR2420.64kQ.3m.09tT||CsT0.01冲0.048曲Riet1.8賊7.8kQC40.01冲0.031冲民174.84kn1.6kDT丄Rat2.2kD5kn艮wtlOkH30knHR41.57kn0.6kOR2ijlOkH3.75kRetlOkO16.5kQIRast2.32kD7kQ-按照表51,al(正常)状态5种故障状态分别进行仿对电路Norm和1真,-采样的点为图52中打印机位置的输出电压。模拟电路的瞬态信号包含了丰富的。信息,因此对电路施加指定的激励信号进行瞬态仿真在OrCAD10.5软件下设一OOs,每隔213采样次置仿真时间为lO^^。然后分别对电路每种故障模式及正常*组数据模式进行50次蒙特卡罗分析。仿真完成后,总共可W采样800(1650)。在盾期进行诊断时,从每种模式的50次数据中抽取30次数据用于克隆选择算法训练,其它20次数据用于诊断测试。其中部分电阻和电容的电路响应仿真结果--波形如图53和图54所示。得到某故障50次蒙特卡罗分析后输出节点的电压-随仿真时间的变化如图55所示。?I化誦CS呼I{图5-3故障C2形图图5-49t仿真波故障民1t仿真波形图33 北方工业大学硕±学位论文S躬巧資****TRANSIENTANALYSISTEMPERATURE=27.0^D巧C8谷邮B9BSMONTECARLOPASS13巧S6?幸拿?????????>?????????幸???????拿??????????*???????*?????????????????*?:??>■3907ga今3sSS39SS3S899:1曰TIMElV()8952巧+-?36.妨0Eee1.的5E03巧?4-贿--2.000E2.572E扫24---S995.000E06366E扫.72---89?66.撕0E067.382E02---S937S.㈱E扣1.467E01ee-6--81巧%l.eE52.328E--4巧E-08¥巧1.2说5扣3.19^m1---.4㈱E054.502E019的11---.6如E巧5.818E01---58021.800E0560.961E15的5200--7-.0E的.8巧E01-e--9的42.200E58.443E01seas2---.4朗E化8.说7E015-5故2r图障Ct第13次MonteCalo分析图5.4数据预处理当完成故障注入、数据采集后,要对采集到的数据进行预处理工作。数据预处理包括使用小波包分解提取故障特征和使用LLE进行特征数据降维优化处理两部分。首先,在MATLAB软件中,实现小波包分解函数,对采样数据分别进行Haar小波包5和7层分解。分解完成后,分别提取第五层和第走层的所有的高低频部分小波系数能量作为故障特征,得到16种故障模式(包括正常状态)的32维(分解5层)和128维(分解7层)特征向量。然后分别将这些特征向量随后被送入LLE模型和Isoma模型进行降维。利用LLE算法在处理高维非线p性数据时,假设小波系数特征数据在高维空间中形分布,通过局部线性、全一-局非线性的思想,可W为样本数据中的每个数据点采用K近邻法寻找其邻域=点,本文采用K12时。考虑到小波包分解层数n和特征维数V是W指数形式增长的事实,本文根据关系式;x=(5-1)^(5-X式1)中指的是降维后的维数,分别将维数降到[16、8、4、2](32维原始数据)、[64、32、16、8、4、2(128维原始数据)。其中,使用IXE算法将原]32-始数据由维降到2维的结果如图56所示,使巧Isomap算法将原始数据由325-7所示维降到2维的结果如图。34 北方工业大学硕±学位论文(L2「0*0-15〇0?0"DO6-?.10—0.〇??g??0?????????。。0eoO60?。?。?:????化-。。-?。节V。*。*?。?。?0。。4。。,。《?;。?。。;。。"。::。-产一.巧好拇旅I0,。。。。。,?S*。。。0。*。。?。:?0。。。。。。?。?。2。oV。。口。%%?。6000。。。?C0f???。。-*06e々.05?00ft〇〇?〇?〇〇0?〇*?0口>0〇0?0-.100i1111。巧-0S4■10拍00把011图5-6使用LLE算法将32维数据降维到2维的显示4厂????????????.??*t?.??-??3?.0???2-/*??0%?????-。■,牺/\IIIIIII!II3.5--.-21.S10.500.S115¥32图5-7使用Isoma算法将32维数据降维到2维的显示p35 北方工业大学硕±学位论文5.5实验结果与分析5.5.1LLE和Isomap数据降维效果对比实验分别将上述通过使用LLE算法和Isomap算法降维后的维数不同特征数据与原始特征数据分别构成故障特征J。,输入克隆选择算法进行诊断yl对比降维效果表5-2为分解5层后LLE模型下的故障识别结果-构造的恃征在,表53为分解5层后构造的特征在Isomap模型下的故障识别结果。其中在Isomap中除去了原始32维的对比5-8aar小波包分解7层再使用LLE降维到32数据。图为使用h维,克隆选择算法诊断后,所有测试数据中被正确识别的故障个数统计(实验中测试20组数据)。5-9为LLE算法和Isomap算法的平均诊断率比较-图。表54为分解7层得到128维特征数据在WPD-LLE-CSA故障诊断方案下的降维效果。在使用克隆选择诊断算法进行故障识别时,故障诊断率的计算方法为所有测试数据中被正确识别的故障个数与测试数据怠数之比,艮P:=-R-^(52)Total-2)中式(5,艮表示是识别率,N表示被识别的个数,r〇化读示测试总数。一5-2)来计算毎种故障的诊断率按照公式(。WFll+R16+H[l巧为例,具体计--算时,首先将16种故障按[015标号,从图58可知,故障标号为2,测试20]组数据-,故障正确识别的个数20,按照公式(52)可得此标号为16的电阻阻值超过正常容差范围成为故障的故障诊断率为一100%。平均诊断率为每种故障的诊断率的和与故障总数之比。36 北方工业大学硕±学位论文F1+C1+知lOp0000000000000000000正确率^:1.000000*|||||j||||||||II|||F10+R3+H|10p4l8l8ll5ll8lllllll81:0.700tXKV|||正确率||||||||||j||||||。1+?15+服0护22222222222222222222正^’:1.000000||||||||||||||||||I确率|F12+R17+iJ10p|3|3|3|3|3|3|3|3|3|3|3|3|3|3|9|3|3|3|3|3正确率:0.350CXXVF13+R19+服啡|4|4444S144444814484|44正确率:0.75000CV|||||||||||||||||F14+R2蝴聊55555535555355555559:0.8500正确率0V||1||||||||||||I||||HL5+R22+弧句由66666666666666666666*^:1.000000||||||||!正确率|||||||||||巧+C2+站lOp67777777777777777777正确:0.95000V||||||||||||||||||||率段+C3+弧Op|4|8884814|88|4|8|8|1|4|8|8|8|8|8正确率:0.65000CV|||||||F4+C4+她0护|5999393599939993弓999正;0*".800000|(||||!|||IIIIIII1确率(|F5+貼+弧旬1010101010101010101010101010101010101010IIIIIIIIIII1II1IIIII?J正确率:1.000000F6+R4+IJ10P1111111111111111111111I11111111111111I1111II1IIIII!IIII1I11IJ*正确率:1.000000*JF7+R6+站10】12口口1212121212口12121212121212口121212II!IIIIIIIIiII1IIIII|00000>?正确率:1.0F8+R7+I10PJ131313131313131313131313口13131313131313IIIII1IIIIII1IIIIIII正确率:1.000000^F3+R8+抽10P1414141414141414141414141414141414141414IIIIIII1IIIIIIIIIIII^J正确率:l.OOOOOOWor取弓恥狐巧巧巧巧巧巧巧巧巧巧巧巧巧巧巧巧巧巧巧巧IIjIIIIIIIIIIIIIIII1'-*正确率:1.000000^算法结巧!JPressanytocontinue?图5-8所有测试数据中被正确识别的故障个数统计8维降维到32维)(由口37 北方工业大学硕±学位论文表5-2WPD+LLE+CSA模型不同维度下的故障识别结果5(分解层)故巧故障32维16维8维诊4维诊2维诊编号类型诊断率诊断率断率断率断率0C1100%100%100%100%100%个1R3个的%100%100%100%100%2R44.50%100%100%100%03R6个10%100%100%100%100%4R74,10%100%100始100%05R8100%100%100%100%0个6R160%100%60%化%个100%107C2个50%100%巧%10%08R巧个巧%巧%75%巧%09R22巧%100%100%巧%巧%个10C470%扣%80%05%个11C3100%的%的%50%0个12R920%70%70%20%0个13R174,90%100%95%巧%5%14R2180%85%化%40%5%本15Normal45%100%100%100%0平的:58.1%93.1%91.3%67.2%25.9%.降维比例050%75%88%94%从表5-2可LECSA看出,本文提出的小波包分解、L算法及算法相结合的WPD+LLE+CSA故障诊断方案,在典型的两级四运放低通滤波器电路上进行故障特征数据降维的实验研巧结果表明,在研巧模拟电路故障诊断特征提取的非线法降维问题上,使用LLE算法对原始故障数据的降维比例达到75%后,诊断率仍保持在90%的较商水平。但随着故障特征数目的逐渐减少,故障诊断率也有。所下降,当降维到2维时,故障诊断率仅为25.9%38 北方工业大学硕±学位论文5-表3WPD+Isomap+CSA模型不同维度下的故障识别结果(分解5层)故障故巧16维8维诊4维诊2维诊编号类型诊断率断率断率断率0Clt100%100%100%100%1R3100100100100个%%%%2R4100%100%100%04.〇3R6!00100100100个/〇%%%4R7100%100%100%0山5R8100100100个%%%0〇6R16!0010010035个/〇%%%7C2555个%%%0〇8R19255550个/〇40%%9R22t40%20%10%10%10C445%化%4030%个11C309610%5%5个〇12R930/〇25%25%30个13R174.90%90%90%70%14R2U50%50%50%巧%15Normal100%100%100%0平均:7%67.8%67.5%35.3%6.8圓1邮111 ̄]I,——tLLE■I ̄—SIsoma巧-、p4。\N,30-\-2与216842维巧-LLE和图59Isomap各维度下的平均诊断率比较39 北方工业大学硕±学位论文从表5-3和图5-9可WPD+LLE+CSA故障W看出,与诊断方案相比,WPD+Isomap+CSA故障诊断方案降维效果相差甚远,充分表明本文提出了小波包分解、LLE算法优化优化特征方案的优越性。实验结果证实了LLE算法在模拟电路故障诊断的适用性,从而为LLE算法在复杂数据降维的工程应用方面提供了有用的参考。5.5.2WPD不同分解层数下数据降维效果对比从第四章中,W典型的四运放低通滤波器电路为研究对象,使用小波分解分解7层有较高的故障诊断率,本实验W两级四运放低通滤波器电路为例,对比了使用小波分解5层和7层两种情况下所提取的特征在经过局部线性嵌入降维后的效果。表5-4WPD+LLE+CSA模型不同维度下的故障识别结果7(分解层)故巧故巧128维64维32维16维8维诊4维诊2维诊编号类型诊断率诊断率诊断率诊断率断率断率断率0C1个90%90%95%100%75%90%80%1R3100%100%100%100%100%100%100%个2R44,100%100%100%100%100%100%03R6个45%100%100%100%100%100%100%4R7,60%100%100%100%100%100%0vl5R8100%100%100%100%100%100%0个6R:L640%55%70%90%100%100%100%%个7口个80%90%85%70%5%20%10%8R1935%65%85%65%50%50%20%个9R2255%55%100%90%55%20%10%个10C4100%100%90%70%40%50%30%个11C3个100%55%65%30%20%5%10%12R9100%60%55%40%40%15%30%个13R17^^100%100%100%100%100%100%35%14R2U85%75%90%65%60%65%55%15Normal80%100%100%100%100%100%0平均.38%84.07%89.69%82.5%71.57%69.7%36.25%:7940 北方工业大学硕±学位论文5-4可知H小波分解5层后提取得32维特征所得故障诊断率从表,与aar(58.1%)相比,分解7层后诊断为率79.%%,故障诊断率提高的原因可能是由于分解7层后,提取的128维故障特征包含更详细丰富的故障信息,使其故障诊断效果更优。此外,当同样降维比例达到75%时,分解5层实验最终所得诊断率为91.3%,而分解7层实验最终所得诊断率为的.69%,这可能由于分解层数多。了之后,重要的信息在降维后有所损失导致一5.5.3同数据进行降维效果对比实验为了进一步说明本文提出的小波包分解与局部线性嵌入特征降维优化技术的优越性,増加使用局部线性嵌入技术对第四章中典型四运放低通滤波器电路的高维特征数据降维的对比实验。利用Haar小波包对原始数据进行5层分解,然后将所得数据输入LLE算法模型进行降维处理,分别得到降维到16维、8维、4维、2维时的降维结果。最后故障诊断率为评价标准,得到降维后的故障诊断率如表5-5所示。表5-5各维数下的故障诊断率对比故阵类型16维8维4维2维Normal100%100%70%65%Clt75%80%90%60%ClI85%85%85%40R4165%70%80%45%R4190%60%50%10C2t100%100%55%0C2i100%100%70%45%R3t95%50%40%10R3i100%75%45%0R2t95%85%60%55%R2i100%70%95%跳R1t90%100%95%0R1I70%80%85%10平均;89.6%81.2%70.8%5%41 北方工业大学硕±学位论文5-5可W看出由表,高维数据经过降维后故障诊断率有所提升,在降维到16维时故障诊断率达到89.6%,超过之前选择故障特征系数试验中的C组所得到的最髙故障诊断率(75.8%)。实验表明,原始数据经过小波分析特征提取和LLE一算法降维处理后,所构建的故障特征子集是种优选的特征子集,能够提高故障诊断率。42 北方工业大学硕±学位论文第六章结论与展望6.1主要结论本课题研究了电路板故障诊断中基于流形学习的局部线性嵌入数据降维技术,主要提出使用模拟电路故障诊断中通用的小波分析特征提取技术与局部线性嵌入相结合的故障特征提取及降维优化方案,研究了小波分析特征提取技术在模掛电路故障诊断工程应用中存在的H个方面的不足:如何选择最优小波基函数、如何确定小波分解层数和如何选用小波系数构造特征H方面工作一,得出般性的指导结论,解决模拟电路故障诊断工程中通用的小波特征提取技术缺乏理论性指导的问题;W及主要研充了使用局部线性嵌入技术解决小波特征提取技术所提取的特征维数随分解层数増加呈指数形式増长的维数灾难问题。主要工作是提出了小波包分解、局部线性嵌入算法及克隆选择算法相结合的WPD+LLE+CSA模拟电路故障智能诊断方案,该方案在典型的两级四运放低通滤波器电路上进行故障特征数据降维的仿真结果表明,使用基于流形学习的局部线性嵌入数据降维技术对原始故障数据的降维比例达到巧%后,诊断率仍保持在的娩的较高水平。实验结果证实了局部线性嵌入数据降维技术在模拟电路故障诊断的适用性,从而为局部线性嵌入数据降维技术在复杂数据降维的工程应用方面提供了有用的参考。6.2研究巧望虽然本文对模拟电路故障诊断中数据降维进行了大量的研巧工作,也取得了一一定的研巧成果,但课题仍存在需要进步解决的关键问题;一1、最优K值确定。在局部线性嵌入降维算法中,只有个参数就是算法第一步中的K值一,这是个预先给定的值,不同的数据集有不同的K值。本课题=中,针对本课题使用的电路及采集到的数据,通过大量实验对比,得到K口时能获得较髙的故障诊断率,缺乏理论性的指导。2、寻找更合理的故障模式识别技术。人工智能与机器学习的飞速发展,人们针对复杂的电路板和庞大的数据量进行故障识别有了更多的诊断算法选择机一会,下步要研巧的工作就是寻找更高效的识别算法。43 北方工业大学硕±学位论文参考文献.流形学习理论与方法及其应用研巧.国防科学技术大学[U詹宇斌[D],2011.2黄移军.基于局部线性嵌入的高维数据降维研究阳].中南大学2009.,[]3王超.基于流形学习的有监督降维方法研巧巧].中国科学技术大[]学2009.,[4]雷迎科.流形学习算法及其应用研巧[D].中国科学技术大学,2011.5唐文俊.基于流形学习的数据降维的研究巧].广东王业大学2012.,[]陈磊.基于线性子空间与流形学习的人脸识别算法研巧化].西安电子科[巧技大学,2014.BiilnfodJ约alhai7ernstenDeSvaVLarC.Graroxmations化eodesicson[,g,pppg]embeddedSUTRmanifolds.tanfordniversitechnicaleort.2001.y,p臧家鹏.互联网环境下企业信息获取与加工技术及应用探究巧].华中科[巧技大学2012.,例李盛化基于VC++和MATLAB的车型分类及车辆计数系统[D]?东北师范大学2009.,10毛向德王庆贤董唯光梁金平.小波包神经网络与数据降维的移,,,,朱科[]-相全桥变换器的故障诊断[J].电源学报20140468:,,11罗混.基于小波分析和人工神经网络的容差模拟电路故障诊断巧].湖南[]大学,2011.1.基于小波分析和神经网络的模拟电路故障诊断巧].湖南大[巧宋丽伟学,2012.**3YWhenYWW-1angYonandinangaveFEuehaianletBasedeaturextractionin[],gzg,Qyong,'*-PaFssilterrcuitFaultDiagnosisforBiuadHighCitMahematicalProblemsinEnineerinq,gg,vol.2016,Article阻%拾847,13pag的,20W.doi:10.1155/2016/5682847王勤勇.基于人工免疫技术的模拟电路故障诊断技术[D]14.北方工业大[]学2013.,彭良五禹枉兵.基于小波分析和克隆选择算法的模拟电路故障诊断[J].[巧200706-电工技术学报:1216.,,。巧AMINIANF,AMINIANM,COLLINSJRHW.Analogfaultdiagnosisofactualcircuits44 北方工业大学硕±学位论文usinneuralnetworks[J].IEEETransactionsonInstrumentationandMeasurement2002g,,5134-50:54()17詹宇斌.流形学习理论与方法及其应用研究巧].国防科学技术大学[,]2011.re-oweisSSaulL.NonlineardimensionaliductionblocalllinearembeddinJ.口巧民,tyyyg[]—Science.20002905500:2巧32326.,()SeunHSLeeDD.TheManifoldWasOfPercetion?Science.2000290500:"刮g,yp阴^口)2268-2269.口0]TenenbaumJ,SilvaV,LangfordJ,Aglobalgeometricframeworkfornonlineard0巧05001-imensionalityreduction.Science.200:巧923巧.,口…)[21BreglerC,OmohundroS.Nonlinearmanifoldlearningforvisualsec沈reconitionC.虹pg[]]Proceedinsf5化InttilConferenceonCotViio.1995:49一99,goemaonampuersn22..基于流形学习的特征提取方法及其应用研巧中国科技大学博±[]李波学位论文合肥.2008.,口3]WeinbergerKQ,ShaF,SaulLK.LearningakernelmatrixfornonlineardimensionalityreductionC?虹Proc说dinsofthe21巧internationalconferenceonMachinelearnin.2004:][gg-106113.24LinT,ZhaH.RiemannianManifoldLearninJ.IEEETransactionsonPaternAnalysis[g[]]6-andMachineIntellience.2008,30:巧809-g口)5einbererKShaFSaulL.2004.LearningaKernelMatrixforNonlinearDimensionalit口]g?,y-MaReductionI.ProceedingsofthetwentyfirstnternationalConferenceonchinelearning.口巧Weinberger氏SaulL.UnsupervisedLearningofImageManifbldsbySemide伍liteP-rorammin.InternationalJournalofComputerVision^2006.701:7790.gg()口7]T.L的Zha^托6.May,Riemannianmanifbldlearning,圧EETransactionsonPatternM2008-Ana.3057lysisandachineIntelligence,.vol,no.,.96809.pp口巧吐Chang,Yeung,0?Y"Robustlocallylinearembedding,PatternRecognition^2006-396:10531065.()[29]TenenbaumJB,deSilvaV,LangfordJC.AglobalgeometricframeworkfornonlineardS-2323imensionalityreduction.cie打ce2000?巧0500:巧巧.,扣口)30卢进军杨杰.LLE.2006.,梁栋等在图像检索中的应用[],3罔志敏.基于流形学习的数据约简方法研巧与应巧[D].山东师范大[U45 北方工业大学硕±学位论文学2012.,32人彬王磊.人工免疫系统:原理、模型、分析及展望[J].计算机学[]肖,20022-报(1):128193.,,BC--V3erkowitZR*8、onditionsforNetworkElementalueSolvabilit.CircuitTheoryIRE口jy,]-Transactions.:.2429.OH19拍9j。)口[34]NavidjN.andA.N.WillsoBj比,Atheoryand処algorithmforanalogcircuitfaultdiagnosis.CT79440 ̄ircuitsandSstemsIEEEransactionson巧.267:.4巧.y,*()9[35]Sandier,J.W.andA.E.Salama,Faultdiagnosisofanalogcircuits.ProceedingsoftheIEEE,-1985.1.?巧8:2791325()p.20036刘新东.基于LLE和SVM的模拟电路软故障诊断1系统仿真技术及[]其应用学术会议.,中国吉林长春37廖剑...测,周绍磊,史贤俊,王朕模拟电路故障特征降维方法[J]振动[]-+4试与诊断502:30230800.,201,[38]Catelani,M.andA.Fort,Softfaultdetectionandisolationinanalogcircuits:someresultsandacomarisonbetweenafiizzaroachandradialbasisfunctionnetworks.pyppT200211-202InstrumentationandMeasureme雌阻距ransactionson^.5:.96.口)pTaii¥?etalANovelMethodforAnaloFaultDiagnosisBased処NeuralNetworksandj,,口句gGeneticAlgorithms.leeeTransactionsonInstrumentationandMeasurement2008.5711:,()-p.2树12639.-HLh-IedanceFaunEcPow40HY-on.Y?姐dW.S.uanocatingHimpltSectioniletricer[,g,g]gSnWTmk-MGtstemsUsiAlithtVyigaveletransfor,eans,enecgorms,andSupporectorMachine.MathematicalProblems虹Engineering,2015.4FAmu-ne-minianM.and.inianNeraltworkbasedanalocircuitfaultdianosisusing。A^^gg[wavelettransfonnaspreproc的sonCircuitsandSystems口:AnalogandDigitalSignalProra-c的sing圧EETnsactionson,2000.472:.151156.,()p42Peng,W.andY.Shiyuan,Anewdiagnosisapproachforhandlingtoleranceinanalogand[]-uszzmsinalcirIRePIEEEmixedircuitsbyinfiimath.CcuitsandSstes:ularaersggyygp,Tn2005-ransactios.112127.on,巧10:28()护DeCastro,L.N.andF.J.VonZuben,LearningandoptimizationusingtheclonalselectionEuIEEE-rinrile.volutionaryComtationTransactionson2002.63:.239251.pp,,pp()46 北方工业大学硕壬学位论文申请学位期间的研究成果及发表的学术论文"Yuehaanandinonanele-iWgYonzhenYanQWWavtB化edFeature山,gg,ygg,’’Extractioniuadh-ihemalinFaultDianosisforBHigPassFilterCrcuitMatticagq^ProblemsinEngine灯ingvol.2016ArticleID568284713aes20化.,,,pg,doi:l0.1155/2016/5682847"2JianhouGaiiGanXieYonzhenYananuanLiu.Heteroeneous[]jg,gg,Wqg"InfonnationKnowledgeConstructionBasedonOntology.TELKOMNIKATelecommunicationComtinElectronicsandControl14.401.(pug)口句47 北方工业大学硕±学位论文致谢。光阴似箭,岁月如梭,短暂而充实的硕±学习生涯即将结束能够顺利完成学业离不开导师的精也培养、领导的亲切关怀、家人、同学化及朋友的热必帮助。值此论文完成之际,向各位表示最真诚的敬意和最衷也的感谢。首先,我要感谢的是我的导师王月海教授。王老师开阔的研充思路、渊博的、]专业知识、严谨的治学态度敏锐的学术目光1^1及诲人不倦的敬业精神,无时无。刻不在激励着我前进,使我受益匪浅从王老师身上学到的不仅仅是前沿的专业知识和科学研巧方法一,更重要的是刻苦钻研的精神和严谨的科研作风,这是我生最宝贵的财富,也将激励着我在今后的学习与工作中乘风破浪。在此,对王老师的辛勤栽培再次表示最诚挈的谢意。其次,我要感谢计算机学院的全体老师,感谢各位老师的倾囊相授W及在我学习期间给予莫大的关必和帮助。感谢电子信息工程学院的杨扬老师、杜涛老师、和王华峰老师I,特别感谢刘万泉教授在我SC论文写作与投稿期间给予精也细致的指导I论文的发表。同时也特别感谢论文答辩的各位老师在,让我能够完成SC百忙之中审阅我的论文和出席答辩会。此外,在此我还要感谢本人所在的图像与智能感知实验室H年来为我提供良好的学习环境和便利的科研条件。感谢实验室的程冉师兄、王勤勇师兄W及各位师弟师妹们,在此衷也的感谢他们给予的关也、支持和帮助。最后我要感谢我的父母、家人和室友,无微不至的关怀和博大无私的关爱,始终是我前进的动力源泉,感谢他们在我身后默默地支持和无私的奉献。间永征2017年6月6日48

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
大家都在看
近期热门
关闭