基于数据挖掘的设备远程监测和故障诊断系统的研究

基于数据挖掘的设备远程监测和故障诊断系统的研究

ID:33404414

大小:6.15 MB

页数:149页

时间:2019-02-25

上传者:U-22107
基于数据挖掘的设备远程监测和故障诊断系统的研究_第1页
基于数据挖掘的设备远程监测和故障诊断系统的研究_第2页
基于数据挖掘的设备远程监测和故障诊断系统的研究_第3页
基于数据挖掘的设备远程监测和故障诊断系统的研究_第4页
基于数据挖掘的设备远程监测和故障诊断系统的研究_第5页
资源描述:

《基于数据挖掘的设备远程监测和故障诊断系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

上海交通大学博士学位论文基于数据挖掘的设备远程监测和故障诊断系统的研究姓名:伍星申请学位级别:博士专业:机械设计及理论指导教师:陈进20050101 中请上海交通走学工学博士学位论文基于数据挖掘的设备远程监测和故障诊断系统研究摘要随着科学技术的飞速发展和市场竞争的日益激烈,工业生产表现出大型化、分布化、高速化、自动化和复杂化等特点。由于这些大型系统一般都是作为能源、石化、冶金以及其他国民经济支柱产业中的关键设备,一旦发生故障,轻则降低生产效率,重则设备停机、生产停顿,有时甚至产生机毁人亡的恶性事故,造成灾难性的后果。因此,为了发挥设备更大的工作效率且安全高效地运行,就必须对关键设备部件进行状态监控与故障诊断。目前现场总线、网络和Intemet技术为分布式应用提供了一个易实现的通讯主干。软件体系结构理论和组件技术已经为分布式软件系统提供了理论和实现基础。数据挖掘理论为处理来自于监测系统的海量数据提供一种新的解决方案。构建基于数据挖掘理论和Internet技术的远程监测和故障诊断系统已成为故障诊断发展的重要趋势。因此,本学位论文在国家“十五”科技攻关计划重点项目“基于网络的设备远程监测与故障诊断系统”(项目编号2001BA204806)和国家自然科学基金重点项目。“大型复杂机电系统早期故障智能预示的理论与技术”(项目编号50335030)的资助下,以Internet为支撑平台,以软件体系结构和数据挖掘为理论基础,围绕着设备监测和诊断系统的软件体系结构模型、特征识别方法和知识获取方法三个主题展开,采用理论研究、实验验证与原型实现相结合的研究路线,具体如下:1)从工程应用的角度出发,简要阐述了本文的选题背景与研究意义。分别对基于Internet和数据挖掘的监测与诊断技术的国内外研究现状进行了较为全面地综述。2)对目前设备监测和诊断系统开发领域存在的问露进行了总结,通过引入软件复用思想和体系结构理论,提出一种面向监测和诊断的软件体系结构(MODOSA)模型。针对基于Internet的远程监测与故障诊断系统(IRMFDS)的问题域,给出了IRMFDS的拓扑结构模型,进一步提出了MODOSA的体系结构风格、用例模型、领域模型、对象模型、行为模型、组件模型和部署模型。3)通过对故障诊断领域信息特点的分析和诊断系统知识表达系统的总结,给出了旋转机械故障诊断的特征挖掘模型,针对故障特征的自动提取问题提出了采用数据挖掘中数据准备技术解决的方案。在特征值归约方面,提出了一种改进的多特征离散化算法;在特征归约方面,提出了一种基于遗传算法、粗糙集和信息熵理论的混合特征归约算法。4)在总结传统数据挖掘过程模型的基础上,对比故障诊断专家系统的知识获取系统,提出了旋转机械故障诊断的知识挖掘模型,针对故障诊断知识的自动获取问题给撮动、冲击、噪声国家重点实验室 摘要出了基于数据挖掘技术的解决方案。通过对决策树的构造、修剪、规则的生成和评价几个方面进行深入研究,提出了一种基于遗传算法和粗糙集理论的决策树构造算法和一种规则综合评价指标,并给出了规则匹配问题的一个解决方法。5)在前述MODOSA模型和数据挖掘理论研究的基础上,给出了两个专用数据挖掘工具RMFMiner和RMKMiner的设计和实现,初步解决了诊断特征的自动提取和诊断知识的自动获取问题,并采用转子故障模拟数据集和UCI机器学习数据库验证了两工具的有效性。6)根据提出的MODOSA模型、特征挖掘模型和知识挖掘模型,结合RMFMiner和RMKMiner工具,采用Web构架设计了IRMFDS,并采用组件技术建立基于Web的原型系统VSN-NetMDS,并在实验室的测试环境中验证了系统的有效性。此原型为状态监测领域的开发者提供了一个范例。实践表明,MODOSA模型对于推进先进信息技术在本领域中的应用有着积极的意义。关键词:数据挖掘,远程监测,故障诊断,软件体系结构,知识获取,Web应用振动.冲击,噪声国家重点实验室 申请上海交通大学S-学博士学位论文ResearchonRemoteConditionMonitoringandFaultDiagnosisSystemforMachinerybasedonDataMiningAbstractTheextraordinarygrowthoftechnologiesandmarketcompetitionhasalreadyhadasignificantimpactoncommercialmanufacture.Therearesomenewcharacteristics.suchashugeness,distribution,highspeed,automationandcomplexity.Theseequipmentsarethekeyequipmentinpillarindustries,suchasenergyindustry,petrochemicalindustry,metallurgicalindustry,etc.Oncethereissomethingwrongwiththem,productionefficiencywillfallormachinesetshalt,evencatastrophicaccidentswilloccur.Itisnecessarytomonitorkeyequipmentsanddiagnosetheirfaultsinordertoimprovesafety,allowpredictivemaintenanceandshortensignificantlytheassociatedoutofservicetime.CurrentFieldBus,Networking,andInternettechnologiesprovideaueasilyimplementedcommunicationsbackbonefordistributedapplication.SoftWarearchitecture(SA)andComponenttechnologyhavebeenrapidlydevelopedtosupportdistributedsoftwarearchitectures.DataMiningfDM)providesanewsolutiontoprocessmassdatacollectedfrommonitoringsystems,ItisbecomingamajortrendtoconstructaremotemonitoringandfaultdiagnosissystembasedonDMandInternet.ThepresentstudyissupportedbytheNational‘‘10.5”ScienceandTechnologyKeyProject(No.2001BA204805)andNationalNaturalScienceFoundationofChina(No.50335030).ItbasesonDM,SAandInternet.ThepresentstudyisinvolvedinSAmodelofequipmentmonitoringanddiagnosissystem,featurerecognitionandknowledgeacquisition,whichcombinesthetheoreticalinvestigation,experimentalinvestigationandprototypeinvestigation.Theconcretecontentsaregivenasbelow:Fromtheviewpointofengineeringapplication,thebackgroundandsignificanceofthepresentstudyareelucidated.ThestateoftheartrevJewonmonitoringanddiagnosistechnologybasedonInternetandDMarethoroughlycompleted,respectively.Theproblemsofdevelopmentofmonitoringanddiagnosissystemaresystematicallysummarized.AMonitoring—OrientedandDiagnosis-OrientedSA(MODOSAlmodelisproposedbasedonsoftwarereuseandSAtheory.AccordingtoproblemdomainoftheInternet—basedremotemonitoringandfaultdiagnosissystem(IRMFDS),itstopologicalstructuremodelisgiven.FurthermoreMODOSAisresearchedonmanyaspects,whichincludearchitecturestyle,usecasemodel,domainmodel,staticmodel,dynamicmodel,componentmodelanddeploymentmodel.AccordingtosummarizeinformationcharacteristicandKnowledgeRepresentationSystem(KRS)infaultdiagnosisdomain,afeatureminingmodelisgivenforfaultdiagnosisofrotatingmachinery.Asolutionbasedondatapreparationtechnologyis振动、冲击,噪声国家重点实验奎.III- 摘要pl㈡¨,sedforautomaticextractionoffaultfeature.Amodifiedmulti—featurediscretizationaI-、-lilhmisstudiedonthepartoffeaturevaluereduction.Amixedfeaturereduction1:1㈦1『ithlnbased011geneticalgorithm(GA),Rou曲SetCas)andInformationEntropyOs)ispl‘qjoscd01lthepartoffeaturereduction.naditionalDMprocessmodelsaresummarized.IncontrasttoKnowledgeAcquisition、。,ysteJn(KAS)inFaultDiagnosisExpertSystem(FDES),aknowledgeminingmodelis:·ivenforfimltdiagnosisofrotatingmachinery.Asolutionbasedondataminingtechnologyi、、一t}posedforautomaticacquisitionofdiagnosisknowledge.Severalproblemsarestudiedal;mltdecisiontree,whicharetreeconstruction,prune,rulegenerationandruleevaluation.{ITt:L’ninstructionalgorithmbasedonGAandRSisdeveloped.Acomprehensivegtbae'<4ITlCll|criterionofruleisproposed。AmethodisgivenforsolvingtheproblemofruleInatcllTwospecialDMtools,RMFMinerandRMKMiner,havebeendesignedanddevelopedIkcordingtoMODOSAmodelandDMresearch.Toacertainextent,theysolvethei,roblcmsOilautomaticextractionofdiagnosisfeatureandautomaticacquisitionofliagnosisknowledge.Afterthetwotoolsareappliedindatasetfromrotorfaulttest-bedandI(’TMachineLearningRepository.experimentalinvestigationverifiestheaccuracyof、t”iespondingalgorithmsinthepresentstudyanddemonstratesitsavailabilityand“asibililyinengineeringpractices.,}prototypesystemofWeb—basedRemoteMonitoringandFaultDiagnosisSystemlWRMI:DS),VSN-NetMDS,hasbeenimplementedbasedontheMODOSAmodel,featureIIl⋯n*modelandknowledgeminingmodel.ThisprototypeisdevelopedusingWebH,chilectureandcomponent-basedprogramming.TheimplementedVSN-NetMDShasbeenhstcdintimlaboratory,inwhichatestenvironmenthasbeenbuilt.VSN-NetMDSgives¨therresearchersaparadigm.TheMODOSAmodelisofvaluetopromoteadvancediulormationtechnologiestobewidelyappliedindiagnosisdomain.Kc!words:datamining,remotemonitoring,faultdiagnosis,softwarearchitecture,k.owl,:dgc;acquisition,Webapplication振动,冲击、噪声国家重点实验室 上海交通大学学位论文答辩决议书所在学科申请者伍星机械设计及理论(专业)论文题目基于数据挖掘的设备远程监测和故障诊断系统的研究答辩日期2005年5月21日地点上海交通大学徐汇校区机械楼210答辩委员会成员姓名单位职称签名孟光上海交通大学教授彭L张泉南中国船舶重工集团第711研究所研究员。稚绚恽伟君上海船舶研究611所研究员{珲怍况朱继梅上海理工大学教授芝鳓。,}1赵玫上海交通大学教授户坦壮陈进上海交通大学教授p鼬评语和决议:随着Internet技术、组件技术、软件体系结构理论和数据挖掘理论的发展和完善,综合运用数据挖.掘理论和各种计算机主流技术t解决机械设备的远程监测和复杂诊断问题已成为故障诊断发展的重要趋势。论文选题于国家重点攻关项目和国家自然科学基金重点项目,系统地总结了软件体系结构和数据挖掘理论,对设备的监测和诊断系统的软件体系结构模型、特征提取方法、知识获取方法以及系统的原型进行了研究,对解决机械设备故障诊断问题具有重要的理论意义和应用价值。论文主要创新点如下:1)采用UML作为可视化建模语言,提出了一个可复用的面向监测和诊断的软件体系结构模型。2)提出了一种基于遗传算法、粗糙集和信息熵理论的特征归约混合算法,此算法在确保分类精度的同时,可以太幅度减少条件属性项,从而使故障诊断系统实时性增强。3)提出了一种基于遗传算法和粗糙集理论的决策树构造算法,使满足一定分类精度的前提下获取的规则数为最小。同时.为了评价规则的合理性,提出了一种包含了准确率、灵敏性、特效性和精度信息在内的规则综合评价指标。论文工作表明,作者已掌握本学科扎实宽广的理论基础和深入的专业知识,已具备独立从事科学研究的能力。论文理论分析正确,公式推导严密,结果可靠。论文答辩论述清晰.回答问题正确。黼颈鲂和靴龇始托舣好球芝黧≯幺 申请上海交通太学工学博士学位论文DMCBMMIMOSAKDDIRMFDSMODOSARMFMinerRN贼inerUML00ACASECOMCORBAEJBDSSASAERMSDLAPIRDCEMCEMUDSPCDASKRSISSFSSBSSAARSTGACRISP.DMCBDC/SB/SDTS主要符号说明表DataMiningCondifion-basedMaintenanceMachineryInformafionManagement0penSystemsAllianceKnowledgeDiscoveryinDatabasesIntemet-basedRemoteMonitoringandFaultDiagnosisSystemMonitoring.OrientedandDiagnosis-OrientedSoftwareArchiteetureRotatingMachineFeatureMinerRotatingMachineKnowledgeMinerUnifiedModelingLanguageObject-OrientedAnalysisComputerAidedSoftwareEngineeringComponentObjectModelComnlon0biectRequestBrokerArchiteotureEnterpriseJavaBearlsDomain.SpecificSoftwareArchitectureSoftwareArchitectureEntity-RelationshipModelingSpecification&DescriptionLanguageApplicationProgrammingInterfaceRemoteDiagnosisCenterEnterpriseMonitoringCenterEnterpriseMonitoringUnitDigitalSignalProcessingChipDataAcquisitionSystemKnowledgeRepresentationSystemInformationSystemSequentiaIForwardSelectionSequentialBackwardSelectionSimulatedAnnealingAlgorithmRou西SetTheoryGeneticAlgorithmCROSSIndustryStandardProcessforDataMinillgConceptLearningSystemMinimumDescriptionLengthObject.OrientedDesignⅥ毡b.basedRemoteMonitoringandFaultDiagnosisSystemComponent-basedDevelopmentClient/ServerBrowser/ServerDamTransactionService数据挖掘基于状态的维护机械信息管理开放系统联盟数据库中的知识发现基于Internet的设备远程监测与故障诊断系统面向监测和诊断的软件体系结构旋转机械特征挖掘器旋转机械知识挖掘器统一模型语言面向对象分析计算机辅助软件工程组件对象模型公共对象请求代理体系结构企业JavaBeans特定领域的体系结构软件体系结构实体关系建模说明与描述语言应用编程接口远程诊断中心企业监测中心企业监测站数字信号处理芯片数据采集系统知识表达系统信息系统顺序前进法顺序后退法模拟退火算法粗糙集理论遗传算法跨行业数据挖掘标准过程概念学习系统最小描述长度面向对象设计基于Web的远程监测帮故障诊断系统基于组件的软件开发客户器,服务器浏览器明日务器数据转换服务盟裟 主要符号说明表DBMSGOODUBALRRUBUBRRoILWCRAKDatabaseManagementSystemGoodConditionUnbalanceConditionRadialRubConditionUnbalance&RadialRubConditionOilWhirlConditionShaftCrackCondition数据库管理系统正常状态不平衡状态径向碰磨状态不平衡+径向碰磨状态油膜涡动状态轴裂纹状态 上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交}{台文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在年解密后适用本授权书。本学位论文属于不保密口。(请在以l:方框内打“4”)学位论文作者签名:歹五瑾艚教师签名:日期:Z辟多月乡日/日期:列年≥眵日 上海交通大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。靴论文作一7磋日期:2∥岁年歹月2日 中请上海交通大学工学博士学位论文1.1课题概述第一章绪论1.1.1课题来源本学位论文是国家“十五”科技攻关计划重点项目“基于网络的设备远程监测与故障诊断系统”(项目编号2001BA204806)和国家自然科学基金重点资助项目“大型复杂机电系统早期故障智能预示的理论与技术”(项目编号50335030)的重要组成部分。1.1.2课题意义随着科学技术的飞速发展和市场竞争日的益激烈,各个企业为了求生存、谋发展不断进行技术引进和技术改革,促使工业生产不断向大型化、连续化、高速化、重载化和智能化等方向发展。这些发展主要表现出三个特点:1)设备结构的复杂化,各组成部件之间关系复杂,导致影响设备正常运行的因素增加;2)设备规模的大型化,越来越多的是高度自动化的集成生产系统,导致系统造价不断升高;3)设备速度的极限化,导致越来越多的安全隐患。从正面看,这些发展降低了生产成本、提高了生产效率满足了工业生产的客观要求。但从另一方面来看,对整个系统的设计、制造、安装、运行、维护就提出了更高的要求,这些特点导致工业设备的结构以及故障的产生机理日益复杂,有时还表现出强烈的非线性、随机性和突发性,同时负荷、温度、压力等工况参数作为一种外在的因素对设备的工作都有着很大的影响。由于这些大型系统一般都是作为能源、石化、冶金以及其他国民经济支柱产业中的关键设备,一旦发生故障,轻则降低生产效率,重则设备停机、生产停顿,有时甚至产生机毁人亡的恶性海故,造成灾难性的后梨1埘。因此,为了发挥设备更大的工作效率且安全高效地运行,就必须了解设备的运行状况,掌握其变化规律,对关键设备部件实行状态监测与故障诊断。自70年代以来,国外机械状态监测与故障诊断技术已进入实用化阶段获得了显著的经济效益口‘5】。英国Thomas在1984年发表论文认为,对大型汽轮发电机组进行振动监视,其获利和投资的比例为17:1。英国CEGB公司下属的550MW和600MW发电厂因机组故障每年损失750万英镑,采用诊断技术后对机组振动故障原因的五次正确分析就取得直接经济效益293万英镑【51。在国外,商业化状态监测与故障诊断系统的研制和生产都已经达到了成熟阶段,其中又以设备振动量的分析处理最为成熟。我国自80年代中期起开始设备故障诊断技术的研究,状态监测与故障诊断系统的研制 第一章绪论和开发还处于发展阶段,最初主要集中在科研院所和高校。随着我国市场经济的发展,各研究所后来纷纷将其研究成果产业化。20世纪90年代以来,Intemet的迅速发展及其良好的应用前景,使之成为各种信息的载体。基于Intemet的远程协作作为2l世纪的新型合作方式倍受学术界和工业界重视;Intemet模式的开放式软硬件体系结构也得到人们的认同,成为各种系统开发的必然趋势[6’7]。Intemet技术的飞速发展使故障诊断技术面临着新的机遇和挑战。一方面,遍布世界的国际互联网打破了地域上的限制,跨越了企业和研究机构在时间和空间上的距离,为异地的信息、知识、方法、服务等各种资源的有效地沟通提供了非常方便的联系途径。另一方面,诊断技术的研究开始向多级监测和诊断中心模式方向发展,实现研究、设计、制造、管理、使用和维修等部门的沟通,从而为现场提供更高水平的诊断服务【⋯。随着状态监测和故障诊断系统的应用规模、范围和深度的不断扩大,企业积累的设备监测数据越来越多,相应地进行信号采集、特征提取、状态识别和诊断决策这四个步骤的难度也不断增长,激增的数据背后隐藏着许多重要的信息,而企业并不能充分利用这些数据中的大量信息去监测机器运行状态,诊断机器故障的原因、位置和严重程度。因此,企业希望能够对已有数据进行更高层次的分析,以便更好地利用这些数据。20世纪80年代后期发展起来的数据挖掘(DataMining,DM)首先在银行、电信、保险、交通、零售(如超级市场)等商业领域成功应用,随后便开始向其他领域渗透。它在对海量数据进行关联规则、分类和预测、聚类等分析上显示出强大的生命力,尤其是人的分析和分辨能力不能胜任高维的海量数据方面【9】。因此,本学位论文在国家“十五”科技攻关计划重点项目“基于网络的设备远程监测与故障诊断系统”和国家自然科学基金重点项目“大型复杂机电系统早期故障智能预示的理论与技术”的资助下,以Intemet为支撑平台,以数据挖掘为理论基础,研究面向故障诊断领域的可复用软件体系结构模型和知识挖掘方法,针对能源、石化、冶金等流程工业研制基于Intemet的设备远程监测与故障诊断系统。该研究对保证工业生产设备的完好率,控制恶性事故的发生,实现机械设备基于状态的维护(Condition—basedMaintenance,CBM),提高机械设备管理水平,推进本领域的信息化建设等方面有着广阔的应用前景、重要的理论意义和实用价值。1.2国内外研究现状综述1.2,1设备监测和故障诊断技术的发展j.2.1.1故障诊断技术的发展设备状态监测和故障诊断技术最早起源于美国,1967年,在美国国家宇航局(NASA)的刨导下,由美国海军研究室(oNR)主持成立了美国“机械故障预防小组” 中请上海交通太学工学博士学位论文’MFPG)。在英国,60年代末至70年代初,以科拉科特(R.A.Collacott)为首的“英t2机器保健中心”(UK.MechanicalHealthMonitoringCenter)率先开展研究工作,在彭传、培训、咨询、制定计划、故障分析以及诊断技术开发等多方面取锝了很好的成放,瞅洲其它匡l家的设备诊断技术研究也有不同程度的进展,在某些方面占据领先地‘曩,如瑞典的SPM轴承监测技术,挪威的船舶诊断技术,丹麦的振动、噪声分析和招一:削技术等。在日本,设备诊断技术在民用工业(如钢铁、化工和铁路等)部门发。雕&速.并占有一定的优势。新日铁子1971年率先开展了设备故障诊断技术的开发坝,t|.作,1976年基本上进入了实用阶段,开发完成了商品化的专用诊断仪器。法国}0.力部门(EDF)从1978年起就在透平发电机上安装离线振动监测系统,到90年代弘五提H{了监测和诊断支援工作站(MonitoringandDiagnosisAidStation)的设想。90;卜代中期,其专家系统PSAD及其DIVA子系统在透平发电机组和反应堆冷却泵的自动诊断上得到了应用。丹麦的B&K公司在90年代推出了新一代状态监测与故障诊断系统.B&K3450型COMPASS系统。而美国Bently公司的在线监测系统则在全球范围内,尤其是在中国得到广泛应用。日本三菱重工首先研制出机械状态监测系统(MI{MS),并在多台核电站和商业热电站使用,后来又发展成带诊断规则描述,以毖、彩Hj模糊逻辑分析确定置信因素功能的振动诊断专家系统。我国自80年代中期起J{‘始设备故障诊断技术的研究,尚属于跟随性发展研究,但在一些领域也取得了丰硕‘⋯I蛾粜,并已形成高校、研究所及工厂的梯队式研究、开发和应用层次。j2l2状态监测和故障诊断系统随着微电子技术、控制技术、传感器技术与机电一体化技术的迅速发展,特别是¨算钆的广泛应用,作为设备状态监测和故障诊断重要手段和工具的监铡与诊断系统-E装胬也得到了很大的发展,形成了状态监测和故障诊断系统的许多新观念,而系统论、信息论和控制论所形成的系统科学与方法论则对状态监测和故障诊断系统正在产生越来越大的影响。A:国外,商业化状态监测与故障诊断系统的研制和生产都已经达到了成熟阶段,Jtl{-义以设备振动量的分析处理最为成熟。在旋转机组状态监测系统方面,美国j'alomar公司的PalomarSeries8000MachineryMonitoringSystem是一个典型的例子,比外还有美国BentlyNevada的早期7200系列、9000系列产品和德国Philips公司的RMS。700系统等。在旋转机组状态监钡4及分析系统方面,著名的有美国SKF—CM公司的M800A系统、CMMSl00/lIO系统,美国IRD公司的IQ/2000系统,美国BentlyNevada公司的Tranmaster2000系统和ADRE3系统,Vibro.meter公司的$501系统,美国scientificAtlanta公司的M6000系统和ENTEK公司的5915系统等。在旋转机组扶态监测分析及故障诊断系统方面,著名的有美国的WestingHouse公司的PDS(ProcessDiagnosisSystem)系统,美国BentlyNevada公司的EA(EngineerAssistSystem)系统,加拿大CSI公司的Nspectr-2系统,ENTEK公司的EXPLORE系统等 第一章绪论[10-23]。在国内,状态监测与故障诊断系统的研制和开发最初主要集中在科研院所和高校,随着我国市场经济的发展,各研究所后来纷纷将其研究成果产业化。其中具有代表性的产品有,北京英维卡泰科技有限公司(东方振动研究所)的INV303/306系统,北京京航公司(中国运载火箭技术研究所)的HG-'6802电机故障诊断仪,南京安正软件技术有限公司(南京汽轮机研究所)的QLFDMS系统(电站汽轮发电机组振动在线监测系统)和FJYJMS系统(风机及压缩机组在线监测系统),河南狮鼎股份有限公司(原化学工业部机械振动研究检测中心)的MMDS一2000设备状态监测与故障诊断系统等等。高校中研究比较成功的此类系统有,浙江大学、清华大学和哈尔滨工业大学联合研制的ZHX.10型200MW汽轮发电机组监测分析与故障诊断系统,清华大学与北京自动化研究所研制的BB.1旋转机械状态监测与故障诊断安全保护系统,西安交通大学轴承研究所的RB.20高速旋转机械状态监测与故障诊断系统,华中科技大学的HZ.1型汽轮发电机组监测与故障诊断系统,西安交通大学轴承研究所与天津电力试验研究所的RB.20—2机组振动在线监测和远距离电话传输诊断系统,西安交通大学智能仪器与监测诊断研究所的大型回转机械状态监测与故障诊断在线离线两用系统(RotvIEW6.O)等。同国外相比来说,从监测产品的先进性和现场运行的可靠性角度上看,具有一定的差距,但在分析诊断技术上我国还是处于国际先进水平【24。”。纵观状态监测与故障诊断系统的产品由20世纪60年代的萌芽到今天的繁荣,可以把它总结为三种典型形式:定期监测与诊断系统、单机在线故障监测与诊断系统和分布式监测与诊断系统口3j”。1)定期监测与诊断系统定期监测与诊断系统通过监测传感器采集设备运行信息,由计算机进行分析和诊断。当需要监测的机械设备数量较多,但又不属于关键设备时,可采用此类系统。其优点是经济、灵活方便。但系统的工作效率低,占用大量的人力和物力,而且由于只是定期监测,故一般不能监测到机组发生故障前后的信号,因而起不到“黑匣子”作用,难以正确判断故障和预报机组的运行趋势。2)单机在线故障监测与诊断系统对每一台设备安装一套故障监测诊断系统。这种方式实时性好,可靠性高。该模式适合于早期的小规模工厂。它是一个封闭的系统,信息只在系统内部流动和处理,各鼗测诊断系统之间信息难以共享,随着工厂规模的扩大,设备数量的增加,该类系统越来越显示出其局限性。3)分布式监测与诊断系统随着大规模企业和大型机电设备的出现,单机在线故障监测与诊断系统已不能满足生产需要,人们根据设备的功能分布和地域分布的特点,实现了基于网络技术的分 申请上海交通大学工学博士学位论文布式监测与诊断系统。该类系统将各个监测点的计算机组成局域网,实现资源共享、分散监控和集中诊断,提高了系统的效率,是一个相对开放的系统。不足之处是各个企业均建立相对独立的监测与诊断局域网,仅能做到企业内部各监测诊断系统的信息共享,而企业之间毫无联系。1,2.2基于Intemet的远程监测和诊断技术的研究现状基于Intemet的远程监测与诊断研究工作最先是从医学领域开始的。上世纪50年代末,美国学者Wittson首先将双向电视系统用于医疗,这被认为是最初的远程诊断。自80年代后期,美国和西欧国家的远程医学系统发展速度最快,联系方式多是通过卫星和综合业务数据网(ISDN)。1987年斯坦福大学的知识系统实验室开始研究基于知识的自动代理系统Guardian,用于心脏病手术病人的远程监护【3扪。1988年开放式远程医疗系统的概念在美国提出,人们普遍认为一个开放式远程医疗系统应包括远程诊断、专家会诊、信息服务、在线监测和远程学习等几个部分。1994年9月SysOptics公司在美国国会向克林顿总统演示了一个基于Intemet的全国保健示范系统。1995年1月美国俄克拉荷马州的远程医疗系统投入使用,它把该州的54家乡村医院与卅I中心医院联系在一起,并通过计算机网络将CT、X光片等病人的临床检验结果送到州中心医院诊断,这样病人在入网的任何一家乡村小医院就诊都能得到专家级的服务。Sacile等人成功地将远程诊断技术运用于电报电话业务和医疗服务上【36】。国内上海医科大学也在上海地区建立了一个类似的远程诊疗系统【3”。另外,在昆虫研究领域也有人建立了类似系统,1999年Drake等人建立了一个远程昆虫监测网络[3”。从技术上讲,远程医疗诊断与远程设备监测与故障诊断在系统结构、信息传输方式以及专家会诊模式等方面是极为相似的。事实上,美国西屋公司从1R76年就开始了电站在线计算机诊断工作,1980年投入了一个小型的电机诊断系统,1981年开始进行电站人工智能专家故障诊断系统的研究,1984年应用于现场,后来发展成大型电站在线监测诊断系统(AID),并建立了Orlando故障运行中心(DOC)。故障运行中心通过专门的电话线与各电厂的数据中心相连,提供了对发电机组全天候的实时监测和诊断。该诊断系统包括三个子系统:TurbinAID、GenAID和ChemAID。三个子系统有各自的诊断规则,但是共享一个数据库。电厂数据中心接收传感器传来的数据,计算出所需各种参数,供上层的诊断专家系统分析。TurbinAID用于诊断处理汽轮机的热动力参数和机械振动参数;GenAID监钡9并分析发电机的定子线圈和励磁系统的参数;ChemAID用于实时监测发电系统的水化学成分含量并作出相应调整。通过DOC中心,可以看到分布在全美20多个电厂的数据信息(其中有2个核电站)。在国外,许多学者针对各种不同的设备进行了远程监测与诊断系统的研究。文献『39]采用Java建立了基于B/S模式的核电站远程诊断演示系统。文献[401采用B/S模式实现了印刷机的远程诊断。哈勃太空望远镜的控制中心采用Java技术实现了其远程 第一章绪论控制⋯j。文献[421介绍了一个通过工作站在Intemet上进行机器人控制的系统一“HighRobot”。文献[43]设计了一个远程诊断系统,用于帮助服务工程师诊断扫描电子显微镜的故障。瑞士ABB集团的协作研究所开发了一套电力设备远程监测系统GLASS(GlobalAccessforServiceandSupport)H⋯。文献【45】建立了一个基于Java的远程望远显微镜C/S系统。文献【46】实现了用于PLC远程维护和诊断的VirtualPLC系统。Westinghouse公司已经开发了一个基于Web浏览器的WAVE系统,用于用户浏览实时系统数据。IntuitiveTechnology公司的产品—1X.Web@aGlance使用户能通过Internet浏览现场的过程数据【47】。文献【48]用“VirtualSpectrometer”系统实现了网上传输核磁共振图像。文献[49】设计了一个汽油分馏器远程实时监测和控制系统一VirtualFactory。文献[501介绍了~个基于多代理的CNC机床刀具磨损远程故障诊断系统。1997年1月,在斯坦福大学和麻省理工学院的联合倡导下,召开了首届基于Internet的工业远程诊断研讨会,有来自30多个公司和研究机构的50多位代表到会。会议主要讨论了远程诊断系统连接开放式体系、诊断信息规程、传输协议,以及对用户的合法限制,并对未来技术发展作了展望。会上确定由斯坦福大学和麻省理工学院合作开发基于Internet的下一代远程诊断示范系统,该项工作得到了制造业、计算机业和仪表业的Boeing、Ford、Segate、Intel、SUN、HP等12家大公司的支持和合作,并很快建立了一个限于合作者间的远程诊断示范体系Testbed。Testbed采用嵌入式Web组网,用实时JVA和BayesianNet实现远程信息交换和诊断推理;从该项目对外开放内容和项目组1997年底的研究总结报告来看,系统离实用还有很大距离,许多研究内容也还只是一个提法。美国密西根大学也在积极开展针对机械加工的远程诊断和制造系统的研究工作,并和威斯康辛大学合作,建立了智能维修中心IMS(CenterforIntelligentMaintenanceSystems)[5l】。另外,许多国际组织,如MIMOSA(MachineryInformationManagementOpenSystemsAlliance)、MFTP(SocietyforMachineryFailurePreventionTechnology)、COMADEM(ConditionMonitoringandEngineeringManagement)、VibrationInstitute等,也纷纷通过网络进行设备故障诊断咨询和技术推广工作,并制定了一些信息交换格式和标准。许多大公司在他们的产品中也加入了Internet功能,如Bently公司的计算机在线设备运行状态监测系统DataManager2000可以通过网络动态数据交换(NetDDE)的方式向远程终端发送设备运行状态;美国NationalInstruments公司在其虚拟仪器产品LabVIEW中新增了Intemet模块,可以通过WwW、Email、FTP方式发送测试数据。此外,Entet、CSI、Soltran等公司也纷纷在设备状态监测产品中加入了最新的网化技术。在国内,远程故障诊断的研究和应用也有了很大的进步和发展。山东电力科学研究院和清华大学等单位在1997年共同开发的“大型汽轮发电机组远程在线振动监测 申请上海交通大学J-擘博士学住论文5i'.0i。i诊断网络系统”,通过网络方式将维坊发电厂、石横发电厂、邹县发电厂等电j的振动数据传输到山东电力科学研究院远程诊断中心站,并通过中心站对振动数据进行远距离的监测分析与诊断,这个故障诊断系统和远程中心站类似于美国西屋公司。内AID系统及DOC中心,也取得了较好的经济和社会效益。华中理工大学机械学院在Internet上建立了设备故障远程诊断中心,向国内介绍远程诊断技术,并以技术示范的方式向用户提供远程诊断服务f521。西安交通大学轴承晰建壹:了网上远程诊断与处理支持中心,其耳标是在网上实现远程监测、分析和诊断;&嘲上提供人员培训和及时技术支持等口31。哈尔滨工业大学动力工程控制与仿真研究所也开展了远程故障诊断的研究工作,并与锦州电厂、哈尔滨第三发电厂合作,实现J’对两家电厂发电机组的远程监测与诊断,同时在Intemet上建立了远程故障诊断中心。L海交通大学振动、冲击、噪声国家重点实验室建立了基于Internet的机械设备远程故障诊断申心,当前主要以技术示范的方式向用户提供远程诊断服务,包括信号采囊.分析和诊断等功能【5⋯。国内其它高校如天津大学、浙江大学、华南理工大学和南泵航空航天大学也都在进行远程故障诊断的研究和开发工作。以’F总结了三个主要激发基于Intemet的设备远程监测与故障诊断系统的研究、玎发和应用兴趣的因素:1)企业内部专家数量有限进行诊断时,诊断者都需要根据设备当时的实际情况、现场的基本参数、使用第平数据进行分析和判断。但由于企业内部专业技术人员比较少,设备出现故障时专家又由于地域原因不能及时到位,往往会因为时间的延误造成巨大的经济损失。而采取远程诊断这种经济、简便的方法通过计算机把现场数据及时送到专家手中,就可以象专家在现场一样准确、及时的作出判断、采取有效措施解决问题[5”。2)在保证诊断性能的同时降低了系统成本综合了单机在线监测与故障诊断和分布式在线监测与故障诊断方式的优点。对每jf机组分别配置一套数采监测系统,多台数采监测系统共享一套诊断系统。这样,既保证了嗌测的实时性(即使在诊断时也能保证不中断监测),又节约了监测诊断系统的成本[55,561。3)实现了诊断知识的共享,避免了知识的重复获取。在全球企业中,具有相似设备的企业经常分布在不同地区,他们完全可以使用相同的基于知识的诊断系统,在工作过程中,在一个企业中发现的新规则可能对于另一个企业完全是未知的,这将导致同样的知识获取过程要在许多不同的地区重复,时间被浪费了。而基于Internet的设备远程监测与故障诊断系统可以使不同的监测诊断现场与I司一个诊断中心建立联系,所有的诊断信息都可由网络获得,使在不同企业的用户鼓享同样的诊断知识,通过Internet可以搜集尽可能多的知识,你仅需获取诊断知 第一章绪论识一次便可以使所有的企业都使用它。因此,它是一个完全开放的系统。l2.3基于数据挖掘的监测和诊断技术的研究现状1.2.31数据挖掘的发展数据挖掘这个词最早来自于文献[571,1978年EE.Learner便用这个词来形容用线性回归方法去解决一些传统概率很难解决的问题是非常有意义的。它的发展是一个逐渐演变的需求推动的过程。当人们对知识获取的研究经历了机器学习、专家系统和人工神经网络三个几经反复的阶段后,在1989年举行的第十一届国际联合人工智能学术会议上,为了强调“知识”是数据驱动发现的最终产物,首次用“数据库中的知识发现”(KnowledgeDiscoveryinDatabases,KDD)这个词来命名一种新的知识获取技术。第一个KDD实验室于1989年8月在美国Detroit建立f5⋯。1996年,U,Fayyad给出了KgD的经典定义:一个在数据中识别有效的、新颖的、潜在的、最终可理解的模型的非平凡过程[591。数据挖掘经常是作为KDD的同义词使用。但按照U.Fayyad的观点,它们是有区别的,KDD涉及从数据中发现有用知识的全过程,而数据挖掘则是这个过程中的一个特殊步骤,数据挖掘是指为了实现从数据中提取知识模型而对具体算法的应用。由于在产业界、媒体和数据库研究界,“数据挖掘”比“数据库中的知识发现”这个词更流行,因此,现在多采用“数据挖掘”这个术语,数据挖掘的广义定义是从存放在数据库、数据仓库或其他信息库中的大量数据中发现有趣知识的过程【鲫】。从1995年的知识发现和数据挖掘国际会议(KDD’95:KnowledgeDiscoveryandDataMining’95)开始,每年都有KDD国际会议召开,2002年7月,在加拿大Alberta的Edmonton举办了第8届KDD国际会议[61-63】。表1—1从商业的角度清楚地说明了数据挖掘的进化历程l”J。表1.1数据挖掘的演化过程Tab.1·1Evolutionofdatamining 申请上海交通大学工学博士学位论文1.2.3.2数据挖掘系统数据挖掘技术的广阔应用前景吸引了国内外众多的研究人员和软件供应商,一批应用系统或原型被开发出来。它们综合采用了数据库技术、人工智能、模式识别、专家系统、机器学习和统计学等领域的研究成果,可以总结为如下三个阶段[651:第一代数据挖掘系统出现在80年代,包含单一任务的研究驱动工具,包括:决策树工具(如C4.5)或神经网络(如sNNs)建立的分类器等。在1995年左右,数据挖掘公司开发了第二代数据挖掘系统。这些工具主要是实现了知识发现过程要求的多种类型的数据分析和数据清洗和预处理。例如,SPSS的Clementine,SiliconGraphics的Mineset,IBM的IntelligentMiner和SASInstitute的EnterpriseMiner。商业用户的需求导致了90年代晚期出现了基予应用和解决方案的第三代数据挖掘系统,它们面向商业用户,直接解决特定的商业问题,隐藏了所有数据挖掘的复杂性。例如,HNCSoftware的Falcon,IBM的AdvancedScout,NASDRegulation的Advanced—Detection系统,MIT的DataEngine。到1998年,根据HerbEdelstein的调查嘲,数据挖掘工具市场是$45million,比1997年有100%的提高。根据在www.kdnuggets.com网站上时事通讯信息的分析,近几年数据挖掘工具的发展趋势见表1-2t65】。表1.2数据挖掘工具的发展趋势Tab.1*2Developmenttrendofdataminingtools在2001年10月16日到10月28日,www.kdnuggcts.com网站对495家使用数据挖掘系统的公司进行调查,分析各种数据挖掘系统使用的比率,调查结果见表1-3。 第一章绪论表1、3数据挖掘系统的使用率Tab.1-3Serviceratingofdataminingsystems排名系统名称使用率排名系统名称使用率1Clemetine(156)18%9/BMM/NERf29)3%2SPSS/AnswerTree(135)16%10Statistica(1612%3SAS(104)12%llOracleDarwin(14、2%4CART/MARS(97)11%】2SGIMjneser(14)2%5SASEM(55)6%13Model1(1011%6Megaputer(52)5%14Gainsmart(6)1%7MATLAB(45)5%15Xa伍nity(3)O%8Angoss(29)3%Other(93)11%1.2.3.3数据挖掘在工程诊断中的应用目前,数据挖掘在许多领域都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。数据挖掘所能解决的典型商业问题包括:数据库营销(DatabaseMarketing)、客户群体划分(CustomerSegmentation&Classification)、背景分析(ProfileAnalysis)、交叉销售(Cross.selling)等市场分析行为,以及客户流失性分析(ChurnAnalysis)、客户信用记分(CreditScoring)、欺诈发现(FraudDetection)等等。而在国内外工业设备状态监测与故障诊断领域的应用应该主要体现在三个方面:特征提取、状态识别和诊断决策。1)特征提取方面文献[67]中应用多值关联规则对某汽油发动机的异响信息进行了数据挖掘。文献【68]采用最大一致性因子改进了粗糙集模型,给出了基于最大一致性因子的特征提取方法,大大减少约筒属性数目和规则数。文献[69】将模糊聚类分析用于模式识别,对往复式压缩机故障信号特征模式进行了挖掘。文献[70】基于Shannon熵理论提出了特征参数组所含故障分类信息的理论值及其工程计算方法,并以此作为特征参数的优选准则。文献【71】为了克服获得用于精确诊断的重要特征参数困难,提出了在常用特征参数基础上运用遗传算法寻找新特征参数函数的新方法。在文献[72忡论述了怎样应用FFCM(functionalFuzzyc—means)算法于机器状态变化的早期识别以及在没有任何专家知识的前提下进行特征挖掘。2)状态识别方面文献[731零U用粗糙集理论从数据信息中直接推导出诊断规则,然后利用遗传算法对这些规则进行学习。文献[741为解决多级往复式压缩机的故障诊断问题,利用粗糙集理论对数据样本进行浓缩,形成初步的诊断规则,并基于该结果形成模糊神经网络,再利用网络的分类逼近能力,建立从故障状态空间至解释空间的精确映射,从而达到故障诊断的目的。文献[751在内燃机神经网络故障诊断系统的基础上,引入粗糙集理 中请上海交通大学工学博士学位论文论,利用可辨识矩阵算法对决策表进行属性约简,降低了神经网络构成的复杂性。文献『76】提出了多层感知器神经网络作为遗传搜索的问题表示方式的思想,设计了遗传神经网络故障诊断模型。文献[771采用小波变换提取阀门故障振动信号的时频特征,并用粗糙集理论对特征向量进一步约简,建立了基于粗糙集理论的往复式柱塞泵故障诊断系统。文献[78]基于神经网络和谱分析技术建立了一个机器故障诊断系统,它可以发现未知的故障模式。文献[79]利用人工神经网络获取了机器振动的非线性回归模型的确定统计信息。文献[80l在多缸柴油发动机故障诊断中应用粗糙集理论诊断阀门故障获得了良好的效果,并提出了一种无先验知识属性离散化方法。文献[8l】利用船用推进器振动信号的功率谱密度作为特征参数输入神经网络,同时将神经网络和模糊算法结合得到一个优化的网络和优化的学习系数。文献【82】将Kohonen自组织特征映射网络和启发式规则结合用于过程监测。文献[831提出了一种用于挖掘跨国公司客户服务数据库服务记录数据进行在线机器故障诊断的数据挖掘技术。文献[84,85]将基于Kohonen神经网络的数据挖掘技术应用于高压变压器状态监测中的油中溶解气体分析。文献[86,87】采用数据挖掘和数字可视化技术设计多个智能主体用于轴承振动数据的诊断。文献[88,891使用改进的时序数据挖掘技术,从示例数据中挖掘正常和故障特征模型,突破了传统时序分析要求稳定和线性的前提限制。文献[901应用数据挖掘技术于热电厂的蒸汽产生系统的性能监测和优化。德国管理智能技术公司(ManagememIntelligenterTechnologienGmbH,MIT)于1992年就成功的研究和开发了一个进行智能数据分析和数据挖掘的组合软件平台DataEnginep“。3)诊断决策方面文献[921应用粗糙集理论来处理因保护装置和断路器误动作、信号传输误码而造成的错误或不完整警报信号,以决策表作为主要工具,直接从故障样本集中导出诊断规则。美国ZaptronSystemsTMIne.公司(AptronixInc.的~个子公司)开发了两个数据挖掘软件产品:MasterMinerTM和DataXTM,可用于模型发现、设备诊断、过程优化、预测管理、网络规划和智能控制凹】。文献【94】介绍了一个用于燃气轮机故障检测和诊断的TIGON系统,它是一个非常简单的数据挖掘系统,既没有数据库,也基本上不做信息的查询。英国Aston大学根据电力工业的需要,开发了一个的基于模型的大型旋转设备故障诊断系统--MODIAROT(ModelBasedDiagnosisofRotorSystemsinPowerPlants)系统,整个系统采用诸如神经网络和模糊逻辑等数据挖掘方法【95I。加拿大国家研究委员会(NailonalResearchCouncilofCanada,NRC)信息技术研究所的集成推理组实验室(TheIntegratedReasoningGroup)开发一个称为航空数据挖掘者(AerospaceDataMiner,ADAM)的自动数据挖掘工具,采用决策树、基于案例的推理、粗糙集合神经网络等数据挖掘技术寻找数据集中的模型和趋势【9“oo]。 第一章绪论1.2.4文献的总结由上述文献可知,众多学者和商业机构已经分别对基于Intemet的远程监测与诊断系统和数据挖掘系统做大量的研究和开发工作,但仍存在以下问题:_虽然传统的模块化软件开发方法已在状态监测和故障诊断系统的开发中取得了一定的成功,但它受到了过程式软件构造方法的极大制约,对需求的应交能力极为有限,从而导致已有的远程故障诊断系统普遍存在移植性、可操作性、开放性、可扩展性和复用性等方面的问题。_当前文献中主要描述是针对某一设备的故障诊断系统实例(实现),而不是面向故障诊断领域体系结构的研究,缺乏更高层次的抽象,已有的领域分析和设计经验不能充分地复用,对其他研究者起不到的应有的范例作用,不能实现软件体系结构的复用。一虽然已开发了众多的远程故障诊断系统,但各高校和研究所都采用封闭的开发模式,存在重复研究和开发的问题,不利于本领域的信息化建设。一目前的诊断方法和诊断系统,一般都是单独地使用人工智能、模式识别、机器学习和信息融合技术中的某一种技术,并没有一个完整的体系将各种方法分类和融合,缺乏一个统一的客观信息挖掘过程模型。-数据挖掘是一门新兴技术,现有的数据挖掘系统多为单机版,且主要是针对诸如银行、电信、保险、交通、零售(如超级市场)等商业领域,在故障诊断领域的应用尚不完善。●数据挖掘虽然为专家系统中知识获取提供了一个新的解决方案,但是并不存在通用的知识挖掘算法,所以它与人工智能、模式识别、机器学习及信息融合技术的交叉还需要进一步的研究,以便改进各种算法的性能,提高诊断规则的容错能力和推广能力。1.3本文的主要研究工作考虑到目前状态监测和故障诊断领域软件体系结构、系统开发模式、知识获取模型和知识获取技术研究的不足,本文对状态监铡和故障诊断系统的体系结构及基于数据挖掘技术的故障诊断方法进行研究,包括面向监测盒诊断领域的软件体系结构、诊断特征的自动识别方法、诊断知识的自动获取方法、远程监测和诊断系统的实现方法。其中,第二章研究了本领域的软件体系结构,第三和第四章对具体的特征挖掘和知识挖掘方法进行研究,第五章是在软件体系结构和对数据挖掘理论研究的基础上对远程监测和故障诊断系统的原型进行了实现。本文结构如下图: 申请上海变通大学工学博士学位论文J远程诊断与数据挖掘的概述(第一章)JlI远程诊断体系结构研究(第二章)ll特征挖掘方法研究(第三章)ll知识挖掘方法研究(第四章)l远程监测与诊断系统的实现(第五章)i结论与展望(第六章)图1-1本文组织结构图Fig.1-1Organizationstructuralchartofthisdissertation1)第二章对面向监测和诊断领域的软件体系结构进行了研究。首先总结了设备监测和诊断系统开发领域存在的问题,然后分别对软件复用、软件体系结构和统一模型语言进行了概述,最后在面向对象分析的基础上,选用统一模型语言作为建模语言,结合基于Interact的设备远程监测与故障诊断系统(Intemet.basedRemoteMonitoringandFaultDiagnosisSystem,IRMFDS)开发的实际案例,对一种创新的面向监测和诊断领域的软件体系结构(Monitoring—OrientedandDiagnosis-OrientedSoftwareArchitecture,MODOSA)模型进行了初步研究,建立了MODOSA的用例模型、领域模型和对象模型。2)第三章对旋转机械故障诊断的特征挖掘方法进行了研究。首先讨论了原始数据集的描述方法,在研究传统数据挖掘的数据准备方法的基础上,建立了旋转机械特征挖掘模型。然后从特征值归约方法和特征归约两方面,对特征挖掘理论进行了深入研究,提出了~种改进的多特征离散化算法和一种基于遗传算法的粗糙集特征归约算法。最后,设计了一个创新的专用数据挖掘工具RMFMiner(RotatingMachineryFeatureMiner)来解决特征自动识别的问题,并采用转子故障模拟数据集和UCI机器学习数据库对RMFMiner的有效性进行验证。3)第四章对旋转机械故障诊断的知识挖掘方法进行了研究。首先,在总结传统数据挖掘过程模型的基础上,提出了旋转机械知识挖掘模型。然后,通过射众多分类方法的总结,选择具有较好综合性能的决策树算法作为数据挖掘技术在故障诊断领域应用的理论研究对象,并进一步从决策树的构造、修剪、规则的生成和评价几个方面进行深入研究,提出了一种基于遗传算法和粗糙集理论的决策树构造算法和一种新的综合评价指标,给出了规则匹配问题的一个解决方案。通过进一步整合RMFMiner,设计了一个创新的旋转机械知识挖掘工具RMKMiner(RotatingMachineryKnowledgeMiner),用以解决本系统中的知识自动获取的问题。最后,采用转子故障模拟数据集 第一章绪论和UCI机器学习数据库对RMKMiner的有效性进行验证。4)第五章对设备远程监测和故障诊断系统进行了实现研究。首先,对软件体系结构风格和组件开发方法进行了总结。然后,在本领域软件体系结构和数据挖掘技术研究的基础上,提出了IRMFDS的体系结构风格,并根据IRMFDS选择的Web应用构架,在面向对象设计方法的基础上,采用统一模型语言(UnifiedModelingLanguage,UML)设计了基于Web的远程监测和故障诊断系统(Web-basedRemoteMonitoringandFaultDiagnosisSystem,WRMFDS)的数据库、子系统的静态和动态模型、组件模型和部署模型。最后,简要介绍了WRMFDS的原型系统VSN-NetMDS的实现,并对MODOSA模型进行了总结。由此在一定程度上证明了本文相关研究内容的正确性与有效性。5)第六章对全文的研究成果和创新点进行了总结,并对进一步的研究方向给出了展望。 申请上海交通欠学工学博士学位论文第二章面向监测和诊断领域的软件体系结构研究2.1引言随着计算机硬件性能的不断提高和价格的不断下降,其应用领域也在不断扩大。人们在越来越多的领域希望把更多、更难的问题交给计算机去解决,这使得计算机软件的规模和复杂性与日俱增,因而软件技术不断地受到新的挑战。20世纪60年代软件危机的出现就是因为系统的复杂性超出了当时的技术条件下人们所能驾驭的程度。此后在软件领域,从学术界到工业界,人们一直在为寻找更先进的软件方法与技术而奋斗。每当出现一种先进方法和技术,都会使软件危机得到一定程度的缓解。然而这种进步有立刻促使人们把更多、更复杂的问题交给计算机去解决,于是又需要更先进的方法和技术。机械设备状态监测与故障诊断系统的研究过程就是一个典型的实例,目前面对不断向大型化、分布化、连续化、高速化、重载化和智能化方向发展的企业设备,系统体系也上升成为构建一个大规模分布式软硬件密集型系统,传统“算法+数据结构”的软件开发方法已经不能胜任。因此,采用何种设计和开发方法才能提高系统的灵活性,使系统实现在状态监测和故障诊断领域内的良好复用,最终成为众多研究者可以借鉴的范例,这是非常值得研究的。J分析设各监测和诊断系统l开发存在的问题‘上‘I软件复用的概述li篙篓薷嚣If统一模型语言的概述{提出MODOSA模型上给出IRMFDS问题域描述上建立mMFDS用侧模型巨粤建}rMODOSA中的关键对象模型图2-1本章组织结构图Fig.2-1OrganizationstnJcnHalchartofthischapter 第二章面向监测和诊断领域的软件体系结构研究本章首先总结了设备炼测和珍断系统开发领域存在的问题,然后分别对软件复用、软件体系结构和统一模型语言进行了概述,最后在面向对象分析(Object.OrientedAnalvsis,OOA)的基础上,采用UML作为建模语言,结台基于Irtternet的设备远程监测与故障诊断系统(Intemet.basedRemoteMonitoringandFaultDiagnosisSystem,IRMFDS)开发的实际案例,提出了一种创新的面向监测和诊断的软件体系结构(Monitoring—OrientedandDiagnosis—OrientedSoftwareArchitecture,MODOSA)模型,本章是按照问题域描述、用例建模、领域建模和对象建模的顺序,逐渐深入地对MODOsA模型进行研究。图2.1是本章的组织结构图。2.2设备监测和诊断系统开发领域存在的问题根据第一章的论述,作者针对设备状态监测和故障诊断领域内软件系统开发所遇到的问题进行了如下总结:11软件系统难以维护开发人员所作的每一种变化的分枝似乎都会将它们的触须广泛而深远地伸到所部署的每个系统中。为了确定哪些代码需要改动阱及安全地进行改动,开发A员不得不深八研究一大堆的代码。21应用集成的需要对企业中已存在的整个监测和诊断系统进行全部重写,这根本就是币现实的,代价太大。任何企业的应用组合都会包含已有的应用和新开发的应用,而它们必须共存并实现互操作。如果已购买多个第三方数据采集系统,电会带来集成问题,它们通常没有很好的组件化,难以集成。31表示方式的改变随着设备状态监铡和诊断技术的发展,与信息表示相关的新需求会出现。从批处理的年代开始,用户已经经历了从绿屏终端到图形用户界面的转变,正朝着基于浏览器的界面前进。其他形式的接口界面,如电子标签和语音识别,或文档扫描,也在不断增长。当每次必须以不同的方式来表示信息时,通常会出现一个相同的问题——是简单地为已有的应用加上一个新的前端,还是必须重写整个应用?们开发技术的变化技术变化的速度好像始终很快,有时候似乎用一种技术剐剐完成监测和诊断系统的软件开发,就发现有了更好的选择。不管原因是什么,技术变化的速度是一个挑战,似乎对承担的每碾新开发项目的寿命都是一种威胁。51重复不必要的工作由于开发监测和诊断系统本质上是一项创造性活动,不存在唯一正确的解决方案,由于开发监测和诊断系统本质上是一项创造性活动,不存在唯一正确的解决方案r 中请上海交通大学工学博士学位论文',xtJJL每个架构设计师或团队所设计的解决方案自然会与别的解决方案在结构上有所_、同。多数软件开发团队会发现,常常在为不同的企业开发类似的应用,他们希望能找到一种方式使得以往的经验能变成一种资本。2.3软件复用的概述自七十年代末期以来,“软件开发过程自动化”和“软件复用”已经成为有望解决钦件危机的两大软件技术主流。前者的研究与发展成果,造就了大量的计算机辅助软件]一程(ComputerAidedSoftwareEngineering,CASE)工具与CASE环境;后者则在八|.年代与九十年代几次成为软件工程学术晁与软件产业界的热门话题。23I复用的概念软件复用是指将已有的软件成分用于构造新的软件系统。其出发点是应用系统的开发不再采用一切“从零开始”的模式,而是以已有的工作为基础,充分利用过去应用系统开发中积累的知识和经验,从而将开发的重点集中于应用中特有的构成成分。越叠£软件复用,在应用系统开发中可以充分利用已有的开发成果,消除重复劳动,避免重新开发可能引入的错误,从而提高软件开发的效率和质量。首次正式提出软件复用是在1968年,Mcllroy在NATO软件工程会议上提出了建●.生产软件组件的工厂,用软件组件组成复杂系统的建议【1“】。20世纪70年代中期以后,复用的着眼点主要局限于对源代码的复用,而编程仅仪是睹多软件生产过程的一个环节,因此整个软件生产过程不能得到全面改进。2c)世纪80年代末期,形成了对软件复用的广义理解:软件生产过程中各个活动得到的结果均在复用考虑之列【l”J。软件复用更为广义的理解是把软件开发过程中得到的知识、经验和过程等一切相关事务,都列入复用的范畴【103】。!:;2复用的级别软件复用的一个关键因素是抽象。抽象是对软件可复用对象的提炼和概括,即从}I体的语言、环境和其他细节中提炼出来。软件的复用性很大程度上取决于对可复用对象的认识深度或者说可复用对象的抽象层次。抽象层次越高、与具体环境和特定细节越无关,则它被未来系统复用的可能性也越大。作者按抽象程度将复用级别从低到离分成如下三个层次:11源代码级复用子程序库的概念应该算是最早的源代码复用,数学程序库就是源代码的复用技术惟常成功应用。近年来,面向对象技术(Object—OrientedTechnology)逐步成为主流波术.它大大提高了源代码的易读性、可维护性和可重用性。随之而来的设计模式 第二章面向监测和诊断领域的软件体系结构研究(DesignPattern)则使源代码的复用进入了一个新的时代,它为我们提供了特定场景下解决一般设计问题的类和相互通信的对象的描述,使面向对象设计更灵活、优雅,最终复用性更好。此级别的复用一般属于白盒复用(White—BoxReuse)。21二进制级复用二进制级复用在经过了静态链接库和动态链接库阶段后,现在进入了组件模型阶段。组件是指系统中可以替换的物理部分,该系统封装了实现并提供了一组接口的实现【1041。组件模型是关于开发可复用软件组件和组件之间相互通信的一组标准的描述。目前三种主流的组件模型分别是Microsoft的组件对象模型(ComponentObjectModel,COM)、OMG的公共对象请求代理体系结构(Common0bjectRequestBrokerArchitecture,CORBA)和Sun的企业JavaBeans(EnterpriseJavaBeans,EJB)。通过复用已有的组件,基于组件模型的软件开发者可以像搭积木一样快速构造应用程序。这样不仅可以节省时间和经费,提高工作效率,而且可以产生更加规范、更加可靠的应用软件。此级别的复用一般属于黑盒复用(Black—BoxReuse)。31体系结构级复用可复用的软件体系结构是针对问题域的某些事物或某些问题的抽象程度更高的解决方案,受设计技术及实现条件的影响很少,所以复用的机会更大。它能够在具有相似需求的多个系统中发生影响,比源代码级复用和二进制级复用有更大的好处。当前针对特定领域的体系结构(Domain—SpecificSoftwareArchitecture,DSSA),人们开展了许多研究和实践工作。另外,软件体系结构有利于形成完整的软件生产线,1976年Pamas就提出了发展软件族的软件生产线概念。现在,软件开发正由过去的“算法+数据结构”演变成为“组件开发+基于体系结构的组件组装”。2.3.3复用的益处首先,通过提高软件生产率而降低软件生产的代价。工业化社会物质财富迅速增长的原因之一就是在工业化生产中可以大批量的复制各种产品。标准零部件生产业的独立存在和发展是产业形成规模经济的前提,机械和建筑等行业的发展过程均证明了这种模式的可行性和正确性。同理,软件的复用达到一定的规模后,同样也可产生如此的规模效益。实现软件多层次复用是软件产业工程化的必由之路。在某些情况下,复用的设计方案本身也许不是最适合该系统,但从熬体上权衡,通过复用带来的成本节约和质量提高能够让复用变得非常有价值。其次,提高软件质量。因为可复用组件的质量保证工作一般比非复用组件的质量保证更为严格和充分。当组件被大量使用时,得到了反复的考验,它的错误将被更早的发现和排除。因此,可复用组件一般都具有较高的质量和可靠性。其他方面的益处诸如,使用相同的组件(尤其是用户界面组件)的系统将对用户体现较多的一致性,并具有较好的互操作性;推动标准化工作,使分析、设计、开发 申请上海交通戈学工学博士擘位论文“i洲0试整个过程都趋于一致;支持原型开发,因为组件库中的组件可以为尽快地构造个系统原型提供有效支持。2.4软件体系结构与DSSA的概述由于软件复用的层次越高,所带来的收益越大。因此,作者本章主要从软件体系tli卡句复用的角度,针对基于Internet的远程监测和故障诊断系统的软件体系结构进行琛人的研究。14I软件体系结构的发展从最初的模糊概念发展到今天成为--I"7日益成熟的技术,软件体系结构(SoftwareArchitecture,SA)技术主要经历以下四个阶段【1∞】[105】【106]:一“无体系结构”阶段:20世纪70年代以前,主要采用汇编语言,系统规模较小,很少明确考虑体系结构。_萌芽阶段:20世纪80年代以前,主要采用结构化开发技术,系统规模一般,。i明确考虑体系结构,采用自顶向下逐步求精的设计并注意了模块的耦合性。_初级阶段:20世纪90年代以前,主要采用面向对象开发技术,系统规模大且疆杂性高,从多角度对系统建模,体系结构的研究逐渐得到重视。囊高级阶段:20世纪90年代后,主要采用基于组件的开发技术,系统为大规模、’j布式、软硬件密集型系统,软件开发的中心是描述系统高层抽象结构模型,该阶段以‘‘4H’7模型为标志【Ⅲ】。当然软件体系结构仍然存在诸多问题,还有待于进一步的研究、发展和完善。2.4.2软件体系结构的概念⋯裔,软件体系结构处在发展期,学术界还未形成统一意见,不同的学者有不同的看法。F面按照时间的先后顺序,介绍几个具有代表性的定义,其余概念详见文献f105】。11IEEE610.12.1990软件工程标准词汇中的定义SA=(components,form,rationales),体系结构是以组件、组件之间的关系、组件,。环境之间的关系为内容的某一系统的基本组织结构,以及指导上述内容设计与演化的原理。21Perry和Wolf的定义‘1。8]SA=(elements.form.rationales),软件体系结构是在专有特性和关系的基础上由一泪元素构成的。专有特性用于限制软件体系结构元素的选择,关系用于限制软件体系结构元素组合的拓扑结构。而在多个体系结构方案中选择合适的体系结构方案住往是搐于一组准则。 第二章面向监测和诊断领域的软件体系结构研究3)Garlan和Shaw的定义‘m1SA=(components,connectors,constrains),组件可以是一组代码,如程序的模块,也可以是一个独立的程序,如数据库的SQL服务器。连接件是软件体系结构的一种抽象成份,用它来表示组件之间的相互作用,体系结构还包括某些限制。41Bass、Clements和Kazman的定义⋯ojSA=(structures,components,properties,relationships),它是系统的一个或多个结构,包括软件组件、组件的外部可视属性和组件之间的关系。5)Booth、Rumbaugh和Jacobson的定义⋯11SA=(elements,subsystems,frameworks,styles),软件体系结构是一种将由结构元素和行为元素组合构成的予系统组织在一起的框架风格。它描述了这些元素及其接口、以及它们之间的协作和组合。综上所述,虽然各种定义都从不同角度描述软件体系结构,但都涵盖了诸如组件、组件之间的交互关系、使用限制、设计原则和选择准则。考虑到一般的适用性和被广泛接受的程度,本文后续章节里,如果不特别指出,作者所提到的“软件体系结构”,都以定义5的概念为基础。2.4.3软件体系结构的研究状况SA作为软件工程研究的一部分,现在已经获得了长足的发展。目前,SA的主要研究领域有以下几个方面:_体系结构理论模型的研究一体系结构描述研究一体系结构设计研究一体系结构分析与验证·基于体系结构的软件开发过程·提供特定领域的体系结构框架国内外有许多高校、研究机构成立了专门的SA研究课题组,按不同的研究思路,可以将他们分为学术界和工业界两派。学术派侧重于SA的各种形式化理论研究,希望使SA有一个完善的理论基础;而工业派则更务实,他们关心如何将SA直接应用于软件工程实践,最具代表性的思路是将UML可视化建模技术用于SA的表示。2.4.4特定软件领域体系结构.DSSA在一个领域中,不同系统及同一系统的不同版本之间在体系结构上存在的相似性,甚至有许多共同的组件,这是非常有利于迸行软件复用的,DSSA主要就是研究这个领域的问题。C.Braun等人在1993年提出了DSSA的概念,并指出对基于DSSA的软 申请上海交通大学工学博士学位论文件开发,应采用新的软件生命周期观点,研究符合其特点的软件开发过程(“”。DSSA是针对领域模型中的领域需求给出的解决方案,是一个领域中所有应用系统所共有的体系结构,也是识别、开发和组织特定领域可复用组件的基础。2.4.4.IDSSA的发展DSSA最早是由美国国防部的高技术局(DefenseAdvancedResearchProjectAgency,DARPA)倡导的。它通用于领域中的各系统,体现了领域中各个系统的共性,它通过领域分析和建模得到软件参考体系结构,为软件开发提供了一种通用基础,能够提高软件开发效率。1991年7月美国国防部的DARPA发起的DARPA—DSSA计划将DSSA的研究推想了一个新的高潮。整个计划分成6个独立项目,其中4个应用于特定的军事领域,2个是针对特定领域软件开发基础技术研究。该计划由军方、工业界、学术界紧密合作,开发了许多软件开发领域的参考体系结构和设计分析工具,如航空电子、指挥j|矗控、CNC(引导、导航和控制)、适应性智能系统等。DARPA—DSSA的主要几个研究成果如下:HonywellAJmd:为智能GNC(Guidance,NavigationandContr01)系统开发了快速说明和自动代码生成器、ControlH、MetaH以及一个高级实时操作系统.并应用于NASA飞行控制系统的导弹体系结构部分。IBM/Aerospace/MIT/UCI:开发了一个航空电子系统体系结构以及大量工具[包含形式化描述工具),可以使需求定义的生产率提高10倍。Teknowledge/Stanford/TRW:开发了一个基于事件的、并发的、面向对象的体系结构描述语言RAPIDE及其开发环境。USC/ISI/GMU:开发了一个自动代码生成器和其他工具,并应用于NRaD消息代理系统中,使生产率提高了100倍。从1992年开始,各参与方陆续发表了大量的研究成果,带动了一批相关研究项目的开展,从而将软件体系结构的研究提升到一个新的高度。2.4.4.2DSSA的概念对DSSA研究的角度和关心问题的不同,导致了对DSSA的不同定义。Hayes—Roth的定义为:DSSA是专用于一个特定类型的领域的、在整个领域中能有效使用的、为成功构造应用系统限定了标准的组合结构的软件组件的集合。Tracz的定义为:DSSA是一个特定的问题领域中支持一组应用的领域模型、参考需求、参考体系结构等组成的开发基础,其目标是支持一个特定领域中多个应用的生成。DARPA的定义为:DSSA是软件组件的一个集合,以标准的结构组合而成,对于 第二章面向监测和诊断领域的软件体系结构研究一个特殊类型的领域是通用的,可用于有效地、成功地建立一个系统。综上所述,DSSA的简明定义是:在一个特定应用领域中,抽象出该领域典型的可复用元素,为一组应用提供组织结构参考的标准软件体系结构。2.4.5DSSA与体系结构风格的关系DSSA是考虑软件开发的特定领域背景,通过对领域内结构共性的描述,抽取该领域的软件体系结构,来达到领域内复用的目的。体系结构风格是对己有的应用中一些常用的、成熟的、可复用的体系结构进行抽象形成的,它的通用性较好,不限于某一应用领域。DSSA和体系结构风格是互私的两种技术:DSSA只对某一个应用领域迸彳亍设计专家知识的提取、存储和组织,但可以同时使用多种体系结构风格;当在某个体系结构风格中进行体系结构设计专家知识的组织时,可以将提取的公共结构和设计方法扩展到多个应用领域。在大型的软件开发项目中,基于领域的设计专家知识和以风格为中心的体系结构设计专家知识都占有重要地位。在具体系统开发过程中,应当根据实际需要选择适用的体系结构风格和DSSA,进行系统级的体系结构重组,达到系统级的复用。2.5统一模型语言的概述由于本文更关心如何将DSSA直接应用于基于Internet的远程监测和故障诊断系统设计和开发,作者便采用工业界最具代表性的思路,将UML应用于DSSA的表示。UML是一个用于描述、可视化、构造和文档化软件系统的语言。它记录了对正在构造的系统的各个层次理解,它同样适用于商业建模和其他非软件系统建模,在大规模复杂系统建模中的成功应用是最好的说明t104】【ll”。2.5.1UML的发展从1967年的第一个面向对象的语言Simula-67出现开始,到80年代初Smalltalk语言的广泛使用,人们在传统的软件结构化分析和设计方法上也掀起了~场“面向对象运动”,各个方法论学者采用不同的方法进行丽向对象分析和设计,在70年代中期到80年代末期之间出现了面向对象建模语言。另外,诸如实体关系建模(Entity—RelationshipModeling,ERM)、说明与描述语言(Specification&DescriptionLanguage,SDL)等其他一些技术也对面向对象建模语言产生了影响。在1989至1994年间,建模语言从原来的不足10种增加到50种以上,其中最著名的是GBooch的Booch,93方法、I.Jacobson的OOSE方法和J.Rambaugh的OMT-2方法。面对众多的建模语言,用户发现很难找到一种完全满足他们的要求,每种方法都被认为各有优缺点。一般说来,Booch’93方法在项目的设计和构造阶段的表达能力特别强,适用于工程密集型应用;OOSE方法是一个面向用况的方法,它对商业工程和需求分析提供了 申请上海交通大学工学博士学位论文良好的支持;OMT-2方法对于分析和数据密集型信息系统非常富有表现力。1994年10月Rational软件公司的GBooch和J.Rumbangh开始着手将各自的方法结合起来成为一种新方法。同年秋天,I.Jacobson也加盟Rational软件公司并参与了统一行动。1995年10月发布了第一个版本UM0.8(UnifiedMethod)。由于统一行动的产物只是一种语言,从1996年6月的第二版开始改称为UML0.9。UML进化历程见图2—2。图2-21M.的发展历程Fig.2·2EvolutionofUML2.5.2UML的特点和目标UML的特点如下:一UML是对Booth、OMT、OOSE、其他面向对象方法和许多其他方法的一个进化,这些来自于众多学者的方法(还包括非面向对象方法影响)组成了UML中许多不同的元素,诸如:Statechartdiagram(状态图)、Activitygraphdiagram(活动图)、Sequencediagram(顺序图)、ObjectConstraintLanguage(对象约束语言)。_UML对Booch、OMT和OOSE的语义和符号作了许多局部改进,诸如:Usecasediagram(用况图)、Classdiagram(类图)、Implementationdiagram(实现图)、Collaborationdiagram(协作图)。 第二章面向监测和诊断领域的软件体系结构研究■UML从对象建模和计算机科学实践中选择和集成了最好的概念。●UML在演化过程中还不断增加了许多新概念,诸如:ExtensibilityMechanism(扩展机制)、Stereotypes(构造型)、TaggedValues(标记值)、Constraint(约束)、Thread(线程)、Process(进程)、Distribution(分布)、Concurrency(并发)、Refinement(精化)、Interface(接口)、Component(组件)。UML的目标是:使系统建模(并不仅是软件)能使用面向对象概念;对于概念系统或实际系统,建立一个清楚的联系;从事复杂的关键性系统的规模性继承的研究;创建一种适用于人和机器的建模语言。2.5.3UML工具简介就像MSVisualc++是使用cH语言实现面向对象程序设计的工具一样,UML语言也需要通过一个工具去实现可视化面向对象的建模。目前,国外已经有大量的CASE工具在不同层次上提供对UML的支持,国内的CASE工具有青鸟CASE系统、PlayCASE系统等,主要的UMLCASE工具见表2一l。袁2—1主要的UMLCASE工具Tab.2.1MaintoolkitsforUMLCASE三墨垒里Argo/UMLrFtee)TigrisRationalRose2003RationalSoftwareGDProAdvmacedSoftwareTechnologiesSELECTEnterprisePrincetonSoflechTogetlferTogetherSoRWithClassMicroGoldSystemArchitect2001PopkinSoftwarePtatimtmParadigmPlusComputerAssociatesSoftwarethroughPictures/UMLAonixVisio2003MicrosoftMagicDrawUMLNoMagicPowerDesigner9.5sybaseVisualUMLVisualObjectModeletsUMLStudioPragSoftⅣISl0NObjectInsightSoflModelerSofteraUMLStudioStingray(RogueWave)Objecteering/UMLSOFTEAMMetaEdit+MetaCaseConsulting青鸟CASE北京大学软件工程研究所兰!型兰垒塑生里型兰堕鎏里旦垫些巫塞盟支持UML的CASE系统一般包括创建和管理UML图、各种语言的支持代码框架生成,以及将源代码通过逆向工程加入到UML中等等。由于三位UML主要设计者都加盟了Raftonal软件公司,使RationalRose在众多的UML系统中更是具有了领导地位。 中请上海交通大学工学博士学位论文2.6面向监测和诊断领域软件体系结构模型的研究设备监测与故障诊断系统属于一种大规模分布式的软硬件密集型系统,其中的各个组成部分一般都是基于第三方的专有技术。以构建监测和诊断系统的基础设备——数据采集系统为例,其数据格式通常依赖于工业过程、现场总线或开发平台。当前有很多数据采集系统的标准,诸如OPC(OLEforProcessandContr01)、M(InterchangeableVirtualInstrument)、ODAS(OpenDataAcquisitionStandard)等,但它们都不具备广泛接受的API(ApplicationProgrammingInterface)。作者认为:不论采用何种技术实现的设备状态监测与故障诊断系统,它们都遵循同一个高层次抽象的领域模型,存在一个通用的适合于监测和故障诊断专向领域的软件体系结构模型。通过结合IRMFDS开发的实际案例,作者提出了一个MODOSA模型。它主要包括六个部分:用例模型、领域模型、对象模型、动态模型、组件模型和部署模型。由于论文篇幅的限制,文中的IRMFDS模型做了一定的简化,但是足以说明那些在建立MODOSA过程中需要面对的实际闯题。本节主要侧重与MODOSA的用例模型、领域模型和对象模型的研究,至于动态模型、组件模型和部署模型,由于与具体的设计相关,作者将在第五章中进一步讨论。2.6.1IRMFDS的问题域描述IRMFDS是一个软硬件集成的系统,它为企业提供了一个实现企业专家和研究机构专家在Intemet上进行信息交互的平台。作者提出了如图2—3所示的IRMFDS拓扑结构模型,整个系统包括:一个远程诊断中心(RemoteDiagnosisCenter,RDC)、多个企业监测中心(EnterpriseMonitoringCenter,EMC)、隶属于不同EMC的众多企业监测站(EnterpriseMonitoringUnit,EMU)以及许多授权专家和用户。图2.3IRMFDS的拓扑结构模型Fig.2-3TopologicalstructuremodeloflRMFDS 第二章面向监测和诊断领域的软件体系结构研究2.61.1企业监测站一EMUEMU通常安景于关键设备附近,负责从各种现场传感器上搜集被监测设备工作级的数据,通过预处理转化为知识级数据,根据来自EMC的预定义报警水平产生实时报警。EMU的主要特点是使用高速现场总线、数字信号处理芯片(DigitalSignalProcessingChip,DSPC)和追忆硬盘,它们保证了系统的高精度、实时性和高可靠性。EMU的主要功能如下:一数据采集:一个数据采集系统(DataAcquisitionSystem,DAS)通过高速现场总线从传感器或其他监测系统中获取实时数据。输入信号包括转速信号、振动量信号(例如,加速度、速度和位移)和工艺量信号(例如,温度、流量和压力)。它可以支持关键设备的不同运行状态,诸如稳态运行、启停车等。一数据预处理:DSPC被用于快速处理采集的大量数据,从数据中抽取各种特征信息,诸如频谱、基本的数字特征(例如,均值、均方根、总值、峰峰值等)。·在线报警:当数字特征超过了期望值或预定义的运行极限值时,产生报警。_数据备份:为了发生故障后能查询发生故障时的指定数据,所有的实时数据均以循环地写入本地硬盘中的环状数据文件内。此备份硬盘的功能类似于飞机上的“黑匣子”。EMU由一个控制计算机、一个高速DAS、多个信号调理器和众多传感器组成。基于高速现场总线的DAS从传感器采集实时数据。数据中的信息被用于评价被监测设备的状态,诊断机器故障的种类、位置和严重程度。控制计算机通过高速总线从DAS中获取数据,数据处理后经过In仃anet被上传至EMC。2.6.j.2企业监测中心.EMCEMC位于企业研究中心,负责控制和管理分布于同一个Intmnet内的多个EMU,设置系统功能参数,存储和可视化监测数据,处理和分析数据,丛数据中抽取特征,诊断常见故障。EMC的主要特点是使用成熟的监测和诊断技术,以便避免灾难性故障。EMC的主要功能如下:●用户管理:任何匿名用户都允许注册后成为EMC的普通用户。系统管理员根据系统管理规定对他进行授权。根据授权,用户可以访问EMC的指定功能。·远程监测:任何授权用户都可以通过Intranet和Intemet监测关键设备的状态。用户可以浏览各种实时系统数据,诸如时间波形、趋势、轴心轨迹、频谱、瀑布图及整机组态图等。用户也可以分析历史数据,输出各种机器状态的报告。当EMU提交报警信息到网络数据库后,计数报警指示器将自动更新显示。一故障诊断:任何授权专家不仅可以根据计划评估被监测设备的健康状况,而且也可以根据报警记录诊断指定的历史数据。在EMC的知识库的基础上,他可以使用多种故障诊断技术(例如,基于案例的诊断,基于规则的诊断等)。 中请上海交通大学工学博士学位论文一设备管理:任何授权用户可以建立工厂信息树,从而管理不同地点的车间和关键设备。有大量的信息与设备关联,诸如维护计划、诊断记录和维护记录。他可以查看传感器在设备上的安装位置,评估设备当前的健康状况,预测未来一段时问的状态或使用寿命。最终,用户可以实现基于状态的维护(CBM)。2.6.1,3远程诊断中心.RDCRDC位于大学或其他研究机构,负责提供监测方法和诊断算法方面的技术支持。主要特点是测试各种最新的信号处理方法和故障诊断理论,为各种先进信息处理理论在企业中的应用做准备。RDC的主要功能如下:■用户管理:此功能与EMC中的用户管理功能类似。●远程分析:对于任何授权用户,当本地没有一些先进的信号分析算法或信号分析系统时,他可以通过使用RDC中提供的分析功能来处理自己的数据。RDC提供结果数据和相应的报告。一透程诊断:任何授权用户可以上载故障数据,使用RDC提供的诊断功能进行设备故障诊断。他也可以提交一个请求,由RDC的专家协助诊断上载的数据。所有的诊断功能都依赖于RDC自身的知识库。一组件检索:RDC中的组件库用于发布RDC软件开发组开发的各种组件,任何授权用户在组件库中检索所需的组件,然后登记下载组件用于构建自己所需的应用。通过专向领域组件库,RDC支持了本领域内不同层次的软件复用,从而推进先进信息技术在企业中的推广。从图2.3可以看出,授权的企业专家可以通过Internet上载数据到RDC,请求RDC的专家协助其分析故障数据。授权的RDC专家可以通过]ntemet使用EMC提供的各种远程监测和诊断功能,同样也可以使用RDC提供的各种分析和诊断功能。RDCA、EMCA和EMCB组成了一个IRMFDS组,称为IRMFDSA。在这个组中的授权用户能共享所有的资源,诸如专家、硬件和软件系统。它们共享RDCA中的知识库。通过Intemet,EMCA和EMCB可以互相交换彼此具有的知识。最终,IRMFDSA、IRMFDSB和Iln仃DSC构成了一个巨大的协作诊断网络。此网络内的授权用户可以使用RDC中提供的诊断结果集成工具去融合来自于不同RDC的诊断结果。隶属于不同RDC的软件开发组将持续开发新的组件包(例如,图形的或算法的),不断地更新和升级诊断网络,从而使整个诊断网络具有良好的适应性和扩展性。2.6.2IRMFDS的用例模型在UML中,用例模型(UseCaseModel)是一种既能捕获商业处理流程又能捕获大多数系统行为的有效方法。用例分析的任务就是识别参与者(Actor)和用侧(UseCase)。参与者是直接与系统相互作用的系统、子系统或类的外部实体的抽象概念【1⋯。主要是人、设备和外部系统。用例是描述一个参与者使用系统完成某个过程时事件发 第二章面向监测和诊断领域的软件体系结构研究生顺序的功能性单元【⋯]。使用用例可以增进对领域分析的理解,它是对领域过程的一种形式化叙述。2,6.2,1参与者模型通过确定参与者,作者力图明确IRMFDS的范围阻及与外部世界的接口;同时也为进一步控制不同参与者的角色和权限,最终确定系统访问的安全机制做准备。图2-4是IRMFDS的参与者模型,表2.2是参与者的具体描述。表2.2参与者的描述Tab.2-2Descriptionofactor名称描述研究机构专家估,提交诊断结论,并通过电子自5件通知企业用户。在BMC中注册,挤助企业专家诊堑堡量塑堕!专家企业级专家和研究机构专家的抽象。设备管理员茬_蔓Mc中管理设备信息,组态设备机组和虚拟测点,配置EMU的各种参数:根据设备健康状况和专家建议,用电子邮件通知企业级专家进行会诊或通知设备维护员进行设备维护员萎嚣曩鲁?抽象口在收到设各管理员的维护电子邮件通知后,进行现场维护,并提设备操作员使用EMU进行现场数据采集,并可以根据现场情况修改EMU的各种耋兰数。一一一系蕴管理员使用EMC或RDC中的对系堡用户进j驾理,壁室甩左边塑壑堕!{i二白注册于EMC中的普通用户可以进行设备状态监测;注册于RDC中的普通用户可以使84⋯7用远程分析和故障诊断功能。匿名用户可以在RDC中试用远程分析功能。一磊i≯言奏菇妻?姒虱骼韶氪潞缈戥潞排虱黝馘跚黼用系匿数据采集系统设各操作员组件开发人员设备维护员图2_4IRMFDS的参与者模型Fig.2_.4Actormodelof琢A伍DS-28. 中请上海交通太学工学博士学位论文2,6.2.2EMU的用例模型用例从参与者的角度描述了它与系统之间的交互,其中不涉及任何系统内部工作方式,也没有用户界面的任何细节描述。图2—5显示了EMU的高层用例模型,各用例的描述见表2—3。表2—3数据采集的用例Tab.2—3Usecasgofdataacquisition用例名称参与者描述管理姒s信息设各操作员羡絮麓勰篇錾黧誉焉’慧嚣需瑟篷黔5各种参数’管理采集参数设备操作员委爹皇嚣嚣霎霾兰篱慧?置状况’操作员可根据现场情况更改参管理报警参数设备操作员委箩皇袭墨£霎委墨芏娑型:毖爹设置状况’操作员可根据现场情况更改参执行数据采集设备操作员委笑黎誓莩嚣委‰蠢搬喜黧愁蕊奏瑟赫。将实时数据记二互垂垂亘蔓臻二二!坚生二二委垂塑堂塞堕囹囹鳗塑!壅王塞堕!!|燮!记录实时数据一系统将实时数据记录入本地存储器。i磊磊飞熏r磊磊赢赢磊赢鬲磊赢⋯——2.6.2.3EMC的用例模型根据EMC的问题域描述,作者认为主要分成三个用例包:设备管理、状态监测和故障诊断。由于用户管理的用例模型现在已经很成熟,此处不在做进一步研究。图中<>为包含关系,表示了基用例和包含用例之间的关系。基用例可以看到包含用例,并依赖于包含用例的执行结果l“”。图2-6显示了设备管理的高层用例模型,各用例的描述见表2-4。图2-5数据采集的用例模型Fig,2—5Usecasemodelofdataacquisition图2-6设备管理的用例模型Fig.2—6Usecasemodelofequipmentmanagement 第二章面向监测和诊断领域的软件体系蟾构研究登录蓑蓉墓雾i使用EMc提供的帐号登录系统。管理企业设备设备管理员星籍巯㈣掣茏星燃芦理粥从崩骼队8图2—7显示了状态监测的高层用例模型,各用例的描述见表2-5。袁2.5状态监测的用倒Tab2.5Usecaseofconditionmonitoring图2-8显示了故障诊断的高层用例模型,各用例的描述见表2-6。 中请上海交通大学工学博士学位论文2.624RDC的用例模型图2-9显示了RDC的高层用例模型,各用例的描述见表2—7。由图可知,RDC可以看成是EMC中设备管理、监测和诊断的部分用例的组合,并添加了一些与组件库相关的用例。图2.7状态监测的用例模型Fig.2-7Usecasemodelofconditionmonitoring图2.8故障诊断的用例模型Fig.2—8Usecascmodeloffaultdiagnosis表2—7RDC的用例Tab.2.7UsecaseofRDC 第二章面向监测和诊断领域6々软件体系结构研究查询下载组件注册用户磊亲案?库中提供的各种组件’并根据需要对其下载;也可提交开友新组件管理组件库组件开发人员薯暑嚣c中的组件库’根据企、业用户或专家的请求’渤口、删除和升船各图2.9RDC的用例模型Fig.2-9UsecasemodelofRDC2.6.3MODOSA的领域模型在IRMFDS用例分析的基础上,通过对监测和诊断系统的共同应用领域进行系统化的分析,作者希望以建立MODOSA的领域模型来发现该领域的共同认识、需求及其应用系统的共同特征。领域模型(DomainModel)是一组刻画概念(对象)的图形。它不是对软件组件的描述,它表达了真实世界中问题域内的概念【114】。在UML中,领域模型是用静态结构图(StaticStructureDiagram)来表达,模型中不定义操作和方法。这个模型提供了一种对概念和它们的重要关系的有用描述,形成了后期研究和确定解决方案工作的基础。为了避免和软件类图混淆,作者使用构造型>表示了一个用于问题域描述的概念实体,它不代表设计意义上的类或对象,不代表软件元素。 申请上海交通大学工学博士学位论文在这部分中,作者提出了IRMFDS的一个领域模型,它覆盖了本领域与监测和诊断相关的主要概念。为了将细粒度的概念用更高的抽象程度来组织,需要将模型中的概念划分成更小的子集用UML中的“包”来管理。作者将所有概念分成四个包。图2.10显示了这些包及其它们之间的依赖关系(有向虚线)。在本节的后续部分,作者将详细描述每个包中的概念。毋一目图2.10领域概念包Fig.2·10Domainconceptpackage·Core(核心)包:此包的作用在于组织了与被监测机器相关的所有概念。以Machine(机器)为中心,将MeasurementPoint(测点)、SampleData(采集数据)、Knowledge(知识)、FaultCase(案例)等诸多其他包中依赖的关键概念有机地组织成为一个整体。·DA(数据采集)包:组织了所有和数据采集系统相关的概念。DAS(数据采集系统)概念描述了一个现实世界中与被监测机器相关联的数据采集系统。·KA(知识获取)包:组织了所有和知识获取相关的概念。K_AcquisitionMethod(知识获取方法)概念描述了一个现实世界中与指定Machine相关的故障诊断知识获取过程。·FD(故障诊断)包:组织了所有和故障诊断相关的概念。InferenceEngine(推理机)概念描述了一个现实世界中与指定Machine相关的故障诊断过程。2.6.3.1核心包在2.5.2节用例分析基础上,作者提出了如图2一ll所示的核心概念领域模型。~个现实世界中的工厂、车间和机器分别对应概念Factory、Workshop和Machine。每个Machine都拥有0至多个HealthCard(健康卡)、MaintenanceCard(维护卡)和AlarmCard(报警卡)。一个Machine拥有0至多个MeasurementPoint(测点)。MeasurementPoint概念又同SampleParameter(采集参数)、AlarmParameter(报警参数)、AntiAliasingFilter(抗混滤波器)和Transducer(传感器)等概念联系在一起。FaultCase(案例)概念保存着Machine已确诊的故障实例,可用于知识获取和基于案例的诊断。Knowledge(知识)概念存放着己获取的知识,主要用于基于知识的诊断。SampleData(采集数据)概念描述了与Machine相关的原始监测数据。Knowledge还 第二章面向监测和诊断领域的软件体系结构研究可进一步分成特征知识、规则知识、模型知识和神经网络结构知识四种概念。图2.11核m概念的领域模型Fig.2-11Domammodelofcoreconcepts2.6.3.2数据采集包如图2.12所示,DAS与Core中的Machine一一对应。一个现实世界中的数据采集系统是概念DAS的一个实例。每个DAS都是在一种仪器总线(诸如,VXI或PXI等)基础上由多个模块组成(诸如,控制模块、采集模块等),每个模块都由相应的DASDriver(DAS驱动程序)实现驱动。每个DAS拥有一个至多个Channel(数据采集通道),每个Channel与Core中的MeasurementPoRt一一对应,采集参数和报警参数均来自于预定义的MeasurementPoint。当Channel的值超过了预定义的报警参数时,DAS在与Machine关联的AlarmCard进行记录。42一12数据采集的领域模型Fig.2·12Domainmodelofdataacquisition2,63.3知识获取包如图2—13所示,根据指定的Machine取出FaultCase,当FaultCase中存储的是特 中请上海交通大学工学博士学位论文r正值时,KAcquisitionMethod(知识获取方法)直接对其进行知识获取;否则先采用FExtractMethod(特征提取方法)进行特征提取,得到FeatureData(特征数据),然】再再进行知识获取。最后,使用指定的EvolutionMethod(评价方法)进行评价,达刮接受指标后存放于指定Machine的Knowledge中。其中,KAcquisitionMethod又派。一出AutoKA(自动知识获取方法)和InteractiveKA(交互式知识获取方法)两种概念。图2—13知识获取的领域模型Fig.2—13Domammodelofknowledgeacquisition2.6.34故障诊断包如图2.14所示,首先根据指定的Machine取出SampleData,使用指定的FEx仃actMctllod获得待检的FeatureData。然后,根据选择的InferenceS似egy(推理策略)和(?ontrolStrategy(控制策略),InferenceEngine(推理机)对FeatureData进行诊断。Ⅷ曝InferenceStrategy选择基于案例的推理时,InferenceEngine需要从Machine中取出FaultCase,根据FaultCase的数据类型决定是否需要采用FEx仃actMethod。如果InferenceS廿ategy选择基于知识的推理时,InferenceEngine需要从Machine中取出K【_lowledge用于诊断。诊断结论由ExplainEngine负责解释,并记入Machine的HealthCard中。图2.14故障诊断的领域模型Fig.2-14DomammodeloffauttdiagnosisⅦ3.5MODOSA领域模型的全貌MODOSA的总体领域模型见图2.15。它显示了MODOSA高层次抽象概念的全貌, 第二章面向监测和诊断领域的软件体系结构研究为MODOSA对象模型建立了概念基础。图2—15MODOSA领域模型的全貌Fig.2—15CompletedomammodelofMODOSA2.6.4MODOSA中关键的对象模型由于领域模型仅是一种描述工具,用来帮助设计者记录他们的决策以及相互之间的交流是非常重要的。领域模型中的对象未必对应于软件的面向对象设计,这样对应也是没有太大的价值【1151。在对象系统中,Jacobson将类分为三种原型(Stereotype):一实体类<>:代表了应用程序的核心概念,用于常时间的保存应用程序的实体,同时提供驱动应用程序中大多数交互服务。它覆盖了目前所有的用例文档。·接口类<>:充当那些想要和应用程序之间发生作用的外部活动者和实体类之间的屏障。大多数是用户接口组件,一般采用表单或屏幕显示方式与应用程序交互,这是又可称为边界类<>。组件封装时也常会见到接口类。·控制类<>:将事件的过程联系在一起,担负起应用程序领域中与其他对象通信的任务,它通常是临时性的。将类分成三种类型可以使应用程序更能适应改变。这些改变可能是由于市场的动态改变引起,或者是希望用不同的方式查看应用程序中的信息。因此,为了能够设计出可复用的软件体系结构,首先需要在MODOSA领域模型中客观存在的各项概念的基础上,采用OOA和设计模式技术,建立高聚合、低耦合的MODOSA实体类模型。作者认为:任何一种状态监测和故障诊断系统中数据集在各部分之间“流动”,它 申请上海交通大学工学博士学位论文是一个非常重要的对象,将它独立研究有助于系统的不断演化;一个系统必须具有一个被监测设备(诸如,压缩机、透平机或复杂机组等);每个被监测对象都需要一个数据采集系统(诸如,基于VXI总线采集系统或基于PXI总线采集系统等)进行监测;任何~种监测和分析方法都是基于某种具体的工程信号处理的算法,由于现代信号处理技术的不断发展,工程信号处理方法也在不断变化;随着人工智能、机器学习、数据挖掘和专家系统技术的不断发展,故障诊断方法以及诊断中用到的诊断知识的获取方法也在不断的发展。因此,基于上述的理解,作者总结出以下几种关键的对象模型。2.6.4.1数据集的实体类模型根据图2-1l和2.13所示,对于SampleSet、CaseSet、FeatureSet、HealthCard、AlarmCard、MaintenanceCard和Knowledge七个与数据相关的概念进行对象建模。所有这些概念都是一种数据集,而此数据集又是由多条记录组成的,可以考虑采用设计模式中的COMPOSITE模式,见图2一16所示。Record类(记录类)是一个采用“部分一整体”关系的层次结构,关键是抽象类Record,这使得类Numerical(数值型记录类)、Event(事件型记录类)、Rule(规则类)和一个组合类DataSet(数据集类)具有一致性。一个现实世界中的数据集(例如,样本集)就是Record的派生类DataSet的一个实例。其中,Event用于实现HealthCard、AlarmCard和MaintenanceCard三个概念;Numerical用于实现SampleSet、CaseSet、FeatureSet、特征知识和神经网络层这五种概念,属性tagType用于区分概念类型。QuantVal类(规则质量指标类)用于规则的评价。如果有新的数据类型需要加入,仅需继续再Record类上进行派生即可。图2.16数据集的实体类模型Fig.2—16Entityclassmodelofdataset2.6.4.2设备的实体类模型根据图2一儿,对Factory、Workshop、Machine、MeasurementPoint、Transducer、 第二章面向监测和诊断领域的软件体系结构研究AntiAliasingFilter、SampleParaTab和AlarmParaTab八个与设备相关的概念进行对象建模。Factory、Workshop、Machine和MeasurementPoint所有这些概念都存在一种组成的关系,同样可以考虑采用设计模式中的COMPOSITE模式,见图2—17所示。Component类(部件类)是一个采用“部分一整体”关系的层次结构,关键是抽象类Component,这使得类MPoint(测点类)、组合类Machine(机器类)、组合类MachineSet(机组类)、组合类Workshop(车间类)和组合类Factory(工厂类)具有一致性。由于每个机器都有一个对应的机器筒图,为了将机器简图的实现和抽象分离,解除简图绘制和机器对象之间的耦合,作者根据BRIDGE模式设计了一个抽象类MachineDigramlmp(机器简图实现类),其下派生了CompressorDiagram(压缩机简图类)和MotorDiagram(电机简图类)作为各种机器简图具体实现。另外,作者从Transducer、AntiAliasingFilter、SampleParaTab和AlarmParaTab概念中抽象出了Parameter模板类(参数模板类),参数key和T用于定义具体的参数名称和对应值。Parameter有两个派生类:Transducer(传感器类)和AttachManager(绑定管理器类),Transducer类用于定义的工程单位和标定值,AttachManager类用于将测点与采集系统进行绑定。MachineSet通过实例化Data::DataSet为对象mainteanceSet来管理机器维护记录,通过实例化DA::DAS为对象itsDAS来管理数据采集系统。图2—17设备的实体类模型Fig.2—17Entityclassmodelofequipment2.6.4.3数据采集的实体类模型根据图2.11,提出了如图2.18所示的数据采集系统类模型。Module类(仪器模块类)与EM::Machine关联,从而可以获得各种参数设置。根据采集系统的组成原理,将Module类采用COMPOSITE模式表示成为一个“部分.整体”层次结构,抽象类Module是关键,这使得类ParallelModule(并行采集模块类)、ScanModule(扫描采集模块类)、FreqMultiplier(倍频器模块类)和组合概念DAS(数据采集系统类)具有 申请上海交通大学工学博士学位论文一致性。一个现实世界中的数据采集系统是Module的派生类DAS的一个实例。由于采集系统硬件往往都是第三方的API(应用程序接口),为了解除采集系统和API之间的耦合,可以采用BRIDGE模式设计一个抽象的BusFactory(总线工厂类),将具体实现派生为VXIFactory、PXIFactory和PCIFactory类,它们再分别使用各自对应的API。MapManager(映射管理器类)用于管理测点和通道的映射关系。图2-18数据采集系统的实体类模型Fig.2-18Entityclassmodelofdataacquisitionsystem2.6.4.4算法的实体类模型在状态监测和故障诊断领域,目前已有很多成熟算法可以复用,但这些算法的接口多为简单数据类型(诸如,整型、单精度浮点型、双精度浮点型等),丽根据图2.16对数据集的对象设计,系统中各种数据都是Record类的实例。因此,为了将目前常用算法的接口转换成系统希望的Record接口,基于ADAPTER模式从图2—14和图2.15中的概念中抽象出了如图2一19所示的算法类模型,此模型不仅保证已有的各种算法的在系统中的复用性,而且也保证了系统中新设计的算法在其他系统中的复用。在图2.19中,系统中实际使用的算法是Algorithm基类的各个派生类的实例,图中Algorithm的派生类有DSPAlgorithm(数字信号处理算法类)、MatrixAlgorithm(矩阵算法类)和GeneralAlgorithrn(通用算法类),而OtherAlgorithm(其他算法类)表示算法的扩充。从图中的FFT类可以看出,所有的算法都继承setParameter(设置参数)、IsApplicable(检查算法可用性)和apply(使用算法)三个操作,操作参数是Record类的实例。而DSPAlgorithmImp(数字信号处理算法实现类)是对成熟算法进行封装的类,FFT算法具体的实现体现为BasedFFT(基于FFT的算法类)的一个操作,操作参数为简单数据类型。因此,当系统中添加新算法时都采用简单数据类型作为操作参数,然后采用Algorithm的派生类进行接口的转换,这样便于新算法可以在其他非基于Record数据的系统中的复用。 第二章面向监测哥口诊断领域的软件皋摹结构研究2.7本章小结图2.19算法的实体类模型Fig.2—19EntityclassmodelofAlgorithm设备监测与故障诊断系统属于一种大规模分布式的软硬件密集型系统,面对日益增长且多变的需求,传统的设计和开发方法已不能满足需要。作者认为不论采用何种技术实现的此类系统,它们都遵循同一个高层次抽象的领域模型,存在一个通用的适合于监测和故障诊断专向领域的体系结构模型。为此,本章提出了一个创新的MODOSA模型,并将其分为七个部分:用例模型、领域模型、对象模型、数据库模型、动态模型、组件模型和部署模型。通过结合IRMFDS构建的实际案例,在首先对问题域分析的基础上,选择UML作为可视化描述语言,采用OOA技术,对MODOSA的用例模型、领域模型和对象模型进行了初步研究。已总结的各种模型都属于高层抽象,具有良好的体系结构级复用性。 申请上海交通大学工学博士学位论文3.1引言第三章旋转机械故障诊断的特征挖掘方法研究随着数据库技术和存储介质技术的飞速发展,企业数据库中常常多达数千兆字节,甚至更多。拥有数据是进行数据挖掘的必要条件,但仅仅拥有数据是不够的。首先,它们极易受到噪声数据、空缺数据和不一致数据的侵扰。其次,只有那些具备领域知识而且理解数据的人,才能为数据挖掘正确地选择数据。“如何进行数据准备才能提高数据质量,从而提高挖掘结果的质量?”这是在开始数据挖掘前必须考虑的问题,由于高质量的决策必然依赖于高质量的数据,因此数据准备是直接关系到整个挖掘项目成败的重要步骤。数据准备工作在数据挖掘文献中往往作为一个并不重要的阶段被省略,但是在现实世界的应用中形势恰好相反,数据准备比数据挖掘需要花费更多的精力,芬兰赫尔辛基大学的H.Mannila在文献[1221qb指出数据准备工作大概要花去数据挖掘整个过程80%以上的时间。研究特征挖掘问题不仅是为了减少计算工作量,还有其他因素,例如,识别精度往往并不随特征数量的增多而提高,一般只需要合适数量的精特征就足以达到很高的识别精度。从物理意义上来分析,由于各特征量由观测得到或由观测数据算得,其中必然含有观测中各种噪声的干扰,因此,当采用较多的特征量时,一方面会因为被考虑的因素增多而提高识别精度,另一方面又会因噪声干扰的增强而损失识别精度,从而使总的识别效果并不一定理想【12”。另外,故障诊断技术已经发展多年,同其它的模式识别技术一样,它有一个前提假设——被识别的目标具有q,a2,⋯,ah共h个特征。这些特征构成了识别目标的特征向量甜=h,a2,⋯,%r,故障诊断系统就是利用这些特征向量进行诊断,这些特征的集合就构成了特征库。特征库一般是由用户或领域专家预先建立,而对于不同的设备其特征也不尽相同,这导致由人工建立的特征库存在如下缺点:-特征库的质量取决于设计人员的经验,可能冗余,也可能不完备。_特征库是静态的,没有更新机制,不能自动从大量数据中发现新特征。-没有充分利用数据库中的冗余信息,这些信息可以帮助用户从不同角度去识别目标。为此,本章针对特征自动识别问题进行了研究,为自动建立特征库打下了基础。本章的组织结构图见图3一l。首先,在研究传统数据挖掘的数据准备方法、分析诊断信息特点和诊断知识表达数学描述的基础上,建立了旋转机械故障诊断的特征挖掘模型。然后从特征值离散化方法和特征归约两方面,对特征挖掘模型进行了深入研究。 第三章旋转机械故障诊断的特征挖掘方法研究针对ChiMerge算法的局限,提出了--T0改进的多特征离散化算法;针对粗糙集理论在特征归约中的缺陷,提出了一种基于熵度量的最佳特征评价方法和一种基于遗传算法的粗糙集特征归约算法。最后,在上述理论研究的基础上,设计了一个创新的专用数据挖掘工具RMFMiner(RotatingMachineryFeatureMiner),用来解决MODOSA模型中特征自动识别的问题,并采用转子故障模拟数据集和UCI机器学习数据库对RMFMiner的有效性进行验证。指出人工建立特征库存在的局限传统数据挖掘的数据准备方法概述分析故障诊断领域信息的特点二二]二建立旋转机械故障诊断的特征挖掘模型离散化方法概述分析ChLMerge算法存在的局限故障诊断知识表达系统的数学描述特征归约方法概述分析粗糙集方法存在的局限建立冲突水平概念和改进的多Il建立基于熵度量的ll建立基于遗传算法的特征离散化算法l{最佳特征评价方法ll粗糙集特征归约方法设计专用特征挖掘工具RM蹦蛔er将RMFMmer在转子频谱特征集和UCI机器学习数据库中应用图3—1本章的组织结构图Fig.3-1Organizationstructuralchartofthischapter312传统数据挖掘的数据准备方法存在不完整、含噪声的和不一致的数据是大型的、现实世界数据库或数据仓库的共同特点【4】。数据不完整的出现可能有多种原因。有些感兴趣的属性,如销售事务数据中顾客的信息,并非总是可用的。其他数据没有包含在内,可能只是因为输入时认为是不重要的。相关数据没有记录是由于错误的理解,或者因为设备故障。数据含噪声的原因有多种:收集数据的设备可能出现故障;人的或计算机的错误可能在数据输入时出现;数据传输中的错误也是可能出现。同其他数据不一致可能是由于错误的删除,此外,历史记录或修改的数据可能被忽略。空缺的数据,特别是某些属性上缺少值的字段可能需要推导。总之,大型原始数据集并不总是数据挖掘的最佳数据集,需 申请上海交通大学工学博士学位论文要对其进行一系列的处理才能产生对所选择的数据挖掘方法有用的特征。三种常用的数据准备方法如下:-数据清理(DataCleaning):通过填写空缺值,平滑噪声数据,识别、删除孤立点,并解决不一致问题来实现“清理”数据。脏的数据能使挖掘过程陷入混乱,导致不可靠的输出。-数据集成(DataIntegration)和变换(Transformation):数据挖掘经常需要将来自于多个数据源的数据进行合并存储,还可能需要将数据转换成适合于数据挖掘的形式。_数据归约(DataReduction):将大型数据集压缩表示,使在归约后的数据集上挖掘将更有效,并产生相同(或几乎相同)的挖掘结果。主要包括特征值归约、特征归约和样本归约。数据准备有两个主要任务:一将数据组织成一种标准形式(关系表),以便用数据挖掘程序进行处理。●准备数据集使之能实现最佳的数据挖掘效果。数据准备的处理模型见图3-2。l丢失数据l_。——__——l样本归约l特归I原始数据集卜—-}噪声数据J征——特征归约I形提化成取不一致数据特征值归约数据清理数据集成和变换数据归约图3-2数据准备过程模型Fig.3-2Datapreparationprocessmodel3.3旋转机械故障诊断的特征挖掘模型3.3.1故障诊断领域信息的特点在大中型企业的监测与诊断数据库中,已存储的设备信息与普通的零售、银行等领域的商业信息相比有很多不同,主要体现在以下几个方面025]:11监测对象的多样性:设备信息主要来自于各类大中型机械及自动化设备,诸如转子系统(燃气轮机、水轮机、空压机等)、液压系统及静止设备(压力容器、工业管道、电器设备等)。21监测手段的多样性:可以采用诸如振动监测、声学监测、温度监测、无损监测、红外监测、油样分析等多种手段进行设备监测。 第三章旋转机械故障诊断的特征挖掘方法研究3)信息表示的多样性:由于监测对象和手段的多样性导致了设备信息表示的多样性,除了一般的数据类型(如浮点型、布尔型、文本型等),还有多媒体类型的数据(如声音、图像等)。4)信息的复杂性:在传感器采集数据的过程中,有用信号和机器其它部件引起的噪声信号都会被传感器拾取。这些噪声有的是线性叠加在有用信号上,还有的是非线性叠加。如果采用间接测量,与目标故障有关的相关信号在到传感器的传递过程中还会发生畸变。这些使得采集到的数据成为一类复杂的时间序列数据邮J。5)数据的海量性:监测系统按用户指定的时间不断向数据库中写入各种监测信息,有些设备故障特征直接体现在时间序列数据中,而更多的情况是人的分析和分辨能力并不能胜任找出的高维海量设备数据与故障之间的对应关系。被测设备l毳誊l噪声{噪声l⋯塑兰+(姜卜—,陌丽i—卜一(虹一开关量}环境l噪声工艺量天传感器噪声数据采集系统振动量原始数据振动量导出数据工艺量数据开关量数据扳动量报警数据工艺量报警数据开关量报警数据图3-3工程信号采集系统示意图Fig.3-3Schematicofengineedngsignalsacquisitionsystem在设备故障诊断过程中,多数处理的是传感器采集的数据。图3—3是工程信号采集系统示意图,需要监测的原始物理量包括工艺量、开关量、扳动量等,这些原始的非电量信号与环境噪声信号由传感器拾取,再加上信号传输线引入的噪声,一起进入数据采集系统,最后从数据采集系统得到的信息比原始信息更加丰富,除原始工艺量、开关量、振动信号外,还有导出数据、报警数据等。综上所述,鉴于工程信号数据集的以上特点,作者认为采用正确的工程信号特征挖掘方法是影响数据挖掘在故障诊断领域成功应用的主要因素。3.3.2故障诊断知识表达系统的数学描述诊断知识的表达在智能故障诊断数据处理中占有十分重要的地位,它对特征挖掘理解起到了指导作用,使作者能够明确特征挖掘结果在诊断知识表达系统中的位置。设感兴趣对象的非空有限集合为论域,记作U(U≠o)。任何Ⅳ的子集称为U中的一个概念或范畴,记作S(S£u)。U中的任何概念族称为关于【,的知识。u的 中请上海交通犬学工学博士学位论支一个划分称为等价关系,记作R={墨,量,⋯,S。),其中:U=U置,置兰U,Si≠o,S,nS,=o,对于f≠J,f,J=l,2,⋯,H。U上的一族等价关系R构成了一个知识库(KB:KnowledgeBase),记作K=缈,冠)。在此理论的基础上,一个知识表达系统(KnowledgeRepresentationSystem,KRS)可以描述为四元组‘126】:KRS=(U,A,V,厂)(3—1)其中,一:属性的非空有限集合;V=U屹:屹是属性a的值域;aeAf:UxA时V是一个信息函数,它为每个对象的属性赋予一个信息值,即Va∈As,x∈U,f(x,a)∈屹:可以看出,一个属性a对应一个等价关系,根据圪可以获得U的一个划分咒,一个表可以看成是一族等价关系,即KB。KRS也称为信息系统(InformationSystem,IS),通常记作S=(U,A)。令A=cuD,CnD=a,C称为条件属性集,D称为决策属性集,具有c和D的KRS就称为决策表。表行对应U的一个元素,列对应于爿的一个元素,对象的信息是通过指定对象的各/%∞来表达。3.3.3旋转机械故障诊断的特征挖掘模型如前所述,作为监测的工程信号主要包括振动量、工艺量和开关量,其中振动量是设备故障诊断中最有效、最常用的信号量。机械设备和结构系统在运行过程中的振动及其特征信息是反映系统状态及其变化规律的主要信号。统计表明由于振动引起的设备故障再各类故障中占60%以上。据国内外报道,用振动的方法可以发现使用中的航空发动机故障的34%,可节约维修费用70%[116】。因此,本文讨论的工程信号主要是指振动信号,后续章节中的工程信号在没有明确说明的情况下均指振动信号。通过查阅文献,作者发现在专家系统的知识获取系统研究中并没有对包含知识的案例集(即特征集)的建立给出明确的处理过程模型,这不利于建立统一规范的MODOSA模型。因此,作者认为可以将数据准备过程模型引入到MODOSA中,进一步将数据挖掘技术引入MODOSA的知识获取系统打下基础。基于上述考虑,在图3.2模型的基础上,本文提出了一个旋转机械故障诊断的特征挖掘模型见图3-4,用于解决本领域特征自动识别的问题。 第三章旋转机械故障诊断的特征挖掘方法研究图3_4旋转机械故障诊断的特征挖掘模型Fig.3-4Featureminingmodelforfaultdiagnosisofrotatingmachinery振动数据集:在故障诊断系统中,网络数据库存储的振动数据集不同于传统信息系统中存储的数据,一般采用二进制数据块(Binary)的形式存放,称为原始模式向量,维度分为1024和2048两种,记作Ⅳ,Ⅳ=h,⋯,‘11Q=1024或2048)。根据用户的需求,将各个库中指定的/./合并存储于~个新库中,此时构成的集合称为原始样本空间,记作U(球∈U)。数据清理:根据盯的存放方式,空缺数据就意味着一个模式向量的丢失,它可能是由于传感器失效、网络失效等各种硬件原因造成,唯一的解决办法就是去除空缺的Ⅱ。为了提高H的信噪比,进行一系列的诸如去除电平漂移、零均值化、剔除奇异项、消除趋势项和数字滤波等处理,以便突出有用信息。由于振动数据集的特殊性,一般不需要考虑样本数据的不一致问题。清理后的U便成为原始特征空间,记作U’。此阶段也就是通常所谓的“特征形成”。数据变换:在故障诊断领域,数据集成和变换的重点是放在数据变换上。通过时域分析、频域分析、轴心轨迹分析及其他高分辨率变换方法,将F’中的∥映射为时域、频域或其他高分辨率域中的粗特征模式向量Y(3L称为特征提取),并进一步对Y做归一化处理,力图为将来挖掘出的知识具有范化性打下基础。从广义上说,若£,7是原始特征空间,y是粗特征空间,则变换T:U7斗y就称为数据变换。数据归约:故障诊断领域中,数据归约的重点是在特征值归约和特征归约。由于故障诊断领域的特征向量通常是连续型数值,而多数数据挖掘和机器学习算法也可使用离散化属性值(例如,粗糙集),因此,特征值的归约在故障诊断领域的特征挖掘中也是一个很重要的问题,记作VR:l,一l,’。特征归约就是从粗特征向量Y中挑选出一些最有效的、对故障模式最敏感的特征元素构成一个精特征向量,记作a(a£Y),从而实现降低特征空间维数。从广义上说,若l,是粗特征空间,F是精特征空间,则FR:Y斗,就称为特征归约,又称为特征选择,最简单的特征归约方式是根据专家 申请上海交通大学工学博士学位论文知识挑选那些对分类最有影响的特征量,例如,日本故障诊断专家白木万博的得分法[1271和美国J.S.Sohre的故障症状与状态表【128];其次,使用基于可分离性判据和优化的数学方法进行筛选比较,找出对故障分类最有效的信息特征量,有利于实现精特征的自动识别。挖掘数据集:当粗特征向量Y的维数不高、对故障足够敏感且后续知识挖掘不要求离散化属性值时,可以由】,直接构成特征空间A;对于Y维数较高且特征归约和知识挖掘算法不要求离散化属性时,先进行FR:Y寸F,然后再由F构成特征空间一;一般情况下,先VR:g—Y’,然后船:l,’一F,最后由F构成特征空问一。根据前述步骤获得的U、A及f:UxAoV便可构成一个挖掘数据集(即关系表),从而形成了一个诊断知识表示系统KRS=fU,A,V,f1,为后续的知识挖掘做好准备。设备故障状态分类能否成功,在很大程度上取决于特征量的选择。机械系统往往是一个复杂的随机过程,一般很难用一个确定性的时间函数来描述。特征挖掘的目的就是将原始数据集变换成挖掘数据集,使后续的知识挖掘更易于找出它与状态的关系。故障诊断可用的特征量很多,但反映的状态规律性、敏感性和在模式空间的聚类性、可分性并不相同,需要选择规律性好、敏感性强的特征量作为特征向量。3.4旋转机械故障诊断的特征值归约方法研究诊断对象的特征可以分为两种类型:一种是连续(定量)特征,其值取自某个连续的区间,例如各阶倍频幅值等;另一种是离散(定性)特征,这种特征是用语言来表示的,例如轴心轨迹形状等。在一些情况下,特征数据集中既包含了连续特征,又包含了离散特征。不同数据挖掘方法对于输入数据的要求也是不相同的,如神经网络要求连续型特征,粗糙集要求离散型特征,决策树对两种特征都适用。由于特征离散化具有两个优点,其一是简化了特征的描述;其二是在生成训练样本集合之前就把连续属性离散化,从而大大提高了后续的知识挖掘的效率。因此,有必要对特征僚归约方法进行研究。3.4.1离散化方法概述离散化定义:对于一个连续型属性a,令其值域为【‰。,v珊。】,离散化就是寻找一个属性值域的划分民:见={[v0,v1),【vl,v0,⋯,【唯+唯】),其中V0=vmi。,vk=‰,k是离散化的级【””。传统的离散化方法是根据以前关于特征值的知识人工进行。分割点是主观定义的,导致规约存在两个问题:分割点的定义和区间的表述。当没有任何关于特征的知识时,离散化是非常困难。自动离散化方法基于统计、布尔推理、聚类技术以及误差和信息熵等理论,很好的解决了传统离散化方法所遇到的问题。根据离散化样本的分类信息 第三章旋转机械故障诊断的特征挖掘方法研究可获得情况,目前的自动离散化的方法可以分为两类:_无监督离散化方法:对于将进行离散化的样本集没有任何分类信息,此方法依赖于属性值的分布假设。·有监督离散化方法:样本集的分类信息可以获得,离散化属性值时可以利用。无监督离散化的常用方法如下:(1)等宽区间法:将[vm,。,Vm。]分为k个区间,区间宽度为(-k一‰)肛。此方法的前提是假定所有属性值满足均匀分布。(2)等频区间法:从‰。开始,每次取相同数目的样本作为一个区间,若属性值总数目为m,离散为k个区间,则每一区间间隔中样本个数为m/k。有监督离散化常用的方法如下:(1)ChiMerge算法:它使用z2统计来对一个已知特征的多个区间的质量进行分析,根据样本的分类信息确定两个相邻区间中数据分布的相似性。ChiMerge算法已经在机器学习的论文中广泛使用【”ol,Chi2是此算法的改进版【13”。(2)基于熵的离散化方法:此方法是Fayyad和Irani在文献[132160提出的,文献r133]也对此方法进行了讨论。此类方法都是采用Rissanens的最小描述长度准Ntl341作为回归划分算法的停止条件。(3)正交超平面方法:此方法是由Skowron和Nguyen基于粗糙集和布尔推理理论提出的【”51,它可以看成是模式识别中常用的线性判别准则的一个特例。采用离散化方法应满足三个原则:(1)连续属性离散化后的空间维数尽量小,即每一个离散化后的属性值的种类尽量少。(2)属性值被离散化后的信息丢失尽量少。(31离散化后样本集合中冲突样本数尽量少。3.4.2ChiMerge归约技术ChiMerge技术是一种有监督的自动化的离散化算法。此算法使用的是z2统计来对一个已知特征的多个区间的质量进行分析。此算法根据输出样本的分类来确定两个相邻区间中数据分布的相似性。若z2检验结果是输出类的频数独立于特征区间,那么相邻区间应该合并,否则表示区间之间的统计差别很大,不能合并[124】。令知识表达系统为KRS=(U,A,V,厂1。设U是数据样本的集合,A为样本的属性集合,它包括条件属性c(C£A)和决策属性D(D£A),条件属性即是本文中所指的特征,决策属性即是样本的类标号。假定D具有k个值,即有k个不同类4。 申请上海交通大学工学博士学位论文对于一个己知的条件属性c∈C的值域为K(K£V),现将K划分为m个区问,记作‘O=l,2,⋯,m),从而U也被分成U子集,U=Uu,(f_1,2,⋯,聊)。根据样本集合Uiyou。来检验两相邻区间样本分布的相似性假设:Ho:两区间分布相似,可以合并;q:两区间分布不同,不能合并(3.2)z2检验的统计量公式如下:z2(‘,Ii+。)=杰(呜一岛)2/岛+壹(4。,,一乓。,∥压。,,(3-3),2Ij=l式中,k=tDf,表示输出类个数;AⅣ=Co..t(aj,q),表示区间‘内第_,类的样本数,Count(·)为计数函数;Ri=lul=∑呜,表示区间Ii内的样本数;j=1q=呜+4㈣,,表示相邻两区间‘和Ii+。内的第,类的样本数;Ⅳ=眵f+1%。|_弓+&嗍,表示相邻两区间t和k,内的样本总数:岛=(R×C_,)/N,表示呜的期望数;注意,如果计算中出现R或ci为0情况,岛应设为一个极小值10~,这样避免被0除。当风为真时(不论风中的分布属于什么分布),统计量(3—3)总是近似地服从自由度为七一r一1的z2分布,其中,r为估计参数个数。本算法中r=0。于是,若在假设王‘下计算式(3—3)有z2≥z2(膏-1)(3—4)则在显著akqZa下拒绝风,否则接受风。口为犯第~类错误的概率,即当矾为真时,fL却被拒绝的错误。3.4.3改进的多特征离散化算法ChiMerge技术应用时存在的局限性如下:(1)仅对单一特征适用,而且当对多特征同时离散化时,会出现冲突对象问题。(2)在生成初始区间时并未充分利用样本决策属性D,从而导致边界集合丑元素过多,计算量增加。为此,作者定义了一个冲突检验指标,基于ChiMerge思路提出了一种改进的多特征离散化算法,见表3-3。 第三章旋转机械故障诊断的特征挖掘方法研究根据式(3—1),条件属性C={C1c:,⋯,“},决策属性D={吐,d2,⋯,巩l,数据样本的集合U的定义为U=‰,“:,⋯,“。},ⅣJ≠o,对于,(%,D)≠f(bgj,D)时,有厂心,c)≠f(u,,c),f,J=1,2,⋯,Ⅳ。令属性cf的连续值域■有一个的分割点集合&,最.对应的区间集合‘便成为属性Ci离散化后的新值域。由于f=U‘,j对应一个新的信息函数f’:Ux.4斗,,定义不含冲突样本的集合u7为U’={U1":,⋯,%},甜,≠a,对于,’(%,D)≠,’("』,D)时,有厂’(她,o≠f’(”,,C),i,j=l,2,⋯,g。从而,得到一个新的知识表达系统为KRS7=(U’,A,J,f’)。冲突样本集合U。的定义为U。=U—U’。定义新值域,导致的冲突水平口为luclfl(1)2饼(3-5)式中,⋯表示计算集合元素的个数。表3.1基于ChiMerge的多特征离散化算法Tab,3—1ChiMerge-basedmulti—featuresdiscretizationalgorithm算法:连续型特征值的离散化。觚罂焉鞣荤芽《阢丑_力、指定的离散化区间数肌显著水平打毗2他一卜允塑堂!至鱼、仲塞塑登查塞鱼旦!:曼墼些匡闷鲍垫墨塞鱼曼!方法:(1)iffl(v)≤芦’then,/对U进行冲突检查(2){Fori=ltolCJ(3){对属性q的值域■进行升序排序.(4)Forj21tolvl一1(5){1f(’≠k,且4乒力。)thenb=(叶+’+。)/2,骂=墨u6.),艨得初始边界集合(6)While(1&l一1≤N)(7){Forj21tolBil-2(8)z2U】=z2(‘,‘。),‘=【6},6『+.),‘+.=Ck。,6』+:).,做式(3-3)';-/-gx2(‘,‘+。)(9)Minz2=nfin{z2[1】,z2[21,⋯}.(10)whileMinZ2≥z2婶-1)z2姥-1)=z2(七一1)+1.(11)Bi=Bi一6f。/,合并两区间”02)根据占={置,嘎,,置d}对艘s=(盯,A,V,/)进行离散化,NKRS=(U’,爿,,,厂’).(13)Iffl(O<∥’then算法终止.//对触略=(U’,A,,,,’)进行冲突检查f!生曼!!!丝:芝:!:整型丝2:1 申请上海交通大学工学博士学位论文{.5旋转机械故障诊断的特征归约方法研究粗特征经过归约成为精特征后,对后续的故障挖掘都可以大大降低其计算工作量。__|弓外,研究数据归约还不仅是为了降低运算工作量,大型数据集虽然有得到更佳挖掘结果的潜力,但并不能保证就一定能获得LLd,型数据集好的挖掘结果。文献[1231的遥’哄识另fJ的课题就是一个很好的例证。事实上,领域专家经过长期研究,作了很多调查和实验,甚至是经过很多失误之f阴,对一些设备的最佳诊断特征量的选择已经给出了一些经典的总结【”,它们提供给什.暂啼}数据归约的最简单方法。但是对于不同的被监测设备,最佳特征是有区别的,删去菸个特征是很难进行的,这需要一种定量的指导。因此,本节通过研究基于可分离性判据和优化的数学方法,获得归约知识指导归约的进行,从而实现精特征的自动识别,使最佳特征量的选择更容易、更方便,同时又有根据。3.5,1特征归约方法概述特征归约的任务是从一组数量为D的特征集A={121a2,⋯,a。)中,在可分离准则函数,(Ⅱ)意义上选择出数量为d(D>d)的一组最优特征子集_’={c11,a:,⋯,ad},此子集在数据挖掘性能上比得上整个特征集4,从而达到降低特征空间维数的目的。‰比,需要解决二个问题,一是选择的准则函数J(a)(即可分离性判据);另一问题选择一个较好的算法,以便在允许的时间内找出最优的一组特征子集。从D个特征中选d个精特征,所有的特征组合数为:Ⅳ=q=若赫ps,蕾采用穷举算法将Ⅳ个J(a)都算出来进行比较,其计算量之大是可想而知的。但任何非穷举的算法都不能保证所得结果是最优的,因此,实际中常采用次优解算法。所有算法中,最优特征组的构成都是采用“自下而上”法或“自上而下”法。令4表示特征数目为k的所有可能特征组合,4表示从A中去掉k个特征后所剩特钮一的所有可能的特征组合。“自下而上”算法中第k步的最有特征组应当使t,(4)=平黔,(4)(3—7)从A。=圆开始,k=1,2,⋯,直到k=d。“自上而下”算法中第k步的最有特征组应当使,(4)=maxJ(A})(3-8) 第三章旋转机械故障诊断的特征挖掘方法研究从A。=A开始,k=1,2,⋯,直到k=D—d。分支定界算法:是一种自上而下且具有回溯功能的算法,它是目前唯一能得到最优结果的搜索算法,主要是利用了可分离性判据J(a)的单调性。虽然理论上,(口)满足单调性,但是有时,(a)必须用有限个样本去估计,这可能破坏了单调性,特别是当各类分布密度是用非参数法估计时,更有可能发生此类情况,此时不能保证结果最优。单独最优特征组合法:计算各特征单独使用时的判据值并加以排队,取前d个作为选择结果,但即使各特征是统计独立的,结果也不~定最优。但是当可分离判据为下式时,此法可以找出一组最优特征。Dl,(爿)=∑,(q)或‘,(4)=IIl,(q)(3—9)i=1顺序前进法(SequentialForwardSelection,SFS):一种最简单的自下而上搜索方法,每次从未入选的特征中选择一个特征,使得它与已选入的特征组合在一起时所得‘,值为最大,自到特征数增加到d为止。缺点是一旦特征被加入,即使由于后加入特征使它变为多余,也无法再把它剔除。顺序后退法(SequentialBackwardSelection,SBS):一种最简单的自上而下搜索方法,从全体特征组成的全集开始,每次剔除一个特征,所剔除的特征应使保留的特征组的,值最大。缺点是计算,值是在高维特征空间中进行的。由于特征选择属于一个组合优化问题,因此也可已使用解决优化问题的方法解决特征选择问题,例如,在文献[136]给出了模拟退火算法(SimulatedAnnealingAlgorithm,SAA)用于特征选择时的算法步骤,文献[137]和[138]使用Tabu算法进行特征选择,文献[139]、[140]和[141]中使用遗传算法进行特征选择。作者认为与离散化方法类似,特征归约方法也应满足两个原则:(11特征归约后的空间维数尽量小。(2)特征归约后的样本集合的分类错误率应尽量小。3.5.2基于传统粗糙集理论的特征归约粗糙集理论(RoughSetTheory,RST)由波兰的z.Pawlak教授【142,“3】于1982年提出的一种数据分析工具。它建立在分类机制基础之上,从一个新的角度把知识和事物的划分联系在~起,为处理不完整和不确定的信息提供了一种新的数学工具。该理论的最大特点是,不需要所需处理的数据集合之外的任何先验信息,即它的知识的表达与处理完全是客观的。在众多的机器学习方法中,粗糙集学习方法是一个非常活跃和迅速发展的方法,该方法能够最大程度地对信息进行约简,从而导出学习规则。 申请上海交通大学工学博士学位论文3.5.2.1粗糙集的基本概念根据式(3—1),设KRS=(U,A,y,f)是一个知识表达系统,A=cuD,CuD=D其中C为条件属性集,D为决策属性集‘126t。定义3一l:令R£A,它是论域u上的一种等价关系,用R表示论域l【厂上的等价类为:叫R={x∈U,Y∈ulf(x,日)=以y,日),Va∈R}(3-io)R把整个u论域划分为k个等价类x,,x:,⋯,鼍,【工k表示包含元素x∈U的R等价类。定义3-2:令PsA,由属性子集P决定的论域【,上的等价类为;v/ind(P)={x∈U,Y∈Ulf(x,口)=f(Y,d),Va∈P}(3—11)加d(P)不可分辨关系满足自反性、对称性和传递性。ind(P)是一种等价关系,它把整个U论域划分为k个等价类墨,x:,⋯,Xk,记为v/ind(P)={x,,置,⋯,鼍),或简记为U扭a定义3.3:令x∈U,R是论域u上的一个等价关系,x的R下近似集为:星x={x∈Uf[x】。∈xj(3-12)定义3-4:令xsU,R是论域u上的一个等价关系,x的R上近似集为:五x={x∈Ul[x】Rnx≠a}(3-13)定义3-5:令x£u,R是论域U上的~个等价关系,x的R正域定义为:posR(x)=RX(3—14)表示由那些根据知识月判断肯定属于x的U中元素组成的集合。定义3-6:令R是一族等价关系,R∈R,如果ind(R)=打耐俾一{R))(3一lS)则称R为胄中不必要的;否则称为必要的。若每一个R∈R都是皿中必要的,则称R为独立的;否则称矗为依赖的。定义3—7:设QsP,如果Q是独立的,Jj.ind(Q)=ind(P)则称Q为P的一个约简。定义3—8:P的核core(P)=nred(P),其中red(P)表示P的所有约简。定义3—9:令_P和Q为等价关系族,R∈P,如果pD%吖P)(胁d(Q))=pos州(,一{蛳(加d(Q))(3—16) 第三章旋转机械故障诊断的特征挖掘方法研究则称R为户中Q不必要的;否则稼为必要的。若尸中每一个月都是Q中必要的,则称P为Q独立的;否则称P为Q依赖的。定义3-10:设S£P,如果S为P的Q独立子族且p∞。(Q)=pos,(Q),则称S为相对约简。定义3-II:P的相对核∞7吃(P)=nrede(V),其中redQ(V)是所有P的Q约简构成的集合。定义3-12:知识Q对知识P的依赖度定义为re(Q)=[pos,(e)lllvf(3—17)定义3.13:属性子集C’∈C关于口的重要度定义为aco(C’)=rc(D)一7c《(D)(3-18)利用区分矩阵(DiscemibilityMatrix)来表达知识系统能很容易地计算约简和核。定义3-14:KRS的区分矩阵是一个Iul×luI的矩阵,其任一元素定义为a(x,y)={c∈Cf(x,c)≠f(Y,c)}(3-19)即,a(x,Y)是区另4对象石和Y的所有条件属性的集合。定义3-15:az(x,y)={cl,c2,⋯,q}≠g,则指定布尔函数为qVC2V⋯vq,用∑a(x,y)来表示;a(x,y)=f3,则指定布尔函数常量为1。区分函数(Discernibilityfunction)定义为A=Fi∑a(x,y)(3—20)(‘y)eUxO函数4的极小析取范式中的所有合取式是属性集C的所有约简。定义3—16:核是区分矩阵中所有单个元素组成的集合,定义为cD比(o={c∈cj口(五力={0,XEU,yU)(3·21)定义3-17:Ke.sk耐D的区分矩阵是一个pIxlul的矩阵,其任一元素定义为口’(t力={cECIf(x,C)≠f(Y,c)且w(x,y)}(3-22)对于x,Y∈U,w∽y)满足:x∈posc(D)王抄萑posc(D)(3-23)或者x仨pOSc(D)JlY∈posc(D)(3-24)亘£者 申请上海变通太擘工学博士学位论文~kE====iⅡⅢ==日_-____IItj,日Et==目日E-—__E±=b___日E__mE=a__———----___口日==={=!z=====_$—__—一x,Y∈posc(D)且(z,力盛u/D(3—25)定义3—18:区分函数∥定义为A’=兀∑a+(五y)(3-26)(x,y)eUxtd嘲数4+的极小析取范式中的所有合取式是属性集c的所有D相对约简。定义3-19:D的相对核是相对区分矩阵中所有单个元素组成的集合,定义为coreD(C)={c∈CI口‘(z,y)={c},x宦U,Y∈U}(3.27)3522传统粗糙集归约的不唯~性问题当采用传统的基于粗糙集对一个决策表进行归约时,可能会获得多个属性约简。没有决策表互=,lUl=6,条件属性C={a,b,c},vo={o,l,2),吒={0,2),K={o,1);决策属性为D={d},圪={o,1)。决策表五如表3-2所示,其区分矩阵见表3-3。表3-2决囊表ZTab.3-2Decisiontable巧袁3-3决策表z的区分矩阵Tab.3—3DiscernibilityMatrixofdecisiontableZ4+=口^(avb)^(6Vc)^(avc)^(口vbVC)=a^(byc)=abvac决策表正有两个D约简《={a,b}和《={口,C),Dcoreo(C)={口)。根据式(3—11),v/c={{1},{2,3),{4),{5),{6)),V/{b,c)={{l,2,3),{4),{5,6)},u/江c)={{1),{2,3),{4),{5),{6)),叫{n,bj={{1),{2,3},{4),{5),{6));根据式(3—11),u/o={{l,3,6),{2,4,5}}; 第三章旋转机械故障诊断的特征挖掘方法研究根据式(3—14),posc(D)={1,4,5,6},posp㈣(D)={4},posIC-lb}}(D)={1,4,5,6),pos{c删(D)2{1,4,5,6};根据式(3_17),Yc(D)=4/6,y{c_似l(D)=1/6,1c一㈨(D)24/6,,{。一扣”(D)=4/6;根据式(3—18),盯∞(日)=o.5,O'cb(b)=0,%(c)=0。因此,当有多个约简且元素个数相同时,可能会出现属性重要度相同的情况,这时便无法根据属性重要度对约简集合进行选择。3.52.3传统粗糙集归约算法的时间复杂’眭问题当进行知识约简计算时,随着决策表规模的增大,属性空间的规模呈指数增长的,s.K.M.Wang和w.Ziarko已经证明找出一个决策表的所有约简和最小约简是一个NP-hard问题“矧。主要原因是属性组合爆炸问题,下面就对传统的约简算法的时间复杂性进行分析。11基于属性重要度的约简算法此类算法以r,(Q)作为计算的出发点,属性的重要度作为宿发条件,计算最小约简。根据式(3.17)n可知l,rAQ)的计算是以pos。(D)计算为基础,表3-4给出了pos。(D)的算法。表3_4正域算法Tab.3-4Algorithmofpositiveregion算法:正域算法。输入:离散化的知识表示系统KRS=(U,A,V,f)。输出:poa。(D)。方法:(1)U/C=o,置={“.),K=,(置,c),u/c=(Ⅳ/c)u五,I【,/cI=1.(2)Fori=lto1Ul,,计算U/C(3){Forj51toIUICft∞If,如,,c)=yithen。lExJ,Xi=x}UH..(5)Ifq岳U/Cthen一Ⅳ,cl+-=o,XIv,叫+1=一“吲+Iu蚱,U/C=(u/c)u~,chI.)(6)p/Dl=|Dl,∥={暇,%,⋯,%},U/D={I,E,⋯,%f},E=,(巧,D).(7)Fori=ltoIUl//计算U/D(8){Iff(uf,D)=%then“,El,I=‘u“,.)(9)posc(D)=o,(10)Fori=ltolDI,/计算pOSc(D)(11){Forj21to|U/Cl(12)IflXjnIl=I■I≠。thenXj£z,pos。(D)=pos。(D)wXj.} 申请上海交通大学工学博士学位论文v/c在最坏的情况下,每个样本独立成为一个子集,共需l+2+⋯+(Iul_1)次检验/(哆,c)=■是否成立,而l+2+⋯+(Ivl一1)=lu[(Iul-1)/2,故时间复杂性为o(Iul(IuI一1)/2)=o(Iul2)。叫D共需lul次检验,(坼,D)=%是否成立,故时间复杂性为o(Ivl)。在最坏的情况下,pos。(D)算法的时间为Iul(IuI_1)/2+IuI+IUIIDI,故时间复杂。酗,o(Ivl2)。因此,n(Q)计算的时间复杂性为o(Ivl2)。⋯根据式(3—18),c’£c个数为c晶+Cij+⋯+Ci目=29l_1,故基于属性重要度的启发式约简算法的时间复杂性为D(Iul2+(2H一1)lul2)=0(2吲Ivl2)。21基于区分矩阵的约简算法此类算法在获得区分矩阵后,以核属性为出发点,利用区分函数进行属性约简,计算最小约简。根据式(3-22),表3-5给出了区分矩阵的算法。表3.5区分矩阵的算法Tab.3—5Algorithmofdiscernibilitymatrix算法:区分矩阵算法。输入:离散化的知识表示系统艘s=(u,A,V,f)a输出:区分矩阵。方法:(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)m=0,a=g,IoMI=Iul(1uI一1)/2,DM={al,a:,-..,鼍。I)Fori=ltoIUl-1{Forj=i+lto1Ul{Fork=ltolCI{Iff(u,,q)≠f(uj,c女)then{if虬∈posc(D)and”,芒posc(D)then口=盘t)Ck.if屿芒posc(D)and",∈posc(.D)then货=口uq.if毽Eposc(O)and叶6posc(D)and{q,叶扣UIDthen口=auq.))m=m+1,a。=%u口,口=a.)}根据表3.5,区分矩阵算法的时间为Iul(p卜1)/2+iu卜I£厂lD卜IclIu|(1u卜_1)/2,时间复杂。眭为o(Icllul21。根据式(3.26)可知,区分函数计算需要对区分矩阵的所有Iul(Iu卜1)/2个元素进行合取和析取操作,故时间复杂性为o(1cIM2+Ivl4)=o(Ivl4)。 第三辛旋转机械故障诊断的特征挖掘方法研究3,5.3基于熵度量的最佳特征评价方法基于文献[124】中的熵度量理论,作者提出了一种基于熵重要度的最佳约简评价指标,解决了最佳约简的选择问题。当特征值为数值型时,两个"维样本“i和“j之间的相似性度量S可定义为:S=e-哟(3.28)其中珥是样本坼和“,间的距离,参数盯的数学表达式为:a=-Ono.5)历(3.29)西是数据集样本间岛的均值。采用标准化的欧氏距离度量计算B为:岛=J羔[(‰一‰)/(max,-min。)]2(3-30)Y^=1式中max。和rain女是用于第七维标准化的最大和最小值。当特征值为名义型时,两个样本“,和”,之间的相似性可用Hamming距离度量:昌=(主fUV.--“#k=l0卢睁s,,\/,式中,若‰=‰,则1‰--Zfjk[=l,否则为0。若存在一个数据集“}(f=l,2,⋯,Ⅳ),则熵为:E=~∑∑[岛×109:岛+(卜西)×1。g:(1一S口)](3-32)令条件属性集合为c={cl,c:,⋯,q},移除属性cI后引起已知数据集的熵变化量为4E(q)=IEc—Ec一{c』}I,4E@)越小,说明去除属性c,后的数据集越接近原始数据集a因此,d占如)是属性q重要度的一个量化值,4占如)越大表明属性q对原始数据集越重要。设约简集合为c’={q,q,⋯,q,⋯,瓯)且lc;l=lc;l=⋯=1qI一·=1c二I,则约筒子集E熵重要度定义为:凹(q)=∑一E(q)(3-33)qEq约简集合C’中元素个数最少的约简子集C’定义为:c”={晖q,⋯,q}={c7eC’妒I_min{J吲,jq卜·,Ic;I}}(3-34) 申请上海交通大学工学博士学位论文一一———————————————————————————————一一约简集合C’中最佳约筒子集定义为:best(C”)=C”∈c1盯(c”)=max{El(C;),髓(q),⋯,田(q)}}(3-35)针对表3-2中决策表五,有两个D约简西={口,b}和《={口,c},利用式(3.31)u7"以钨刮如表3-6至表3-9所示的相似性度量置,表。根据式(3—32),得E{。^,}=一11。[(2/3)×log:(2/3)+(I-2/3)×Iog:(1—2/勺)]=lo.101%d=-5sV(1/2)×log。(1/2EhIj=一9+[(1/2)×log。0/2Em】=一8+E(I/2)×109:(1/2根据式(3—33),得+-1/2l092—1/2)-I=5-1/2)]=9-1/2)]=8E1({口,6})=4占({Ⅱ})+4E({6})=k埘~%tI+1%M一墨。}--Jlo.101—51+110.101-9}=6.202F,({。,c})=4E“口})+4E({cj)=l气舶砖一鼍蚰jf+陔啪,q一&叫}=110101—51+110.10l一8f277n’根据式(3—35),决策表王的最佳约简为《={。,c)。表3—6基于{口'b,c}的岛表’l'ab.3—6{a,b,。},based品table表3-7基于协c)的品表Tab.3·7融c)一based&table盯l2345612/21/20/222/2I/20/231/20/241/252/28表-3-9基于b6)的S表Tab.3—9kb)-based毛tableU123456 第三章旋转机械敌障诊断的特征挖掘方法研究3.5.4基于遗传算法的粗糙集特征归约方法的研究现在大多数的基于粗糙集的归约算法都采用启发式约简算法来解决组合爆炸问题。但是这些约简算法主要是从粗糙集的核出发,采用启发式搜索的方法构造所含条件属性最少的约简。但是这种算法并非对所有的知识表达系统都适用[14”,而且随着问题规模的增大会越来越复杂。遗传算法(GeneticAlgorithm,GA)是20世纪70年代初期美国Michigan大学的J.Holland与其同事、学生们研究形成的⋯个较完整的理论和方法,它是基于生物学进化原理的全局搜索算法,通过用计算机模拟生物进化的机制,使群体不断优化,并在变化过程中找出人工系统的最优解。遗传算法为减小传统粗糙集归约算法的时间复杂性提供了一个解决途径。遗传算法可以描述为七元组:GA=\Np口,Ng。,Cp。,Q。t,Q,。,nmect,j■10-3q其中,^k为种群大小,^k为进化代数,巴。为个体基因的编码方法,f乙。为变异算子,皿一为交叉算子,砬。,删为选择算子,/o为个体适应度评价函数。3.5.4.1基因的编码方案属性约简的目标是找出最小属性组合,这可以看成遗传算法的表现型。从表现型到基因型的映射称为编码。作者采用的二进制编码形式,将条件属性集合代表的个体表示成为一个{o,11二进制串,具体的编码方案如下:设条件属性集合为C={cl,c2,⋯,巳},则很容易将C映射为遗传算法中个体的染色体,染色体的基因位数为n,每一位对应一个条件属性。如果第i位取值为1,则表示选择其对应的条件属性ct;如果第,位取值为0,则表示去除其对应的条件属性c;。因此,每一个染色体对应了条件属性集合C中的一个属性子集。图3—5所示的属性子集为C’={q,c2,c5,c7}。clc2qc4c5吒c7图3-5基因编码示例Fig.3-5Schematicofgenecode3.5,4.2个体适应度评价函数的构造遗传算法在进化过程中基本不利用外部信息,仅以适应度函数为依据,利用种群中每个个体的适应度值来进行搜索。因此,适应度函数的构造直接影响到遗传算法的收敛速度以及能否找到最优解。它是遗传算法与粗糙集方法的唯~接口,通过它使用粗糙集理论确定属性约简优劣。在前面已给出的属性归约原则基础上,作者提出~种加权的个体适应度评价函数: 申请上海交通大学工学博士学位论文‰=Weight*研+(1-嘲小翩仔,·,式(3—37)由三部分组成,第一部分l£,Dl/l【,I是C’关于D的近似分类精度,当然是越高越好;第二部分l—Ic’I/Icl是当前个体中未使用条件属性的比率,此部分值当然也是越高越好;第三部分Weight是权值,它的大小反映了应用时考虑问题侧重点,它的值域为【O,1】。3.5.4.3遗传算法各算予的选择1)选择算子选择过程一种基于适应度的优胜劣汰的过程,以一定的概率从种群中选择若干个个体操作用于进行交叉操作。常见的算法有轮盘赌选择、随机遍历抽样、局部选择、截断选择和锦标赛选择等。作者采用了轮盘赌选择方法。为了选择交叉个体,需要进行多轮选择,每一轮产生一个[O,1】均匀随机数,将该随机数作为选择指针来确定被选择个体。2)交叉(基因重组)算子交叉过程是把两个父个体的部分结构加以替换重组而生成新的个体的过程。交叉的目的是为了能够在下一代产生新的个体,通过交叉操作,遗传算法的搜索能力得以飞跃地提高,它是遗传算法获得优良个体的最重要的手段。常见的二进制交叉算法有单点交叉、多点交叉、均匀交叉洗牌交叉和缩小代理交叉等。作者采用了单点交叉方法。以交叉点为分界点,将两个父个体交叉点后的基因位进行交换。3)变异算子变异过程是一种局部随机搜索,与选择和交叉算子结合在一起,保证了遗传算法的有效性,使遗传算法具有局部的随机搜索能力:同时又保持了种群的多样性,以防止出现非成熟收敛。变异操作中变异率不能取的太大,如果变异率大于0.5,遗传算法就退化为随即搜索。二进制变异方法有基本位变异法、换位法、复制、插入和删除等。作者采用基本位变异法,也就是基因位的翻转,即0变l或1变0。3.5.4.4基于遗传算法的粗糙集特征归约方法的时间复杂性分析根据文献[146],作者基于面向对象技术对原算法框架进行了全新设计,采用c++实现了标准遗传算法模板类,真正意义上将吒。』丸。Q一、q。和t。作为算法参数。针对属性约简应用中可能存在多个约简的实际情况,作者对算法进行了改进,在 第三章旋转机械故障诊断的特征挖掘方法研究算法中将约简集合映射为最佳种群,表3.10给出这个简单遗传算法。表3.10简单遗传算法Tab.3一lOSimplegeneticalgorithm简单遗传算法。Nw.Np,C∽,n。,n一,,n“目,l“最佳基因q一集合。%。+oldpop,4newpop,柚estp叩;,,当前代种群,新一代种群,最佳种群IfI。l≤30thenN"P=矿IElseJⅣW230Initialize(oldpop,Ⅳ。,n。,,o).//初始化种群Fori21toⅣⅣ{sum=0;Dofnum=0;//$十群的选择和交叉q~(oldPop,newpop,‰,gm,num);胴中群的选择和交叉Forj=1tollunlnewpopO].f乏。;/,个体变异/o(n唧op);,,计算适应度(13)sum=$11nl+Ixllm;(14)}while(sum≤‰);,,检查种群中个体是否已遍历f!!!鱼!堡!坠g!!!f!!竺里12:!竺!£型:!生里堑墨堡茎里堡垒根据上表可知,遗传算法的计算时间主要与种群大小、进化代数和适应度计算方法有关,故遗传算法时间复杂性为o(^k+^ks厶。,的计算复杂度)。根据式(3—37),适应度计算的时间复杂性为o(Iul2)。因此,基于遗传算法的粗糙集特征归约方法的时间复杂性为o(Ⅳ玉也。Iun。设决策表的条件属性为lcl=20,^k=40,^k=30(2”>30),三种约简时间复杂性的对比见表3-11。袁3.11三种算法的时间复杂性对比Tab.3.11ComparisonofthreealgorithmsOlltimecomplexity时间复杂性lUI10100100010000基于区分矩阵约简1.0000E+41.0000E+81.0000E+121.0000E+16堇三望堡薹鎏丝塑!:;鲤!兰:!!:!!!!星旦!:!!!!里±!!:!!!!曼±旦...62一融觚籼磊m圆∽∽④@④∞∽㈣mm 申请上海交通大学工学博士学位论文3.6应用实例3.6.1专用的特征挖掘工具RMFMiner根据MODOSA的算法实体类模型(见图2-19)和旋转机械故障诊断的特征挖掘模型(见图3—4),在旋转机械故障诊断的特征值和特征归约理论研究的基础之上,作者设计了一个专用的特征挖掘工具RMFMiner用于旋转机械特征挖掘,其主要算法静态模型见图3-6。图3.7是进行特征自动识别的动态模型,它婕示算法静态模型中部分算法类的协作方法,其中引入“co曲吣l>>FMinerController类(特征挖掘控制器类)来实现挖掘过程的控制。Ⅱ]3-6RMFMiner的静态模型Fig.3-6StaticmodelofRMFMiner根据图3-6可知,抽象的归约算法(Reduction)、归一化算法(Normalization)、评价算法(Evaluation)和分类器(Classifier)都从基类Algorithm派生获得,这样保证了算法接口的统一性。Reduction又派生出SampleReduction(样本归约类)、Discmtization(离散化类)和FeatureReduction(特征归约类)。其中,MChiMerge类即为作者改进的基于冲突水平的多特征离散化算法。它使用了ChiMerge算法模板类;GARSReduct类即为作者提出的基于遗传算法的粗糙集特征归约算法,它使用了GA 第三章旋转机械故障诊断的特征挖掘方法研究(遗传算法)模板类,RSFitFunc(粗糙集适应度类)是连接GA类与RoughSet(租糙集类)的桥梁。Classifier派生出了RSTClassifier(粗糙集分类器类)和ANNClassifier(人工神经网络分类器类),其中GBPNN为普通反向传播分类器,它使用了与Matlab提供的Engine接口类。Evaluation派生出了KCrossValidation(K折交叉验证类),它需要选择一种Classifier作为器评价工具。图中部的水平线将图分成两部分,上部分为使用Record数据类型的算法类,下部分的类是采用普通数据类型的具体算法实现类,其目的已在第二章说明此处不在重复。l二t一到l竺Il竺竺|1竺I也;。。,。。。;皇{。。。——。。,。甜。。。。。恳篙≯⋯t-jJ’lt18it*Ⅱ自日J’IJ。L‘【E意裂’ll**J、图3-7特征自动识别的动态模型Fig.3-7Dynamicmodeloffeatureautorecognition3.6.2特征知识挖掘实例采用本文图3—7的流程,对来自于转子系统模拟故障的60个的原始时间序列样本ur:‰,Ⅳ,,⋯,“。{进行特征挖掘。转子系统的故障模拟和数据采集详见附录A。图3培至图3一12是样本的典型时间和频谱波形,图3-8为在正常情况下且转速为3000rpm时的转子振动信号;图3-9为在不平衡(1.29)情况下且转速为3000rpm时的转子振动信号;图3.10为在径向碰摩情况下且转速为3000rpm时的转子振动信号;图3-11为在不平衡(2.09)+径向碰摩情况下且转速为1200rpm时的转子振动信号:图3一12为在油膜涡动情况下且转速为1640rpm时的转子振动信号。 申请上海交通大学工学博士学位论文1lj010801108I800800I『\f\』I《yVyVIIV《JyI《《V《VJ《I1j诂r—志广—扬—1占—苟矿—菇r—菇r—南一一土图3.8在时域和频域中正常转子的振动信号Fig.3-8Goodrotorvibrationsignalintimeandfrequencydomain图3-9在时域和频域中转子不平衡时的振动信号Fig.3-9Unbalancerotorvibrationsignalintimeandfrequencydomain1/一亩1打—高—前r1打—南—二图3.10在时域和频域中转子径向碰摩时的振动信号Fig.3-10Radialrubrotorvibrationsignalintimeandfrequencydomain—EE—t口j盖呈、㈧¨女二j“Ⅲ一叫。萼_叶■o,}u1∞qn1。a£‘...}l一.【1i,0I叫删i孙赋i吲∥ 第三章旋转机械故障诊断的特征挖掘方法研究ROtormUnbalance+RadialRubRolorinU曲Ⅻ㈣’RadlaIRub图3.1l在时域和频域中转子不平衡+径向碰摩时的振动信号Fig.3-1lUnbalance&Radialrubrotorvibrationsignalintimeandfrequencydomain图3.12在时域和频域中转子在油膜涡动时的振动信号Fig.3-12Oilwhirlrotorvibrationsignalintimeandfrequencydomain3.6.2.1数据变换故障诊断的一个重要途径是通过振动信号的频谱分析揭示振动过程的频率结构,特别是随着快速傅里叶变换(FFT)算法的出现和近代谱分析仪的推出,频域分析现已被广泛采用。大量的文献表明,频谱分析在诸如对汽车发动机Ml、齿轮箱1148啪0l、直升机电动舵机[151】、钻加工过程c”21以及其他旋转机械的故障诊蝌”3。”51中都获得了广泛的应用。对于不同的机械设备和结构系统,在不同的工况下其频谱的幅值和形状是不同的,在特征频段上特征量的大小和比例关系可以反映出相应的故障类型,各种故障的频域特征是较为明确、集中和有规律可循的,不同的频率分量对应不同的振动原因。因此,作者选择以频谱分析作为数据变换方法,通过特征知识的挖掘,验证本章前面提出的特征挖掘方法和本节提出的特征知识挖掘框架的有效性。 申请上海交通大学工擘博士学位论文3.6.2.2特征知识挖掘数据集的构造方案1)基于频谱分析的条件属性构造方案根据文献[156],一般异常振动(包括不平衡、不对中、弯曲、螺栓松动)的频带属于低频段[o,5^];齿轮故障的频带属于中频段[5Z,1000Hz];轴承故障的频带属于高频段[1000m,~】。作者采用了如下基于频谱分析的条件属性构造方案:首先,在功率谱估计的基础上进行特征向量构造,谱估计公式见(3.38)。为了减少功率谱估计的随机误差,需要对功率谱估计进行平滑处理,首先将有限长采集数据分为Ⅳ段,每段为M个记录(M∈{1024,2048,4096});再将相邻两段数据重叠50%,则数据总段数变为2N/M一1;最后,每9个数据段的谱估计平均一次得到承厂)。e(厂)=i1fz(州2(3.38)然后,选择频率范围为帆/8,(5+l/8)工】,以‘/4为带宽,将眈/8,(5+1/8)Z3频带分为20个区间,每个区间的中心频率为以/4,i=l,2,⋯,20,采用式(3—39)计算各区间的能量P(f),如图3.13所示。另外,将奇数工频也作为一个特征,记作P(21),见式(3_40)。P(f):∑百(‘,),毕≤J.4厂<掣(3-39)jEⅣo0P(21)=P(4)+P(12)+尸(20)(3—40)最终,用以f)构造一个基于频谱分析的条件属性集合c={P(0,爿2),⋯,P(21)}。条件属性的值域为%=f(u。,c)=【0,+o。),此处的信息函数f(u;,C)就是频谱分析。G(门Ir,P爿4)∥彪/J口(0/hffTl南、一毒援监L等J盐华H半。旦矗LJ坐虼3xj图3.13功率谱中区间的示意图Fig,3-13Schematicofpowerspectrumsections 第三辛旋转机械故障诊断的特征挖掘方法研究2)决策属性构造方案根据第三章的实验研究,决定采用状态类型作为决策属性D=fConditionType},共有五中状态:正常(GOOD)、不平衡(uBAL)、径向碰磨(RRUB)、不平衡+径向碰(UBRR)和油膜涡动(0ILW)。决策属性的值域为%={l,2,3,4,5}。3)特征知识挖掘数据集方案根据u7、A(A=CtJD)、/和矿(y=屹u%),可以根据式(3一I)获得知识表达系统KRS=fUr,A,},,f),即特征知识挖掘数据集U7。4)特征知识挖掘数据集中样本示例图3—14显示了五种故障的~组频域特征之间的关系,可以看出它们不是线形可分的。DemostrationofSamplesinDataSet,址t几buteINdex图3.14五种状态下样本的示倒Fig.3-14Demonstrationofsamplesinfiveconditions3.6.2.3样本归约对于基于频谱分析的特征知识挖掘数据集,不存在去除丢失属性值样本的问题。因此,样本归约主要有两个任务:重复样本检查和冲突样本检查。1)重复样本检查;U。={坼∈Ur,“,∈U7lf(u,,一)=f(u,,4)},仅在数据集矿中保留一个U。中的样本,令此样本的权值等于Iu5I,其余样本全部从数据集u7中删除。2)冲突样本检查:根据式(3—5)对∥’进行检查,从扩中删除冲突的样本。 申请上海交通大学.T-学博士学位论文3.6.2.4特征值归约采用表3-1的算法进行特征值归约,算法参数如下:_不相容事件数k;2,r=0,在显著水平口=O.1下查表得z2(1)=2.706;_离散化区间数为Ⅳ=3;一允许的冲突水平为O%。经过计算,获得两个分割点值6l和如,见表3一12。根据这些分割点值,将数据集的每个属性值离散化为三个区间:[O,61)、【6l,62)和[b2,+。0),每个区间的属性值分别量化为0、1和2,对应的描述性语言是幅值低、中和高。表3—12分割点^和62的值Tab.3-12Valuesofcutpoint6land62条件属性b,(mm2)b2(mm2)条件属性b1(ram2)b2(mm2)q0.000050.00015c120.00010.0004c,0.00020.0007Cl,0.000050.00015c,0.000050.00015C140.000050.00015吼0.004450.01955c。s0.000050.00015岱0.000050.00015C160.000150.0003吒0.000050.00015q70.000050.00015C,0,000050.00015qB0.000050.00015岛0.00020.00375C190.000050.00015c00.000050.00015c。0.000050.00015Cl。0.000050.00015c2.000460.01955q10,000050.000153.6.2.5特征归约采用3.5.4节提出的基予遗传算法的粗糙集特征归约方法进行特征归约,算法参数如下:一种群大小^k=50,最大进化代数^k=150,染色体长度为21;一q。为基本位变异法,变异概率为0.01:一q~单点交叉方法,交叉概率为0.25;_砬。为轮盘赌选择方法;一厶,见式(3—37),权值Weight为0.7:一允许的冲突水平为O%。经过计算,获得11个条件属性约简集合,见表3.13。在表3.13的基础上,统计各属性的频数,见表3—14。 第三章旋转机械故障诊断的特征挖掘方法研究袁3.13属性约简集合Tab3.13Attributereductionsets表3.14全部约筒集合中各属性的频数Tab.3—14AttributefrequencyinaIlreductionsets条件属性freq(cj)条件属性freq(c,1c1(叫4)4cl:(3∞5乇(叫2)10q】1c3(3吖4)1c142巳(1x)3cls0c53c16(4x)1c60c170e,10180Q(2曲7q90e94C20(5x)9cl。2c2】(1X+3X+5x)10o】l23.6.2.6最佳特征约简的选择采用3.5.3节提出的基于熵度量的最佳约简选择方法进行选择。利用式(3—32),获得21个条件属性对应的熵变化量4E(q),见表3·15。6个条件属性约筒集合的熵重要度见表3-16,最佳约简集合为{c2,c4,cl:,q。,c2。,c2。)。表3-15属性对应的熵变化量一AE(ctlTab.3—15Ag(ci)-Varianceofentropyforattributes 申请上海交通大学工学博士学位论文c,25.98c1425.98屯106.8ob25.98丘25.98om27.15“25.98c1725.98c,25.98Cls25.98c871.72q925.98co25.98C2025.98CIo25.98c2】106.8o】I25.98表3—16约简集合的熵重要度Tab.3-16En虹opyimportanceofattributes约筒集合1234567891011熵重要度318.8327.1318.8409.1318.8407.9318.8372.8,327.13.6.2.7生成特征知识针对当前的知识表达系统KRS=f矿,A,V,厂},获得的特征知识分成三部分:特征值离散化知识(见表3-12)、最佳特征约简知识c,={c2,c4,c1:,q。,C2。,C2。}和特征频数表(见表3-14)。3.6.2.8基于特征知识构造新的数据集根据特征知识和KRS=(Ur,A,V,f),形成新的KRS’=(u7,A’,V’,厂)。其中A’=C’uD,屹=,(珥,C’)={o,l,2j,V’=%u%。3.6.2.9特征知识的评价采用3.交叉验证方法,对特征知识进行评价。1)基于粗糙集理论的评价为了验证特征约简知识C7的有效性,采用粗糙集分类器进行评价。使用相同的特征值归约方法离散化^二Rs=(u7,A,V,,),它的分类效果与职∥=(矿,A’,矿’,-厂)对比见表3.17。对于丘醛=fu7,CuD,V,f),计算时间为1.95秒;对于KRS”=(uTc’uD,V,f),计算时间为0.292秒;使用特征知识对艘s=f矿,cuD,V,,)简化后,计算速度提高了6.678倍,分类正确率提高了23%。2)基于BP神经网络的评价为了验证特征约简知识c’的泛化性,采用Matlab引擎库,在Matlab6.5软件中构 第三章旋转机械故障诊断的特征挖掘方法研究造BP神经网络分类器进行评价。算法参数:一最小最大归一化方法:呓=(_-min)/(max。~1Ilin。),对数据集做线性变换,将值映射到区间[O,1】之间;-BP神经网络参数:三层前馈网络;Ⅳ输^展=Ⅳ妮=ICl,Ⅳ输m层=1D1;隐层传递函数为对数s形函数,厂(曲=l/(1+e。);输出层传递函数为饱和线性函数,当x≤0时,(功=0,当0旭:(峨I,m),则抛弃节点门;的分枝,将节点f转化为叶节点。对决策树采用上述策略,自底向上递归修剪。剪枝算法见表4—2。表4.2决蓑树剪枝算法Tab.4.2A190rithmofpruningdecisiontree算法:PruneTree,对给定的决策树剪枝。输入:未剪枝的决策树RawTree;输出:剪枝后的决策树BestTree;方法:(1)计算编号sP和EP之间样本数ItemNum;(2)计算编号sP和EP之问样本集的类分布ClassDist[MaxClass】(3)在当前豹类分布中找出最频繁的类作为BestClass:(4)用式(4.13)计算当前节点的预测误差率CttrError; 第四章旋转机械故障诊断的知识挖掘方法研究(51IfNodeType为叶节点thenTreeError=CurError,returnTreeError;(6)Else{forv=ltoForkNum(分枝数)(7)f按照属性值v将样本集重新排序,放于编号sP至KP之间;(8)TreeError=TreeError十PruneTree(当前节点的第v个分枝,sP'KP);11(9)计算当前节点样本最多分枝的错误率BranchError;(IO)If(CttrError<=TreeError&&CurError<=BranchError)then用叶节点替换当前节点;(111Else(BranchError<=TreeError)then用当前样本最多的分枝替换当前节点;r12)Else当前节点误差=TreeError;(t3)return当前节点误差;一14.6决策规则的生成及约简决策树经过剪枝后比原来更紧凑,但是仍然非常复杂。对于大型的决策树理解起来非常困难,为了使决策树模型更易理解,需要把达到每个叶的路径转换成IF-THEN规则。对决策树从根节点到叶节点的每条路径创建一条规则,IF部分包括到叶节点路径经过的所有检验,THEN部分是叶节点的类标号。此种形式的规则称为决策规则,所有叶节点的决策规则集能够与决策树一样对样本进行分类。由于规则来自于树,故规则的IF部分是相互排斥且完备的,规则的排列顺序对决策没有影响。4.6.1决策规则的约简当由决策树生成规则后,分类模型种决策规则的数量可能非常大,规则的约简可以提高模型的易理解性。设规则R和P分别为R:驴AandBThenClass~1(4-15)R。IfAThenClass一1(4—16)式中,F的前项是从R的前项中删除条件B获得的。我们删除对规则R进行约简的准则是基于规则R和科的正确性的悲观估计。设样本集合为c,,关于条件口的样本分类情况见表4-3,表中Y和m代表样本数。表4.3关于条件B的U样本分类Tab.4-3UClassificationinconditionB规则R包含样本数为M+删。,其中有确个误分类,因为不属于cf口踞一1。同理,规则R7包含样本数为M+y:+%+m2,其中有ml十珊:个误分类。根据式(4一13),规则R的预测误差率估计为^嘭“+铂,m1),规则F的预测误差 申请上海交通大学工学博士学位论文率估计为Ⅳ嘭’(Yl+Y2+%+%,m。+m:)。如果Ⅳ硭’>、(>、<>、(>和<

>,提出了如图5-6和图5—7所示的采集控制系统的静态和动态模型。 申请上海交通大学工学博士学位论文恤r呐n晌h窖强呻khm眺b8,善?7/fMonitoriagDillog严<,一、j、,、、(E一~一双户⋯一一⋯~:i)、一/\、、上—£/7、、一/一一”\\、二o//~∞mb\、∞.,^#/7一()卜.1一J、、一/L上』—kDP,A一“㈣Tm’、叩“pf『丁]i~一~、LL。。如ric"一羔癞图5-6ACS的静态模型Fig.5-6StaticmodelofACS1I_7I喁’t‘’l』图5.7ACS的动态模型Fig.5-7DynamicmodelofACS由图可知,EMU用例分析中的每个用例都对应了一个<>类(侧如,一,了一]二琶 第五章设备远程监测和故障诊断系统的实现MonitoringDialog),界面控制类(例如,UIDASController)管理着界面类和用例控制类(例如,UCDASController)之间的通信,用例控制类是界面控制类和<>类IDBAccess之间的桥梁,而数据库访问<>类DBAccess是IDBAceess类的实现。<>类IDBAccess并1]<>类DBAccess有效地分离了采集逻辑和数据库。<
>、“sPContainer>>幂1]<>原型被用来描述数据库模型。<>是数据库逻辑行为——存储过程的抽象。图中示意性的显示了关键的<>类MachineSet、Module和MPoint类,其他的一些实体类在第二章中已经描述,此处被省略。当进行采集时,UISampleController(采集控制器类)会创建MonitofingDialog(监测对话框类)的实例,并调用UCThreadController(用例线程控制器类)为所有的Module实例创建自己的采集线程,ThreadController会通过Module使用的BusFactory实例获得最新数据,然后写入本地硬盘、上载到网络数据库并通知UISampleController更新界面显示。图5.7中的黑框框起来的部分表示在不断的循环执行。5.3.4EMC的设计EMC位于企业研究中心,是一个基于Web的软件平台,负责控制和管理分布于同一个Intranet内的多个EMU,设置系统功能参数,存储和可视化监测数据,处理和分析数据,丛数据中抽取特征,诊断常见故障,发布各种与被监测设备相关的信息。5.3.4.1EMC的静态模型设计对于具有面向对象风格的系统而言,类是最重要的构造模块。为了实现高内聚、低耦合,在文献[104]的UML扩展机制和文献[197]的Web应用建模机制基础上,参考第二章提出的MODOSA实体类模型,建立了EMC的静态结构模型。图5—8所示的是EMC中远程监测系统的静态模型。当用户向<>RemoteMonitofing(服务器页面)请求进入远程监测系统时,一个具有三个<>(框架)的HTML格式的<>RemoteMonitoring.html(客户端页)被返回给客户端。左边的框架中是一个TreeMenu.html客户端页,它是~个功能菜单。当选择菜单上的功能funcfionl后,首先ChannelChoice服务器端页将产生~个ChannelChoice.html客户端页显示在<>MainWindow框架中,以便选择被监测通道,接着<>ftmctionl服务器端页将创建<>funcfionl.html客户端页,同时一个<>GUIObjectl边界类对象被嵌入在页面中用于可视化来自于数据库的数据。<>UIMonitoringController界面控制类将界面和监测逻辑隔离,<>UCMonitoringController将数据库访问控制类<>DBAccess和UIMonitoringController隔离。<>DBAccess类有效地分离了采集逻辑和数据库。<
>、<>和<>原型被用来描述数据库模型。<>是数据库逻辑行为——存储过程的抽象,它的操作<对 中请上海交通大学工学博士学位论文ji·酱存储过程。图中显示UCMonitoringControUer使用了七个实体类存储来自于数据r々J的数据,它们是Factory、Workshop、Machine、MachineDiagramlmp、MPoint、MapManager和Transducer类。图5-8远程监测系统的静态模型Fig.5—8Staticmodelofremotemonitoringsystem534.2EMC的报警机制EMC的报警机制包括几个基本过程:设置运行界限、产生报警、显示报警和存储‘J4i:{警相关的数据。为了产生实时报警,我们分析了WRMFDS体系结构,设计了两层订,『报警结构,如图5-9所示。一第一层报警一在EMU中产生实时报警。ACS首先从EMC的网络数据库中下载预定义的设备运行状态报警界限值,然后在启动DAS之前将它们下载至DAS的内存中。当DAS根据预定义的报警值产生报警后,ACS将输出报警到报警指示器上;与此同时,为了专家的进一步分析,ACS将分别上载报警表和与报警对应的原始数据到临时库和报警库。一第二层报警一在EMC中监测和确认报警。用户可以通过客户端测览器监测EMC中所有设备的报警。报警指示器中的报警每秒更新一次。远程监测系统将自动发送与报警相关的电子邮件给专家。专家将登录EMC去查看报警记录并分析它们。 第五章设备远程监测和故障诊断系统的实现曰仃———神±载预自i0BmⅫ△n镕自*4月:r—————1——————1——一——————f————叫丫自自*##qi韩::f丫脞m镕B*理庳T4斡R¨镕t朔。#2“’”’陷堪3“4、11[)m$日ii∞pq:)am,**。ttt÷—≮、:)豢:m镕t*∞m}“i目%H%#$t#sm}№*∞4“警oH“}m*4:UM%H§*|十*$m##镕=)《—㈣*”E,web页十m}m*镕io±Ⅲ一7【自自%£℃∞々《&*rIMm抽£#十*#n*∞月镕t÷。U:图5.9报警机制的执行场景Fig.5-9Alarmmechanismexecutionscenario5.3.43EMC的远程监测机制№喇目韵.nn;焉;;;晶啪=)m“f,|l“。”“睁、I**F71#*目目t*、lj旷”““”””l?,0、┃.1I┃如_┃t黼^十*gm-“乇┃Io远程监测机制的执行场景F.5—10Reotemoitoringmehanismexcutionscnario 申请上海交通大学工学博士学位论文设备远程在线监测需要迅速、庞大的数据交换,而过去常采用的胖Web客户端构架模式其实并不完全适合基于Web的实时远程监测,主要原因是在于HTTP内在的无连接行为无法保证客户端和服务器之间直接且持久的通信能力。由于WRMFDS中的EMC和EMU处于同一企业Intranet内,用户通过有效地控制客户端和网络的配置,可以将常用的胖Web客户端构架模式和远程对象传输协议进行组合,构成一种混合胖Web客户端构架模式,它是一种最佳的监测领域的客户端构架模式,其行为模型见图5.10。5.3.4.4故障诊断机制WRMFDS是~个数据驱动的系统。通过使用各种智能数据挖掘技术(诸如,粗糙集、人工神经网络和决策树),EMC中知识学习过程从故障案例库中抽取出专家知识。这个学习过程将形成诊断知识库,它包含神经网络模型、决策树模型和规则集。这些模型和规则将在一个基于案例的推理诊断机制下支持EMC和RDC中的故障诊断系统。基于案例的推理诊断机制主要包括选择诊断参数、执行诊断和保存诊断结论三个阶段,见图5.“。图5-11故障诊断机制的活动图Fig.5—11Activitydiagramoffaultdiagnosis在第~个阶段,用户可以选择诊断参数,诸如诊断模型(例如,整机或部件)、被检查的测点、检查的时间段和诊断方法(例如,神经网络模型/决策树模型/规则集)。-109. 第五章设备远程监测和故障诊断系统的实现在执行诊断阶段,在企业信息管理库和故障案例库中检索被诊断机器已有的诊断结论,如果诊断参数相同则复用已有的结论。否则,在故障案例库中检索是否有相同诊断参数的特征数据,若存在就复用做进一步诊断。如果诊断记录和特征都不存在,则从历史数据库中取出原始数据进行特征提取,并将新的特征数据存入故障案例库。然后,故障诊断系统根据选择的诊断方法从专家知识库中取出知识进行诊断。在最后阶段,用户将查看诊断结论。根据用户关于诊断过程有效性的反馈,系统对企业信息管理库进行更新。5.3.5WRMFDS的组件模型现在任何应用程序如果不希望一两年内进行大的重写,都至少要实现三个逻辑层:表示服务层、商业服务层和数据服务层。考虑到设备监测与诊断领域的特殊性,在Microsoft咱匀分层策略的基础上,WRMFDS采用五层划分方式,分别对应于驱动包装组件、表示服务层组件、应用逻辑层组件、数据访问层组件和数据库服务层组件五类组件,如图5—12所示,图中也显示了各个组件包之间的依赖关系。数据访问层⋯~Ji再;溪n,⋯]~剃一}--⋯一j应用。⋯一一诊断应用逻L.I设备维护应I:l用户管理应|}f辑组件包f}l用组件包I:i用组件包Ir—]^[]土.一1、[];.厂]I特征提取11诊断算法I:l报表应用1l监测应用组II组件包JJ组件包l:}组件包l件包一I—————a■———一m”r襻控l忙控件包f控分张龅}1基褙控f1艄槲包1驱动服务层图5.12WR.MFDS的组件模型Fig,5-12ComponentmodelofWRMFDS·驱动包装组件:由于EMU中的高速数据采集系统经常是采用第三方的产品,它们的驱动程序通常不是采用组件技术开发。为了在升级或更换采集系统时对EMU的影响减小到最小,WRMFDS采用驱动包装组件包来标准化这些驱动程序。·表示服务层组件:封装了静态图中I钓l<>和界面控制类。由于ActiveX控件仅适用于Microsoft的IE浏览器,当在其它平台上使用时,可以基于瘦客户端模式,通过添加图形绘制组件实现监测图片的显示。 申请上海交通大学工学博士学位论文一应用逻辑层组件:用于实现各种监测和诊断逻辑,管理表示层组件与数据访问组件之间的通讯。它主要封装T<>和<>类。首先对第四章和第五章提出的RMFMiner和RMKMiner进行组件化,将公用的算法组件化后封装于渗断算法组件包的相应组件中;然后,将RMFMiner中的特征挖掘流程封装成为特征提取组件包中的特征挖掘组件,将RMKMiner中的知识挖掘流程封装成为诊断应用逻辑组件包中的知识挖掘组件。_数据访问层组件:不论采用微软或Java的SQL调用层接口解决方案,它们都是通过调用API函数访问不同种类的关系或非关系数据库。它封装了<>数据访问控制器类,实现了数据与膝测和诊断逻辑的分离。一数据库服务层组件:采用存储过程访问数据库。虽然存储过程和触发器是用依赖于数据库的语言编写,无法实现数据库平台上的复用,但它可使事务运行性能变得稳定。5.3.6VSN—NetMDS的部署模型在前述的WRMFDS拓扑结构模型的基础上,图5一13给出了一个简化的VSN—NetMDS的典型部署策略,图中各组件的功能参见图5一12。图5.13VSN-NetMDS的部署模型Fig.5-13DeploymentmodelofVSN-NetMDS5.4WRMFDS原型的实现为了验证前述MODOSA模型和WRMFDS设计的有效性,我们开发WRMFDS的原型系统VSN-NetMDS,并在自行构建的测试环境中进行了测试。根据WRMFDS的设计,VSN-NetMDS分别对EMU、EMC和RDC进行了实现,并建立EMC和RDC各自的数据库系统,系统框架见图5—14。 第五章设备远程监测和故障诊断系统的实现WRMFDS原型VSN.NetMDSRDC原型EMC原型EMU原型VSNsNetRDCVSNsNetEMCVSNsNetDAU数据库原型VSNsNetDB数据库原型VSNsNetDB图5—14VSN-NetMDS的系统框架Fig.5—14FrameworkofVSN-NetMDS5.4.1VSN-Nem回S的测试环境图5一15中两个转子试验台作为被监测对象。1号转子试验台是BentlyRK4。8个参数(3个转子的6个径向位移和轴端的2个径向位移)被实时监测。2个Jovian6槽JV53500(基于VXI总线的数据采集系统)分别采集了来自于2个转子试验台的16个通道的数据,并通过MXI.2总线将它们分别发送到2个DellAw.Precision530工作站(主控计算机),见图5.16。图5.152个转子试验台Fig.5-15Tworotortest-beds图5.16VSNsNetDAU的硬件Fig.5-16HardwaresofVSNsNetDAU5.4.2企业监测站原型根据WRMFDS的整体需求,VSNsNetDAU实现了EMU的设计。图5.16是硬件照片,图5.17是主控机上采集控制系统(ACS)的主界面,图5.18是JV53413采集参数设置界面,图5.19是JV53122采集参数设置界面,图5—20是ACS通道报警表。≯模块控制功能:目前有三类模块,高速并行采集模块,慢变信号扫描式采集模块和倍频器模块,主要是进行参数控制。其中控制的方式应该是多样化的,包括本地设置和远程设置。>数据追忆功能:按照系统要求需要有黑匣子功能,就是把当前采集的数据保 申请上海交通大学工学博士学住论文存在主控机SCSI硬盘上,便于发生故障时进行数据检查。≯网络数据存储:主要是把采集的数据进行整理,按照每个通道、每一秒钟往数据库存放一组数据(1024点)。另外,各个通道参数的初始化和保存也是放在数据库上,以便于缺省设置。≯报警功能,在实时性的监测系统中,应该具有数据的预处理功能,包括基本报警、六频段报警等功能。≯双机通讯功能,将两个32通道的采集系统组合成一个64通道的采集系统,并且保证触发同步和采样同步。图5.17ACS的主界面Fig.5—17MainscreenoftheACS图5.19JV53122模块参数设置对话框Fig.5-19ParameterDialogofJV53122Module图5.18JV53413模块参数设置对话框Fig.5-18ParameterDialogofJV53413Module图5—20ACS的报警界面Fig.5-20AlarmscreenoftheACS以上五个功能是系统的主要功能,功能之间是并行关系,所以需要采用多线程技术,网络数据存储部分需要和SQLServer进行交互,所以在Vc++中采用COM/ADO技术也是必要的,通过存储过程对数据库进行数据存取。5.4.3企业监测中心原型根据WRMFDS的整体需求,VSNsNetEMC实现了EMC的设计。图5-21是 第五章设备远程监测和故障诊断系统的实现VSNsNetEMC的主页。5.4.3.1用户管理系统只允许管理员登录。用户管理系统的功能分为用户信息管理、用户系统设置和切换其他系统三部分。用户信息管理包括了在线用户和用户信息的查询、修改及删除功能;用户系统设置包括了设置管理密码、设置用户权限和发信息给用户等功能;切换其他系统可以引导管理员进入其他系统界面。图5—22是在线用户信息页。图5-21VSNsNetEMC的主页Fig.5-21VSNsNetEMChomepage圈5-22在线用户信息页Fig一522Onlinensgrinformationpage5.4.32设备管理系统负责设备信息的管理维护,包括设备硬件信息管理和相应的软件信息管理a本系统分为设备信息管理、整机简图设计、测点信息管理和测点布局管理四个功能模块,为状态监测系统提供辅助支持功能。该系统的用户权限设置为:操作员用户具有完全操作权限,其他注册用户只有查看权限而不能修改信息。图5—23是设备管理页面,图5.24是测点管理页面。图5.23设备管理页面Fig.5-23Equipmentmanagementpage图5.24测点管理页面Fig,5—24Measurementpointmanagementpage 申请上海交通大学工学博士学位论文5.4.33远程监测系统主要实现设备状态的在线髓测、报警信息及其管理、离线分析和报表信息输出等功能,是整个状态监测和故障诊断的核心之一。因此该系统的用户权限设置为:操作员具有完全操作权限,其他注册用户仅具有部分浏览权限。该系统实现了多台机器设备的在线监测,并可以通过“监测设置”功能随时切换所需监测的设备。在线监测包含了轴心轨迹、轴心位置、矢端图、波形监测、趋势分析、频谱监测、综合恩示、整机监测和温度趋势等多项实时监测功能。根据选择监测功能的不同,系统可以同时显示最多为4~16个测点的数据曲线。离线分析也包含了目前较新的分析方法,如EMD分析、全息谱分析等等。为了让用户能够实时了解报警信息,各个监测和分析页面中都包含报警状态条,实现滚动显示报警数据库中最近报警的相关信息和机器实时转速的功能。图5—25是整机状态监测页面,图5.26是启停车过程的瀑布图监测页面。图5.25整机状态页Fig.5·25Completemachinestatuspage图5.26瀑布图页Fig.5-26Waterfallpage5.4.3.4故障诊断系统故障诊断系统可以对历史数据进行初步的故障诊断并将诊断结论存入故障结论数据库。针对故障案例库,在数据挖掘技术的基础上,该系统实现了基于神经网络和决策树的自学习功能。推理策略有基于案例、基于规则和神经网络模型的演绎推理策略,控制策略为正向推理控制策略。为更加准确、可靠地对故障数据进行诊断,允许专家用户上传诊断知识。因此该系统的用户权限设置为:专家用户具有完全操作权限,操作员可以浏览但不能修改和保存,其他注册用户没有进入该系统的权限。1)知识获取功能VSNsNetEMC提供了知识自动获取和和交互式上传两种方式。目前的自学习功能主要使用基于决策树的知识挖掘组件实现。图5-27是自学习案例选择页面,图5—28为决策树自学习获得的知识页面,图5.29是交互式上传诊断知识页面,图5—30是上传诊断知识的测试结论。 第五章设备远程监期{和故障诊断系统的实现图5.27知识自动获取页Fig.5—27Automaticknowledgeacquisitionpage图5.29诊断知识上传页Fig.5·29Diagnosisknowledgeuploadingpage图5.28知识表示页Fig.5-28Knowledgerepresentationpage图5.30上传知识的测试结论Fig.5-30’Ibstresultofuploadedknowledge2)故障诊断功能第一步是进行诊断方式选择。共有测点诊断、部件诊断和整机诊断三种选择,其中整机诊断为诊断功能扩展预留接口。测点诊断是根据诊断系统某一测点的信息进行诊断。系统测点的信息一般是根据系统该测点处的振动时间历程获取的诊断信息,可以包括振动信号的时域信息、频域信息和相位信息等。由于测点诊断仅仅利用测点的信息进行诊断,其利用的信息量少,因此仅能给出该测点处的系统大概的运行状况。由于不同的诊断方法利用上述部分或全部信患,因此得到的诊断结论会有差异。部件诊断是利用系统某一部位或部件的信息进行诊断。系统某一部位或部件的信息可以包括若干个测点的振动信息以及相关的慢变信号信息。图5—31是诊断方式选择页面。第二步是进行部位信息选择。当选测点诊断后将进入测点部位选择界面,见图5.32。系统将根据选择的测点信息进行诊断。系统测点的信息一般是根据系统该测点处的振动时间历程获取的诊断信息,可以包括振动信号的时域信息、频域信息和相位信息等。 申请上海交通大学工学博士学位论文图5-31诊断方式选择页Fig.5-31Diagnosismodeselectionpage图5.32部位信息选择页Fig.5—32Diagnosispositionseleefionpage第三步是进行诊断数据选择。根据用户选择的测点类型,诊断数据选择页面(见图5-33)会显示指定时间段内测点相关通道的待检数据列表,用户可使用鼠标键选择多条记录进入下一步。图5.33诊断数据选择页Fig.5—33Diagnoseddataselectionpage图5.34诊断方法选择页Fig.5-34Diagnosismethodselectionpage第四步是进行诊断方法选择。根据已选择的待诊断样本集的特性,用户可以选择粗糙集诊断、灰色诊断、决策树诊断、模糊诊断和神经网络诊断,图5—34是诊断方法选择页面。当选决策树诊断后,系统将显示对于当前机器和测点已获取的决策树知识列表,见图5.35。用户可以选择某一决策树知识集对当前的待检数据进行诊断。第五步是查看诊断结论。图5—36是诊断结论页丽,页面上部是诊断结论列表及相应的置信度,下部是结论的解释。最终,用户可以保存诊断结论,或选择其他诊断方法再进行诊断,以便得到一个综合结论。-117- 第五章设备远程监测和故障诊断系统的实现图5.35诊断知识选择页Fig.5-35Diagnosisknowledgeselectionpage图5.36知识表示页Fig.5—36Diagnosisresultpage5.4.4VSN—NetMDS的安全机制由于VSN-NetMDS是基于Intranet和Intemet的系统,所以安全性是需要考虑的。通过使用TCP/IP协议,Intemet上的资源是到处都可以访问的。VSN-NetMDS的安全性是提供以下策略获得保证的:一为了将内部网络和Internet分离,可以在VSNsNetEMC和VSNsNetRDC中使用带有防火墙的代理服务器。_通过使用IP地址和用户权限信息(例如,用户名和密码)来实现授权的web访问。所有的资源都存放在WindowsNT文件系统(NTFs)中。_所有的操作系统都安装了servicepack4.0补丁。IIS5.0的补丁也被安装。数据库服务器上装了SQLServer2000servicepack3.0补丁。●使用加密算法加密用户信息。因为客户端的ADO远程对象桩需要使用数据库连接信息实现数据库的访问,所以也需要对数据库连接信息进行加密。_VSNsNetDAU中使用了追忆硬盘,它类似于飞机上的“黑匣子”。当机器发生故障后,用户可以在环装数据文件中查询故障时间附近的指定数据块。Web服务器和数据库服务器都采用了冗余磁盘阵列1(RAID1)模式。如果出现硬盘故障,数据也不会丢失。5.5MODOSA模型的总结由于可视化建模一个软件密集型系统,要求从几个角度去观察系统。体系结构可以驾驭不同的观点,并在整个项目的生命周期内控制对系统的迭代和增量式开发。通过前述章节对MODOSA不同部分的研究,现在采用5个互连的视图来描述整个MODOSA模型,见图5.37。其中,每一个视图是在一个特定的方面对MODOSA的组织和结构进行投影。 申请上海交通大学工学博士学位论文设计视图MODOSA领域模型MOD0sA对象模型RMFMiner的静态和动态模型RMKMiner的静态和动态模型l,一Acs的静态和动态模型/用例视图EMC的静态模型/进程视图报警机☆Ⅱ模型远程监测机制模型故障诊断机制模型存储数据活动图上载数据活动图1RMFDS问题域描述IRMFD$用例模型实现视图WRMFDS组件模型实施视图IRMFDS拓扑结构模型WRMFDS拓扑结构模型WRMFDS包模型VSN-NetMDS部署模型图5.37MODOSA模型Fig.5-37MODOSAmodel_用例视图:用来描述最终用户、分析员和测试人员的角度所看到的系统行为的用例。主要是在问题域描述的基础上,利用用例图对系统的静态方面建模。IRMFDS问题域描述和用例模型属于此视图。通过IRMFDS问题域研究,进一步明确了基于网络的远程监测和诊断的需求以及系统的责任,为将来建立一个符合问题域情况、满足本领域需求的MODOSA模型打下基础。IRMFDS用例模型划出了IRMFDS和与该系统打交道的人和物之间的明确界限,明确了系统的范围以及与外部世界的接口。_设计视图:包括构成问题域(空间)和解空间的词汇的类、接口和协作,使用类图和对象图对系统的静态方面建模,利用交互图、状态图和活动图对系统的动态方面建模。MODOSA的领域模型、MODOSA对象模型、RMFMiner的动静态模型、RMKMiner的动静态模型、ACS的动静态模型和EMC的动静态模型都属于此视图。根据IRMFDS的问题域描述和用例模型,可以对远程监测和诊断这一类应用系统进行系统化分析,进一步发现该领域的共同知识、需求及其应用系统的共同特性,从而建立了MODOSA的领域模型,它实质上是本应用领域共同概念的集合。MODOSA对象模型中的类没必要与领域模型中的概念的一一对应,而是开发一个面对未来变化更加健壮、更加可维护的模型。ACS的动静态模型给出了EMU的主要类、接口及其协作方式。EMC的动静态模型给出了EMC的主要类、接口及其协作方式,RMFMiner和RMKMiner的动静态模型则对EMC中知识获取系统的主要类、接口及其协作方式进行了详细的描述。最终,在此视图基础上,用户可以实现源代码级复用。_进程视图:包括构成系统并发与同步机制的线程和进程。主要利用与设计视图相同的图描述系统的动态方面。报警机制、远程监测机制、诊断机制、数据存储机制和数据上载机制属于此视图。报警机制使用了一个两层的报警模型。远程监测机制使用了一个混合式胖客户端监测模型。诊断机制则是采用了基于案例推理的诊断模型。由于数据采集系统中同时存在快变信号采集模块和慢变信号采集模块,为了保证 第五章设备远程监测和故障诊断系统的实现两种不同采集速度的模块不互相干扰、提高数据的保存速度、不丢失数据点,ACS为每个快变信号采集模块单独建立一个数据保存线程,慢变信号采集模块采用定时器的方式来保存数据。因此,通过采用多线程数据存储机制,ACS使同种或不同种类的多个模块都可以同时进行数据采集。数据传输是在不同的线程之间进行,涉及到ACS软件开发中的多个层次,包括DSPs层、驱动层和数据库层,主要基于工作者线程实现了数据上传机制。-实现视图:包括组装和发布物理系统的组件。利用组件图和交互图对系统的静态和动态方法进行建模。w删FDs组件模型属于此类视图。在Microsoft的分层策略的基础上,MODOSA采用五层划分方式,它将使系统具有更好的健壮性和复用性,以后可以很容易地使用其他低成本的采集系统硬件(例如PXI总线仪器)、不同的表示服务(例如应用程序)和不同的数据库技术(例如,Oracle)来代替现在的驱动包装服务、表示服务和数据库服务。最终,在此视图基础上,用户可以实现二进制级的复用。·实施视图:包括构成系统的硬件拓扑结构且系统在其上执行的节点。利用部署图对系统的进行建模。IRMFDS拓扑结构模型、WRMFDS拓扑结构模型、WRMFDS包模型以及VSN—NetMDS的部署模型都属于此类视图。拓扑结构模型和部署模型可视化了MODOSA的拓扑结构以及软件组件如何在客户和服务器上分布的决策。通过对MODOSA模型的构建过程可知,不可能一次建立一个满意的系统体系结构,我们必须采用用例驱动的、以体系结构为核心的、以增量迭代的方式来不断地细化系统的体系结构。通过MODOSA模型的不断完善,实现体系结构级的复用。最终,从低到高实现三个级别的复用支持。5.6本章小结基于软件体系结构技术和组件技术的软件开发是软件开发的高级阶段,在第二章MODOSA研究的基础上,通过WRMFDS的设计和实现进一步深化了MODOSA的模型,完成了在WRMFDS案例基础上的MODOSA数据库模型、静态和动态模型、组件模型以及部署模型的总结,在一定程度上证明了本文相关研究内容的正确性与有效性。MODOSA研究的主要思想就是让“瀹当的专家做恰当的事情”,诊断领域的开发人员将开发精力放在监测和诊断逻辑方面,而不用考虑系统构建的问题,它为状态监测领域的开发者提供了一个实现此类系统的范例。实践表明,MODOSA模型将使机械设备状态监测和故障诊断系统的开发和应用进入一个崭新的发展阶段,对于推进先进信息技术在本领域中的应用有着积极的意义。 中请上海交通大学工学博士学位论文6.1本文总结第六章结论与展望目前,在状态监测和故障诊断领域的软件体系结构、系统开发模式、知识获取模型和知识获取技术等方面还存在羞一些不足之处。随着Internet技术、组件技术、软件体系结构理论和数据挖掘理论的发展和完善,综合运用数据挖掘理论和各种计算机主流技术,构建系统解决远程监测和复杂诊断问题己成为故障诊断发展的重要趋势。因此,本学位论文在国家“十五”科技攻关计划重点项目“基于网络的设备远程监测与故障诊断系统”和国家自然科学基金重点资助项目“大型复杂机电系统早期故障智能预示的理论与技术”的资助下,以软件体系结构和数据挖掘为理论基础,对设备的监测和诊断系统的软件体系结构模型、特征识别方法、知识获取方法以及系统的原型进行了理论、实验和实现的研究,其主要内容与结论如下:1)对目前设备监测和诊断系统开发领域存在的问题进行了总结,通过引入软件复用思想和体系结构理论,提出了一种面向监测和诊断的软件体系结构(MODOSA)模型。针对基于Internet的远程监测和故障诊断系统(IRMFDS)的问题域,给出了IRMFDS的拓扑结构模型,进一步提出了MODOSA的体系结构风格、用例模型、领域模型、对象模型、行为模型、组件模型和部署模型。2)通过对故障诊断领域信息特点的分析和诊断系统知识表达系统的总结,建立了旋转机械故障诊断的特征挖掘模型,针对故障特征的自动提取问题提出了采用数据挖掘中数据准备技术解决的方案。在特征值归约方面,提出了一种改进的多特征离散化算法;在特征归约方面,提出了一种基于遗传算法、粗糙集和信息熵理论的混合特征归约算法。3)在总结传统数据挖掘过程模型的基础上,对比故障诊断专家系统的知识获取系统,建立了旋转机械故障诊断的知识挖掘模型,针对故障诊断知识的自动获取问题给出了基于数据挖掘技术的解决方案。通过对决策树的构造、修剪、规则的生成和评价几个方面进行深入研究,提出了一种基于遗传算法和粗糙集理论的决策树构造算法和一个规则综合评价指标,并给出了规则匹配问题的一个解决方法。4)在前述MODOSA模型和数据挖掘理论研究的基础上,给出了两个专用数据挖掘工具RMFMiner和RMKMiner的设计和实现,初步解决了诊断特征的自动提取和诊断知识的自动获取问题,并采用转子故障模拟数据集和UCI国际数据集验证了两工具的有效性。 第六章结论与展望5)根据提出的MODOSA模型、特征挖掘模型和知识挖掘模型,结合RMFMiner和RMKMiner工具,采用Web构架设计‘了IRMFDS,并采用组件技术建立基于Web的远程设备监测和故障诊断的原型系统VSN.NetMDS,并在实验室的测试环境中验证了系统的有效性。此原型为状态监测领域的开发者提供了一个实现此类系统的范例。实践表明,MODOSA模型对于推进先进信息技术在本领域中的应用有着积极的意义。6_2主要创新点1)针对目前设备监测和诊断系统开发领域存在的问题,采用UML作为可视化建模语言,在基于Intemet的远程躲测和故障诊断系统(1RMFDS)问题域分析的基础上,通过详细研究tRMFDS的用例模型、领域模型、对象模型、行为模型、组件模型和部署模型,提出一个适可复用的面向监测和诊断的软件体系结构模型。此模型具有良好的复用性和可扩展性,可以提高此类系统开发的效率和质量。2)针对诊断专家系统中特征自动提取问题,以数据挖掘中的数据准备技术为基础,提出一种基于遗传算法、粗糙集和信息熵理论的特征归约混合算法。此算法在确保分类精度的同时,可以大幅度减少条件属性项大,从而使得知识获取系统和故障诊断系统工作速度加快,实时性增强。3)针对诊断专家系统中知识自动获取问题,提出了一种基于遗传算法和粗糙集理论的决策树构造算法,基于此算法的决策树分类器在性能上优于通常的神经网络、粗糙集和决策树分类器,在保持较高分类精度的前提下获取的规则数也为最小。同时,为了评价规则的合理性,又给出了一种包含了准确率、灵敏性、特效性和精度信息在内的规则综合评价指标,它比准确率更客观地评价了规则,并保证了相对低的偏置和方差。4)结合实际项目,在面向监测和诊断的软件体系结构模型的基础上,提出了一种基于Web的远程设备监测和故障诊断系统的体系结构风格,采用组件开发技术,设计和实现了原型系统VSN-NetMDS,为状态监测和故障诊断领域的开发者提供了一个范例。6.3研究展望在深入地了解了国内外基于网络的设备远程监测和故障诊断系统的研究现状、进展与发展趋势后,结合本文的研究工作,作者认为还需要在以下几方面问题需要进一步研究:1)在已实现了知识的存储和管理之后,需要进一步研究决策树的增量式挖掘算法,以便今后案例数据增加后,新的知识挖掘工作不需要从零开始,这样做的代价非常大。振动、冲击、噪声国家重点实齄室 申请上海交通大学_T-学博士学住论文2)本文主要是针对数据挖掘技术在知识获取系统中的应用进行了深入研究,但疑机器所反映的故障信息具有不完整、不精确、模糊和不确定的特点,各种信息在不同的征兆域有不同的表现,需要进一步对基于软计算和信息融合的故障诊断理论进行研究,以便综合利用机器所反映出来的故障信息,给出合理的诊断决策。将软计算和信息融合技术应用于状态监测和故障诊断是当今的一个研究热点。3)MODOSA模型还需要进一步的完善,使其在本领域的系统研制中实现系统级的复用,建立专向领域的软件体系结构是当今软件体系结构领域研究的热点之_二。4)进一步结合各领域的最新成果(诸如,嵌入式系统、无线传感器网络等),使监测和诊断系统的采集前端在信息量增大的同时成本大幅度降低,从而促进先进的监测和诊断技术在企业中推广。5)开发大量的面向监测和故障诊断领域的可复用组件,构建一个开放的监测和诊断方法的组件库,将对我国整个故障诊断学科的各种理论研究成果的积累和产业化创造一个瞧好的环境。随着我国加入世界贸易组织,国外状态监测和故障诊断公司大鼍涌入中国市场,这必将对我国高校的诊断科研经费的来源和本土检测公司的发展产牛蓖大冲击。面对外国公司强有力的产品,我们只有实现国内高校和公司之间广泛而}{乏期的合作,在整个企业和学科范围内进行广泛、深入的调查研究,制定开放式监测j=¨诊断方法组件库的有关标准,一方面发挥国内不同高校在不同理论研究方面的优£》,设计和开发各种监测和诊断算法组件;另一方压,国内的各种监测仪器生产厂商作为组件集成商构建整套监测系统,实现科研成果的迅速产业化。目前,VSN-NetMDS中许多已开发的组件在新的项目中已显示出良好的复用性,专用组件库的建立工作正矗j进行中。 申请上海交通大学212擘博士学位论文【l】【2】[3】【4】参考文献陈进,机械设备振动监测与故障诊断,上海,上海交通大学出版社,1999.屈梁生,何正嘉,机械故障诊断学,上海科学技术出版社,1986.E,Downham,VibrationinRotatingMachineryMalfunctionDiagnosisArtandScience、theFjrstCon£onVibrationinRotatingMachinery,UniversityofCambridge.1976.P-M.McGuireandDWPrice.TheDevelopmentandPracticalApplicationofRotorDynamicAnalysisTechniquesforLargeSteamTurbineGenerators,Int.VibrationinRotatingMachinery,Heriot-WattUniversity,l988.D.E.BentlyandA.Muszyuska,DetectionofRotorCracks,Proc.oftheFifteenthTurboMachinerySymposium,TexasA&MUniversity,1988,PP.129~136熊良才,何岭松,基于Intranet的轧机状态监测与故障诊断系统的研制,冶金自动化,2000,5:17—19.何岭松,王峻峰,杨叔子,基于因特网的设备故障远程协作诊断技术,中国机械工程,1999,10(3):336-338伍星,陈进,李如强,基于WEB的设各远程监测与诊断系统UML模型的研究,计算机工程2004,30(14):27-29.UsamaFayyad,PaulStolorz,DataminingandKDD:Promiseandchallenges,FutureGenerationComputerSystems.1997.13:99-115.TechniaclManual:800AProgrammableMachineryMonitoringsystem,SKFConditionMonitoring,lnc.,1992CMMSl00[110MultilogDigitalMonitoringSystemUserManual,SKFConditionMonitoring,lnc.,1992.徐敏,欧美大型旋转机械监测诊断技术发展近况与评述,第四届全国机械设备故障诊断学术会议论文集.1994.4.TechniaclManualofSystem50IOn—LineConditionMonitoringSystemofTurbomachinery,Vibro—Meter,Inc.,1994.Series5915MachineryConditionMonitoringSystem—UserManual,EntekScientificCorporation,1993IntroductionofTrendmaster2000System,BentlyNeva出Corporation,March,1992.孙惠国.设备状态监测与故障诊断.河南科学技术出版社,1993,CSINspectr-2全自动专家诊断系统介绍,加拿大CSI工业系统有限公司,1993ENTEK预测维修(PM)系统简介,ENTEK科学公司,1994.M.A.Moradian,TurbinAlD:TurbineArtificalIntelligenceDiagnostics,OWP5266,1991,周广顺,专家系统在汽轮发电机组故障诊断中的应用,哈尔滨工业大学学报,V0125,No.5,1993.M,AMoradian,Newideainon—linediagnosticsimprovesplantperformance,Power,No.5,】991.CategeryofSeries3300MonitoringsystemonTurbomachinery,BentlyNevadaCorporation,1990.Introductionofdamanagersystemofmachine,BentlyNevadaCorporation,1992.http://www.xjtu.edu.cn/xjneffacademe/index.html,200212.http://www.bcae.tom.crd.2002.12.振动、冲击、噪声国家重点实验室.125.吼嘲m嘲呻㈣陴∞畔mm∞呷呈lmⅢ瞄∞阱瞄 参考文献[47】[48】[49】【50](5I】HZ—l型汽轮发电机组监测与故障诊断系统鉴定资料,华中理丁大学,19934.旋转机械状态监测与故障诊断安全保护系统,清华大学,1990.9.常西畅,BB一1大机组振动监测与诊断系统级电站专用计算机系统,第三届全国机械设释故障诊断会议论文集,1991.5ZHX一10型200MW汽轮发电机组监测分析及故障诊断系统鉴定资料,哈尔滨电工仪表研究,1990.1.RB-20高速旋转机械状态监测与诊断系统鉴定资料,西安交通大学轴承所,19925.RB-20-2机组振动在线监测和远距离电话传输诊断系统鉴定资料,西安交通大学轴承所,1994.5.江大川,大型旋转机组状态监测分析及故障系统品质评定研究,上海交通大学博士论文,1995.11.吴伟蔚,杨叔子.远程协作故障诊断系统的设计及实现.计算机工程与应用,2000,1:139.141贾民平,许飞云.远程分布式汽轮机组故障诊断网络系统的研究.中国电机工程学报,1998.1,18(1):60-63J.E.LarssonandB.Hayes—Roth.‘'Guardian:anintelligentautonomousagentformedicalmonitoringanddiagnosis'’,IEEEIntelligentSystems,1998,13(1):58-64.R.Sacile,C.RuggieroandCLombardo,“CollaborativediagnosisovertheIntemet:aworkingexperience'’,IEEEInternetComputing,1999,36:29-37夏峰,盛焕华,赵家骜,上海医科大学”远程医疗系统”模型的建立和研究,软件学报,1998,9(3):222-226V.A.Drake,HK.Wang,I.IHarmanInsectMonitoringRadar:RemoteandnetworkoperationComputersandElectronicsinAgriculture,2002,35:77-94,H.Eriksson,“Expertsystemsasknowledgeservers”,IEEEExpertSystemsandtheWeb,PP.14—19.June1996.S.Bamberger,“Knowledge-baseddiagnosticsystemsintheIntemet'’,1EEEColloquiumonAIforNetworkManagementSystems,Digestno:1997/094,PP.9/1—9/4,1997.Rifkin,A.,IEEEIntemetComputing,l(3),28,1997.Kuchlin,w,etal,1EEE6thInternationalConferenceonEmergingTechnologiesandFactoryAutomation,115,1997.H.M.CNicholas,C.B.BernardandM.H.David.“RemoteinstrumentdiagnosisontheIntemet'’,IEEEIntelligentSystems,13(3),PP.70-76,1998.ROBERTITSCHNER,CLAUDEPOMMERELL,ANDMARTINRUTISHAUSER,”GLASS.remotemonitoringofembeddedsystemsinpowerengineering”IEEEINTERNETCOMPUTING(1998)7:46—52Wolf,G,etal.,Nature,391(5),613,1998.MarioGrabneretal,”JavainIndustrialAutomation—AVirtualPLC”0.7695.1372.7/01,IEEE,2001Basra,N.,ChemicalEngineering,pg.145,1997(3).DePasquale,P.,eta1.,TelemanipulatorandTelepreseneeTechnologies,4,159,1997.AIfredC.Weaveretal,"MonitoringandcontrolusingtheIntemetandJava”.0-7803—5735,3/99.1EEE,1999S.K.Ong,“Web—BasedFaultDiagnosticandLearningSystem”,IntJAdvManufTechnol(2001)18:502-51lhttp://demoimscentennet,2004..126.振动、冲击、噪声国家重点实验室㈣∽跚㈣㈣川旧㈣㈣鲫㈣鲫冈㈣M㈣㈣嘲㈤ 申请上海交通大学工学博士学位论文http://testctrl.hust.edu.cn/server/server.hta『l,2001,http://www.rdmsc.xjtu.edu.cn,2001.戚海明,基于Internet的远程机械故障诊断系统的实现,【硕士学位论文】,上海交通大学,20021.季立明,王太勇,基于Interact的远程监测诊断系统的设计与实现,微型电脑应用,2000,16(3),9-12。袁洪芳,王信义,基于Interact的FMS远程监测与故障诊断技术研究,制造业自动化,2000.5,22(5),37—39。ELearner,SpecificationSearches:AdhocInferencewithNonexparimentalData,Wily,NewYork,1978.G,Piatetsky—ShapiroandW.Frawley,eds.,KnowledgeDiscoveryinDatabasesMITPress,Cambfige,MA,1991.U.Fayyad,GPiatetsky—Shapiro,RSmythandR.Uthurnsamy,eds,AdvancesinKnowledgeDiscoveryandDataMining,MITPress,Cambrige,MA,1996.JianweiHan,MichelineKamber,DataMining:ConceptsandTechniques.CA:MorganKaufmannPublisher,2000),UsamaFayyad,DavidHausslar,PaulStolorz.KDDforScienceDataAnalysis:IssuesandExamples.ProceedingsoftheSecondInternationalConferenceOilKnowledgeDiscoveryandDataMining(KDD96),Portland,Oregon,August2-4,1996。pSBradley,UsmnaMFayyad.OL.Mangasarian.MathematicalProgrammingforDataMining:FormulationsandChallenges,JournalofCompting,specialissueOilDataMining,A.BashandB.Golden.1998.UsamaFayyad,Dataminingandknowledgediscovery:makingsenseoutofdata,IEEE0885—9000/96,1996.METAGroupApplicationDevelopmentStrategies:DataMiningforDataWarehouses:UncoveringHiddenPatterns,1995,7.GregoryPiatetsky—Shapiro,TheData-MiningIndustryComingofAge,IEEEIntelligentSystems,1999,PP.32-34HerbEdelstein,TwoCrowsReleases1999TechnologyReport,DataMiningNews,1999,2(18).杨文献,任兴民,秦卫阳,姜节胜,基于数据挖掘的复杂设备故障诊断方法研究,振动工程学报,2000:13(s):48-51高毅龙,数据挖掘及其在工程故障诊断中的应用,【博士学位论文】,西安交通大学,2000.3.关惠玲,张优云,韩捷等,从故障实例势力数据库中挖掘振动信号特征.振动工程学报,2002,13:335-342.谢涛,张育林,基于遗传算法与Shannon熵的故障监控参数优选,自动化学报,2000,9:666-671PengChen,ToshioToyota,ZhengjiaHe,AutomatedFunctionGenerationofSymptomParametersandApplicationtoFaultDiagnosisofMachineryUnderVariableOperatingConditions,IEEEl083-4427ml,200I.A.Joentgen,L.Mikenina,R.Webereta1.,Automaticfaultdetectioningearboxesbydynamicfuzzydataanalysis,FuzzySetsandSystems,1999,105:123‘132于勇,姜兴渭,黄文虎,基于粗集理论和遗传算法的知识获取方法研究,宇航学报,2001,5:114.118.振动、冲击、噪声国家重点实验室.127.旧嘲㈣嘲嗍唧㈣例㈣旧㈣例㈣㈣M吲㈣㈣嘲 参考文献f74】【75】【76]【77】【78】f79】【80】【8l】[82】【83】【84】[85】【86】f87】[88】【91】[92】[93]【94]杜海峰,王孙安,丁国锋,报,2001,9:940—944.张邦礼,孙颢楷,曹眭修,20(2):153-156.基于粗糙集与模糊神经厂埘络的多级压缩机诊断,西安交通大学学基于粗糙集理论的内燃机气阀故障诊断研究,内燃机学报,2002,陈长征,刘强,汽轮机故障诊断的遗传神经网络法,振动与冲击,2000,19(3):46.50ShulinLiu,WengangShi.RougbSetBasedIntelligenceDiagnosticsystemforValvesinReciprocatingPumps.IEEE0-7803—7087-2101.2001ShojiHAYASHI,ToshiyukiASAKURA,ShengZHANG,StudyofMachineFaultDiagnosisSystemUsingNeuralNetworks.IEEE0-7803.7278-6/02,2002.AndrewCMcCormick.NeuralNetworkAutoregressiveModelingVibrationsforConditionMonitoringofRotatingShafts.IEEE,0·7803-4122-8/97,1997:2214—22l8LixiangSbeneta1.FaultDiagnosisusingRou【ghSetsTheory.ComputersinIndustry,2000,43:61-72.Hsing-ChiaKuoetalNeural-fuzzyfaultdiagnosisinamarinepropulsionshaftsystemJournalofMaterialsProcessingTechnology,2002,122:12-22S.一L.Jamsa-Jounelaeta1.AprocessmonitoringsystembasedontheKohonenself-orgnizingmaps.ControlEngineeringPractice,2003,11:83—92A.C.M.Fong.S.C.Hui.AnIntelligentonlinemachinefaultdiagnosissystem.Computing&ControlEngineeringJournal,2001,10:217-224.D.GEsp、A.J.MeGrail.AdvaneesinDataMingforDissolvedGasAnalysis.ConfereuceRecordof血e2000IEEEInternationalSymposiumonElectricalInsulation.2000.PP456.459.K.FThang,RK.Aggarwal,D.G.Esp,ata1.StatisticalandNeuralNetworkAnalysisofDissolvedGasesinPower.DielectricMaterials,MeasurementsandApplicationsConferencePublication,2000,473:324-329.Blair,J,ShirkhodaieA,DiagnosisandPrognosisofBearingUsingDataMiningandNumericalVisualizationTechniques,Inproceedingsofthe33rd,2001,395099.Blair,J,ShirkhodaieA,,“BearingFaultIdentificationsUsingAgent-basedDataMiningandNumericalVisualizationTechniques'’,2001ASMEInternationalMechanicalEngineeringCongress&Exposition,Novll·16,NewYork,NY,2001Povinelli,RJ,Bangura,J.F.;Demerdash,N.A.O.eta1.,Diagnosticsofeccentricitiesandbar/end-ringconnectorbreakagesinpolyphaseinductionmotorsthmughacombinationoftime·seriesdataminingandtime-steppingcoupledFE—statespacetechniques,InThirty-SixthIASAnnualMeeting.ConferenceRecordofthe200lIEEE.2001.3:1579-1586.Povinelli.RJ.TIMESERjESD—JAMINING:1DENTlFYINGTEMPORAL科rTEItNSFORHARACTERIZATIaNANDPREDlCTl0NOFTIMESERIESEVENTS.PhDthesis.MarquetteUniversity,ComputerScienceDepartment.1999,11.Ogilvie,t:Swidenbank,E.;Hogg,B.WUseofdataminingtechniquesintheperformancemonitoringandoptimisationofathermalpowerplant,KnowledgeDiscoveryandDataMining,狂IEColloquium0n.1998.PP.7/1-7/4.htlp://www.mitgmbh.de,http://www.dataengine.de.张琦,韩祯祥。文福拴,一种基于粗糙集理论的电力系统故障诊断和警报处理新方法,中国电力,1998,4:32-36httO://www.zaptroncom.DerekSleeman,F.Mitchell,R.Miine,ApplyingKDDtechniquestoproduceDiagnosticrulesforDynamicSystems,TechnicalReport,August1996..128.振动.冲击、噪声国家重点实验室 申请上海交通大学工学博士学位论文[95】http://www—users.astonacuk:880/modiarot/.[96】L6tourneau,S,Famiti,A,Matwia,SDataMiningForPredictionofAircraftComponentFailure、IEEEIntelligentSystems:SpecialIssueonDataMining.Fall1999PP.59—66.f97】Famili,A,andL6tourneau,S.MonitoringofAircraftOperationUsingStatisticsandMachineLearning,1EEEInternationalConferenceonToolswithAI一99.Chicago,November9—11,1999.PP279—286.【98】Letourneau,S,Famili,A.,Matwin,S..DiscoveringUsefulKnowledgefromAircraROperation/MaintenanceData.ProceedingsoftheWorkshoponMachineLearningintheRealWorld,atthe14thInternationalConferenceonMachineLearning,London,England:Inpress.July,8-12,1997[99】Lehane,M.,DubF.,Halasz,M.,Orchard,R.,Wylie,R.,Zaluski,M.,IntegratedDiagnosticSystem(IDS)forAircraft:FleetMaintenance.ProceedingsoftheAAAIWorkshop:Case·BasedReasoningIntegrations.heldinMadisionWI.July1998.TechnicalReportWS-98—15.f100}1|:l叫畦R.,Orchard,R,Halasz,M.,andDubE,IDS:ImprovingAircraftFleetMaintenance.Proceedingsofthe14thNationalConfereuceonArtificialIntelligenceandInnovativeApplicationsofArtificialIntelligence(IAAl-97),Providence,ILl.July27-31,1997.PP.1078一1085.【101】McllroyD.,Mass-ProducedSoftwareComponents,InNATOConterenceofSoftwareEngineering,NewYork,1968,PP88—89.【102】董蕴美,软件复用,计算机百科全书,北京,清华大学出版社,1998.[103l邵维忠,杨芙清,面向对象的系统分折,北京,清华大学出版社,1998.【104】GBooch,J.Rambaugh,I-JacobsonTheUnifiedModelingLanguageReferenceManual,Addison—WesleyLongmanlnc,1999.【105】冯冲,江贺,冯静芳,软件体系结构理论与实践,北京,人民邮电出版社,2004[106】ShawM.,GarlanD.,So,warearchitecture:perspectivesollanemergingdiscipline,PrenticeHallInc,1996.【107】KruchtenP.B,The4+1ViewModelofArchitecture,1EEESoftware,1994(11):42—50.[108】DEPeuy,A.L.Wolf,FoundationsfurtheStudyofSoftwareArchitecture,SoftwareEngineeringNotes,1992,17(4).【109】D.Garlan,MShaw,AnIntroductiontoSaflwereArchitecture,AdvancesinSoftwareEngineeringandKnowledgeEngineering,VolumeI,WorldScientificPublishing,1993.【110】L.Bass,P.Clements,R.Kaanan,SoftwareArchitectureinPractice,Addison—Wesley,1997.[1lj1GBooch,J.Rambaugh,hJacobson,TheUnifiedModelingLanguageUserGuide,Addison-WasleyLongmanInc.,1999[1121BraunC.,CoutantR,,Armitag?J.,DomainSpecificSoftwareArchitecture:AProcessfurArchitecture-basedSoftwareEngmeerngIn:Proceedingsofthe1lthAnnualNationalConferenceonAdaTechnology,1993.[113】XingWu,JinChen,RuqiangLi,eta1.Internet-BasedRemoteMonitoringandFaultDiagnosisSystem,LectureNotesinComputerScience,vol3174,PP.567—573.[114】CraigLarman,ApplyingUMLandPalterns:AnIntroductiontoObject-OrientedAnalysisandDesign.PrenticeHallPTR,1998.[115】Jacobson,lvar.Object-OrientedSoftwareEngnieeringaUseCaseDrivenApproach.Addison-Wesley,1992.『116]黄文虎,夏松波,刘瑞岩等,设备故障诊断原理、技术及应用,北京,科学出版社,1997,47.74. 毒考文献【117】18】19】20l21]【122]【132][133】【134][135】【1361【137]【138][139】【140】韩捷,张瑞林等,旋转机械故障机理及诊断技术,北京,机械工业山版社,1997,91.141r玉兰,石来德,机械设备故障诊断技术,上海,上海科学技术文献出版社,1994,605.638BNCGLOSSARY,Version2.02,BentlyNevadaCorporation,2000BentlyNevada,ROTORKIT(modelP.K4),PartNumber:126376-01,2002BentlyNevada,ROTORK1TOilWhirl/WhipOption(modelRK4),PartNumber:137482.0I,2002.HeikkiMannila:Datamining:machinelearning,statistics,anddatabases.EightInternationalConferenceonScientificandStatisticalDatabaseManagement,StockholmJune18.20,1996,PP.1—8.李介谷,藜国庆,计算机模式识别技术,上海,上海交通大学出版社,1986。M.Kantardzic,DataMiningConcepts,Models,Methods,andAlgorithms,北京,清华大学出版社,2003陈进,伍星,数据挖掘在状态监测和故障诊断中的应用,2002年全国振动工程及应用学术会议论文集,上海高教电子音像出版社,pp:22—31.张文修,吴伟志,梁吉业等,粗糙集理论与方法,北京,科学出版社,2000.自木万博等,故障诊断、异常诊断及其对策——振动监测法,机械振动讲演文集,机械工业部郑州机械研究所,1984.J.Sohre,TurbomachineryMaintenanceHandbook,1980.曾黄麟,粗集理论及其应用,重庆,重庆大学出版社,1998.R.Kerber,ChiMerge:Discretizationofnumericattributes.InAAAI一92,ProceedingsNinthNationalConferenceonArtificialIntelligence,1992,PP.123-128.H.Liu,R.SetfonoDiscretizationofOrdinalAttributesandFeatureSelection.InProceedingsofthe7thInternationalConferenceonToolswithArtificialIntelligence,WashingtonD.C.,Nov1995.PP388—391.U.Fayyad,K.B.Irani.Multi—Intervaldiscretizationofcontinuosattributesaspreprocessingforclassificationlearning.InProceedingsofthe13thinternationalJoinConferenceonArtificialIntelligence,MorganKaufinann,PP.1022-1027.J,DOOgherty,R.Kohavi,M.Sahami.SupervisedandUnsupervisedDiscretizationofContinuousFeatures.InMachineLearning:ProceedingsoftheTwelfthInternationalConference.MorganKaufmannPublishers,1995.Rissanen,J.,Modelingbytheshortestdatadescription.Aotomatica,1978,14,PP.465-471A.Skowron,N.H.Son.QuantizationofRealvalueAttributes:RoughSetandBooleanreasoningapproach.InProceedingsofthesecondInternationalJohatConferenceonInformationSciences,WrightswilleBeach,NC,USA,1995,Sept,28-Oct.1.PP,34-37.边肇祺,张学工等,模式识别(第二版),北京,清华大学出版社,2000.顾雪平,张文朝,基于Tabu搜索技术的暂态稳定分类神经网络的输入特征选择,中国电机工程学报,2002,22(7):66—70.张鸿宾,孙广煜,Tabu搜索在特征选择中的应用,自动化学报,1999,25(4):457-466.于之虹,郭志忠,遗传算法在暂态稳定评估输入特征选择中的应用,继电器2004,32(1):16-20.刘斌,曾立波,刘生浩,血液细胞图像自动识别系统的研究,计算机工程,2003,29(1):174·176.∞M笱;写”勰拶如引}}} 中请上海交通是学5-学博士学位论文[141]史东锋,屈梁生,遗传算法在故障特征选择中的应用研究,振动测试与诊断,2000,20(3):17l-176【142】PawlakZ.,RoughSets.InternationalJournalofComputerandInformationScience,1982,11(5):341.348.[.143】PawlakZRoughsettheoryanditsapplicationstodataanalysis.CyberneticsandSystems,1998,29:661—688.【144】WangS.K.M,ZiarkoWOnoptimaldecisionrulesindecisiontables.BulletinofPolishAcademyofSciences,1985,33(6):693—676.[145】WangJ,MiaoDQ.Analysisonattributereductionstrategiesofroughset.JournalofComputerScienceandTechnology,1998,13(2):189-192【146】王小平,曹立明,遗传算法一理论、应用与软件实现,西安,西安交通大学,2002.【147】张海军,屈粱牛,汽车发动机诊断的统计模拟方法,汽车工程,2003,25(1):96-100.[148】李晓虎,贾民平,许飞云,频谱分析法在齿轮箱故障诊断中的应用,振动、测试与诊断,2003,23(3):168—170.【149】周风星,高立新,叶辉等,基于模糊控制的齿轮箱监测诊断系统,自动化与仪表,2003,3:19—2l[150】A.Joentgen,L,Mikenina,R。Weber,etc.,Automaticfaultdetectioningearboxesbydynamicfuzzydataanalysis,FuzzySetsandSystems,1999,105(1):123·132[15l】张华君,递推批量最小二乘在直升机电动舵机故障诊断中的应用,西安交通大学学报,2004,38(2):158—161.【152]ShuxinGu,Stationaryanduon—stationaryprocessconditionmonitoringandfaultdiagnosisanditsapplicationtodrillingprocesses,fPhDDissertation],MechanicalEngineering,UniversityofMichigan,1997.【153】马笑潇,柴毅,基于SVM的二叉树多类分类算法及其在故障诊断中的应用,控制与决策,2003,18(3):272-284【154】D.S.NalinakshS.Vyas,Artificialneuralnetworkdesignforfaultidentificationinarotor-bearingsystem,MechanismandMachineTheoryv01.2001,36.【155]GiovanniBetta,AlffedoPaolillo,andAntonioPietrosanto,ADSP—BasedFFT-AnalyzerfortheFaultDiagnosisofRotatingMachineBasedOilVibrationAnalysis,IEEETRANSACTIONSONINSTRUMENTATIONANDMEASUREMENT’2002,5l(6)【156]S.L.KwangheeNam,Diagnosisofrntatingmachinesbyutilizingabackpropagationneuralnet,IEEE,0-7803-0582—5/921992.【157】http://www,icsuci.ed啦mIe姗,MLsⅢmary.html,2004.【158】包约翰,自适应模式与神经网络,北京,科学出版社,1992【159】WilliamJ,Frawley,GregoryPiatetsky—Shapiro,andChristopherJ.Matheus.“KnowledgeDiscoveryinDatabases:AnOverview”,AIMAGAZINE,pages:57,70,FALL1992.[160】Fayyad,U.andR.Uthurusamy,ProceedingsoftheFirstInternationalConferenceouKnowledgeDiscoveryandDataMining(KDD-95),TheAAAIPress,MenloPark,CA,1995.【161】Brachman,R.andIAnand.TheProcessofKnowledgeDiscoveryinDatabases:AHuman·CenteredApproach.AdvancesinKnowledgeDiscoveryandDataMining,AAAI/MITPress,j996.【162】GregoryPiatetsky·Shapiro,KnowledgeDiscoveryinDatabases:10yearsafter,SIGKDDExplorations,2000.Volumel,Issue2,PP.59. 参考文献【163][164][1651【166】【167][168]【169】【170][171】[172】[173】【174】【175】76]77】78】79]【180】[18l】【182】[183][184l[185】UsamaFayyad,GregoryPiatetsky—Shapiro,andPadhraicSmyth,KnowledgeDiscoveryandDataMining:TowardsaUnifyingFramework.ProceedingsoftheSecondIntemationalConfefenceonKnowledgeDiscoveryandDataMining(KDD-96),Portland,Oregon,August2-4,1996,AAAIPress.Simoudis,ERealityCheckforDataMining,IEEEExpert,1996,11(5):20-25.TheCRISP—DMconsortium.CRISP—DM1.0:Step-by·stepdataminingguide.August2000.I。Breiman,J.Friedman,ROlshen,eta1.ClassificationandRegressionTreesMonterey,CA:WadsworthIntemationalGroup,1984.M.Mehta,RAgrawal,J.Rissanen.SLIQ:AfastscalableclassifierfordataminingInProe1996Int.ConfiExtendingDatabaseTechnology,Avignon,France,Mar,1996J.Sha如r,RAgrawal,M.Mehta.SPRINT:Ascalableparallelclassifierfordatamining.InProe1996Int.ConfiVeryLargeDataBases,Bombay,India,Sept.1996,PP.544-555.J.Gehrke.RRamakrishnan,v.Ganti.Rainforest:Aframeworkforfastdecisiontreeconstructionoflargedatasets.InProc.1998Int.Conf.VeryLargeDataBases,PP.416·427,NewYork,Aug.1998.sK.Murthy.Ongrowingbetterdecisiontreesfromdata,【PhDDissertation],DepartmentofComputerScience,JohnsHopkinsUniversi吼Baltimore,Maryland,1995.Wien.SienLim.Wei—YinL0h.Yu-ShahShiih.Anempiricalcomparisonofdecisiontreesandotherclassificationmethods,TechnicalReport979,DepartmentofStatistics,UniversityofWisconsin,Madison,June1997.SK.MuShyAutomaticConstructionofDecisionTreesfromData:AMulti-DisciplinarySurvey,DataMiningandKnowledgeDiscovery,1998,2:345-389.ClaudioBettini,SeanWang,SushilJajodia.Discoveringfrequenteventpatternswithmultiplegranularitiesjntimesequences,IEEETransactionsonKnowledgeandDataEngineering,1998,10(2):222·237DavidW'Cheung,YincentTNg,YongjianFu,Efficientminingofassociationrulesindistributeddatabases.IEEEtransactionsonKnowledgeandDataEngineering,1996,8(6):911—922陈文伟编著,智能决策技术,北京,电子工业出版社,1998.Hunt.E.B.Marin,J..Stone.EJ.,ExperimentsjnInduction,AcademicPress,NewYork,1966.J.R.Quinlan,Inductionofdecisiontrees,MachineLearning,1986.JRQuinlan,c4.5:ProgramsforMachineLearning.SanMateo,CA:Morgan,Kaufmazm,1993JC.Schlimmer,D.Fishor.AcasestudvofincrementalCOUCE:讲induction.InProc.5thNatl.ConfArtificialIntelligence(AAAI’86),SanMateo:MorganKaufmann,1986,PP.496-501.RE.Utgoff.AnincrementalID3.InProc.FiRhIntConf.MachineLearning,SanMateo,CA,1988,PP107-120.R.Uthurasamy,U.M.Fayyad,S.Spangler,Learningusefulrulesfrominconclusivedata.KnowledgeDiscoveryinDatabases,1991,PP.141—157.MManago.YKodratoIf.InductionofdecisiontreesfromcomIplexstructureddataKnowledgeDiscoveryinDatabases,1991,pp289-306.JGehrke,VGanti,R.Ramakrishnan,eta1.BOAT-optimisticdecisiontreeconstruction,InProc.1999ACM-SIGMODInt.Conf.ManagementofData,1999,PP.169-180.Ben.Bassat,Moshe,Useofdiaance/noasRres,informationmeasuresandor/orbotindsonfeatureevaluation.InKrishnaiahandKanal,1987,PP.773-791.Mingers,John.Expertsystems·ruleinductionwithstatisticaldata.J.oftheOperationalResearchSociety,1987,38(1):39-47. 中请上海交通大学工学博士学位论支[186]Lin,YKandKing—SunFu.AutomaticclassificationofcervicalcellsusingabinarytreeclassifienPatternRecognition,1983,16(1):6%80【187]【188】【189]【190】【191】【192]【193l【194]【1951[196】【197】Haskell,RE,andANoui—Mehidi.Designofhierarchicalclassifiers.InTheFirstGreatLakesComputerScienceConeProc.,Berlin,1991,pp118-124.White,AllanEandWeiZhangLiuTechnicalnote:Biasininformation-basedmeasuresindecisiontreeinduction.MachineLearning.1994,15(3):321—329.Risannen,Jorma.StochasticComplexityinStatisticaEnquiry.WorldScientific,1989.JR.Quinlan、UnkamwnattrthutevaluesininductionInPrncoftheSixth]nt,WorkshoponMachineLearning,1989,PP164—168汪荣鑫,数理统计,西安,西安交通大学出版社,1986.伍星,陈进,李如强等,设备远程监测与诊断系统UML模型的研究,振动工程学报,V01.17(S):576·580.陈一鸣,基于网络的远程监测和故障诊断系统的数据库系统,f硬士学位论文】,上海交通大学,2004.1.梁衍学,基于DSP的VXI采集系统的研究与实现,【硕士学位论文】,上海交通大学,2003.1陈良,远程故障诊断系统中的VXI总线高速数据采集系统研究,[硕士学位论文】,上海交通大学,2004.1,郭广伟,COM/DCOM技术在设备远程监测与故障诊断中的应用,[硕士学位论文】,上海交通大学,2004.1.JimConallen,ModelingWebApplicationArchitectureswithUML.CommunicationsoftheACM,v0142.NO.10、1999. 申请上海交通大学工学博士学位论文附录A转子系统故障的模拟及数据采集A.1实验目的在BentlyRK4转子实验台和自行设计的ZTR转子实验台上模拟转子系统的六种运行状态,包括正常、不平衡、径向碰磨、油膜涡动、轴裂纹和径向碰磨+不平衡。其中,在BentlyRK4上模拟正常、不平衡、径向碰磨、油膜涡动和径向碰磨+不平衡的机器运行状态,而在ZTR实验台上模拟轴裂纹的机器运行状态。通过模拟上述状态.获得转子不同恒速状态下的振动信号。A.2转子系统故障模拟A.2.1BentlyRK4转子实验台Bently砌“转子实验台主要包括电动机、基座装置、电动机速度控制装置、传感器装置以及一些可选模块,根据需要模拟转子的不同故障状态,可以选择不同的模块安装故障模拟平台,如图A一1所示。图A一1BentlyRK4转子实验台Fig.A-1BentlyRK4rotorkitA.2.1.1实验装置参数为了便于本文后续章节对故障状态的描述,表A一1给出了转子实验台各种状态的缩写名称。表A.2为BentlyRK4故障模拟装置的参数。表A一1实验室模拟状态类型Tab.A一1Laboratorysimulationconditiontypes状态种类描述GOOD正常(withoutanydefects) 附录A转子系统故障的模拟及数据采集UBALRRlrBUBRR0ILWCRAK不平衡(Unbalance)径向碰磨(RadialRub)不平衡+径向碰磨(Unbalance&RadialRub)油膜涡动(Oilwhirl)轴裂纹(ShaftCrack)表A.2BentlyRK4故障模拟装置的参数Tab,A-2ParametersoffaultsimulationonBen@RK4UBAL不平衡质量Am1.29UBRR不平衡质量Am2.09两转子之间盼间隙O.25em转子和静子之间的间隙0,5cmoIL、V轴长L450mm转轴跨度,410mm轴颈D25mmA.2.2ZTR转子实验台轴裂纹状态的模拟是在ZTR转子实验台上进行,如图A一11所示。实验台由底座、轴承座、等直径长轴及刚性薄转子组成,可用一个铜质锥套固定在轴上任意位置。转轴通过锥套和双列滚珠球面轴承与轴承座连接。轴承座能在底座导轨上任意地移动,这样可以调节支承跨度及裂纹相对轴承座的位置。转轴一端用弹性联轴节与交流调速电机连接,而交流调速电机的转速由交流无级调速器控制。图A.2ZTR转子实验台Fig.A一2ZTRrotortestbed 申请上海交通大学工学博士学位论文A.2.3基于ZTR转子实验台的故障模拟A.2.3.1模拟轴裂纹状态的装置轴上表面横向裂纹在近转子根部,把一对垂直和水平安装的电涡流传感器利用配套的传感器支架安装在刚性转子附近,支架固定安装在底座上。轴裂纹及传感器的安装位置如图A一3所示。轴裂纹N/转子影、管易图易SKF电N/7≮滞#&*一图A.3裂纹及传感器位置Fig.A-3ThelocationsoferaekOntheshaftandsensorsA.23,2实验装置参数在ZTR转子实验台上,模拟轴裂纹状态时的实验装置参数见表A一3。表A。3ZTR实验台故障模拟装置的参数Tab.A.3ParametersoffaultsimulationOllZTRtestbedA.3数据采集在机械设备和结构系统的运行过程中,振动及其特征信息是反映系统状态及其变化规律的主要信号,通过各种动态测试仪器拾取、记录和分析动态信号,是进行系统状态监测和故障诊断的主要途径。在本文中,我们主要采用电涡流传感器采集转予的径向位移信号,这些传感器是被无接触地安装在转子附近。A3.1实验方案通过转子附近垂直和水平方向上安装的两个电涡流传感器,在不同的恒定转速下采集转子的振动原始数据。各状态下的转速选择和分析带宽见表A一4。对所有的转子状态,使用的采样频率均为2560.82Hz,对每一组采样数据,采样点数均为4096点。一个带有PCI数据采集卡的计算机作为数据采集系统,抗混滤波器的截至频率为20KHz,转子实验台转速由无级调速器控制,另外还有CF350双通道动态信号频谱分析仪和示波器等其他设备。图A.4是数据采集系统的示意图。图A~5显示了在Bent/y 附录A转子系统故障的模拟度数据采集RK4模拟故障时数据采集现场使用的设备。表A.4故障模拟转速和分析带宽Tab.A-4rotorvelocityandbandwidthinfaultsimulation堡塑丛查壁王堡婆!翌望!坌塑堂重!生!GOOD600/900/3000/3600/48001000UBALRRUBUBRROILWCRAK600/900/3000/3600/4800600/1200/2400/3000/3600/4200600/12001640/1727/1901489/540/600/780,100810005001000图A.4转子位移信号的采集Fig.A-4Rotordisplacementsignalacquisition图A.5信号采集设备Fig.A一5Signalacquisitioninstruments 申请上海交通大学工学博士学位论文附录BB.1攻读博士学位期间所获得的荣誉与奖励≯2002年度上海交通大学“上风高科优秀学生奖一等奖”≯2004年度上海市普通高等学校优秀毕业生B.2攻读博士学位期间所参与的项目≯“十五”国家科技攻关计划重点项目一一“基于网络的设备远程监测与故障诊断累统”项目(编号:2001BA204806)≯国家自然科学基金重点资助项目一一大型复杂机电系统早期故障智能预示的理论与技术(编号:50335030)≯上海华阳检测仪器有限公司PMS巡检系统项目Bt3攻读博士学位期间所发表与录用的论文【1】XingWu,JinChen,RuqiangLi,eta1.Internet-BasedRemoteMonitoringandFaultDiagnosisSystem,LectureNotesinComputerScience,v01.3174,PP.567—573.(SCI#BAT68)【2]XingWu,JinChen,RuqiangLi,eta1.ModelingaWeb—BasedRemoteMonitoringandFaultDiagnosisSystemwithUMLandComponentTeehnology,JournalofIntelligentInformationSystems,inpress.(SCI、E1检索源)[3]XingWu,JinChen,RuqiangLi,eta1.Web-basedremotemonitoringandfaultdiagnosissystem,InternationalJournalofAdvancedManufacturingTechnology,inpress.(SCl、E1检索源)[4】伍星,陈进,李如强,基于WEB的设备远程监测与诊断系统UML模型的研究,计算机工程,2004,30(14):27—29.(EI#04388367130)【5】伍星,陈进,李如强,基于数据挖掘的设备状态监测和故障诊断,振动与冲击,2004,23(4):70—74.(EI#05068829682)[6】伍星,陈进,李如强等,设备远程监测与诊断系统体系结构的研究,计算机工程与应用,录用待刊.(核心期刊)[7】伍星,陈进,李如强等,设备远程监测与诊断系统UML模型的研究,2004年全国振动工程及应用学术会议论文集,振动工程学报,17(S):576·580.[8]陈进,伍星,数据挖掘在状态监测和故降诊断中的应用,2002年全国振动工程及应用学术会议论文集,上海高教电子音像出版社,pp:22—31. 附录B【9】RuqiangLi,JinChen,XingWu.FaultDiagnosisofRotatingMachineryBasedonSVD,FMCandRST,InternationalJournalofAdvancedManufacturingTechnology,inpress+(SCI、EI检索源)[10】RuqiangLi,JinChen,XingWu.FaultDiagnosisofRotorusingKnowledge—basedFuzzyNeuralNetworks,Appliedmathematicsandmechanics,inpress.(EI检索源)【11】李如强,陈进,伍星,基于奇异值分解、模糊聚类和粗糙集理论的旋转机械故障诊断,振动与冲击,录用待刊.(EI检索源)【12]李如强,陈进,伍星,一种基于软计算的转子故障诊断方法,振动与冲击,录用待刊.(EI检索源)[13]李如强,陈进,伍星,基于多尺度奇异谱分析的转子碰磨诊断的数值仿真,上海交通大学学报,录用待刊.(EI检索源)【14】李如强,陈进,伍星,一种基于粗糙集和模式识别的旋转机械故障诊断方法,机械科学与技术,2004,23(11):1308—1312.(El检索源)[15]李如强,陈进,伍星,一种连续条件属性值的决策表的归纳学习方法,计算机应用,2004,24(1):4.5.(核心期-r,1)【16】李如强,陈进,伍星,基于模糊C均值聚类和粗糙集理论的旋转机械故障诊断,信息与控制,33(3):355—360.(核心期刊1[17]李如强,陈进,伍星,基于知识的模糊神经网络在转子故障诊断中的应用,第八届全国振动理论及应用学术会议论文,录用待刊.【18】孙卫祥,陈进,伍星等,基于网络的设备远程监测与故障诊断系统开发,2004年全国振动工程及应用学术硷瞅论文集,振动工程学报,17(S):597—600.【19]袁艳霞,陈进,伍星等,设备远程监测系统中图形组件包的开发,2004年全国振动工程及应用学术会议论文集,振动工程学报,17(s):629.632. 申请上海交通支学工学博士学位论文致谢本论文是在导师陈进教授的悉心指导和热情鼓励下得以完成的。从论文的选题、理论研究、实验研究、系统研发到论文撰写的整个过程,处处浸透着导师的心血。导师渊博的知识、诲人不倦的师者风范、实事求是的治学态度、废寝忘食的3-作精神和理论联系实际的严谨作风,是我终身学习的榜样;他敏捷的思维、精益求精的科研作风和孜孜不倦的进取精神,使我受益非浅。导师不仅在“十五”国家科技攻关计划重点项目期问给予精心的指导,而且在思想、工作和生活等方面也予以无微不至的关怀,使本人在组织能力和科研能力两方面得到了极大的提高,所取得的点点滴滴的成就都与导师的言传身教分不开。谨以此文的完成向导师表示衷心的感谢并致以崇高的敬意!振动、冲击、噪声国家重点实验室求实严谨的学术氛围和良好的实验条件是论文顺利完成的坚实基础。在参与“十五”国家科技攻关计划重点项目期问,盂光教授、赵玫教授扣李鸿光副教授等多位学者严谨的科研作风和始终坚持在科研第一线的工作精神给本人留下了深刻的印象,他们从状态监测方法、故障诊断理论以及转子试验台的使用等方面给予了必要的指导和关心。史习智教授在数字信号处理、数据挖掘和软计算等方面给予了指导和关心。韩雪华高工和静波高工在实验研究过程中进行了耐心地指导与帮助,在此表示由衷的感谢。华宏星教授和孙旭博士夜以继目的科研热情,也给作者留下了深刻的印象。重点实验室各位老师的无私帮助和忘我工作热情潜移默化地影响了我,使本人对论文的研究_T-作始终保持着高度的热情,最终使论文能够得以不断地完善和充实,在此一并表示由衷的感谢。自从2001年进入陈进教授带领的226学科梯队,本人就像进入了一个科研大家庭,梯队内部资料及成果的网络化、统一化、规范化和标准化的管理对本人的学术思想和科研实践产生了无法估量的冲击和影响。青年教师张桂才副教授和李富才博士的加盟给梯队的学术氛围注入了新思维和活力,让我在毕业前有幸感受到了华中乖西交的学术思想。师兄蒲亚鹏博士、姜鸣博士、李如强博士、钟振茂博士、昊军彪博士和邹剑博士给予了友善的指导,师弟威海明硕士、陈一鸣硕士、郭广伟硕士、陈良硕士、梁衍学硕士、孙卫祥博士以及师妹袁艳霞硕士、何俊博士和毕果博士在“十五”国家科技攻关计划重点项目期间给予了大力的支持,师弟周福昌博士、董广明博士、矫健博士、李加庆博士、王国伟博士、薛玮飞博士、吴立伟硕士和刘先锋硕士给予了无私的帮助。三年的时间转瞬即逝,与陈少林博士后、雷宣扬博士后等众多师兄弟的愉快合作和交流至今记忆犹新,历历在目,此番经历将毕生难忘。作者在此还要感谢重点实验室的刘元峰博士、鲁宏权博士、王彦卫硕士、陈迅硕士、荆建平博士后、吴峰奇博士、张文明博士、黄海博士、范客平博士、李防战硕士 致谢和万铮硕士在“十五”国家科技攻关计划重点项目期问给予的支持和帮助!没有他们的大力配合,项目的顺利进行是难以想象的。在攻读学位期间,与彭伟博士、鲁宏权博士、王志毅博士、吴广明博士、杨瑞梁博士、韦凌云博士、江国和博士、张军博士、谌勇博士、郭强博士等众多同窗学友们进行了友好的交流,为求学生涯留下了美好的回忆。值此即将成文之际,作者怀着无比激动的心情向三年来一直关心、理解、支持和帮助自己的昆明理工大学人事处和机电学院的各位领导、师长和同事表示最衷心的感谢!特别感谢机电学院罗德扬教授、郭之璜教授、廖伯瑜教授和迟毅林教授多年的关心和指导,是他们将我引入了机械设备状态监测和故障诊断领域的大门。向多年来一直鼓励作者进取的父母致以最衷心的感谢,妻子毛剑琳的理解与支持是作者不断进步的动力与源泉。在外求学多年,年迈的父母替我和妻子照顾儿子伍环宇,作者以未尽儿子的孝心和父亲的责任而内疚和自责,谨以此文献给我的父母、妻子和儿子!作者于闵行交大31栋二口口口年十二月

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭