欢迎来到天天文库
浏览记录
ID:23652139
大小:62.50 KB
页数:10页
时间:2018-11-09
《机器学习算法在数据挖掘中的应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、机器学习算法在数据挖掘中的应用陈小燕(江苏农林职业技术学院,江苏句容212400)摘要:针对数据挖掘算法中常用的机器学习型算法进行研究。机器学习型算法特色是运用了人工智能技术,能在大量样本集训练和学习后自动找出运算需要的参数和模式。以机器学习型算法中的人工神经网络为例研究数据挖掘技术,针对学习速度慢、抗干扰能力弱以及容易陷入局部最小值等缺点和传统的遗传算法存在算法早熟以及局部寻优能力弱等问题,提出一种通过改进常规遗传算法的染色体结构和遗传算子,并且通过引入自适应交叉和变异概率来对BP神经网络结构参数进行优化的改进型遗传优化BP神经网络模型。最后通过煤矿空压机故障诊
2、断系统这一实例来研究改进型算法的数据挖掘技术的性能。研究结果表明,改进后的算法建立的诊断模型相比常规神经网络的诊断模型诊断准确率更好,诊断效率更快。.jyqkachinelearningalgorithmindataminingCHENXiaoyan(JiangsuPolytechnicCollegeofAgriculturalandForestry,Jurong212400,China)Abstract:Themachinelearningalgorithmmonlyusedindataminingalgorithmisstudiedinthispaper.AI
3、T(artificialintelligencetechnology)isadoptedinmachinelearningalgorithm,aticallyfindouttheparametersandmodesrequiredbyoperationafteralargenumberofsamplesettrainingandlearning.Theartificialneuralachinelearningalgorithmistakenasanexampletoresearchthedataminingtechnology.Sincethetradition
4、algeicalgorithmhastheshort?ingsofprematurityandizingcapacity,theimprovedgeicoptimizationBPneuralodelispro?posedbyimprovingthechromosomestructureandgeicoperator,andbyintroducingadaptivecrossoverandmutationprobabilitytooptimizeneuraletersandsolvetheproblemsofslomingcapability,andeasilyf
5、allingintolocalminimumvalue.Finally,theperformanceoftheimprovedalgorithmisstudiedbyusingthefaultdi?agnosissystemofairpressor.Theresearchresultsshoproveddiagnosticmodel,paredodel,hasbetterdiagnosticaccuracyandhigherdiagnosticefficiency.Keyining;BPneuralizationalgorithm;faultdiagnosisof
6、airpressor0引言数据挖掘技术是在整个社会发展中随着科学和技术的不断进步而顺应需要所生。随着信息化技术的不断普及,人类社会逐步进入到信息化社会中,信息化管理技术随之不断提升,成本却同时逐步下降,数据管理技术(DataManagementTechnology)在各企事业单位中进一步普及,从而推动企事业单位内部职能部门间的沟通联络。但是,随之而来的弊病是海量数据的累积导致数据分析的困难[1?2]。1数据挖掘数据挖掘算法中常用的有机器学习型算法和统计型算法两类。前者的特色是运用了人工智能技术,能在大量样本集训练和学习后自动找出运算需要的参数和模式;后者则常用相关
7、性分析、聚类分析、概率和判别分析等进行运算。不同算法当然有着各自不同的对应领域和目标,它们既能单独使用,也能相互结合。机器学习型算法中人工神经网络方法被普遍运用,它具有极好的数据处理能力和自组织学习能力,并且能准确进行识别,从而有助于分类问题中的数据处理。人工神经网络通过建构模型而工作,其模型多样,能满足不同需求。总体来看,人工神经网络模型精确度高、鲁棒性好,具有较强描述能力,在应用时可以无需专家支持。当然,它也存在一些缺陷,具体表现在:训练数据所需要的时间较长;对所获取知识的理解上不够智能;开放性和可伸缩性也有一定局限性。传统的BP神精网络存在学习速度慢、抗干扰
8、能力弱以及
此文档下载收益归作者所有