欢迎来到天天文库
浏览记录
ID:33312808
大小:104.00 KB
页数:73页
时间:2019-02-24
《相关分析在异检的测中的应用研究可编辑精选》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、相关分析在异常检测中的应用研究西安科技大学硕士学位论文相关分析在异常检测中的应用研究姓名:汪保男申请学位级别:硕士专业:计算机软件与理论指导教师:李爱国20100101论文题目:相关分析在异常检测中的应用研究专业:计算机软件与理硕士生:汪保男签名指导教师:李爱国签名摘要本文研究相关分析方法在异常检测中的应用,并将其应用于特征选择及地震特征数据的异常检测中。主要研究内容如下:提出了一种基于离散粒子群算法BinaryParticleSwarmOptimization,BPSO及以重叠信息熵OverlapInformationEntropy,OIE为适应值函数的特征子集选择方
2、法。该方法是不依赖于分类器的特征选择方法。主要思想是:首先随机产生若干粒子,以特征属性集与类别属性之间的OIE作为BPSO算法的适应值函数,其大小表示所选特征子集与类别属性之间相关性程度的高;利用BPSO算法对特征子集进行优化,最终确定与类别属性的OIE最大的特征子集为最优特征子集。实验结果显示:该方法不仅能有效地寻找到最优特征子集,且能进行特征降维和去除冗余信息,其分类结果不差于全部属性的分类结果。提出了一个非线性新相关信息熵的概念,推导并证明了该信息熵的若干性质,这些性质满足香农熵的基本性质。新相关信息熵是一种度量多变量、非线性系统的相关性程度大小的标准。作为多变量
3、之间相关关系的不确定性度量,变量间的相关性程度越大,对应的新相关信息熵值越小。新相关信息熵的提出为相关分析理论的研究提供了一种新方法和新思路。新相关信息熵的应用实例结果说明它是一种有效且有用的度量非线性系统不确定性的方法。基于上述研究,开发了用数据挖掘技术进行地震趋势预报与评判的分析软件原型系统,此系统的开发目的旨在为后续的进一步研究打下基础。本文的研究结果主要开发了其中的相关分析模块,同时提供给用户可视化的操作界面,其主要功能是进行特征选择和异常检测,以此评判本文特征选择方法的有效性。以汶川余震特征数据为实验数据,测试结果表明该系统功能正确。关键词:数据挖掘;相关分析
4、;特征选择;新相关信息熵;异常检测研究类型:应用研究Subject:StudyandApplicationofCorrelationAnalysisMethodsinAnomalyDetectionSpecialty:ComputersoftwareandtheoryName:WangBaonanSignatureInstructor:LiAiguoSignatureAbstractThisthesismainlyfocusesonthatthecorrelationanalysismethodisappliedinanomalydetection,andthismet
5、hodisusedinfeatureselectionandearthquakefeaturedatasanomalydetection.Atthesametime,theprototypesoftwaresystemofusingdataminingtheoryandtechnologytoforecastandjudgeearthquaketendencywasdeveloped.Themaincontentsareasfollows:ThisthesisproposesanewmethodofFeatureSubsetSelection,whichisbasedo
6、ndiscreteBinaryversionofParticleSwarmOptimizationBPSOandOverlapInformationEntropyOIE.Thismethoddoesnotdependonclassifier.Themainideais:atfirst,agroupofparticlesaregeneratedrandomly.TheOIEbetweenattributesetandclassattributeisusedasBPSOalgorithmsfitnessfunction,itssizedenotesthecorrelatio
7、ndegreebetweenselectedattributesetandclassattribute.Then,featuresubsetisoptimizedbyBPSO.Finally,featuresubset,whichhasthelargestOIEwithclassattribute,isselectedastheOptimalFeatureSubset.ExperimentalresultsconfirmthatthismethodcannotonlyfindtheOptimalFeatureSubseteffective
此文档下载收益归作者所有