欢迎来到天天文库
浏览记录
ID:32752601
大小:2.39 MB
页数:56页
时间:2019-02-15
《基于免疫遗传算法聚类和特征降维的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要1111111IIIIIIlllII舢1Y1944454随着信息技术的飞速发展,各种数据呈几何级数增长,面对这些海量的数据,如何利用数据挖掘技术获取有价值的知识,已经成为学术界和工业界的重要研究课题之一。聚类分析作为数据挖掘过程中的重要组成部分,也受到了广泛的关注。本文将免疫遗传算法应用于数据挖掘方法中,针对高维特征的维数约减和数据聚类问题进行了深入的研究,主要工作包括以下几方面的内容。首先全面分析了遗传算法和免疫算法的原理特性,将免疫机制引入遗传算法中。重点介绍了免疫遗传算法的设计过程和特点。随后从理论层面上剖析了聚类分析的数学描述、数据结构、相
2、异性度量方法以及常用的一些聚类算法。针对k.medoids算法容易受初始聚类中心的影响问题,本文提出将免疫遗传算法与k.medoids算法相结合组成新的聚类方法,这样既可以获得全局最优解,也可以很好的区分孤立点。同时由于使用改进的中心点替换策略,可以加快收敛速度,节约时间成本。采用免疫遗传算法与CHI统计方法相结合进行文本特征降维。文本特征通常采用向量空间模型表示,而高维稀疏的特征矩阵会降低聚类的效率和准确率。本文首先运用CHI方法对文本特征进行降维,使得文本特征从几千维降至几百维,然后在此基础上再利用免疫遗传算法继续降维,这样不仅有效地降低了维数,而
3、且提高了聚类质量。·关键词:数据挖掘;聚类;k-medoids;特征降维;免疫遗传算法AbstractWiththerapiddevelopmentofinformationtechnology,variousdataisincreasinginageometricrate.Inthefaceofvastamountdata,howtoobtainvaluableknowledgeintheuseofdataminingtechnology,hasbecomeoneoftheimportantresearchtopicsbetweenacademiaa
4、ndindustry.Asallimportantcomponentpartsinthedatammmgprocess,Clusteringanalysishasreceivedwidespreadconcern.Thepaperhasapplyedimmunegeneticalgorithmtodammining.Aimingtothedimensionreductionofhighdimensionalcharacteristicsanddataclusteringissues,thepaperhasdonefurtherresearch,incl
5、udingthefollowingaspectsofcontent.Firstly,thepaperhascomprehensivelyanalyzedthetheoryofgeneticalgorithmandimmunealgorithm,andputimmunemechanismintogeneticalgorithm,andgivenemphasistointroducethedesignprocessofimmunegeneticalgorithmanditscharacteristic.Then,fromtheperspectiveofth
6、eory,thispaperhasanalyzedclusteringanalysis,includingmathematicaldescription,datastructure,dissimilaritymeasuremethodandsomecommonclusteringalgorithm.Duetok.medoidsalgorithmbytheinfluenceofinitialclusteringcenter,thispaperhaspresentedanewclusteringmethodbasedonimmunealgorithmand
7、k-medoidsalgorithm.Themethodnotonlycanobtaintheglobaloptimumsolution,butalsoCanbetterdistinguishtheisolatedpoints.Atthesanletime,thenewmethodmayexpeditetheconvergencespeedandsavethetimecostbecauseofusingimprovedcenterreplacestrategy.Tl:lispaperhascombinedimmunegeneticalgorithmwi
8、thCHIstatisticalmethodtoreducethedimensionoftex
此文档下载收益归作者所有