基于免疫遗传算法聚类和特征降维的研究

基于免疫遗传算法聚类和特征降维的研究

ID:32752601

大小:2.39 MB

页数:56页

时间:2019-02-15

基于免疫遗传算法聚类和特征降维的研究_第1页
基于免疫遗传算法聚类和特征降维的研究_第2页
基于免疫遗传算法聚类和特征降维的研究_第3页
基于免疫遗传算法聚类和特征降维的研究_第4页
基于免疫遗传算法聚类和特征降维的研究_第5页
资源描述:

《基于免疫遗传算法聚类和特征降维的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要1111111IIIIIIlllII舢1Y1944454随着信息技术的飞速发展,各种数据呈几何级数增长,面对这些海量的数据,如何利用数据挖掘技术获取有价值的知识,已经成为学术界和工业界的重要研究课题之一。聚类分析作为数据挖掘过程中的重要组成部分,也受到了广泛的关注。本文将免疫遗传算法应用于数据挖掘方法中,针对高维特征的维数约减和数据聚类问题进行了深入的研究,主要工作包括以下几方面的内容。首先全面分析了遗传算法和免疫算法的原理特性,将免疫机制引入遗传算法中。重点介绍了免疫遗传算法的设计过程和特点。随后从理论层面上剖析了聚类分析的数学描述、数据结构、相

2、异性度量方法以及常用的一些聚类算法。针对k.medoids算法容易受初始聚类中心的影响问题,本文提出将免疫遗传算法与k.medoids算法相结合组成新的聚类方法,这样既可以获得全局最优解,也可以很好的区分孤立点。同时由于使用改进的中心点替换策略,可以加快收敛速度,节约时间成本。采用免疫遗传算法与CHI统计方法相结合进行文本特征降维。文本特征通常采用向量空间模型表示,而高维稀疏的特征矩阵会降低聚类的效率和准确率。本文首先运用CHI方法对文本特征进行降维,使得文本特征从几千维降至几百维,然后在此基础上再利用免疫遗传算法继续降维,这样不仅有效地降低了维数,而

3、且提高了聚类质量。·关键词:数据挖掘;聚类;k-medoids;特征降维;免疫遗传算法AbstractWiththerapiddevelopmentofinformationtechnology,variousdataisincreasinginageometricrate.Inthefaceofvastamountdata,howtoobtainvaluableknowledgeintheuseofdataminingtechnology,hasbecomeoneoftheimportantresearchtopicsbetweenacademiaa

4、ndindustry.Asallimportantcomponentpartsinthedatammmgprocess,Clusteringanalysishasreceivedwidespreadconcern.Thepaperhasapplyedimmunegeneticalgorithmtodammining.Aimingtothedimensionreductionofhighdimensionalcharacteristicsanddataclusteringissues,thepaperhasdonefurtherresearch,incl

5、udingthefollowingaspectsofcontent.Firstly,thepaperhascomprehensivelyanalyzedthetheoryofgeneticalgorithmandimmunealgorithm,andputimmunemechanismintogeneticalgorithm,andgivenemphasistointroducethedesignprocessofimmunegeneticalgorithmanditscharacteristic.Then,fromtheperspectiveofth

6、eory,thispaperhasanalyzedclusteringanalysis,includingmathematicaldescription,datastructure,dissimilaritymeasuremethodandsomecommonclusteringalgorithm.Duetok.medoidsalgorithmbytheinfluenceofinitialclusteringcenter,thispaperhaspresentedanewclusteringmethodbasedonimmunealgorithmand

7、k-medoidsalgorithm.Themethodnotonlycanobtaintheglobaloptimumsolution,butalsoCanbetterdistinguishtheisolatedpoints.Atthesanletime,thenewmethodmayexpeditetheconvergencespeedandsavethetimecostbecauseofusingimprovedcenterreplacestrategy.Tl:lispaperhascombinedimmunegeneticalgorithmwi

8、thCHIstatisticalmethodtoreducethedimensionoftex

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。