欢迎来到天天文库
浏览记录
ID:37083414
大小:2.72 MB
页数:46页
时间:2019-05-17
《学术论文:基于高维数据的双聚类算法研究与应用(文字格式,可编辑)(nxpowerlite)(nxpowerlite)(nxpowerlite)(nxpowerlite)(nxpowerlite)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、声明:本人文档均为可编辑文本格式PDF,前3页打有标签,使用时可以去掉。硕士论文基于高维数据的双聚类算法研究与应用摘要近年来,随着生物信息学、电子商务等行业的迅速发展,在这些领域积累了大量高维数据,利用数据挖掘技术能够在这些数据中找到许多对科学研究和市场营销起到重要作用的有价值的信息。在聚类分析技术方面,传统聚类方法只能在数据矩阵的行或者列某一方向上进行,因此只能找到全局信息,而高维数据的特点就是含有大量的局部信息,这是传统聚类方法所无法找到的。为了更好地聚类高维数据,尤其是在高维数据空间中聚类局部信息,双聚类这种新的聚类方法
2、得到了越来越广泛的应用。双聚类算法之所以更加适应高维数据,是因为双聚类算法是在数据矩阵的行和列两个方向上同时聚类,这就使得双聚类算法能够更加有效地发现高维数据中的局部信息。双聚类算法的出现,很好地解决了传统聚类在聚类高维数据时遇到的瓶颈,但是由于国内外对双聚类算法研究还处于起步阶段,近年所提出的各种双聚类算法都还存在着各种不足之处,因此对双聚类算法的研究与改进尤为必要。本文的主要工作是首先对双聚类的定义、类型、结构作详细阐述,然后对近年来应用较多的双聚类算法的数学模型,聚类策略等方面进行研究分析,总结分析了这些双聚类算法的优缺
3、点。在研究分析多种双聚类算法的基础上,提出了一种适合高维数据的基于惩罚策略的双聚类算法(PenaltystrategybasedOverlappingBiclusteringAlgorithm,简称POBA)。重点针对ChengandChurch算法中在每次迭代过程中,须引入随机数取代聚类结果中元素的替代过程进行了改进,利用惩罚策略改善双聚类算法的迭代过程,该策略能够使数据矩阵顺利完成双聚类,同时避免了贪心搜索策略中随机数干扰问题,并通过设置POBA算法中引入的控制惩罚力度的参数秒,达到控制双聚类结果重叠率的效果,这使得算法能
4、够灵活的满足不同聚类应用的需求。论文最后设计实现了POBA算法并将其应用在公共的高维数据集的双聚类实验中,通过对实验结果分析,验证了算法的有效性,同时针对实验数据的分析结果,确定了算法中参数设置的原则。关键词:聚类分析,双聚类,高维数据,惩罚策略,双聚类算法声明:本人文档均为可编辑文本格式PDF,前3页打有标签,使用时可以去掉。Abstract硕士论文Inrecentyears,晰tllthedevelopmentinthebioinformaticsande-commerce,moreandmorehigll-dimensi
5、onaldataneedtobeanalyzed,dataminingtechnologycallfindvaluableinformationinthesedataforscientificresearchandmarketing.Intheclusteringtechnology,traditionalclusteringmethodsclustereitherrowsorcolumnsbutnotsimultaneously,SOtheresultisalmostabouttheoverallinformation,bu
6、tthehighdimensionaldataalwayscontainsa10toflocalinformation,whichthetraditionalclusteringmethodcannotfind.Biclusteringalgorithmclustersthedatamatrixinbothofrowsandcolumnsatthesametime,SOtheycanfindthelocalinformationinthedatamatrix,thisnewmethodisappliedtoimprovethe
7、effectofclusteringforthehi.ghdimensionaldata,especiallyinclusteringpartialcorrelationofhighdimensionaldataspace.Biclusteringalgorithmimprovestheeffectofclusteringforthehi。ghdimensionaldata,buttheresearchonbiclusteringalgorithmisstillinitsinitialstage,thevariousbiclu
8、steringalgorithmsstillhaveitsownshortcomings,andthereforetheresearchofbiclusteringalgorithmsisparticularlynecessary.Themainworkofthispaper
此文档下载收益归作者所有