欢迎来到天天文库
浏览记录
ID:37380912
大小:9.49 MB
页数:56页
时间:2019-05-22
《混合属性数据聚类算法及其应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、专业学位硕士学位论文混合属性数据聚类算法及其应用ClusteringAlgorithmforMixedTypeDataandItsApplication作者姓名:工程领域:学号:指导教师:完成日期:』亘增查2013-3-28大连理工大学DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或其他用途使用过的成果。与我一同工
2、作的同志对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文题目:i邑佥属!睦数量鐾娄箕法及墓廑趣作者签名:独查杰日期:丝f圣年—£月尘日大连理工大学专业学位硕士学位论文摘要目前已有的聚类算法大部分局限于处理连续属性或是分类属性的数据,然而在实际应用中,许多数据集是由连续属性数据和分类属性数据共同组成的,仅适用于单种数据类型的聚类算法就不能满足需求。因此,对混合了分类属性数据和连续属性数据的聚类算法的研究,具有重要的理论意义和实际价值。本文的主要研究工作包括以下几个方面:(1)首先介绍无监督
3、离散化算法和k-ANMI聚类算法,然后提出基于一种无监督离散化的混合数据聚类算法,在UCI数据集上的实验结果表明,提出的无监督离散化的混合数据聚类算法聚类混合类型数据是非常有效的。(2)有监督离散化算法CAIM的介绍,然后提出基于有监督离散化的混合数据聚类算法,在UCI混合数据集上的实验结果表明,提出的算法优于k-prototypes算法,UCI连续数据集上的实验证明,提出的基于有监督离散化的连续数据聚类算法对比k-means算法具有更好聚类效果。(3)介绍基于质谱技术的蛋白质鉴定以及蛋白质推断问题,然后提出如何应用本文的聚类算法解决蛋白质推断
4、问题,并给出解决方案,通过真实的蛋白质数据验证算法在蛋白质推断应用中的可行性和有效性。关键词:混合数据;聚类;离散化;蛋白质推断混合属性数据聚类算法及其应用ClusteringAlgorithmforMixedTypeDataandItsApplicationAbstractUntilnow,mostoftheexistingclusteringalgorithmshavebeenlimitedtodealwiththedatawhichcontainseithernumericalattributesorcategoricalattribut
5、es.However,alotofthepracticaldatabasesandlargedatasetscontainnotonlynumericaldatabutalsocategoricalones.It’Snecessarytohandlebothofthematthesametime.Thus.itisofgreattheoreticalandpracticalsignificancetodevelopaclusteringalgorithmwhichCandealwitllnumericaldataandcategoricalda
6、tasimultaneously.ThemainresearchworkofthisPapercanbesummarizedasfollows:(1)Itfirstlyintroducestheunsuperviseddiscretizationalgorithmsandthenproposesanewclusteringalgorithmformixedtypedatawhichisbasedonunsuperviseddiscretizationalgorithms.TheexperimentalresultsonUCIdatasetind
7、icatethatthisnewclusteringalgorithmisveryeffectiveforthemixedtypedata.(”Introducethesuperviseddiscretizationalgorithm,CAIM,andonthebasisofCAIM.thepaperproposessuperviseddiscretizationclusteringalgorithm.TheexperimentalresultsonUCImixeddatasetshowthattheproposedalgorithmissup
8、eriortok-prototypesalgorithm.Moreover,forUCInumericaldataset,thisalgorithmo
此文档下载收益归作者所有