子空间聚类算法中的若干问题研究

子空间聚类算法中的若干问题研究

ID:33287870

大小:2.50 MB

页数:58页

时间:2019-02-23

子空间聚类算法中的若干问题研究_第1页
子空间聚类算法中的若干问题研究_第2页
子空间聚类算法中的若干问题研究_第3页
子空间聚类算法中的若干问题研究_第4页
子空间聚类算法中的若干问题研究_第5页
资源描述:

《子空间聚类算法中的若干问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号!里!墨重庆邮电大学硕士学位论文英文题目量渲s皇丛堡hQ塾S皇y曼!鱼!£靼鱼!星盟墨Q£硕士研究生奎立兰E指导教师夏差割燃学科专业盐差垫廛囝垫盎论文提交日期2壁Q窆生垒且论文答辩日期塑!!:篁:丛论文评阅人——答辩委员会主席当滥邀蕉盈盘堂2009年4月27日独创性声明㈣IfIf『舯Ⅲ啪㈣咖㈣Y182488。{。本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重麽邮血太堂或其他教育机构的学位或

2、证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:爸乏拂签字日期:2阿(『年s月j上日学位论文版权使用授权书本学位论文作者完全了解重庞童g电太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重麽自&电太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:舍定琊导师签名:签字日期:洳‘}

3、年F月j1日签字日期:炒7年厂月啪签字日期:炒/年y月啪重庆邮电大学硕士论文摘要聚类分析是将数据对象分成类或簇的过程,使同一个簇中的对象之间具有很高的相似度,而不同簇中的对象高度相异。聚类分析源于许多研究领域,包括统计学、生物学和机器学习等。聚类分析是数据挖掘中的一种非常重要的技术和方法,是自发的、无监督的学习过程。随着聚类分析应用的领域扩展和深入,高维数据聚类已成为聚类分析的一个重要研究方向。同时高维数据聚类也是聚类分析的难点,是一个极具挑战性的工作。技术的进步使得数据收集变得越来越容易,导致数据库规模越来越大、复杂性越来越高

4、,如各种类型的贸易交易数据、Web文档、基因表达数据等,它们的维度(属性)通常可以达到成百上千维,甚至更高。但是,受“维度效应”的影响,许多在低维数据空间表现良好的聚类方法运用在高维数据空间上往往无法获得好的聚类效果。子空间聚类是高维数据聚类分析中的一种有效技术,尝试在相同数据集的不同子空间上发现子空间簇。本文对已有的一些高维子空间聚类算法进行了研究,分析了其中存在的若干问题,改进了相关方法:首先,针对某些算法中需要用户输入阈值识别冗余属性的问题,改进出了一种采用熵比值度量的识别算法。实验结果表明,新的方法能够正确有效地识别出高

5、维数据集中的冗余属性,且对默认的阈值参数性能稳定,不需要用户根据不同数据集设置不同的阈值,减轻了用户负担。其次,针对聚类算法相关操作易受不相关属性影响的问题,在SCA(SubspaceClusteringtllroughAttmuteClustering)算法搜索相似兴趣子空间方法的基础上,改进出了一种基于属性相关性分析的子空间搜索算法。实验结果表明,新的方法减少了需要用户输入参数的个数,且对子空间的识别能力更优。最后,针对部分算法需要用户输入簇的数量作为参数的问题,在P3C(ARobustPrQjectedClustering

6、Algoritllrll)算法挖掘簇核方法的基础上,改进出了一种有效的子空间簇核挖掘算法。实验结果表明,新的方法对簇核的挖掘精度更高,能够正确地识别簇的数量。上述问题的研究,对于提高子空间聚类算法的易用性、高效性、稳定性较为有意义。关键词:聚类分析,子空间聚类,冗余属性,兴趣子空间,簇核AbstractC1usteringanalysisdividesdataobjectsintoseVeralclaSsesorclusters·uata0biectsaresimilartotheoneinthes锄eclusteraI】Ida

7、redissimilartomeobjectslnmeomercluSters.Clustemganalysisdemes舶mm刁myresearchfields,includingstatlstlcs,biologyaIldmachinele锄ing.CluSteringaIlalysisisaVer)rimport锄ttcchnologyandmethodsinthedatamining.ItisaspontaneousaIldunsupen,lsedle删ngprocess·WitllmeextensionofCluste

8、ringaulalysis印plication’sdomaln,thehigh-dimensionaJclusteringhaSbecome锄imporCantresearchdirectlon,and1sthedimcultpointofclusteringa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。