在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用

在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用

ID:33099687

大小:1.66 MB

页数:59页

时间:2019-02-20

在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用_第1页
在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用_第2页
在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用_第3页
在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用_第4页
在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用_第5页
资源描述:

《在聚类中关于噪音与高维问题的研究——一种快速鲁棒的映射聚类算法的研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:,r最。弓p每聂。罨硕士学位论文密级目:在聚类中关于噪音与赢维润题的研究一二二二塑速婆鱼鲎塑壁堑鍪耋篁整塑堑塞垦垄旦——一英文并列题目:墨!!!!壁!里型!塑!塑型业旦!竺!!塑型!型!!婴!堕旦型!堕!L二坠!璧塑篓!堕!呈堕型墅!堕塑塑坚旦坚塑堕一趟艘尘垒婴翌璺坐垒理!堡堕曼一——研究生.'一⋯罔~,耋——专业:望.篁拯堕厘垫查研究方向:燕壅迟型墨鳖鳇墼型一一——导师:.壅笪型塾堡一指导小组成员:—一——学位授予日期:——一——答辩委员会主席:江南大学地址:无锡市二oo六年三月独创性声明本人声明所呈交的学

2、位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南大学或其它教育机构的学位或证书面使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:区l壑日期:炒‘年{月7日关于论文使用授权的说明本学位论文作者完全了解江南大学有关保留、使用学位论文的规定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部

3、分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。签名:f三3童导师签名:日期:沙‘年’月y日摘要近年来,作为数据挖掘的重要工具之一,聚类技术得到了越来越多的关注。目前已有许多成熟的聚类算法,而且这些算法被广泛应用于各个相关领域中。然而大多数的聚类算法只是对低维数据集有效,对于日益增多的高维数据集,其聚类性能大大降低。如何正确对高维数据集进行有效的聚类分析是当前数据挖掘领域的一个难点和热点问题。高

4、维数据集聚类分析的难点之一是其较高的时间复杂度,这使得一些经典的聚类算法,如层次聚类,在处理大规模高维数据时难以有效。高维数据集的另一个难点是其高度的噪音敏感性,这一特点使得众多已有的聚类算法,如k均值聚类、层次聚类等算法的性能大大降低。因此给出快速且鲁棒的用于高维数据集的聚类算法是很有必要的。映射聚类算法是针对高维数据集提出的一大类聚类算法,实验和理论证明这些算法较之于经典的聚类算法是比较有效的。本文针对上面提到的高维数据集聚类的难点,给出了一种快速且鲁棒的映射聚类算法。该算法中利用关联规则来查询每个聚类簇的

5、相关维,然后利用相关维进行进一步的聚类分析。该算法的主要优点在于:1.快速性2.较好的鲁棒性,对噪音敏感度较低3.能够自动获得聚类数我们通过几组仿真实验有效的证明了上述优点。关键词:数据挖掘、聚类分析、高维数据、映射聚类、关联规则、相关维3江南大学硕士学位论文Abstractlnrecentycars,弱咖eoftheimpon锄tdataminingt00ls,dusteri丑gtedmologygetsmore卸dmoreanentions.Nowadays,m卸yclusteIiIlgalgoritll】

6、mshavebeensucccssfIlllyappljedinVa—ousrelatedfields.However,mostoftheclustefiIlga190rithmsarconlye任ectiVet0lowdimensionaldatasets卸d啪notworkOntllein汀eaSingh妯dimensi嘶aldat舔etsinditfcrent盯eas哦ctivdy.Howtoe蚯cientlyclusterthehiglldimensionaldataisadifficIlltyandh

7、ottopicbynow.oIIeofthedi舾cIltiesofclusteringh蛐djmensionaldatasetjstheh蛐tilIlecomplicati咖,whjchmal【es岫ealgofithmsdi伍cIIlttobcimplemented.Anotherdifficutiesofdusteringhi曲dimensionaldataSetisitshi曲se鹏itiv“yto∞ise,whichalSomal【esmoSt仃aditionalclusteringalgoritll

8、ms,such笛k-me锄s,HCets,ine骶divetohighdimensionaldataset.So,itisVerynece船aryandinterestillgtopr叩oseafastaIIdrobuStclusteringa190ritlllntohiglldinlensjonaldataScts.Projectedclustcringalgo血hmsarcabig

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。