欢迎来到天天文库
浏览记录
ID:37400760
大小:4.04 MB
页数:52页
时间:2019-05-23
《基于决策粗糙集的聚类数自动确定方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号——JP趔重庆邮电大学硕士学位论文英文题目△坠!Q堡丛i堡垒!!Y旦曼!星!堡i垒ing!h星趟丛匹坠星!Q££!丛墨±殳!=墨堕墨i旦g旦曼璺i墨iQ垒:!h曼Q!星!i垒&Q坠g垫S垒±论文提交日期量Q!窒笙垒旦论文答辩日期至Q12生墨旦论文评阅入答辩委员会主席金建叠麴握酉直太堂2012年5月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研究成果,也不包含为获得j塞鏖邮电太堂或其他教育机构的学位或证
2、书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:匆?占l司签字日期:0眇J≥年6n奎日学位论文版权使用授权书本学位论文作者完全了解重麽邮电太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重麽邮电态堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:毒l占I司导师签名:百;芰签字日期
3、:2口IZ年舌月r日签字日期:伪f矿石月厂日重庆邮电大学硕士论文摘要聚类分析是数据挖掘研究中重要的方法之一,它在发现数据内在结构特征方面有着重要作用。聚类是一种无监督的学习方法,它已经广泛应用在模式识别、商务智能、图像分析、信息检索和生物信息学等众多领域。现在已有很多种成熟的聚类算法,包括划分聚类和层次聚类等。然而这些方法大部分都需要人为的提供像聚类类簇数这样的参数,比如,划分聚类需要预先知道聚类的类簇数,层次聚类需要知道聚类的终止点,此外还有基于网格聚类需要预先知道网格大小的阈值参数等等。然而这样的参数在实际应用中是很难得到
4、的,这就大大的限制了聚类分析在现实中的应用。因此,对一个给定系统进行聚类时,一个基本而困难的问题就是如何确定聚类类簇数。为了数据驱动地确定聚类数,一个好的聚类有效性指标(CVI:ClusterValidityIndex)是必不可少的,它可以用来评价在聚类过程中得到的聚类结果(ClusteringResult)的好坏。Yao等人提出的决策粗糙集模型对于分类有更好的理解,它是一个典型的概率型粗糙集模型,引入了贝叶斯理论来获得最小损耗的决策。本文通过扩展决策粗糙集模型提出了一种在层次聚类算法框架下的自动确定聚类数的新方法。首先,我们
5、扩展了决策粗糙集模型,用代价(risk)的概念来描述对象之间的关系,进而描述聚类结果的好坏。而以这个代价作为描述某个聚类结果的聚类有效性评价指标,在文中称为基于DTRS的聚类有效性函数。然后,根据此评价函数,基于凝聚型层次聚类算法框架,将聚类过程中的每个聚类结果的代价值描绘为曲线,我们发现并证明了该曲线最多只有一个极值点。所以,我们根据曲线的变化趋势,就可以找出最佳聚类数和对应的聚类结果,从而实现自动的确定聚类数。最后,我们根据在算法有效性证明过程中得到的性质,改进了算法的聚类效率,大大降低了算法的时间复杂度,实现了高效、准确
6、的确定聚类数。关键词:聚类,聚类有效性评价,聚类数目,决策粗糙集模型重庆邮电大学硕士论文AbstractAbstractClusteringanalysisisoneoftheimportantcontentsofdatamining,itplaysanimportantroleinthediscoverydatainnerstructurecharacteristics.Clusteringisanunsupervisedlearningmethod,ithasbeenwidelyusedinincludingpattern
7、recognition,businessintelligenceimageanalysis,informationretrievalandbio.informaticsandSOon.Therehavebeenmanyclusteringalgorithm,includingdividedclusteringandhierarchyclustering,etc.However,mostofthesemethodsrequireartificialparameterslikenumberofclusters,forexample
8、,thepartitionclusteringneedtoknowhowmanyclasses,thehierarchicalclusteringneedtoknowtheclusterending,moreover,thegridclusteringneedtoknowth
此文档下载收益归作者所有