基于rough集的层次聚类算法研究及应用

基于rough集的层次聚类算法研究及应用

ID:33805800

大小:2.29 MB

页数:58页

时间:2019-03-01

基于rough集的层次聚类算法研究及应用_第1页
基于rough集的层次聚类算法研究及应用_第2页
基于rough集的层次聚类算法研究及应用_第3页
基于rough集的层次聚类算法研究及应用_第4页
基于rough集的层次聚类算法研究及应用_第5页
资源描述:

《基于rough集的层次聚类算法研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士研究生是壅盘指导教师士送型塾蕉学科专业盐差垫廛旦垫盔论文提交日期圣QQ皇堡昼旦论文答辩日期豳墨望论文评阅人答辩委员会主席盆复揸益丝逖2009年岁月j口日独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得重庆邮电太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:关右

2、荔2签字日期:少p宁年乡月纠日学位论文版权使用授权书本学位论文作者完全了解重迭邮电太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重迭整电太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:曩磊磊’导师签名:签字日期:伽7年箩月叫日签字日期:∥1年箩月21日重庆邮电大学硕士论文摘要随着信息技术的发展,数据挖掘技术

3、得到了广泛的关注。在数据挖掘技术中有很多研究领域,聚类分析是数据挖掘的一个非常活跃的研究方向,有着重要的理论意义和应用价值。目前在文献中存在大量的聚类算法,算法的选择取决于数据的类型,聚类的目的和应用。聚类算法具体可以分为划分方法,层次方法,基于密度的方法,基于网格的方法,以及基于模型的方法等。在中、小规模的数据聚类应用中,层次聚类算法不仅适合用于任意属性和任意形状的数据集,还可以灵活控制不同层次的聚类粒度,因此具有较强的聚类能力。而传统的凝聚层次聚类算法大部分只能处理数值属性数据,本文针对字符

4、型数据和混合型数据的聚类方法进行了研究。首先,在经典粗糙集(又称Rough集)理论的基础上,通过松弛对象之间的不可分辨和相容性条件,得到了基于和谐关系的扩展粗糙集模型。该方法有别于传统凝聚层次聚类算法中广泛应用的距离方法,采用和谐度的定义,有效地解决了混合属性对象间的相似性度量问题。其次,重新定义了个体间不可区分度、类间不可区分度、聚类结果的综合近似精度等概念,提出了一种新的混合数据类型层次聚类算法。该算法不仅能处理数值型数据,而且能处理大多数聚类算法不能处理的字符型数据和混合型数据。实验验证了

5、算法的可行性。最后,结合web用户的行为模型,将新的层次聚类算法应用于Web用户挖掘中,提出了一种新的Wcb用户聚类算法。该算法综合考虑了Web用户浏览行为中的浏览时间和浏览频率,提高了wcb用户挖掘的准确度。实验证明该算法比单纯考虑时间或单纯考虑频率的算法具有更好的聚类结果。关键词:数据挖掘,层次聚类,粗糙集,Web用户挖掘雾琴琴警零爹鬻鼍甍零露臻焉露麓爨霉霹#器翳露鬻鞲鞭鬻舅紊票臻笺詈烹覆焉焉麓霭j重型堕大学硕士论文Abstract——’—————————————————’—-___-—●●

6、_●_—____-_-_—-—__——_——-_—一一一_AbstractWiththedeVelopmentofinformationtechnology,thedatamininghasbeenpaidmoreattention.Asweknow,thcclusteringisaveryactivefieldinthedataminingresearch.Therefore,therearcdifferentclusteringalgorithmsfitt0differentdatatype

7、s.Clusteringa190rithmscanberealizedthroughthepartitioningmethod,thehierarchicalmethod,thedensity.basedmethod,thegfid—basedmethod,andthemodel.basedmethodctc.Amongmediumandsmallscalcapplicationofdataclustering,Hierarchicalclusteringalgorithmisnot0nlySu

8、itablcforarbitrary.shapedandarbitrary—attributedatasets,butals0flexibilitVt0controltheclustersizeatdifferentleVels.Therefore,ithasastrongabilitytoclustering.Traditionalhierarchicalclusteringalgorithmcanonlydealwiththcnume“caltypedata,thispaperpresent

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。