基于决策粗糙集的面向知识自动聚类及应用研究

基于决策粗糙集的面向知识自动聚类及应用研究

ID:34037471

大小:2.48 MB

页数:60页

时间:2019-03-03

基于决策粗糙集的面向知识自动聚类及应用研究_第1页
基于决策粗糙集的面向知识自动聚类及应用研究_第2页
基于决策粗糙集的面向知识自动聚类及应用研究_第3页
基于决策粗糙集的面向知识自动聚类及应用研究_第4页
基于决策粗糙集的面向知识自动聚类及应用研究_第5页
资源描述:

《基于决策粗糙集的面向知识自动聚类及应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士研究生指导教师学科专业论文提交日期..勉ff生£旦迦旦论文答辩日期一雄皇上颦一论文评阅人——答辩委员会主席≯ff年5月7Et本学位论文作者完全了解重庆邮电太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权重麽整电太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:l墙双从导师签名:签字日期:锄『f年‘月‘『日./j绣签字日期:∥ff年阳夕日重庆邮电大学硕士论文Abstract摘要聚类分析是智

2、能信息处理、数据挖掘、模式识别等研究方向的重要研究内容之一,在识别数据的内在结构方面具有重要作用。大多数聚类算法都需要预先给出参数,如聚类数目、聚类中心点或迭代次数等。事实上,如果没有相关知识和经验,这在多数情况下是不可行的。因此,为了减少人为干扰因素,本文基于决策粗糙集模型进行了自动聚类的研究。Hirano和Tsumoto等提出的面向知识(Knowledge.Oriented)聚类算法,通过结合层次聚类算法和粗糙集理论,能从局部和全局的数据特性上对数据进行聚类,具有很好的聚类效果。因此,本文采用了面向知识聚类的算法框架进行自动聚类的研究。首先,针对面向知识聚类算法的初始聚类

3、结果对用户输入的初始阈值参数敏感这一问题,本文提出了一种自动阈值选取方法一一选择差值法。该方法充分考虑了数据的物理特性,能自动地得到较好的初始聚类结果。此外,本文研究发现了以往文献中定义的类类不可区分度公式的不合理性并进行了改进,新的计算方法使聚类结果更加准确。本文还对决策粗糙集模型进行了研究,提出了基于决策粗糙集的聚类模式代价评估方法,能够动态的对聚类结果进行评估,根据聚类模式的代价值的变化来制定合并策略和指导算法选择终止点;另外,新方法也自动地给出了类重叠边界区域的范围,有助于用户选择不同粒度的聚类结果。同时,本文给出了一个基于决策粗糙集的面向知识自动聚类算法,在人工数据

4、集和标准数据集上的实验结果表明该算法是有效可行的,并且能处理类类边界重叠问题,也不需要人为阈值的设定。最后,本文将上述研究成果应用到了Web搜索结果聚类中,仿真实验表明新方法在边界具有重叠现象的聚类中应用良好。关键词:聚类,面向知识聚类,自动聚类,决策粗糙集,代价automatically.Inaddition,thethesisfindsthattheexistingdefinitionofindiscernibilitydegreeofclustersisnotalwaysreasonable,andtheredefinitioncanleadtobettercluste

5、ringresults.Furthermore.thethesisstudiesthedecision—theoreticroughsetmodel,andaclusteringschemeestimatemethodisproposedinviewofthedecision.theoreticroughsetmodel,whichishelpfultodecidethecombinestrategyandtochoosetheterminationpointofthealgorithmaccordingthechangeoftherisks.Thenovelmethodca

6、ndealwiththeoverlappingclusteringandillustratestherangeoftheboundarywhichishelpfultochoosethedifferentgranularclusteringresults.Then,thethesisproposesanautonomousknowledge-orientedclusteringalgorithmbasedonthedecision-theoreticroughsetmodel,theresultsofexperimentsonthesyntheticdataandthesta

7、ndarddatashowthatthenovelmethodisvalidandefficienttodisposetheoverlappingclusteringandthereisnohumanintervention.Finally,thenovelmethodisusedinthewebsearchresultsclusteringandtheresultsofexperimentshowthatthenewmethodisgoodatdealingwiththeoverlapclusteri

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。