概念属性多视角聚类方法研究

概念属性多视角聚类方法研究

ID:34551579

大小:4.04 MB

页数:58页

时间:2019-03-07

概念属性多视角聚类方法研究_第1页
概念属性多视角聚类方法研究_第2页
概念属性多视角聚类方法研究_第3页
概念属性多视角聚类方法研究_第4页
概念属性多视角聚类方法研究_第5页
资源描述:

《概念属性多视角聚类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术信息研究所万方数据硕士学位论文作者时晨导师朱礼军中国科学技术信息研究所论文提交日期(2014年09月)万方数据中图分类号丝丝;!腔旦lUDC02学校代码璺Q旦Q!密级公开中国科学技术信息研究所硕士学位论文作者姓名吐屋导师姓名塞垫至学位类别笪堡堂学科专业憧拯堂学号一809011219职称硒究员学位级别一亟±一一一研究方向值:垦这苤皇翅迟撞苤中国科学技术信息研究所论文提交日期(2014年09月)万方数据独创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的成果。尽我所知,论文中除已经加以标注和致谢的地方

2、外,不包含任何他人享有著作权的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中明确说明并表示了谢意。研究生签名:曲装时间:幻I斗年l。月二7日关于论文使用授权的说明本人完全了解中国科学技术信息研究所有关保留、使用学位论文的规定,即:所里有权保留送交论文的打印稿和电子稿,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同意中国科学技术信息研究所用不同方式在不同媒体上发表、公布论文的全部或部分内容。保密的论文在解密后遵守此规定。研究生签名:时装时间:2。J4年I。月二7日导师签名:辑时间:驯悔/0月7

3、日万方数据致谢值此论文完成之际,谨向一直关心帮助过我的老师、同学、朋友及家人表达我最衷心的感激。感谢我的导师朱礼军老师。朱老师为人谦和,知识渊博,一向毫无保留地给予我最真诚地教导。从论文的选题、构思,到后期的成文与修改,朱老师一直关注着我的论文进展,严格把关我的论文质量,遇到困难时朱老师也总是第一时间给予我最大的鼓励与指导,让我有信心坚定地走下去。同时,朱老师也引导我积极参加各类项目与讲座,丰富我的学术阅历,开拓我的学术视野。接近两年半的研究生生涯中,无论是在学习上,还是在生活中,朱老师以身作则,不断教导我做事与做人的道理,给了我人生一笔宝贵

4、的财富。同时,我也要感谢我的师姐张凌博士,在论文过程中,她一直积极和我交流我遇到的问题,帮助我寻找解决的办法,同时提供了一些新颖的思路和方法。论文之外,她也像姐姐一样照顾我、鼓励我,让我感受家人的温暖。感谢我的工作伙伴程枫同学,他思维活跃,编程能力强,在数据处理与聚类工具寻找上给了我很大的帮助,同时,感谢他能坦诚地提出我聚类方法上的不足并提供我新的思路,让我能够不断地改进论文。感谢研究生部的罗勇、张泽玉、王桂凤、郝文英、刘敏等老师,无论在学习中还是生活中,每当我遇到困难时,你们都会给予我最大的帮助,为我创造了良好的学习环境。感谢我的家人,在我

5、二十多年的求学生涯中,你们一直默默地关心和支持我,使我能够顺利地完成学业。你们无私的爱是我前进的动力,没有你们的关心和爱护,就没有现在的我。感谢所有的同学和朋友们,谢谢你们一直陪伴在我身边,分享我的喜悦,分担我的烦恼,让我不再感到孤单。最后,向所有关心过我和帮助过我的人表达我最真挚的谢意!万方数据概念属性多视角聚类方法研究摘要本文针对传统的知识组织系统(KonwledgeOrganizationSyStem,KOS)结构僵化、复用性差等问题,提出了多视角化知识组织系统(Multi-viewKonwledgeOrganizationSystem

6、,MVKOS)的概念,MVKOS在KOS的基础上引入视角的相关集合,为系统中的所有知识对象都增加了视角信息,相当于为每条知识都增加了适用语境,在服务时,根据用户的检索需求,提供不同视角的服务。此外,本文定义了视角的表达、关系及相关操作,并提出了MVKOS的实施方案,主要分为三步:概念模型构建、视角生成以及系统的多视角化过程。视角生成是构建MVKOS的关键步骤,本文提出了基于属性多视角聚类的视角生成方法。虽然目前关于属性词的聚类研究并不常见,文章改进文档聚类及词聚类的方法,率先将基于文档词频特征的方法与基于共现的方法用于属性词聚类,提出了基于概

7、念文档词频特征的属性聚类方法以及基于属性词共现频次特征的属性聚类方法。上述两种方法属于不重叠聚类,每个属性只能归到一个视角,文章又基于LDA主题生成模型,提出了基于LDA的属性主题聚类方法。在聚类实验中,本文自建了金融领域的典型语料库,包括金融领域核心概念体系、文档语料资源以及属性列表,其中文档语料库依据核心概念体系从搜索引擎、行业机构网站以及学术数据库检索而来,属性列表基于概念体系和语料库通过自动化辅以人工的方式抽取。利用属性列表和文档语料资源,对前文所提的三种聚类方案进行了实验,结果发现聚类准确率最高达至lJ91%,视角精确率最高达至IJ

8、86.7%,充分验证了属性聚类生成视角的可行性,同时,基于LDA的属性主题聚类方法相比于其他两种方法更能得到完整的视角,基于属性共现特征的聚类方法拥有较高的准确率和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。