大数据环境下异构知识融合方法研究

大数据环境下异构知识融合方法研究

ID:35072990

大小:5.39 MB

页数:62页

时间:2019-03-17

大数据环境下异构知识融合方法研究_第1页
大数据环境下异构知识融合方法研究_第2页
大数据环境下异构知识融合方法研究_第3页
大数据环境下异构知识融合方法研究_第4页
大数据环境下异构知识融合方法研究_第5页
资源描述:

《大数据环境下异构知识融合方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号TP391密级公开学号132294■■■VTwmMmim硕±学位论文(学术型)大数据环境下异构知识融合方法研究题目作者指导教师李永明教授-级学科名称软件工程二级学科名称软件工程理论提交日期二〇—六年五月k?学位论文原创性声明本人声明所呈交的学位论文是我在导师的指导下进行研究工作所取得的研究成果。尽我所知,,除文中已经注明引用的内容和致谢的地方外本论文不包含其他个人或集体已经发表或撰写过的研巧成果,也不包含本人或他

2、人己申请学位或其他用途使用过的成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。一本学位论文若有不实或者侵犯他人权利的,本人愿意承担切相关的法律贵任。痛刮曰《月'作者签名:期:各年3曰学位论文知识产权及使用授权声明书本人在导师指导下所完成的学位论文及相关成果,知识产权归属陕西师范大学。本人完全了解陕西师范大学有关保存、使用学位论文的规定,允许本论文被查阅和借阅,学校有权保留学位论文并向国家有关部n或机构送交论文的纸质版和电子版,有权将本论文的全部

3、或部分内容编入有关数据库进行检索,可W采用任何复制手段保存和汇编本论文。本人保证毕业离校后,发表本论文或使用本论文成果时署名单位仍为陕西师范大学。保密论文解密后适用本声明。</作者签名:汤明日期:年月3曰摘要随着目前大规模的数据交叉及相互关联性,数据的持征和现实的需求也都相。W大规模、跨领域、跨语言、跨媒体应的发生了变化、普适化、动态演化、多源异构为主要特征的数据正在发挥着更加重要的作用,而相应的在数据存储、理解和分析等方面也将面临着非常巨大的挑战。当下急需解决实现大数据的

4、价值最大化的问题,。在大数据环境下由于数据的结构差异大、数据来源广、价值密度,较低,而、更新实时等特点给知识服务带来了巨大的挑战多源异构知识的融合为研究者在大数据环境下进行知识获取、知识组织和利用提供了非常有效的手段和方法。知识融合自身的价值就在于从众多分散、异构的数据源、知识源中挖掘出隐含的、有价值的、尚未被发现的信息和知识(如规则、方法、模型、约束、经验等。目前的知识融合方法还有很多的不足,本文就大数据环境下的异构知识融)一合方法展开了进步地深入研究,主要从W下几个方面开展:(1

5、)多源异构知识库的构建:本文提出了多源异构知识库的构建模型,并对知识库的构建方法进行了详细的阐述。本文主要研究了资源描述框架(民esource化scriptionFramework,RD巧的知识表本方法,由于知识源有结构化、半结构化和非结构化的,本文针对不同的知识来源选择合适的知识抽取方法来进行知识的获取。最后提出了构建RDFS元组的算法,并将抽取后得到的巧识中间文件按照构建RDFH元组算法生成了WRDF/XML的形式的存储文件,作为本文的知识库。2源异构知识融合方法一()多:目前

6、还没有形成个高效的用于知识融合的算,现在己有的知识融合方法都是通过借鉴信息顧合方法得来的法。知识融合的目一的是为了可W提供更好的知识服务,将多源异构的知识经过系列处理,得到可一,也可能会发现隐藏的知识。在此基础上靠性较高的知识,本文提出种基于数一:据融合的知识融合方法,并提出依据知识源的粒度提出了种改进算法知识源-的分解合并算法,W求得尽可能真实可靠的知识。(3)多源异构知识融合算法实验分析:应用Hadoop构建实验平台,并基于MapReduce框架,实现多源异构知识融合算法求得本文构建

7、的多源异构知识库中包含的RDF兰元組的真实概率,并根据本文提出的改进算法得到了质量更高的知识源,再进行融合实验,将得到的数据结果利用MATLAB绘制成图,分析数据后得出根据本文提出的改进方法可W有效提高多源异构知识融合算法的性能。关键词:多源异构知识,知识库,知识表示,知识抽取,知识融合算法IAbstract-Datacharacteristicsandrealisticdemandshavechanedbecauseofllg化6argescae’wdatas

8、linksandcrossover.Thedata,hichhasmainfeaturesoflargescale,crossdomain,crosslanguage,crossmedia,generalization,dynamicevolutionand-multisourceheteroeneousisla

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。