欢迎来到天天文库
浏览记录
ID:35072990
大小:5.39 MB
页数:62页
时间:2019-03-17
《大数据环境下异构知识融合方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号TP391密级公开学号132294■■■VTwmMmim硕±学位论文(学术型)大数据环境下异构知识融合方法研究题目作者指导教师李永明教授-级学科名称软件工程二级学科名称软件工程理论提交日期二〇—六年五月k?学位论文原创性声明本人声明所呈交的学位论文是我在导师的指导下进行研究工作所取得的研究成果。尽我所知,,除文中已经注明引用的内容和致谢的地方外本论文不包含其他个人或集体已经发表或撰写过的研巧成果,也不包含本人或他
2、人己申请学位或其他用途使用过的成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。一本学位论文若有不实或者侵犯他人权利的,本人愿意承担切相关的法律贵任。痛刮曰《月'作者签名:期:各年3曰学位论文知识产权及使用授权声明书本人在导师指导下所完成的学位论文及相关成果,知识产权归属陕西师范大学。本人完全了解陕西师范大学有关保存、使用学位论文的规定,允许本论文被查阅和借阅,学校有权保留学位论文并向国家有关部n或机构送交论文的纸质版和电子版,有权将本论文的全部
3、或部分内容编入有关数据库进行检索,可W采用任何复制手段保存和汇编本论文。本人保证毕业离校后,发表本论文或使用本论文成果时署名单位仍为陕西师范大学。保密论文解密后适用本声明。</作者签名:汤明日期:年月3曰摘要随着目前大规模的数据交叉及相互关联性,数据的持征和现实的需求也都相。W大规模、跨领域、跨语言、跨媒体应的发生了变化、普适化、动态演化、多源异构为主要特征的数据正在发挥着更加重要的作用,而相应的在数据存储、理解和分析等方面也将面临着非常巨大的挑战。当下急需解决实现大数据的
4、价值最大化的问题,。在大数据环境下由于数据的结构差异大、数据来源广、价值密度,较低,而、更新实时等特点给知识服务带来了巨大的挑战多源异构知识的融合为研究者在大数据环境下进行知识获取、知识组织和利用提供了非常有效的手段和方法。知识融合自身的价值就在于从众多分散、异构的数据源、知识源中挖掘出隐含的、有价值的、尚未被发现的信息和知识(如规则、方法、模型、约束、经验等。目前的知识融合方法还有很多的不足,本文就大数据环境下的异构知识融)一合方法展开了进步地深入研究,主要从W下几个方面开展:(1
5、)多源异构知识库的构建:本文提出了多源异构知识库的构建模型,并对知识库的构建方法进行了详细的阐述。本文主要研究了资源描述框架(民esource化scriptionFramework,RD巧的知识表本方法,由于知识源有结构化、半结构化和非结构化的,本文针对不同的知识来源选择合适的知识抽取方法来进行知识的获取。最后提出了构建RDFS元组的算法,并将抽取后得到的巧识中间文件按照构建RDFH元组算法生成了WRDF/XML的形式的存储文件,作为本文的知识库。2源异构知识融合方法一()多:目前
6、还没有形成个高效的用于知识融合的算,现在己有的知识融合方法都是通过借鉴信息顧合方法得来的法。知识融合的目一的是为了可W提供更好的知识服务,将多源异构的知识经过系列处理,得到可一,也可能会发现隐藏的知识。在此基础上靠性较高的知识,本文提出种基于数一:据融合的知识融合方法,并提出依据知识源的粒度提出了种改进算法知识源-的分解合并算法,W求得尽可能真实可靠的知识。(3)多源异构知识融合算法实验分析:应用Hadoop构建实验平台,并基于MapReduce框架,实现多源异构知识融合算法求得本文构建
7、的多源异构知识库中包含的RDF兰元組的真实概率,并根据本文提出的改进算法得到了质量更高的知识源,再进行融合实验,将得到的数据结果利用MATLAB绘制成图,分析数据后得出根据本文提出的改进方法可W有效提高多源异构知识融合算法的性能。关键词:多源异构知识,知识库,知识表示,知识抽取,知识融合算法IAbstract-Datacharacteristicsandrealisticdemandshavechanedbecauseofllg化6argescae’wdatas
8、linksandcrossover.Thedata,hichhasmainfeaturesoflargescale,crossdomain,crosslanguage,crossmedia,generalization,dynamicevolutionand-multisourceheteroeneousisla
此文档下载收益归作者所有