欢迎来到天天文库
浏览记录
ID:46640330
大小:1.51 MB
页数:9页
时间:2019-11-26
《基于两层元数据与本体的异构数据共享技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、2015年8月第41卷第8期北京航空航天大学学报JournalofBeijingUniversityofAeronauticsandAstronauticsAugust2015V01.41No.8http:ffbhxb.buaa.edu.enjbuaa@buaa.edu.caDOI:10.13700/j.bh.1001-5965.2014.0568基于两层元数据与本体的异构数据共享技术李小涛,胡晓惠+,李斌全(北京航空航天大学自动化科学与电气工程学院。北京100191)摘要:针对多源、多类、异构数据难以同时共享的问题,提
2、出了一种两层元数据结合本体的信息共享技术.首先,分析了两层元数据的结构,介绍了如何通过两层元数据统一描述多类异构数据.其次,针对元数据缺乏语义信息不能描述数据类别之间的隐含关系的问题,在元数据之上建立本体层,对元数据进行语义描述和本体推理.最后,在数据检索方面,利用Lucene全文检索引擎与SPARQL(SimpleProtocolandRDFQueryLanguage)本体查询语言相结合,在关键词查询过程增加了SPARQL检索操作,提高了查全率,并优化了检索时间.实验选取了2014--2015赛季欧洲足球冠军联赛数据作
3、为测试数据,证明了本文方法在异构数据共享上的有效性和元数据查询性能的改进.关键词:异构数据;元数据;本体;信息共享;语义检索中图分类号:V219;TP393文献标识码:A文章编号:1001—5965(2015)08—1476-09随着网络技术的发展和大数据时代的到来,海量数据的分布式存储和网络化管理变得日益重要.大数据的来源和格式呈多样性、复杂性和海量性等特点,简单通过增加存储空问的方法已不能完全解决大数据的共享问题.目前研究人员对数据共享的研究主要集中在元数据和本体两个方向,寄希望于通过一种数据中介实现资源数据的共享与
4、管理.元数据从本质来说是一种描述数据的数据,是从原始数据提取出的一种上层数据.元数据由于其对数据资源的描述能力以及简单的数据结构,成为信息共享的常用手段.文献[1]建立了基于元数据的多源异构信息共享平台,实现了对大规模的多个来源的信息的集成管理和相互交流.文献[2]是本文之前取得的研究成果,通过设计两层元数据结构,实现了在同一系统中多个种类数据的共享.但是,元数据由于缺乏语义描述能力,不能解决数据集的语义异构问题.例如同一个概念在不同的数据集中可能使用不同的术语,相同的术语在多个数据集中可能表示不同的概念,各数据集中概念
5、之间的隐含联系不能体现出来.本体是用来描述某个领域甚至更广范围内的概念以及概念之间的关系,使得这些概念和关系在共享的范围内具有大家共同认可的、明确的、唯一的定义,这样,人机之间以及机器之间就可以进行交流∞1.本体由于其丰富的语义表达能力和强大的推理能力,能够在描述数据的同时分析概念之间的内部联系,成为解决语义异构问题的重要手段.因此,越来越多的学者将本体与元数据相结合H11,赋予元数据语义信息,形成语义元数据,以解决不同数据集的结构异构和语义异构问题.但是本体在实际应用中仍存在以下问题:收稿日期:2014.09.16;录
6、用13期:2014—10.31;网络出版时间:2014—12.1620:42网络出版地址:WWW.cnki.net/kcms/detail/11.2625.V.20141216.2042.003.html基金项目:国家自然科学基金(61273350)作者简介:李小涛(1987一),男,河北唐山人,博士研究生,taosmall@163.corn+通讯作者:胡晓惠(1960一),男,河北承德人,教授,hxh@iscas.ac.cn,主要研究方向为智能系统的综合集成与优化决策、综合信息系统与集成技术.引用格式:李小涛,胡晓惠,
7、李斌全.基于两层元数据与本体的异构数据共享技术fJJ.北京航空航天大学学报,2015,41f8):1476.1484.LiXT,HuX14,LiBP.Heterogeneousdatashadngtechnologybasedontwo—layermetadataandontology[JJ.JournalofBeijingUniversityofAeronauticsandAstronautics,2015,41(8):1476—1484(inChinese).第8期李小涛,等:基于两层元数据与本体的异构数据共享技术1
8、)数据的自动语义标注仍是本体应用的瓶颈,当数据量较大时需耗费很大的人力进行标注工作.2)本体与元数据之间的映射关系复杂,元数据的结构变化会直接影响本体的结构和推理规则.3)由于本体通常以OWL(WebOntologyLan.guage)旧1语言编写的XML文件存在,当个体数量庞大时,本体文件变得很大,检索速度很难令人
此文档下载收益归作者所有