欢迎来到天天文库
浏览记录
ID:58156106
大小:767.77 KB
页数:7页
时间:2020-04-25
《一种基于本体的异构数据语义抽取方法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、计算机与现代化2014年第6期JISUANJIYUXIANDAIHUA总第226期文章编号:1006-2475(2014)06-0001-06一种基于本体的异构数据语义抽取方法成欣,李扬(北京科技大学计算机与通信工程学院,北京100083)摘要:针对领域科学数据异构多样、缺乏语义的问题,本文提出一种基于本体的异构数据语义抽取方法。首先,构建领域科学数据的语义抽取框架,并在此基础上分别针对结构化、半结构化以及非结构化数据制定相应的语义转换与抽取规则,形成局部领域本体;然后,通过异构数据间的关联映射,构
2、建领域数据的全局本体,实现异构数据的有效组织与统一管理;最后,将相关方法应用到材料领域,为材料科学数据的有效管理与共享服务提供支撑。关键词:本体;异构数据;语义抽取;数据集成;领域科学数据中图分类号:TP301.2文献标识码:Adoi:10.3969/j.issn.1006-2475.20l4.06.oolAnOntology-basedSemanticExtractionMethodofHeterogeneousDataCHENGXin.UYang(SchoolofComputerandCommu
3、nicationEngineering,UniversityofScienceandTechnologyBeijing,Beijing100083,China)Abstract:Fortheissuesofheterogeneousandlackofsemanticsaboutscientificdata,thispaperproposesallontology-basedse-manticextractionmethodofheterogeneousdata.Firstly.weconstruct
4、thesemanticextractionframeworkofscientificdata,andonthisbasis,respectivelyformulatethecorrespondingsemanticconversionandextractionrulesforthestructured,semi-structuredandunstructureddata,thusformthelocaldomainontology.Secondly,weconstructtheglobalontol
5、ogyofdomaindatathroughtheassociationmapping,andthenachievetheeffectiveorganizationandunifiedmanagementofheterogeneousdata.Finally,weap-p1ytherelatedmethodtothefieldofmaterials,andrealizetheefectivedatamanagementandsharingserviceinthefieldofmate-rials.K
6、eywords:ontology;heterogeneousdata;semanticextraction;dataintegration;domainscientificdata领域用户多样化需求,迫切需要一种新的数据处理方O引言式来支撑并实现大规模异构数据的统一转换与抽取。近年来,随着互联网数据规模的快速增长,大数据此,本文提出一种基于本体的异构数据语义抽取方据刮的管理问题日益凸显,人们在数据管理方面正法,并将其应用于材料科学数据的共享服务中,从而面临着新的挑战,尤其是在领域科学数据刮方面,科通
7、过本体技术的语义支撑来实现领域科学数据的有学家发现已经很难有效管理和共享这些在人类社会效管理与共享。科学实践中所产生的领域科学数据。一方面,人们对1相关研究大规模数据集的处理能力已远远跟不上现代科学研究高速产生数据的能力;另一方面,这些大规模快速针对异构数据的语义[处理,目前已取得了一增长的数据资源形式多样、异构复杂,使得传统单纯定的研究成果。XuJ.等人提出一种采用分解聚合查的关系数据库管理模式已无法有效应对这种局面。询来整合领域异构数据的方法9],对异构数据的语在此背景下,为提高领域科学数据的利
8、用效率,满足义查询具有一定的支撑效果。VinciniM.等人提出一收稿日期:2014-04—18基金项目:国家科技基础条件平台建设项目(2005DKA32800);材料领域知识工程北京市重点实验室2012年度阶梯计划资助项目(Z121101002812005);十二五国家科技支撑计划资助项目(2011BAK08B04);973国家重点基础研究发展计划资助项目(2013CB329606)作者简介:成欣(1983.),女,河南安阳人,北京科技大学计算机与通信工程学院博士研
此文档下载收益归作者所有