大数据环境下领域本体构建框架研究

大数据环境下领域本体构建框架研究

ID:9120453

大小:85.50 KB

页数:10页

时间:2018-04-18

大数据环境下领域本体构建框架研究_第1页
大数据环境下领域本体构建框架研究_第2页
大数据环境下领域本体构建框架研究_第3页
大数据环境下领域本体构建框架研究_第4页
大数据环境下领域本体构建框架研究_第5页
资源描述:

《大数据环境下领域本体构建框架研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、summarizesconclusionsforconstructionofdomainontologyforbigdata,proposesmethodologicalframeworksforbuildingdomainontologythatcanbuildaYangshengdomainontology.Comparedwithotherdomainontology,thedomainontologyofYangshengaccordingtomethodologyhassomeoutstandingfeatures,suchasreusability,s

2、calability,etc..Therefore,thispaperprovidesreferencetoquicklybuilddomainontologyinthebigdataera.Keyword:Bigdata;Domainontology;Knowledgeorganization;Yangsheng;Received:2017年6月[引用本文格式]付苓.大数据环境下领域本体构建框架研宂[JL图书馆,2017(11):66—711引言大数据环境下,信息资源呈几何速度増长且高速变化,数据源多样并且价值密度低。由于数据的数量、多样性、速度和价值密度,在大

3、数据环境下处理相关数据变得越来越困难。大数据的主要挑战是从结构化和非结构化数据中提取有价值信息。为了处理它们的复杂性,必须将数据分解为知识。木体为此提供了解决方案,因为本体提供了某一领域的明确的和机器可理解的概念化说明。本体是某一领域的共享概念化的规范说明m,提供特定领域的共享和对重用的知识。一般来说,本体旨在向原始数据添加语义,解决异质性问题,允许推理和推断。因此,基于大数据构建领域木体是非常有趣的。随着网上和各领域有效木体数量大量增加,木体构建成为再利用过程m。木体复用关注点不同,如:(1)其他本体,DOLCE1位1,SUM0B1,0B0X51;(2)本体模块

4、[6-8];(3)非本体资源,如叙词表,词表和分类表等,导致本体复用水平不同。本体开发可表述为构建一个本体网络M,但由于本体构建过程中缺乏统一清晰、规范完善的框架和依据,目前已有领域本体复用和整合效果较弱,面对数据量巨大、数据类型多、价值密度低、高速变化[10]的大数据,从构建过程、生命周期、支持构建过程的方法、技术和工具等方面建立统一的领域本体构建方法论,从应用角度方面实现领域本体构建是亟待解决的问题。为了满足用户从巨量数据中快速有效获取有价值信息的需求,本文提出了一种适合大数据特征的本体构建方法。2相关研究NeOn提出一种棊于场景的本体构建方法,支持不同本体开

5、发过程,支持分布式环境中网络化本体的动态演化,支持不同人员(领域专家和构建人员等)在本体开发过程的不同阶段阐述知识M,旨在通过本体网络进行大规模语义应用。NeOn项目设计了9个木体构建场景:从头开始创建;重用和重建非木体资源;重用本体资源;重用和重构本体资源;重用和整合本体资源;重用、整合、重构本体资源;重用本体设计模型;重组本体资源;本体资源本地化[11]。浼业本体化网络mi首先确定本体领域的范围及包括的数据,然后根据场景1、2、3、7、5构建本体,包括HGIS的渔业时间序列参考表、AGROVOC、ASFA、渔业和水产的分面表、FAO地理木体。基于参考表数据重组

6、为木体,用来索引时间序列,是核心木体。STKOS项目组[13]在NeOn本体构建方法基础上提出了STKOS本体构建方法。马雨萌等ill!提出丫构建STKOS屮学科领域本体模型的3层架构,并以屮国科学院植物研宄所为例,阐述领域本体模型3层架构模型在构建植物多样性领域本体的应用。根据概念是否面向学科领域及其描述层次,领域本体研究层次主要分为无只体学科特征的顶层木体、表达学科共有特征的领域上层木体、面向具体建设目标的领域应用本体三方面[15]。Abbes和Gargouriii虹认为手工构建本体是非常困难和容易出错的工作,提出了一种自动化本体构建方法,它是基于MongoD

7、B数据库中的数据获取OWL本体。从MongoDB数据库学习本体的方法是基于将MongoDB结构映射到OWL本体的转换规则U21,伍括五个主要步骤:创建木体框架:学习概念属性;识别个体:推导出类公理、属性公理和约束;用类定义运算符(交、并、补)来丰富本体。最后使用“NorthWind”数据库通过工具M20nto(MongoDB到本体)验证了此方法的有效性。表1大数据和大规模语义应用中木体构建方法比较Jirkovsky等[18]和Bansal等提出了大数据集成应用中本体构建方法。Jirkovskf等提出了创建共享本体解决大数据语义异质性问题。首先,处理不同类型的数据源

8、,如文本文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。