基于领域本体的开放存取资源语义检索引擎设计与实现

基于领域本体的开放存取资源语义检索引擎设计与实现

ID:34116059

大小:2.33 MB

页数:5页

时间:2019-03-03

基于领域本体的开放存取资源语义检索引擎设计与实现_第1页
基于领域本体的开放存取资源语义检索引擎设计与实现_第2页
基于领域本体的开放存取资源语义检索引擎设计与实现_第3页
基于领域本体的开放存取资源语义检索引擎设计与实现_第4页
基于领域本体的开放存取资源语义检索引擎设计与实现_第5页
资源描述:

《基于领域本体的开放存取资源语义检索引擎设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、情报理论与实践(ITA)欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟1,21●鲍玉来,毕强(1.吉林大学管理学院,吉林长春130022;2.内蒙古大学图书馆,内蒙古呼和浩特010021)*基于领域本体的开放存取资源语义检索引擎设计与实现摘要:提出一个以领域本体为基础的,开放存取(OA)资源的语义检索引擎的设计方案。引入了中介映射和局部映射的方法来处理顶级领域本体与OA资源的应用领域本体之间的通信。探索了通过SPARQL查询分解与重构来处理异构OA资源语义检索新途径。关键词:语义检索;开放存取;领域本体Abstract:Thispaperpr

2、oposesadesignschemeforopenaccessresourcesemanticretrievalenginebasedondomainontology.Then,thepaperintroducesmethodsofmediatedmappingandlocalmappingtodealwithcommunicationbetweenthetopdomainon-tologyandapplicationdomainontologyofOAresource.Finally,thepaperexploresthenewwayofsemanticretrievaltodeal

3、withheterogeneousOAresourcethroughtheSPARQLquerydecompositionandreconstruction.Keywords:semanticretrieval;openaccess;domainontology开放存取(OpenAccess,OA)资源是公开科学研究于EAI(EnterpriseApplicationIntegration)的跨库实时检[6]成果,共享学术信息的一种重要的在线学术资源。网络技索机制。这种方式先对OA期刊的检索表单进行大范围术的发展,OA期刊和OA仓储资源得到了空前的发展,统计,根据特征对表单元素分类,并借

4、助于HTML文档分加速了开放存取从理念到实践应用的进程。目前重要的开析技术对分类后的属性单元进行深度解析,然后根据属性[7]放存取资源集成服务平台DOAJ(DirectoryofOpenAccess单元语义信息实现检索服务。[1]Journals)、DOAR(DirectoryofOpenAccessReposito-在上述3种主要的OA资源整合服务方式中,第一种[2][3]ries)、SOCOLAR等系统就是OA资源信息组织的成方式要求大范围地采集OA资源的元数据,由于目前有相功范例,这些系统所建立的基于OAI-PMH(OpenArchives当部分的OA资源并不支持OAI-PMH协议

5、,所以元数据InitiativeProtocolforMetadataHarvestingProject)的元数据采集的质量是这种方式的瓶颈,会造成查全率和查准率的获取机制、基于DOI的文献标识机制、基于OAIS的永久缺失。第二种方式技术复杂,对一些存在登录验证或者权保存机制为OA资源的深度利用起了重要的推动作用。但限控制的OA资源,不能进行抓取和索引。第三种方式较是,由于许多OA资源是分散存放在世界各地不同的服务之前两种具备良好的查全率和查准率保证。但是上述3种[4]器和网站上的,分布的泛在性与组织的异构性决定了整合和检索方式,目前提供的检索仍然都是以关键词匹配对其进行深度知识组织的复

6、杂性,因此用户很难直接全面为基础,结合布尔运算构造查询表达式的传统方式,没有地检索到这些资源。将OA资源的检索提升到知识检索的高度。鉴于此,利用领域本体来解决OA资源整合中的语义异构问题,将使1研究现状OA资源的检索提升到“语义”的水平。本文给出了基于近年来,学术界对于OA资源的整合检索的研究主要领域本体的OA资源语义检索引擎的系统模型及实现。集中在3个方面:①元数据整合方式。通过OAI-PMH或2OA资源语义检索引擎系统逻辑结构者其他方式获取OA资源的元数据,集中存储提供检索;②基于网络爬虫技术的整合方式。通过网络爬虫技术抓本体具有对“语义”水平的描述和组织能力,本体[5]取、解析和索

7、引OA资源,集中存储提供检索;③基的形式化允许某些种类的推理,这些推理会在一定的环境中自动产生。由于本体数据的独立性和自动推理本体已被*本文为国家自然科学基金项目“开放语义网环境下数字图书馆广泛应用于特定领域的知识组织和知识服务。本体非常适资源多维度聚合与可视化展示研究”(项目编号:71273111)和合整合异构数据库,使不同的系统在独立和互操作基础上吉林大学“985工程”项目的研究成果。提供以知识为基础的服务成为可能。·第37卷2

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。