web集成信息检索在数字图书馆中的应用研究

web集成信息检索在数字图书馆中的应用研究

ID:24072308

大小:50.00 KB

页数:4页

时间:2018-11-12

web集成信息检索在数字图书馆中的应用研究_第1页
web集成信息检索在数字图书馆中的应用研究_第2页
web集成信息检索在数字图书馆中的应用研究_第3页
web集成信息检索在数字图书馆中的应用研究_第4页
资源描述:

《web集成信息检索在数字图书馆中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Web集成信息检索在数字图书馆中的应用研究:本文针对数字图书馆领域的特点,提出了一种实现数字图书馆L相比,RDF支持语义信息,然后,XML的设计动机是关心文档的结构,目的在于提供多元的文檔表示结构,关注的焦点不是文档中数据所代表的语义信息。通过比较得知,RDF查询语言可以根据实际需要,使用多元的机制,同时可以定制应用领域内资源、语义信息、知识的表达规则。因此,采用RDF查询语言作为信息表示标准,更方便实现数字图书馆领域异构、半结构化数据源IIR的语义相互操作。RQuery的作用有两个,实现对RDF数据和RDFS的查询,为了给用户提供超出普通信息查询更多的知识,系统将上述查询方法结合起

2、来。设计的RQuery解析器是一个简单的语法分析器,针对RQuery的上下文无关文法的特点,采用了自上而下的语法分析方法。顾名思义,自上而下就是从文法的开始符号出发,向下推导,推出句子。其主旨是:对任何输入串,试图用一切可能的办法,从文法开始符号(根节点)出发,为输入串获取确定的最左推导。提出的RDF查询语言RQuery,是一种融合了谓词逻辑的说明式查询语言,它的设计基于数字图书馆IIR需求,与其它RDF查询语言相比,具有如下特点:支持语义映射、可逻辑解析、模式查询和数据查询相融合。2数字图书馆集成信息检索框架基于中介器,包装器的数字图书馆集成信息检索(DLIIR)系统结构如图1所示

3、。系统采用RDF作为中间信息表示规范:即系统各组件间交换的数据皆为符合RDF规范和RDFS定义的信息。因此组件之间以计算机可理解的语义信息进行通讯,提高了处理信息的效率和准确度,适合海量数据的查询。DLIIR系统包含用户接口和中介器2个模块:包装器生成组件(A在进行查询结果到转换时,根据提前定义的显示模式,将RDF文档转换成具有一定格式的文档,然后提交给UIA,以供在用户端的A。完成此次查询任务后,icrosonSQLServer数据库中。因此,KAA和KBSA组件需要更新、访问关系数据库,实现对知识库的维护和查询。这个过程涉及到RDF的解析与RDF图的恢复。7性能评估传统的应用程序

4、往往由程序员手工为每个信息源编制包装器代码,采用包装器自动生成机制避免了程序员手工编写代码。传统方式中手工开发包装器代码耗费的开发代价最大,而DLIIR中建立数据源接口描述文档的开发代价远远小于它。DLIIR系统在实现对异构数据源检索的基础上,同时从检索结果中获取知识,构造了以RDF进行知识表示的知识库。利用本文提出的RQuery语言对知识库进行检索。因此,衡量DLIIR系统的知识库检索性能(P-RKBIR)也就是衡量RQuery语言的检索性能。采用知识库检索时间作为P_RKBIR的衡量标准。在数据量很小时(10万条记录以下),数据量的变化对查询时间的影Ⅱ向无法衡量出来,查询时间相等

5、。在数据量在百万级别以上时,才体现出查询时间随着数据量的增大而增加的趋势。此外,查询时间与记录数是线性关系的。基于结果,DLIIR系统符合设计要求,满足了对数字图书馆领域异构数据源集成检索的需要,而系统的RDF知识库通过设计的专用查询语言RQuery进行检索时性能良好。8结论数字图书馆已经成为国家信息化水平的标志,是社会信息知识共享的框架平台。因此,实现对该领域内异构信息源的互操作,给用户提供智能的、主动的知识服务是数字图书馆的发展方向。本文提出了一种实现异构信息源集成信息检索的互操作框架,并对知识库的建立和检索进行了初步研究。:张小英

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。