试论数字图书馆跨库检索的现状和发展

试论数字图书馆跨库检索的现状和发展

ID:30205992

大小:96.55 KB

页数:12页

时间:2018-12-28

试论数字图书馆跨库检索的现状和发展_第1页
试论数字图书馆跨库检索的现状和发展_第2页
试论数字图书馆跨库检索的现状和发展_第3页
试论数字图书馆跨库检索的现状和发展_第4页
试论数字图书馆跨库检索的现状和发展_第5页
资源描述:

《试论数字图书馆跨库检索的现状和发展》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、试论数字图书馆跨库检索的现状和发展摘要:数字图书馆的跨库检索是一种近些年才兴起的服务方式,但已经成为数字图书馆领域的研究热点,无论是在功能还是在技术上都发展迅速。文章探讨目前数字图书馆跨库检索的相关技术及其发展,以及对国内外跨库检索系统进行比较和总结。关键词:跨库检索;数字图书馆;中间件ABSTRACT:Digitallibraryofcross-databaseretrievalisakindofemergedinrecentyearsserviceway,buthasbecometheresearchfocusinthefieldofdigitallibrary,whetherinfunc

2、tionortobetechnicallydevelopingrapidly.Thearticleprobesintodigitallibrarycross-searchtherelevanttechnologyanddevelopmentathomeandabroad,andcross-searchsystemtocompareandsummarized.KEYWORDS:Cross–search;Digitallibrary;middleware一、引言本世纪以来,人类创生的信息量高速增长,据估计,70年代以来全世界每年出版图书50万种以上、期刊10万种以上、专利约50万件、科技报告约90

3、万件、会议文献10多万篇、产品样本50多万种,每年发表的科技论文总数近500万篇,并呈指数式增长,真可谓信息浩如烟海。随着互联网的快速发展,通过网络提供服务的以缩微品、声像带、磁盘、光盘等形式记录的非纸信息急剧上升,电子资源日益增多,数据库种类越来越丰富。如何从这浩如烟海的信息中找出所需信息,就成为信息检索的重任。信息化的多样性、数据库种类的形式不一、平台的差异性这些都对文献检索带来了许多困难。随着国家教育部要求在部分高校开设“文献检索与利用”课程,各高校图书馆数字化建设的大力投入、情报单位信息化建设的研究深入,这方面的工作也取得了一定的成绩。但存在的问题也不少,几乎所有的数据库都有自己独特的

4、检索系统,用户每使用一种数据库,都必须重新进入和使用一种不同的检索系统,使人感到不胜其烦。往往又找不到所要的信息。这样用户的使用成本大大增加,降低了用户的积极性。因此,不少用户提出能不能开发一个兼容各种数据库的无所不包的检索和阅读的统一平台。二、跨库检索简介跨库检索也称联邦检索(FederatedSearch),数据库检索(Multi-DatabaseSearch)或集成检索(IntegratedAccess),是以多个分布式异构数据源为对象的检索系统,这种系统向用户提供统一的检索接口,将用户的检索要求转化为不同数据源的检索表达式并发地检索本地的和广域网上多个分布式异构数据源,并对检索结果进行

5、整合,在经过去重和排序等操作后,以统一结果呈现给用户。跨库检索的发展不仅方便了用户的信息获取,而且还在一定程度上提高了数据库的利用率,促进了资源共享。目前,国内外已经有不少跨库统一检索系统,美国在这个领域处于领先地位,他们早先在跨库统一检索领域的研究成果之一就是提出了三个数字图书馆系统模型。第一个是伊利诺依大学的Interspace系统,第二个是斯坦福大学的Infobus系统,第三个是密执根大学的UMDL系统。另外还有后来的美国新墨西哥州莫斯阿拉莫斯国家实验室研究图书馆研究开发的FlashPoint系统,加利福尼亚大学的SearchLight系统等。我国的数字图书馆研究起步较晚,但是也研究开发

6、出了多个数字图书馆跨库检索系统,主要有清华大学的同方异构统一检索平台(USP)、中国科学院文献情报中心开发的集成检索系统(CSDL)、中国高等教育文献保障系统(CALIS)统一检索系统、CNKI知网技术有限公司开发的CNKI跨库检索系统等等三、跨库检索的相关技术跨数据库检索需要用到数据的整合技术,目前对异构数据源的数据整合方式主要有以下两种:一种是将各种异构数据库的部分数据导入一个数据库系统中,为了整合不同类型的数据,必须将一些非传统的数据类型转化成新的数据类型。这种方法的优点是检索反应速度快,不会因个别数据库访问失败而影响整体检索效率。缺点是收录的数据库数量不能太多,只能实现对有限数据库的集

7、中和检索。第二种方法是利用中间件技术进行异构数据库数据整合,这种方法不需要改变原始数据的存储和管理方式。采用中间件技术,对来自用户的查询请求,分解成对不同原始数据库的独立访问请求,通过标准或非标准的数据访问接口对原始数据库进行实时访问并将结果整合后通过发布系统(或直接)返回给用户。这种方式的特点是实时性好,任何原始数据的更改都可以在用户查询时及时得到反映;原文获取可以直接通过中间件获得从而省去原文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。