数字图书馆建设与发展策略研究

数字图书馆建设与发展策略研究

ID:24704693

大小:55.00 KB

页数:8页

时间:2018-11-14

数字图书馆建设与发展策略研究_第1页
数字图书馆建设与发展策略研究_第2页
数字图书馆建设与发展策略研究_第3页
数字图书馆建设与发展策略研究_第4页
数字图书馆建设与发展策略研究_第5页
资源描述:

《数字图书馆建设与发展策略研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数字图书馆建设与发展策略研究  一、数字图书馆的含义  数字图书馆就是运用当代信息技术,对数字信息资源进行采集、整理和贮存,并向所有连接网络的用户提供,为一定的社会政治、经济服务的文化教育机构以及这种机构的组合。前者称之为狭义数字图书馆,后者为广义数字图书馆。这个定义明确了数字图书馆的社会性质――文化教育机构;明确了数字图书馆的活动目的――为一定社会的政治、经济服务;明确了数字图书馆的工作对象――数字信息资源;明确了数字图书馆的工作内容――采集、整理、贮存和提供数字信息资源;区别了数字图书馆和传统图书馆的不同之处――利用当

2、代信息技术,工作对象是数字信息资源和服务的对象是所有连接网络的用户;绘出了广义数字图书馆和狭义数字图书馆的概念。因此这种表述方法还是比较准确、全面的。  二、数字图书馆建设面临的技术挑战  数字图书馆涉及到许多高新的技术,其建设面临着诸多技术方面的挑战,如超大规模数据库技术、信息压缩与传输技术、分布式处理技术、安全保密技术、可靠性技术、数据仓库与联机分析处理技术、信息抽取技术、数据挖掘技术、基于内容的检索技术、自然语言理解技术等。  (一)信息资源建设  数字图书馆作为一个数字资料库,首先涉及到众多资料的整理入库问题。已有

3、图书的数字化工作,需要有效的管理机制。我国目前有各种各样的图书馆几千个,信息资源建设的协调管理是一个大问题,这其中有工具问题,也有管理问题。例如,对于同一本图书,应该保证:如果某图书馆已经将其录入,其他人就不要再进行录入了。这项工作如果协调不好,很可能同一件事要做若干遍,重复劳动,而给社会造成极大的浪费。  (二)数据存储与压缩  数字图书馆所涉及的数据类型有文本、图像、声音、视频等,而且所面临的数据是海量的。这么大的数据量是迄今为止其他任何系统都没有理到过的,需要大规模数据库来存储和处理这些数据。因此,如何存储和管理海量

4、数据是系统设计的核心任务之一。在数字图书馆的数据中,文本数据的存储不是很大,真正大的是多媒体数据。因此.对多媒体数据必须进行压缩,然后存储在数据库中,以降低库的成本,使库的规模保持在可管理的范围内。如对一段“新闻联播”中主持人讲话的录像,如果将其原封不动地保存下来放到数据库中,可能要占几百兆字节的空间,压缩后,就可能只占几兆的字节空间。  (三)分类、索引和检索  在图书馆中,分类与索引是检索的基础。分类方法也有各种学派和门类,目前在数字图书馆领域中,还没有完成统一的分类方法,这就提出了一个如何统一分类标准的问题。如果没有

5、一个统一的索引方法和分类带,将来开发计算机的搜索工具就会非常困难,需要针对不同的分类方法制作不同的搜索工具。  另外,我们所面临的数据类型也不同,如文本、图像、视频、音频等信息,列不同的内容,需要不同的分类体系和索引机制、而能否制定一个比较好的分类方法、建立一个比较好的索引机制,将直接影响到能否开发出一个比较好的检索工具。  对于检索,假如在Internt检索“数字图书馆”这个词,目前的检索常常是这样实施的。把“数字图书馆”切分成“数字”和“图书馆”,凡是与“数字”、“图书馆”、“数字图书馆”打出的条目都会检索出来,其实这

6、些并不都是用户所需要的,并且由于这样检索出的条目往往非常之多,从而使用户无从下手,难于找到需要的信息。而目前的分类器绝大多数都是尽可能多地给你信息,而不管你有用没用。  因此,怎样做一个比较好的检索工具,使得提供给用户的信息恰恰是用户最需要的(不需要的一条也没有),也就是说,大量数据的搜索效率(最优解)与速度是系统面临的最大挑战,其中包括中文搜索、图像搜索、语音搜索、智能搜索等。这当中涉及大量的人工智能的支持。  (四)传输与保护  目前,无论是访问国内的站点还是国外的站点,速度都比较慢。因此,怎样从服务器端进行调度、协调

7、,当用户提出―个服务请求时,用最短的时间对用户的请求进行回答,这是系统能否成功的关键;这其中有很多问题需要解决,如带宽的有效使用问题。现在,所有的搜索中都存在这一问题,搜索工具只管找到用户的解,而不管使用多长时间。另外,当用户提出的关键字关联性不很强,其组合方式又很初级的时候,可以预见,这种检索会花很长时间,解也会很多。在这种情况下,应该在检索之前提醒用户,再增加―些约束条件,以加快搜索速度,并使检索中的信息真正是用户所需要的。  在对多媒体检索时,应该有快速图像浏览机制,即多媒体解的分层传输;如果用户提交了一个多媒体检索

8、请求,并且搜索引擎―次找到很多照片或图像,系统的做法是将找到的照片分成若干层,将最粗层传给用户,用户确认选择后,再逐渐细化,而当用户认为这张照片不是所要的时,可随时结束,再换另一张。  保护包括版权保护和系统安全性保护。版权保护是数字图书馆作为商业系统运行的前提。没有版权保护的手段,就不可能允许数字图书

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。