高校图书馆特色数据库建设技术研究

高校图书馆特色数据库建设技术研究

ID:23468150

大小:76.96 KB

页数:8页

时间:2018-11-07

高校图书馆特色数据库建设技术研究_第1页
高校图书馆特色数据库建设技术研究_第2页
高校图书馆特色数据库建设技术研究_第3页
高校图书馆特色数据库建设技术研究_第4页
高校图书馆特色数据库建设技术研究_第5页
资源描述:

《高校图书馆特色数据库建设技术研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、高校图书馆特色数据库建设技术研究(安徽建筑工业学院图书馆,安徽合肥230601)摘要:文章认为,特色数据库建设一直是各高校图书馆进行数字化建设的重要内容,它必须要有很强的技术支撑,涉及到信息的采集、加工、存储、检索和发布等一系列技术应用过程。关键词:高校图书馆;特色数据库;信息化建设中图分类号:G250.74文献标识码:A文章编号:1007—6921(XX)05—0126—0221世纪是知识经济和信息化的时代,数字资源建设已经成为评价一所学校图书馆资源建设的重要标志,也是数字书馆建设的核心,这其中尤以特色数据库建设最受关注。特色数

2、据库是数字图书馆开展信息服务最主要的信息资源,是传统图书馆特色馆藏在数字时代的另一种表现形式。特色数据库建设需要大量的技术支持,从信息资源的采集、加工、存储、检索和发布等涉及一系列的技术应用过程。1信息采集技术信息资源是构成特色数据库的主要内容和表现形式,随着多媒体技术的发展,目前可纳入数据库收录范围的信息包括文本、图像、音频和视频等多种形式,这些不同形式的资源纳入到数据库中必须经过严格的数字化技术处理,使其符合一定的标准规范。1.1扫描技术这是最常用的,能够快速将大量印刷型文献进行数字化的技术体做法是采用光学扫描仪、数码相机等将

3、现有的纸介质文献经模数转换成位图。数字化文件通常以压缩形式存储,一般的数字化项目需要有多套存储方案,例如可以采用无损压缩算法的TIF格式保存一套方案,再加工一套采用有损压缩的,可供上网发布用的JPEG或GIF格式文件。1.2光学字符识别它是利用计算机软件把扫描的图像文献转换成字符文本的方法。它的工作原理是通过扫描仪等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储为计算机的文本文件。因此,OCR实际上是让计算机认字,实现文字自动输入。1.3视音频捕捉这是对多媒体信息

4、进行数字化的处理过程,其基本原理也是通过数字化采样而进行模数转换,设定一定的采样频率例如通过声卡、帧捕获器或影视影像数字卡可将模拟的音频录像材料转换成以数字方式存储的电子文档,采用标准压缩和标准格式存储其数字化资源。2信息加工技术文本、图像、音频、视频信息资源加工技术一般要用到自动标引技术、人工标引技术和元数据技术。2.1自动标引和人工标引技术主要涉及主题标引和分类标引。主题标引是以主题词表或标引规则作为依据,将信息资源中具有检索意义的特征转换成相应的主题词或采用自然语言的词语标识主题内容,并将其组织成表达信息资源内容特征标识系统

5、的过程。而分类标引是依据一定的分类体系,对信息记录的内容特征进行分析、判断,赋予分类标识的过程。人工标引是直接由标引人员对信息记录进行分类标引或主题标引,赋予特定检索标识的工作,但是由于标引人员水平的不同和信息资源所存在的语义上的歧义,造成同一篇文献不同人员的标引不一致。而自动标引技术则以主题词表和分类表为基础,为标引人员自动生成主题和分类,并且可以对人工标引进行校对。2.2元数据技术元数据是描述和限定其它数据的数据,它的应用领域非常广泛,在特色数据库建设的信息加工过程中,也要用到元数据技术。元数据在数据库中的功能是描述和定位信息

6、资源标准的元数据描述可以使分散的异构网用户分享和再利用不同类型的数据。3信息存储技术信息存储是对加工后的信息进行科学有序的存放、保管以便使用的过程。它包括两层含义:①将加工后的信息按照一定规则,记录在相应的信息载体上;②将这些信息载体,按照一定的特征和内容性质组成系统有序的、可供自己或他人检索的集合体。传统的信息存储技术有印刷存储、缩微存储、磁存储、半导体存储和光盘存储,在网络环境下,信息的存储已成为网络设计中的一个重要的环节。目前,数字化信息资源的存储技术主要有以下几种:3.1直接连接存储它的原理是存储器通过一个通用服务器连接在

7、网络上,存储器与服务器之间通过传统的I/O总线通信。客户机如需要访问存储器的数据,首先必须给文件服务器发送一个请求消息,文件服务器解析这个请求并给存储器发送访问消/匕、存储器访问数据并发送至文件服务器的内存,最终由服务器把数据传给客户机。3.2网络连接存储NAS是一种独立地直接存储的联网方案,它转变“以服务器为中心”的存储方案为“以数据为中心”的智能网络服务器方案。它是基于LAN的,按照TCP/IP协议进行通信,面向消息传递,以文件的I/O方式进行数据信息传输。3.3存储区域网络SAN是一种数据存储设备及服务器间通信的专用网络,能

8、够提供几乎无限的信息交换能力。存储区域网上的服务器可以通过SAN直接访问存储设备,而无需通过局域网。SAN是一种几乎拥有无限存储空间的分布式网络,非常适合作为特色库存储系统的核心。4信息检索技术信息检索是从按一定方式组织的信息存储中将满足用户需求的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。