欢迎来到天天文库
浏览记录
ID:46751557
大小:69.00 KB
页数:7页
时间:2019-11-27
《浅谈科研机构对文献资源的数字化管理》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、浅谈科研机构对文献资源的数字化管理【摘要】对于科研机构而言,能够将其存储和积累的文献信息资源进行数字化组织管理;因此木文简耍概述资源在数字化的组织管理中的五个方面,资源的采集、资源的数宁化加丁、资源的管理、资源发布检索、资源组织管理的质量控制;【关键词】资源釆集资源加工数字信息资源数字资源组织数字资源管理随着数字技术的飞速发展,越来越多的信息资源成为网络上可以被访问的资源,从简单的文本到声音、图片、视频等都加入这一行业。环境的变化带动了机构对自身资源的数字化组织管理,尤其是对科研学术机构而言,能够将其存储和积累的文献信息资源进行数字化的组织管理更是具冇十分重要的战
2、略意义。在组织管理中深入开发和广泛利用信息资源,包括资源的采集,存储,处理等,包括采纳先进的技术和思路,达到资源的数字化建设管理能为机构的科研创新提供有力保障。1资源采集本处所说资源主要是文字、图片、音频、视频等,因此资源采集整理中,首先对资源进行大的分类,如:图书、期刊、会议资料、报刊、视频、音频、古籍等;对于古籍的采集要考虑其加工和保存的独特性。在进行大的分类后,对资源可按学科领域进行小的分类,当然也可以结合自身资源的特征进行新的分类定义,总之要求资料按要求进行分类、组卷、排列、修补、编写案卷号等。在采集当中,有些是机构自身现有的资源,而机构自身资源无法满足需
3、求时需要借用各种渠道获取资源,如网络下载,购买其他商家资源作为自身资源的互补,如买适合木机构的某一研究领域的数字资源。当前在资源釆集中,一般从事科研学术的机构对资源需求量大。在资源的采集过程中,我们还应当认识到,机构的信息资源建设依赖于机构的宏观信息环境,如文献信息部门、新闻媒体、信息网络等社会组织或媒体,它们是组织获取信息的主要來源,因此这些资源对机构的信息资源组织建设也有人的影响。2资源数字化加工零散的资料,如,杂志,图书,古籍等,在数字化的加工环节,首先要结合各类资源进行纸质文档数字化,如借用扫描仪、数码相机等设备对纸质档案进行数字化。在数字化过程屮,并非简
4、单的扫描或照相,而是冇一个尽量详细的过程。2.1数字化加工过程(1)扫描:通过扫描仪和专用扫描软件,转换为电子的图像文件格式。对扫描后的文件要求使用软件进行校正、去噪、版心校正、剪裁、反转、灰度图像页亮度及对比度的调整、整书去除装订孔、整书裁边、增加图章、内容居中等功能。扫描过程严格耍求页号顺序,必须保证图像质量与原件一样清晰。(1)文字识别:本文以OCR为例,OCR软件将扫描生成的图像文件自动辨识成文木字符。OCR的识别率不可能达到100%,因此经OCR处理之后,需要编辑进行校对或补充。尤其是档案类的,要求编辑校勘后达到与原始信息100%的一致。对于冃录页,可通
5、过工具增加目录项的连接,通过对目录项建立其对应的物理页码,建立目录导航浏览。(3)规范记录:即编辑加工过程,编辑加工过程可参考《CALTS联合目录规范控制过程详细说明》,规范记录是山编目规则规定的检索点形式及其相关信息的记录,以保证:1)在书目文档增加新记录时,该记录中某一实体的规范标冃和数据库中相同实体的标冃形式保持一致,达到标目的一致性和唯一性;2)使书目数据库中具有相同形式的标目集中排序,实现书目的查全功能;3)将已经确定的标目形式及其决策信息记录在案,供维护记录时参考;4)通过参照方式把标目的变异形式、不同系统、不同文种所使用的标目形式记录在案,供连接相关
6、书目记录和建立检索参照体系参考。例如,依照原文对书名、作者、机构、摘要、关键字、图片信息等进行分别标引;如果是文献,尽量按学科分类;著录的原数据耍求应注意表明来源,在标引的时候要尽量详细,如期刊著录相关元数据如表1。(4)质检审核:增加该环节是因为规范记录过程中编辑参与,为保证质量対扫描的图像,编辑的规范记录等进行质检市核。W核后的数据方可流入下一环节。(5)重新装订:在扫描环节,大量文献时,需耍拆开扫描,被拆开的文献资料原件上的页号排列顺序,并且根据装订要求重新装订。装订完的档案经过质检员检查后才可以归还档案库房。(6)备份:数字化加工完成后必须进行的安全管理的
7、一环。系统维护人员依据上述加工环节对各类数据进行备份,有专门的服务器或存储设备以作长期备份。2.2数字化加工过程用到的关键技术(1)电子书:浏览、标引、OCR文本识别、OCR图像识别。(2)文本挖掘系统:智能过滤、自动分类、自动聚类、自动文摘、内容相似性分析等。(3)流水线业务管理:分配任务、标引、分类、检查、发布。3资源管理资源的管理主耍涉及对数字资源如何有效管理利用及长期保存;在数字资源种类丰富,资源较多时,首先选择支持全文检索的数据库管理;因为可能涉及外來资源或语种区别的资源,所以可能存在编码不统一,如Unicode、GB18030.GB2312、GBK、B
8、ig5等多
此文档下载收益归作者所有