古籍数字化研究的回顾与思考

古籍数字化研究的回顾与思考

ID:46397468

大小:79.50 KB

页数:7页

时间:2019-11-23

古籍数字化研究的回顾与思考_第1页
古籍数字化研究的回顾与思考_第2页
古籍数字化研究的回顾与思考_第3页
古籍数字化研究的回顾与思考_第4页
古籍数字化研究的回顾与思考_第5页
资源描述:

《古籍数字化研究的回顾与思考》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、古籍数字化研究的回顾与思考毛建军(南京大学屮文系江苏南京210093)文摘文章认为,古籍数字化的研究首先从技术上获得突破,理论研究则相对滞后。古籍数字化研究的回顾有利于古籍数字化工作的进一步开展,也有利于古籍数字化理论研究的深入。关键词古籍数字化古籍整理回顾思考ReviewandPondersontheAncientBookDigitizationResearchMaoJian-jun(ChineseDept.NanjingUniversity,JiangsuNanjing,210093,China)[Abstract]Alongwi

2、thdevelopmentofthemassiveancientbooksdigitizationresources,theancientbookdigitizationresearchfirstobtainsthebreakthroughfromthetechnology,butthefundamentalresearchrelativelylags.Thereviewancientbookdigitizationresearchisadvantageoustothefurtherdevelopmentofancientbookdi

3、gitizationworkandmorethoroughfundamentalresearch.[Keywords]Theancientbookdigitization;heancientbooktrims;reviewandponders古籍数字化属于古籍整理的范畴,代表着古籍整理的耒来方向。数字资源具有占据空间小、存贮量大、检索方便、传输迅速、易于复制,可以长期保存等诸多优势。因此,古籍数字化从其产生就受到有关部门和部分学者的关注。1988年曹书杰在《古籍整理硏究学刊》第1期发表了《古籍整理与电子计算机应用研究的思考》,第一次以

4、论文的形式探讨了计算机运用到古籍整理的可能性和有效性。在台湾,计算机运用于古籍整理也开始了真正的实践应用,学术界也首次提出了古籍电脑化这一概念。山20卅:纪90年代以來,随着大量古籍数字化资源的开发,丰富的实践上带动了人们対古籍数字化研究和思考。1汉字字符集研究汉字输入是古籍数字化首先要面临的问题。由于古籍中包含冇大虽生僻字、异体字、通假字以及手写字和避讳字,而已公布的汉字通用字符集如GB2313字符集(7478个字符)、BIG-5字符集(13868个字符)、GBK字符集(21885个字符)、ISO/IEC10646/Unicode字

5、符集(70195个字符)均不能完全处理古籍中汉字的复杂性,因此,解决汉字字符缺失问题就成为古籍数字化的首要任务。囚早期古籍数字化汉字输入主要集中在新旧字形和异体字问题。这方面广西大学林仲湘等在开发《占今图书集成》时取得了一定经验,同时在《广西大学学报》(哲社版)1996年第2期发表了《论古籍整理用计算机字库中的字形处理》、《如何解决古籍整理用计算机字库中的界体字问题》等一批论文。rfl于GBK的编码体系不能通川于国际标准,如果采川它作为古籍数字化的字符集,会导致由于字符集的壁垒而使数字化古籍产品无法走向世界。因此经过探索和实践,日前国

6、内学术界在字符集的采用上己有主流看法:坚定不移地采用国际标准ISO/IEC10646o121《四库全书》电子版工程的开发结合了GBK的编码体系与ISO/IEC10646/Unicode各自的优势,解决了大型古籍数字化汉字字符集的难题。⑶另外,一些致力于古籍数字化汉字处理的数字化企业也积极参与到汉字输入的研发当中,开发出了许多冇效解决汉字输入的软件。北京中易郑码新技术有限公司的《中易汉神e—超大型中文网络国际应用平台》被列为“国家973信息技术与高性能软件规划项目”,支持TSO/IEC10646:2003(同Uncode4.0)国际标准

7、编码的7万个汉字的输入、编辑排版和打印输出。⑷北京龙戴特信息技术有限公司开发的四字节汉字处理系统——龙语瀚堂典籍数据即系统彻底突破了古籍整理和研究中生僻汉字数字化的瓶颈,开创性地实现了对所冇汉字通川的典籍文献数字化,这标志着汉学研究进入四字节典籍研究的数字时代2系统功能研究支持系统主要运用于书目数据库和具有智能分析和检索功能的数字化古籍中,主要有古籍机读冃录的链接技术、全文数据库技术、全文检索以及超文本标注等智能化支持系统。传统的古籍冃录检索是通过分类卡片和书冃检索手工方式进行的。随着计算机数据库技术的发展,古籍机读bl录格式逐步应用

8、于古籍文献检索服务当屮。古籍书目数据库的建设也成为古籍数字化建设的一个重要内容。1999年林兴国、杨怡《古籍机读目录格式设计》(《四川图书馆学报》1999年第2期)一文开始就机读目录的优点以及古籍机读目录格式的设计原则、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。