古籍资源数字化过程中的问题

古籍资源数字化过程中的问题

ID:24833605

大小:51.50 KB

页数:5页

时间:2018-11-16

古籍资源数字化过程中的问题_第1页
古籍资源数字化过程中的问题_第2页
古籍资源数字化过程中的问题_第3页
古籍资源数字化过程中的问题_第4页
古籍资源数字化过程中的问题_第5页
资源描述:

《古籍资源数字化过程中的问题》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、古籍资源数字化过程中的问题刘金荣(吉林师范大学博迭学院,吉林四平136000)摘要:本文结合古籍资源数字化的发展过程和出现的问题,提出了优化古籍资源数字化的几点建议:1.提高人员素质和加大经费投入;2.建立统一的文本格式,实行统一的著录规则;3解决文字转换的问题;4实现资源共享,统一开发利用;5.建立功能完善的古籍全文检索系统。.jyqkL(超文本)、XML(可扩展标记语言)、PD(便携式文档)等众多格式,由于阅读器不同,难以相互兼容,不光给读者带来了很多麻烦,也影响了各个单位之间对已经数字化的古籍资源进行共享。(四)文字转换的难题根据目前的研究成果,古籍资源

2、数字化的录入方式分为全文版和图像版。全文版是将古籍中的文字转录到计算机中,并在已建立的检索系统中检索..关键词。然而,这种数字化方式会产生很多有误的地方。汉字中有很多同音字、繁体字、通假字、简化字、异体字等,如“昂首观之,项为之强”(《童趣》)中,“强”是通假字,而其本字是“僵”;如“不亦说乎”中,“说”是古字,“悦”是今字,在一个数据库中很难进行统一的处理。(五)软件功能和精确检索难以统一软件功能是否健全对古籍资源数字化的进程和质量起着至关重要的作用,选择适当的软件可以加速古籍资源数字化的进程。现在大多数单位选择的OCR软件,对部分繁体字和不规则用字的识别能

3、力很差,需要大量人力时间校对。进行全文本数字化的古籍可以实现任意字符的检索,但是,检索到的内容精准度不高。图像版本可以提供精准的信息,但往往却不能在全文检索中体现出来,通过标引有效的检索点可以在一定程度上解决这个问题,但还是会漏检到某些重要的信息。由于古籍中的古汉字有很多同词不同意,同意不同词,使数字化的古籍在检索系统中很难制定一个标志词,将全部的有效词汇进行标引。如何建立关联检索和前控后控词表也很难统一。四、优化古籍资源数字化的建议(一)提高人员素质,加大经费投入古籍资源数字化工作不仅繁杂,还需要系统认真地对待,因此,古籍资源数字化这项工作对人员的素质与工作

4、能力的要求都要比一般的图书馆员高出许多。从事古籍资源数字化工作的人员不仅要掌握整理校对古籍的专业知识,还要精通新型的互联网及各种科技技术,同时还要内外兼修,崇尚文化,能够坐住冷板凳,能够创新。因此,必须培养一些优秀的具备整理古籍并精通现代网络信息技术的人才。有了资金的保证,古籍资源数字化才能从过去的混沌工作中扭转过来,在不断吸纳优秀人才的同时给予丰厚的待遇,鼓励研究人员坚守自己的工作岗位,为古籍资源数字化做出贡献。(二)建立统一的文本格式,实行统一的著录规则建立方便检索的统一机读目录格式是古籍资源数字化过程中必须遵循的著录标准,只有在一个标准下制作的古籍目录才

5、能有效地实现古籍数据库的资源共享。在制作条目时执行统一分类方法和著录标准,这样才有利于读者利用,实现跨数据库的检索,便于读者学习和研究。除此之外,古籍资源数字化工作更应该注重古籍数据库的自动化、智能化的研究,开发古籍数目的元数据,自动翻译,自动校勘,自动编纂,开展古籍文献计量学的研究以及异体字的显示,字典词典、历史年代对照表、人名大辞典、地名大辞典、官名辞典等各种知识库和辅助工具库的配备等。有了以上研究的支持,可以极大地改善古籍检索和利用的质量。(三)解决文字转换的问题在古籍资源数据库中,如何解决古今汉字的转换问题,也是亟待解决的首要难题。Word虽然有简体字

6、转换的功能,但是还不够强大,虽然有些研究人员提倡使用《简繁字对应表》,但是人们在使用过程中还要翻阅对照表,因此有人提议建设相关数据库,即使现在一些研究古籍资源数字化的人想到了一些可执行的方法,如Unicode字符集虽然可以解决字库问题,但是很多软件不支持,常用的输入法和搜索引擎不支持大字符集,很多生僻字仍不能正确显示和检索。用造字的方法费时费力,而且很难共享和检索,生僻汉字的处理仍是古籍资源数字化过程中的一大障碍。因此,还是应该建立一个标准可执行的文字数据库。(四)实现资源共享,统一开发利用古籍文献不仅种类繁多、数量庞大,并且分布不均匀,在古籍数字化过程中必须

7、共同遵守一个可操作的标准,单靠个人力量或者是单个组织很难实现数量庞大的古籍数字化。因此需要有一个权威组织或带头人进行资源等各方面的协调,个人或组织之间要密切配合,相互帮助,对已经数字化的古籍资源实现资源共享,避免人力、物力的大量损耗,健全各个学科的古籍数据库,把数字化技术和资源充分地调配起来,最大限度地发挥资源优势。(五)建立功能完善的古籍全文检索系统古籍资源数字化最大的优势在于能够进行检索,所以有一个功能完善的检索程序是古籍数字化建设的重要标准。首先,检索速度要快,在几秒钟之内,应列出..关键词所在页面的所有条目,并按一定顺序排列;其次,检索系统要符合学科特

8、点;再次,满足多条件检索;最后,检索结

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。