欢迎来到天天文库
浏览记录
ID:33336194
大小:164.52 KB
页数:3页
时间:2019-02-24
《基于msoffice的古文字工具书自动编纂技术简论》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于MSOFFICE的古文字工具书自动编纂技术简论张再兴华东师范大学中国文字研究与应用中心上海200062计算机使古文字工具书的编纂出版走出了手抄本的时代。但是出版社专用排版系统与MSword等个人文字处理系统之间的对接困难,又常常使得古文字工具书的出版显得费时费力。实际上,MSword作为Office套件,在VBA的支持下,具有十分强大的自动化能力。结合套件中的Access数据库,充分挖掘word的各项功能,利用VBA代码,实现古文字工具书编纂的自动化,既能极大地提高工作效率,也能弥补word自身在排版上的不足,排出比较完美的版式。我们利用这
2、一技术,编纂了《金文引得》(殷商西周卷、春秋战国卷)、《中国异体字大系》(篆书编、楷书编、隶书编)、《古文字考释提要总览》等多种大型古文字工具书。《中国异体字大系·篆书卷》书影《古文字考释提要总览》书影一、古文字工具书的技术特征工具书的格式化是其可以进行自动编纂的可行性前提。而古文字工具书本身的一些技术特点又为它的自动编纂提供了充分的必要性。1,工具书格式多样、版式复杂。如引得类工具书是一种全文本的格式。而文字编类工具书则通常使用表格。表格的样式则更加复杂多变。版式上,或采用文字横排,或采用竖排,甚至同一书中的不同内容交替使用不同的方式。2,数
3、据量大。一般古文字工具书的数据量都很大。如《中国异体字字大系·篆书编》收各类古文字字形25000个。3,数据类型复杂。除了普通文本外,古文字字形拓片一般采用图片形式,因此,古文字工具书经常采用大量的图文混排。此外,在现有的计算机系统编码条件下,多种古文字字1库只能通过字体方式实现。因此,众多的字体文件使得工具书的字体格式十分复杂。如我们编纂的《古文字考释提要总览》,所用古文字字体有十余种。4,数据对应关系复杂。数据之间的对应关系涉及到不同种类与不同层次,如古文字原始文献语篇与字词的对应、原始文献与各种著录的对应、文献字词与各家考释意见的对应等。
4、5,索引要求高。古文字工具书需要提供尽量多的检索途径,以方便使用。在手工条件下要编纂符合上述特点的古文字工具书,其高难度和巨大的工作量是显而易见的。而采用计算机软件进行自动编纂,则能够比较便捷地解决问题。二、自动编纂的技术实现基于MSOffice的古文字工具书自动编纂的实现需要以下几个步骤:一、建立基础数据库要使古文字工具书的编纂做到自动化,首先必须建设相应的古文字数据库,以存储工具书的相关内容。MSoffice套件中Access简便易用,与文字处理软件MSword的互动便捷,是我们建设数据库的理想工具。为了适应工具书编纂的自动化、精细化、格式
5、化要求,数据库中的数据处理必须遵循一些规范。1,录入的数据只包含原始数据。能通过自动分析获得的数据尽量通过计算获得。2,数据内容加工细致。尽量采用最深层次切分的底层数据。3,数据对应关系明确。4,数据层次结构清晰。二、导出数据完成数据库的建设之后,即可根据预先设定的版式、格式等要求,利用计算机程序自动将数据导入到word文档中。具体可以分为数据导出、数据转换、版式控制三个步骤。1,数据导出是将数据从数据库中一个或多个表中的数据根据格式需要导出到word文档中。2,数据转换包括以下内容:(1)图形转换。古文字字形、拓片等图片文件一般不直接存储在数
6、据库中。到了word文档中需要用地址解释模块将文件名、编号等转换为图片。(2)特殊字体转换。现有的古文字字形需要通过字体形式实现。因此在数据库中用字体符号标记,在word文档中则通过字体解释模块转换成相应的字体。(3)编号格式转换。数据库中排序、对应所需的编号格式与word文档中中文版式的编号格式时常不一致,需要通过编号转换模块转换。3,版式控制是排版过程中对工具书的各种版式要求。以上数据导出过程中的各个步骤有时可以同步实现,有时也需要分步骤实施。可以同步实现的如版心大小等基本版式,以及系统字体、字号、字距、行距、索引项标记等基本字体格式。需要
7、采用分步实施机制的如图文混排时的图片转换,竖排等特殊中文版式中页码等特殊标记。与纯文本文件的线性排列形式不同,表格式工具书是一种以单元格为单位的平面排列形式。在数据导出的过程中,处理步骤相对更加复杂。三、编制索引索引是工具书必不可少的重要组成部分。传统形式索引的自动编制也需要通过几个步骤实现。首先,自动标记索引项。索引项可在数据导出过程中用书签、样式等功能直接标记。其次,需要自动读取word文档中的索引项及所在页码。再次,标记索引项的排序原则,如拼音顺序、笔画顺序等。最后,进行索引项的排序即打印输出。索引项的种类可以不只一种,2排序方式也可以多
8、样。结合电子文本,则可以给工具书的索引带来革命性的突破,使工具书的检索使用更加便捷。如,利用pdf、doc等格式文档的超链接功能,可以在索引项及索引内
此文档下载收益归作者所有