欢迎来到天天文库
浏览记录
ID:22549499
大小:88.00 KB
页数:19页
时间:2018-10-30
《录入校对子系统》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、录入校对子系统1、现代校对技术概述现代校对技术采用三校一读对片制度。“三校”即三个校次,这是必须坚持的最低限度的校次。“一读”即终校改版后的通读检查。 现代的“三校一读”,校法和任务各不相同。一校、二校以对校为主,操作上采用点校、折校等方式,任务是消灭录排差错;三校以本校为主,任务是发现并质疑原稿错讹;一读是最后通读检查。磁盘书稿校对,由于原稿与校样合二为一,一校没有可资比照的原稿,则应采用本校法,通过是非判断发现录排差错和原稿错讹。一校改版后打出二校样,一校样就成为二校的比照物,所以二校时应先对红,然
2、后再进行二校。三校样打出后,校法同二校。如前所述,三个校次是最低限度的校次,特殊的书稿,特殊的情况,还须相应增加校次。对片是当代校对制度的创新,它是计算机排版制片新工艺的产物。计算机排版制片,有可能发生文字错乱丢失,因此制片完成后,必须将胶片一一与清样对照。对照的方法是:将胶片压在清样上面,通过移动胶片,使胶片上的字符图表与清样完全对合,如发现不能完全对合,则要采用对校法,将胶片与清样对校。在校对软件方面,除了OCR校对软件外,还有以下两种功能的商业化软件产品:(1).语文校对针对文章和数据中的中文说明
3、部分,利用文章校对软件的汉语语料库和汉语切分技术、汉语语法分析技术、汉语依存关系分析技术,精确校对中文文字、句法、标点、计量单位、异形词和重句等各类错误和不规范。此步属校是非,校对员根据校对结果比对校样与原稿的异同,在判定是非的基础上进行修改。(2).双文对校不同的录入人员同时录入一份文件,或者,一份采用OCR录入,另一份采用人工录入,两者在同一处出现同样的错误的几率几乎为零,利用双文对校软件对比这两个文件,就能迅速地发现录入稿和原稿中存在的各种错误。采用双文对校的方式,成本要低于人工折校的校对费用,而
4、准确率又远远高于人工折校,是替代传统的人工折校的理想工具。年鉴、档案、技术报告三校稿有没有改错的地方,二校的修改意见都改了没有?单靠人工校对难免会有遗漏和失误,用双文对校软件比对二校稿和三校稿,所有不同之处尽显眼前,轻松完成核红工作,确保出版物的准确无误。通过智能比对原文件和修改后的文件的异同,能够准确地显示和统计编辑人员的修改工作。所有不同之处都会准确地标记出来。智能定位对比功能确保比对结果的完美性。提供添加、删除和修改等标记手段,可以突出显示各种标记。2、现代录入技术概述对于有纸数据,采用扫描录入方
5、式形成电子影像,然后,将文字数据用OCR系统软件识别后存档,将图形数据用矢量化软件矢量化后存档,目前,这种录入方式的录入速度是手工录入速度的5倍左右,如果采用先进的软件系统,录入质量不低于人工录入质量。在现代数据中,很多数据是自动采集的,有些作者直接用电脑创作,这些数据不需要录入,但仍然需要校对。现代录入技术的发展和数据库技术对校对技术提出了新的要求,首先,用于出版业的传统校对技术的一些环节是有纸的,而基于扫描的录入技术已经得到了影像化的原稿,对数据库工作而言,后续的校对工作最终成果都是无纸化的,纸张校
6、对只是作为一种辅助形式,纸张输出不是最终目的。只要电子数据规范准确,可以采用任何形式输出,不仅仅用于打印出版。其次,简单实用的对片操作显然可以用于校对的每一个环节,而不只是最后一个环节。这是现有软件开发技术可以实现的。3、数据质量要求基础水文数据是水文数据中种类最多、质量最高、数据量最大、且代代相传的数据,是对地球水圈的最真实最完整记载,地球水圈也是子子孙孙们的生存环境,基础水文数据是他们改造地球水圈的重要依据,所以基础水文数据质量高低关乎千秋万代。必须采用较高的数据质量标准,电算整编数据、分析图和计算
7、参数按差错率小于1/20000控制,其他数据按出版业标准的1/10000误码率控制。数据质量高低主要取决于入库之前的数据处理水平和手段,数据处理手段必须建立在数据处理业务的模式化规范化基础之上,由于录入校对要求的文化素质不高,必须有固定且简洁的工艺要求,才能保证做到人人做得好做的快。所以必须建立科学合理的录入校对工序。要满足控制误码率的要求,必须靠工序和质量体系,并不是把数据输入到电脑就万事大吉了。4、数据校对工序在信息转移过程中,有可能因转移造成信息损失和变化的,如抄写、纸介质手工录入,都必须校异同,
8、不会造成信息损失和变化的,如复印、计算机复制,网络传输等,不必校异同。前者是有损转移,后者是无损转移。在信息转移过程中,信息表示形式也有可能发生变化,有些信息转移是同形式转移,如纸上文字打字进电脑,结果还是文字,有些信息转移则是异形的,如纸上图形,采样后以数字形式输入电脑。有些信息转移自始至终都是无损的,好像没有原稿一样,又好像都是原稿,如信息采集系统和遥测系统采集传输的数据,没有纸质原稿,我们把数据按有纸质原稿和无纸质原稿分为有纸数据和无
此文档下载收益归作者所有