欢迎来到天天文库
浏览记录
ID:9284802
大小:27.00 KB
页数:8页
时间:2018-04-26
《汉字编码标准中的类推简化》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、类推技术标准说一说汉字编码技术标准中的类推简化1.引言随着《通用规范汉字表》发布,一场宣传已经展开,随之也有一些争论出现。争论中一个重要问题,或焦点性问题:是应该实行有限制的类推,还是无限制的类推?这个问题不仅仅是语言文字学里的理论性争论,它密切关联着电脑的实际使用。实际上,此次的《字表》已经继续类推出一批电脑汉字编码中没有的汉字,即新造了一批电脑外字,160余个。这将带来一系列不良后果。由于汉字编码技术标准是新事物,其产生历史不过仅仅三十多年,又具有较强的技术性,领导机构管理者、广大公众对其了解较少。本文将对此做简要但也是较为完整的介绍。2.文字编码技术标
2、准的产生世界上最早的文字计算机编码技术标准是ISO646—1973(约40年前)。这是一个关于拉丁字母文字的国际编码标准。编码的字符包括拉丁字母、数码以及标点等其他符号,总计94个可见图形字符,及一些起控制作用符号共计128个,占用7位二进制位。此标准的前身是美国国内的编码技术标准,1960年代的版本中只有大写字母,没有小写字母;后来补充大写字母,又被称为ASCII字符集。这个ISO646或者说是ASCII字符集,成为世界信息技术界最重要的技术标准。它决定了拉丁字母文字信息的表达、存储、加工、以及传输,保障了一大批西方文字、科技语言、程序语言在全球范围的电子
3、化流通。这个信息化的、电子化的字符集,取代了历史久远,在工业时代、机械化时代成功广泛应用的,以纸质印刷形式为主的‘字母表’,成为文字规范的新形式、新手段。以此为基础的英文信息处理电脑化的成功,极大地刺激了、推动了世界各国文字处理技术的电脑化浪潮。1.中国汉字编码技术标准的初期,简化字无限制类推阶段中国的第一个汉字计算机编码技术国家标准是GB2312—1980(刚刚33年)。这是在国际性文字处理电脑化浪潮初起时期的一项开创性工作。主持者是一位比王选还年轻十来岁的青年技术工作者。该标准的语言文字学依据,自然靠向语文学家请教,遵循了当时语文界的主流认识。它不包含任
4、何一个繁体字。这个标准并不完美,甚至还有错字出现。但正是这个标准的适时推出,保障了中国汉字电脑化浪潮有了一个可用的基础,对汉字的电脑化迅猛但有序的发展作出了重大贡献,曾经被授予科技重奖。这个国家标准GB2312—1980,收字仅仅6763个,不包含任何繁体字。标准实施过程中,同时设计了五个称为‘辅助字符集’的编码标准,总计约四万余汉字,以实现对汉字文献的完整表达。其中,第二、第四辅助集,是经过无限制类推简化得到的,不包含任何繁体字。而第一、第三、第五辅助集,是与前者并立的繁体汉字系统集,其中不包含任何简化字。这种思路,自然来自当时语文界的主流认识。其政策依据
5、是《简化字总表》的说明(1964年5月)。在类推简化字表的说明中指出:“汉字总数很多,这个表不必尽列。”表中未列出的字,在实际使用中需要用到时,“凡用第二表的简化字或简化偏旁作为偏旁的,一般应该同样简化”。1.简、繁体两个并立的六个编码字符集为什么没有获得应用?上述六个编码字符集,除了基本集外的那五个,基本没有怎么投入应用,也少为人知。原因可能是:把汉字区分为并立的、或平行的两个独立系统的认识不符合实际,不符合潮流。人们发现:在中华古籍印刷中,并非需要一律地、完全地翻译成现代白话(一律用简化字);而用繁体字印刷时,那辅助集二、四根本没有用。实际上是白白地类推
6、简化出两个编码字符集。1980年代,汉字电脑化潮流迅猛、神奇、精彩。那些说‘汉字字量大、结构复杂的无法克服的缺点’的认识,已经大大地失去了市场。就连著名汉字改革家周有光先生,在他那‘简化十戒’中也说“简化常用字好;简化罕用字不好”,明确地不再支持无限制地类推简化。台湾的繁体字系统,及大陆的简化字系统,同样成功地、精彩地实现了电脑化。简繁体汉字电脑处理效率几乎完全没有什么差异。这使越来越多的人相信中华民族新的书同文终将到来。周有光先生欣然题词“书同文是21世纪必须实现的目标”。这就使得基本集、二辅助集、四辅助集联用的、彻底的、完整的简化字方案失去了群众基础和社
7、会基础。2.放弃无限制类推、具有简繁体共存优点的编码标准产生1980年代初期汉字电脑化浪潮,迅猛、神奇、精彩。这让国人重新燃起汉字复兴、民族新的书同文的梦想。1986年,中央高层决定把‘文字改革委员会’更名为‘语言文字工作委员会’,同时提出:“今后,对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对稳定,以利于社会应用”。这实际上给停止无限制类推提供了政策依据。由于文字处理技术产品的广大市场,特别是迅速发展的中国市场,吸引了西方信息产业巨头及国际标准化组织关注,而汉字问题是其中的一个重要关键。这给中国联合台、港、澳专家与日、韩专家合作研制简、繁体汉字
8、,中、日、韩汉字兼容的编码技术标准提供了机会。这种编
此文档下载收益归作者所有