欢迎来到天天文库
浏览记录
ID:40674397
大小:34.50 KB
页数:4页
时间:2019-08-06
《2001论汉字数量的统计原则》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、论汉字数量的统计原则李运富(原载《辞书研究》2001年第1期)【提要】汉字数量的统计应该有科学的原则。以前对汉字数量的统计大都从书写角度出发,以笔画形体为据,或者从字用角度出发,以记词功能为据,这是值得商榷的。本文认为统计汉字应该从构形系统出发,坚持字形单位原则和构造功能原则,即根据字形的构造功能归纳成不同的字形单位,然后对单位的正体作出统计。这样,相对于仅据笔画形体的统计,应该把同功能异写字(含错讹字)的字数扣除,并加上同形异构字的字数;相对于仅据记词功能的统计,应该加上同符异构字,并将同音借用字的数量减去。【关键词】汉字数量,
2、统计原则,字形单位,构造功能用来记录汉语的汉字究竟有多少,恐怕至今没有人能说得清楚。这不是因为无人统计,而是因为统计没有原则,或者虽有原则而这原则并不科学,所以统计出来的结果经不起推敲。目前所见有这样两种类型的字数统计:一,累积型通用字典的字数统计。东汉许慎《说文解字》收正篆9353个,重文1163个;南朝梁顾野王《玉篇》收楷书约22000个;宋代司马光《类篇》收字31319个;宋丁度等《集韵》共收53525字;清张玉书等《康熙字典》共收47035字;近代陆费逵等《中华大字典》共收48000多字。又现代编纂的《汉语大字典》“是汉字
3、楷书单字的汇编,共计收列单字56000左右”(前言),而最近出版的《中华字海》又将所收楷书字数上升到“85000余个”(前言)。二,服务于特定语料的字表或字编中的字数统计。朱芳圃编《甲骨学文字编》收单字845个,重文3469个;中国科学院考古研究所编《甲骨文编》合正编、附录共计4672字;容庚编《金文编》正编收录金文字头2402个,重文19357个,附录收字1352个,重文1132个;容庚《金文续编》正编收字951个,重文6084个,附录收字34个,重文14个;张守中编《中山王厝器文字编》收单字505个,合文13个,存疑字19个,
4、形体共2458个;秦公辑《碑别字新编》收字头2528个,别字12844个;罗福颐编《汉印文字征》正编收2646字,重文7432字,附录收字143个,重文18个;滕壬生《楚系简帛文字编》共计摹写收录文字形体19250个,分为单字、合文、重文、存疑字四部分。4我们先不必拘泥于各家的具体字数,而应该考察一下这些数字是怎样得出来的。大致说来,上述数据的统计有两个原则,一是笔画形体原则,二是记词功能原则。所谓笔画形体原则,是从书写着眼的,只要笔画形体相同,即使代表不同的词也只算一个字;而凡是笔画上有差异的形体(包括错讹的形体),不管它是不是
5、同一个字的不同写法,都算作不同的字。例如《汉语大字典》的所谓56000左右字和《中华字海》的85000余字就都是按这个原则统计出来的,因而象“世、丗、丗、卋、卋”被统计成了五个字,“户、戶、戸”也被统计为三个字。但按照这样的原则统计汉字理论上是不科学的,实际上也是难以办到的。因为汉字的书写变体千差万别,收不胜收,是根本无法作出精确统计的。《中华字海》号称“当今世界收汉字最多的字典”,而事实上远非汉字形体的全部,单就传世文献的印刷字体而言,我们已看到多篇“补遗”性质的文章,拾掇了许多漏收的形体,而我们翻阅魏晋以后的诗文杂录等口语色彩
6、较浓的著作,还会时时遇见在《中华字海》中查不到的奇怪形体。要是加上手写本,例如吐鲁藩、敦煌等地文书中的俗字异体,那就更不得了。而且,《中华字海》虽是只统计楷书,但其中的许多形体实际上是历代从篆隶金石文字转写而来的,现在地下古文字层出不穷,如果按照同一原则,将所有古文字的各种形体转写成楷书而收入字典并加统计,例如上举各种字表字编中的形体(包括重文),那汉字的数量就会急剧膀胀,决不止几万,而是几十万、几百万,甚至上千万!何况随着汉字的继续沿用,个人手写体的千变万化,汉字形体的差异是无穷尽的,因而汉字的数量在这一原则指导下也将是永远无法
7、精确统计的。所谓记词功能原则,是从用字的角度出发,按照文献中是否记录同一个词来归纳和统计汉字,要是记录同一个词,即使写法和结构都不同,也仍然算作一个字,如果记词功能不同,同样的形体也被算作不同的字。上举服务于特定语料的字表字编中的字头大都是按这一原则设立和统计的,其所谓重文实际上是与字头算作一个字的。例如《楚系简帛文字编》一方面将有衣的“裘”和无衣的“求”列于同一“裘”字头下算作一个字,另一方面“凡一字而数用者分别重出”,即同一形体有时算作不同的几个字,包括同音借用现象。这样的处理原则混淆了字与词的界线,模糊了构形与字用的差异,虽
8、有便于阅读之功(因为字头与词的用法对应),却完全不顾字的形体,实际上已超越汉字本体,当然更无法反映汉字数量的真实。那么,究竟应该怎样来把握汉字的数量呢?我们认为首先应该确定究竟怎样才算一个“字”,字的单位不明确,要进行统计就无法操作。我们说记录汉语
此文档下载收益归作者所有