欢迎来到天天文库
浏览记录
ID:50375089
大小:33.02 KB
页数:2页
时间:2020-03-08
《五笔汉字拆分的原则.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、五笔汉字拆分的原则.五笔字型的拆分原则是“书写顺序,取大优先,兼顾直观,能连不交,能散不连”。一:取大优先:尽可能取文字中最大的字根。例1:世:第一种拆法:一、凵、乙(误)第二种拆法:廿、乙(正)显然,前者是错误的,因为其第二个码元“凵”,完全可以向前“凑”到“一”上,形成一个“更大”的已知码元“廿”。例2:制:第一种拆法:、一、冂、丨、刂(误)第二种拆法:、冂、丨、刂(正)同样,第一种拆法是错误的。因为第二码的“一”,作为“”后一个笔画,全可以向前“凑”,与第一个码元“”凑成“更大”一点的码元“”。总之,“取大优先”,俗称“尽量往前凑”,是一个在汉字拆分中最常用到的基本原则。至于
2、什么才算“大”,“大”到什么程度才到“边”,这要等熟悉了码元总表,便不会出错误了。二:兼顾直观:牺牲正常的书写顺序,特例拆根。例如“国”字,按书写顺序,应取“冂、王、丶、一”,但这样编码,不但有悖于该字的字源,也不如使码元“囗”直观易辩。我们只好违背书写顺序,按“囗王丶”的顺序编码。再如“戋”字,按取大优先,应取“二、匕、丶”,但没有取“一、戈”直观,所以用后者。三:能散不连:能散开的字根就不要连到一起拆。“主”字按取大优先,应取“亠、土”,但根据此规则,只能取“丶、王”。能连不交:能连到一起的字根,就不要拆交叉的字根。当一个字既可以视作“相连”的几个码元,也可视作“相交”的几个码
3、元时,应取“相连”的。因为一般来说,“连”比“交”更为“直观”,更能显现码元的笔画结构特征。例如“天”字,取“一、大”而不取“二、人”。五笔字型的拆分原则是“书写顺序,取大优先,兼顾直观,能连不交,能散不连”。①书写顺序:在合体字编码时,一般要求按照正确的书写顺序进行。例如:新:立木斤(正确,符合规范书写顺序)立斤木(错误,未按书写顺序编写)夷一弓人(正确,符合规范书写顺序)大弓(错误,未按书写顺序编写)②取大优先:按照书写顺序为汉字编码时,拆出来的字根要尽可能大,即“再添一个笔画,便不能构成笔画更多的字根”为限度。例如:世:廿乙(正确)一凵乙(错误)亲:立木(正确)立一小(错误)
4、③兼顾直观:在确认字根时,为了使字根的特征明显易辩,有时就要牺牲书写顺序和取大优先的原则。例如:国:如按书写顺序,其字根应是“冂、王、丶、一”,但这样编码不断有违该字的字源,也不能使字根“囗”直观易辩。为了直观,应从外到内取字根“囗、王、丶”。④能连不交:当一个字可以视作相连的几个字根,也可视作相交的几个字根时,我们认为,相连的情况是可取的。天:一大(二者是相连的)(正确)二人(二者是相交的)(错误)⑤能散不连:如果一个结构可以视为几个基本字根的散的关系,就不要认为是连的关系。例如:占:卜口(都不是单笔画,应视作上下关系)非:三刂三(都不是单笔画,应视作左右关系)总之,拆分应兼顾几
5、个方面的要求。一般说来,应当保证每次拆出最大的基本字根,在拆出字根的数目相同时,“散”比“连”优先,“连”比“交”优先末笔字型交叉识别码对于不足四码的汉字,例如:“汉”字拆分成“氵、又”只有IC两个码,因此要增加一个所谓末笔字型交叉识别码Y。我们举个例子来说明它的必需性。例如:“汀”字拆分成“氵、丁”,编码也为IS,“沐”字拆分成“氵、木”,编码也为IS;“洒”字拆分成“氵、西”编码也为IS。这是因为“木、丁、西”三个字根都是在S键上。就这样输入,计算机无法区分它们。为了进一步区分这些字,五笔字型编码输入法中引入一个末笔字型交叉识别码,它是由字的末笔笔划和字型信息共同构成的。末笔笔
6、划只有五种,字型信息只有三类,因此末笔字型交叉识别码只有15种如上表所示。图1从表中可见,“汉”字的交叉识别码为Y,“字”字的交叉识虽码为F,“沐、汀、洒”的交叉识虽码分别为Y、H、G。如果字根编码和末笔交叉识别码都一样,这些汉字称重码字。对重码字只有进行选择操作,才能获得需要的汉字。
此文档下载收益归作者所有