汉字字形形式化描述方法及应用研究

汉字字形形式化描述方法及应用研究

ID:37393701

大小:7.44 MB

页数:124页

时间:2019-05-23

汉字字形形式化描述方法及应用研究_第1页
汉字字形形式化描述方法及应用研究_第2页
汉字字形形式化描述方法及应用研究_第3页
汉字字形形式化描述方法及应用研究_第4页
汉字字形形式化描述方法及应用研究_第5页
资源描述:

《汉字字形形式化描述方法及应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、北京工业大学博士学位论文汉字字形形式化描述方法及应用研究姓名:林民申请学位级别:博士专业:计算机应用技术指导教师:宋柔20090301北京工业大掌工学博士学位论文字形比对,也适用局部字形比对,对结构比例失调较大的不规范字形能发现与结构规范字形的差异性,适合面向字形分析的应用需要。此外,建立了基于笔画关系矩阵的汉字结构关系描述和计算方法,可用于支持汉字结构类型的自动判别。3)由于汉字部件在汉字形体结构研究中的重要性,本文提出了在笔段网格描述的简单笔画上,附加组合关系标注的部件描述方法及部件自动发现算法,实验表明,该算法能很准确发现包含特定部件的汉字,而不受部件在字形中位置和大

2、小的影响。4)本文还改进了《汉字信息字典》的汉字结构描述体系,提出了基于结构描述的字形相似度比对算法,实验表明,该法找到的相似字结构类型一致性好,与人认知的相似字吻合度较高(96%以上),适合结构类型划分无歧义汉字的相似性计算。5)本文最后设计实现了一个实用软件系统——汉字字形描述和自动比对分析工具,采用大众化手写描画方法来建立笔段网格字形描述,可以输入各种可以想见的汉字,包括错字、异体字和拼合字及其它相关信息,能自动将笔段网格字形转换成对应TrueType字模,与标准字符集内汉字一样被处理。对笔段刚格字形可以自动进行整字、局部的字形比对,找出按相似度大小排序的相似字。采用

3、这一工具完成了GBK字符集20902个汉字及北京语言大学留学生错字的描述,字形库应用于汉字教学错字偏误分析。这些工作有益于汉字字形描述的标准化,在基于汉字字形计算的各种应用领域:如标准字符集外汉字的输入、我国数字图书馆建设、汉语教学研究和国际推广、汉字文化历史研究、社会管理信息化等具有应用前景。关键词汉字字形;形式化描述;笔段网格;比对计算:部件ⅡAbstraetAbstractInthefieldofChinesecharactersinformationprocessing,thepresentapproachestotheformaldescriptionofChin

4、esecharacterglypharemostlybaseonstructureanalysismethodusedfordescribingthetopographyofChinesecharactersintheresearchonC:hinesecharactersandteachingofChinese,wherestrategicdescriptionsareadoptedbyapplyingthehumanperceptiveunits,viz.glyphformationunitssuchastypesofstructure.componentsandstr

5、okes.Thesemethodsresultinambiguitiesanddescriptiondeficiencywithregardtoglyphresolution,structureclassification,andselectionofdescriptiveelements,thereforetheycannotmeettheneedtodescribeanypossibleglyphskeletons(includingwronglywrittencharacters,variantformsofcharactersinancientliteratures

6、,andcombined—characters),norCantheysupportautomaticcomputationofglyphcomparison,letalonetomeetthepracticalneedbasedonglyphcomparisonandanalysis,suchasthedescriptionofwronglywrittencharactersorthequantitativeanalysisofmisusedcharactersintheteachingandresearchofChinesecharacters,thedescripti

7、onandanalysisofvariantformsofcharactersinancientliteratures,ortheretrievalofrarecharacterglyphsintheelectronicbooksandSOon.ForspecialChinesecharacterstheglyphsamplesofwhichCannotbecollectedinadvance,suchaswronglywrittenones,variantformsinancientliteratures,and

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。