基于结构特征的手写体汉字识别研究

基于结构特征的手写体汉字识别研究

ID:36795338

大小:1.89 MB

页数:77页

时间:2019-05-15

基于结构特征的手写体汉字识别研究_第1页
基于结构特征的手写体汉字识别研究_第2页
基于结构特征的手写体汉字识别研究_第3页
基于结构特征的手写体汉字识别研究_第4页
基于结构特征的手写体汉字识别研究_第5页
资源描述:

《基于结构特征的手写体汉字识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Y974538分类号UDC密级编号YUNNANNORMALUNIVERSITY硕士研究生学位论文论文题目:基王缱掏挂焦的壬至签邋皇迟曼9硒窒学院i土篡扭抖堂与篮皇燕查堂随专业名称基型数堂研究方向缦金数主——研究生姓名墨盍敛学号—030701—01007导师姓名墨歪生!塞幼明职称麴撞2006年月日独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位

2、论文作者签名:Ⅺ乞镪L仂力(年C,qj歹日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关-部f-]或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权云南师范大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存禾F1,E编本学位论文。学位论文作者签名:您善钆调(年6月弓日指导教师签名:沼香乏卫叫年‘月乡B基于结构特征的脱机手写体汉字识别研究摘要手写体识别有着广阔的应用前景和很高柏理论价值,从应用角度来看各种文档的高速自动录入,档案管理,早期图书资料的数字化,邮件的

3、自动分拣,证件的自动阅读,票据的自动处理等方面都有广泛的应用。从理论方面来讲传统的模式识别理论和技术在手写体汉字识别中有很大的局限性,研究手写体汉字识别可以认识高难度模式识别的一般规律,还有助于发展新的模式识别理论,而且它涉及到模式识别、图像处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、计算机科学、中文信息处理等许多学科,因此手写体汉字识别在相关学科研究郓多学稃妁融合中都有很高的理论价值。汉字识别从1966年IBM公司的Casey和Nagy首次发表了汉字识别的文章到现在已有40年的历史,经过无数科研工作者的努力现在联机识别和印刷体识别已经可以达到实用水平,只有脱

4、机手写体识别至今还不能达到令人满意的效果,被称为文字识别中“最难征服的领域”,尤其是基于结构特征的手写体汉字识别更是具有挑战性。其中手写体的连笔问题和变形问题是手写体识别中的两大难点。本文从结构特,正出发对限制性手写体的识别进行研究,同时也对于连笔也提出了解决的方案。本文提出了新的笔段提取算法;对没有连笔的手写体提出了基于笔段的结构判断和部首分割算法;对有连笔的手写体提出基于笔段的部首的动态组台算法:重新定义了方向线素特征:将结构特征和统计特征有机的结合起来提出新的特征。对每个输入的汉字预处理后进行细化,首先用传统的方向线素的特征判断每个像素点所属的笔段类型,这样就提取出各种笔

5、段的一些小线段,再经过延伸、连接、删除,笔段类型的判断再延伸等操作,提取出横、竖、撤、捺四种笔段。利用笔段来定义方向线素特征,从整体上考虑方向特征,削除传统的方向线素特征中的不确定信息,提取出一个196维的特征向量。在细化的基础上利用像素值从0到l的数目来提取交点的数目,当然在提取的时候要去掉三叉点的干扰。将各种笔段的数目和交点的数目作为特征向量的前五个分量并且赋予较大的权值,把新的方向线素的特征向量作为第6到第201个分量,使结构特征和统计特征有机的结合起来,组成新的方向线素的特征向量。对没有连笔的汉字进行反转用和提取笔段类似的算法在规定的区域内提取最长的横和竖,对于结构类型

6、进行判断,。第1贞共35页同时也对于上下和左右结构的部首切分。对有连笔的汉字提取所有的笔段后计算每个笔段的重心.按重心位置从上到下、从左到右两种顺序排序,假设两种结构的出现是等概率的,从最小的部首开始按顺序不断添加新的笔段到是上下结构时的部首和是左右结构时的部首中,每添加一个笔段都要进行一次匹配。用这样动态的组合、匹配来进行结构判断和部首切割。最后按照部首查字法的思想对部首和剩余的部分进行识别给出最终的识别结果。关键词:汉字识别、手写体、笔段、方向线素、部首切割。第2页共35页AbstractOff——LineHandwrittenChineseCharacterRecogni

7、tionBasedOnStructureHandwrittenChinesecharacterrecognitionhasagoodprospectandhighvalueoftheoryresearch.Fromthepointofapplication,manydocumentneedputintothecomputerespeciallyinthemanagementofarchives,librarydigitalization,envelopeautomaticmanage.Ano

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。