欢迎来到天天文库
浏览记录
ID:25856569
大小:1.19 MB
页数:32页
时间:2018-11-23
《毕业论文-汉字识别技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国人民公安大学毕业论文(设计)题目汉字识别技术研究学生姓名郭耀珅学号2006212100192006年级安全防范工程专业方向安全防范与网络保卫大队06中队一区队指导教师王蓉教务处制中国人民公安大学本科毕业论文(设计)汉字识别技术研究摘要:本文主要在研究当前光学字符识别系统及相关识别技术的基础上,利用matlab编程语言设计了一套简单的相对具有较高识别率的汉字识别程序。首先,将RGB图像转化为二值图像(即仅有黑白二种颜色的图像),而后经平滑处理,滤除混入的噪声,得到清晰完整的文字图像,其次,进行行字切分使整篇文字图像成为单个文字图像,最后提取汉字的横竖撇捺特征与现有的汉字特征库进行比
2、较匹配从而进一步输出汉字的数码形式。实验结果表明,本文研究的方法能够识别汉字,准确率较高。关键词:印刷体汉字识别;预处理;特征提取;特征匹配IV中国人民公安大学本科毕业论文(设计)ResearchonChineseCharacterRecognitionTechnologyAbstract:Thisthesisstudiesontheopticalcharacterrecognitionsystemandcorrelativerecognitiontechnology,basedonthematlabprogramminglanguagedesignedasetofrelativel
3、yhighrecognitionsimpleofcharacterrecognitionprograms.First,transformingRGBimagesintobinaryimage(onlyblackandwhitecolorimage),thenthesmoothfilteringde-noisingintermingledwiththenoiseofthetexttogetclear.Secondly,theimagesegmentationwords,theessaywritingasasinglewordimages,theimagesofChineseabando
4、nedanyfinalextractingfeaturesofcharacterswithexistingisfeaturelibrarycomparedtofurtheroutputcharactersofthematchindigitalform.ExperimentalresultsshowthatthismethodcanbeusedtoidentifyChinesecharactersandprecise.Keywords:PrintChineseCharacter;Preprocessing;Characteristiccollecting;Characteristicm
5、atchingIV中国人民公安大学本科毕业论文(设计)目录1绪论11.1汉字识别的研究背景与现实意义11.2我国汉字识别技术发展历史与现状21.3本文研究的主要内容32汉字识别技术的相关基础知识42.1概述42.2汉字识别流程52.2.1预处理52.2.2特征提取62.2.3特征匹配与汉字识别72.2.4后处理72.3汉字识别模式82.3.1结构模式识别82.3.2统计模式识别83汉字识别系统93.1汉字图像增强93.1.1二值化处理93.1.2平滑去噪103.1.3行字切分103.2特征提取123.2.1统计特征123.2.2特征提取方法133.3特征匹配识别133.4后处理144
6、系统仿真与实验结果154.1实验环境154.2实验过程154.2.1预处理154.2.2特征提取与特征识别194.2.3比对实验214.3仿真结果分析224.4本章小结225总结与展望235.1总结235.2展望23IV中国人民公安大学本科毕业论文(设计)致 谢25参考文献26IV中国人民公安大学本科毕业论文(设计)1绪论1.1汉字识别的研究背景与现实意义据文献记载,印刷体汉字的识别最早可以追溯到60年代。1966年,IBM公司发表了第一篇关于印刷体汉字识别的论文,在这篇论文中他们利用简单的模板匹配法识别了1000个印刷体汉字。70年代以来,日本学者做了许多工作,其中有代表性的系统有
7、1977年东芝综合研究所研制的可以识别2000个汉字的单体印刷汉字识别系统;80年代初期,日本武藏野电气研究所研制的可以识别2300个多体汉字的印刷体汉字识别系统,代表了当时汉字识别的最高水平[1]。此外,日本的三洋、松下、理光和富士等公司也有其研制的印刷汉字识别系统。但价格过于昂贵,没有得到广泛应用。80年代初期,日本武藏野电气研究所研制的可以识别2300个多体汉字的印刷体汉字识别系统,识别率为99.88%,识别速度大于100字/秒,代表了当时汉字识别的
此文档下载收益归作者所有