分析手写数字识别的原理及应用

分析手写数字识别的原理及应用

ID:21633920

大小:61.00 KB

页数:9页

时间:2018-10-23

分析手写数字识别的原理及应用_第1页
分析手写数字识别的原理及应用_第2页
分析手写数字识别的原理及应用_第3页
分析手写数字识别的原理及应用_第4页
分析手写数字识别的原理及应用_第5页
资源描述:

《分析手写数字识别的原理及应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、分析手写数字识别的原理及应用手写数字识别的原理及应用林晓帆丁晓青吴佑寿一、引言手写数字识别(HanderalRecognition)是光学字符识别技术(OpticalCharacterRecognition,简称OCR)的一个分支,它探究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个OCR领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的探究中已取得很多可喜成就,但距实用还有一定间隔。而在手写数字识别这个方向上,经过多年探究,探究工已经开始把它向各种实际应用推广,为手写数据的高速自

2、动输进提供了一种解决方案。二、探究的实际背景字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量非凡符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类信息的核心技术是手写数字识别。这几年来我国开始大力推广的“三金”工程在很大程度上要依靠数据信息的输进,假如能通过手写数字识别技术实现信息的自动录进,无疑会促进这一事业的进展。因此,手写

3、数字的识别探究有着重大的现实意义,一旦探究成功并投进应用,将产生巨大的社会和经济效益。三、探究的理论意义手写数字识别作为模式识别领域的一个重要新题目,也有着重要的理论价值:1.阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的探究基本上和文化背景无关,这样就为各国,各地区的探究工提供了一个发挥才智的大舞台。在这一领域大家可以探索,比较各种探究方法。2.由于数字识别的种别数较小,有助于做深进分析及验证一些新的理论。这方面最明显的例子就是人工神经X络(ANN)------相当一部分的ANN模型和算法都以手写数字识别作为具体的实验平台,验证理

4、论的有效性,评价各种方法的优缺点。3.尽管人们对手写数字的识别已从事了很长时间的探究,并已取得了很多成果,但到目前为止机器的识别本领还无法和人的认知能力相比,这还是一个有难度的开放新题目(Openproblem)。4.手写数字的识别方法很轻易推广到其它一些相关新题目棗一个直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿探究的。四、探究的难度数字的种别只有十种,笔划又简单,其识别新题目似乎不是很困难。但事实上,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如联机手写体汉字识别

5、率高,而只仅仅优于脱机手写体汉字识别。这其中主要原因是:第棧??值淖中涡畔⒘亢苄。?煌??中捶ê?B>字形相差不大,使得正确区分某些数字相当困难;第二,数字固然只有十种,而且笔划简单,但同一数字写法千差万别,全世界各个国家各个地区的人都用,其书写上带有明显的区域特性,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。另外,在实际应用中,对数字识别单字识别正确率的要求要比文字要苛刻得多。这是由于,数字没有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及的财会、金融领域其严格性更是不问可知的。因此,用户的要求不是单纯的高正确

6、率,更重要的是极低的、千分之一甚至万分之一以下的误识率。此外,大批量数据处理对系统速度又有相当的要求,很多理论上很完美但速度过低的方法是行不通的。因此,探究高性能的手写数字识别算法是一个有相当的挑战性的任务。五、学习和测试样本库的选择正如前一部分提到的,手写数字的写法带有明显的地区性和民族性,因而选择一个可供系统练习和测试使用的样本库是手写数字识别探究的重要基础之一,对识别系统的性能也有重要的影响。探究者对所需的样本库有两种选择:一是自己根据需要建立专门的样本库,二是选用其它机构做好的现成的样本库。前者的优点是帖近自己的应用,缺点也是明显的:

7、要费相当的精力且代表性很难保证,和其它人的结果不比如较。因此,现在的趋向是使用有权威性的通用样本库。目前,比较有代表性的、样本数目较大的手写数字样本库有:(1).NIST数据库,由美国国家标准和技术局收集;(2).CEDAR数据库,是由纽约州立大学Buffalo分校计算机科学系文天职析和识别中完成的邮政编码的样本库;(3).ETL数据库,由日本电工技术探究所收集;(4).ITPT数据库,由日本邮电通讯政策探究所收集。六、识别系统性能的评价作为一个识别系统,我们终极要用某些参数来评价其性能的高低,手写数字识别也不例外。评价的指标除了借用一般文字

8、识别里的通常做法外,还要根据数字识别的特征进行修改和补充。对一个手写数字识别系统,可以用三方面的指标表征系统的性能:正确识别率A=正确识别样本数/全部样本数*100

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。