欢迎来到天天文库
浏览记录
ID:31981140
大小:1.49 MB
页数:42页
时间:2019-01-30
《基于神经网络的手写数字识别技术.研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、硕士学位论文第一章绪论1.1课题研究背景及现状第一章绪论光学数字识雯JIJ(OpticalCharacterRecognition,简称OCR)是20世纪20年代发展起来的一门自动化技术,是图像处理和模式识别领域的一个重要分支‘1112]。其目就是把图像作一个转换,使图像内的图形、表格继续保存,图像内的文字和表格中的资料一律变成计算机文字。从而达到减少存储容量、通讯交流的信息量、循环利用已识别出的文字节省人力和时间。手写数字识别[31(HandwrittenNumeralRecognition,简称HNR)是光学数字识别技术的一个分支,它是把手写阿拉伯数字(如0,1,2,⋯,9)通过扫描方式
2、输入到计算机中,再通过计算机建立的识别系统,自动辨识人用笔写在纸(介质)上的数字。它是模式识别【41、人工智能【5】的一个重要分支,在办公自动化,机器翻译等方面有重要实用意义。手写数字识别涉及到模式识别和图像处理、人工智能、统计决策理论、模糊数学、组合数学、信息论、计算机等学科;是介于基础研究与应用研究之间的--1"7综合性的技术【6】。手写数字识别主要包括两大类,一类是联机手写数字识别,另一类是脱机手写数字识别。本文讨论的均为脱机手写数字识别。目前手写数字识别主要的应用领域【7】:1)手写数字识别在大规模数据统计中的应用。2)手写数字识别在财税、金融领域应用。3)手写数字识别在邮件分拣中的
3、应用等。但目前手写数字识别的难度较大。虽然数字只有十种模式,笔划又简单,看起来识别不是很困难。但事实上,一些测试结果表明,数字识别的正确率还不如印刷汉字识别等的正确率高。其困难在于:1)数字笔划简单,其笔划差别相对较小,字形相差不大,使得准确区分某些数字(例如3与8,0与9,5与6等)相当困难。2)手写数字由于各个书写者的一些书写习惯和随意性,造成单个模式内变化很大,(见图1.1。)3)数字前后之间一般无语义相关性。这就减少了通过后处理进行纠正的可能性。从而使手写数字的正确识别率比印刷体汉字识别和联机手写体汉字识别低。为此,研究并建立一高效可靠的识别系统将是难点所在。硕士学位论文第一章绪论1
4、929年,Tauschek就试图用光学模板匹配的方法来识别十个印刷体阿拉伯数字心l,如图1.2。其主要原理是机器中有十个相应于阿拉伯字符0-9的模板,这些模板类似于照相的负片。当文件上的阿拉伯数字例如“2”与模板上的“2”字相吻合时,透过模板的光线最少,则在模板后的光接收器输出最小。而当文件上的阿拉伯数字与模板上的数字字符不相吻合时,字符以外纸面反射的白光就能部分透过模板的透明部分,使光接收器有的输出较大。对每个待识别的数字字符依次试过十个模板,输出最小的模板就是待识别的数字字符。貉戳囊支捧毙譬透凌豢绶图1-2Tauschek装置示意图一嗲◆辕积意缓缎器数字识别就是在这个原始方法的基础之上不
5、断地加以改进而得以发展,最后形成现有的识别技术可分为如下4类:【9】1.基于统计特征的数字识别这种识别技术一般选取同一类字符中共有的、相对稳定的并且分类性能好的统计特征作为特征向量。常用的统计特征有字符二维平面的位置特征、字符在水2譬警嗲9孳8鬈譬霉V7,7了Y样厶A五6‘本5守≥s§挪数体≮嗲簪够≮褐l卜熏》30篡图》Z器玉氏盖lt。》£DO鑫6辔硕士学位论文第一章绪论平或者垂直方向投影的直方图特征、矩特征和字符经过频域变换或其它形式变换后的特征等。识别过程是大量字符的统计特征经过提取、学习、分类形成关于字符原型知识,构成识别字符的模板信息,这些模板信息存储在识别系统中。未知图像在识别时首
6、先提取相同的统计特征,然后与识别系统存储的字符原型知识匹配比较,根据比较结果确定字符最终分类,达到识别的目的【lo】。最常用的匹配方法基于字符像素点平面分布的识别算法【1¨。后根据算法的不足,不断有学者提出改进的思路,产生了序贯相似性算法(SSDA)【121。即Kelner和Glauberman在1956年提出来用二维图像的投影代替图像点阵信息的思路【13】。2.基于结构特征的数字识别基于结构的数字识别技术。首先要提取字符的结构。根据识别策略的不同,结构的选择也有所不同。提取出的结构又称作字符的子模式、.部件、基元,所有基元按照某种序排列起来就成了字符的特征。基于结构的文字识别实际上是将字符
7、映射到了基元组成的结构空间进行识别。识别过程是在提取基元的基础上,利用形式语言和自动机理论,采取词法分析、树匹配、图匹配和知识推理的方法分析字符结构的过程。常用的结构特征有:端点、线特征、是否含有闭合笔画等。传统识别方法中,对输入图像采取统一分辨率进行识别,分辨率由系统的计算和存储资源先期决定,造成了系统资源的浪费和识别效率的降低。J.Park分析了传统结构识别方法中的这些弊端,提出主动数字识另U(Activ
此文档下载收益归作者所有