欢迎来到天天文库
浏览记录
ID:49406662
大小:215.50 KB
页数:8页
时间:2020-03-01
《【matlab代做】神经网络手写数字识别文献综述.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于神经网络的手写体数字识别系统1前言自1946年笫一台计算机面世以来,让电脑能说会看,能写会画,使人与计算机的交流更加充分融洽,就成为电脑专家们努力追求的H标。其小计算机的输入技术也由最早的磁带输入到键盘鼠标操作,然而,笔输入的更加直观方便使之成为每个人的梦想。1987年,美国电气和电子工程师学会IEEE(instituteforelectricalandelectronicengineers)在圣地亚哥召开了盛大规模的神经网络国际学术会议,国际神经网络学会(internationalneuralnetworkssociety)也随
2、Z诞牛。1990年IEEE神经网络会刊问世,各种期刊的神经网络特刊层出不穷,神经网络的理论研究和实际应用进入了一个蓬勃发展的时期山。H前关于人工神经网络的定义尚不统一⑵,例如,美国神经网络学家HechtHielsen关于人工神经网络的一般定义是:“神经网络是由多个非常简单的处理单元彼此按某种方式相互连接而形成的计算系统,该系统是靠其状态对外部输入信息的动态响应來处理信息的综合人工神经网络的來源、特点及各种解释,对以简单表述为:人工神经网络是一种旨在模仿人脑结构及其功能的脑式智能信息处理系统C神经网络经过训练可有效地提取信号、语音、图像
3、、雷达、声呐等感知模式的特征,并能解决现有启发式模式识别系统不能很好解决的不变量探测、适应、抽象或概括等问题。2手写体数字识别系统的现状2.1手写体数字识别手写体字符的识别是多年来的研究热点,在过去的数十年屮,研究者们提出了许许多多的识别方法。数字识别问题是根据待识别数字符号的特征观察值将其分类到()・9共1()个类别屮去。手写体数字识别方法大致可以分为两类⑴:基于统计的识别方法和基于结构的识别方法。统计法所使用的技术大致有一下几类:1)模板匹配法2)从像素点统计分布的角度来抽取特征,主要的方法有:采样点方法,矩方法、特征轨迹方法等。
4、3)用全局变换和级数展开的方法抽取特征。全局变换和级数展开可以减少特征向量的维数,且对于一些全局的形变,如平移和旋转,具有一定的不变性。上述统计方法屮,对仅使用单个特征的分类器而言,其识别率还不够高。对结构方法而言,它-•般是通过分析字符的轮廓或骨架来取得字符的儿何和拓扑特征,如环路、端点、弧状线及凹凸性等等。一般來说,结构方法有较高的识别速度,而且对于字符的变形具有良好的抗干扰能力,同吋对字符的旋转,平移和伸缩具有较好的稳定性,但是这种方法的特征抽取过程比较复杂,由于特征定义和抽取都直接依赖于研究者的直觉,对图像预处理要求较高。2.
5、2识别系统的性能评价作为一个识别系统,最终要用某些参数來评价其性能的高低,手写数字识别也不例外。评价的指标除了借用一般文字识别里的通常做法外,还要根据数字识别的特点进行修改和补充。对一个手写数字识别系统,可以用三方面的指标表征系统的性能⑸:正确识别率A=(正确识别样本数/全部样本数)X100%替代率(误识率)S二(误识样本数/全部样本数)X100%拒识率R二(拒识样木数/全部样本数)X100%三者的关系是:A+S+R二100%数字识别的应用屮,人们往往很关心的一个指标是“识别精度”,即:在所有识别的字符屮,除去拒识字符,正确识别的比例
6、有多大,定义:识别精度P=A/(A+S)X100%一个理想的系统应是R,S尽量小,而P,A尽可能大。而在一个实际系统屮,S,R是相互制约的,拒识率R的提高总伴随着误识率S的下降,与此同时识别率A和识别精度P的提高。因此,在评价手写数字识别系统时,必须综合考虑这几个指标。另外,由于手写数字的书写风格、工整程度可以有相当大的差别,因此必须弄清一个指标在怎样的样本集合下获得的。以上多种因索使得不同系统的性能很难做绝对比较,根据从文献屮所看到的和在科研研究的较高水平是:对自由书写的数字,在不拒识时达到96%以丄的识别率;在拒识少于15%的样本
7、时,误识率能降到0.1%以下。2.3基于人工神经网络的字符识别技术人工神经网络具有自学习、容错性、分类能力强和并行处理等特点⑸,对于手写体阿拉们数字的识别来说,神经网络的方法是一种较有效地手段,也渐渐得到广泛的应用。用神经网络进行字符识别•主要有两种方法:(1)首先对待识别字符进行特征提取,然后用所获得的特征训练神经网络。这种网络的识别效果与字符特征的提取有关,而字符的特征提取往往比较耗吋。(2)充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。这种网络互联较多,待处理信息量大。2.3.1预处理识别字体
8、的过程首先是耍在输入图像后进行预处理〔"I,预处理一般包括二值化、行字切分、平滑、去噪声、规范化和细化等。不同的识别方法对预处理的要求不同。所谓的二值化(Binarization)就是指把字符灰度图像处理成二值(0,1)
此文档下载收益归作者所有