光字符识别技术.doc

光字符识别技术.doc

ID:61499287

大小:214.50 KB

页数:7页

时间:2021-02-07

光字符识别技术.doc_第1页
光字符识别技术.doc_第2页
光字符识别技术.doc_第3页
光字符识别技术.doc_第4页
光字符识别技术.doc_第5页
资源描述:

《光字符识别技术.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、模式识别技术中的光字符识别技术2.1OCR概述1929年Tausheck取得光字符识别(OpticalCharacterRecognition,OCR)专利,由于其容易被人们接受、掌握,它同语音识别、行为识别等一起日益成为人们研究的焦点[4]。经过近一个世纪的发展,OCR已经成为当今模式识别领域中最活跃的研究内容之一[5]。它综合了数字图像处理、计算机图形学和人工智能等多方面的知识,并在计算机及其相关领域中得到了广泛应用。通常OCR识别方法可以分为如下3类:统计特征字符识别技术、结构字符识别技术和基于人工神经网络的识别技术。]。2.2统计特征

2、字符识别技术统计特征字符识别技术一般选取同一类字符中共有的、相对稳定的并且分类性能好的统计特征作为特征向量。常用的统计特征有字符二维平面的位置特征、字符在水平或者垂直方向投影的直方图特征、矩特征和字符经过频域变换或其他形式变换后的特征等。基于字符像素点平面分布的识别算法,因为算法简单、实现方便的特点而成为最常用的匹配方法。Kelner和Glauberman在1956年提出了用二维图像的投影代替图像点阵信息的思路。二维的图像被一维的投影代替,计算量减少,同时也消除了文字在投影方向偏移的影响,但是对于字符的旋转变形却无能为力。基于统计特征的字符识

3、别技术对于形近字符区分能力弱,通常应用于字符的粗分类。2.3结构字符识别技术结构字符识别技术首先要提取字符的结构,提取出的结构又称作字符的子模式、部件、基元,所有基元按照某种顺序排列起来就成了字符的特征。基于结构的文字识别实际上是将字符映射到了基元组成的结构空间进行识别。传统识别方法中,对输人图像采取统一分辨率进行识别,分辨率由系统的计算和存储资源先期决定,造成了系统资源的浪费和识别效率的降低。J.Park分析了传统结构识别方法中的这些弊端,提出主动字符识别(ActiveChar—acterRecognition)的思想,主动依据输人图像,动

4、态确定结构特征的选取,降低了系统资源的浪费并提高了效率。2.4基于人工神经网络的识别技术基于人工神经网络的识别技术目的就是力图通过对人脑功能和结构的模拟来实现字符的高效识别。在OCR系统中,人工神经网络主要充当分类器的功能,输人是字符的特征向量,输出是字符的分类结果,即识别结果。Krezyak和LeCun主要研究了BP(BackPropagation)神经网络在文字识别方面的应用,针对BP网络学习速度慢、泛化能力弱的缺点,在BP网络的基础上产生了竞争监督学习的策略。3OCR技术在汉字识别中的应用汉字识别属于模式识别的研究范畴。目前汉字识别技术

5、按照识别的汉字不同可以分为印刷体汉字识别和手写体汉字识别。印刷体汉字识别从识别字体上可分为单体印刷体汉字识别与多体印刷体汉字识别。手写体汉字识别根据实时性又可分为联机手写体识别和脱机手写体识别。从识别的难度看,多体印刷体识别难于单体印刷体识别,手写体识别难在日常生活中,字符识别技术应用越来越成熟,备受人们关注。在此用BP网络和霍普菲尔德网络对部分英文字母进行识别设计与测试。首先将待识别的26个字母整的每一个字母都通过长和宽分别为7×5的方格进行数字化处理,并用一个向量表示。其相应有数据位置置为1,其他位置置为0。图3.1给出了字母A、B和C的

6、数字化过程,其中最左边的为字母A的数字化处理结果所得对应的向量为:letterA=[00100010100101010001111111000110001]',由此可得每个字母都是由35个元素组成一个输入向量。由26个标准字母组成的输人向量被定义为一个输人向量矩阵alphabet,即神经网络的样本输人为一个35×26的矩阵。其中alphabet=[letterA,letterB,letterC,.....,letterZ]。网络样本输出需要一个对26个输人字母进行区分输出向量,对于任意一个输人字母,网络输出在字母对应的顺序位置上的值为1,其余

7、为0,即网络输出矩阵为对角线上为1的26×26的单位阵,定义target=eye(26)。图3.1数字化字符本文共有两类这样的数据作为输人:一类是理想的标准输人信号;另一类是在标准输人信号中加上用MATLAB工具箱里的噪声信号,即randn函数。3.2识别字符的网络设计及其实验分析3.2.1单层感知器的设计及其识别效果选取网络35个输人节点和26个输出节点,设置目标误差为0.0001,最大训练次数为40。设计出的网络使输出矢量在正确的位置上输出为1,在其他位置上输出为0。首先用理想输人信号训练网络,得到无噪声训练结果,然后用两组标准输入矢量加

8、上两组带有随机噪声的输人矢量训练网络,这样可以保证网络同时具有对理想输人和噪声输人分类的能力。网络训练完后,为保证网络能准确无误地识别出理想的字符,再用无噪声的标准

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。