资源描述:
《神经网络在车牌识别中的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、神经网络在车牌识别中的应用神经网络在车辆牌照字符识别中的应用曹迪铭。宣国荣。摘要在车辆牌照自动识别系统中,因自然因素或采样因素使得原本规则的印刷体字符产生畸变,给字符识别带来了很大困难。本文在特征抽取的基础上,采用BP网络进行分类,并附加线性感知器来实现单字的有效识别。该方法算法简便,识别率高,可适用于多种高噪声环境中的印刷体字符识别。关键词车辆牌照字符识别BP网络线性感知器一、引言车辆牌照识别系统可对道路上行使的汽车身份进行自动认证,从而使车辆管理、流量控制、路口交费等实现高度自动化。牌照中的字符主要由有限汉字、字母和数字组成
2、,采用固定的印刷体格式,然而由于自然因素(如:光照、气候)及人为因素(如:牌照污损、变形)等造成采样后的数据发生几何形变、投影形变、笔画缺损及附加随机噪声,使得原本规则的印刷体字符发生畸变,给识别带来了很大困难。早期类似的系统在实用中都无法获得满意的效果。近几年,国内外的许多学者都致力于牌照识别的理论研究,并提出了许多新算法,对该领域的发展起了很大的推动作用。本文所研究的图象是采用照相机拍摄的车辆照片,用扫描仪对其进行数字化,生成256级灰度图像。首先对图象进行分割,提取出带有牌照字符串的小块区域(该区域具有较单一的背景,且字符
3、串基本处于区域的中央);接着提取精确的字符串区域,对其形变校正;然后对字符串分割,确定单个字符的位置;最后对单一字符进行识别。文中主要介绍字符识别部分。字符特征选用其灰度信息及纹理信息,使用BP神经网络进行初级字符分类,再用线性感知器进行次级分类。在实验室环境中获得较高的识别率,应用此方法对于高噪声环境下规则字符的识别将会有很大帮助。二、神经网络识别牌照字符串的识别过程见图1,主要包括四个部分:首先将待识别字符区域规一化(汉字规一化为9×15象素灰度图,字母、数字规一化为5×9象素灰度图);接着提取规一图的灰度特征及纹理特征;然
4、后将结合的特征作为神经网络的输入,训练相应的权值矩阵,实现字符的初级分类;最后字母及字母数字神经网络的分类输出经过线性感知器的次级分类产生识别结果,而汉字及数字网络的分类输出直接作为识别结果。·5·MicrocomputerApplicationsVol.16,No.6,2000专题微型电脑应用2000年第16卷第6期。。宣国荣同济大学计算机学院教授博士生导师上海200092曹迪铭同济大学计算机系硕士上海200092国家自然科学基金资助项目标准的车辆牌照由七个字符组成(见图2、3,此类样本图例均为实际拍摄照片数字化后的灰度图象,
5、以100%比例显示,后文提供的图例与此相同)。第一位字符是汉字(省名缩写),第二位字符是大写英文字母,第三位字符是大写英文字母或数字,其余字符是阿位位数字。为了提高综合识别率,根据其字符所处位置的差异构造了4个神经网络。其中汉字网络具有135个输入神经元及30个输出神经元;字母网络54个输入,26个输出;字母数字网络54个输入,36个输出;数字网络45个输入,10个输出。下面主要以字母数字网络为例,具体说明实现过程。图2图31.规一化及特征抽取对字符抽取的特征分为两部分,包括图象的灰度信息及纹理信息。图4第一部分选取图象的灰度信
6、息:这些特征可使神经网络对字符的笔画缺损及随机噪声有较强的抗干扰性。分割后的字符串是7个二值化图象区域(图5中背景为黑色的矩形区域)。首先对图象区域进行规一化,形成5×9象素点阵图。为使原图象有效灰度信息尽可能保留到规一图中,采用伪灰度及象素移交映射方法(见图4),即规一化的操作对象是二值图象而不是原灰度图像[1],先将二值化图象扩展为256级灰度图像,并映射到规一图上,再将其灰度值按差值比例分配到相邻的四个象素点:g(x0,y0)+=f(x,y)·(x1-x′)·(y1-y′)g(x0,y1)+=f(x,y)·(x1-x′)·
7、(y′-y0)g(x1,y0)+=f(x,y)·(x′-x0)·(y1-y′)g(x0,y0)+=f(x,y)·(x′-x0)·(y′-y0)(1)其中原图象点(x,y)映射为规一图中点(x′,y′),f(x,y)和g(x′,y′)分别为相应的灰度值,而(x0,y0),(x0,y1),(x1,y0),(x1,y1)为与(x′,y′)相邻的四点。然后对规一图的灰度值规一化,形成数字字母网络的45个输入特征值:g(x′,y′)=[g(x′,y′)-E(g(x′,y′))]max[g(x′,y′)-E(g(x′,y′))]g(x′,y
8、′)>E(g(x′,y′))g(x′,y′)=0g(x′,y′)≤E(g(x′,y′))(2)规一化后的图象如图6所示图5图6图7第二部分选取图象的纹理特征,这些特征可使神经网络不受字符变形的影响。处理的对象是规一化后的伪灰度图象。对图象水平扫描,记录字符的水平