融合字符及字符排列特征的铭牌识别方法

融合字符及字符排列特征的铭牌识别方法

ID:31376516

大小:113.00 KB

页数:9页

时间:2019-01-09

融合字符及字符排列特征的铭牌识别方法_第1页
融合字符及字符排列特征的铭牌识别方法_第2页
融合字符及字符排列特征的铭牌识别方法_第3页
融合字符及字符排列特征的铭牌识别方法_第4页
融合字符及字符排列特征的铭牌识别方法_第5页
资源描述:

《融合字符及字符排列特征的铭牌识别方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、融合字符及字符排列特征的铭牌识别方法  摘要:传统铭牌字符识别主要通过计算铭牌字符图片的灰度平均值来判定,由于铭牌字符具有笔画方向特征、轮廓特征,同时字符之间存在着一定的排列特征。提出融合字符及字符排列特征的铭牌识别方法,首先对铭牌字符图片分别进行横、竖、撇三个方向上的小波变换,求出三个方向上的小波平均能量,再提取出字符的边缘方向直方图,以小波平均能量和边缘方向直方图构成特征向量,用支持向量机分类器训练并构建候选字符识别模型,得到候选字符,然后利用铭牌字符排列特点和铭牌的样本数据训练构建N阶马尔科夫字符排列模型,

2、借助于模型对候选字符进行约束获得铭牌识别结果,最后对电力设备铭牌进行识别实验。结果表明,提出的方法表现了很好的效果,比OCR软件识别的准确率提高了12.6%。  关键词:设备铭牌;字符识别;笔画方向特征;轮廓特征;字符排列特征  中图分类号:TN919?34文献标识码:A文章编号:1004?373X(2016)22?0006?03  0引言9  铭牌字符不同于具有白色背景的普通文档字符,它一般出现在彩色背景中,字符可能出现倾斜,而且字符数量远远少于普通文档,一般同时包含文字、数字和字母,识别这种字符对于设备的管理

3、具有重要意义[1]。目前的铭牌字符识别是提取字符特征建立模版,利用模版匹配来进行字符识别。其中,字符特征的提取和匹配是最关键的部分。对于特征的提取,Yang等人提出以字符的孔洞数[2]、字符每一行由白到黑跳变的像素个数以及字符经过Gabor[3]变换之后的纹理特征来作为字符的识别特征;Chen等人提出以字符的小波能量[4]作为字符识别特征的方法,其中小波能量是一种细节特征,可以较好地体现字符在不同笔画方向上的频谱能量[5];Wei等人利用字符的开闭环特征[6]训练BP神经网络[7]来进行字符的识别,通过判断字符的

4、形状有没有构成封闭的区域,以构成不同类型的封闭区域作为字符的识别特征。对于铭牌字符模版的匹配,传统方法是将字符分割成很多小块,然后计算出所有小块的灰度平均值[8]来进行匹配,字符中的汉字、数字和字母笔画弯折的部分具有丰富的笔画方向特征[9],通过小波变换可以把字符笔画方向的变化这一局部细节信息反映在频谱的高频部分,同时铭牌字符的轮廓线条存在着很多方向突变,具有丰富的形状轮廓信息,边缘方向直方图[10]可以体现字符的整体形状轮廓信息。铭牌上的内容一般是某一领域的相关术语,字符只有通过固定的排列才能构成这些术语,通过

5、N阶马尔科夫方法[11]构建的字符排列模型可以体现出字符之间的特定排列特征。所以本文将它们融合在铭牌识别的特征提取和结果匹配中,提高铭牌字符识别的准确率。以电力设备铭牌识别实验为例,其结果也验证了本文提出方法的有效性。  1铭牌字符预处理9  在进行铭牌字符识别之前,需要对铭牌上的字符做预处理,包括字符图像的二值化、字符图像的去倾斜、以及字符图像的分割。设备铭牌的图像通常是彩色的,为了方便对字符的分割以及识别,首先要对字符图像进行二值化,本文采用全局最大方差阈值法来确定对字符图像进行二值化的灰度阈值K。设灰度图像

6、的灰度级区间为[0,M],某一灰度级K将该区间分为两组,分别为[0,K]和[K+1,M],记为C0和C1,则这两个灰度区间之间平均灰度的方差为:  [δ2K=ω0μ0-μ2+ω1μ1-μ2=(μω(K)+μ(K))2ω(K)(1-ω(K))](1)  式中:μ0和μ1分别为C0和C1的平均灰度;ω0和ω1分别为C0和C1所占像素点数量与总像素点数量的比值。在[0,M]之间不断变换K的值,直到求出式(1)中δ2(K)为最大值时的K值,这个值就是对字符图像进行二值化的灰度阈值K。到此,完成了设备铭牌上字符的灰度二值化

7、。  由于拍摄角度的原因,设备铭牌上的字符会与水平线之间存在一个微小的夹角θ。为了方便特征的提取,需要对字符图像进行去倾斜。由于铭牌上的字符是横排书写的,即从左往右书写,对字符图像分别进行x轴和y轴方向上的投影,其投影长度分别为L1和L2,然后检测y轴上灰度值为1的起始点的坐标,其到x轴的距离记为L3,设字符图像的去倾斜角度为θ,则:  [θ=arctanL2-L3L1](2)  对于设备铭牌上的字符,如果最左侧字符的y轴投影坐标大于最右侧字符的y轴投影坐标,则将整个字符的投影区域逆时针旋转去倾斜角θ即可,反之,

8、则顺时针旋转去倾斜角θ9即可。在进行字符图像的二值化和去倾斜之后,接下来进行字符图像的分割和归一化。设备铭牌字符的分割可分为行分割与字间分割,首先进行的是铭牌字符的行分割,对铭牌字符进行y轴方向的投影,可以得到铭牌字符在y轴方向的像素分布,在像素分布图中有一些地方为零,它们对应两行之间的空白,可以根据y轴方向的像素分布来计算每一行的宽度以及行与行之间的距离,在进行字符图像

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。