基于形体特征的手写体数字识别

基于形体特征的手写体数字识别

ID:33578622

大小:389.99 KB

页数:8页

时间:2019-02-27

基于形体特征的手写体数字识别_第1页
基于形体特征的手写体数字识别_第2页
基于形体特征的手写体数字识别_第3页
基于形体特征的手写体数字识别_第4页
基于形体特征的手写体数字识别_第5页
资源描述:

《基于形体特征的手写体数字识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于形体特征的手写体数字识别摘要:通过对手写体数字识别技术的研究,本文建立了一个脱机手写体数字识别系统,对手写体数字的识别提出了一些新的思路,并对识别过程中所采用的关键算法进行了阐述。本文提出了二次毛刺去除法对手写体数字图像进行预处理,采用骨架搜索法来提取字符的孔洞特征,使用模板匹配加骨架搜索的方法来确定不同方位的端点,利用模板匹配法来提取字符的横线及竖线特征,采用特征匹配法对字符进行识别。实验证明,本文所建立的基于形体特征的手写体数字识别系统能较全面地反映手写体数字各方面的特征,总的识别率达到95.5%,有着较好的识别性能和十分广泛的应

2、用前景。  1、引言  随着计算机硬件速度的快速提高及价格的不断下降,计算机的应用逐渐渗透到人们工作和生活的方方面面,然而硬件运算速度的提高并不意味着数据处理速度也能同样得到大幅度的提高,因为它还受到信息数据采集速度的制约。为了提高信息数据的采集录入速度,本文对手写体数字识别技术进行了研究,并建立了一个脱机手写体数字识别系统。  2、基于形体特征的手写体数字识别系统的软件架构  手写体数字识别系统主要由五大模块组成(如图1所示),分别是:字符读入模块、预处理模块、特征提取模块、字符识别模块和输出显示模块。图1系统软件架构图  3、手写体数

3、字字符的预处理  预处理的目的是去除图像中的噪声,将原来的灰度图像转变成清晰的二值图像,以便字符特征的提取。本系统在预处理的过程中,提出了二次毛刺去除法和分方位毛刺去除法等多种新方法对字符进行预处理。  3.1.读图并将其二值化  二值化后的bmp数字图像的像素值统一为“0”和“1”两种。“1”值代表数字数据,“0”值代表背景数据。图4.a即是二值化后的数字字符图像。  3.2.平滑:一次毛刺去除  平滑的作用是去除数字边缘的粗糙点,采用模板匹配法来进行平滑。本文提出了二次毛刺去除法对数字图像进行毛刺的去除,即在粗线条和细线条两种不同的情

4、况下对字符的毛刺进行两次去除,这里是在粗线条的情况下对字符毛刺进行的第一次去除,如图4(b)所示。其算法如下所示:  (1)平滑去噪。  归一化后的数字矩阵中,1代表数字数据,0代表背景数据。若在数字矩阵的某一部分中,一条线段的四周都是0,则认为该线段不是数字数据,属于噪声,因此将其去掉;而如果在一个0的周围都是1,则认为此0不该出现,因此令其为1,如图2模板1和模板2所示。  (2)去掉对于拓扑分析无贡献的点。  将数字矩阵从上到下、从下到上各扫描一遍,对数字拓扑进行两遍分析和处理,首先建立一个如图3所示的模板模型。  从上到下对图像进

5、行扫描,其处理准则为:  1)P0、P1、P2、P3、P4、P6等于0,g等于1,若P5或P7等于1,则令g等于0。  2)若P5、P6、P7至少有两个等于1,P0、P1、P2、P3、P4等于0且g等于1,则令g等于0。  从下到上扫描是做位置上下对称的相同处理,这里不在重复介绍。图2平滑去噪模板图图3去掉对于拓扑分析无贡献的点  3.3.切割  切割是指沿着字符的上下左右边缘将数字剪切出来。首先采用扫描的方法,找出字符的上下左右切点,然后根据上下切点的行数和左右切点的列数来决定所要剪切的字符的起始和终止的行数与列数,就可以将字符剪切出来

6、。图4(c)即是对数字字符图像进行切割后的结果。  3.4.细化  细化是将字符的粗线条变为细线条,为后面的骨架搜索奠定基础。本系统的细化步骤采用Matlab库函数里的细化函数:bwmorph(J,'skel',Inf)来完成,图4(d)即是细化处理后的结果。  3.5.归一化  归一化是将细化后的字符放在32*24的图像空间的中间,统一字符的大小及格式,如图4(e)所示。  3.6.二次毛刺去除及断点修复  去毛刺即是去除细化后的数字边缘的粗糙点,采用模板匹配法来实现。这里是二次毛刺去除法中在细线条的情况下对字符毛刺进行的第二次去除。在

7、第二次毛刺去除的过程中,本文又提出了分方位毛刺去除法对毛刺进行去除,即使用不同的模板对字符的左上、左下、右上、右下、左中、右中、上中和下中八个方向分别进行处理。在去毛刺的同时采用模板匹配法对字符中出现的断点进行修复。图4(f)即是对字符进行第二次毛刺去除和断点修复处理后得出的结果。图4预处理过程图  4、手写体数字字符的特征提取  特征提取是手写体识别系统中一个非常重要的环节。本文在对前人所采用的特征提取方法进行研究的基础上,从多角度、多方位对数字字符的特征进行提取。  4.1.孔洞特征  对孔洞特征的提取,首先是寻找字符的上切点,以上切

8、点为起始点,按照右、右上、上、左上、左、左下、下和右下八个方向的顺序开始进行骨架的搜索,当搜索到非零像素点时,即以该点作为中心点,重复上述操作,同时记录上一个中心点的行列数,以避免重复搜索已搜

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。