基于神经网络的手写体汉字识别实验系统.pdf

基于神经网络的手写体汉字识别实验系统.pdf

ID:52353692

大小:1.04 MB

页数:3页

时间:2020-03-26

基于神经网络的手写体汉字识别实验系统.pdf_第1页
基于神经网络的手写体汉字识别实验系统.pdf_第2页
基于神经网络的手写体汉字识别实验系统.pdf_第3页
资源描述:

《基于神经网络的手写体汉字识别实验系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、学术探讨应用技术与研究2015年第5期基于神经网络的手写体汉字识别实验系统郑少兰(福建水利电力职业技术学院,福建永安366000)[摘要]基于神经网络的手写体汉字识别是将汉字点阵图形转换成电信号,然后输入给数字信号处理器或计算机进行处理,依据一定的分类算法在众多汉字字符中找出和它相互匹配的汉字字符。本文阐述了手写体汉字识别实验系统的设计目标,分析了手写体汉字的预处理及其原理,详细介绍了手写汉字的特征提取。[关键词]神经网络;手写体;汉字;识别中图分类号:TP391.43文献标识码:A文章编号:1008-6609(2

2、015)05-0044-03能对输入的整个手写体汉字图像进行一些必要的处理,并从1引言中正确切分出一个个手写体汉字,形成单个汉字的图像阵基于神经网络的手写汉字识别在众多领域中应用广泛,列,以便对其进行方便的单字识别处理。一般的做法是自上比如在信息处理领域,通过手写汉字识别系统的应用就能够而下逐行地对汉字图像进行扫描,同时对各个扫描行的像素使纸质文档的电子化效率得到大大提高。若将汉字识别的进行计算,得到图像水平的投影,利用文字每行之间存在的速度与准确度都提高到比人工手动输入更高的层次,这样在空白间隔,对其进行分割,然

3、后再利用字和字之间空白间隔提高效率时又节省了大量的人力资源。因此,研究基于神经的投影空隙把单个的汉字图像切分出来。网络的手写汉字识别试验系统能够有效实现汉字信息的高如下图1所示,我们从一个汉字上、下、左、右四个对角线速输入,进而能够更加方便快捷地加工和处理信息。方向,用一种假想的网线对手写汉字进行扫描和切分,某条2手写体汉字识别实验系统的设计目标网线穿过笔划的次数就是该笔画的密度特征。本次设计要实现的目标就是建立一个图像处理识别的平台,使手写的汉字以图像文件格式(BMP)的形式输入FP-GA,提取出其特征向量,通过

4、分类识别,转换为汉字文本。我们需要设计和实现基于神经网络的手写汉字识别系统,主要实现样本采集、预处理、特征提取、分类与识别五个方面。系统的具体目标有以下几个方面:图1汉字切分首先就是使用FPGA对字库图像文件进行前期处理,包设Ii是水平方向上第i条网线,则沿这条扫描线得到的手括字符分割平滑去噪、二值化处理、归一化、细化等;其次就写汉字加权笔划密度特征的公式为:是使用处理后的标准字符图像对分类模型进行训练,使其成4N-1------------------1为具有字形识别功能的分类器。通过包括神经网络、笔画密WCCH

5、i=∑W[k+4]∑f(Ii+k,j)f(Ii+k,j+1)2k=-4j=1度、字型特征、四角特征等多种分类器的测试,综合考虑每种3.2平滑去噪处理分类器的并行化可能性、汉字特征针对性等,选出合适的分一幅汉字图像往往会存在许多噪声,对图像中噪声成分类器分别进行粗分类和细识别,以利用FPGA的并行运算特的处理就叫图像平滑化,平滑化的目的共有两个:第一就是性大幅度提高识别的效率和准确度;最后就是对多个手写样按照特定的要求将一幅图像中较为有用的信息凸显出来,从本图像文件进行并行化的采集和预处理,提出具有价值的字而使汉字图

6、像更加地清晰,达到更好地视觉效果;另外一种形特征。采用适当的分类器对其进行分类识别,得到汉字国就是为了更好地适应计算机处理的需要,避免汉字再输入数标码,从而实现手写体汉字从图片到文本的转换。字化的过程中混入噪声。目前较为常用的平滑去噪算法有3手写体汉字的预处理及其原理Unger平滑算法、中值滤波以及邻域平均法等。3.1行、字切分3.3二值化从实际出发,一个完整的脱机手写体汉字识别系统必须二值化也就是将手写汉字图像灰度数字信号处理为只——————————————作者简介:郑少兰,女,福建漳平人,本科,讲师,研究方向:

7、数据库应用和图形图像应用。-44-应用技术与研究学术探讨2015年第5期含1与O两个级灰度的图像。将灰度图像进行二值化处理能如图2所示,我们可以从手写汉字上下左右四个方向的够有效地减小数据存储的容量,这样在后续处理的过程中其八个等距边缘点处对所要识别汉字的一阶和二阶外围特征复杂度就会有所降低。二值化最基本的要求就是字笔划中进行检测,通过四方向法的处理,可以使细化速度更快,加权不可以存在空白,并且原来的文字特征也要得到有完整的保和也就更加容易算出。存。最简单的二值化通过设定固定灰度阈值完成,其关键在于阈值的选择。常用

8、的方法有动态阈值法、整体阈值法以及局部阈值法三种。但是动态阈值与局部阈值比较浪费时间,而且在选择算法的过程中还会在图像整体的选择上产生失真,因此,在对文字进行识别时,通常选用整体阈值的方法。3.4归一化图2一阶、二阶外围特征检测单个汉字图像或者点阵,都要归一化处理,目的是消除汉字在大小与位置上的变化。大小归一化与位置归一化是4手写汉字的特征提取归一化处理的两

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。