手写数字体识别的支持向量机方法.doc

手写数字体识别的支持向量机方法.doc

ID:57991080

大小:263.01 KB

页数:14页

时间:2020-04-05

手写数字体识别的支持向量机方法.doc_第1页
手写数字体识别的支持向量机方法.doc_第2页
手写数字体识别的支持向量机方法.doc_第3页
手写数字体识别的支持向量机方法.doc_第4页
手写数字体识别的支持向量机方法.doc_第5页
资源描述:

《手写数字体识别的支持向量机方法.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于支持向量机的手写数字识别第一章绪论1.1研究背景1.1.1数字识别概述阿拉伯数字是人类文明的标志之一,也是人们进行交流与沟通的主要媒介。数字作为世界经济发展的信息载体,展示了世界各族人民的思维和认知方式。在我们的日常生活中,每天都要进行大量的文档处理工作,税单、银行支票、汇款单、信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为一个迫切需要解决的问题。计算机文字识别,是计算机和人之间进行信息沟通的一座桥梁。计算机文字识别一直是图像识别领域中十分活跃的研究课题。它被认为是典型的图像识别应用研究课题

2、。随着信息时代的到来,如何实习数字识别的自动识别与处理将直接关系到我国信息事业的发展。数字识别是一种类别的识别问题,在理论和技术上都具有较大的研究价值。其中,数字识别特别是手写数字识别因其需要较高的识别精度和较快的识别速度被视为识别领域中“最难的领域”,成为国内外研究的热点。1.1.2数字识别的问题和困难数字的类别只有十种,笔划也比较简单,其识别问题似乎不是很困难,但事实上,一些测试结果表明,数字的正确识别率并不如印刷体汉字识别正确率高,甚至也不如连机手写提汉字识别率高。这其中的主要原因如下:第一,手写数字字形相差不大,比如“1”和“7”,“3”和“8”很相似,使得准确

3、区分某些数字相当困难;第二,在实际应用中,对数字识别单字识别正确率的要求要比文字要苛刻得多。这是因为,数字没有上下文关系,每个单字的识别都事关重要,而且数字识别经常涉及的财会、金融领域其严格性使其准确率要求更高。此外,大批量数据处理对系统速度又有相当的要求,许多理论上很完美但速度过低的方法行不通的。因此研究高性能的数字识别算法是一个有相当的挑战性的任务。-13-第二章数字识别技术2.1数字识别的方法数字识别是图像内容识别的一个应用领域,且有被识别的数较少,只有十个数字,阿拉伯数字笔画少的特点。所以手写阿拉伯数字的识别采用的方法相对于人脸识别、汉字识别等应用领域来说可以采

4、用更为灵活的方法,例如基于神经网络的BP学习算法、SVM方法等。但无论使用那种方法,都需要通过基本的图像处理技术来对图像进行预处理,才能获得这些方法的输入信息。下面我们来介绍这两种方法。2.1.1神经网络的BP学习算法神经网络是模拟人脑内部结构,在模拟推理、自动学习等方面接近人脑的自组织和并行处理的数学模型,包括输入层、隐含层、输出层。其优点之一是,不依赖于对象,通过学习将输入、输出以权值的方式编码,把它们联系起来。神经网络在数据挖掘中的优势是:噪声数据的强承受能力,对数据分类的高准确性,以及可用各种算法进行规则提取。因此,常常借助神经网络来进行数据挖掘。BP学习过程可

5、以描述如下:1)工作信号正向传播。输入信号从输入层经隐单元,传向输出层,在输出端产生输出信号,这是工作信号的正向传播。在信号的向前传递过程中网络的权值是固定不变的,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入误差信号方向传播。2)误差信号方向传播。网络的实际输出与期望输出之间的差值即为误差信号,误差信号由输出端开始逐层向前传播,这是误差信号的反向传播。在误差信号方向传播的过程中,网络的权值由误差反馈进行调节。通过权值的不断修正使网络的实际输出更接近期望输出。-13-工作信号误差信号图为多层感知器的一部分,其中有两种信号:一是用实线表

6、示的工作信号,工作信号正向传播;二是用虚线表示的误差信号,误差信号反向传播。2.1.2SVM算法SVM方法定义最优线性超平面,并把寻找最优线性超平面的算法归结为求解一个凸规划问题。进而基于Mercer核展开定理,通过非线性映射φ,把样本空间映射到一个高维乃至于无穷维的特征空间(Hilbert空间),使在特征空间中可以应用线性学习机的方法解决样本空间中的高度非线性分类和回归等问题。简单地说就是升维和线性化。升维,即是把样本向高维空间做映射,一般只会增加计算的复杂性,甚至会引起“维数灾”,因而人们很少问津。但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本

7、集,在高维特征空间却可以通过一个线性超平面实现线性划分(或回归)。SVM的线性化是在变换后的高维空间中应用解线性问题的方法来进行计算。在高维特征空间中得到的是问题的线性解,但与之相对应的却是原来样本空间中问题的非线性解。一般的升维都会带来计算的复杂化。SVM方法巧妙地解决了这两个难题:由于应用了核函数的展开定理,所以根本不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比不但几乎不增加计算的复杂性,而且在某种程度上避免了“维数灾”。这一切要归功于核的展开和计算理论。因此人们又称SVM方法为基于核的一种

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。