资源描述:
《基于svm的手写体阿拉伯数字识别》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、文章编号:1009-8119(2005)09-0041-03基于SVM的手写体阿拉伯数字识别张鸽陈书开(长沙理工大学计算机与通讯工程学院,长沙410076)摘要支持向量机(SVM)是近年来在统计学习理论的基础上发展起来的一种新的模式识别方法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。介绍了在提取穿越次数特征、粗网格特征以及密度特征提取的基础上应用SVM进行手写体阿拉伯数字识别的方法。关键词SVM,核函数,穿越次数特征,粗网格特征,密度特征HandwritingNumeralsRecognitionbasedonSVMZhang
2、GeChenShukai(DepartmentofComputerandCommunication,ChangshaUnivesityofScienceandTechnology,Changsha410076)AbstractSupprotVectorMachine(SVM)isanewpatternrecognitionmethoddevelopedinrecentyearsonthegoundationofstatisticallearningtheory.Itwinspopulatityduetomanyattractivefeatures
3、andemphaticalperformanceinthefieldsofnonlinearandhighdimensionalpatternrecognition.ThepaperintroducesascriptarabicnumeralsrecognitionmethodappliedSVMbasedondrawingoutTraversing-timescharacterandWide-griddingcharacter.KeywordsSVM,KenerlFunction,Traversing-timescharacter,Wide-g
4、riddingcharacter,densitycharacter1引言手写体阿拉伯数字识别是图象处理和模式识别领域中的研究课题之一。字符识别系统一般由图象采集、信号预处理、特征提取、分类识别等几个部分组成。识别系统的识别方式可分为联机手写体字符识别、脱机印刷体字符识别和脱机手写体字符识别等,其中脱机手写体字符由于书写者的因素,使其字符图像的随意性很大,例如,笔画的粗细、字体的大小、手写体的倾斜度、字符笔画的局部扭曲变形、字体灰度的差异等都直接影响到字符的正确识别。所以手写体数字字符的识别是数字字符识别领域内最具挑战性的课题。近年来,支持向量机(
5、SupportVectorMachines,SVM)的研究在广泛开展。支持向量机是V.Vipnik等根据统计学习理论(StatisticalLearningTheory简称SLT)提出的一种新的机器学习方法,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,已经在模式识别、函数逼近和概率密度估计等方面取得了良好的效果[1]。支持向量机从本质上讲是一种前向神经网络,根据结构风险最小化准则,在使训练样本分类误差极小化的前提下,尽量提高分类器的泛化推广能力。从实施的角度,训练支持向量机的核心思想等价于求解一个线性约束的二次规划问题,从而构造
6、一个超平面作为决策平面,使得特征空间中两类模式之间的距离最大,而且它能保证得到的解为全局最优解。本文即是采用SVM进行0~9的手写体阿拉伯数字的识别。2SVM基本原理2.1线性可分情况SVM方法是从线性可分情况下的最优分类面(OptimalHyperplane)提出的。所谓最优分类面就是要求分类线不但能将两类样本无错误的分开,而且要使两类之间的距离最大。设线性可分样本集为(xi,yi),i=1,2,…,n,x∈Rd,y∈{+1,-1}是类别标号。d维空间中线性判别函数的一般形式为:g(x)=w·x+b,分类面方程为:w·x+b=0(1)将判别函数
7、进行归一化,使两类所有样本都满足
8、g(x)
9、≥1,即,使离分类面最近的样本的
10、g(x)
11、=1,这样分类间隔就等于2/‖w‖,因此间隔最大等价于使‖w‖(或‖w‖2)最小;而要求分类线对所有样本正确分类,就是要求其满足:yi[(w·xi)+b]—1≥0,(i=1,2,…,n)(2)因此,满足上述条件且使‖w‖2最小的分类面就是最优分类面。这两类样本中离分类面最近的点且平行于最优分类面的超平面上的训练样本就是使式(2)中等号成立的那些样本,他们叫做支持向量(SupportVectors)。根据上面的讨论,最优分类面问题可以表示成如下的约束优化问题,即
12、在式(2)的约束下,求函数:φ(w)=‖w‖2=(w·w)(3)的最小值。这是一个二次规划问题,可定义以下的拉格朗日函数:L(w,b,a