资源描述:
《SVM在小字符集手写体汉字识别中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、http://www.elecfans.com电子发烧友http://bbs.elecfans.com电子技术论坛SVM在小字符集手写体汉字识别中的应用研究朱辉杨扬颉斌封筠(北京科技大学信息工程学院100083)摘要:本文将支持向量机(SVM)引入到小字符集脱机手写体汉字识别中。文章首先介绍了SVM的基本原理和主要算法,然后在实验中采用了LibSVM训练软件,针对银行票据手写汉字的小字符集进行了仿真,同时与欧氏距离分类方法进行了比较。实验结果表明此方法的汉字识别率较高,在小字符集手写体识别中具有较强的实用性。关键词:支持向量机(SVM
2、);LibSVM;脱机手写体汉字识别Small-setOff-lineHandwrittenChineseCharactersRecognitionBasedonSupportVectorMachineZhuHui,YangYang,XieBin,FengJun(InformationEng.School,Univ.ofScienceandTechnologyBeijing100083)Abstract:ThispaperpresentstheapplicationofSVMinsmall-setoff-linehandwritten
3、Chinesecharactersrecognition.ThepaperbeginswithbasicintroductionofSVMtheoriesandalgorithms.ThensoftwareLibSVMispro-posedforhandwrittenChinesecharacterstrainingofbankforms.TheresultsarealsocomparedwithEuclideanDistanceclassifier,whichindicatesthattheSVMstrategycanimprove
4、recognitionrateandthereforehasmorepracticability.Keywords:SupportVectorMachines(SVM);LibSVM;Off-lineHandwrittenChineseCharacterRecognition近年来,脱机手写体汉字识别这一模式识别领域中最棘手的问题,取得了大量的研究成果。但是,非特定人手写汉字识别仍然被认为是文字识别领域最困难的问题之一,其原因可以归结为:汉字规模大;相似汉字较多,且有些相似字差别极其细微;存在大量的不规则书写变形。由于后两个因素的存在
5、,导致相似字在特征空间中的距离变小,使得普通距离分类器的推广能力变弱。因此,如何补偿手写汉字的书写变形,提高分类器的泛化和推广能力,就成为汉字识别研究的关键问题之一。支持向量机(SupportVectorMachines)简称SVM,是AT&TBell实验室的V.Vapnik等人根据统计学习理论提出的一种新的机器学习方法,它已初步表现出很多优于已有方法的分类性能,在解决小样本学习、非线性以及高维模式识别等问题中表现出许多特有的优势。其基本思想可概括为:首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优线性分类面
6、,而这种非线性变换是通过定义适当的内积函数实现的。根据结构风险最小化准则,在使训练样本分类误差极小化的前提下,尽量提高分类器的泛化推广能力。从实施的角度看,训练支持向量机等价于解一个线性约束的二次规划问题,使得分隔特征空间中两类模式点的两个超平面之间距离最大,而且它能保证得到的解为全局最优点,使得基于支持向量机的手写汉字分类[1]器能够吸收手写的变形,从而具有较好的泛化和推广能力。1.支持向量机(SVM)1.1单类问题由于支持向量机(SVM)具有良好的泛化特性,因此可以用来进行向量估计,以包含大多数[2]的相关图像,并使用规则剔除野值
7、。单类问题的命名缘自于在训练集和测试集中只使用正定http://www.elecfans.com电子发烧友http://bbs.elecfans.com电子技术论坛样本。它的思想就是将数据规划到特征空间中,用最小半径的超球面包围最多的训练数据,特点是数据样本非常密集。主要应用于工程诊断的状态监测和医学诊断中判断是否正常等。具体[3]算法详见文献。1.2两类问题SVM方法是从线性可分情况下的最优分类面提出的。首先考虑一个二维两类模式分类问题,nl设模式样本为()x,y,i=Λ,1l,,x∈R,y∈{+,1−1},支持向量机就是要解决下列
8、优化问题:iiil1Tminωω+C∑ξi(1)ω,b,ξ2i=1约束条件:Ty(ωφ()x+b)≥1−ξiiiξ≥0i函数φ把x规划到高维(或是无限维)空间中,SVM就是要解决在高维空间中寻找具有最大分i隔空间的线性分