资源描述:
《基于改进型CLAFIC学习子空间算法的有限汉字集识别.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第23卷第7期计算机学报VOl.23NO.72000年7月CINESEJ.COMPUTERSJuly2000===================================================================基于改进型CLAFIC学习子空间算法的有限汉字集识别蒋伟峰刘济林刘艺(浙江大学信息与电子工程学系杭州310027)摘要采用改进型CLAFIC(Class-FeaturingInfOrmatiOnCOmpressiOn)算法可以为学习子空间LSM(LearningSubspac
2、eMethOd)算法提供更好的初始向量子空间并通过LSM算法对各类样本子空间按不同的旋转方式训练来提高OCR的识别率.该文的特点在于首先采用了学习子空间算法来实现字符在灰度图像上的识别它克服了传统的基于二值化图像进行特征提取和识别所带来的主要弊病最大限度地保存了字符特征.应用结果也表明,采用改进型CLAFIC的学习子空间算法能在原有较高OCR识别率的基础上得到进一步的提高实用价值很高.关键词改进型CLAFIC算法学习子空间算法灰度图像的OCR识别图像信息特征相似字形的字符识别中图法分类号,TP391Recogni
3、tionofALimitedChineseCharactersetBasedonImprovedCLAFIC-LsMAlgorithmJIANGWei-FengLIUJi-LinLIUYi(Departmentof1nformatzonEle6tronz6sZhejzangUnzUersztyHangzhoU310027)AbstractTheimprOVedClass-FeaturingInfOrmatiOnCOmpressiOn(CLAFIC)algOrithmcanprOVideabetterinitial
4、subspacefOrLearningSubspaceMethOd(LSM).OnthebaseOfthesesub-spacestrainingOfeachsubspaceisrOtatedindifferentWaysbyLSMWhichcOnducestOimprOV-ingrecOgnitiOnrateOfOpticalcharacterrecOgnitiOn(OCR).ThecharacteristicOfthispaperistOrealiZetheOpticalcharacterrecOgnitiO
5、nbyadOptingLSMOncharactergray-scaleleVelandthere-fOreOVercOmesmainshOrtagesOfclassificatiOnOnthebinary-scaleleVelandkeepsintegrityfea-turesOfcharacterinfOrmatiOntOtheextreme.TheresultsshOWthattheeffectOfrecOgnitiOnhasbeenimprOVedbytheCLAFIC-LSMalgOrithmWhichm
6、akesithighlyWOrthapplyingtOOCRfields.KeywordsimprOVedCLAFICalgOrithmLSMrecOgnitiOnOfgray-scaleOpticalCharacterRecOgnitiOnimageinfOrmatiOnfeaturesrecOgnitiOnOfsimilarcharacterOnshape统计模式识别~句法模式识别~直接逻辑法四大类[1]1引言.但随着计算机技术的发展某些理论逐步走向应用如神经网络和模糊识别技术都在模式识别领传统的模式识别技术
7、通常可分为模板匹配法~域取得了令人欣喜的成就.这些算法和理论都经历收稿日期,1999-09-27;修改稿收到日期,2000-03-27.蒋伟峰男1967年生博士研究生主要从事信号处理~模式识别~神经网络等方面的研究.刘济林男1947年生教授博士生导师主要从事图像处理~计算机视觉~并行处理等方面的研究.刘艺女1974年生硕士研究生主要从事信号处理~模式识别等方面的研究.60计算机学报2000年了兴旺*沉寂*发展的过程.基于矩阵变换理论的了数字字符的识别[6].子空间模式识别作为早期的模式识别技术,在最近采用CLAF
8、IC算法进行模式识别时,在特征子几年来,又引起人们的兴趣[,0,]空间的构造上往往仅考虑自身结构的特征,而没有.统计模式识别是利用特征矢量来表示模式,并考虑不同类之间的相关性,一旦设计完成就不能修主要依靠统计手段来实现模式分类的方法,其基础改.这种子空间的构造方法没有学习功能,不能根据是BayeS决策理论.这种方法要获得好的识别率,通训练结果进行调整,这在多模式识别时容易