欢迎来到天天文库
浏览记录
ID:54367454
大小:288.04 KB
页数:7页
时间:2020-04-29
《基于主曲线的脱机手写数字识别.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第9期电子学报Voi.33No.92005年9月ACTAELECTRONICASINICASep.2005基于主曲线的脱机手写数字识别苗夺谦,张红云,李道国,王真(同济大学计算机科学与技术系,上海200092)摘要:该文提出了一种基于主曲线的脱机手写数字识别方法.该方法将主曲线及知识约简算法运用于识别模型中.主曲线是主成份分析的非线性推广,它是通过数据分布“中间”并满足“自相合”的光滑曲线.它较好地反映了数据分布的结构特征.粗糙集理论的知识约简是从决策表中获取决策(分类)规则的有效工具.本文将主曲线用于训练数据的特征提取,根据主曲线的特征生成决策表;利用我们提出的知识约简算
2、法对决策表进行处理,自动获得分类规则.这种方法既符合人的识别习惯,又克服了利用统计特征识别所带来的不足.实验结果表明了该方法能有效提高手写数字的识别率,为脱机手写数字识别的研究提供了一条新途径.关键词:手写数字识别;主曲线;知识约简;分类规则中图分类号:TP391.4文献标识码:A文章编号:0372-2112(2005)09-1639-05Off-lineHandwrittenDigitRecognitionBasedonPrincipalCurvesMIAODuo-gian,ZHANGHong-yun,LIDao-guo,WANGZhen(Departmentofcomp
3、uterScienceandTechnology,TongjiUniuersity,Shanghai200092,China)Abstract:Thepaperproposesamethodofoff-iinehandwrittendigitrecognitionbasedonprincipaicurves.Themethodusesprincipaicurvesandreductionofknowiedgetoextractthestructuraifeaturesofdigitsanddesignaciassifier.Principaicurvesarenon-iin
4、eargeneraiizationsofprincipaicomponentanaiysis.Theyaresmoothseif-consistentcurvesthatpassthroughthe“middie”ofthedistribution.Theypreferabiyrefiectthestructuraifeaturesofthedata.Reductionofknowiedgeistheefficienttooiofobtainingciassifi-cationruiesfromadecisiontabie.Firstiyprincipaicurvesare
5、usedtoextractthestructuraifeaturesoftrainingdata.Secondiythecias-sificationfeaturesarechosenbyanaiyzingthestructuraifeaturesofprincipaicurvesindetaii,thenwesetupthedecisiontabiethatconsistsoftheseciassificationfeatures.Finaiiyweautomaticaiiyattainciassificationruiesbyattributeandattributev
6、aiuereduction.Themethodaccordswiththerecognitionhabitofhumanandovercomesthedisadvantageofstatisticaifeatures.Theexperimentairesuitindi-catesthatthemethodcaneffectiveiyimprovetherecognitionrateofoff-iinehandwrittendigits,andprovidesanewapproachtothere-searchforoff-iinehandwrittendigitrecogn
7、ition.Keywords:handwrittendigitrecognition;principaicurve;reductionofknowiedge;ciassificationruies识别率,但这些方法基本上都是利用数字的统计特征来进行!引言识别,一方面,它们不能很好地分辩出数字结构上的细微差脱机手写数字识别是一个经典问题,并且在银行、税务和异,另一方面,它也不太符合人的思维习惯,因为人在识别数邮政系统等领域有重要的应用和广阔的发展前景.到目前为字时,他首先是根据数字的结构特征而非统计特征来进行识止,人
此文档下载收益归作者所有