欢迎来到天天文库
浏览记录
ID:36798086
大小:1.48 MB
页数:62页
时间:2019-05-15
《特殊印刷体粘连字符切分方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中文摘要中文摘要随着人们对DIA领域的不断探索,印刷体粘连字符切分技术已经逐渐成熟、完善。但是,现有技术绝大部分局限在对Roman字符集的处理,而对其它字符集没有做过多的讨论,这就使得现有技术不能够很好的满足人们对文档自动处理提出的越来越高的要求。同时,现有技术绝大部分针对字符左右粘连这种情况,而对其它粘连情况一般不做详细的分析和处理。其次,在现有技术中由于其处理情况相对单一(横向粘连),从而使得现有系统并没有对粘连情况区分这一问题进行深入的研究、设计。最后,针对文档图像中存在的粘连字符这一问题,人们研究的焦点往往集中在
2、如何将这些粘连在一起的字符分离成单独字符,并没有考虑如何抑止大量粘连字符在同一文档中的出现。针对上述问题,通过对现有切分算法及系统的分析,提出了针对数学公式和Devanagari粘连字符的完整的处理系统模型,从而,首次提出了完整的针对非横向Roman粘连字符的切分的解决方案。在原有切分系统基本模型的基础上,加入了粘连情况判别这一模块,从而完整,清晰对各种粘连情况加以区分。同时,本文引入了傅立叶分析的方法使得对于过窄的横向两两粘连字符与较宽的单个字符区分这一问题得到了较好的解决。对投影,外围轮廓,骨架等特征的提取及其各自特
3、点进行了详细分析探讨,从而将这些特征较好的应用于各种粘连情况。最后,本文首次分析了预处理对于粘连字符切分模块的影响,从而进一步在切分之前加入了文本区域局部二值化模块,使得系统对于严重粘连样张的处理性能有了进一步的提高。关键字粘连字符切分,文档图像处理,数学公式,DevanagariAbstractCharactersegmentationhaslongbeenacriticalareaoftheOCRprocess.Thehigherrecognitionratesforisolatedcharactersvs.thos
4、eobtainedforwordsandconnectedcharacterstringswellillustratethisfact.However,mostofthesegmentationsystemsbuildbythemodemtechnologylimitintheRomancharactersandtheconditionthata11thecharactersareconnectedinonelineisseemasthedefaultcondition.Mostimportantofall,people
5、alwaysfocusonhowtoun-touchtheconnectedcharactersintoisolatedonesbuttheproblemofhowtoavoidthisconditionhasbeenneglectedforalongtime.ThispaperprovidesawholesegmentationsystemmodelforboththeformulacharactersandtheDevanagaricharactersandforthefirsttimeprovidesaneffec
6、tiveschemeforthenon—left—rightconnectedconditioninnon—romancharacters.Basedontheanalysisoftheoriginalsystems,wehaveintroducedanewmodulewhichcanbeusedtodistinguishtheconnectedconditionforfurtherdisposal.TheFouriertransformhasalsobeenappliedtodistinguishthesingle/m
7、ultipleconnectedpattern.Thefeaturesoftheprojection,contouLandtheskeletonanalysishavebeendiscussedindetmlforallkindsoftouchingcondition.Atlast,thestrategyoflocalbinarizationhasbeenintroducedtomakeoursystemmoreeffectiveforthepoorprintedimages.KeywordCharacterSegmen
8、tmion,DIA,MathematicalExpression,DevanagariII目录图目录图1.1粘连情况分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2图1.2切分系统框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....2图2.1分类依据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯5图2.2切分算法分类树⋯⋯
此文档下载收益归作者所有