特殊印刷体粘连字符切分方法研究

特殊印刷体粘连字符切分方法研究

ID:36798086

大小:1.48 MB

页数:62页

时间:2019-05-15

特殊印刷体粘连字符切分方法研究_第1页
特殊印刷体粘连字符切分方法研究_第2页
特殊印刷体粘连字符切分方法研究_第3页
特殊印刷体粘连字符切分方法研究_第4页
特殊印刷体粘连字符切分方法研究_第5页
资源描述:

《特殊印刷体粘连字符切分方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文摘要中文摘要随着人们对DIA领域的不断探索,印刷体粘连字符切分技术已经逐渐成熟、完善。但是,现有技术绝大部分局限在对Roman字符集的处理,而对其它字符集没有做过多的讨论,这就使得现有技术不能够很好的满足人们对文档自动处理提出的越来越高的要求。同时,现有技术绝大部分针对字符左右粘连这种情况,而对其它粘连情况一般不做详细的分析和处理。其次,在现有技术中由于其处理情况相对单一(横向粘连),从而使得现有系统并没有对粘连情况区分这一问题进行深入的研究、设计。最后,针对文档图像中存在的粘连字符这一问题,人们研究的焦点往往集中在

2、如何将这些粘连在一起的字符分离成单独字符,并没有考虑如何抑止大量粘连字符在同一文档中的出现。针对上述问题,通过对现有切分算法及系统的分析,提出了针对数学公式和Devanagari粘连字符的完整的处理系统模型,从而,首次提出了完整的针对非横向Roman粘连字符的切分的解决方案。在原有切分系统基本模型的基础上,加入了粘连情况判别这一模块,从而完整,清晰对各种粘连情况加以区分。同时,本文引入了傅立叶分析的方法使得对于过窄的横向两两粘连字符与较宽的单个字符区分这一问题得到了较好的解决。对投影,外围轮廓,骨架等特征的提取及其各自特

3、点进行了详细分析探讨,从而将这些特征较好的应用于各种粘连情况。最后,本文首次分析了预处理对于粘连字符切分模块的影响,从而进一步在切分之前加入了文本区域局部二值化模块,使得系统对于严重粘连样张的处理性能有了进一步的提高。关键字粘连字符切分,文档图像处理,数学公式,DevanagariAbstractCharactersegmentationhaslongbeenacriticalareaoftheOCRprocess.Thehigherrecognitionratesforisolatedcharactersvs.thos

4、eobtainedforwordsandconnectedcharacterstringswellillustratethisfact.However,mostofthesegmentationsystemsbuildbythemodemtechnologylimitintheRomancharactersandtheconditionthata11thecharactersareconnectedinonelineisseemasthedefaultcondition.Mostimportantofall,people

5、alwaysfocusonhowtoun-touchtheconnectedcharactersintoisolatedonesbuttheproblemofhowtoavoidthisconditionhasbeenneglectedforalongtime.ThispaperprovidesawholesegmentationsystemmodelforboththeformulacharactersandtheDevanagaricharactersandforthefirsttimeprovidesaneffec

6、tiveschemeforthenon—left—rightconnectedconditioninnon—romancharacters.Basedontheanalysisoftheoriginalsystems,wehaveintroducedanewmodulewhichcanbeusedtodistinguishtheconnectedconditionforfurtherdisposal.TheFouriertransformhasalsobeenappliedtodistinguishthesingle/m

7、ultipleconnectedpattern.Thefeaturesoftheprojection,contouLandtheskeletonanalysishavebeendiscussedindetmlforallkindsoftouchingcondition.Atlast,thestrategyoflocalbinarizationhasbeenintroducedtomakeoursystemmoreeffectiveforthepoorprintedimages.KeywordCharacterSegmen

8、tmion,DIA,MathematicalExpression,DevanagariII目录图目录图1.1粘连情况分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯2图1.2切分系统框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯....2图2.1分类依据⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯5图2.2切分算法分类树⋯⋯

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。