基于多特征的文本定位方法研究

基于多特征的文本定位方法研究

ID:38959587

大小:2.84 MB

页数:32页

时间:2019-06-22

基于多特征的文本定位方法研究_第1页
基于多特征的文本定位方法研究_第2页
基于多特征的文本定位方法研究_第3页
基于多特征的文本定位方法研究_第4页
基于多特征的文本定位方法研究_第5页
资源描述:

《基于多特征的文本定位方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学号2011301760037密级武汉大学本科毕业论文基于多特征的文本定位方法研究院(系)名称:印刷与包装系专业名称:印刷工程学生姓名:张宇指导教师:易尧华教授二○一五年六月郑重声明本人呈交的学位论文,是在导师的指导下,独立进行研究工作所取得的成果,所有数据、图片资料真实可靠。尽我所知,除文中已经注明引用的内容外,本学位论文的研究成果不包含他人享有著作权的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确的方式标明。本学位论文的知识产权归属于培养单位。本人签名:日期:摘  要图像文本定位是基于内容的图像分析

2、任务的重要前提,是文本识别的基础。实现自然场景图像中文本的准确定位,有着非常重要的实际意义和应用前景,同时由于自然场景文本的背景往往比较复杂,这给检测与定位带来诸多困难,目前已成为数字图像处理、计算机视觉领域的研究热点。本文根据场景文本颜色一致、字符大小一致,以及笔画宽度稳定的特征,基于最大稳定极值区域MSER理论以及支持向量机SVM方法,提出了一种基于多特征的自然场景文本定位方法。该方法首先提取图像中的最大稳定极值区域,而后沿着边缘梯度方向增长得到的裁剪蒙版,并对MSER区域进行裁剪;然后针对裁剪后图像进行连通域分析,再用先验

3、性知识规则对连通域进行筛选与合并,得到候选文本区域;最后利用多特征融合方法训练支持向量机SVM分类器,并使用SVM分类器再对候选文本区域进行分类,从而得到最终的定位文本区域。本文算法使用ICDAR2011自然场景文本数据集进行测试,测试结果为召回率50.79%,准确率68.49%,综合指标f为58.33%。试验表明,本文提出的文本定位方法可以较准确地定位出场景图像中的文本区域,具有一定的实用参考价值。关键词:文本定位;最大稳定极值区域(MSER);支持向量机(SVM);连通域分析ABSTRACTLocatingtextinima

4、gesisanimportantprerequisiteformanycontent-basedimageanalysistasksandthefoundationoftextrecognition.Achievingaccuratelocatingoftextinnaturalsceneimageshasveryimportantpracticalsignificanceandapplicationprospect,meanwhile,it’salsoadifficulttask.Therefore,textlocatingi

5、sahottopicinthefieldofdigitalimageprocessingandcomputervision.Sincethecolorandcharactersizeoftextregionsinsceneimagesareconsistent,andthestrokewidthofcharactersissteady,amulti-featurebasedscene-textlocatingmethodwhichutilizedMaximallyStableExtremalRegions(MSER)andSup

6、portingVectorMachine(SVM)wasproposedinthispaper.Firstly,extractingMSERregionsinimages,thenpruningtheMSERswithedgemaskwhichwasshapedbygrowingtheedgesoutwardwithgradientsaroundedgelocations.Secondly,filteringtheregionsusingconnectedcomponentanalysisandpriorknowledgecri

7、terion.Then,grouptheregionsintotextcandidateshorizontally.Finally,Textcandidatesandnon-textcandidatesareidentifiedwithaSVMclassifierwhichwastrainedbystudyingmulti-featureoftrainingsamples,thereforethetextregionsarelocated.TheproposedmethodwasevaluatedontheICDAR2011sc

8、eneimagesdataset;therecallratiois50.79%,meanwhiletheprecisionratio68.49%,andthef-measure58.33%.Experimentsdemonstratetheaccuracyand

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。