基于adaboost的场景文本定位研究

基于adaboost的场景文本定位研究

ID:35055387

大小:3.00 MB

页数:61页

时间:2019-03-17

基于adaboost的场景文本定位研究_第1页
基于adaboost的场景文本定位研究_第2页
基于adaboost的场景文本定位研究_第3页
基于adaboost的场景文本定位研究_第4页
基于adaboost的场景文本定位研究_第5页
资源描述:

《基于adaboost的场景文本定位研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工学硕士学位论文基于Adaboost的场景文本定位研究郑亮哈尔滨理工大学2016年3月国内图书分类号:TP391工学硕士学位论文基于Adaboost的场景文本定位研究硕士研究生:郑亮导师:尹芳申请学位级别:工学硕士学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年3月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP391DissertationfortheMasterDegreeinEngineeringResearchonTextLocationBasedonAdaboos

2、tinNaturalImagesCandidate:ZhengLiangSupervisor:YinFangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerAppliedTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈尔滨理工大学硕±学位论文原创性声明本人郑里卢明:此化所提交的硕1:学位论文《基于Adabo

3、ost的场鼓文本化位研究》,是本人在导师巧导下,在哈尔滨理X大学攻读硕±学位期W独立进巧研究X作所取得的成果。据本人所知,论文中除己注明部分外不包含他人已发表或撰与过的研究成果。对本文硏究.X作做出贡献的个人和集体,均己在文中W明确义式注明。本卢明的法律结果将完全山本人承担。作者签名:曰期/^:〇/)年月/曰1^f哈尔滨理工大学硕±学位论文使用授权书《基于Adaboost的场景文本定位研究》系本人在哈尔滨理工大学攻读硕i学位期问化导师指导下完成的硕±学位论文。本论文的研究成果巧哈尔滨理王

4、人学所有,本论文的研究内容不得其他单位的名义发表。本人完全了解哈尔滨理工火学关于保存、使用学位论文的规定,同意学校保留并向有关部口提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可采用、影印缩印或其他复制手段保存论文,可[^公布论文的全部或部分内容。本学位论文属于保密,巧年解密后适用授权书。[□不保密。[3请在L义上相应方框内打(7)作者签名:曰巧年月円去j与各导师签名:n期:W年?月日哈尔滨理工大学工学硕士学位论文基于Adaboost的场景文本定位研究

5、摘要随着多媒体网络技术的发展,大量场景图片进入了人们的学习、生活和工作当中,场景中的文本信息作为一种重要的语义信息,对场景的理解、分析和检索有着重要的作用。因为自然场景中文本的颜色五颜六色,字体大小不一,这使得场景中的文本定位比起传统文档文本定位更加具有复杂性,因此场景中的文本定位成为了计算机视觉中的重要研究课题。本文在研究和总结近10年国内外文本定位方法的基础之上,对场景文本定位进行了深入研究,提出一种基于Adaboost的场景文本定位方法,主要包含图像的预处理、生成候选文本区域、特征提取和候选文本区域的分类四部分。

6、在预处理阶段,通过实验比较了灰度化处理的三种方法,最大值法、平均值法和加权平均值法,并对实验结果的优缺点进行对比分析,提出了选用加权平均值的方法对图像进行灰度化处理;提出了一种基于改进的Sobel算子边缘检测算法,实验结果表明,本方法不仅能够有效地提取图像的边缘,而且能够很好地解决边缘检漏问题,并且具有一定的抗噪性能。在生成候选文本区域过程中,本文提出了使用文本尺寸特征和边缘密度特征来表征文本字符特征,实验表明,利用这两种特征对连通区域进行分析与筛选,能够大量地排除明显不属于文本区域的连通区域,最终得到候选文本区域。本

7、文提取了4类场景文本特征,分别是Gabor特征、笔画密度、纹理统计特征和图像导数的方差和期望,实验结果表明,这4类文本特征分别构建的分类器对文本区域的分类都有一定的作用。本文通过改进经典的Adaboost算法,提出基于Adaboost的场景文本定位方法,利用分类与回归决策树((CART,ClassificationAndRegressionTree)的Adaboost算法对4类本文提取的文本特征生成的弱分类器进行组合,生成了一个对场景文本区域具有很强分类能力的场景文本分类器,然后利用Adaboost强分类器对候选文本区

8、域进行筛选,最终获得了正确的文本区域。本文建立的数据库包含了300幅自然场景图像,分类器的训练样本为200幅图像,分类器的测试样本为100幅图像。本文所提出的方法对文本进行定位的准确率为82.8%,召回率为85.8%。实验表明,利用同样的测试样本,-I-哈尔滨理工大学工学硕士学位论文本文定位方法优于文献所提供的的方法,不仅对场景文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。