基于AdaBoost的复杂背景下场景文本的检测与识别

基于AdaBoost的复杂背景下场景文本的检测与识别

ID:34917449

大小:2.42 MB

页数:75页

时间:2019-03-14

基于AdaBoost的复杂背景下场景文本的检测与识别_第1页
基于AdaBoost的复杂背景下场景文本的检测与识别_第2页
基于AdaBoost的复杂背景下场景文本的检测与识别_第3页
基于AdaBoost的复杂背景下场景文本的检测与识别_第4页
基于AdaBoost的复杂背景下场景文本的检测与识别_第5页
资源描述:

《基于AdaBoost的复杂背景下场景文本的检测与识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、广东工业大学硕士学位论文(工学硕士)基于AdaBoost的复杂背景下场景文本的检测与识别雷俊杰二○一八年五月分类号:TP311.1学校代号:11845UDC:密级:学号:2111504090广东工业大学硕士学位论文(工学硕士)基于AdaBoost的复杂背景下场景文本的检测与识别雷俊杰校内导师姓名、职称:余荣教授学科(专业)或领域名称:控制科学与工程学生所属学院:自动化学院论文答辩日期:2018年5月ADissertationSubmittedtoGuangdongUniversityofTech

2、nologyfortheDegreeofMaster(MasterofEngineeringScience)DetectionandRecognitionofSceneTextinComplexBackgroundBasedonAdaBoostCandidate:LeiJunjieSupervisor:Prof.YuRongMay2018SchoolofAutomationGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,5

3、10006摘要摘要自然场景图像中的文本信息具有重要的价值,可以应用于图像检索、无人驾驶、视觉辅助等多个方面,是当前计算机视觉领域的热门研究课题。自然场景图像文本提取主要分为字符定位,字符合并,字符识别三个部分,其中字符定位是提取文字的关键步骤,对后面字符识别的准确率有重大的影响。虽然传统的OCR技术已经非常成熟,对文档图像文字的识别准确率达到将近百分之百,但是如果直接应用于自然场景图像的文字识别的话,效果会大打折扣,原因是文档图像一般分辨率高,文字清晰,与背景对比度高,基本不会发生倾斜变形;而自

4、然场景图像中往往包含了大量复杂的背景纹理,并受到光照、字体、拍摄角度的影响,使得文本的定位与识别面临着重重的困难。本文对自然场景文本检测与识别相关技术进行了研究,提出了一种基于最大稳定区域MSER和适应性提升算法AdaBoost的自然场景图像文本候选区域检测与识别算法,主要工作包括如下几个方面:(1)根据自然场景图像的特点,设计了一种能够提高自然场景图像文本获取效率的预处理方法。预处理包括灰度化、平滑和锐化。灰度化可以简化图像,减少算法的计算量,提高算法处理速度;平滑使用了高斯模糊,平滑后可以去

5、除图像的噪声,锐化则使用了拉普拉斯锐化算子,锐化可以加强图像的边缘,突出图像的细节部分。(2)设计了一种基于最大稳定极值区域的自然场景图像文本候选区域提取方法,该方法通过提升二值化阈值的方法找到图像中的极值区域,计算这些极值区域的变化率得到文本候选区域。(3)根据获得的文本候选区域的特征,提出了筛选文本候选的三种方法,分别是启发式规则过滤、笔画宽度过滤和基于AdaBoost的分类模型过滤。启发式规则过滤是根据候选区域面积,占空比特征来设定过滤规则;笔画宽度过滤是提取候选区域中文字的笔画宽度,将不

6、符合笔画宽度大小的区域删除;基于AdaBoost的分类模型首先需要通过梯度直方图和局部二制模式提取候选区域的梯度和纹理特征,输入由决策树构成的弱分类器中学习得到分类模型,将候选区域分成文本区域和非文本I广东工业大学硕士学位论文区域,并采用了ICDAR-2003图像集进行仿真实验,仿真结果表明,对于自然场景图像中的文字能够较准确地定位出来。(4)设计了一种字符合并方式和基于Tessact的字符识别系统。通过数学形态的膨胀方法将图像中相近的字符连接在一起,通过连通域分析将连通的字符合并,调用Tess

7、eract进行字符识别。最后进行了仿真实验,实验结果表明,该系统识别准确率较高,具有一定的理论意义和实用价值。关键词:最大稳定区域区域过滤方向梯度直方图局部二值模式AdaBoostIIAbstractAbstractThetextinformationinthenaturalsceneimageisofgreatvalueandcanbeappliedtomanyaspectssuchasimageretrieval,driverlessness,andvisualaids.Itisahotre

8、searchtopicinthefieldofcomputervision.Theextractionofnaturalsceneimagetextismainlydividedintothreeparts:characterpositioning,charactermerging,andcharacterrecognition.Characterpositioningisthekeystepofextractingtext,whichhasasignificantimpactonthereco

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。