欢迎来到天天文库
浏览记录
ID:37062298
大小:4.63 MB
页数:78页
时间:2019-05-16
《基于递归卷积网络的手写及场景文本识别的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于递归卷积网络的手写及场景文本识别的研究作者姓名孙增辉学科专业通信与信息系统指导教师金连文教授所在学院电子与信息学院论文提交日期2018年4月ConvolutionalRecurrentNetworkforOfflineHandwrittenTextandSceneTextRecognitionADissertationSubmittedfortheDegreeofMasterCandidate:SunZenghuiSupervisor:Prof.JinLianwenSouthChinaUniversity
2、ofTechnologyGuangzhou,China分类号:TP391.4学校代号:10561学号:201520108782华南理工大学硕士学位论文基于递归卷积网络的手写及场景文本识别的研究作者姓名:孙增辉指导教师姓名、职称:金连文教授申请学位级别:工学硕士学科专业名称:通信与信息系统研究方向:计算机视觉与图像处理论文提交日期:2018年4月10日论文答辩日期:2018年5月30日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:郑伟诗教授委员:梁添才教授级高工,孙季丰教授,金连文教授,张鑫副教授摘要
3、文本作为社会信息交流的基本工具,其识别任务一直以来作为学术界的研究难点和热点。本文主要对于手写文本以及自然场景文本的识别任务展开研究,二者都存在着相应的难点需要进一步研究攻克。对于手写文本而言,多变的书写风格以及文本中存在的连笔现象对手写文本识别带来相当的挑战。而自然场景文本识别的难点主要集中在其场景多样性上。自然场景文本会受到自然环境的影响,如光照和拍摄角度变化等;而文本区域背景的高复杂性也对识别任务造成相当的困难。基于手写文本、场景文本识别任务存在的困难,本文需要提出对应的解决方案以更好地进行相应文本的识别。本文的主
4、要研究工作和贡献包括:1.对脱机手写文本以及自然场景文本识别任务目前学术界的常见方法进行介绍,分析了每一个方法的优点以及存在的不足。通过对于前人研究分析,得出了基于全图的识别网络基础框架。2.针对脱机手写文本识别问题,本文在基础网络框架上进行多种改进。针对基础框架只能学习水平方向上下文信息的短板,本文提出了多方向递归网络模块。在网络中加入多方向递归模块进行多方向的上下文信息学习,以增强网络的序列学习能力。针对深度网络存在收敛速度慢、收敛效果不佳的问题,本文在网络中加入了捷径连接机制。捷径连接可在网络中引入多层次特征的融合
5、,同时带来了模型集成的效果,优化网络的识别性能。3.针对场景文本识别问题,本文在识别框架中加入注意力机制网络。文中通过加权坐标映射可视化,分析了基础注意力网络对于非水平文本识别能力的局限性,并随之提出了多行注意力网络模型。而针对多行注意力网络对于文本定位不准的问题,本文提出了局部区域信息的学习算法以帮助网络进一步提取细颗粒特征,从而优化网络的序列识别能力。关键词:序列文本识别;深度卷积神经网络;多方向递归神经网络;注意力机制;局部区域学习IAbstractAsacommonmediaofsocialcommunicati
6、on,textshavealwaysbeenplayinganimportantroleinsocialdevelopment.Andtextrecognitionisstillachallengingproblemthatneedsmoreinvestigation.Inthisthesis,wemainlystudiedthetaskofrecognizinghandwrittenandnaturalscenetexts,bothofwhichhavetheirowndifficultiesinfindingprop
7、ersolutions..Forhandwrittentexts,thechangeablewritingstyleandtheircursivenaturehavecausedconsiderablechallengesforrecognizingthem.Forscenetexts,challengesaremainlyarisenbythediversityofscenesandthenaturalenvironmentsthatmayputeffectsonthetexts.Themainworkandcontr
8、ibutionsofthisthesisinclude:1.Athoroughintroductionofcommonmethodsforoff-linehandwrittenandnaturalscenetextrecognition.Basedontheanalysisofpreviousresearches,o
此文档下载收益归作者所有