欢迎来到天天文库
浏览记录
ID:35180654
大小:4.12 MB
页数:58页
时间:2019-03-21
《基于深度学习的印刷体数学公式符号识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、巧391&开分类号:密级;瞧—繼码’__3!患保寺夫賓硕壬学位论文基于深度学习的印刷体数学公式符号识别方法研究嚇学号:2013412作者:王琪辉学利?名称计算机软件与理论:2016年2月27日独创性说明本人郑重声明:所呈交的论文是我个人在导师指导下进行的研巧工作及取得的研究成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得沈阳工业大学或其他教育机构的学位或证书所使用过的
2、材料一同。与我工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。签名:义破為^日期:关于学位论文使用授权的说明本学位论文作者和指导教师完全了解沈阳工业大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权沈阳王业大学可将学位论文的全部或部分内容编入有关数据库进行检索、交流,可采用影印、缩印或其他复制手段保存论文和汇编本学位论文。(保密的论文在解密后应遵循此规定)签名:
3、石谈^导师签名占^%句部;嫌嚇日期:卢4沈阳工业大学硕士学位论文基于深度学习的印刷体数学公式符号识别方法研究ResearchonPrintedMathematicalFormulaSymbolsRecognitionMethodBasedonDeepLearning作者:王琪辉单位:信息科学与工程学院指导教师:张胜男副教授单位:沈阳工业大学协助指导教师:单位:单位:论文答辩日期:2016年2月27日学位授予单位:沈阳工业大学摘要印刷体数学公式识别是光学字符识别领域中的一个重要研究课题,目的是将以图像
4、方式输入的印刷体数学公式转化为可编辑的符号,实现公式的重用。由于数学公式结构复杂,数学符号种类繁多且字体多样、大小不一,目前其识别效果并不理想,需要更为有效的识别方法。本文将深度学习中的卷积神经网络理论应用到数学符号识别中,旨在克服传统符号识别方法中手工提取特征的不足,通过构建具有多个隐含层的深度网络模型并使用大量的训练数据来学习得到更有用的特征,进而提升公式符号分类的准确性。本文对数学公式识别的关键技术、研究现状以及卷积神经网络的理论进行了研究,在此基础上建立了面向公式符号识别的卷积神经网络结构,并通过大
5、量的对比实验确定网络的最优参数。该网络由一个输入层、输出层、两个卷积层和采样层交替组成,输入层直接对应经公式定位及分割处理后的公式符号图像,采用5×5大小的卷积核对符号图像进行特征抽取。执行卷积时,将传统的Sigmoid和双曲正切激活函数替换为更接近生物神经的ReLU激活函数,以提高模型训练的收敛速度,并解决梯度消失问题。对提取到的卷积特征图采用2×2的最大池化方式进行采样,从而在降低特征维数、保留特征的同时,减少参数计算量,这种卷积与采样相结合的方式使特征具有一定的旋转不变性。输出层采用Dropout连接
6、方式减轻了网络的过拟合程度并提高泛化能力。此外,针对卷积神经网络训练速度慢的问题,本文采用基于CUDA的GPU编程方法,实现了对训练速度的大幅度提升。为验证所提出算法的有效性,本文应用VS2010设计并实现了一个印刷体数学公式识别系统。以包含公式的文档图像作为系统的输入,经过版面校正处理、公式图像预处理、公式符号识别和公式结构分析,最后将结果输出。通过大量的实验和对比,本文所提出方法的公式符号的平均识别率可以达到99%,高于现有识别方法,可以满足实际应用的需要。关键词:卷积神经网络,数学公式符号识别,深度学
7、习,CUDA,GPUIAbstractTherecognitionofprintedmathematicalformulaisanimportantresearchsubjectinthefieldofopticalcharacterrecognition.Itaimsatturningprintedmathematicalformulawhichisinputbyimageintotheeditablesymbols,andthenrealizesformulareuse.However,becauseo
8、fthecomplexmathematicalformulastructure,manydifferenttypesofmathematicalsymbolsaswellasdiversefontandsize,therecognitioneffectsarenotideal,thereneedstobeamoreeffectiverecognitionmethod.Thispaperwillapplyconve
此文档下载收益归作者所有