基于深度学习的印刷体数学公式符号识别方法研究

基于深度学习的印刷体数学公式符号识别方法研究

ID:35180654

大小:4.12 MB

页数:58页

时间:2019-03-21

基于深度学习的印刷体数学公式符号识别方法研究_第1页
基于深度学习的印刷体数学公式符号识别方法研究_第2页
基于深度学习的印刷体数学公式符号识别方法研究_第3页
基于深度学习的印刷体数学公式符号识别方法研究_第4页
基于深度学习的印刷体数学公式符号识别方法研究_第5页
资源描述:

《基于深度学习的印刷体数学公式符号识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、巧391&开分类号:密级;瞧—繼码’__3!患保寺夫賓硕壬学位论文基于深度学习的印刷体数学公式符号识别方法研究嚇学号:2013412作者:王琪辉学利?名称计算机软件与理论:2016年2月27日独创性说明本人郑重声明:所呈交的论文是我个人在导师指导下进行的研巧工作及取得的研究成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得沈阳工业大学或其他教育机构的学位或证书所使用过的

2、材料一同。与我工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。签名:义破為^日期:关于学位论文使用授权的说明本学位论文作者和指导教师完全了解沈阳工业大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅;本人授权沈阳王业大学可将学位论文的全部或部分内容编入有关数据库进行检索、交流,可采用影印、缩印或其他复制手段保存论文和汇编本学位论文。(保密的论文在解密后应遵循此规定)签名:

3、石谈^导师签名占^%句部;嫌嚇日期:卢4沈阳工业大学硕士学位论文基于深度学习的印刷体数学公式符号识别方法研究ResearchonPrintedMathematicalFormulaSymbolsRecognitionMethodBasedonDeepLearning作者:王琪辉单位:信息科学与工程学院指导教师:张胜男副教授单位:沈阳工业大学协助指导教师:单位:单位:论文答辩日期:2016年2月27日学位授予单位:沈阳工业大学摘要印刷体数学公式识别是光学字符识别领域中的一个重要研究课题,目的是将以图像

4、方式输入的印刷体数学公式转化为可编辑的符号,实现公式的重用。由于数学公式结构复杂,数学符号种类繁多且字体多样、大小不一,目前其识别效果并不理想,需要更为有效的识别方法。本文将深度学习中的卷积神经网络理论应用到数学符号识别中,旨在克服传统符号识别方法中手工提取特征的不足,通过构建具有多个隐含层的深度网络模型并使用大量的训练数据来学习得到更有用的特征,进而提升公式符号分类的准确性。本文对数学公式识别的关键技术、研究现状以及卷积神经网络的理论进行了研究,在此基础上建立了面向公式符号识别的卷积神经网络结构,并通过大

5、量的对比实验确定网络的最优参数。该网络由一个输入层、输出层、两个卷积层和采样层交替组成,输入层直接对应经公式定位及分割处理后的公式符号图像,采用5×5大小的卷积核对符号图像进行特征抽取。执行卷积时,将传统的Sigmoid和双曲正切激活函数替换为更接近生物神经的ReLU激活函数,以提高模型训练的收敛速度,并解决梯度消失问题。对提取到的卷积特征图采用2×2的最大池化方式进行采样,从而在降低特征维数、保留特征的同时,减少参数计算量,这种卷积与采样相结合的方式使特征具有一定的旋转不变性。输出层采用Dropout连接

6、方式减轻了网络的过拟合程度并提高泛化能力。此外,针对卷积神经网络训练速度慢的问题,本文采用基于CUDA的GPU编程方法,实现了对训练速度的大幅度提升。为验证所提出算法的有效性,本文应用VS2010设计并实现了一个印刷体数学公式识别系统。以包含公式的文档图像作为系统的输入,经过版面校正处理、公式图像预处理、公式符号识别和公式结构分析,最后将结果输出。通过大量的实验和对比,本文所提出方法的公式符号的平均识别率可以达到99%,高于现有识别方法,可以满足实际应用的需要。关键词:卷积神经网络,数学公式符号识别,深度学

7、习,CUDA,GPUIAbstractTherecognitionofprintedmathematicalformulaisanimportantresearchsubjectinthefieldofopticalcharacterrecognition.Itaimsatturningprintedmathematicalformulawhichisinputbyimageintotheeditablesymbols,andthenrealizesformulareuse.However,becauseo

8、fthecomplexmathematicalformulastructure,manydifferenttypesofmathematicalsymbolsaswellasdiversefontandsize,therecognitioneffectsarenotideal,thereneedstobeamoreeffectiverecognitionmethod.Thispaperwillapplyconve

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。