关于深度学习在手写汉字识别中的应用综述

关于深度学习在手写汉字识别中的应用综述

ID:22655823

大小:51.50 KB

页数:5页

时间:2018-10-30

关于深度学习在手写汉字识别中的应用综述_第1页
关于深度学习在手写汉字识别中的应用综述_第2页
关于深度学习在手写汉字识别中的应用综述_第3页
关于深度学习在手写汉字识别中的应用综述_第4页
关于深度学习在手写汉字识别中的应用综述_第5页
资源描述:

《关于深度学习在手写汉字识别中的应用综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、关于深度学习在手写汉字识别中的应用综述 由于在拍照文档、支票、表单表格、证件、邮政信封、票据、手稿文书等光学字符识别(Opticalcharacterrecognition,OCR)图像识别系统以及手写文字输入设备中的广泛应用前景,自从上个世纪80年代以来,手写汉字识别(Handinatedfunction,MQDF)、支持向量机(Supportvectormachine,SVM)、隐马尔科夫模型(HiddenMarkovmodel,HMM)、鉴别学习二次判决函数(Discriminativelearningquadrat

2、icdiscriminatefunction,DLQDF)和学习矢量量化(Learningvectorquantity,LVQ)等.对于文本行识别,主要有基于切分策略和无切分策略的两种识别方法,分别利用投影法、连通域分析法等方法对文本行进行字符分割,利用单字分类器对分割好的字符,或利用滑动窗口按一定步长滑窗,利用单字分类器对滑动窗口内的字符进行识别,结合统计语言模型,在Bayes等学习框架下对整个文本行的上下文关系进行建模,从而得出整体行识别结果.经过四十多年来研究学者的不懈努力,HCCR取得了极大进展,例如文献中使用鉴别

3、特征提取方法(Discriminativefeaturelearning,DFE)和鉴别学习二次判决函数(Discriminativelearn-ingquadraticdiscriminantfunction,DLQDF)分类器,在极具挑战的联机和脱机手写汉字数据集CASIA-OLHicrosoftSurfacePro4、iPadPro、三星Note4等为代表的手写笔交互的移动互联X智能设备的迅猛发展,并逐渐在人们日常生活中占据重要地位.随着触屏智能代替传统键盘,笔交互设备的第二次复兴,文字输入从原来纯键盘的拼音或五笔输

4、入方式将逐渐变成虚拟键盘、手写和语音等多种输入结合的方式.艾媒咨询2015年第二季度中国市场调研数据显示:输入方式的使用比例中,手写输入方式占13.1%,仅次于九宫格拼音(占47.2%)和全键盘拼音输入(占24.8%),并远大于语音输入(占5.8%)和五笔输入(3.6%),手写输入用户连续三年呈现平稳增长态势,手写输入作为一个重要的触屏交互应用也逐渐流行并广受重视,每天将产生大量的各种各样手写样本.  因此,中文手写识别技术仍然值得更多的关注和更深入的研究.手写体汉字识别经历了四十多年的长足发展,在单字和文本行识别性能上有

5、了很大的提高,特别是以N为代表的一系列深度学习模型的出现,手写单字符中文识别问题已经基本上得到了很好解决,无论是联机还是脱机手写中文字符识别,目前基于N及其改进模型的方法均取得了接近甚至是超过人眼识别性能的高识别率.然而,在手写汉字识别领域,仍然很多值得研究的问题有待解决,例如:  1)手写文本行识别问题:目前基于深度学习模型的联机及脱机手写文本行识别的成功报道很少,自从ICDAR2013中文手写文本行竞赛以来,近两年在此方向上仍然没有突破性进展,对于联机中文手写文本行识别,目前最好的识别率指标(CR或者AR)均才达到95

6、%左右,而脱机手写文本行识别最好的AR及CR指标仅为90%左右,特别是以整行为单位来评价识别率,行级别的识别率将会很低,仍然有很大的提升空间.可以说联机及脱机手写文本行识别仍然是未解决的难题.一些值得关注的研究方向包括:  a)融合基于切分+基于N的单字识别+路径优化算法,这当中有不少关键技术需要解决,例如如何提升N的置信度的可靠性、能否用N的方法进行字符分割等;b)基于无切分的RNN/LSTM/BLSTM的滑窗式识别方法,此方面对于小类别的拉丁文字已经成为公认的最佳方法,但对于大类别的汉字识别问题是否最优仍然值得商榷及探

7、讨;c)基于N+LSTM的端到端的纯深度学习解决方案.  2)无约束的手写文字识别问题:其中一个值得关注的研究问题是旋转无关的手写识别问题,根据2010年发布的国家标准GB/T18790-2010联机手写汉字识别系统技术要求与测试规程,手写输入软件及设备必须要能识别的手写样本,然而目前市场上的绝大部分主流输入法产品均无法满足此要求.尽管一些研究人员注意到此问题,并开展了不少前期探索工作,但总体而言,此问题仍然远未得到有效解决.相信深度学习新技术的出现,将为解决此问题提供崭新的思路及技术手段.另外,目前的研究工作绝大部分局

8、限于解决简单的问题,例如单字符识别或简单的文本行识别,对于联机手写重叠文本行识别、混合手写单字/文本行/重叠以及来自整屏任意无约束书写的手写汉字识别的研究工作仍然鲜有报道,这是一个值得研究的课题.  3)超大类别手写汉字识别问题:目前手写汉字识别研究报道所能识别的文字类型基本上以国标一级字库3755类汉

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。