欢迎来到天天文库
浏览记录
ID:50145690
大小:6.25 MB
页数:67页
时间:2020-03-06
《脱机—联机样本骨架化联合训练的DBLSTM手写英文识别.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕硕硕士士士学学学位位位论论论文文文脱机-联机样本骨架化联合训练的DBLSTM手写英文识别OFFLINE-ONLINESKELETONSAMPLESCO-TRAININGBASEDDBLSTMHANDWRITTENENGLISHRECOGNITION张张张雄雄雄哈哈哈尔尔尔滨滨滨工工工业业业大大大学学学2015年年年6月月月国内图书分类号:TP39学校代码:10213国际图书分类号:681.3密级:公开工工工学学学硕硕硕士士士学学学位位位论论论文文文脱机-联机样本骨架化联合训练的DBLSTM手写英文识别硕士研究生:张雄导师:李海峰教授申请学位:工学硕士学科:计算机科学与技术
2、所在单位:计算机学院答辩日期:2015年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP39U.D.C:681.3DissertationfortheMaster’sDegreeinEngineeringOFFLINE-ONLINESKELETONSAMPLESCO-TRAININGBASEDDBLSTMHANDWRITTENENGLISHRECOGNITIONCandidate:ZhangXiongSupervisor:Prof.LiHaifengAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:
3、ComputerApplicationAliation:SchoolofComputerScienceandEngineeringDateofDefence:June,2015Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论文摘要手写英文识别因其实用背景和较高的难度吸引了大批研究者的兴趣,而近年来无切分方法和深度学习方法的兴起也为这一领域注入了新的活力。传统上手写英文识别因为原始数据形式的不同分为脱机手写识别和联机手写识别两种,因而一般会对其分别建立识别系统。本文将无切分方法和深
4、度学习框架基础上,对脱机-联机手写英文识别的联合训练方法进行研究。我们在得到图像对比度归一化及手写文字歪斜矫正的文字行图像基础上,首先构建了基于DBLSTM-HMM框架的手写识别系统,其基本思想为:首先训练GMM-HMM模型以实现自动切分,在强制对齐算法下得到每一帧特征向量和HMM状态之间的一一对应关系,并利用这种对应关系来训练DBLSTM循环神经网络,使其能够对新的数据结合其上下文信息进行分类。识别时将HMM转移概率,DBLSTM网络对每个HMM状态预测的后验概率,词表限制及语言模型概率结合起来,在Viterbi解码算法下寻找最优路径。本文在IAM脱机手写英文数据集上对此
5、系统进行了验证,并优化了DBLSTM网络结构。为了进行脱机和联机手写样本的联合训练,本文中将联机手写样本绘制为了静态手写图像,并使用骨架化方法将脱机样本和联机样本都转化为笔划为1像素宽的手写骨架图像以模糊两者的界限。之后使用融合样本进行DBLSTM-HMM系统的训练。融合样本的使用能够极大地扩充训练样本的数据量,提升识别系统的鲁棒性。在IAM脱机-联机手写数据集和微软INK联机手写数据集上的实验表明,使用融合样本训练得到的系统相较于使用单一样本能够在脱机和联机两种类型的测试集上均得到更好的识别准确率。本文在DBLSTM-HMM混合识别框架下,创新地使用骨架化方法将脱机和联机
6、手写英文样本进行融合以进行联合训练。实验结果证实了这种训练方法的显著效果。关键词:手写英文识别;DBLSTM识别系统;骨架化脱机-联机手写样本联合训练-I-哈尔滨工业大学工学硕士学位论文AbstractHandwrittenEnglishrecognitiondrawsinterestsofresearchersduetoitspracticalpotentialsandresearchhardness.Recentlythedeep-learningandun-segmentationbasedmethodsgivenewlifetothisfiled.Convention
7、allyhandwrittenEnglishrecognitionisdividedintooinerecognitionandonlinerecognition.Separaterecognitionsystemsarebuilttotodealwithdierentkindofdata.Inthisthesiswewillinvestigatetheco-trainingmethodsofoineandonlinehandwrittensamples,byusingtheun-segmentationmet
此文档下载收益归作者所有