欢迎来到天天文库
浏览记录
ID:35067198
大小:6.24 MB
页数:67页
时间:2019-03-17
《基于深度学习的维语语音识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、密级;保密期限:告氣乂爹硕±学位论文基于深度学习的维语语音识别研究ResearchonUyghurSpeechRecognitionBasedonDeeLearninpg学号P13201073姓名李鹏飞学位类别工学硕±通信与信息、系统fxIS盖指导教师朱军副教授完成时间2016年5月独创性声巧本人寅明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其
2、他人己经发表或撰写过的巧究成果,化不包含为获得安徽大学或其他教育机构的学位或证书而使用过的材料一。与我同王作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。〇《学位论文作者签名:之/曰:寺巧勝忘签字日期年尽月之7学位论文版权使用授权书本学位论文作者完全了解安徽大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权安徽大学可W将学位论文的全部或部分内容编入有关数据库进行检索,可W采用影印。、缩印或扫描
3、等复制手段保存、汇编学位论文■(保密的学位论文在解密后适用本授权书)j学位论文作者签名控导师签名:签字日期:〇/年5月王日签字曰期:2年5月三曰]三17/(^7:《7^摘要语音识别就是将原始语音信号识别成相对应的文本或者其它形式的可tu被一计算机所处理的信息。语音识别技术是人工智能领域个重要的研究方向,具有很高的研巧价值和商业价值。近年来,随着深度学习在机器学习和模式识别领域""的兴起,W及深度学习所具备的超强建模能化能从海量的数据里学习到有效的信息,迅速吸引了众多国内外
4、研究者的关注。深度学习也被应用到语音识别-DN,基于深度神经网络隐马尔科夫模型(eepeural领规并且取得了很好的效果Nk-HM-etworiddenarkovModeDNNHMMl的语音识别框架更是迅速取代了传,)GausGMM-sianMixtureModel,统基于高斯混合模型(,)隐马尔科夫模型的框架成为当今语音识别系统的标准配置。W往语音识别所关注的语种主要是那些使用人口多或普及率高的语言,比如汉语、英语、阿拉伯语等,研究过程中所开发的技术成果在不经过太大改动的情
5、况下就可,送些语种1^直接被推广到具有相似特点的语种中。经过几十年的发展一的语音识别技术发展己经日趋成熟。然而些像维吾尔语这样的小语种的语音识别技术在国外却没有得到广泛的关注和发展。随着新疆经济的快速发展,新疆也变的越来越开放,关于维吾尔语语音识别系统开发工作的必要性及极其广阔的市场前景是不可忽略的。本文对基于深度学习的网络模型及其建模方法做了详细分。析,并将基于深度学习的语音识别技术用在了维吾尔语的识别上-1DNNHMM的声、研巧了基于学建模AcouAM一声学模型(sticModel,
6、是语音识别系统最重要的组成部分,个好)的声学模型可提高语音识别的系统性能。本文首先介绍了深度神经网络的网络结构W及算法,然后分别用300小时和500小时的维吾尔语语音数据训练基于深度神经网络结合隐马尔科夫模型的声学模型。通过实验发现500小时的训练集训出的声学模型比300小时的训练集训出的声学模型在词识别错误率上相对下降了3.03%,这说明训练集合越大声学模型识别率越高。2-、研究了基于LSTMHMM的声学建模介绍了循环神经网络(RecurrentneuralNetwork,RN
7、N),但由于RNN存在后面时间节点对前面时间节点感知为下降导致的梯度消失问题,因此研究了长短期I^-LonShortTermMemoryLSTM网络-HMM声学记忆。通过实验发现LSTM(g,)模型较DNN-HMM声学模型在词识别错误率上相对下降了4912.%,这说明LSTM-HMM声学模型较DNN-HMM声学模型有很大的性能提升。3、维语语言模型优化由于维吾尔语为黏着性语言,黏着语超大词汇量会带来传统整词语言模型数据稀疏、鲁棒性不强等问题。本文通过子词建模的方法对维语语
8、言模型进行了优化,缓解了黏着语超大词汇量带来的传统整词语言模型数据稀疏性、鲁棒性不强,24%等问题使词识别错误率相对下降了.。关键词:语音识别;深度学习;声学建模:深度神经网络;长短期记忆网络:语言模型IIABSTRACTABSTRACTSpeechrecognitionmformatio打isid
此文档下载收益归作者所有