基于深度学习的维语语音识别研究

基于深度学习的维语语音识别研究

ID:35067198

大小:6.24 MB

页数:67页

时间:2019-03-17

基于深度学习的维语语音识别研究_第1页
基于深度学习的维语语音识别研究_第2页
基于深度学习的维语语音识别研究_第3页
基于深度学习的维语语音识别研究_第4页
基于深度学习的维语语音识别研究_第5页
资源描述:

《基于深度学习的维语语音识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级;保密期限:告氣乂爹硕±学位论文基于深度学习的维语语音识别研究ResearchonUyghurSpeechRecognitionBasedonDeeLearninpg学号P13201073姓名李鹏飞学位类别工学硕±通信与信息、系统fxIS盖指导教师朱军副教授完成时间2016年5月独创性声巧本人寅明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其

2、他人己经发表或撰写过的巧究成果,化不包含为获得安徽大学或其他教育机构的学位或证书而使用过的材料一。与我同王作的同志对本研究所做的任何贡献均己在论文中作了明确的说明并表示谢意。〇《学位论文作者签名:之/曰:寺巧勝忘签字日期年尽月之7学位论文版权使用授权书本学位论文作者完全了解安徽大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权安徽大学可W将学位论文的全部或部分内容编入有关数据库进行检索,可W采用影印。、缩印或扫描

3、等复制手段保存、汇编学位论文■(保密的学位论文在解密后适用本授权书)j学位论文作者签名控导师签名:签字日期:〇/年5月王日签字曰期:2年5月三曰]三17/(^7:《7^摘要语音识别就是将原始语音信号识别成相对应的文本或者其它形式的可tu被一计算机所处理的信息。语音识别技术是人工智能领域个重要的研究方向,具有很高的研巧价值和商业价值。近年来,随着深度学习在机器学习和模式识别领域""的兴起,W及深度学习所具备的超强建模能化能从海量的数据里学习到有效的信息,迅速吸引了众多国内外

4、研究者的关注。深度学习也被应用到语音识别-DN,基于深度神经网络隐马尔科夫模型(eepeural领规并且取得了很好的效果Nk-HM-etworiddenarkovModeDNNHMMl的语音识别框架更是迅速取代了传,)GausGMM-sianMixtureModel,统基于高斯混合模型(,)隐马尔科夫模型的框架成为当今语音识别系统的标准配置。W往语音识别所关注的语种主要是那些使用人口多或普及率高的语言,比如汉语、英语、阿拉伯语等,研究过程中所开发的技术成果在不经过太大改动的情

5、况下就可,送些语种1^直接被推广到具有相似特点的语种中。经过几十年的发展一的语音识别技术发展己经日趋成熟。然而些像维吾尔语这样的小语种的语音识别技术在国外却没有得到广泛的关注和发展。随着新疆经济的快速发展,新疆也变的越来越开放,关于维吾尔语语音识别系统开发工作的必要性及极其广阔的市场前景是不可忽略的。本文对基于深度学习的网络模型及其建模方法做了详细分。析,并将基于深度学习的语音识别技术用在了维吾尔语的识别上-1DNNHMM的声、研巧了基于学建模AcouAM一声学模型(sticModel,

6、是语音识别系统最重要的组成部分,个好)的声学模型可提高语音识别的系统性能。本文首先介绍了深度神经网络的网络结构W及算法,然后分别用300小时和500小时的维吾尔语语音数据训练基于深度神经网络结合隐马尔科夫模型的声学模型。通过实验发现500小时的训练集训出的声学模型比300小时的训练集训出的声学模型在词识别错误率上相对下降了3.03%,这说明训练集合越大声学模型识别率越高。2-、研究了基于LSTMHMM的声学建模介绍了循环神经网络(RecurrentneuralNetwork,RN

7、N),但由于RNN存在后面时间节点对前面时间节点感知为下降导致的梯度消失问题,因此研究了长短期I^-LonShortTermMemoryLSTM网络-HMM声学记忆。通过实验发现LSTM(g,)模型较DNN-HMM声学模型在词识别错误率上相对下降了4912.%,这说明LSTM-HMM声学模型较DNN-HMM声学模型有很大的性能提升。3、维语语言模型优化由于维吾尔语为黏着性语言,黏着语超大词汇量会带来传统整词语言模型数据稀疏、鲁棒性不强等问题。本文通过子词建模的方法对维语语

8、言模型进行了优化,缓解了黏着语超大词汇量带来的传统整词语言模型数据稀疏性、鲁棒性不强,24%等问题使词识别错误率相对下降了.。关键词:语音识别;深度学习;声学建模:深度神经网络;长短期记忆网络:语言模型IIABSTRACTABSTRACTSpeechrecognitionmformatio打isid

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。