基于复合双向循环网络特定工况的语音识别研究

基于复合双向循环网络特定工况的语音识别研究

ID:37068844

大小:2.96 MB

页数:77页

时间:2019-05-16

基于复合双向循环网络特定工况的语音识别研究_第1页
基于复合双向循环网络特定工况的语音识别研究_第2页
基于复合双向循环网络特定工况的语音识别研究_第3页
基于复合双向循环网络特定工况的语音识别研究_第4页
基于复合双向循环网络特定工况的语音识别研究_第5页
资源描述:

《基于复合双向循环网络特定工况的语音识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要随着计算机技术的高速发展,基于神经网络语音识别系统广泛运用于各个领域。对于语音这一类时序的序列,循环神经网络(RNN)具有得天独厚的优势。LSTM(长短期记忆网络)利用不同的门模块控制信息的流入与流出,解决了RNN在训练时梯度爆炸和消失的问题。深层、双向及复合的模型结构在在当今GPU计算能力暴涨的时代,充分发挥出其对时序类强烈依赖前后信息的序列的非线性模拟能力。本文提出一种基于双向LSTM网络的复合结构,并与成熟的语音识别系统作对比,得出在识别效果上的提升;同时提出一种适合这样的复合结构网络的目标函数构造方法,最后

2、通过与成熟的目标函数作对比,验证了其识别效果的提升。具有两个子网络的复合的结构用于解决单纯对语音输入的非线性变换后与目标输出的耦合问题。在提出了复合结构后,尝试提出了一种对目标输出中插入分割符的方法。在训练时,只需找到所有分割的方式,并使这些方式发生的概率最大,进而不必将每帧都和相应的目标对应,大简化了运算。在进行理论推理的过程中,定义了前端变量和后端变量用于表示这样的分割思想,最后推导出目标函数,并完成相应梯度公式的导出。本文的特定工况环境是指在工厂的生产环境。主要任务是在特定工况条件下完成语音识别。对工厂环境噪声分析,

3、提取噪声音素,利用混音软件混入将提取的音素混入训练和测试资料中;在训练阶段,利用已加噪声的训练资料和测试资料进行训练,但目标输出序列则是纯净的音素序列,从而模拟在工厂环境下的语音识别任务。最后,利用Tensorflow深度学习模块及librosa语音模块完成相应程序的编写。由于用于比较的目标函数均以TIMIT语料库作为训练和测试的语料库。所以使用TIMIT进行训练和测试。最终测试结果验证了提出的目标函数识别效果有明显的提升。关键词:循环网络;语音识别;模型结构;目标函数IAbstractABSTRACTWiththerap

4、iddevelopmentofcomputertechnology,speechrecognitionsystemsbasedonneuralnetworksarewidelyusedinvariousfields.Forthetimesequenceofspeech,therecurrentnetworkhasauniqueadvantage.InaLSTM,differentdoormodulesareusedtocontroltheinflowandoutflowofinformation,whichsolvesth

5、eproblemofgradientexplosionanddisappearanceduringtraining.Thedeep,bi-directional,andcompoundmodelstructures,intheeraoftoday'sGPUcomputingcapabilities,havebeenprovedtobringthestate-of-the-artperformanceonnon-linearsimulationcapabilitiesthatrelyheavilyonsequencesoft

6、iminginformation.Inthispaper,acompositestructurebasedonabidirectionalLSTMnetworkisproposedandcomparedwithmaturespeechrecognitionsystemstoshowtherecognitioneffect.Atthesametime,anobjectivefunctionconstructionmethodsuitableforsuchacompositestructurenetworkisreducted

7、.Theobjectivefunctionisthencomparedtoverifytheimprovementofitsrecognitioneffect.Inthispaper,firstly,popularneuralnetwork-basedspeechrecognitionsystemsisintroducedbyintroducingthetraditionalspeechrecognitionsystem.Afteranalyzingandcomparingtheeffectsofthreekindsofs

8、peechrecognitionsystems,acompositestructurebasedonLSTMnetworkwithtwosub-networkswasproposedtosolvetheproblemsofthecouplingbetweenthesimplenonlinearinput

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。