基于深度学习神经网络的孤立词语音识别的研究-论文.pdf

ID：53029542

大小：351.31 KB

页数：4页

时间：2020-04-14

资源描述：

《基于深度学习神经网络的孤立词语音识别的研究-论文.pdf》由会员上传分享，免费在线阅读，更多相关内容在行业资料-天天文库。

1、第32卷第8期计算机应用研究Vo1．32No．82015年8月ApplicationResearchofComputersAug．2015基于深度学习神经网络的孤立词语音识别的研究木王山海，景新幸，杨海燕(桂林电子科技大学信息与通信学院，广西桂林541004)摘要：为了提高语音识别系统性能，研究提出将自编码器深度学习神经网络应用于语音识别中。该网络结构引入贪婪逐层预训练学习算法，通过预训练和微调两个步骤提取出待识别语音信号的本质特征，克服传统多层人工神经网络模型在训练时存在易陷入局部极小值且需要大量标签数据的问题；经过规整网络，将任意长度帧的

2、语音特征参数规整到某一特定帧，输入到分类器中进行语音识别。对反向传播神经网络和自编码神经网络分别进行了仿真实验，结果表明深度学习神经网络识别准确率较传统神经网络有20．0％的提升，是一种优良的语音识别模型。关键词：语音识别；人工神经网络；深度学习；自编码器；规整网络中图分类号：TP391．42文献标志码：A文章编号：1001．3695(2015)08．2289．03doi：10．3969／j．issn．1001．3695．2015．08．0llStudyofisolatedspeechrecognitionbasedondeeplearnin

3、gneuralnetworksWangShanhai，JingXinxing，YangHaiyan(SchoolofInformation&Communication，GuilinUniversityofElectronicTechnology，GuilinGuangxi541004，China)Abstract：Toimprovetheperformanceoftheconventionalspeechrecognitionsystem，thispaperintroducedtheautoencoder．deeplearningneural

4、networkswhichwasappliedtospeechrecognition．Theneuralnetworksbasedondeeplearningintroducedgreedylayer-wiselearningalgorithmbypretrainingandfine—tuning．Itcouldextracttheessentialfeaturesofspeechsignalwhichwasneededtorecognition．Itcouldovercometheshortcomingsoftheconventionalm

5、uhilayerartificialneuralnetworkswhicheasilytrappedintolocaloptimumwhentrainingthemode1．Andtheyneededalargenumberoflabeleddata．Thenthestructuredalignmentnetworkscouldalignarbitrary~amesoffeaturestofixed~ames．Anditinputthesefeaturestoaclassifiertospeechrecognition．Thispaperdi

6、dsomeexperimentwithbackpropagationneuralnetworksandautoencoderneuralnetworksrespectively．Theresultsillustratethatthedeeplearningneuralnetworkscanoutperformtheconventionalneuralnetworksby20．0％inaccuracy．Itisanexcellentspeechrecognitionmode1．Keywords：speechrecognition；artific

7、ialneuralnetworks；deeplearning；autoencoder；alignmentnetworks络的不足。0引言1人工神经网络语音识别是为了让计算机理解人类语言的命令，达到人机交互智能化的目的。随着计算机技术的不断发展和广泛应用，1．1神经网络简介语音识别技术得到了迅速发展，语音识别的研究越来越受到人人工神经网络(ANN)是由大量简单的处理单元——神经们的关注。元按照某种方式连接而成的自适应的非线性系统。这种网络目前常用的识别方法主要有动态时间规整(dynamictime具有与人脑相似的学习记忆、知识概括和信息特征抽取

8、能力。warping，DTW)方法、矢量量化(vectorquantization，VQ)方法和神经元的结构如图1所示。神经网络的输A／输出关系可以用隐马尔可夫模型

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于深度学习神经网络的孤立词语音识别的研究-论文.pdf

基于深度学习神经网络的孤立词语音识别的研究-论文.pdf

相关文章

相关标签