欢迎来到天天文库
浏览记录
ID:53029542
大小:351.31 KB
页数:4页
时间:2020-04-14
《基于深度学习神经网络的孤立词语音识别的研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第32卷第8期计算机应用研究Vo1.32No.82015年8月ApplicationResearchofComputersAug.2015基于深度学习神经网络的孤立词语音识别的研究木王山海,景新幸,杨海燕(桂林电子科技大学信息与通信学院,广西桂林541004)摘要:为了提高语音识别系统性能,研究提出将自编码器深度学习神经网络应用于语音识别中。该网络结构引入贪婪逐层预训练学习算法,通过预训练和微调两个步骤提取出待识别语音信号的本质特征,克服传统多层人工神经网络模型在训练时存在易陷入局部极小值且需要大量标签数据的问题;经过规整网络,将任意长度帧的
2、语音特征参数规整到某一特定帧,输入到分类器中进行语音识别。对反向传播神经网络和自编码神经网络分别进行了仿真实验,结果表明深度学习神经网络识别准确率较传统神经网络有20.0%的提升,是一种优良的语音识别模型。关键词:语音识别;人工神经网络;深度学习;自编码器;规整网络中图分类号:TP391.42文献标志码:A文章编号:1001.3695(2015)08.2289.03doi:10.3969/j.issn.1001.3695.2015.08.0llStudyofisolatedspeechrecognitionbasedondeeplearnin
3、gneuralnetworksWangShanhai,JingXinxing,YangHaiyan(SchoolofInformation&Communication,GuilinUniversityofElectronicTechnology,GuilinGuangxi541004,China)Abstract:Toimprovetheperformanceoftheconventionalspeechrecognitionsystem,thispaperintroducedtheautoencoder.deeplearningneural
4、networkswhichwasappliedtospeechrecognition.Theneuralnetworksbasedondeeplearningintroducedgreedylayer-wiselearningalgorithmbypretrainingandfine—tuning.Itcouldextracttheessentialfeaturesofspeechsignalwhichwasneededtorecognition.Itcouldovercometheshortcomingsoftheconventionalm
5、uhilayerartificialneuralnetworkswhicheasilytrappedintolocaloptimumwhentrainingthemode1.Andtheyneededalargenumberoflabeleddata.Thenthestructuredalignmentnetworkscouldalignarbitrary~amesoffeaturestofixed~ames.Anditinputthesefeaturestoaclassifiertospeechrecognition.Thispaperdi
6、dsomeexperimentwithbackpropagationneuralnetworksandautoencoderneuralnetworksrespectively.Theresultsillustratethatthedeeplearningneuralnetworkscanoutperformtheconventionalneuralnetworksby20.0%inaccuracy.Itisanexcellentspeechrecognitionmode1.Keywords:speechrecognition;artific
7、ialneuralnetworks;deeplearning;autoencoder;alignmentnetworks络的不足。0引言1人工神经网络语音识别是为了让计算机理解人类语言的命令,达到人机交互智能化的目的。随着计算机技术的不断发展和广泛应用,1.1神经网络简介语音识别技术得到了迅速发展,语音识别的研究越来越受到人人工神经网络(ANN)是由大量简单的处理单元——神经们的关注。元按照某种方式连接而成的自适应的非线性系统。这种网络目前常用的识别方法主要有动态时间规整(dynamictime具有与人脑相似的学习记忆、知识概括和信息特征抽取
8、能力。warping,DTW)方法、矢量量化(vectorquantization,VQ)方法和神经元的结构如图1所示。神经网络的输A/输出关系可以用隐马尔可夫模型
此文档下载收益归作者所有