资源描述:
《一种改进的bp神经网络模型及其在语音识别中的应用_王爱国》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1996年第4期1996(总第80期)STUDYONOPTICALCOMMUNICATIONS(Sum.No.80)一种改进的BP神经网络模型及其在语音识别中的应用王爱国肖定中(邮电部武汉邮电科学研究院)摘要提出了一种改进的BP神经网络模型,即多层双并联神经元可学习的人工神经网络,给出了相应的算法。并以异或问题和对称性检测问题为例,对改进算法和传统算法的优缺点进行了比较;对改进的BP网络在孤立单字语音识别应用作了初步探讨。关键词BP神经网络语音识别神经元AnImprovedBPneuralnetwork
2、andItsApplicationinSpeechRecognitionWangAiguoXiaoDingzhongAbstracAnimprovedBPneuralnetwork,thatismutilayerdouble-linkartificialneuralnetworkwhosenodeshavetheabilitiesofstudy,isproposed,andacorre-spondentalgorithmisgiven.ForexamplesofXORproblemandsymmetry
3、test,afunctionalcomparisonismadebetweentheimprovedalgorithmandtheconventionalalgorithm.Aprimitivetestofisolatedwordspeechrecognitionbasedontheim-provedBPneuralnetworkismadeinthispaper.KeywordsBPneuralnetwork,speechrecognition,neuralunit1网络模型数学描述人工神经网络在语音
4、识别的分类、聚类、音素识别中取得了令人欣喜的结果。将人工神经网络应用于语音识别的研究是目前语音识别技术研究的热点。BP网络是实际应用中用得较多的人工神经网络,但传统的BP网络收敛速度很慢,有时甚至根本不能收敛。文中提出一种改进的BP网络即多层双并联神经元可学习的人工神经网络,并给出了相应的算法。本文提出的网络结构模型如图1(a)所示,图1(a)中可学习的神经元的结构模型如图1(b)所示。该多层神经网络为m层网络。为了描述方便,指定:(1)m:处理层代号,且m=0,1,2,⋯,M-1;m=0对应网络的输入
5、层,m=M-1对应网络的输出层,1≤m≤M-2对应网络的隐层。(m)(2)N:第m层所有的神经元的数目(m=0,1,2,⋯,M-1)。(m)(3)Z:第m层第i个处理元件的输出。收稿日期:1996-05-2115光通信研究光通信研究1996年第4期总第80期图1BP网络结构和神经元结构示意图(m)(4)netZi:第m层第i个处理元件的输入。(m)(5)Wij(m)令netZN(m)=-1(m=0,1,2,A,M-2),则有:(m)(m)(m+1)(a)Wij(m∈[0,M-2],i∈[0,N],j∈[
6、0,N-1])(m)当i∈[0,N-1]时,代表第m层第i个处理元件和第m+1层第j个处理元件之间的连接权值。(m)当i=N,m7、0):网络第m层第i个神经元的非线性转移函数。设有P个训练样本{X1,X2,⋯XP},其相应的导师信号即这P个样本对应的理想输出{D1,D2,⋯DP};相应的网络的实际输出为{Y1,Y2⋯YP}。其中XP(p∈[1,P])各自对应一个(0)(0)N维输入特征矢量,该矢量各元素为Xpi(i[0,N-1]);DP(p∈[1,P])各自对应一个(M-1)(M-1)N维理想输出矢量,该矢量各元素为dpk(k∈[0,N-1]);YP(p∈[1,P])各自对(M-1)应一个M维实际输出矢量,该矢量各元素为Ypk(k
8、∈[0,N-1])。定义系统的误差函数:PPN(M-1)-112E=∑Ep(W,F,Dp,Xp)=2∑∑(dpk-Ypk)(1)p=1p=1k=0网络训练的目的就是通过调整网络参数使得网络实际输出{Y1,Y2⋯YP}与理想输出{D1,D2,⋯DP}的误差小于控制误差从而逼近输入到输出的理想映射。假定网络的输入层采用线性神经元,则网络各层的输入输出关系可用以下方程来描述:(m)ZN(m)=-1(m∈[0,M-2])(2)(0)(0)netZi