资源描述:
《基于模式匹配方式的语音识别技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、语音识别基础上海交通大学计算机系吴亚栋E-mail:ydwu@mail.sjtu.edu.cnTel:62932057第四章基于模式匹配方式的语音识别技术第四章基于模式匹配方式的语音识别技术4.1语音短点检测*4.2失真侧度*4.3动态时间规正法*(DTW:DynamicTimeWarping)4.4基于DTW技术的语音识别方案*设待识语音模式为T=accbac,参考模式为R=cbacabc,若a、b、c之间的距离分别为d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=c(c,c)=0时,
2、1)试用DTW法,在点阵图上画出最佳匹配路径,并计算出最佳匹配距离D(T,R);2)根据1)的结果,试用线条画出与之间的对应关系。提交时间:第四章回家作业4.1语音端点检测4.1.1语音端点检测的困难性-语音端点检测:从包含语音的一段信号中确定出该语音的起始点及终止点。-由于背景噪声或人为呼吸等原因产生的杂音,使得语音的端点比较模糊。4.1.2采用能量及过零数参数的检测法*4.2失真侧度4.2.1距离侧度与失真侧度-数学上的距离(1)正值性d(x,y)≥0;当x=y时,有d(x,y)=0;(2)对称性d(x,y)=d(y,x);(3)三角形不等式性d(x,y)=d
3、(x,z)+d(z,y)。-失真侧度(1)正值性D(x,y)≥0;当x=y时,有D(x,y)=0;(2)在频域中应具有物理意义。(3)在实际工程中能有效地计算。4.2.2几种典型的失真侧独*4.3动态时间规正法(DTW)4.3.1语音模式匹配的问题点-匹配时音长不一致问题-线性匹配与非线性匹配*4.3.2DTW的原理*4.3.3DTW的具体解法*4.4基于DTW技术的语音识别方案词汇表:W(n),n=1,2,…,N参考模式:R(k),k=1,2,…,N待识模式:T-利用DTW算法,计算所有Dk(T,R(k))。-对所有Dk(T,R(k))求其最小值,该最小失真度所
4、对应的下标n就为识别结果。n=argmin{Dk}k采用能量及过零数参数的检测法时间ETLETUZTN1N2NBNE过零数Zj能量EjN’1N1-25时间几种典型的失真侧度(1)欧氏距离D(x,y)={∑
5、x–y
6、r}/N,(0≤1≤N-1)-均方误差-绝对值平均误差(2)对数频谱距离V(w)=log(f(ω))-log(g(ω))D(g,f)={∫
7、V(w)
8、rdw}/2π(3)倒谱距离D(x,y)=∑(c–c)2,(1≤n≤p)riicepr-ππ(f)(g)nn不同音长的匹配距离(D39、D2(T,R)非线性匹配D3(T,R)动态时间规正法(DTW)的原理Ck=(ik,jk)C1=(1,1)CK=(I,J)j=i-rj=i+r时间伸缩函数F匹配窗ijt1t2t3titITRr1r2rjrJ(1)时间伸缩函数FF={c1,c2,…,cK}ck=(ik,jk)(2)F的累加距离D(F)D(F)=∑{d(ck)wk}k∑wkkd(ck)=d(ik,jk)(3)最佳匹配失真侧度D(T,R)D(T,R)=min{D(F)}F动态时间规正法(DTW)的具体解法ck=(ik,jk)(ik,jk-1)(ik-1,jk)r4r3r2r1t1t2t3t4t5ming(
10、i-1,j)+d(i,j)g(i-1,j-1)+2d(i,j)g(i,j-1)+d(i,j){(1)约束条件F={c1,c2,…,cK}ck=(ik,jk)(2)D(F)式中分母部独立处理D(F)=∑{d(ck)wk}k∑(I+J)k(3)DTW算法(部分优化法)g(ck)=g(ik,jk)=g(i,j)=D(T,R)=g(I,J)/(I+J)动态时间规正法(DTW)的计算实例ck=(ik,jk)(ik,jk-1)(ik-1,jk)min2175151647245243348221511920232617221622161815191211151679171345
11、1011FEDCBA1234RTg(i-1,j)+d(i,j)g(i-1,j-1)+2d(i,j)g(i,j-1)+d(i,j){DTW算法(部分优化法)g(ck)=g(ik,jk)=g(i,j)=D(T,R)=g(I,J)/(I+J)