基于模式匹配方式的语音识别技术

基于模式匹配方式的语音识别技术

ID:39306271

大小:367.81 KB

页数:13页

时间:2019-06-30

基于模式匹配方式的语音识别技术_第1页
基于模式匹配方式的语音识别技术_第2页
基于模式匹配方式的语音识别技术_第3页
基于模式匹配方式的语音识别技术_第4页
基于模式匹配方式的语音识别技术_第5页
资源描述:

《基于模式匹配方式的语音识别技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、语音识别基础上海交通大学计算机系吴亚栋E-mail:ydwu@mail.sjtu.edu.cnTel:62932057第四章基于模式匹配方式的语音识别技术第四章基于模式匹配方式的 语音识别技术4.1语音短点检测*4.2失真侧度*4.3动态时间规正法*(DTW:DynamicTimeWarping)4.4基于DTW技术的语音识别方案*设待识语音模式为T=accbac,参考模式为R=cbacabc,若a、b、c之间的距离分别为d(a,b)=d(b,a)=2、d(a,c)=d(c,a)=3、d(b,c)=d(c,b)=1、d(a,a)=d(b,b)=c(c,c)=0时,

2、1)试用DTW法,在点阵图上画出最佳匹配路径,并计算出最佳匹配距离D(T,R);2)根据1)的结果,试用线条画出与之间的对应关系。提交时间:第四章回家作业4.1语音端点检测4.1.1语音端点检测的困难性-语音端点检测:从包含语音的一段信号中确定出该语音的起始点及终止点。-由于背景噪声或人为呼吸等原因产生的杂音,使得语音的端点比较模糊。4.1.2采用能量及过零数参数的检测法*4.2失真侧度4.2.1距离侧度与失真侧度-数学上的距离(1)正值性d(x,y)≥0;当x=y时,有d(x,y)=0;(2)对称性d(x,y)=d(y,x);(3)三角形不等式性d(x,y)=d

3、(x,z)+d(z,y)。-失真侧度(1)正值性D(x,y)≥0;当x=y时,有D(x,y)=0;(2)在频域中应具有物理意义。(3)在实际工程中能有效地计算。4.2.2几种典型的失真侧独*4.3动态时间规正法(DTW)4.3.1语音模式匹配的问题点-匹配时音长不一致问题-线性匹配与非线性匹配*4.3.2DTW的原理*4.3.3DTW的具体解法*4.4基于DTW技术的语音识别方案词汇表:W(n),n=1,2,…,N参考模式:R(k),k=1,2,…,N待识模式:T-利用DTW算法,计算所有Dk(T,R(k))。-对所有Dk(T,R(k))求其最小值,该最小失真度所

4、对应的下标n就为识别结果。n=argmin{Dk}k采用能量及过零数参数的检测法时间ETLETUZTN1N2NBNE过零数Zj能量EjN’1N1-25时间几种典型的失真侧度(1)欧氏距离D(x,y)={∑

5、x–y

6、r}/N,(0≤1≤N-1)-均方误差-绝对值平均误差(2)对数频谱距离V(w)=log(f(ω))-log(g(ω))D(g,f)={∫

7、V(w)

8、rdw}/2π(3)倒谱距离D(x,y)=∑(c–c)2,(1≤n≤p)riicepr-ππ(f)(g)nn不同音长的匹配距离(D3

9、D2(T,R)非线性匹配D3(T,R)动态时间规正法(DTW)的原理Ck=(ik,jk)C1=(1,1)CK=(I,J)j=i-rj=i+r时间伸缩函数F匹配窗ijt1t2t3titITRr1r2rjrJ(1)时间伸缩函数FF={c1,c2,…,cK}ck=(ik,jk)(2)F的累加距离D(F)D(F)=∑{d(ck)wk}k∑wkkd(ck)=d(ik,jk)(3)最佳匹配失真侧度D(T,R)D(T,R)=min{D(F)}F动态时间规正法(DTW)的具体解法ck=(ik,jk)(ik,jk-1)(ik-1,jk)r4r3r2r1t1t2t3t4t5ming(

10、i-1,j)+d(i,j)g(i-1,j-1)+2d(i,j)g(i,j-1)+d(i,j){(1)约束条件F={c1,c2,…,cK}ck=(ik,jk)(2)D(F)式中分母部独立处理D(F)=∑{d(ck)wk}k∑(I+J)k(3)DTW算法(部分优化法)g(ck)=g(ik,jk)=g(i,j)=D(T,R)=g(I,J)/(I+J)动态时间规正法(DTW)的计算实例ck=(ik,jk)(ik,jk-1)(ik-1,jk)min2175151647245243348221511920232617221622161815191211151679171345

11、1011FEDCBA1234RTg(i-1,j)+d(i,j)g(i-1,j-1)+2d(i,j)g(i,j-1)+d(i,j){DTW算法(部分优化法)g(ck)=g(ik,jk)=g(i,j)=D(T,R)=g(I,J)/(I+J)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。