语音识别和说话人识别中各倒谱分量的相对重要性

语音识别和说话人识别中各倒谱分量的相对重要性

ID:9232687

大小:316.70 KB

页数:8页

时间:2018-04-24

语音识别和说话人识别中各倒谱分量的相对重要性_第1页
语音识别和说话人识别中各倒谱分量的相对重要性_第2页
语音识别和说话人识别中各倒谱分量的相对重要性_第3页
语音识别和说话人识别中各倒谱分量的相对重要性_第4页
语音识别和说话人识别中各倒谱分量的相对重要性_第5页
资源描述:

《语音识别和说话人识别中各倒谱分量的相对重要性》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、北京大学学报(自然科学版),第37卷,第3期,2001年5月ActaScientiarumNaturaliumUniversitatisPekinensis,Vol.37,No.3(May,2001)语音识别和说话人识别中各倒谱1)分量的相对重要性甄斌吴玺宏刘志敏迟惠生(北京大学信息科学中心,100871,北京)摘要采用增减特征分量的方法研究了MFCC各维倒谱分量对说话人识别和语音识别的贡献。使用DTW测度,在标准英文数字语音库上的实验表明,最有用的语音信息包含在MFCC分量C1到C12之间,最有用的说话人信息包含在MF

2、CC分量C2到C16之间。MFCC分量C0和C1包含有负作用的说话人信息,将其作为特征会引起识别率的降低。低阶MFCC分量较高阶分量更容易受加性噪声和卷积噪声干扰。关键词MFCC;说话人识别;语音识别中图分类号TP319;TP391190引言与人听觉系统非凡的感知能力比较,目前的语音识别和说话人识别等机器系统还存在许[1,2]多问题,尤其是在不利的噪声环境下,系统性能急剧下降。语音识别和说话人识别系统中特征提取过程就是抽取保持语音最重要特征,并消除与语音无关信号的干扰,其性能对识别系[1]统的性能有直接影响。寻找具有良好

3、性能的特征及其提取算法是提高识别系统性能的根本途径之一。目前,常用的语音特征包括基于声道的LPCC、基于临界带的MFCC以及基于临界[1~3][4]带和等响度曲线的PLP,考虑语音动态特性的一阶和二阶差分倒谱,考虑语音时域特性[5][6]的RASTA滤波,还有其他基于听觉模型的特征。在语音识别和说话人识别的特征中,通常丢弃第零阶倒谱系数以归一化功率谱,为什么只[1,2]丢弃第零阶倒谱系数?还有没有其他阶倒谱系数需要丢弃?Juang提出适合语音识别的升余弦(Raised-Sine)倒谱提升,甄斌等提出适合说话人识别的半升余

4、弦(HalfRaised-Sine)倒谱提[7,8]升。不同的倒谱窗口对识别率有较大的影响,它暗示不同倒谱系数项对识别的贡献是不一样的。由此引出这样一个重要问题,即提取的所有特征分量是否都对识别有贡献?它们对识别目标的重要程度是否相同?同时还有特征的抗噪声性问题。本文以目前较为常用的MFCC特征为例,采用增减特征分量的方法评价MFCC各阶系数对语音识别和说话人识别性能的影响。在第二部分介绍了倒谱分量相对重要性评价方法,第三部分是使用的标准语音库,第四部分是MFCC各分量对语音识别和说话人识别的相对重要1)国家自然科学基金

5、(69635050)、北京市自然科学基金(4002012)和高等学校骨干教师资助计划资助项目收稿日期:2000-04-05372北京大学学报(自然科学版)第37卷性,最后是讨论和结论。1倒谱分量相对重要性评价方法评价特征对识别的贡献有两种方法,通过定义各分量的F比可以得到各特征分量的区分[2,9,10]能力,还可直接进行识别,通过增减分量的方法考察每个特征分量的贡献。本文采用第[10]二种方法,每个MFCC倒谱分量的平均贡献R(i)由下式计算:1R(i)=n(E(p(i,j)-p(i+1,j))+E(p(j,i)-p(j

6、,i-1))。(1)j>ij

7、分量平均贡献评价方法能使得识别率降低。但从所有特征分量可能的顺序组Fig.1Gridforevaluatingtheaverage合平均,包含该特征的识别率总体是增加的),负的平均importanceofMFCCcomponents贡献R(i)则相反。由于本文实验仅顺序添加或舍弃特征分量,因此平均贡献R(i)仅表示该分量的相对重要性,而不表示各分量之间的相互依赖关系,对语音识别和说话人识别都是如此。2语音数据库识别数据库为TI46,数据库包含8男8女,样本内容为0~9共10个孤立的英文数字,包括训练集和测试集,训练集为一

8、次录音,每个数字发10遍,测试集8次录音,每个数字每次发2遍,抽样频率12500Hz。识别时,从训练集中取的10遍录音作为训练样本,以测试集中16遍录音作为测试样本,测试中加入零均值的高斯加性白噪声和卷积噪声。卷积噪声指训练语音和识别语音通过不同的通信信道,如不同的麦克风或电话线路所引入的失真,这里将测试集语音通过4

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。