声纹识别的特征参数提取

声纹识别的特征参数提取

ID:40919725

大小:161.43 KB

页数:4页

时间:2019-08-10

声纹识别的特征参数提取_第1页
声纹识别的特征参数提取_第2页
声纹识别的特征参数提取_第3页
声纹识别的特征参数提取_第4页
资源描述:

《声纹识别的特征参数提取》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第7卷第1期太原师范学院学报(自然科学版)V01..No.12008年3月。JOURNALOFTAIYUANNORMALUNIVERSITY(NaturalScienceEdition)Mar·2008声纹识别的特征参数提取郭慧娟.(太原师范学院,山西太原030012)[摘要]声纹识别是语音识别的一种,根据测试语音来辨别说话者的身份.特征参数的提取是声纹识别的重要组成部分.为此,文章主要介绍了LPC和MFCC两种常用的声纹识别特征参数及Matlab实现算法.[关键词]声纹识别;特征参数;LPC;MFCC[文章编号]1672—2027(2008)01—0070—04‘(

2、中图分类号]TP30(文献标识码]A‘语言是人类特有的功能,是人与人之间进行信息交流最主要、最自然的手段.语音信号处理研究分为语音识别、语音合成、语音编码和声纹识别四大分支.21世纪是信息化的世纪,计算机技术、通信技术、蓝牙技术等高新技术进一步发展,现代电子与软件产品更具人性化、智能化、微型化.鉴于此,我国和许多国家都把语音处理研究列为国家级研究项目.声纹识别的应用n3领域相当广泛.包括电话预约业务中的声音确认转账、汇款、余额通知、票行情咨询;搜索罪犯判断犯罪现场记录的声音是多个嫌疑犯中哪一个人的声音;医学应用[2]如声纹识别系统可以响应患者的命令,从而实现对机器假肢

3、的控制等。本文从声学的角度和听觉的角度分别介绍了LPC和MFCC两种语音特征参数及Matlab实现.1语音信号的数学模型根据语音产生的机理,可以将语音发声系统分为3个子系统:在声门(声带)以下,称为“声门子系统”,它负责产生激励振动,是“激励子系统”;从声门到嘴唇的呼气通道是声道,是“声道系统”;语音从嘴唇辐射出去,所以嘴唇以外是“辐射系统”.人类的发声是一个复杂的过程.语音发声系统的完整数学模型[3]可表示为:H(z)一G(z)V(2)R(z)Rosenberg在研究语音合成时,提出了一个可替代声门的波形,该波形的数学表达式为:一÷7._fTj,。’I寺[1一cos

4、(rn/N。)]0≤以≤N,譬?:fjc。s_@一Nt)/2N。J,N,≤竹≤N,+N。峄、’【0其他其2变换为:G(z)一百j南‘1)当发浊音时,激励信号源可表示为序列脉冲串;当发清音时,激励信号源可视为白噪声.这是对激励源的粗略划分,并非所有的发音都可用这两种信号来简单表达.对于一般的分析,声道可用一个全极点模型来表示,其传递函数为:V(z)一———寺—一(2)1一∑口∥~置辐射模型的传递函数可用一个一阶高通函数来表示:收稿日期:2007—12—23作者简介:郭慧娟(1979一),女,山西定襄人,硕士,太原师范学院计算机系助教,主要从事声纹识别的研究第1期郭慧娟:

5、声纹识别的特征参数提取71R(2)=Ro(1一Z--I)(3)如式(3)所述的发声系统数学模型只是一个最为基本的模型,对于大多数的分析,该模型已经够用了,但是对于一些情况,如高质量语音合成,则需更为精确的数学模型,这时就要考虑到激励源的多样性和声道中鼻腔的影响.2特征参数2.1线性预侧系数LPCI4](LinearPredictorCoefficient)信号处理中系统传递函数参数模型主要有三种:第一种是只有零点没有极点的滑动平均模型(MA);第二种是只有极点没有零点的自回归模型(AR);第三种是既有零点又有极点的自回归滑动平均模型(ARMA).AR模型能够很好地近似

6、声道模型,且其参数求解相对容易,有多种解法,如针对自相关方程的Durbin递推算法和Schur递推算法、针对协方差方程的乔里斯基算法、Burg算法,所以一般用一个AR模型来表示声道模型.H(z)=G(2)F(2)R(别一砑G—G(4)其中G为增益系数,在下面的分析中不对其进行考虑.由(4)式所述传递函数可得到有关信号S(以)的差分方程:三‘S(,2)=>:afS(”一i)+Gu(,z)互’一S(咒)的线性预测S(,z)可近似表达为:.三5(,z)一>:aiS("一i)f=l预测信号S(以)的误差为:P锄)=S(以)一S(,z)一Gu(挖)户线性预测S(挖)的传递函数为

7、:P(z)一∑niz一‘i=l上误差e(n)是信号s(挖)通过如下系统而产生的:A(z)=1一≥:alz-:‘f一1由此我们可知A(2)是声道模型传递函数的逆滤波器.H(2)参数可通过使e(以)在均方误差最小的准则下求得.通过使实际语音的采样值和线性预测采样值之间达到均方差最小(LMS),即可得到线性预测系数(LPC).对LPC的计算方法有自相关法(Durbin法)、协方差法、格型法等等.计算上的快速有效保证了这一声学特征的广泛使用.2.2美尔倒谱系数[5](MelFrequencyCepstrumCoefficients)MFCC不同与LPC,它不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。