基于倒谱加权的说话人识别技术

基于倒谱加权的说话人识别技术

ID:14921068

大小:31.50 KB

页数:10页

时间:2018-07-31

基于倒谱加权的说话人识别技术_第1页
基于倒谱加权的说话人识别技术_第2页
基于倒谱加权的说话人识别技术_第3页
基于倒谱加权的说话人识别技术_第4页
基于倒谱加权的说话人识别技术_第5页
资源描述:

《基于倒谱加权的说话人识别技术》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于倒谱加权的说话人识别技术2006年5月第儿卷第3期西安邮电学院May.2006JOURNALOFXI'ANUNIVERSITYOFPOSTANDTELECOMMUNICATIONSVo1.11No.3基于倒谱加权的说话人识别技术孙林慧,李平安(南京邮电大学通信与信息工程学院,江苏南京210003)摘要:提出一种通过加不同权值来考察语音各阶参数的抗噪性强弱的方法,采用此方法分析了对干净语音和加白噪声语音的Mel倒谱各阶参数加不同权值后对识别系统性能的影响.得出结论:高阶Mel倒谱参数抗噪性较差而低阶倒谱参数抗噪

2、性较好.因此可以根据抗噪性的强弱对该倒谱各阶参数进行合理加权,以便突出抗噪性强的参数对说话人识别系统的贡献.关键词:权值;抗噪性;Mel倒谱;说话人识别中图分类号:TN912.3文献标识码:A文章编号:1007—3264(2006)03—0009—04引言说话人识别在相当广泛的领域可发挥重要作用…,如安全保卫领域,司法领域,军事领域,财经领域,信息服务领域等等.正因为如此,说话人识别越来越受到人们的重视.说话人识别系统根据应用分为说话人辨认(SpeakerIdentification)和说话人证实(Speaker

3、Verification)两种.说话人辨认是对给定的声音,由系统来判断其属于已注册的一群人中的某个特定人,说话人证实则是说话人先声明身份,然后由系统判断目标声音是不是他所声称的人的.根据待识别的文本又可以把说话人识别分为与文本有关的说话人识别和与文本无关的说话人识别.前者在训练和识别时采用相同内容的语句,后者在训练和识别时采用不同内容的语句.本文采用文本无关的说话人辨认系统.一般说话人识别系统包括训练和识别两个阶段,系统的基本结构详见图l.提取语音特征参数的目的在于保留反映说话人个性差异的特征,消除其他冗余信息和

4、无用信息.对说话人识别系统来说,特征参数的提取与选择是一个重要环节.特征参数的提取解决时域语音信号的数字表示问题,而特征参数的选择则通过选取有效的特征为模式划分部分提供数据.特征提取与选择的好坏直接影响到识别器的性能.说话人识别一般都在噪声环境中进行,如果我们可以预先知道各阶参数的抗噪性能,那么就可以通过对它们进行合理的加权处理来有效的选择特征参数,以便突出抗噪性强的参数对识别的贡献.因此关键的问题是通过什么方法来考察各阶参数抗噪性的强弱.本文提出一种通过加不同权值来考察各阶参数的抗噪性强弱的方法.图1说话人识别

5、系统的基本结构,l特征参数l,1特征参数的鲁棒性说话人识别是一种自动识别说话人身份的过程.说话人识别和语音识别的区别在于,它不注重收稿日期:2005—09—22基金项目:江苏省高校"青蓝工程"计划项目(QIA)O3YZ)作者简介:孙林慧(1979一),女,山西临汾人,南京邮电大学通信与信息工程学院助教.李平安(1976一),男,山西运城人,南京邮电大学通信与信息工程学院硕士研究生?lO?西安邮电学院2006年5月包含在语音信号中的文字符号以及语义内容信息,而是着眼于包含在语音信号中的个体特征,提取说话人的这些个体

6、信息特征,以达到识别说话人的目的.因此,说话人识别提取的特征参数要能很好的表征说话人个体信息特征.一般情况,说话人识别系统在实验室环境下有很好的识别效果,但在实际的环境下性能下降很多,造成此现象的主要原因是识别与训练条件的误匹配.说话人识别系统中可能引入干扰的因素有:说话人说话方式的变化(如说话人说话速度,音量的变化以及由疾病,情绪引起的变化等),录音环境(如麦克风的变化,背景噪声的干扰)以及传输影响(如传输信道畸变和线路噪声干扰导致误码,传输过程中数据分组丢失)等等.提取鲁棒性的特征参数是目前说话人识别技术的一

7、个热点和难点.寻找具有鲁棒性的参数,要求其满足下述条件:(1)能有效的区分不同的说话人,含有说话人的个性特征;(2)对同一说话人,当说话人说话方式改变时特征参数变化小;(3)抗噪声和信道干扰能力强.多年来,各国研究者对各种特征参数在说话人识别中的有效性进行了大量的研究,并且得到了许多重要的结论.说话人识别系统中常用的特征可划分为如下几类:(1)线性预测参数及其派生参数:如线性预测参数(LPC:LinerPredictionCoefficient)及LPC倒谱参数(LPCC:LinerPredictionCepst

8、ralCoefficient),声道面积比函数,线谱对参数和部分相关参数等;(2)语音频谱导出的参数:如基音轮廓,功率谱,共振峰带宽及其轨迹和MEL倒谱参数(MFCC,Mel—FrequencyCepstralCoefficient)等;(3)混合参数:上面参数进行合理组合,也可以提高系统的性能.在实际应用中,由于噪声环境下MFCC比LPCC的鲁棒性更好l2J,Mel倒谱

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。