资源描述:
《说话人识别中基于最大后验概率的通道补偿方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第3期高荣春等:说话人识别中基于最大后验概率的通道补偿方法·103·说话人识别中基于最大后验概率的通道补偿方法高荣春,韩纪庆,张磊(哈尔滨工业大学计算机学院,黑龙江哈尔滨150001)摘要:为了解决通道变化对说话人识别系统性能的影响,将最大后验概率方法应用到具体的通道补偿中。首先设置标准通道,然后利用其他通道和标准通道偏差的分布作为先验知识,通过少量自适应数据获得当前通道的偏差对特征进行调整,达到补偿的目的。实验结果表明,在1s自适应数据时,该方法的识别率达到89.1%,和倒谱平均减方法相比识别率提高4.2%,随
2、着自适应数据的增加,采用该方法的系统性能可进一步提高。关键词:说话人识别;通道补偿;最大后验概率方法中图分类号:TP391文献标识码:B文章编号:1000-436X(2009)03-0099-05ChannelcompensationofspeakeridentificationbasedonmaximumaposterioriGAORong-chun,HANJi-qing,ZHANGLei(SchoolofComputerScienceandTechnology,HarbinInstituteofTechnol
3、ogy,Harbin150001,China)Abstract:Tosolvetheeffectofchannelchangesontheperformanceofspeakeridentificationsystem,applythemethodofmaximumaposterioritospecificchannelcompensation.First,setupastandardchannel,then,usethedistributionofdeviationofotherchannelandstanda
4、rdchannelasexperienceknowledge,andobtainthedeviationofcurrentchannelbyafewadaptivedata,usethesedeviationstoadjustthecharacteristictogainthegoalofcompensation.Theresultsshowthatadaptivedatain1s,ithasadiscriminationof89.1%,abovethemethodofcepstrumaveragereducti
5、onby4.2%,withtheincreasingofself-adaptive,theperformanceofthissystemcanbeimproved.Keywords:speakeridentification;channelcompensation;MAP第3期高荣春等:说话人识别中基于最大后验概率的通道补偿方法·103·1引言收稿日期:2008-08-08;修回日期:2008-12-30基金项目:国家重点基础研究发展计划(“973”计划)基金资助项目(2007CB311100);国家自然科学基金
6、资助项目(60672163)FoundationItems:TheNationalBasicResearchProgramofChina(973Program)(2007CB311100);TheNationalNaturalScienceFoundationofChina(60672163)语音信号在真正进入识别器之前,会受到各方面因素的干扰,传输通道的影响就是其中之一。在语音处理中,通道畸变一直是降低识别率的最重要因素。为此,研究者们已经提出了许多通道畸变的补偿方法。在已知纯净语音和畸变语音的条件下,可以采用
7、经典的自适应滤波方法,估计通道的滤波特性从而进行通道均衡。而仅知畸变语音时,一般采用基于特征域和模型域的通道补偿方法。在特征域,倒谱均值减(CMS,cepstralmeansubtraction)[1]是一种简单而有效的方法,该方法认为,通道对语音的影响是不变的而且集中在均值部分,它通过从信号倒谱减去倒谱均值来降低通道畸变的影响。RASTA滤波[2]也是在倒谱中滤去通道干扰的有效方法,该方法在对数谱上使用一个低端截至频率非常低的带通滤波器进行滤波处理,抑制每个频带上的常量以及慢变分量。这种滤波也可以在第3期高荣春
8、等:说话人识别中基于最大后验概率的通道补偿方法·103·PLP(RASTA-PLP)[3]频带上进行。CMS和RASTA滤波对消除通道引起的线性畸变有不错的效果。Thomas等人[4]通过研究发现,通道畸变不仅存在着线性畸变,还存在着非线性畸变,在频谱上表现为出现虚假的共振峰,他们提出L-N-L模型,即用一个线性滤波器串联一个非线性滤波器再串联一个线性滤波器来刻画通道形成