资源描述:
《基于子带加权和GMM的鲁棒性话者确认的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第19卷增刊信号处理117SIGNALPROCESSING基于子带加权和GMM的鲁棒性话者确认的研究王金明,张雄伟(解放军理工大学通信工程学院,南京210007摘要:噪声鲁棒性是话者确认系统实用化的关键问题之一,本文设计了一种基于子带加权和GMM的话者确认系统,该系统将语音谱分为若干子带,采用基于短时能量分布的算法估计各子带噪声强度,并根据噪声强度来进行子带加权,最终生成具有更高鲁棒性的语音特征,语音识别模型采用简化的GMM。实验表明,上述方法能有效提高话者确认系统的性能,增强其噪声鲁棒性,而且在低噪声环境下,仍能保证系统性
2、能不下降。关键词:子带加权;话者确认:高斯混合模型;鲁棒性:美尔倒谱系数ResearchonRobustSpeakerVerificationBasedonSub-bandWeightingandGMMWangJinmingZhangXiongwei(InstituteofCommunicationEngineering,PLAUST,Nanjing210007)Abstract:Thenoiserobustnessisoneofthekeyproblemsforthepracticabilityofaspeakerviri
3、ficationsystem,inthispaper,aspeakervirificationsystembasedonsub-bandweightingandGMMispresented,inthissystem,thespeechsignalisdivdedintoseveralsub-bands,foreachsub-band,aalgorithmbasedonshort-timeenergydistributionisusedtoestimatethenoiseintension,thentheenergyofeve
4、rysub-bandisweightedaccordingtoit'snoiseintension,atlast,morerobustspeechparametersareproduced,modifiedgaussionmixturemodelsadoptedhereasspeakermodels.Itisshownthroughexperimentsthatthesemethodscaneffectivelyimprovetheperformanceandnoiserubostnessofthespeakerverifi
5、cationsystem,furthermore,inlownoiseconditionthesystemcanstillworkwell.KeyWords:Sub-bandWeighting;SpeakerVerification;GMM(GaussionMixtureModels);Robustness;MFCC(Mel-FrequencyCepstrumCoeficients)目前已有若干文献和资料针对以上问题提出解决办法:引言比如,用语音增强、特征补偿、模型自适应等技术来适应环境的改变,文献[I]中提出用倒谱归一化(
6、CepstralMean说话者确认技术己取得了很大进展,目前在实用中遇到Normalization)来避免常值卷积性噪声带来的影响;文献[2l的主要问题在于系统的鲁棒性,体现在以下一些方面:在实中利用语音信息在人的听觉系统中的冗余性来提高抗噪声际环境中,不可避免有各种噪声的存在,主要有加性噪声和性能;文献[3]中则对HMM模型作了改进,以使在强噪环境卷积性噪声,这样使很多在实验室具有良好识别性能的话者下,鲁棒性好的特征参数起主导作用。确认系统在实际环境中性能显著降低;在利用电话语音的话本文针对噪声鲁棒性,提出一种基于子带加权
7、和GMM者确认系统中,语音经过电话信道传输,3KHz频带外的说的说话者确认方法,该方法将语音谱分成子带,采用基于短话人信息丢失,若信道不匹配,语音信号还会产生畸变:另时能量分布的算法估计每个子带的噪声强度,根据噪声强度外,说话人的声道特征、发音方式等随时间、情绪以及身体进行子带能量加权,最终生成具有更高鲁棒性的语音特征矢状况的变化均会产生变化。以上各种因素均是鲁棒性话者确量,再对该语音特征利用简化的GMM模型进行话者确认。认系统需要研究解决的问题。实验表明,该方法对窄带噪声具有良好的抑制作用。并且克118信号处理第19卷增刊
8、SIGNALPROCESSING服了许多鲁棒性方法在千净语音或低噪声环境下,系统性能倒谱域得到倒谱系数。反而降低的缺点,能保证系统性能不下降。(1)Ck=客log(X;,一““一2)N1;“=1,2,A,P2子带加权算法式中P为子带MFCC参数的阶数,N为滤波器个数,X为第i个子带能量,(