基于修正mel子带系数的文本无关的说话人识别new

基于修正mel子带系数的文本无关的说话人识别new

ID:34141949

大小:737.94 KB

页数:3页

时间:2019-03-03

基于修正mel子带系数的文本无关的说话人识别new_第1页
基于修正mel子带系数的文本无关的说话人识别new_第2页
基于修正mel子带系数的文本无关的说话人识别new_第3页
资源描述:

《基于修正mel子带系数的文本无关的说话人识别new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、122011,47(1)ComputerEngineeringandApplications计算机工程与应用基于修正Mel子带系数的文本无关的说话人识别1,22张庆芳,赵鹤鸣1,22ZHANGQingfang,ZHAOHeming1.苏州经贸职业技术学院,江苏苏州2150092.苏州大学电子信息学院,江苏苏州2150061.SuzhouInstituteofTrade&Commerce,Suzhou,Jiangsu215009,China2.SchoolofElectronicsandInformationEngineering,SuzhouUniversity,Suzhou,Jia

2、ngsu215006,ChinaE-mail:qfzclear@yahoo.com.cnZHANGQingfang,ZHAOHeming.Melfrequencysubbandcoefficientsbasedtextindependentspeakerrecognition.Com-puterEngineeringandApplications,2011,47(1):12-14.Abstract:Text-independentspeakerrecognitionisanimportantbranchresearchfieldofspeakerrecognitionbecauseo

3、fitsease-to-useandpotentialapplicationsintheinformationtechnology.Thispaperfocusesontheproblemsofthefeatureextrac-tion.ThroughmodifyingtheMelfrequencysubbandcoefficients,itenhancesthedifferencesofthefrequencybetweenthepeo-pleinthesystem,improvestheabilityofseparatingtheclassesinthefeaturespace.

4、Andtheparameterscanemphasizepeo-ple’sindividualityandincreasetheaverageaccuracyofrecognition.Keywords:speakerrecognition;textindependent;vectorquantization;Melfrequencysubband摘要:与文本无关的说话人识别具有用户使用方便、可应用范围较宽等优点,是当前说话人识别技术的研究重点。对文本无关说话人识别系统中的特征参数提取进行了研究,通过对Mel子带系数进行修正,增强了说话人识别系统中说话人之间的频带差异,提高了特征空间

5、中类别的可分性,得到了更能体现说话人个性特征的Mel子带系数,从而提高了说话人识别系统的平均正确识别率。关键词:说话人识别;与文本无关;矢量量化;Mel子带DOI:10.3778/j.issn.1002-8331.2011.01.004文章编号:1002-8331(2011)01-0012-03文献标识码:A中图分类号:TP3911引言quencySubbandCoefficients,MFSC)的各维进行修正,增强目前,在说话人识别系统中常用的语音特征包括基音识别系统中说话人之间的频带差异,提高系统的识别率。(Pitch)、线性预测倒谱系数(LPCC)、Mel频率倒谱系数(MF-C

6、C)等,这些特征参数都是从语音信号中得到的,它们既包含2常用的特征处理方法说话人的语音特征,又包含说话人的个性特征,并且相互交织在说话人识别系统中,为了提高识别率,通常对基音、在一起,以复杂形式存在于语音参数中,所以既可以用在语音LPCC、MFCC等基本参数有以下几种使用方法:组合法、差分识别中,也可以用在说话人识别中。文献[1-4]用组合法,扩充法、特征变换法等。特征参数的维数,提高了识别率,文献[4-5]采用差分法,提高2.1组合法识别率,文献[6]中采用特征空间映射的方法来增强说话人的组合扩展就是将两个较低维参数合并为一个较高维参个性特征,但目前还没有有效的方法将说话人的个性特

7、征从数,一般组合方法如下:如有参数一(N维)和参数二(M维),组说话人所发语音的语音特征中分离出来。语音信号的频谱是合法就是将这两种参数进行简单的维数扩充,得到(N+M)维非平坦的,且对人耳听觉的贡献也不均匀,语音中不同频率段矢量。组合法虽然使用简单,但是当两个参数的维数较高时,对说话人特征的反映程度不一样,文献[7-8]对不同的子带的会增大计算量。特征进行分析和应用,来提高系统的识别率。本文通过对不2.2差分法同Mel子带中提取的特征进行研究,分析不同子

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。