欢迎来到天天文库
浏览记录
ID:35097699
大小:2.84 MB
页数:62页
时间:2019-03-17
《说话人识别中特征组合方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码10530学号201330101205分类号TN912密级硕士学位论文说话人识别中特征组合方法的研究学位申请人谢小娟指导教师曾以成教授学院名称物理与光电工程学院学科专业电子科学与技术研究方向语音信号处理二○一六年五月十六日ResearchonSpeakerRecognitionBasedonFeaturecombinationCandidateXiaojuanXieSupervisorProfessorYichengZengCollegeSchoolofPhysicsandOptoelectronicEngineerin
2、gProgramElectronicScienceandTechnologySpecializationSpeechSignalProcessingDegreeMasterofEngineeringUniversityXiangtanUniversityDateMay16th,2016湘潭大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方
3、式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湘潭大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期:年月日导师签名:日期:年月日摘要说话人识别是一种生物认证技术,研究的是如何根据人的语音中独有的个性特点,来自动识别说话人身份。目前,凭
4、借其特有的便利性、经济性和正确性,已在某些领域得到应用,是语音处理的一个研究热点,其两个关键部分是说话人特征提取和识别模型建立。本文重点研究了说话人识别的特征组合方法,主要工作如下:(1)在线性预测系数(LPC)和美尔频率倒谱系数(MFCC)基础上,将LPC系数融入到MFCC参数中,得到线性预测美尔倒谱系数(LPMFCC),用于说话人识别。该方法不会增加特征维数,运算量也相对较少,识别率有较大程度提高。(2)为提高说话人识别的正确率,同时采用多个特征参数。针对综合特征参数中各维分量对识别结果的影响可能不一样,同等对待并不一定是最
5、优的方案这个问题,提出基于Fisher准则的MFCC、LPMFCC、Teager能量算子倒谱参数(TEOCC)相混合的特征参数提取方法(FMLT参数),该方法有效地结合了人耳的感知、声道和非线性能量方面的特征;另外,提出一种采用改进的升半正弦函数进行加权的组合特征参数(WFMLT参数)。为验证这两种方法的有效性,提出基于PCA的MFCC、LPMFC和TEOCC组合特征参数提取方法(PCMLT参数)进行对比分析。(3)针对MFCC参数在中高频的计算精度不高的问题,采用滤波器组主要分布在高频部分的翻转美尔倒谱参数(IMFCC)和滤波
6、器组主要分布在中频部分的中频美尔倒谱参数(MidMFCC)相结合的方法,提出基于Fisher比的MFCC、IMFCC和MidMFCC的组合特征参数(FMFCC参数),来改善说话人识别系统性能。(4)研究基于GMM和BP神经网络的说话人识别系统,将上述特征参数提取方法分别应用到系统中,验证组合特征参数的有效性和可行性以及系统的识别性能。仿真实验表明,FMLT方法与MFCC、LPMFCC、MFCC+LPMFCC、FMFCC以及PCMLT方法相比,识别率在纯净语音环境下分别提高了21.65%、18.39%、15.61%、15.01%与
7、22.70%;在30dB噪声环境下,则分别提升了15.15%、10.81%、8.69%、7.64%与17.76%;并且经加权处理的WFMLT方法的识别性能更优于FMLT方法,在纯净语音环境下提升了2.62%。结果表明,FMLT和WFMLT参数能够有效提高说话人识别率,且具有更好的鲁棒性。关键词:说话人识别;特征提取;Fisher准则;GMM;BP神经网络IAbstractSpeakerrecognitionisabiometricauthenticationtechnology.Theresearchaimsathowtoext
8、ractthespeaker'svoicecharacteristicstoidentifythespeakerautomatically.Atpresent,speakerrecognitionhasbeenappliedinsomefieldsduetoit
此文档下载收益归作者所有