欢迎来到天天文库
浏览记录
ID:34955192
大小:2.74 MB
页数:56页
时间:2019-03-15
《说话人识别中基于自动编码机的信道补偿方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文说话人识别中基于自动编码机的信道补偿方法研究AUTO-ENCODERBASEDCHANNELCOMPENSATIONINSPEAKERRECOGNITION于首杰哈尔滨工业大学2018年6月国内图书分类号:TP391.42学校代码:10213国际图书分类号:681.3密级:公开工学硕士学位论文说话人识别中基于自动编码机的信道补偿方法研究硕士研究生:于首杰导师:郑铁然副教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2018年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.42U.D.C:681.3Dissert
2、ationfortheMasterDegreeinEngineeringAUTO-ENCODERBASEDCHANNELCOMPENSATIONINSPEAKERRECOGNITIONCandidate:YUShoujieSupervisor:AssociateProf.ZHENGTie-ranAcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:Jun
3、e,2018Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要说话人识别技术作为一种身份鉴别技术被广泛研究和应用,在众多的说话人识别技术中基于i-vector特征的概率线性判别分析(ProbabilisticLinearDiscriminantAnalysis,PLDA)方法因为良好的识别效果而被广泛关注。但由于i-vector特征中在提取过程中并没有区分说话人信息和信道信息,因此要对i-vector进行信道补偿,以减少信道信息的影响,而常用的信道补偿方法是线性判别分析(LinearDiscriminantAnal
4、ysis,LDA)。LDA方法属于线性映射方法,消除i-vector特征中信道信息的能力有限,因此本文提出了两种基于传统自动编码机改进的新的信道补偿方法,本文将第一个方法命名为类内距离最小化编码机(Within-classDistanceMinimizationAuto-Encoders,WCDM-AE),之后对WCDM-AE进一步改进得到了收缩类内距离最小化编码机(ContractiveWithin-classDistanceMinimizationAuto-Encoders,cWCDM-AE)。两种方法都具有非线性映射能力,cWCDM-AE是在WCDM-AE的基础上加入了两个新的惩
5、罚项到损失函数中得到的,第一个惩罚项是为了达到最小化类内距离的目的;第二个惩罚项是从CAE中改进而来,利用i-vector和大多数噪声同样属于高斯分布的特性,来达到类内距离最小化的目的。cWCDM-AE的信道补偿效果比WCDM-AE更好。cWCDM-AE方法不仅具有传统自动编码机非线性映射的优势,并且通过改进损失函数可以利用类别信息。由于i-vector经过cWCDM-AE重新编码后属于同一个说话人的特征会尽可能的靠近,之后再进行LDA方法,会使信道补偿的效果更好。经过实验验证,cWCDM-AE与LDA结合使用比单独使用LDA方法的信道补偿更好。本文使用Voxceleb数据集分别进行了
6、说话人确认和说话人辨认的对比实验,虽然cWCDM-AE+LDA方法在说话人确认实验方面识别性能不明显,但在说话人辨认实验中识别性能有很明显的提升,相比于仅使用LDA方法,在识别准确率上达到了10%左右的提升。关键词:说话人识别、信道补偿、LDA、自动编码机、cWCDM-AEIAbstractAbstractAsanidentificationtechnology,speakerrecognitiontechnologyhasbeenwidelystudiedandapplied.Inmanyspeakerrecognitiontechnologies,theProbabilisticL
7、inearDiscriminantAnalysis(PLDA)methodbasedoni-vectorfeaturesiswidelyconcerned,becauseofitsgoodrecognitionresult.However,thei-vectorfeaturedoesnotgreatlyd-istinguishbetweenspeakerinformationandchannelinformationduringthefeatu
此文档下载收益归作者所有