欢迎来到天天文库
浏览记录
ID:34098282
大小:867.64 KB
页数:60页
时间:2019-03-03
《基于gmm说话人识别算法的研究及其在安卓平台实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、国内图书分类号:TN912.34学校代码:10213国际图书分类号:004.93.密级:公开工程硕士学位论文基于GMM的说话人识别算法研究及其在安卓平台的实现硕士研究生:何建军导师:王鸿鹏教授副导师:胡红华高级工程师申请学位:工程硕士工程领域:计算机技术所在单位:深圳电器公司答辩日期:2012年12月授予学位单位:哈尔滨工业大学ClassifiedIndex:TN912.34U.D.C:004.93DissertationfortheMaster’sDegreeofEngineeringRESEARCHONSPEAKERRECOGNITIONALGORITHMBASEDONGMMANDITS
2、APPLICATIONTOTHEANDROIDPLATFORMCandidate:JianjunHeSupervisor:Prof.HongpengWangAsst.Supervisor:SeniorEngineerHonghuaHuAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerTechnologyAffiliation:ShenzhenElectricApplianceCompanyDateofDefence:December,2012Degree-Conferring-Institution:HarbinIns
3、tituteofTechnology哈尔滨工业大学工程硕士学位论文摘要说话人识别,也叫声纹识别,是通过对说话人语音信号的分析处理来完成说话人的辨认或确认。随着嵌入式软硬件技术和无线通信领域的迅猛发展,语音输入和控制将成为手持移动设备和嵌入式系统最佳的交互方式,以声纹信息为特征的身份鉴别技术也越发显得重要。说话人识别技术研究的关键是语音信号的特征提取、模型参数训练和识别等问题。本文通过研究基于声学特征的美尔倒谱特征提取方法和基于概率统计的模式匹配方法,研究实现了基于高斯混合模型(GaussianMixtureModel,简称GMM)的说话人识别系统。本文的研究重点是基于TIMIT语料库,分析研
4、究了说话人识别的语音信号预处理,以及说话人语音特征的提取原理和方法,并使用Matlab实现了美尔频率倒谱系数(MelFrequencyCepstrumCoefficient,简称MFCC)的提取。在此基础上详细研究了GMM模型的基本原理、EM算法和K-均值聚类算法,并基于此使用Matlab设计实现了基于GMM模型的说话人识别系统,完成了GMM模型参数的训练和识别过程。为了分析该说话人识别系统的性能,本文通过实验分析了不同GMM模型阶数和不同训练语音样本时长对系统识别性能的影响。作为基于GMM模型的说话人识别系统应用的扩展,本文将Matlab下的设计实现的基于GMM的说话人识别系统用Java语
5、言全部重新编写,并最终在安卓平台上实现。为了分析安卓平台上实现的说话人识别系统的时效性,本文通过实验分析了不同GMM模型阶数和不同测试人数对系统时效性的影响。论文最后对课题研究进行了总结,并对基于GMM模型的说话人识别系统研究前景作了展望。关键词:说话人识别;美尔倒谱系数;高斯混合模型;特征提取;安卓-I-哈尔滨工业大学工程硕士学位论文AbstractSpeakerRecognitionorVoiceprintRecognitionistoidentifyorconfirmthespeakerbytheanalysisofthespeaker'svoicesignalprocessing.W
6、iththedevelopmentofembeddedsoftware,hardwaretechnologyandwirelesscommunications,thesystemofvoiceinputandcontrolwillbethebestoneofinteractivewaysinhand-heldmobiledevicesandembeddedsystems.Therefore,thevoiceprintauthenticationtechnologyhasalsobecomeincreasinglyimportant.Thecriticalresearchonspeakerre
7、cognitiontechnologyisthefeatureextractionofspeechsignal,themodelparameterstrainingandrecognition,etc.ThisthesishasrealizedthespeakerrecognitionsystembasedonGMMmodelusingtheMFCCextractionmethodbasedontheacou
此文档下载收益归作者所有