资源描述:
《基于声纹的说话人特征识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于声纹的说话人特征识别JIUJIANGUNIVERSITY毕业论文(设计)题目基于声纹的说话人特征识别英文题目Speakerfeaturerecognitionbasedonthevoiceprint院系专业姓名年级指导教师2013年6月61九江学院学士学位论文摘要说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,而自动识别说话人身份的技术。它也常被人们称为声纹识别技术,是生物认证技术的一种,其基本思想就是运用某种匹配方法进行特征识别,从而确定说话人的身份。目前已知的语音特征包括基音周期、语谱图、自相关系数、能量、平均幅度、
2、过零率、共振峰、线谱对、线性预测系数(LPC)、线性预测倒谱(LPCC)、Mel频率倒谱(MFCC)等。本文介绍了说话人识别的概念、原理及其识别实现的方法,指出了说话人识别技术的应用前景。通过在Matlab7.0平台上对语音的基音周期、线性预测倒谱和Mel频率倒谱等特征参数进行提取、分析、对比、识别实现一个简单的说话人识别系统,实验结果表明实验正确、有效。关键字:说话人识别;特征参数;基音周期;线性预测倒谱;Mel频率倒谱61九江学院学士学位论文SpeakerfeaturerecognitionbasedonthevoiceprintAbst
3、ractSpeakerrecognitionisthevoiceparametersinaspeechwaveformwhichreflectsthespeaker'sphysiologicalandbehavioralcharacteristics,andautomaticidentificationtechnologytospeakeridentity.Itisalsooftenreferredtoasthevoiceprintrecognitiontechnology,abiometricauthenticationtechnology
4、.Thebasicideaistouseamatchingmethodforfeaturerecognition,inordertodeterminetheidentityofthespeaker.Currentlyknownvoicefeaturesincludepitch,spectrogram,sincethecorrelationcoefficient,energy,averagemagnitude,thezerocrossingrate,formant,thelinespectrumoftheLinearPredictionCoef
5、ficient(LPC),LinearPredictionCepstrum(LPCC),MelFrequencyCepstral(MFCC).Thisarticledescribesthespeakeridentificationconcepts,principlesandimplementationmethodsofidentification,andpointedouttheprospectofspeakerrecognitiontechnology.BytheMatlab7.0platform,voicepitch,linearpred
6、ictioncepstrumandMelFrequencyinvertedspectracharacteristicparameterextraction,analysis,contrast,identifyasimplespeakerrecognitionsystem,experimentalresultsshowthattheexperimentiscorrect,effective.KeyWords:SpeakerRecognition;FeatureParameter;Pitch;LinearPredictionCepstralCoe
7、fficient;MelFrequencyCepstralCoefficient61九江学院学士学位论文目录摘要IAbstractII目录III引言1第一章说话人识别研究31.1说话人识别研究的意义31.2说话人识别应用领域31.3说话人识别的技术优势41.4说话人识别研究的难点和热点51.4.1说话人识别技术研究的难点51.4.2说话人识别研究的热点71.5影响说话人识别性能的因素71.6论文的内容安排9第二章说话人识别的基本介绍102.1语音的基础知识102.1.1语音的产生原理102.1.2语音产生模型102.1.3语音信号的预处理技术
8、122.2说话人识别的分类142.3说话人识别的基本原理162.4说话人识别的常用特征182.5说话人识别系统的结构框架182.6说话人识别的主要模型202.7说话