探索与文本无关的说话人特征提取及识别方法研究

探索与文本无关的说话人特征提取及识别方法研究

ID:34783020

大小:2.07 MB

页数:67页

时间:2019-03-10

探索与文本无关的说话人特征提取及识别方法研究_第1页
探索与文本无关的说话人特征提取及识别方法研究_第2页
探索与文本无关的说话人特征提取及识别方法研究_第3页
探索与文本无关的说话人特征提取及识别方法研究_第4页
探索与文本无关的说话人特征提取及识别方法研究_第5页
资源描述:

《探索与文本无关的说话人特征提取及识别方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、兰州理工大学硕士学位论文与文本无关的说话人特征提取及识别方法研究姓名:王贞申请学位级别:硕士专业:检测技术与自动化装置指导教师:李战明20060401硕士学位论文摘要说话人识别是根据人特有的语音信号来识别出说话人身份的一种生物认证技术,在说话人识别技术中,关键在于两方面:其一,如何从数据量相当大的原始语音信号中提取出反映说话人个性特征的参数。其二,设计出行之有效的分类器。本文针对说话人识别技术目前存在的技术难点进行了深入的研究,研究内容主要包括两方面:对于特征参数的提取,目前使用最为流行的特征参数是基于人耳听觉特性的MEL倒谱系数(MFcc)

2、,而MFcc是基于语音信号短时平稳的假设,在短时傅立叶变换的基础上提取的。实际上语音信号是一种典型的非平稳信号,短时分析不会随着时间的变化改变分辨率,而小波分析是一种信号的时间一尺度分析方法,它具有多分辨分析的特点,因此本文在基于研究了MFCc的提取原理的基础上,结合小波包对频带的多层次划分,并根据人耳感知频带的特点即Mel频率的分布,选择相应小波包分析后的结点频带,提取出一种基于小波包分析的新型特征参数(WPDC)。对于分类器的设计,主要应用人工神经网络技术,建立了基于RBF网络的说话人识别系统。针对系统性能随时间下降的问题,本文在分析了已

3、有VQ法与人工神经网络法的基础上,融合两者的优点,提出了一种vO与人工神经网络相结合的说话人识别系统,该系统能有效的解决随着时间的变化,系统模型失配的问题。关键词:说话人识别;特征参数;MFcc;小波变换;分类器;RBF网络;LVO网络与文本无关的说话人特征提取及识别方法研究AbstractAutomaticSpeakerRecognitionisabiometriccharacterizationprocessaimedatautomaticallyrecOgnizingwhoisspeakingbasedonuniqueinformati

4、oninherentinspeakersignalTherearetwokeystepsinthistechn0109yThefirstishowtoe×tractthefeatureparameterwhichcandiscriminatedifferentspeakerfromoriginalVoicesignalThesec。ndistodesignaclassinerwhichcouldyieldgoodperformanceInordertos01veproblemswithwhichthistechn0109yconfronts,

5、somedeepresearchhasbeenmade,itmainincludesthef0110wingtwoaspects:Asforfeatureextraction,themostpopularfeatureparameteristheMFCCatpresent,whichisextractedbasedonShon.TimeFourierTransform,assumingthevoicesignalisinvariantinshorttime.Infactvoicesignalisavariantsignaltypically,

6、butsho九一timeanaJysiscannotaltertime—frequencypropenyOntheotherhand,waVelettransformisasignalprocessbasedontime-scalerepresentation,inwhichthetimeandfrequencyresolutionbasisfunctionchangewithascalefactor.SobasedonstudytheMFCC。sextractiontheoryandwaveletpacketdecompositiontos

7、peechsignalprocessing,anewfeatureparameternamedwPDC(waveletpacketdecompositioncoe艏cient)isproposedInthisway,wedescribeaf}equencybandsdivisionofthesignalbycombingthenodesselectedfromthewaveIetpackettreetosecureamel—IikescalewithoutoverlappingInclassmerdesign,wehaVeconcentrat

8、edontheapplicationoftheneuralnetworktechniquestothetaskofspeakerrecognitionFirstly

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。