欢迎来到天天文库
浏览记录
ID:35067703
大小:3.46 MB
页数:44页
时间:2019-03-17
《基于特征子空间量化的文本无关说话人年龄识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校代码:1028520学号=124328053襄W、聲SOOCHOWUNIVERSITY基于特征子空间量化的文本无关说话人年龄识别-ndenTextipendentSpeakerAgeRecogitionBasedonFeatureSub-SaceuantizationpQ研究生姓名倪冬琴*旨导教"巧姓名俞一彪专业名称电子与通信工程研究方向语音信号处理所在院部电子信息学院论文提交日期2016年10月議111赃基于特征子空间量化的文本无关说话人年龄识别中文摘要I基于
2、特征子空间量化的文本无关说话人年龄识别中文摘要I基于特征子空间量化的文本无关说话人年龄识别中文摘要基于特征子空间量化的文本无关说话人年龄识别中文摘要说话人年龄识别是指通过语音信号分析,识别出说话人的年龄特征。随着人机语音交互技术的研究不断深入,其应用也越来越广泛,对交互的自然度要求也随之提高。说话人年龄识别技术可以使得系统在人机交互过程中正确了解说话人的年龄特征,从而自适应地提供合理的交互方式,例如合适的音量、语速、语调、语气等。该技术可以广泛应用于自动语音信息查询、健康护理、娱乐场合等领域。本文提出一种特征子空间量化(FSSQ,FeatureSubspaceQuantizati
3、on)方案进行文本无关的说话人年龄识别,主要思想是通过对同一年龄段说话人语音的声学特征空间基于聚类技术进行子空间划分并对子空间进行量化来减小模式类的分布散度,提高总体识别精度。同一年龄段说话人的语音信号首先提取梅尔倒谱参数(MFCC),然后采用K-Means算法对特征矢量进行聚类,完成特征子空间划分,进一步采用LBG算法对每一子空间进行量化,形成量化码本,每一年龄段的语音最终表示为一组量化码本。年龄识别基于最小平均码本距离进行判决分类。实验结果表明,提出的特征子空间量化说话人年龄识别方法相对矢量量化(VQ)和高斯混合模型(GMM)等典型方法具有更好的识别性能,总体集内和集外识别率
4、分别达到了89.8%和58.6%。关键字:特征子空间量化,MFCC,K-Means,LBG作者:倪冬琴指导教师:俞一彪I英文摘要基于特征子空间量化的文本无关说话人年龄识别Text-independentSpeakerAgeRecognitionBasedonFeatureSub-SpaceQuantizationAbstractSpeakerrecognitionistheidentificationoftheagecharacteristicsofthespeakerbyspeechsignalanalysis.Withthecontinuousdevelopmentofhum
5、ancomputerinteractiontechnology,itsapplicationismoreandmoreextensive.Speakerrecognitiontechnologycanmakethesystemagecorrectlyunderstandtheagecharacteristicsofthespeakerintheprocessofhuman-computerinteraction,soastoprovideareasonablewayofadaptiveinteraction,suchaspropervolume,speed,intonation,
6、tone,etc..Thetechnologycanbewidelyusedinthefieldofautomaticvoiceinformationquery,healthcare,entertainmentandotherfields.Thispaperproposesafeaturesubspacequantization(FSSQ,FeatureSubspaceQuantization)schemefortextindependentspeakerrecognitionage,themainideaisthedistributionofdivergencethrougha
7、cousticfeaturespaceofthesameagespeakerclusteringtechnologybasedonSubspacePartitionandsubspacequantizationtoreducethepattern,improvetheoverallrecognitionaccuracy.SpeechsignalisthesameageofthefirstspeakerMelcepstrumextraction(MFCC),andthenuseK-
此文档下载收益归作者所有