基于韵律特征的SVM说话人识别

基于韵律特征的SVM说话人识别

ID:37041485

大小:3.62 MB

页数:65页

时间:2019-05-20

基于韵律特征的SVM说话人识别_第1页
基于韵律特征的SVM说话人识别_第2页
基于韵律特征的SVM说话人识别_第3页
基于韵律特征的SVM说话人识别_第4页
基于韵律特征的SVM说话人识别_第5页
资源描述:

《基于韵律特征的SVM说话人识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要语音信号是用于个人身份确认的一种有效的生物特征,与文本无关的说话人识别的研究也是语音信号处理的一个重要的研究方向,其研究具有重要的理论意义和广泛的应用前景。为了考察最新的相关研发进展,并提供统一的衡量标准,美国国家标准技术研究院(NIST)于1996年起开始主持说话人识别评测。NIST说话人评测代表了说话人识别领域的最高水准,NIST设立了多项评测任务,探索和尝试各种语音条件下的研究方法,并为各个项目指定统一的电话和广播语音(多环境、多通道、大规模说话人)、测试基准、评测规则和标准。其中一个任务是采用长语音进行说话人识别,是

2、为了探索用于与文本无关的说话人识别的语音信号高层次信息而设置的。除了短时倒谱参数,语音中的高层次信息也是一种有效的说话人特征参数,但其通常与文本内容有关,因此研究从信号中提取可用于与文本无关说话人识别的语音高层次特征信息就成了目前研究的焦点。本文对韵律的提取方法及其与区辨模型结合运用于与文本无关的说话人识别进行了探讨。从与文本无关的说话人识别的特点出发,本文先讲述概率统计模型,从文本相关的语音韵律(语音特征随时间变化的轨迹)中提取的特征信息,进行数据压缩、聚类,再利用支持向量机SVM进行区分。文章提出了一种基于小波分析从韵律中提取超

3、音段韵律信息的方法,分别从声道的MFCC轨迹和基频轨迹,时域能量轨迹中进行超音段韵律特征的提取。由MFCC各维参数的近似不相关和声道缓变的特点,MFCC轨迹的韵律特征只以概貌系数来刻画,提取的PMFCC作为主参数,在参数级和由基频F0轨迹的六维韵律特征参数PF0、由时域能量轨迹的六维韵律特征参数PE,组成更加有效的PMFCCFE参数,进而利用支持向量机SVM模型进行区分。在NIST数据库上的实验表明,与传统的短时MFCC的GMM-UBM系统相比,超音段韵律特征PMFCCFE的GMM-SVM系统的EER相对下降了57.9%,MinDC

4、F相对下降了41.4%。显著提高了说话人识别的性能。关键字:韵律特征;GMM超矢量;SVM;文本无关说话人识别IAbstractAbstractSpeechsignalaseffectivebiologicalfeature,isparticularlyusefulforidentification,andtext-independentspeakerrecognitionisoneoftheprimaryresearchfieldsofspeechsignalprocessing,andnotonlyofgreattheoreti

5、calsignificance,butalsohasawidevarietyofapplications.TheNationalInstituteofStandardsandTechnology(NIST)hascoordinatedSpeakerRecognitionEvaluationssince1996toinvestigateandmeasurethelatestapproaches.Theevaluationsrepresentthestate-of-the-artachievementsofspeechrecogniti

6、on.NISTsetsupseveraltaskstoexaminespeakerrecognitionperformanceunderdifferentcircumstances.NISTofferstotheparticipantstelephoneandbroadcastspeechdatarangingfrommultiplechannelstovariousenvironments,theevaluationspecifications,andsameevaluationcriterion.Onetaskofferslon

7、g-durationspeechfromspeakers,aimingtomakefulluseoftext-independenthighlevelinformationforrecognizingspeakers.Inadditiontoshort-termspectralfeaturessuchasMFCC,highlevelinformationcanalsoserveaseffectivefeatureforspeakerrecognition,butitusuallyassociatedwithdependenttext

8、.Thesolutiontoexplorethehighlevelfeaturefortext-independentspeakerrecognitionbecomesafocus.Thethesisillustratestheeff

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。