基于GMM的说话人识别系统设计与实现.pdf

基于GMM的说话人识别系统设计与实现.pdf

ID:54017957

大小:681.36 KB

页数:4页

时间:2020-04-28

基于GMM的说话人识别系统设计与实现.pdf_第1页
基于GMM的说话人识别系统设计与实现.pdf_第2页
基于GMM的说话人识别系统设计与实现.pdf_第3页
基于GMM的说话人识别系统设计与实现.pdf_第4页
资源描述:

《基于GMM的说话人识别系统设计与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第3期微处理机No.32014年6月MICROPROCESSORSJun.,2014基于GMM的说话人识别系统设计与实现1,21,31刘冰,滕广超,林嘉宇(1.国防科学技术大学电子科学与工程学院,长沙410073;2.武警湖南省总队湘潭市支队,湘潭411104;3.武警黄金一总队通信科,哈尔滨150086)摘要:现代通信中,说话人的身份认证技术一直是通信行业研究的重点和热点。而基于GMM和MFCC的说话人识别技术,是目前为止相对成熟和常用的方法。对说话人识别系统的构成做了相关的研究,并通过MATLAB

2、编程,设计了一款以MFCC作为特征参数,基于GMM模型的说话人识别系统。经过实验测试,本系统能基本满足工作及家庭生活环境下的说话人识别需要。关键词:说话人识别;Mel倒谱系数;混合高斯模型DOI编码:10.3969/j.issn.1002-2279.2014.03.018中图分类号:TP391.4文献标识码:A文章编号:1002-2279(2014)03-0063-03DesignandImplementationofSpeakerIdentificationSystemBasedonGMM1,21,

3、31LIUBing,TENGGuang-chao,LINJia-yu(1.ShoolofElectronicScienceandEngineering,NationalDefenseTechnologyUniversity,Changsha410073,China;2.XiangtanCityTeam,TheArmedPoliceCorpsofHunan,Xiangtan411104,China;3.CommunicationsDepartment,GoldCorpI,TheArmedPolice,H

4、arbin150086,China)Abstract:Inmoderncommunication,thetechnologyofthespeaker'sIDauthenticationisthefocusofresearchandhotspotsincommunicationsindustry.Atpresent,thespeakeridentificationtechnology,basedonGMMandMFCC,isusableandpoplar.Inthispaper,thecompositi

5、onofspeakeridentificationsystemisresearchedandasystemwhichusesMelfrequencycepstralcoefficients(MFCC)asfeatureparameterandGMMforspeakermodelisdesignedbyMatlab.Thetestresultsshowthatthesystemcangenerallymeettherequirementsofidentificationforworkandlife.Ke

6、ywords:SpeakerRecognition;MFCC;GMM1引言2说话人识别系统原理[1]说话人识别(SpeakerRecognition),也称声纹说话人识别系统一般由训练模块和识别模块组识别(VoiceprintRecognition),是一种利用说话人的成。其原理如图1所示。语音特征与预先提取的说话人的语音特征相比较,进而确认和鉴别说话人身份的技术。说话人识别技术的研究始于二战时期美国的Bell实验室,经过几十年的研究和发展,说话人识别技术取得了突飞猛[2]进的发展。特别是1995年,

7、Reynolds对高斯混合[3-4]模型(GaussianMixtureModel,GMM)进行了详细介绍和应用,其简单、实用、高效的特点,使之成为说话人识别模式匹配过程中的重要技术。说话人识别可分为说话人确认(SpeakerVerification)和说话图1说话人识别系统原理框图人鉴别(SpeakerIdentification)两类。作者简介:刘冰(1985-),男,湖南省湘乡市人,工程硕士,主研方向:语音信号处理,说话人识别。收稿日期:2013-10-30·64·微处理机2014年2.1说话人

8、识别系统预处理Dπn(i-0.5)mfcc(n)=∑mel(i)cos()说话人识别系统的预处理过程一般可分为:采i=1M样与量化、预加重处理、加窗和端点检测。其中D=13,mfcc(n)即为原始的mfcc特征;语音信号经过采样和量化之后,信号由模拟转(6)一阶二阶差分:在原有13维mfcc特征的后为了数字信号。为便于频谱分析或声道参数分析,面加入13维的一阶和二阶差分构成39维的特征。需要对信号进行预加重。预加重可以用一阶数字滤可通过一个长度为5的窗函

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。