说话人识别方法综述[权威资料]

说话人识别方法综述[权威资料]

ID:15368908

大小:27.50 KB

页数:11页

时间:2018-08-02

说话人识别方法综述[权威资料]_第1页
说话人识别方法综述[权威资料]_第2页
说话人识别方法综述[权威资料]_第3页
说话人识别方法综述[权威资料]_第4页
说话人识别方法综述[权威资料]_第5页
资源描述:

《说话人识别方法综述[权威资料]》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、说话人识别方法综述  摘要:作为语音处理领域的主要技术之一,说话人识别以确认说话人身份为目标,在移动交互、身份验证、音频监控等领域有着广泛的应用前景。经过数十年的发展,说话人识别技术已经能够取得优秀的识别性能。本文将对说话人识别方法的研究现状进行总结与分析,介绍目前主流的说话人识别技术。  关键词:说话人识别;特征提取;说话人模型  TP391.41文献标识号:A2095-2163(2015)05-  AnOverviewofSpeakerRecognition  CHENChen,HANJiqing  (SchoolofComputerScience

2、andTechnology,HarbinInstituteofTechnology,Harbin150001,China)  Abstract:Asoneofthemaintechnologyofspeechprocessing,speakerrecognitionaimingatspeakerdistinguishing,hasabroadapplicationprospectinthefieldofmobileinteraction,authentication,audiomonitor,andsoon.Afterdecadesofdevelopm

3、ent,speakerrecognitionhasachievedahighaccuracy.Thispaperwillcarryonthesummaryandanalysisofspeakerrecognition,andintroducesthecurrentmainstreamtechnologyofspeakerrecognition.  Keywords:SpeakerRecognition;FeatureExtraction;SpeakerModeling  0引言  语音是人类之间交流情感与认知的重要信息载体,是在生活与工作中最基本、最自

4、然的交流方式。随着信息技术的发展,使得通过分析语音信号中的个人特征来识别说话人成为可能。说话人识别技术因其良好的准确性、经济性和可扩展性,拥有着广阔的发展空间[1],且已经作为一项重要的多媒体数据分析技术,应用在事务访问控制、身份验证、语音数据管理和音频监控等众多研究领域[2]。  对于说话人识别技术的研究,一直是计算机领域的热门话题。其研究历史可以追溯到第二次世界大战后期。在随后的几十年中,说话人技术快速发展,典型的研究成果有基于模式匹配和统计方差分析的说话人识别方法[3]、基于线性预测分析与倒谱分析的说话人识别方法[4],人工神经网络(Artifi

5、cialneuralnetwork,ANN)[5]、动态时间规整(Dynamictimewarping,DTW)技术[6]以及矢量量化(Vectorquantization,VQ)技术[7]。但随着精确度更高的概率模型的提出,上述方法逐渐推出了使用。具有代表性的概率模型是隐含马尔科夫模型(HiddenMarkovmodel,HMM)[8],由于HMM对说话人语音信号有较强的鲁棒性,能够同时把统计参数全部集成在一个统一的框架中,用状态转移规律刻画稳定段之间的变化过程,统计声学特征和时间上的变动,因此在说话人识别中得到广泛的应用。20世纪90年代,单状态的

6、HMM即获提出,也就是高斯混合模型(Gaussianmixturemodel,GMM)[9],随后则将通用背景模型(Universalbackgroundmodel,UBM)[10]引入到GMM中形成的GMM-UBM系统,由于其优异的识别性能、简单灵活的模型结构和初中的鲁棒性,成为文本无关的说话人识别系统领域里发挥开创性引领作用的重要研究称。  目前,说话人识别技术已经取得了巨大的进步,在科技发展的带动下,以说话人识别技术为载体的电子科技产品日益增加,但是在拓展说话人识别技术应用范围的同时,也使其面对了更多变更复杂的噪声干扰问题,这就对说话人识别技术提

7、出了更加严苛的要求和更为严峻的挑战。其中信道畸变所引起的干扰即是噪声干扰的主要来源。在GMM-UBM的基础上,以解决信道畸变问题的联合因子(Jointfactoranalysis,FA)[11]与i-vector[12]方法则相继获得提出,也已成为目前说话人识别领域中最为先进的技术之一。  本文将介绍说话人识别的基本原理,从特征提取和说话人模型两个方面,综合近年说话人识别领域的主要研究情况进行总结与评价。  1说话人识别基本框架  说话人识别的基本任务是通过分析语音信号中包含的说话人个性信息来识别待识别说话人的身份,其基本原理如图1所示。主要包括两个阶

8、段,即训练阶段与识别阶段。具体地,训练阶段根据说话人集合中每个说话人的训练语料,经特征提取后,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。