小议声纹识别,听声辨人

小议声纹识别,听声辨人

ID:24115903

大小:52.00 KB

页数:4页

时间:2018-11-12

小议声纹识别,听声辨人_第1页
小议声纹识别,听声辨人_第2页
小议声纹识别,听声辨人_第3页
小议声纹识别,听声辨人_第4页
资源描述:

《小议声纹识别,听声辨人》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、小议声纹识别,听声辨人声纹识别听声辨人近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和正确性等上风受到众人瞩目,并日益成为人们日常生活和工作中重要且普及的平安验证方式。声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。和语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它夸大说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它夸大共性。声纹识别系统主要包括两部分,即特征检测和模式匹配。特征检测的任务是选取唯一表现

2、说话人身份的有效且稳定可靠的特征,模式匹配的任务是对练习和识别时的特征模式做相似性匹配。1.特征提取声纹识别系统中的特征检测即提取语音信号中表征人的基本特征,此特征应能有效地区分不同的说话人,且对同一说话人的变化保持相对稳定。考虑到特征的可量化性、练习样本的数目和系统性能的评价新题目,目前的声纹识别系统主要依靠较低层次的声学特征进行识别。说话人特征大体可回为下述几类:谱包络参数语音信息通过滤波器组输出,以合适的速率对滤波器输出抽样,并将它们作为声纹识别特征。基音轮廓、共振峰频率带宽及其轨迹这类特征是基于发声器官如声门、声道和鼻腔的生理结构而提取的参数。线性猜

3、测系数使用线性猜测系数是语音信号处理中的一次奔腾,以线性猜测导出的各种参数,如线性猜测系数、自相关系数、反射系数、对数面积比、线性猜测残差及其组合等参数,作为识别特征,可以得到较好的效果。主要原因是线性猜测和声道参数模型是相符合的。反映听觉特性的参数模拟人耳对声音频率感知的特性而提出了多种参数,如美倒谱系数、感知线性猜测等。此外,人们还通过对不同特征参量的组合来进步实际系统的性能,当各组合参量间相关性不大时,会有较好的效果,由于它们分别反映了语音信号的不同特征。2.模式匹配目前针对各种特征而提出的模式匹配方法的探究越来越深进。这些方法大体可回为下述几类:概率

4、统计方法语音中说话人信息在短时内较为平稳,通过对稳态特征如基音、声门增益、低阶反射系数的统计分析,可以利用均值、方差等统计量和概率密度函数进行分类判决。其优点是不用对特征参量在时域上进行规整,比较适合文本无关的说话人识别。动态时间规整方法说话人信息不仅有稳定因素(发声器官的结构和发声习惯),而且有时变因素(语速、语调、重音和韵律)。将识别模板和参考模板进行时间对比,按照某种间隔测定得出两模板间的相似程度。常用的方法是基于最近邻原则的动态时间规整DTU和IBM被用于语音识别。它把语音看成由可观察到的符号序列组成的随机过程,符号序列则是发声系统状态序列的输出。在

5、使用HMM识别时,为每个说话人建立发声模型,通过练习得到状态转移概率矩阵和符号输出概率矩阵。识别时计算未知语音在状态转移过程中的最大概率,根据最大概率对应的模型进行判决。HMM不需要时间规整,可节约判决时的计算时间和存储量,在目前被广泛应用。缺点是练习时计算量较大。人工神经X络方法人工神经X络在某种程度上模拟了生物的感知特性,它是一种分布式并行处理结构的X络模型,具有自组织和自学习能力、很强的复杂分类边界区分能力以及对不完全信息的鲁棒性,其性能近似理想的分类器。其缺点是练习时间长,动态时间规整能力弱,X络规模随说话人数目增加时可能大到难以练习的程度。把以上分

6、类方法和不同特征进行有机组合可明显进步声纹识别的性能,如NTT实验室的T.Matsui和S.Furui使用倒谱、差分倒谱、基音和差分基音,采用VQ和HMM混和的方法得到99.3的说话人确认率。对于说话人确认系统,表征其性能的最重要的两个参量是错误拒尽率和错误接受率。前者是拒尽真实的说话人而造成的错误,后者是接受假冒者而造成的错误,二者和阈值的设定相关。说话人确认系统的错误率和用户数目无关,而说话人辨认系统的性能和用户数目有关,并随着用户数目的增加,系统的性能会不断下降。总的说来,一个成功的说话人识别系统应该做到以下几点:能够有效地区分不同的说话人,但又能在同

7、一说话人语音发生变化时保持相对的稳定,如感冒等情况。不易被他人模拟或能够较好地解决被他人模拟新题目。在声学环境变化时能够保持一定的稳定性,即抗噪声性能要好声纹识别应用远景和其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,声纹识别除具有不会遗失和忘记、不需记忆、使用方便等优点外,还具有以下特性:用户接受程度高,由于不涉及隐私新题目,用户无任何心理障碍。利用语音进行身份识别可能是最自然和最经济的方法之一。声音输进设备造价低廉,甚至无用度(),而其他生物识别技术的输进设备往往造价昂贵。在基于电信X络的身份识别应用中,如银行、炒股、电子购物等,和其他生物

8、识别技术相比,声纹识别更为擅长,得天独厚。由于和其他

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。