声纹识别技术ppt课件.ppt

声纹识别技术ppt课件.ppt

ID:58596813

大小:644.50 KB

页数:19页

时间:2020-10-20

声纹识别技术ppt课件.ppt_第1页
声纹识别技术ppt课件.ppt_第2页
声纹识别技术ppt课件.ppt_第3页
声纹识别技术ppt课件.ppt_第4页
声纹识别技术ppt课件.ppt_第5页
资源描述:

《声纹识别技术ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、声纹识别11120374刘宣缇11120526石雪娜11120527唐子淑声纹识别1、概述2、声纹识别系统3、特征提取4、模式匹配5、应用和发展前景简介声纹识别(VPR),生物识别技术的一种,也称为说话人识别,是从说话人发出的语音信号中提取声纹信息。声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。原理:人在讲话时使用的发声器官在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。分类(按任务)(1)说话人辨认(SpeakerIdentification)(2)说话

2、人确认(SpeakerVerification)。前者用以判断某段语音是若干人中的哪一个所说的,是“多选一”问题;而后者用以确认某段语音是否是指定的某个人所说的,是“一对一判别”问题。缩小刑侦范围银行交易声纹识别分类分类(按类型)(1)文本相关的(Text-Dependent)(2)文本无关的(Text-Independent)文本有关的声纹识别系统要求用户按照规定的内容发音,每个人的声纹模型逐个被精确地建立,而识别时也必须按规定的内容发音,因此可以达到较好的识别效果,但系统需要用户配合。文本无关的声纹

3、识别系统则不规定说话人的发音内容,模型建立相对困难,但用户使用方便,可应用范围较宽。声纹识别系统声纹识别系统的工作过程一般可以分为两个过程:训练过程和识别过程。无论训练还是识别,都需要首先对输入的原始语音信号进行预处理。声纹识别系统框图识别结果训练识别训练还是识别建立模型声学模型模式匹配特征提取语音信号预处理采样、量化、预加重和加窗等处理声纹识别——特征提取特征提取是把一帧原始语音信号转化为N维的特征矢量,运算步骤如下:语音信号加窗(如海明窗)计算频谱(FFT)MEL分段(三角滤波)对数变换log()余

4、弦反变换cos()特征提取过程(Processoffeatureextraction)语音信号加窗(如海明窗)计算频谱(FFT)MEL分段(三角滤波)对数变换log()余弦反变换cos()语音信号加窗(如海明窗)计算频谱(FFT)MEL分段(三角滤波)对数变换log()余弦反变换cos()语音信号加窗(如海明窗)计算频谱(FFT)MEL分段(三角滤波)对数变换log()余弦反变换cos()语音信号加窗(如海明窗)计算频谱(FFT)MEL分段(三角滤波)对数变换log()离散余弦变换DCT声纹识别——建立

5、声学模型VQ矢量量化矢量量化是把所有矢量(设为M个)进行归类,设矢量Xi(i=0~M-1)到距离最近的矢量中心Yj(j=0~N-1)的量化误差为则量化M个矢量的平均量化误差为通过LBG聚类算法找出能使D达到最小的矢量中心集合。这个集合构成了一套码本,它是M个矢量在N维空间最佳分布的体现,即说话人发音的声学特征的体现。所有说话人码本的集合构成声学模型。声纹识别——模式匹配模式匹配识别判断的目的:获取表现说话人个性的特征参数的基础上,将待识别的特征参数模板或模型与训练学习时得到的模板或模型库作相似性匹配,得

6、到特征模式之间的相似性距离度量,并选取适当的距离度量作为门限值,从而识别判断出可能结果中最好的结果。声纹识别——模式匹配在模式匹配中常用的方法有:(1)模板匹配方法:主要用于固定词组的应用(通常为文本相关任务);(2)最近邻方法:训练时保留所有特征矢量,识别时对每个矢量都找到训练矢量中最近的K个,据此进行识别,通常模型存储和相似计算的量都很大;(3)神经网络方法;(4)隐式马尔可夫模型(HMM)方法:通常使用单状态的HMM,或高斯混合模型(GMM),是比较流行的方法,效果比较好;(5)VQ聚类方法(如L

7、BG):效果比较好,算法复杂度也不高;(6)多项式分类器方法:有较高的精度,但模型存储和计算量都比较大;语音识别与声纹识别(1)前者考虑的是语言的内容,而后者则更注重声音特征;(2)前者目的是让机器听懂人说的话并能将其转换成文本,后者目的则是让机器自动识别说话人身份。语音识别的特征提取是从语音波形中提取重要的反映语音特征的相关信息,但一定要去掉说话人的特征。而声纹识别则是要提取语音信号中表征人的基本特征。生物识别技术比较错误接受率错误拒绝率容易实用性处理速度/人指纹识别很低较低好2s-5s掌纹识别低5%

8、使用困难5s-10s人脸识别低<0.2%非常好≤5s虹膜识别很低约10%需要培训才能使用,手工操作对虹膜有困难仪器自动对准虹膜需要3s-5s,手工操作需要5s-25s视网膜识别未知未知不好15s-30s声纹识别低低可以1s-3s签名识别低10%一般5s-10s声纹识别特性:声纹识别除具有不会遗失和忘记、不需记忆、使用方便等优点外,还具有以下特性:第一,声纹识别是一种非接触的识别技术,用户接受程度高,由于不涉及隐私问题,用户无任何心理障碍。第

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。