语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏

语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏

ID:44997086

大小:1.24 MB

页数:58页

时间:2019-11-07

语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏_第1页
语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏_第2页
语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏_第3页
语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏_第4页
语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏_第5页
资源描述:

《语音信号处理PPT_第十 十一章_说话人识别 语种识别 语音隐藏》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、说话人识别语种识别语音隐藏刘迪源10.1概述10.2说话人识别方法和系统结构10.3应用DTW的说话人确认系统10.4应用VQ的说话人识别系统10.5应用HMM的说话人识别系统10.6应用GMM的说话人识别系统10.7说话人识别中尚需进一步探索的研究课题10.1概述自动说话人识别(AutomaticSpeakerRecognition)是一种自动识别说话人的过程。说话人识别和语音识别的区别在于,它不注重包含在语音信号内的文字符号以及语意内容信息,而是着眼于包含在语音信号中的个人特征,提取说话人的这些个人信息特征,以达到识别说话人的目的。说话人识别分类按其最终

2、完成的任务可以分为两类:自动说话人确认(简称ASV):确认一个人的身份,只涉及一个特定的参考模型和待识别模式之间的比较,只做“是”和“不是”的判决。自动说话人辨认(简称ASI):必须辨认出待识别的语音是来自待考察认中的哪一个,有时还要对这个人以外的语音做出拒绝的判决。按测试方法分类:与文本无关:不规定说话内容与文本有关:规定固定的说话内容文本指定型:每次规定不同的说话内容10.2说话人识别方法和系统结构说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。图10-1是说话人识别系统的

3、结构框图,它由预处理、特征提取、模式匹配和判决等几大部分组成。预处理特征提取模式匹配参考模板判决语音输入识别训练识别结果图10-1说话人识别系统框图预处理特征提取模式匹配参考模板判决语音输入识别训练识别结果说话人识别系统框图10.2.1预处理首先对输入语音信号进行数字化,然后进行端点检测、预加重、加窗、分帧等和语音识别的区别:1.抽样频率可能更高。可以多保留一些说话人的高频信息。2.帧和帧长选定不同。应用较长时段语音特征信息以及若干帧范围内过度特征信息。预处理特征提取模式匹配参考模板判决语音输入识别训练识别结果说话人识别系统框图10.2.2特征提取个人特征:

4、1.发音器官的差异(静态特征)代表性特征参数有倒谱和基音参数2.发音动作的差异(动态特征)代表性特征参数是差值倒谱和差值基音由于基音特征只存在于浊音中,说话人识别一般采用倒谱特征参数在理想情况下,选取的特征应当满足下述准则:能够有效地区分不同的说话人,但又能在同一说话人的语音发生变化时相对保持稳定。易于从语音信号中提取不易被模仿尽量不随时间和空间变化10.2.2特征提取说话人识别常用参数分类:线性预测参数及其派生参数(LPC,LPCC)语音频谱直接导出的参数(MFCC,PLP)混合参数(Pitch+MFCC,Pitch+LPCC)其他鲁棒性参数10.2.2特

5、征提取所用特征误识率倒谱9.43%差值倒谱11.81%基音74.42%差值基音85.88%倒谱与差值倒谱7.93%倒谱、差值倒谱、基音、差值基音2.89%10.2.3特征参量评价方法在给定一种识别方法后,识别的效果主要取决于特征参数的选取。对于某一维单个的参数而言,可以用F比来表征他在说话人识别中的有效性。可以选取两种分布的方差之比(F比)作为有效性准则。其中:第i个说话人的第a次话音特征预处理特征提取模式匹配参考模板判决语音输入识别训练识别结果10.2说话人识别系统框图10.2.4模式匹配方法概率统计方法动态时间规整方法(DWT,DynamicWrapin

6、gtime)矢量量化方法(VQ,vectorquantization)隐马尔科夫模型方法(HMM,hiddenmarkovmodel)人工神经网络方法(ANN,artificalneuralnetwork)预处理特征提取模式匹配参考模板判决语音输入识别训练识别结果10.2说话人识别系统框图10.2.5判别方法和阈值的选择图10-2两种错误率与接受门限的关系判决门限错误概率误拒率FR误受率FAabc010.2.6说话人识别系统的评价错误拒绝率FR,错误接受率FA女男女男辨认确认使用人数差错率0图10-3说话人辨认与确认系统性能与用户数关系10.3应用DTW的说

7、话人确认系统一个应用DTW说话人识别系统如图10-4所示。全波整流及积分16BPFGA/D转换对数运算压缩为4bit频谱特征字音边带检测动态时间匹配字音特征存储判决逻辑字音积分语音输入接受拒绝图10-4DTW说话人识别系统确认训练特点:1.在结构上基本沿用语音识别的系统2.利用使用过程中的数据修正原模板文本相关10.4应用VQ的说话人识别系统特征参数提取特征参数提取说话人模型1..说话人模型N说话人1..说话人N阈值Ti判决训练语音测试语音VQ码本建立识别结果图10-5应用VQ的说话人识别系统应用VQ的说话人识别过程的步骤如下:训练过程从训练语音提取特征矢量

8、,得到特征矢量集;通过LBG算法生成码本;重复训练修

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。