基于mfcc和lsp混合的语音特征参数的技术研究(1)

基于mfcc和lsp混合的语音特征参数的技术研究(1)

ID:30641048

大小:19.57 KB

页数:7页

时间:2019-01-02

基于mfcc和lsp混合的语音特征参数的技术研究(1)_第1页
基于mfcc和lsp混合的语音特征参数的技术研究(1)_第2页
基于mfcc和lsp混合的语音特征参数的技术研究(1)_第3页
基于mfcc和lsp混合的语音特征参数的技术研究(1)_第4页
基于mfcc和lsp混合的语音特征参数的技术研究(1)_第5页
资源描述:

《基于mfcc和lsp混合的语音特征参数的技术研究(1)》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果基于MFCC和LSP混合的语音特征参数的技术研究(1)摘要本文提出了一种基于MFCC和LSP(LineSpectrumPair)的混合语音特征参数,有效地弥补了单纯使用MFCC的不足,实验中利用加权的欧几里德距离计算特征矢量的失真距离,结果表明新的特征矢量能够很好的表征语音信号的特征信息,能有效降低系统的误识率。关键字特征提取;MFCC;LSP;欧几里德距离1引言随着教学制度的深入改革,在英语教

2、学中,人们越来越注重“听”“说”这一类的实际交流能力,口语测试环节已经得到越来越多教育专家的关注,我们清醒地认识到,说的能力实际上也包括了对于听和读的能力训练。在现代计算机多媒体技术与网络技术飞速发展的前提下,很多英语教学系统的设置已经越来越科学化人性化,利用计算机辅助设计,评估英语发音者口语发声质量已经成为教学中的重要一环。除了应用于教育背景之下,目前也有一些跨国公司,在招聘员工面试时采用了一种名为PhonePass™SET的机制,就是通过一部电话机,在短短几分钟内,由机器对面试者的外语口语进行一次综合测评。由此可见,口语测

3、评已成为实用外语中一项不可缺少的工作。课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果口语测试的评分一般分为两种:一种是自动评分,一种为专家评分。目前我们进行的大量研究工作都是针对前一种的,希望尽可能脱离人的主观因素对口语测试者的发音客观评分,评分的客观性表现在给出的分数只由被测者个人的表现决定,不会受到评分专家对于测试者的个人印象

4、,特定环境下单个被测群体的平均水平限制,以及发音的个体性差异等因素影响。这就对我们的计算机辅助设计提出了很高的要求。我们主要用到的技术是语音识别和统计模型的相关理论,通过提取被测者语音信号的特征参数,计算机对其经过一系列数字信号处理,从而在统计模型中对它进行分析测评。因此,提取特征参数的类型就显得尤为重要了,目前应用最为广泛的特征系数是Mel频率倒谱参数。已经有大量实验表明,较之其它类型参数,它能够更好的反映人耳听觉肌理的特征[1]。本文中以非线性的特征参数MFCC为主,结合了语音信号的另一个重要参数——线谱对参数LSP,提出

5、了一种语音特征参数的混合使用方法,使发音质量判决系统的正确率有所改进。2特征提取特征参量的选择和提取对于实现语音识别系统有关键的意义,理想的特征参数必须用较少的特征维数包含尽可能多的语音特征信息。.1MFCC特征参数MFCC系数是基于人耳的听觉特性,所谓Mel频率尺度,它的值大体上对应于实际频率的对数关系。其与实际频率的具体关系如下:其中实际频率f的单位为Hz。根据Zwicker的工作,临界频带宽随着频率的变换而变化,并与Mel频率的增长一致。在1000Hz以下,大致呈线性分步,带宽为100Hz左右;在1000Hz课题份量和难

6、易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果以上呈对数增长。类似于临界带的划分,可以将语音频率划分为一系列三角形的滤波器序列,即美尔滤波器组。在Mel滤波器的选择中,滤波器组的选择一般都选择三角形滤波器,可以根据不同的应用选择其他的形状如矩形、正弦形的滤波器组。滤波器的个数一般取24。当信号通过滤波器组时,取每个三角形滤波器频率带宽内所有信

7、号幅度加权和作为每个带通滤波器的输出,然后对所有滤波器输出做对数运算,最后进一步通过离散余弦变换降低特征矢量的维数,得到的参数就是美尔频率倒谱参数(MFCC)[2]。由于MFCC更好的反映了人耳的听觉系统的非线性特性,在参数的抗噪声性能和提高系统的识别率方面具有优势,在实际应用中还可以将MFCC和其差分参数结合起来作为一组特征矢量进行训练,进一步提高系统的抗噪声性能。2.线谱对参数LSP语音信号的谱特性,除了音调周期外,全部包含在线性预测系数LPC里面了[3]。LSP即是线性预测系数的一种推演参数,定义为如下多项式的根:课题份

8、量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果各个根的频率在单位圆上相互交错排列,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。