基于小波变换的说话人语音特征参数研究

基于小波变换的说话人语音特征参数研究

ID:39222441

大小:798.81 KB

页数:15页

时间:2019-06-27

基于小波变换的说话人语音特征参数研究_第1页
基于小波变换的说话人语音特征参数研究_第2页
基于小波变换的说话人语音特征参数研究_第3页
基于小波变换的说话人语音特征参数研究_第4页
基于小波变换的说话人语音特征参数研究_第5页
资源描述:

《基于小波变换的说话人语音特征参数研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于小波变换的说话人语音特征参数研究西安电子科技大学硕士学位论文宋丽亚摘要说话人识别是利用说话人的语音特征对说话人的身份进行辨认或确认。在说话人识别系统中,最重要的是能够从语音片断中提取代表说话人独有特征的稳定参数。针对短时傅立叶分析在提取说话人特征参数时的缺陷,本文通过对小波理论和说话人识别技术的研究,借鉴了一种传统的基于听觉机理的特征参数MFCC(Mel频域倒谱系数),利用小波变换、小波多分辨分析和小波包变换,构造出了两种基于小波变换的说话人识别特征参数:IWPTC(不完全小波包变换系数)和WPTC(小波包变换系数)。通过在Matlab平台上构建的说话人识

2、别系统(包括文本有关和文本无关),验证了这两种参数的有效性:它们的识别率均高于MFCC参数。理论和实验证明,利用小波变换提取的说话人识别特征参数相比于传统的短时分析方法确实具有更好的识别特性。关键词:说话人识别小波变换MFCC参数论文摘读绪论部分说话人识别技术虽然在近二十年得到了迅速发展,但仍然有许多问题需要解决,其中最关键的问题是,究竟用语音信号的哪些特征或特征变换来表征说话人才是有效而可靠的?语音信号是一种典型的非平稳时变信号,但是在10~30ms的短时段内,语音信号是近似平稳的,这是由于人的发音器官不可能是毫无规律地快速变化,因此其频谱特性和某些物理特征

3、参量可以近似看作是不变的,这样我们就可以用平稳过程的分析方法来处理语音信号了。传统意义上的特征参数构造就是基于短时平稳的假设,需要将原始信号分成10~30ms的短时帧,主要采用短时傅立叶变换的分析手段。由于短时傅立叶变换只具有单一分辨率的分析,所以本质上并不适合对语音信号这种非平稳时变信号的分析,用它提取的特征参数必是不完善的。时频分布理论和小波理论的兴起为非平稳信号的分析和表示提供了新的手段,并已经在语音信号的分析和表示方面取得了一定的成功,有很大的发展潜力。小波变换采用多分辨分析的思想,非均匀的划分时频空间,在低频时有高的频率分辨率和低的时间分辨率,在高频

4、时有低的频率分辨率和高的时间分辨率。这样对于频率成分复杂的语音信号,在服从不确定性原理的前提下,使不同的时频区都可以获得比较合适的时一频分辨率。目前,小波分析应用于端点检测、基音提取、语音编码等方面都有较成功的应用,但是对于说话人识别的特征参数提取方面涉及较少。用小波变换构造新的语音识别特征参数,不必受短时平稳假设的限制,所以作者希望借助于小波分析工具能够得到更高效的说话人识别特征参数。在这个过程中,作者借鉴了MFCC参数的提取过程,提取出了两种基于小波变换的特征参数:IWPTC(不完全小波包变换参数)、WPTC(小波包变换参数),在Matlab平台上进行了测

5、试,结果表明,采用这两种参数的说话人识别系统的识别率均高于MFCC参数。第四章基于小波变换的新参数(部分)4.1倒谱分析和MFCC参数倒谱特征是用于说话人个性特征表征和说话人识别的最有效的特征之一。语音信号是声道频率特性和激励信号源二者的共同结果,后者对于某帧而言常带有一定的随机性,而说话人的个性特征很大程度上取决于说话人的发音声道,即声道频率特性,因此,需要将二者进行有效地分离。由于语音信号是由激励信号与声道频率相卷积的结果,可以把信号作适当的同态滤波将卷积的两个部分分离,滤波的关键是先将卷积处理化为乘积,然后作对数处理,使之化为可分离的相加成份。人耳对声音

6、的感知在频域是非线性的,经验证明,在信号处理中考虑到非线性特性,能够使提取出来的特征参数更加强壮。Mel标度描述了人耳对频率感知的非线性特性。MFCC就是基于听觉系统的临界带效应、在Mel标度频率域提取出来的一种倒谱参数。许多实验表明,大部分情况下,MFCC优于其它倒谱系数。4.2基于小波变换的新参数1.新参数的提出通过对MFCC参数的提取原理和提取过程的分析,可以看到这种参数的提取还是基于短时平稳的假设条件:人为地将语音信号分割成10-20ms的帧序列以满足短时平稳的要求,为了减少截断误差又采用了帧叠的方法,这些手段都会导致计算误差的产生,影响语音处理的稳定

7、性和准确性。提取MFCC参数的核心是利用短时傅立叶变换,在第四章我们已经提到过短时傅立叶变换的缺陷:因其固定的窗口形状导致了对信号分析只能采用一定的时频分辨率,而不能兼顾二者,所以不太适合对语音信号这种非平稳信号进行分析。小波变换具有可变的时频分辨率,即在低频时有高的频率分辨率和低的时阃分辨率,在高频时有低的频率分辨率和高的时间分辨率,被称为“数学显微镜”,还具有实现简单和无平稳性要求等诸多优点,可以弥补短时分析的缺憾,能够对信号进行更细致的分析。从理论上讲,凡是传统使用短时分析的地方,在语音信号处理中,都可以用小波分析来代替。目前,小波分析应用于端点检测、基

8、音提取、语音编码等方面都有较成功的应用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。