病态嗓音特征的小波变换提取及识别研究.doc

病态嗓音特征的小波变换提取及识别研究.doc

ID:26835627

大小:167.00 KB

页数:5页

时间:2018-11-29

病态嗓音特征的小波变换提取及识别研究.doc_第1页
病态嗓音特征的小波变换提取及识别研究.doc_第2页
病态嗓音特征的小波变换提取及识别研究.doc_第3页
病态嗓音特征的小波变换提取及识别研究.doc_第4页
病态嗓音特征的小波变换提取及识别研究.doc_第5页
资源描述:

《病态嗓音特征的小波变换提取及识别研究.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、病态嗓音特征的小波变换提取及识别研究于燕平胡维平,摘要:通过分析嗓音的发音机理、病态嗓音与正常嗓音在频域的表现差异,利用小波变换对信号进行分解,突出病态嗓音的特点,本文提出了基于多尺度分析的小波降噪、分解的熵系数(EntropyCoefficientbasedonDe-noise,DecompositionofMulti-scaleAnalysis,ECDDMA)作为识别的特征矢量集。并对比分析了语音识别中经典特征参数Mel倒谱系数(MFCC),分别运用这两种特征参数对242例正常嗓音和234例病态嗓音运用高斯混合模型(GMM)进行了识别。

2、结果显示:ECDDMA系数较传统的模拟人耳听觉非线性特性的MFCC及其动态特征能更准确的表征正常与病态嗓音之间的差异,有利于同时提高病态和正常嗓音的识别率。关键词:高斯混合模型(GMM);病态嗓音;Mel倒谱系数(MFCC);小波变换1引言声带的各种病理性改变导致其振动和闭合异常,使得喉声源声学性质发生改变,出现不同程度的声音嘶哑[1]。目前国内较为常用的喉功能检查方法是利用计算机技术,采用Dr.speech软件进行正常嗓音及病态嗓音的多种声学参数分析,同时和电声图结合能进一步地对基频(F0)、频率微扰(Jitter)、振幅微扰(Shimm

3、er)、规范化噪声能量(NNE)等各种声学参数进行检测,但它们在有效检测病态嗓音方面都存在一定局限[2][3]。而计算机病态嗓音识别方法对临床实现无痛无损伤化嗓音检查具有重要的意义[4]。语音信号是一种非线性、非平稳的信号,以往求取特征的方法都是通过加窗傅立叶变换,这种变换最大的缺点就是不能同时提高时间与频率的分辨率,而小波变换则可以很好的克服这个缺点,它可以灵活的调整时-频窗,同时对时频分辨率作出贡献。在传统计算机语音识别方法中,因MFCC能比较充分利用人耳特殊感知特性而获得了广泛的应用[5],但有分析认为人耳在最初识别声音时使用的是小波

4、变换[6],结合病态嗓音在不同频率范围表现的差异[7],本文提出了基于多尺度分析的小波降噪、分解的熵系数(EntropyCoefficientbasedonDe-noise,DecompositionofMulti-scaleAnalysis,ECDDMA),并用实验证明了ECDDMA在病态嗓音识别中与传统特征相比的优越性。近年来,HMM广泛的用于语音识别,神经网络也被用于病态嗓音评估[8],作为状态数为1的连续型HMM的高斯混合模型(GMM)也同样得到了广泛的应用。由于在一个状态中可以包含多个高斯密度函数,不存在状态转移概率,因此在计算量

5、上GMM就比HMM要小得多。使用GMM对病态嗓音和正常嗓音尝试识别率。特征使用目前广泛应用于语音识别的MFCC参数及提出的ECDDMA参数,并比较其识别效果。2数据来源本文实验数据来源于临床病例,采集数据时的环境要求在安静的室内进行;采样频率为16kHz,时间1.5s至3s;受试声样为汉语元音‘a’,分别对正常人和患有各类喉科疾病的对象进行语音采样。正常对照组242例,年龄18—40周岁,平均年龄25周岁,经询问近期无喉部疾病者;病态嗓音组234例,年龄15—50周岁,平均年龄27周岁,为前来医院就诊临床病例。采集后用cooledit软件进

6、行语音分割,得到实验用语音库。3高斯混合模型(GMM)GMM作为高斯概率密度函数的一个线性组合,只要有足够数目的混合分量,就可以逼近任意一种密度函数。一个M阶混合高斯模型的概率密度函数是由M个高斯概率密度函数加权求和得到的,所示如下:(1)其中,X是一个D维随机向量,是子分布,,,是混合权重。每个子分布是D维的联合高斯概率分布,可表示为:(2)其中代表此密度函数的均值向量,则代表此密度函数的协方差矩阵,混合权重需满足:(3)完整的混合高斯模型有参数表示为:(4)GMM模型参数估计最常用的参数估计方法是最大似然(MaximumLikeliho

7、od,简称为ML)估计。对于一组长度为T的训练矢量序列GMM的似然度可以表示为:(5)由于上式是参数的非线性函数,很难直接求出上式的最大值。因此,常常采用EM(ExpectionMaximization,简称为EM)算法估计参数。对于多观察序列迭代的ML重估公式为:(6)(7)(8)其中c为观察序列的数目,是模型的第c个观察序列的长度,是第c个观察序列的第k个混合成分在时间t是的概率:(9)4基于小波变换的特征提取4.1二进离散小波变换原理及其Mallat算法为了便于计算机的处理,在对嗓音信号进行小波分析时,不仅对尺度参数和时移参数进行离散

8、化处理,而且信号在时间上也是离散的,并表示为,这种情况下的母小波和相应的小波都应该是离散时间的,分别用和表示,(10)则关于的离散二进小波变换((DWT)表示为(11)其中是的共

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。