基于相关维数的病变连续语音检测算法

基于相关维数的病变连续语音检测算法

ID:40918961

大小:330.08 KB

页数:5页

时间:2019-08-10

基于相关维数的病变连续语音检测算法_第1页
基于相关维数的病变连续语音检测算法_第2页
基于相关维数的病变连续语音检测算法_第3页
基于相关维数的病变连续语音检测算法_第4页
基于相关维数的病变连续语音检测算法_第5页
资源描述:

《基于相关维数的病变连续语音检测算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、华南理工大学学报(自然科学版)第40卷第6期JournalofSouthChinaUniversityofTechnologyVol.40No.62012年6月(NaturalScienceEdition)June2012文章编号:1000-565X(2012)06-0001-05*基于相关维数的病变连续语音检测算法贺前华何俊李艳雄王志峰(华南理工大学电子与信息学院,广东广州510640)摘要:针对人为设定最优采样延迟不能客观反映信号采样延迟和固定相关维数不易描述病变异常语音复杂性的缺陷,文中提出一种基于相关

2、维数的病变连续语音检测算法.该算法在语音信号合理采样延迟区间内不断调整采样延迟,搜索使正常语音与病变连续语音的区分等错误率达到最小的嵌入相关维数,以避免设定采样延迟的缺陷.同时,通过将相关维数曲线划分成子区间,并判定子区间的稳定性,以达到不固定嵌入相关维数的目的.最后,对每个合理采样延迟时间内获取的训练语音的最优相关维数进行等错误率分析,选用具有最小等错误率的相关维数及对应的采样延迟为文中混沌参数,为测试语音提取混沌指数进行正异常区分.实验结果表明,该算法的区分正确率为75.6%,分别比GMM-SVM、Shi

3、mmer、固定相关维和采样延迟法、SHR算法和Jitter算法提高7.8%、9.3%、16.0%、18.0%和20.4%.关键词:病变连续语音检测;相关维数;延迟区间;语音信号处理中图分类号:TN912.3doi:10.3969/j.issn.1000-565X.2012.06.001异常语音主要是由于说话人情绪不稳、发音器区分率受制于测试语音的时长.语音在产生过程中官短时功能性疾病、特意改变说话方式和习惯所产存在一些不能用声学参数表征的非线性现象,在发[12]生的语音,这类语音使常用的语音处理算法的性能音器

4、官病变时这种现象更为突出.近年来,混沌理急剧下降.近年来异常语音处理受到越来越广泛的论中的最大李雅普诺夫指数(LLE)和相关维(CD)[1-3]关注,已成为语音信号处理领域的研究热点.被视为一种新的非线性方法且广泛应用于正常与病[12-14]近年来,病态异常语音检测与跟踪获得了快速的变异常单元音/ɑ/的区分.[4-6][7]发展,检测算法大致分为基于扰动的算法和对于如何获取和权衡最优嵌入维数m、最优延[8]基于噪声参数(如谐波噪声比HNR、归一化噪声迟,Takens重构原理没有给出具体的解决方法,通[9][1

5、5]能量NNE、声门噪声激励比GNE等)的算法.然而,常根据互信息函数的第一个最小值(FMMI)或自病变连续语音中的清辅音以及声门的打开或关闭不相关函数的第一个零值(FZA)来获取信号的采样延完全而产生的嘶哑声会影响扰动参数和噪声参数的迟,但这种延迟受噪声的影响很大.用虚假邻域的方[16]准确提取.为克服这两类算法的缺陷,文献[10-11]法来评估嵌入维数m,用阈值来判定嵌入曲线的饱[13]中提出了基于高斯混合模型(GMM)和支持向量机和度,其性能受限于给定的阈值.Henriquez等结合[17](SVM)的

6、病变语音识别算法,但其对单元音/ɑ/的相关维数和信息熵分别对选自于商业数据库MEEI收稿日期:2011-11-14*基金项目:国家自然科学基金资助项目(60972132,61101160);广东省自然科学基金团队项目(9351064101000003);广东省自然科学基金博士科研启动项目(10451064101004651);华南理工大学中央高校基本科研业务费专项资金资助项目(2011ZM0029)作者简介:贺前华(1965-),男,教授,博士生导师,主要从事语音及音频信号处理、嵌入式系统开发等的研究.E-m

7、ail:eeqhhe@scut.edu.cn2华南理工大学学报(自然科学版)第40卷NvNv的53个和173个病变元音/ɑ/进行区分,所得全局1Cm(ε)=2∑∑φ(ε-dij),i≠j(3)正确率为82.47%,但检测病变连续语音时,需要假Nvi=1j=1定采样延迟和固定相关维,不易客观描述发音系统1,x>0式中,φ为heaviside函数,φ(x)=.的复杂性.元音因能较好地刻画发音时声带和声门{0,x≤0的运动情况而常用于病变语音的分析检测,但用户对于足够小的ε,相关积分逼近为为提高声纹认证系统的安全性

8、而提供任意身份认证lnCm(ε)=lnC+D(m)lnε(4)语音.因此,仅研究病变元音/ɑ/不能满足各类声纹因此,计算给定m维相空间的混沌时间序列的相关身份认证系统的需求.维定义为针对设定最优采样延迟不能准确反映采样延迟lnCm(ε)随信号最大分析频率的变化、遍历搜索最优延迟时D(m)=(5)lnε间开销大、固定相关维数不能客观描述病变异常连1.2确定最优相关维集的算法步骤续语音生成系统复杂特性的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。