人耳听觉仿声机理的研究

人耳听觉仿声机理的研究

ID:34474330

大小:140.23 KB

页数:4页

时间:2019-03-06

人耳听觉仿声机理的研究_第1页
人耳听觉仿声机理的研究_第2页
人耳听觉仿声机理的研究_第3页
人耳听觉仿声机理的研究_第4页
资源描述:

《人耳听觉仿声机理的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、维普资讯http://www.cqvip.comJ伽mS~ndongNormaJUnJver~,Jty山东师大学报(自拣科学版)1991午第6卷第l期(总第33期)(Na~ratsder∞F.~on)Vo1.6.Nol(.SumNo.33)1991人耳听觉仿声机理的研究王琳江铭虎(山求教育学院生化暴)(山东工业大学计算机系)摘要奉文从生抽轴理学的角度研宽了^年听分析嚣的机械变压肆用厦捷能作用,阐述了^耳的话产从机械囊率分析到生抽电分析的垃租.对目前话音识剁中几种特枉}敷的识别战略夏算法进行了失磕对比,指出1目前语音识射模型存在的同意及这几种誊戢识列的局限性.置掘的精力及与^耳听

2、觉的盖距.差t调语音识删,信息处理.敷据处理。引言人耳听觉仿声机翻——计算机语言识别是一门交叉性的边缘学科,它所面临的任务是使机器听懂人的语音,由于人类对自身的听觉器官、发声器官的机制认识还相当肤浅,使现有的理论和识别模型有很大的局限性,加上语音信号本身的复杂性,它不仅是一种物理现象,而且是一种复杂的社会现象、涉及的学科甚广,现已掌握的技术距离真正解决问题还差得很远,因此从生物物理学和信息处理的角度来进一步考察语言的听觉机理,并与现有智能听觉模塑的系统方案进行对比研究,使听觉模型进一步地应用于语言识别技术,对推动语言识别的研究具有现实的重要意义。1人耳的感声机理1.1耳蜗的感音

3、换能作用人耳中最重要部分是内耳的耳蜗,耳蜗内部是高度精密的结构,它的作用是把传到耳蜗的机械振动,即压变能转换为沿着听觉神经的上万条纤维传导的电信号,在这一转换过程中,耳蜗基底膜的振动是一个关键因素,基底膜上随有毛细胞,基底膜的任何运动都会使毛细胞产生弯曲和扭转,各种各样的应力和张力如作用在毛细胞上,都将在连接着它们的纤维上激起神经活动,并发生电冲动流涌向昕神经。机械反应把声频和声强转变为各式各样的振动在基底膜上移行,然后神经细胞就对这种信息进行分析,把信号沿着神经通道传送到脑,信号在前进的途中,要完成几件不同的任务:提取特定的声信息、确定声源的位置,粗略测定声的响度和分解音谓的

4、成分。1.2耳对声的傅氏分析作用耳蜗中的基底膜的宽度乃随着它从卵圆窗向蜗顶的延伸而增加,其韧性是随之而递减的,卵圆窗这一端的膜比蜗顶那一端的膜要韧百万倍左右,’与此同时,基底膜上科蒂氏器官的高度和重量。也随着基底膜的加宽而变大,这些因索决定了基底膜愈靠近底部,共振频率愈高,愈靠近顶部,井振频率愈低,这些因素就使得低频振动引起的行波在向顶部传播时阻力较小,而高频振动只髓局限在低部附近,即不同频率的声音I起行波都从基底膜底部开收倍日期;j990—05-25维普资讯http://www.cqvip.com第1期王琳等:人耳听觉螗声机理的研究始,根据共振频率的不同,行波所传到的部分和最

5、大行波振幅出现的部位有所不同,振动频率愈低,行波传播愈远,最大振幅出现的部位愈靠近基底膜顶部,而且在最大振幅出现以后,行波很快消失,不再传播,相反地,高频率振动引起的基底膜振动,只局限于卵圆窗附近,不同频率的声音i起的不同形式的基底膜的振动是耳蜗能区分不同声音频率的基础,这种把声信号的频率改编成基底膜上某一特定振动位置的功能,就是耳对输入信号进行着粗略的非线性傅氏分析,不难理解,既然每一种振动频率在基底膜上都有一个特定的行波传导范围和最大振幅区,与这一区域有关的毛细胞和听神经纤维就会受到最大的刺激,这样,不同来源和组合的听神经纤维将神经冲动传到昕觉中枢中不同的部位,最后产生不同

6、音调的感觉。2机器智能听觉2.1智能听赏的机理智能听觉即语音识4系统是将语音信号经变换及特征提取,建立训练样本的参考数据库,将待识样本与参考样本运用模式识别技术进行最小距离的匹配比较,求得最佳结果哪.语言信息的主要载体是随时间变化的短时谱,常用的求取语谱信息的方法有通道式滤波器组法,LPC系数法等,它是从语音感知的角度来考虑的,人耳分辨语音主要根据信号的幅度频谱,特别是听觉系统对能量比较集中的频率区域比较敏感.带通滤波器组法可以直接获得语音信号的谱包络,它是试图逼近人耳的频谱分析特性,听觉上的一个重要特性就是人耳的频谱分辨能力,从低端到高端近似对数分布,在高频范围内,人耳只对信

7、号做大致的分析,因而具有宽带特性,同时由于这种高频端的宽带特性导致人耳能在时域上对辅音及过渡音有较高分辨能力.线性预测系数法是根据语音产生的激励/滤波器模型,按模式识别中的最小失真原理导出的全极滤波器系数,其全极谱反映了平精后的短时谱包络,可用正交多项式逼近谱的高阶变化来模拟人耳的有关听觉特征.2.2几种识别方案的实验比较2.2.1实验环境和装置实验是在普通计算机房环境下,使用mM—PC/AT微型机.滤波器组系统由语音从话筒输入经放大后,通过l6路带通滤波器组滤波及峰值检波、低通滤波形式语音

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。