数字语音处理及MATLAB仿真第二章

数字语音处理及MATLAB仿真第二章

ID:42047048

大小:2.75 MB

页数:60页

时间:2019-09-06

数字语音处理及MATLAB仿真第二章_第1页
数字语音处理及MATLAB仿真第二章_第2页
数字语音处理及MATLAB仿真第二章_第3页
数字语音处理及MATLAB仿真第二章_第4页
数字语音处理及MATLAB仿真第二章_第5页
资源描述:

《数字语音处理及MATLAB仿真第二章》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章语音信号的数字模型2.1概述12.2语音的发音机理2.3语音的语音听觉机理32.4语音的感知42.5语音信号模型52.6语音信号数字模型622.1概述本章重点介绍语音信号产生的数字模型,对语音信号的特性和听觉特性做一般介绍。2.2语音的发音机理2.2.1人的发音器官1.组成⑴肺和气管组成声源;⑵喉和声带称为声门;⑶由咽腔、口腔、鼻腔组成声道;图2.1发音器官机理模型2.功能肺:产生压缩气体,通过气管传送到声音生成系统。喉:控制声带运动的复杂系统。主要包括:环状软骨、甲状软骨、杓状软骨、声带。声门:声带之间的间隙称

2、为声门。主要功能:产生激励。声道:声道指声门至嘴唇的所有发音器官。包括:咽喉、口腔和鼻腔。主要功能:传输调制声波。声道的形状变化由舌、软腭、唇、牙决定。口腔包括:上下唇、上下齿、上下齿龈、上下腭、舌和小舌等部分。上腭又分为:硬腭和软腭两部分;舌又分为:舌尖、舌面和舌根三部分。鼻腔在口腔上面,靠软腭和小舌将其与口腔隔开。当小舌下垂时,鼻腔和口腔便耦合起来,当小舌上抬时,口腔与鼻腔是不相通的。口腔和鼻腔都是发音时的共鸣器。图2.3声道纵剖面图2.2.2语音生成图2.1为语音生成其机理模型。空气由肺部排入喉部,经过声带进入声

3、道,最后由嘴辐射出声波,这就形成了语音。在声门(声带)以左,称为“声门子系统”,它负责产生激励振动;右边是“声道系统”和“辐射系统”。当发不同性质的语音时,激励和声道的情况是不同的,它们对应的模型也是不同的。图2.1发音器官机理模型语音生成动作可分为两种功能:(1)激励(2)调制2.2.2语音生成-浊音空气流经过声带时,如果声带是崩紧的,则声带将产生张弛振动,即声带将周期性地启开和闭合。声带启开时,空气流从声门喷射出来,形成一个脉冲,声带闭合时相应于脉冲序列的间隙期。因此,这种情况下在声门处产生出一个准周期脉冲状的空气

4、流。该空气流经过声道后最终从嘴唇辐射出声波,这便是浊音语音。这个准周期脉冲的周期即为基音周期。基音频率是由声带张开闭合的周期所决定的:男性的基音频率一般为50~250Hz;女性基音频率为100~500Hz。2.2.2语音生成-清音空气流经过声带时,如果声带是完全舒展开来的,则肺部发出的空气流将不受影响地通过声门。空气流通过声门后,会遇到两种不同情况。一种情况是,如果声道的某个部位发生收缩形成了一个狭窄的通道,当空气流到达此处时被迫以高速冲过收缩区,并在附近产生出空气湍流,这种湍流空气通过声道后便形成所谓摩擦音或清音。2

5、.2.2语音生成-爆破音另一种情况是,如果声道的某个部位完全闭合在一起,当空气流到达时便在此处建立起空气压力,闭合点突然开启便会让气压快速释放,经过声道后便形成所谓爆破音。共振峰频率或共振峰声音产生后,便沿着声道进行传播。声道可以看成是一根具有非均匀截面的声管,在发音时起着共鸣器的作用。声音进入声道后,其频谱必定会受到声道的共振特性的影响,声道具有一组共振频率,称为共振峰频率或共振峰。声道的频谱特性便主要地反映出这些共振峰的不同位置以及各个峰的频带宽度。共振峰及其带宽取决于声道的形状和尺寸,因而不同的语音对应于一组不同

6、的共振峰参数。2.3语音的听觉机理2.3.1听觉器官人的听觉器官包括:外耳、中耳和内耳图2.3人耳结构示意图1.外耳外耳由耳廓(耳翼)、外耳道和耳鼓(鼓膜)组成。2.中耳组成:包括三块听小骨:锤骨,砧骨和镫骨。作用:阻抗匹配和限幅外耳和中耳的综合作用相当于一个介于500Hz到6kHz之间的平滑的带通滤波器,可以用有限冲激响应(FIR---FiniteImpulseResponse)滤波器来模拟。3.内耳内耳是一个充满液体的骨质结构,由前庭、圆形窗、卵形窗及耳蜗组成。2.3.2耳蜗的信号处理机制当声音经外耳传入中耳时,镫

7、骨的运动引起耳蜗内流体压强的变化,从而引起行波沿基底膜的传播。图2.6是流体波的简单表示。在耳蜗的底部基底膜的硬度很高,流体波传播的很快。随着波的传播,膜的硬度变得越来越小,波的传播也逐渐变缓。不同频率的声音产生不同的行波,而峰值出现在基底膜的不同位置上。图2.7基底膜上六个不同点的频率响应1基底膜2内毛细胞3外毛细胞4听传导通路2.3.3语音信号听觉模型听觉系统的研究主要集中在三个方面:听觉系统的实验研究、听觉系统的建模和听觉模型的应用。听觉系统的实验研究主要是指听觉系统在医学、生理学及心理学方面的研究。由于耳蜗深植

8、于颅骨中,尺寸极小(如蜗管的直径只有1mm),所以耳蜗的实验研究是一项非常艰巨和复杂的工作。耳蜗建模主要集中在基底膜的振动上,然而,建立基底膜的振动模型是耳蜗建模的首要任务,它又被称为耳蜗的宏观力学模型。图2.10语音信号听觉模型一般原理框图语音信号首先通过一串带通滤波器(BPF)阵列,其中心频率跟随着图2.7所示的基底膜频率响应

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。