语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性

语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性

ID:37518604

大小:1.29 MB

页数:18页

时间:2019-05-24

语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性_第1页
语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性_第2页
语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性_第3页
语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性_第4页
语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性_第5页
资源描述:

《语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第二章语音信号的产生、特征与人耳的听觉特性语音信号处理§2.1语音信号的产生SpeechSignalProcessing鼻子鼻腔软腭嘴巴长春工业大学图像工程研究所口腔史东承教授dcshi@mail.ccut.edu.cn气管声带2010.8人类发音器官示意图发音器官:产生语音的器官1)肺和气管:能源与能量传输;2)咽喉:振动源,包括声带和声门;3)声道(声门到嘴唇的呼气通道):谐振腔(包括口腔、鼻腔等);4)其他发音器官:包括嘴唇、齿、舌、面颊等,使谐振腔改变形状。1当说话时,声带在软骨的作用下相互靠发音机理近但不完全

2、闭合,声门变成一条窄缝,当气流通过窄缝时压力减小,外界压力大,从而•喉位于气管的上端,实际两片声带完全闭合使得气流不能通过,当气上是气管末端一圈软骨构声带靠拢流阻断时压力恢复正常,推开两片声带,声成的一个框架,前方稍高处的软骨称为甲状软骨,门再次打开,气流再次流过。前后方环成一圈的称为喉部环形软骨,喉中两片肌声带的开启和闭合称肉称为声带,声带之间的为振动。这一振动过程周空隙为声门。而复始,形成了一串周期•当声带张开时,声门打Tp性脉冲气流送入声道。这开,空气可自由呼出,正基音周期个过程发出的音称为浊音。常呼吸就处于这种

3、情况;如汉语发音的[a]、[i]、当声带闭合,声门关闭。[u]和[o]等。男声发音“我的语音”的时域波形和语谱图2第二章语音信号的产生、特征语音的形成原理与人耳的听觉特性§2.2语音信号的分类•肺中的空气受到挤压形成气流,气流通过声声学语音学,根据激励方式划分:门(VocalCords)(声带)沿着声道(Vocal(1)浊音(VoicedSpeech),又称为有声语音基音(pitch):Tract)(由咽-Pharynx、喉-Throat、口腔-声道打开,声带在先打开后关闭,气流经过使声带要发生张Cavity等组成)释

4、放出去,就形成了语音。驰振动,变为准周期振动气流。浊音的激励源被等效为准周期的脉冲信号。•气流Stream、声门(Glottis)可以等效为一(2)清音(UnvoicedSpeech),又称为无声语音:声带不振个激励源Excitation,声道可以等效为一个动,而在某处保持收缩,气流在声道里收缩后高速通过产生湍流,再经过主声道(咽、口腔)的调整最终形成清音。清时变滤波器(共振峰)。音的激励源被等效为一种白噪声信号。(3)爆破音(PlosiveSpeech):声道关闭之后产生压缩空气•语音信号具有很强的相关性(长期相关、

5、短然后突然打开声道所发出的声音。期相关)。浊音发音语音学•激励脉冲的周期值称为“基音周期”,用Tp表示。⎧⎫音素:构成语音流的最小单位•⎨⎬都是基本单位,二者等同。1⎩⎭音节:发声的最小单位•3fp称为“基因频率”。fs与声带尺寸Tp•由音节构成词,由词构成“节奏群”或“句子”;音素与特性有关。的各种不同发音方式称为“音素变体”。•音节=元音Vowel+辅音Consonant⎧男性说话者f在60−−200Hz范围内⎪p•辅音在元音前或后端(声母)f:⎨p⎪女性说话者和小孩f在200−−450Hz之间•元音是音节主干(长

6、度和能量占主要部分)(是浊⎩p音)(韵母)•音节结构:C-V结构,V-C结构,C-V-C结构•由周期脉冲串产生的语音称为“浊音”。3汉语普通话音节结构框架发音语音学•Phoneme(smallest)音素:清音,浊音•Morpheme词素•韵母a,i,u,o为浊音;•Syllable音节:元音和辅音构成;•声母s,sh,h,x,f为清音;(声母和韵母)•声母z,zh,j既有清音又有浊音。•Word单词•鼻音韵母n,ng.•Phrase短语•鼻音声母m,n,l.•Sentence句子•Paragraph段落•Topics

7、,Articles,Stories主题文章4语音信号时频特性第二章语音信号的产生、特征与人耳的听觉特性§2.3语音信号产生的模型语音生成模型常用的有:(1)声管模型:波动方程描述(2)LPC模型:数学模型描述(3)共振峰模型:谐振腔描述32毫秒女声的时域波形及其功率谱一.无损声管模型一.无损声管模型13cm•短期内,声道可以表示为形状稳定的管道8.5cm•各段管子截面积的和差比,称为反射系数17cm声道的无损模型•声道为一变截面积的声管。•声道的频率特性主要取决于声道截面最小值出现的位置(该点称为收紧点)。收紧点位置由

8、舌来控制。5谐振频率的计算气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射。气流流过声道时犹如通过了一个具有某种谐振频率发生在:Fn=2n-1c谐振特性的腔体,放大某些频率,在频谱上形成相4L应位置的峰起,称为共振峰。(声道的横截面是均匀的,发元音e时,声道近似是均匀的。)讲话时,由于舌和唇L=17cm,声道的长度,c=340m/s

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。