欢迎来到天天文库
浏览记录
ID:58707529
大小:2.35 MB
页数:96页
时间:2020-10-04
《第2章 语音技术概述ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2、一些基本概念①音素(phoneme):语音的最小单位,由音素构成音节。②音节(Syllable):说话时一次发出的,具有一个响亮的中心,并被明显感觉的语音片断。音素和音节1辅音和元音音素分为两类:辅音(Consonant)和元音(Vowel)元音:声带振动产生一个准周期的空气脉冲,如i、u、ü、a、o、e等。辅音:呼出的气流,由于通路中某一部分封闭起来或受阻,气流不通畅所产生的声音,如b、p、m、f、d、t、n、l等。2辅音和元音的区别有四点:1、辅音发音时,气流在通过咽头、口腔的过程中,要受到某部位的阻碍;元音发音时,气流在咽头、口腔不受
2、阻碍。这是元音和辅音最主要的区别。2、辅音发音时,发音器官成阻的部位特别紧张;元音发音时发音器官各部位保持均衡的紧张状态。3、辅音发音时,气流较强;元音发音时,气流较弱。4、辅音发音时,声带不一定振动,声音一般不响亮;元音发音时,声带振动,声音比辅音响亮。3半元音:声道基本通畅,但某处比较狭窄,引起轻微摩擦。[W]、[Y]元音构成音节的主干,辅音只出现在音节前端或前后两端。元音的共振峰特性:声道被看成具有均匀截面积的声管,发音时起共鸣器的作用。元音激励进入声道时引起共振特性,产生一组共振频率,即共振峰。4清音和浊音清音:声带不振动浊音:声带振动
3、而发音元音都是浊音、辅音有清音也有浊音。53、汉语的声调:浊音的声带振动基频称为基音频率。无论在说一个单音节或说一段连续语音时,各个音节中韵母段的都是随时间变化的,基音频率的不同轨迹称为声调。几乎平均于横轴、平均值高从较低一直上升到较高频率先降后升从较高频率降到较低频率64、语音信号的时域波形开始/ai//k/时变特性有些段落周期性,有些段落具有噪声特性,短时平稳性7Doyoulikeit?VsDidyoulikeit?Waveform8§2.2语音产生的过程及声学特征语音产生的过程喉以上的部分称为声道,随着发出声音的不同其形状是变化的;而喉的
4、部分称为声门。9声带(VocalCords)10~14mm在喉部的从喉结到杓状软骨之间的韧带褶。声门(Glottis)两个声带之间形成一个开闭自如的声门,声带合拢因而受声门下气流的冲击而张开;但由于声带韧性迅速地闭合,随后又张开而闭合,声带开启和闭合使气流形成一系列脉冲。声门每开启和闭合一次的时间即振动周期称为音调周期或基音周期,其倒数称为基音频率,也简称为基频。基音的范围约为70~350Hz左右。10声道(vocaltract)17cm由咽腔、口腔和鼻腔三个空气腔体组成。声道是一个分布参数系统,它有许多自然谐振频率(在这些频率上其传递函数具有
5、极大值),所以声道是一谐振腔,它放大某一频率而衰减其他频率分量。谐振频率由每一瞬间的声道外形决定。如果声道的截面是均匀的,谐振频率将发生在11听觉系统:声波经过外耳的放大后,经过鼓膜和听小骨将声波转化为机械振动,传入内耳。§2.3语音感知由外耳、中耳、内耳组成人耳的作用:1、声音放大;2、声音传导;3、声源定位12正常人的听域与听阈:听觉感知特性:正常人的听觉系统是极为灵敏的,人耳所能感觉的最低声压接近空气中分子热运动所产生的声压。正常人可听声音的频率范围为0.016-16kHz,年轻人可听到20kHz的声音,而老年人可听到的高频声音要减少到1
6、0kHz左右。正常人可听声音的强度范围为0-120dBSPL(声压级),这里的基准声压(0dBSPL)是或。13纯音听阈是与频率有关的量,在1000Hz时约为4dB左右,而在40Hz时上升为50dB左右,在15kHz时上升为24dB左右。感觉阈代表可容忍的最高声压。在声压级高到一定程度时,耳朵会出现不适感觉,或者具有痒、压迫及痛感。对正常人而言一般取120dB为不适阂,140dB为痛阐,且认为它与频率无关。14响度(Londness)---方(phon)是一种主观心理量,主观感觉到的声音强弱的一种衡量标准,它与频率有关。一样的音强,不一样的频率
7、,则响度也会有所不同。0dB声强级的1000Hz纯音的响度级为0phon;ndB声强级的1000Hz纯音的响度级为nphon;15听觉掩蔽效应掩蔽效应:一种声音的听觉感受受到同时听到的另一种声音的影响。分:同时掩蔽和短时掩蔽16同时掩蔽:同时存在的一个弱信号和一个强信号频率接近时,强信号会提高弱信号的听阈,当弱信号的听阈升高到一定程度会导致弱信号不可闻。短时掩蔽:当A声和B声不同时出现时。后向掩蔽:掩蔽声B消失后,其作用仍持续一段时间:0.5~2s前向掩蔽:被掩蔽音A出现后,相隔0.005~0.2s之内出现掩蔽音B,也会对A起作用。17§2.4
8、语音信号的数学模型准则:要寻求一种可以表达一定物理状态下的数学关系,要使这种关系不仅具有最大的精确度,而且还要最简单。期望:模型既是线性的又是时不变的
此文档下载收益归作者所有