欢迎来到天天文库
浏览记录
ID:59457023
大小:1.47 MB
页数:89页
时间:2020-11-02
《语音信号处理的基本知识-.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第二章语音信号处理的基础知识§2.2语音和语言§2.3汉语语音学§2.4语音生成系统和语音感知系统§2.5语音信号生成的数学模型§2.6语音信号的特性分析§2.2语音和语言一、语音与语言的关系二、语音的基本声学特性三、音节与音素四、英语和汉语的音节构成语音(Speech)=声音(Acoustic)+语言(Language)语音是由一连串的音组成语言的声音。1.语音:人们讲话时发出的话语叫语音。是一种声音,是人们进行信息交流的声音,是组成语言的声音/带有语言信息的声音。一、语音与语言的关系语音:人与人的
2、沟通介面(1)语音中各个音的排列由一些规则所控制,对这些规则及其含义的研究称为语言学(linguistics)。(2)语音中各个音的物理特性和分类的研究称为语音学(phonetics)。它考虑的是语音产生、语音感知等过程和各个音的特征和分类。2.对语音的研究包括两个方面3.人类的说话过程分五个阶段想说说出传送接收理解人类的说话交流是通过联结说话人和听话人的一连串心理、生理和物理的转换过程实现的。4.语言(Language)人与人之间的沟通工具,是从人们的话语中概括总结出来的规律性的符号系统。包括构成语
3、言的语素、词、短语和句子等的不同层次的单位,以及词法、句法和文脉等语法和语义内容。这些构成语言学的研究内容。Phoneme(音素)WordformationGrammarText(Option)5.语言学和语音信号处理的关系语言学是语音信号处理的基础。例如:可以利用句法和语义信息减少语音识别中搜索匹配范围,提高正确识别率。6.语音学和语音信号处理的关系语音学和语音信号处理联系更加紧密。如:运用现代信号处理技术建立发音的数学模型,确定发音方法;用声学和非平稳信号分析理论来解释各种语音现象;语音信息的存储
4、形式等。语音是发声器官发出的一种声波,具有一定的音色、音调和音强和音长。●音色:又称为音质,是一种声音区别于另一种声音的基本特性。●音调:声音的高低,取决于声波的频率●音强:声音的强弱,它由声波的振动幅度所决定●音长:发音时间的长短二、语音的基本声学特性句子的最小单位为单词,单词的最小单位为音节。音节:发音时,被明显感觉到的语音片段为音节。音素:是发音的最小单位,一个音节由一个音素或几个音素构成。分为元音和辅音。元音是构成音节的主干,从长度和能量来看,在音节中占主要位置;辅音只是出现在音节的前端或后端
5、或前后两端,它们的时长和能量较小。三、音节与音素人在说话时,空气由肺部压入,由嘴唇呼出,声门由此开启和闭合,构成声带振动,然后通过声道(喉腔、咽腔和口腔)响应(引起共振特性)变成语音,由于发不同音时,声带的振动情况(基频)和声道的形状不同(谐振频率或共振峰频率),所以构成不同的声音。元音的一个重要的声学特性基频和共振峰1.元音语音的产生喉的生理结构喉位于气管的上端,实际上是气管末端一圈软骨构成的一个框架,前方稍高处的软骨称为甲状软骨,前后方环成一圈的称为喉部环形软骨,喉中两片肌肉称为声带,声带之间的空
6、隙为声门。当声带张开时,声门打开,空气可自由呼出,正常呼吸就处于这种情况;当声带闭合,声门关闭。发音机理甲状软骨声门声带环形软骨人的前方当说话时,声带在软骨的作用下相互靠近但不完全闭合,声门变成一条窄缝,当气流通过窄缝时压力减小,外界压力大,从而两片声带完全闭合使得气流不能通过,当气流阻断时压力恢复正常,推开两片声带,声门再次打开,气流再次流过。声带靠拢Tp基音周期声带的开启和闭合称为振动。这一振动过程周而复始,形成了一串周期性脉冲气流送入声道。这个过程发出的音称为浊音。如汉语发音的[a]、[i]、[
7、u]和[o]等。女声汉语拼音a的时域波形☆F0=1/Tp,基音频率,由声带的质量来决定。☆F0的大小决定了声音的高低,称为音高。☆男性的F0大致分布在:60~200Hz☆女性和儿童的F0大致分布在:200~450Hz基音频率(FundamentalFrequency)F0声道气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,期间的传输通道称为声道。气流流过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置的峰起,称为共振峰。讲话时,由于舌和唇的连续运动,使声道形状改变,随即改
8、变谐振频率,使得发不同的音。声道的不同的形状,对应不同的谐振频率。声带振动频率输出气流的频率声道的谐振特性鼻端嘴唇17cm8.5cm13cm声道的无损模型谐振频率的计算谐振频率发生在:Fn=(声道的横截面是均匀的,发元音e时,声道近似是均匀的。)L=17cm,声道的长度n=1,2,3…称为第一共振峰F1=500Hz、第二共振峰F2=1500Hz、第三共振峰F3=2500Hz,…c=340m/s2n-14Lc女声英文a的时域波形女声英文a的频谱一种声道形
此文档下载收益归作者所有