语音信号实验讲义

语音信号实验讲义

ID:15363077

大小:2.43 MB

页数:20页

时间:2018-08-02

语音信号实验讲义_第1页
语音信号实验讲义_第2页
语音信号实验讲义_第3页
语音信号实验讲义_第4页
语音信号实验讲义_第5页
资源描述:

《语音信号实验讲义》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实验一语音信号的采集实验目的1、掌握语音信号录音;WAV和DAT文件的转换;数据的剪切、复制;2、初步了解元音、浊辅音、清辅音的特性。实验原理1、音素的种类一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节。一个音节可以由一个音素(Phoneme)或几个音素构成。音素是语音发音的最小单位。音素有元音(Vowel)和辅音(Consonant)两种。(1)元音是当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去时,这些声腔完全开放,气流顺利通过。(2)辅音是呼出的声流,由于通路的某一部分封闭起来或受到阻

2、碍,气流被阻不能畅通,而克服发音器官的这种阻碍而产生的音素。发辅音时声带振动的是浊音,声带不振动的是清音。(3)半元音的声道基本畅通,但某处声道比较狭窄,引起轻微的摩擦声。元音构成一个音节的主干,从长度还是从能量看,元音在音节中都占主要部分。辅音则只出现在音节的前端或后端或前后两端,它们的时长和能量与元音相比都很小。2、元音的共振峰(Formant)声道看成是一根具有非均匀截面的声管,在发音时起共鸣器的作用。当元音激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率(简称共振峰)。共振峰参数包括共振峰频率

3、的位置和频带宽度。在实际应用中,只用前三个共振峰,分别为、、。3、发音器官产生元音的条件:①声道受到声带振动的激励引起共振;②在语音流的持续过程中,声道不发生极端的狭窄,并维持较稳定的形状;③和鼻腔不发生耦合,声音只从口腔辐射出去。4、发音器官产生辅音的条件20产生元音的三个条件中,只要缺少其中之一,则该语音就是辅音。辅音没有明确的共振峰结构。5、基音频率浊音的声带振动基本频率又称基音频率,用表示。各个音节的元音段的都是随时间变化的,的变化产生了声调,的变化轨迹称为声调轨迹。6、汉语的声调汉语声调只有阴平、阳平、上

4、声、去声以及“轻声”等五种声调。声调的变化就是浊音基音周期(或基音频率)的变化,各个韵母段中基音周期随时间的变化产生了声调,变化的轨迹称为声调曲线。实验要求1、利用XP中的录音机程序(程序-附件-娱乐-录音机),以属性11025kHz,16位,单声道,21KB/秒,录制下面语音(以“.wav”文件格式存于lab_1data目录下)。“电子信息科学与技术”jījíjǐjìshǖshǘshǚshǜgāgōǖǘǚǜ2、利用实验提供的“语音信号处理实验一程序”将语音分段,并以“.dat”文件格式存于MATLABspe

5、echlab_1data目录下。3、估测ǖǘǚǜ基音周期随时间的变化,并画出声调曲线。4、找出浊音和清音波形区别。操作流程1、运行MATLAB2、更改MATLAB的当前路径到MATLABspeechlab_13、在MATLAB的命令窗口输入main,进入“语音信号处理实验一”程序204、单击“读取wav文件”或“读取dat文件”按钮,出现5、单击“放大(缩小)”按钮,鼠标箭头变成“+”(1)放大时将鼠标分别移到要放大的语音段左端单击鼠标左键、右端单击鼠标左键;(2)缩小时将鼠标放在图形区,先单击鼠标左(右)

6、键、再单击鼠标右(左)键;(3)退出“放大(缩小)”状态慢速击鼠标右键2次,鼠标恢复成原来的箭头。6、单击“播放”按钮播放图形区显示的语音段的声音。7、单击“存语音片断”按钮将图形区显示的语音段以“.dat”文件格式保存,要求存于MATLABspeechlab_1data目录下。208、移动语音片断(1)单击“<<”或“>>”按钮,分别向左或右移动语音片断;(2)编辑“卷轴步长”改变每次移动语音片断的步长。9、单击“最大峰值时刻”按钮,显示该语音片断的最大峰值时刻,对应变量time_feng。思考题1、男女的

7、基音周期有什么不同?20实验二端点检测实验目的1、掌握语音信号端点检测的短时能量分析效果与窗长的关系;2、掌握语音信号端点检测的短时过零分析效果与窗长、零阈比率的关系。实验原理1、短时能量分析短时平均能量的定义:窗序列是沿着平方值的序列逐段移动。窗口的长度对短时平均能量的影响:(1)N很大,等效于带宽很窄的低通滤波器,En随时间的变化很小,不能反映语音信号的幅度变化,波形的变化细节就看不出来;(2)N太小时,滤波器的通带变宽,短时能量随时间有急剧的变化,不能得到平滑的能量函数。窗口的长与短,是相对于语音信号的基音周

8、期的。在一个语音帧内,应含有l~7个基音周期。基音周期变化范围很大,从女性儿童的2ms到老年男子的14ms(基音频率为500Hz~70Hz)。在10kHz取样频率下,N折衷选择为100~200(10~20ms持续时间)。2、短时过零分析:过零就是信号通过零值,过零数是样本改变符号的次数。单位时间内的过零数称为平均过零数。语音信号的短时平均过零数定义:20浊音

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。