欢迎来到天天文库
浏览记录
ID:33400282
大小:10.58 MB
页数:47页
时间:2019-02-25
《汉语耳语音重建的分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第一章绪论1.1背景及意义语音是人类交流的一种最重要、最快捷的形式。近几十年来随着数字信号技术的进步和信息论理论不断地完善,语音方面的商业产品不断地涌现,理论也在不断地趋于成熟。语音识别技术使得手机等设备上出现了语音输入法;说话人识别可以通过说的语音识别出说话人;语音编码使语音在网络上传输和存储的数据量大大压缩;在背景噪声干扰下,语音增强可以使对方较清楚的辨听出语音。虽然如此,由于人类语音产生过程的复杂性和语音信息的丰富性及多样性,迄今为止还没有找到一种能够精确描述语音产生过程和所有特征的理想模型。人类自身的发声原理、听觉感知原理仍然是一个很深刻的课题
2、。耳语音是一种特殊的语音形式,它有别于正常语音的发音方式。耳语音的主要特点是发音时语音能量低、声道传输偏移、而且声带处于完全不振动状态⋯。它和正常语音的最主要差别在于无基音频率和因声道传输函数改变使得共振峰发生偏移。这些因素导致耳语音信号不仅信噪比低而且可懂度和清晰度都比较差。为了在通信交流中不影响他人或者保证交流保密性,耳语音这种交流的形式就会被使用。但是正因为这种方式的特点既影响了交流的质量,又易使交流双方产生说话和听觉疲劳。有关耳语音的研究近几年来逐渐得到国内外相关研究机构的重视。首先,目前大部分的语音研究主要集中在正常语音的语音识别、说话人识别
3、、语音的增强等等方面。由于耳语音信噪比低的特点,导致清晰度和可懂度都较差,所以关于耳语音增强方面的研究【2’3】就随之引来了关注。其次,对于在安静环境中的手机通话或者对于喉头切除者患者,他们在交流过程使用耳语音,为了使对方能够更加清楚的理解耳语音信息,关于耳语音转换为正常语音的研究随之而来,以帮助说话者与接听者之间的交流。最后,由于目前基本上所有的系统和设备都是基于正常语音,例如:语音识别、语音增强和情感分析,若将其系统直接应用于耳语音,必然因耳语音和正常音的差别而使特征产生很大的差异,进而导致模型失配使其性能降低。那么维持原有的设备和系统,就要将耳语
4、音转化为正常语音。汉语耳语音重建的研究1.2耳语音重建研究的概况耳语音作为一种语音的形式,其研究方面远远不及学者们对正常语音的研究。但由于耳语音具有其自身的应用价值,所以自二十世纪中期以来,学者们对其研究越来越多。对耳语音特性的研究有耳语音发声部位和声音感知的研究【lJl4】、耳语音音素感知辨认【5】等等。其次,在了解了耳语音的一些特性之后,学者们又对其共振峰【6~、耳语音识别【8】和说话人性别识别【91进行研究。近几年来对耳语音的研究引起了各国学者的重视。Morris在英语耳语音转换11oj方面进行了研究,Sharifzadeh使用CELP(Code
5、ExcitedLinearPrediction)模型对耳语音进行了重建⋯J,Hansen在耳语音的说话人识别【8’12]进行了研究,日本大阪医学院Higashikawa教授对耳语音的元音共振峰㈣及听觉感知flq方面进行研究,牛津大学Coleman教授的课题组对耳语音喉部运动与语调的关系进行了研列15】。在国内,南京大学声学研究所以徐柏龄为首的研究组对汉语耳语音的声学应用和在手机通话中语音抵消方面进行研究【16】;苏州大学以国家自然基金项目为依托对耳语音特性【17’18】和转换【19也2]进行了研究;东南大学以赵力教授为首的语音研究组对耳语音增强方面【2
6、3】也进行了深入的研究。有关耳语音重建目前存在几个困难:第一、耳语音中有声段和无声段的分割不明显:第二、耳语音的发声声道和正常发音模式不一样,从而导致声道传输函数的改变和共振峰的偏移;第三、由于耳语音的声韵母都是噪声激励产生的,故耳语音中的声母和韵母的特征差异不明显,进而对耳语音的声韵分割增加了难度:第四、耳语音产生时声带不发生振动,进而导致汉语最重要的声调表征一一基频丢失。对于耳语音重建的已有研究可知,Morris博士提出了谱修正法f24】对英语耳语音中共振峰参数进行了修正,在合成语音的时候将所有音默认为浊音,并根据耳语音的能量来添加基频,利用了混合
7、激励线性预测(MELP)模型实现了英语耳语音向正常语音的转换。而Morris博士将MELP模型中的四个低频带作为浊音段,高频带作为清音段,所以重建后的目标语音具有明显的失真。苏州大学赵鹤鸣教授为首的研究组同样利用汜LP为依托,利用神经网络的方法进行了MELP声码器参数的训练识别,利用BP神经网络119】对共振峰的参数进行修改和利用RBF神经网络【2lJ对耳语音和相应的正常语音频谱进行对应转换进而达到合成语音效果。利第一章绪论用神经网络的方法导致语音的重建具有个性,但是损失了模型的通用性,这样会导致利用一个设备的时候,只能对所训练耳语音的测试人进行耳语音
8、向正常音的重建。1.3研究内容、目标以及解决的问题本文的主要研究内容是利用MELP声码器模型对
此文档下载收益归作者所有