欢迎来到天天文库
浏览记录
ID:33959899
大小:4.10 MB
页数:69页
时间:2019-03-02
《基于rbf神经网络的汉语耳语音转换为正常语音的分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于RBF神经网络的汉语耳语音转换为正常语音的研究第一章引言第一章引言1.1耳语音转换研究的目的和意义耳语音转换为正常语音的研究在理论上具有重要的科学价值。因为耳语音是一种有别于正常语音的发音模式【l】。耳语音的声源为噪声源,没有基音周期,其能量比正常语音低20dB,信噪比更低。而正常语音有清浊(或声韵)之分,浊音(或韵母)是由准周期脉冲激励,含有明显的基音频率,且基音频率对语音感知、语音识别和说话人识别有重要作用,所以研究从耳语音到正常语音的转换有益于对语音产生和听觉感知的进一步深入探讨。这方
2、面的研究对于像汉语这样的声调语言来说则更具意义,因为声调识别或韵律合成控制均与基音频率有关。耳语音转换的研究也具有重要的应用价值。耳语音在会场、音乐厅、图书馆和影剧院等禁止大声喧哗的场所被广泛的采用。另外随着移动通讯工具的广泛使用,人们为了不影响他人或为了对话的保密性,常使用耳语方式。由于耳语发音的特殊性和受对话环境的影响,这种方式下的语音信号不仅信噪比低而且可懂度、清晰度都较差,这既影响通话质量,又易使人产生疲劳。如果拥有将耳语音转换为正常语音的技术:在现有手机上附加将耳语音转换为正常语音的功
3、能,并增加语音的自然度和舒适度,这样花费较小的成本就可解决耳语音交流带来的诸多问题。因此耳语音转换为正常语音的研究具有广泛的应用前景。它不仅可以解决在公共场所交流的问题,同时也可以使手机持有者的通话具有保密性,并且不影响他人。现有的语音识别、说话人识别、语音增强系统都是基于正常语音的,如直接将其应用于耳语音,必然因模型失配而使性能大大降低,即使对识别模型作补偿也难以奏效,各种为国家安全部等单位开发的语音增强软件、为地方公安部门研发的说话人识别系统等都遇到此类问题。要直接利用现有的语音识别、语音增
4、强和语音通信系统来处理耳语音,先将耳语音转换为正常语音是一个合适的选择。换言之,可将其作为语音信号的预处理部分直接用于各种语音系统中。此外,我国每年因喉疾做全喉切除的有上万人。无喉发声目前主要有三种途径:气管食管发声、人工喉装置及外科手术发音重建,其中电子人工喉在全世界应用最广。基于RBF神经网络的汉语耳语音转换为正常语音的研究第一章引言电子喉的工作原理是利用声频振荡器代替声带振动作为激励源,通过颈部或口传入咽部、口腔,再经过声道传输器官,即口腔、唇、齿、舌、颚等作用合成语音。它具有发声方便、易
5、学易用、可调节频率、清洁卫生等优点,缺点是价格高、发音带有机械人的金属音,发音较大时就显得有些噪声,语音干平,不能抑扬顿挫,还有待改进【:l。如果能够将无喉者发出的耳语音接收并转换为正常语音,则能为无喉者发音提供一种新的更好的选择。耳语音还是公安和法院等部门在实际工作中经常遇到的情况,它使语音的可懂度降低,给实际工作带来了难度,如将耳语音转换为正常语音,可有助于语音的破译。1.2国内外耳语音转换研究的现状和发展耳语音转换为正常语音的研究报道极少,目前还处于起步阶段,许多问题尚未解决。近年来,国外
6、学者已开始耳语音识别、耳语音重建等方面的研究,前者本质上是语音识别问题,没有涉及耳语音增强和转换的研究,后者虽然给出了一种耳语音的浊音重建方法,但这样重建的语音带有明显的失真。这方面的研究尚有待深入,国内目前有关耳语音转换方面的研究尚在起步阶段。二十世纪五、六十年代开始,对耳语音的研究引起了专家学者的兴趣,但研究的内容还是比较窄,主要是以语音基础研究和医学研究为主。在语音学方面,研究耳语与正常音不同的声学特性,如共振峰的变化13-61等,研究能否对耳语音进行正确的感知,如辅音与元音的辨识17-$
7、1和说话人性别的辨识【,】等;在医学方面,主要研究耳语发音是否有利于喉部手术病人嗓音的治疗和恢复【101等。近年来对耳语的研究逐渐受到世界各国研究人员的重视。如美国佐治亚州理工学院信号与图像处理中心Morris博士在做耳语音转换与识别的研究【·-】:提出了采用混合激励线性预测模型对耳语音重建;日本宇都宫大学工程系及名古屋大学综合声学信息研究中心在做耳语音声学分析和识别的研究112】:对耳语音的声学特性进行了研究,在识别时发现相对于正常语音噪声对耳语音的影响比较大;加拿大维多利亚大学语言学系在研究
8、汉语耳语音的声调感知问题【B】:对多种环境下的普通话声调进行了研究;南京大学声学所在做公共场合通话中语音抵消与耳语通话的应用研究【14】:对耳语音声调特征做了研究,分别提出了基于听觉模型和熵函数的声韵分割方法,使用HMM模型对耳语音孤立字进行识2基于RBF神经网络的汉语耳语音转换为正常语音的研究第一章引言别,并建立了基于同态信号处理方法结合相对熵声韵分割的耳语重建系统;苏州大学在做国家自然科学基金项目一耳语讲话中的语音增强与耳语音一正常语音转换研究:对耳语音特征进行了分析,分别提出了基于OSF、
此文档下载收益归作者所有