面向言语工程的语音转换算法研究

面向言语工程的语音转换算法研究

ID:36449721

大小:4.59 MB

页数:116页

时间:2019-05-10

面向言语工程的语音转换算法研究_第1页
面向言语工程的语音转换算法研究_第2页
面向言语工程的语音转换算法研究_第3页
面向言语工程的语音转换算法研究_第4页
面向言语工程的语音转换算法研究_第5页
资源描述:

《面向言语工程的语音转换算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、北京工业大学博士学位论文面向言语工程的语音转换算法研究姓名:左国玉申请学位级别:博士专业:模式识别与智能系统指导教师:阮晓钢;刘文举20050601摘要语音语料数据库是语音交互技术和中文信息处理的基础。语音识别系统提高识别率,语音合成系统产生流畅的自然语音,充足可靠和高质量的语音语料库是其性能的重要保证。论文主要研究了语音转换中两个方面的问题。一是如何提高声音转换系统(个性化语音合成系统)的转换语音的质量与目标说话人身份信息;二是如何将纯净语音转换为具有电话语音特征的新语音。对于前一个问题,论文主要从频谱平滑、基频曲线映射和

2、遗传神经网络频谱映射等声音转换关键技术的三个方面进行了研究;对于后一个问题,主要从模拟电话信道条件方面研究了纯净语音到电话语音的转换方法。论文主要取得了以下几个方面的成果:(1)一种基于Sinusoidal参数的语音频谱平滑算法论文针对传统LPC频谱平滑算法中将LPC(LinearPredictiveCoding,线性预测编码)参数和残差分别进行插值而导致平滑后语音质量改善不多的问题,提出了一种将描述语音频谱大尺度信息的LP(LinearPredictive,线性预测)模型参数与擅长表现频谱的细节的Sinusoidal模型参

3、数结合起来进行语音平滑的新算法。该算法先对待平滑语音段的LPC参数进行插值,然后以这些插值得到的LPC频谱包络为目标,使用Sinusoidal+全极点模型对待平滑语音段进行修改,使修改后的语音,不仅频谱包络拟合目标频谱的形状,而且同时保持原语音中的细节性信息,从而避免LP平滑中语音音质下降的问题。实验结果显示,该算法对于拼接单元频谱差异较大的情况表现出很好的效果,拼接点处频谱平滑,语音音质较高。(2)一种基于汉语音节基频曲线为单位的声调码本映射模型论文提出了一种基于汉语音节基频曲线为单位的声调码本映射模型。该模型以汉语音节的

4、基频曲线所表示的声调模式作为基频信息的转换单位,通过语音切分和对准分别提取各语音单元的基频曲线,用聚类方法分别建立两个说话人的声调码本。根据源.目标说话人语音的时间对准关系,计算各声调模式的对应统计值,由此训练一个汉语声调映射码本。声音转换的评估结果表明声调码本映射模型可以较好地消除孤立基频值映射关系的算法上固有的离散性,反映出目标语音的局部基频动态特性,因此能比较准确地发现不同说话人语音的身份信息对应关系。在短时声学频谱特征转换的基础上,声调码本映射法在汉语声音转换技术中增加了转换语音中目标说话人的身份信息,改善了声音转换

5、系统的性能。(3)一种基于模拟电话信道条件的电话语音转换模型论文通过分析纯净语音在电话信道中形成电话语音的成园后,发现电话语音北京工业大学工学博士学位论文的形成是电话信道中各种因素共同作用的结果,从而提出了一种由纯净语音向电话质量语音转换的电话语音转换模型。转换模型采用滤波器技术来模拟电话线路连接中各种模拟传输设备频率响应特性,并对电话信道环境中各种噪音行为和其他电话语音现象进行了仿真。频谱失真分析和MLLR(MaximalLikelihoodLinearRegxession,最大似然线性回归)自适应识别实验表明,通过模型参

6、数的合理设置和调整,该模型能有效地实现纯净语音向电话质量语音的模拟转换,由纯净语音转换生成的模拟语音减小了训练语音和测试语音声学性质的不匹配,从而改善电话语音识别性能。该模型为解决由于汉语电话语音资源不足的问题提供了一种可行方案。本课题在国家自然科学基金、北京市自然科学基金和中国科学院知识创新工程领域前沿项目的支持下,以建设通用汉语语音库为目标,围绕汉语语音数据库的复用问题,对面向言语工程应用的语音转换技术进行了基础性研究。论文所取得的研究成果将为这项语音技术的研究与发展产生积极的推动作用。关键词:中文信息处理,声音转换,电

7、话语音转换,频谱平滑,声调码本映射IlABSTItACTABSTRACTSpeechcorpusunderliesspeechinterfacetechnologyandChineseinformationprocessing.Anadequate,reliableandhi曲一qualityspeechcorpuswillbringtheimprovementintherecognitionperformanceforspeechrecognitionsystems,andlenditselftomakingspeechs

8、ynthesissystemsproducefluentandnaturalspeech.Twoproblemsareaddressedinthisthesis.Oneishowtoimprovethequalityandtimbreoftheconvenedspeechinvoiceco

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。