语音信号处理_第八章_语音合成

语音信号处理_第八章_语音合成

ID:46876373

大小:411.00 KB

页数:45页

时间:2019-11-28

语音信号处理_第八章_语音合成_第1页
语音信号处理_第八章_语音合成_第2页
语音信号处理_第八章_语音合成_第3页
语音信号处理_第八章_语音合成_第4页
语音信号处理_第八章_语音合成_第5页
资源描述:

《语音信号处理_第八章_语音合成》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、《语音信号处理》第8章语音合成1第8章语音合成8.1概述8.2共振峰合成法8.3线性预测合成法8.4文语转换系统28.1概述8.1.1语音合成的定义8.1.2语音合成的应用8.1.3语音合成的方法38.1.1语音合成的定义语音合成是通过机械的、电子的方法产生人造语音的技术。它的目的是使一些以其他方式表示或存储的信息能转换为清晰可懂的语音,从而让人们能够利用听觉获取这些信息48.1.1语音合成的定义Intention-To-SpeechConcept-To-SpeechText-To-Speech按照人类语言功

2、能的不同层次,语音合成也可分为三个层次,即:1.从文字到语音的合成(Text-to-Speech)2.从概念到语音的合成(Concept-to-Speech)3.从意向到语音的合成(Intention-to-Speech)58.1.2语音合成的应用传统语音系统的缺陷需要对信息文本进行录音并保存为声音文件,占用存储空间和工作量大不能动态反映信息的更新,应用范围有很大局限WAV格式文件所占容量(KB)=(取样频率X量化位数X声道)X时间/8,每一分钟WAV格式的音频文件的大小约为10MB68.1.2语音合成的应用

3、语音合成技术的优势无需对信息文本进行录音,极大地节省了存储空间和减少了工作量能动态反映信息的变化,应用范围广7几个语音合成应用的实例查询系统话费查询、考试结果查询、股票交易查询等8几个语音合成应用的实例有声词典单词、例句朗读等电脑游戏目前游戏中人物只能说出事先录好的语音。利用语音合成技术可以让人物说出任意语句,同时具有不同说话风格和语气,从而大大加强游戏的趣味性和互动性98.1.3语音合成的方法8.1.3.1波形合成法8.1.3.2参数合成法8.1.3.3规则合成法108.1.3.1波形合成法波形合成法一般分

4、为两种,一种是波形编码合成,另一种是波形编辑合成。波形合成法是一种相对简单的合成技术,通常只能合成有限词汇的语音段。许多专门用途的语音合成器都采用这种方式,如自动报号、报时、报站、报警等118.1.3.1波形合成法128.1.3.2参数合成法主要步骤:利用语音信号的短时平稳性,提取出每帧语音信号的声学参数,将这些参数编码后组成一个语音参数库输出时,从语音参数库中取出相应的参数,利用合成算法恢复语音主要的合成参数有:控制音强的幅度参数、控制音高的基频参数和控制音色的共振峰参数共振峰合成和线性预测合成是该类合成技

5、术中的重要方法138.1.3.2参数合成法优点所需音库一般较小整个系统能适应的韵律特征范围较大音质适中缺点算法复杂,参数多压缩比较大时合成的语音不够自然清晰148.1.3.3规则合成法主要步骤系统中预先存储音素的声学参数,以及由音素组成音节、音节组成词、词组成句子和控制音调、轻重音等韵律的各种规则给出需要合成的语句后,系统根据相应规则自动将它们转换成语音声波158.1.3.3规则合成法特点合成的词汇表不是事先确定可以合成无限词汇的语句16小贴士:语音合成的基本术语1——合成单元(SynthesisUnit)也

6、称为合成单位,是语音合成系统所处理的最小的语音学基本单位按由小到大的顺序排列,语音学中的音素、双音素、半音节、音节、词、短语和句子都可以用作合成单元,合成单元越大,合成语音音质越好,但合成语音的数量及其数码率也越大在波形合成中,合成单元较大,多为词、短语或句子在参数合成和规则合成中,有些语言(如英语或日语)的合成多采用音素,辅音加元音和元音加辅音等合成单元;有些语言(如汉语)的合成单元多采用音节和声、韵母作合成单元17小贴士:语音合成的基本术语2——合成参数(SynthesisParameters)在参数合成

7、和规则合成方式中,控制语音合成器以输出所需语音的一组参数合成参数分为两类音色参数(音段参数),常用的有:共振峰频率,线性预测系数和生理发音参数韵律参数(超音段参数),主要有控制音强的幅度参数,控制音高的基频参数,控制音长的时间参数等18小贴士:语音合成的基本术语3——合成语音库(DatabaseforSynthesis)在语音合成系统中,所有合成单元的编码数据或合成参数数据的集合称为合成语音库对于波形合成,语音库中存储的是合成单元的波形编码对于参数合成,语音库中存储的是各合成单元逐帧的合成参数对于规则合成,语

8、音库中存储的是各合成单元的声学参数和一系列合成规则19PSOLA算法核心思想:直接对存储于音库的语音运用PSOLA算法进行拼接从而合成完整的语音主要特点:有别于传统概念中只是将不同的语音单元进行简单拼接,PSOLA系统首先要在大量语音库中,选择最合适的语音单元用于拼接,使合成波形既保持了原始发音的主要音段特征,又能使拼接单元的韵律特征符合上下文的要求,从而获得很高的清晰度和自然度20选音对于同一个合

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。