欢迎来到天天文库
浏览记录
ID:37966144
大小:13.90 MB
页数:93页
时间:2019-06-04
《语音技术前沿及应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、语音及语言研究、技术及应用讯飞研究院安徽中科大讯飞信息科技有限公司AnHuiUSTCiFlyTekCO.,LTD.2006年07月范围与面向本课程包括:什么是语音、语言,有什么特性(80分钟)智能语音及语言技术包括哪些,讯飞优势(120分钟)本课程面向:以前没有或者较少接触语音及语言技术的所有公司员工什么是语音、语言,有什么特性语音讯飞语音沟通无限语音:人类发音器官发出的声音语音产生于几百万年前但人类能听到的历史不过128年,(1877年:爱迪生发明留声机)无声电影=>有声电影计算机、声卡=>语音的计算机处理技术人类每天说的话如果存下来,…两个不同频率的“嘟”语音链语音产生机理元音发
2、音器官形状汉语辅音音素语音进入计算机:波形和语谱图喝(he)茶语音信号中的一些基本概念波形语谱基频采样率,量化比特数,声道数帧,音高,时长,能量语音的特性1:波形不说明内容语音的特性2:共振峰基本决定内容语音的特性3:基频决定声调语音的特性4:声音一样又不同语音的特性4:汉语方言一级元音格局引自:时秀娟,汉语方言元音格局的实验研究,南开大学博士论文,2005年4月。哈尔滨济南青岛天津兰州郑州成都南京人类听觉系统计算机眼中的语音就是一系列的物理参数隐马尔科夫(HMM)语音建模10秒钟的数据10*16K*16bit的数据,且几乎没有任何规律1000帧,每帧可以计算39个浮点数,3.9万个
3、浮点数,也没什么规律40个音节,80个声韵母320个HMM状态,每个状态20个Gauss函数,每个高斯2参数每个声韵母分别包含哪些帧,几近无穷可能数据多!所能看到的数据和声韵母联系起来困难语言语音语言不分家语言:人类特有的能力有2500至3500种语言汉语属汉藏语系,英语属印欧语系日耳曼语族语言层级:音素、声韵母、音节、字、词、短语、句子、篇章以有限的音节和字按规定的文法构建出无限的句子语言理解:词法、语法、语义、语用计算机眼中的语言数据少意思多!寥寥数字,无穷意境智能语音及语言技术包括哪些讯飞优势智能语音及语言技术语音合成、识别、编码、转换、身份识别及确认、音色分类、评测、哼唱检
4、索、音乐检索、语音检索、SingingTTS、降噪、音效语言基础研究:词典编撰、分词断句、词性分析、语言模型、语法分析、语义分析、语用分析应用研究:拼音输入法、自动摘要、对话系统、文本分类、文本匹配、机器翻译、信息检索、信息抽取语音合成技术(SpeechSynthesis)即TextToSpeech的过程,简称TTS技术中文信息处理领域中的一项前沿技术涉及声学、语言学、数字信号处理技术、多媒体技术等多个学科技术主要解决的问题是将文本状态的文字信息转化为可听的声音信息语音合成的历史电子计算机发明以后,语音合成技术得到了飞速的发展,方法也发生了根本性的变化年代里程碑1939Bell实验室
5、发明voder,最早的现代合成语音产生方式1960’s共振峰参数化合成器结合规则合成1986TD-PSOLA算法发明,显著提高了合成音质1990’sATR提出大语料库合成方法,使语音合成最终达到市场实用化效果键盘光电扫描手写识别网络/数据库文本语言处理韵律处理语音合成结果输出词典/规则语音库语音合成技术语音合成技术语言合成技术之一ArticulatorySynthesis根据人类发音机理方式工作的合成方法模型主要组成部分声门波发生装置---声带气管-口腔声道腔体模型嘴唇的辐射模型主要优缺点真实的反映了人类发音的整个过程人类发音过程的模型不够精确,无法得到清晰度高的语音语音合成技术语言
6、合成技术之二Source-filterSynthesis基于语语音数据信号处理的合成方法模型主要组成部分声门波激励源描述声道模型的滤波器主要优缺点合成语音的音质比上一种方法有很大的提高,但是仍然不是很好可以对合成语音在音色和声调上进行较为灵活的调整语言合成技术之三ConcatenativeSynthesis利用原始语音片断作为合成单元关键技术原始语音片断的获取方法原始语音片断的挑选方法和拼接算法主要优缺点合成语音的音质比上两种方法有质的提高,因为不需要进行大的调整语料库的录制和制作工作量巨大,同时合成语音的灵活性较低语音合成技术输入文本拼音信息和韵律结构信息每个单元将取多个候选s1s
7、2s3s4目标代价挑选候选单元词典等文本分析知识大规模语音库再考虑连接代价决定最后选定单元s1s2s3s4s5s6输出语音InterPhonic系统处理流程语音合成技术语言合成技术之四TrainableTTS利用HMM模型直接对语谱和韵律进行建模关键技术HMM模型对特定人的语音进行建模良好的合成器对预测出来的语谱和韵律参数进行合成主要优缺点合成语句自然流畅,普适性好能够容易的模拟各种不同的说话人,不同情感,不同语气因为采用合成器进行语音的合成,清晰度难以提
此文档下载收益归作者所有