基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new

基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new

ID:34034779

大小:1.47 MB

页数:63页

时间:2019-03-03

基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new_第1页
基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new_第2页
基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new_第3页
基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new_第4页
基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new_第5页
资源描述:

《基于语音识别与合成的低速率语音编码研究_尹岩岩硕士论文new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、学校代码:10270分类号:TP3学号:102201152硕士学位论文论文题目基于语音识别与合成的低速率语音编码研究学院信息与机电工程学院专业通信与信息系统研究方向信息处理与通信研究生姓名尹岩岩指导教师殷业完成日期2013年5月论文题目:基于语音识别与合成的低速率语音编码研究学科专业:通信与信息系统学位申请人:尹岩岩指导教师:殷业中文摘要中文摘要中文摘要在现代通信技术中,人类语音是最重要、最基本的交流媒介并将成为未来人机交互的主要手段。由于考虑到传输效率、耗费成本、占用的物理信道、存储空间等因素,人们总希望在保证较好语音质量的前提下,尽可能的压低语

2、音编码的传输码率。因此,语音传输一般要经过压缩变成比特流的形式。这个压缩语音信息过程被称为语音编码。由Shannon理论可知,语音数据压缩是存在极限的。目前的信源编码方式已经接近极限,因此我们以牺牲算法的复杂度来无限逼近Shannon极限已经变得毫无意义。如果我们从信宿(接收者)的角度来考虑,根据信宿端的需求对发送端语音信息进行基于内容的压缩,去除大量非内容信息,这样就可以大大提高语音信号的压缩效率。本文主要工作及创新点有:1.论文首先对语音通信技术的现状进行了研究和总结,分析了极低速率语音编码应用领域及其重要意义。对国内外语音通信中的语音识别、语

3、音合成和预处理等关键技术做了详细分析研究和仿真实验,并指出目前存在的不足。2.本文对语音信号端点检测的三个特征参数短时能量、短时平均过零率和基本谱熵进行逐一研究分析,在此基础上提出了短时能零熵值这种新型的语音参数,并作为端点检测的主要参数。3.试图寻找一种基于信宿相关的低速率语音编码。其理论依据是:语音的内容信息量总是小于语音的数据信息量。通过语音识别技术针对组成语音的基元,采用仿生模式识别后得到文本信息,把与文本信息相对应的标准语音和说话语音进行“比较”运算后得到个体特征信息,然后再对识别出的语音基元文本信息和个体特征信息进行编码、传输就可得到极

4、低的编码速率(<80bit/s),在接收端,利用语音合成技术将文本信息和个体特征信息转换为语音输出,从而形成完整的语音传输过程。本文的研究主要应用于水声通信和军事通信,由于通信速率比较低,即使能够满足基于语音识别的语音实时通信,但是对于海、陆、空三维立体通信互联来说还是远远不够的。加快发展我国在该领域的技术进步是一项很紧迫的任务。关键词关键词:关键词:::低速率语音编码;语音识别;端点检测;短时能零熵;语音合成AbstractInmoderncommunicationsystems,voiceisthemostfundamentalandimpor

5、tantcommunicationmodeandwillbecometheprimarymeansforthefuturehumancomputerinteraction.Consideringthetransmissioncostandefficiency,thephysicalchannelandstoragespaceittakes,peoplealwayshopethatunderthepremiseofhighvoicequality,asmuchaspossibletosuppressthetransmissionofvoicecodi

6、ngrate.Therefore,thevoiceisusuallytransmittedafterbeingcompressedtobitsstream.Thisvoiceinformationcompressionprocessiscalledspeechcoding.SeenbytheShannontheory,datacompressionmustbeperformedinacertaincompressionlimit,andthesecurrentsourcecodingisalreadyclosetothelimit.Tosacrif

7、icethecomplexityofthealgorithmtoinfiniteapproachingtheShannonlimithasbecomemeaningless.Ifweconsideredfromtheperspectiveofthesink(receiver),wecanmakecontent-basedcompressionofthevoiceinformationfromthetransmittingsideaccordingtothedemandofthesinkend,whichremovalofalargenumberof

8、non-contentinformationandgreatlyimprovethevoicesignalcompress

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。