欢迎来到天天文库
浏览记录
ID:33008532
大小:2.25 MB
页数:68页
时间:2019-02-19
《改进的正弦变换编码算法分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、上海交通大学硕士学位论文第l章绪论第1章绪论语音是人们之间交流的最基本、最自然的方式,也是今后人、机交流的最重要形式之一。随着当今世界数字技术的飞速发展,数字业务量的急剧增长,如何在提供高质语音的基础上用尽量低的码率来传送和存贮数字语音信号,以增加现有信道的带宽利用率、传输鲁棒性等的问题是目前语音信号处理的一个重要方面。中、低码率(48kbps-8kbps)语音编码算法的各种研究成果促使国际电信联盟(ITU)在90年代已制定出若干国际标准,如G728、G729、G729A等。这些际准的应用大大降低丁
2、通信业务成本。在此推动下,人们更加关注低码率语音编码算法的研究。目前,低码率(48kbps及以下)的编码方面已经提出一些较令人满意的算法,如正弦变换编码算法(STC)、多带激励(MBE)、原型波形插值(PWI)等,但是各种低码率语音编码算法仍有待进一步改进、完善:更合适的低码率语占编码模型也有待提出。因此低码率的语音编码仍是信源编码领域学者的研究热点。由_『低码率语音编码技术建立在语音产生模型、心理声学模型、谱分析等理沦基础h它不仅需要运用较多的数学工具,而且需要灵活的运用相关学科的各种理论。本文主
3、要研究低码率语音编码算法,并侧重于谐波模型在这方面的应用。我们对正弦变换编码算法(STC)作了一些重要改进,设计了改进的正弦变换编码算法(1STC)。主观测试实验表明,ISTC算法能在38kbps码率下提供清晰、自然的重建语音,具有较大的应用前景和实用价值。本章主要介绍了语音编码技术的基础知识。第一节介绍了语音信号的时、频域特性:第二节对语音产生模型、听觉模型进行说明:第三节介绍了语音编码器的性能订估:第四节对现有的语音编码算法作了简要的概述;最后第五节对全文内容作了简单介绍。§1.1语音信号特性设
4、汁好的语音编码算法需要对语音信号的特性有清楚的了解,只有这样才能有针对性的建立合适的模型,并达到去除冗余保留感知有用信息的目的。本节回顾了语音编码算法中所使用的各种语音信号的特性。目前在这方面的研究仍处于初级阶段,更深入的研究必将对语音信号处理的各个领域带来重大影响。上海交通大学硕士学位论文第1章绪论§1.1.1语音信号的时域特性语音信号的时域特性表现为时变性和短时稳定性。在某些短时段中它呈现出随机噪声的特点,一些短时段则呈现出周期信号的特点,而另一些则是二者的混合。随着时间的变化.语音信号的短时特
5、性也不断变化,因此语音信号不具有长时稳定性只具有短时稳定性,对语音信号时域特性的分析必须建立在短时的基础上,通常这段时间取5—50ms[1]。常用的语音信号时域参数包括它的短时能量、短时过零率、以及短时相关函数等。图1.1为一段语音信号。从图中可以清晰的观察到语音信号的时变特性,和上述的各种短时特性。Time∞图1.I语音信号(汉语)“数”的时域特性Figure1.1TimeDomainCharacteristicsofSpeech—Shu3”(Chinese)§1.1.2语音信号的频域特性由于语音
6、信号的短时稳定性,语音信号频域特性的分析电必须是短时分析。通常,取20~40ms长的平滑窗截取一段平稳语音信号进行短时傅立叶分析,提取其频域特性。语音信号的很多特征反映在它的短时幅度谱中。如图1·2所示。为了进一步反映语音信号的频域特性,短时幅度谱被分成两部分:幅度谱包络和幅度谱的精细结构。其中,幅度谱包络反映了语音信号的短时相关性(10~30ms[11),而幅度谱的精细结构则反映了语音信号的长时相关性。上海交通大学硕士学位论文第1章绪论著‰。∥鼢儿小m].100.11O152535【A】frequ
7、encyofVoicedSpeechwinrad【B】图卜2语音信号(汉语)“数”的频域特性Figurel-2FrequencyDomainCharacteristicsofSpeech。。Shu3”(Chinese)[1】为清音频谱,【2】为浊音频谱按照语音信号的精细结构,将它分成浊音、清音和过渡段语音【1】【4-5】。浊音幅度谱的精细结构反映为谐波结构,如图1-2B所示,即幅度谱的峰值点近似等间距的规则分布(以基音频率为间距)。这种谐波结构反映在时域为浊音信号的周期性。清音幅度谱的精细结构没有这
8、种谐波结构,如图1-2A所示,反映在时域为清音信号具有随机噪声的特点。过渡段语音幅度谱的精细结构同时具有谐波结构和噪声谱结∞勺ul∞刁暑=QE《E己芑∞o∞矗≥o也∞们∞加∞∞口u!∞∞三{
9、△E《E己l。∞a∞Lm≥o乱上海交通大学硕士学位论文第1章绪论构。一般的,过渡段语音的低频段以谐波结构的频谱为主,而高频段以噪声谱结构为主。语音信号的长时相关性表征了相邻语音周期之间的冗余信息,用基音周期或基音频率(基音周期的倒数)表示。因此对浊音编{i-qn寸,可以利用长时相
此文档下载收益归作者所有