单片机原理及实用技术第6章语音处理技术及应用

单片机原理及实用技术第6章语音处理技术及应用

ID:42737610

大小:1.48 MB

页数:168页

时间:2019-09-21

单片机原理及实用技术第6章语音处理技术及应用_第1页
单片机原理及实用技术第6章语音处理技术及应用_第2页
单片机原理及实用技术第6章语音处理技术及应用_第3页
单片机原理及实用技术第6章语音处理技术及应用_第4页
单片机原理及实用技术第6章语音处理技术及应用_第5页
资源描述:

《单片机原理及实用技术第6章语音处理技术及应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第6章语音处理技术及应用6.1概述6.2凌阳音频技术简介6.3常用应用程序接口6.4语音压缩方法6.5键控放音程序6.6语音识别技术6.1概述6.1.1音频信号我们所说的音频是指频率在20Hz~20kHz的声音信号,分为波形声音信号、语音信号和音乐信号三种。其中波形声音就是自然界中的声音,是声音数字化的基础。语音也可以表示为波形声音,但波形声音表示不出语言语音学的内涵,语音是对讲话声音的一种抽象,是语言的载体,是人类社会特有的一种信息交流系统,是社会交际工具的符号。音乐与语音相比更规范一些,是符号化了的声音。但音乐不能对所有的声音进行符号化,乐谱是符号化声音的符号组,表示比单个符号更复杂的

2、声音信息。6.1.2音频信号的抽样和量化要将音频模拟信号进行数字化处理,就必须将模拟信号转换为数字信号。模拟信号数字化有多种方法,目前采用最多的是信号波形的A/D变换法(波形编码)。它直接将时域信号波形变换为数字序列,接收恢复的信号质量高。此外,还有参量编码(后面介绍)等。常用的波形编码方法有脉冲编码调制(PCM调制)和增量调制(DM)。数字音频信号的质量取决于采样频率和量化位数这两个重要参数。此外,声道的数目、相应的音频设备质量也会影响音频质量。6.1.3音频格式音频文件通常分为两类:声音文件和MIDI文件。声音文件指的是通过声音录入设备录制的原始声音信号,直接记录了真实声音的二进制数据

3、,通常文件较大。MIDI文件是一种音乐演奏指令序列,相当于乐谱。可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件较小。1.声音文件格式1)WAVE文件(*.wav)WAVE文件使用三个参数来表示声音,分别是采样位数、采样频率和声道数。在计算机中采样位数一般为8位和16位两种,而采样频率有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三种。一般WAVE文件的波特率可达到88~704kb/s。WAVE格式是Microsoft公司开发的一种声音文件格式,它符合RIFF(ResourceInterchangeFileForm

4、at)文件规范。它用于保存Windows平台的音频信息资源,Windows平台及其应用程序均支持WAVE格式。WAVE格式支持多种压缩算法,支持多声道、多种音频位数和采样频率,是PC机上最流行的声音文件格式。但其文件较大,多用于存储简短的声音片段。2)AIFF文件(AIF/AIFF)AIFF是音频交换文件格式(AudioInterchangeFileFormat)的英文缩写,是苹果计算机公司开发的声音文件格式。Macintosh平台及其应用程序、NetscapeNavigator浏览器中的LiveAudio、SGI及其它专业音频软件包均支持AIFF文件格式。AIFF支持ACE2、ACE8、

5、MAC3和MAC6压缩,支持16位44.1kHz立体声。3)Audio文件(.au)Audio文件是SunMicosystems公司推出的一种经过压缩的数字声音格式,是Internet中常用的声音文件格式。NetscapeNavigatir浏览器中的LiveAudio支持Audio格式的声音文件。4)MPEG文件(.mp1/.mp2/.mp3)MPEG是运动图像专家组(MovingPictureExpertsGroup)的英文缩写,MPEG音频层(MPEGAudioLayer)代表MPEG标准中的音频部分。MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(M

6、PEGAudioLayer1/2/3),分别对应MP1、MP2和MP3这三种声音文件。MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和6:1~8:1,MP3的压缩率则高达10:1~12:1,就是说若一分钟CD音质的音乐未经压缩需要10MB存储空间,而经过MP3压缩编码后只需1MB左右的存储空间,其音质基本保持不失真。因此,目前使用最多的是MP3文件格式。5)RealAudio文件(.ra/.rm/.ram)RealAudio文件是RealNerworks公司开发的一种新型流式音频StreamingAudio文件格式。它包含在RealMedia中,主要用于在低速的广域网

7、上实时传输音频信息。网络传输速率不同,客户端所获得的声音质量也不尽相同,对于28.8kb/s的速率可以达到广播级的声音质量,如果拥有ISDN或更快的线路连接,则可获得CD音质的声音。2.MIDI文件(.mid/.rmi)MIDI是乐器数字接口(MusicalInstrumentDigitalInterface)的英文缩写,是数字音乐、电子合成乐器的国际标准。它定义了计算机音乐程序合成器及其它电子设备交换音乐信号的方式,还

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。