语音识别技术及应用综述

语音识别技术及应用综述

ID:26925128

大小:72.50 KB

页数:8页

时间:2018-11-30

语音识别技术及应用综述_第1页
语音识别技术及应用综述_第2页
语音识别技术及应用综述_第3页
语音识别技术及应用综述_第4页
语音识别技术及应用综述_第5页
资源描述:

《语音识别技术及应用综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、语音识别技术及应用综述(中国人民解放军通信指挥学院,湖北武汉430010)摘要:文章介绍了语音识别技术的一般概念、分类方法和基本原理,从应用领域角度重点介绍了在军事领域、公共事业领域和其他领域内的应用情况。关键词:语音识别;识别原理;特征提取;语音识别应用中图分类号:TN912.34文献标识码:A文章编号:1007—6921(XX)15—0070—02与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。近20年来,语音识别技术取得显著进步,开始从实验室走向市场,被认为是2000年〜XX年间信息技术领域十大重要的科技发展技术之一。

2、1语音识别技术简述1.1语音识别技术的起源和概念语音识别起源于20世纪50年代AT&T贝尔实验室的Audry系统,它第一次实现了10个英文数字的语音识别,这是语音识别研究工作的开端。1959年,J.W.Rorgie和G.D.Forgie采用数字计算机识别英文元音及孤立字,开始了计算机语音识别的研究工作。语音识别技术与语音合成技术结合使人们能够摆脱键盘的束缚,取而代之的是以语音输入这样便于使用的、自然的、人性化的输入方式,它正逐步成为信息技术中人机接口的关键技术。所谓语音识别技术就是让计算机通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技

3、术,属于多维模式识别和智能计算机接口的范畴。语音识别技术的终极目标就是研制出1台能听懂任何人、任何内容的讲话的机器,但是要想实现计算机与人类之间的语音交流变得和人与人之间的对话那么自如、方便,其难度相当大,甚至超过“人类登上月球”的难度。1.2语音识别系统的分类语音识别系统会有不同的系统设计和实现,因而会有不同的应用范围及限制。它的分类种类也很多,现在举出几个大家比较重要的分类方式。按发音方式分为孤立词、连接词和连续语音的语音识别系统。语音识别系统可能要求说话者以单字、单词、或是短语为发音单位,其间就必须要略微停顿,否则识别就会有问题。以前的语音识

4、别系统,几乎都是以单字或单词为单位的孤立语音识别系统,随着连续语音识别技术渐趋成熟,连续词和连续语音这个最自然的说话方式,将成为语音识别系统的主流。按词汇量大小分为小词表、中词表和大词表以及无限词汇量语音识别系统。如果语音识别系统只为你进行电话拔号,那它只要能听懂10个数字就行了,这属于小词汇量语音识别系统;如果它是为你自动转接话务,那它还应识别单位名、人名和时间等成千上百的词和字,这属于中等词汇量语音识别系统;如果它是把1篇口述的演讲报告转换成为文字,这属于大词汇量语音识别系统。按说话人适应范围分为特定人、限定人和非特定人语音识别系统。特定人系统

5、是指系统在使用前必须由用户输入大量的发音数据、对其进行训练。非特定人系统则试图达到在系统构建成功之后,用户需要事先输入大量的训练数据,即可使用的目的。1.3语音识别原理语音识别其基本原理就是将输入的语音,经过处理后,将其和语音模型库进行比较,从而得到识别结果,具体原理见图1。740)this.width=740"border=undefined>该图中语音输入就是将话筒和电话等语音输入设备采集的语音进行原始输入;数字化预处理包括语音信号采样、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响等;特征提取模块用于提取语音中反映本质特征的声学参

6、数,常用的特征有短时平均幅度、短时平均跨零率、线性预测系数、基音频率、倒谱和共振峰等。在训练阶段,将特征参数进行一定的处理后,为每个词条建立一个模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音特征参数,生成测试模板,与参考模板进行匹配,基于一定的判别规则将匹配分数最高的参考模板作为识别结果。同时在模式匹配和判别时还可以在很多专家的帮助下,提高识别的准确率。1.4语音识别流程现在社会上有很多不同种类的语音识别系统,它们的体实现细节有所不同,但所应用的识别过程大致相似,具流程见图2740)this.width=740"border=und

7、efined>首先要确定语音识别单元的选取。语音识别单元有单词、音节和音素三种,单词单元广泛应用于中小词汇语音识别系统,音素单元多见于英语语音识别的研究中,音节单元一般用于大词汇量汉语语音识别。然后在特征提取中去除语音中对识别无关紧要的冗余信息,目前应用广泛的有基于线性预测分析技术提取的倒谱参数和基于感知线性预测分析提取的感知线性预测倒谱。接着采用适当的语音识别方法,通过对确定的语音特征进行模型训练得到语音模板库,然后对待识别的输入语音信号的特征与模板库进行模式匹配,最后通过友好的人机界面将识别结果输出。2语音识别技术的应用按照不同的特点可以将语音

8、识别进行各种方式的分类,这里按照应用领域的不同可以将语音识别技术分为应用在军事领域、公共事业领域和在其他领域。2.1语音识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。