欢迎来到天天文库
浏览记录
ID:53725608
大小:183.14 KB
页数:2页
时间:2020-04-20
《语音识别技术及应用综述.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第15期总第193期内蒙古科技与经济No.15,the193thissue2009年8月InnerMongoliaScienceTechnology&EconomyAug.2009语音识别技术及应用综述董国超,寇净磊(中国人民解放军通信指挥学院,湖北武汉430010)摘要:文章介绍了语音识别技术的一般概念、分类方法和基本原理,从应用领域角度重点介绍了在军事领域、公共事业领域和其他领域内的应用情况。关键词:语音识别;识别原理;特征提取;语音识别应用中图分类号:TN912.34文献标识码:A文章编号:1OO7~6921(2009)15一OO7O—O2与机器进行语音交流
2、,让机器明白你说什么,这只为你进行电话拔号,那它只要能听懂1O个数字就是人们长期以来梦寐以求的事情。近20年来,语音行了,这属于小词汇量语音识别系统;如果它是为你识别技术取得显著进步,开始从实验室走向市场,被自动转接话务,那它还应识别单位名、人名和时间等认为是2000年~2010年间信息技术领域十大重要成千上百的词和字,这属于中等词汇量语音识别系的科技发展技术之一。统;如果它是把1篇口述的演讲报告转换成为文字,1语音识别技术简述这属于大词汇量语音识别系统。按说话人适应范围1.1语音识别技术的起源和概念分为特定人、限定人和非特定人语音识别系统。特定语音识别起源于20
3、世纪50年代AT8汀贝尔实人系统是指系统在使用前必须由用户输入大量的发验室的Audry系统,它第一次实现了10个英文数字音数据、对其进行训练。非特定人系统则试图达到在的语音识别,这是语音识别研究工作的开端。1959系统构建成功之后,用户需要事先输入大量的训练年,J.W.Rorgie和C.D.Forgie采用数字计算机识数据,即可使用的目的。别英文元音及孤立字,开始了计算机语音识别的研1.3语音识别原理究工作。语音识别技术与语音合成技术结合使人们语音识别其基本原理就是将输入的语音,经过能够摆脱键盘的束缚,取而代之的是以语音输入这处理后,将其和语音模型库进行比较,从而
4、得到识别样便于使用的、自然的、人性化的输入方式,它正逐结果,具体原理见图1。步成为信息技术中人机接口的关键技术。所谓语音识别技术就是让计算机(或机器)通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。语音识别技术的终极目标就是研制出图1语音识别原理图1台能听懂任何人、任何内容的讲话的机器,但是要该图中语音输入就是将话筒和电话等语音输入想实现计算机与人类之间的语音交流变得和人与人设备采集的语音进行原始输入;数字化预处理包括之间的对话那么自如、方便,其难度相当大,甚至超语音信号采样、反混叠带通滤波、去除个体发音差异
5、过“人类登上月球”的难度。和设备、环境引起的噪声影响等;特征提取模块用于1.2语音识别系统的分类提取语音中反映本质特征的声学参数,常用的特征语音识别系统会有不同的系统设计和实现,因有短时平均幅度、短时平均跨零率、线性预测系数、而会有不同的应用范围及限制。它的分类种类也很基音频率、倒谱和共振峰等。在训练阶段,将特征参多,现在举出几个大家比较重要的分类方式。数进行一定的处理后,为每个词条建立一个模型,保按发音方式分为孤立词、连接词和连续语音的存为模板库。在识别阶段,语音信号经过相同的通道语音识别系统。语音识别系统可能要求说话者以单得到语音特征参数,生成测试模板,与参考
6、模板进行字、单词、或是短语为发音单位,其间就必须要略微匹配,基于一定的判别规则(例如构词规则、语法规停顿,否则识别就会有问题以前的语音识别系统,则、语义规则等)将匹配分数最高的参考模板作为识几乎都是以单字或单词为单位的孤立语音识别系别结果。同时在模式匹配和判别时还可以在很多专统,随着连续语音识别技术渐趋成熟,连续词和连续家的帮助下,提高识别的准确率。语音这个最自然的说话方式,将成为语音识别系统1.4语音识别流程的主流。按词汇量大小分为小词表、中词表和大词表现在社会上有很多不同种类的语音识别系统,以及无限词汇量语音识别系统。如果语音识别系统它们的具体实现细节有所不同
7、,但所应用的识别过收稿日期:2009一O3—28作者简介:董国超(1984一),男,辽宁沈阳人,硕士研究生,研究方向:通信战术寇净磊(1983一),男,河北无极人,硕士研究生,研究方向:指挥信息系统。·70·董国超,等·语音识别技术及应用综述2009年第15期程大致相似,具体流程见图2。应用于教育领域、商业领域和服务性领域中。就教育领域而言,语音识别技术的最直接的应用就是帮助厂哑⋯-用户更好地练习语言技巧。如一家美国公司开发了一套《Ta1ktoMe》,当用户跟着计算机说完一句话¨—;I后,计算机会同时显示标准发音和用户发音的波形图2语音识别流程图比照图,用户可以反
8、复对比倾听
此文档下载收益归作者所有