欢迎来到天天文库
浏览记录
ID:463972
大小:45.00 KB
页数:4页
时间:2017-08-05
《基于语音识别和语音播报设计综述【文献综述】》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、毕业论文文献综述电子信息工程基于语音识别和语音播报设计综述摘要:语音识别是机器通过识别和理解过程把语音信号变为相应的文本文件或命令的高技术。作为一个专门的研究领域,语音识别又是一门交叉学科,它与声学、语音学、语音学、人工智能、数字信号处理理论、信息理论、模式识别理论、最优化理论、计算机科学等众多学科紧密相连。语音识别经过四十多年的发展,已经显示出巨大的应用前景,高性能的语音识别系统相继问世。本文主要介绍语音识别技术的简介、发展以及语音识别和语音播报的一些主要应用。关键词:语音识别技术;语音播报一.
2、语音识别技术简介语音识别技术,也被称为自动语音识别AutomaticSpeechRecognition(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。一个完整的语音识别系统可大致分为三部分如图1所示[1]。图1语音识别系统的实现过程二.语音识别技术发展语音识别技术起始于20世纪50年代的Audry系统,这是语音识别研究工作的开端。1959年,J.W.Ror
3、gie和C.D.Forgie采用数字计算机识别英文元音及孤立字,开始了计算机语音识别[2]。1952年,AT&TBell实验室开发了一个单一发音人孤立发音的十个英文数字的语音识别系统,主要是采用度量每个数字的元音音段的共振峰的方法。1956年,RCALab开展的一项独立研究也是试图识别单一发音人的10不同的音节,同样采用了度量共振峰的方法。1959年,英国UniversityCollege的研究人员尝试用谱分析和模板匹配方法构建了一种音素识别器,用以识别4个元音和9个辅音[3]。60年代,语音识别
4、的几个重要的思想被发表了。伴随着这个年代的开始,几个日本的实验室进入语音识别领域,搭建了一些专用的硬件用于语音识别系统。东京RadioResearchLab首先构建了一个用硬件实现的元音识别器。语音信号经过精心制作的带通滤波器进行谱分析和通道输出谱加权处理后,通过用多数逻辑决策电路来选择输入语音中元音的识别结果。1962年,东京大学实施了另一个音素识别器的硬件实现的试验。它使用过零率方法使语音信号的不同部分分离开来,并同时进行识别。1963年,日本NECLab对数字进行语音识别的尝试可以说是最值得
5、注意的项目。它是NEC研究语音识别的开端[4]。20世纪30年代,荷马达德利通过分析语音合成系统提出了HMM模型[5]。20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投入巨大的资金。具有代表性的系统有:IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台,Microsoft的Whisper,Sun的VoiceTone等。1997年,IB
6、M公司开发出汉语ViaVoice语音识别系统。1998年,又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice'98。它带有一个32,000词的基本词汇表,可以扩展到65,000词,其中还包括办公常用词条,具有“纠错机制”,其平均识别率可达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统[6]。清华大学电子工程系语音识别技术与专用芯片设计课题组,开发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%和96.8%。在有5%的拒
7、识率情况下,系统识别率可以达到96.9%和98.7%,这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。中科院自动化所和所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,该系列产品结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。三.语音识别和语
8、音播报的应用近年来语音识别和语音播报应用越来越广泛,主要包括:(1)电话通信中的语音识别和语音拨号。特别是在中、高档移动电话上,现已普遍具有语音拨号的功能。随着语音识别芯片的价格降低,普通电话上也将具备语音拨号的功能。在文献[7]中,作者以AT89C51单片机作为控制核心的自动拨号、检测和放音的智能语音拨号报警系统。重点论述了自动拨号和语音部分的电路结构、工作原理和软件设计方法。该系统配置灵活,可以有效、快速地应用于对安防要求比较高的场合。例如:对不需要监视视频丢失的场合,可以不配
此文档下载收益归作者所有