欢迎来到天天文库
浏览记录
ID:42082667
大小:59.50 KB
页数:4页
时间:2019-09-07
《语音识别系统之管窥》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、语音识别系统之管窥通过语咅和互传递信息,这是人类最重要的基木功能Z-,而与机器进行语音交流,让机器明白你说什么,这是人么长期以来梦寐以求的事。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。计算机语音识别是智能计算机系统的重要特征。这一技术的应用将从根本上改变计算机的人机界面,从而对计算机的发展以及推广应用产生深远的影响。历史1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统。1960年英国的Denes等人研究成功了第一个计算机语音识别系统。而大规模的语咅识别研究是在进入了70年代以后,在小词汇
2、量、孤立词的识别方面取得了实质性的进展。DARPA(DefenseAdvancedResearchProjectsAgency)是在70年代由美国国防部远景研究计划局资助的一项10年计划,其旨在支持语言理解系统的研究开发工作。进入80年代以后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型(HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路。美国国防部远景研究计划局资助了一项为期10年的DARPA战略计划,其小包括噪声下的语音识别和会话(口语)识别系统
3、,识别任务设定为“(1000单词)连续语音数据库管理”。进入90年代以后,在语音识别的系统框架方面并没有什么重人突破。但是,在语咅识别技术的应用及产品化方面出现了很大的进展。我国的语音识别研究起始于1958年,由屮国科学院声学所利用电子管电路识别10个元音。直至1973年才由小国科学院声学所开始计算机语音识别。由于当时条件的限制,我国的语音识别研究工作一直处于缓慢发展的阶段。进入80年代以后,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语咅技术的基木条件。1986年3月我国高科技发展计划(863计划)启动,语音识别作为智
4、能计算机系统研究的一个重要组成部分而被专门列为研究课题。在863计划的支持下,我国开始了有组织的语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。从此我国的语音识别技术进入了一个前所未有的发展阶段。分类按识别器的类型:1・孤立单词识别(IsolatedWordRecognition)识别的单元为字、词或短语,它们组成识别的词汇表,对它们屮的每一个通过训练建立标准模板或模型。2.连续语咅识别(ContinuousSpeechRecognition)3.连续单词识別(ConnectedWordRecognition):以比较少的词汇为对象,能够完全识别每个
5、词。识别的词汇表和标准样板或模型也是字、词或短语,但识别时可以是它们111间几个的连续。4.连续言语识别与理解(ConversationalSpeechRecognition):以多数词汇为对象,待识语音是一些完整的句子。虽不能完全准确识别每个单词,但能够理解其意义,连续言语识别也称会话语咅识别。理解是在语咅识別Z后,根据语言学知识来推断语音的含义内容的。按识别器对使用者的适应情况:特定人语音识别(Speaker-Dependent)语音识别的标准模板或模型只适应于某个人,实际上,该模板或模型就是该人通过输入词汇表中的每个字、词或短语的语咅建立起來的。其他人使用时,
6、需同样建立自己的标准模板或模型。非特定人语音识别(Speaker-Independent)语音识别的标准模板或模型适应于指定的某一范畴的说话人(如说标准普通话),标准模板或模型市该范畴的多个人通过训练而产生。识别吋可供参加训练的发音人(圈内人)使用,也可供未参加训练的同一范畴的发咅人(圈外人)使用。几种基本方法一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。1・基于声道模型和语音知识的方法。该方法起步较早,在语音技术提出的开始,就有了这方而研究,但由于其模型及语音知识过于复杂,如今仍未达到实用阶段。2•模板匹配
7、的方法。此方法比较成熟,目前已达到实用阶段。在模板匹配的方法中,耍经过四个步骤:特征提取、模板训练、模板分类、判决。常用的技术有三种:动态时间规整(DTW),隐马尔可夫模型(HMM)理论、矢量量化(VQ)技术。3.神经网络的方法。利用人工神经网络的方法是80年代末期起初的-•种新的语音识别方法。人工神经网络本质上是一个自适应非动力学系统,模拟了人类神经活动原理,具有自适应性、并行性、鲁棒性、容错性和学习特性,其强人的分类能力和输入输出映射能力在语咅识别系统中都很有吸引力。但由于存在训练、识别时间太长的缺点,目前仍处于试验探索阶段。由于人工神经网络不能很好地描述语
此文档下载收益归作者所有