语音识别技术的发展与未来.doc

语音识别技术的发展与未来.doc

ID:53294815

大小:65.50 KB

页数:5页

时间:2020-04-03

语音识别技术的发展与未来.doc_第1页
语音识别技术的发展与未来.doc_第2页
语音识别技术的发展与未来.doc_第3页
语音识别技术的发展与未来.doc_第4页
语音识别技术的发展与未来.doc_第5页
资源描述:

《语音识别技术的发展与未来.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、语音识别技术的发展与未来与机器进行语音交流,让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比“机器的听觉系统”,该技术让机器通过识别和理解,把语音信号转变为相应的文本或命令。在1952年的贝尔研究所,Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。I960年英国的Denes等人研制了第一个计算机语音识别系统。大规模的语音识别研究始于上世纪70年代以后,并在小词汇量、孤立词的识别方面取得了实质性的进展。上世纪80年代以后,语音识别研究的重点逐渐转向大词汇量、非特定人连续语音识别。同时,语音识别在研究思路上也发生了重大变化,由传统

2、的基于标准模板匹配的技术思路开始转向基于统计模型的技术思路。此外,业内有专家再次提出了将神经网络技术引入语音识别问题的技术思路。上世纪90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。比如,DARPA是在上世界70年代由美国国防部远景研究计划局资助的一项计划,旨在支持语言理解系统的研究开发工作。进入上世纪90年代,DARPA计划仍在持续进行中,其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索S我国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。由于当时条

3、件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。直至1973年,中国科学院声学所开始了计算机语咅识别。进入上世纪80年代以来,随着计算机应用技术在我国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语咅识别技术在经过了多年的沉寂Z后重又成为研究的热点。在这种形式下,国内许多单位纷纷投入到这项研究工作中去。1986年,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在“863”计划的支持下,中国开始组织语音识别技术的研究,并决定了每隔两年召开一次语咅识别的专题会议。自此,我国语音识别技术进入了一个

4、新的发展阶段。自2009年以来,借助机器学习领域深度学习研究的发展以及大数据语料的积累,语音识别技术得到突飞猛进的发展。将机器学习领域深度学习研究引入到语音识别声学模型训练,使用带RBM预训练的多层神经网络,提高了声学模型的准确率。在此方面,微软公司的研究人员率先取得了突破性进展,他们使用深层神经网络模型(DNN)后,语咅识别错误率降低了30%,是近20年来语咅识别技术方面最快的进步。2009年前后,大多主流的语音识别解码器已经采用基于有限状态机(WFST)的解码网络,该解码网络可以把语言模型、词典和声学共享咅字集统一集成为一个大的解码网络,提高了解码的速度,为语音识别的实时应

5、用提供了基础。随着互联网的快速发展,以及手机等移动终端的普及应用,可以从多个渠道获取大量文本或语咅方面的语料,这为语咅识别屮的语言模型和声学模型的训练提供了丰富的资源,使得构建通用大规模语言模型和声学模型成为可能。在语咅识别屮,训练数据的匹配和丰富性是推动系统性能提升的最重要因素之一,但是语料的标注和分析需要长期的积累和沉淀,随着大数据时代的来临,大规模语料资源的积累将提到战略高度。现如今,语音识别在移动终端上的应用最为火热,语音对话机器人、语音助手、互动工具等层出不穷,许多互联网公司纷纷投入人力、物力和财力展开此方面的研究和应用,冃的是通过语咅交互的新颖和便利模式迅速占领客户

6、群。(雨叩整理)相关产品siriSiri技术來源于美国国防部高级研究规划局所公布的CALO计划:一个让军方简化处理一些繁复庶务,并具学习、组织以及认知能力的数字助理,其所衍生出來的民用版软件Siri虚拟个人助理。Siri成立于2007年,最初是以文字聊天服务为主,随后通过与语咅识别厂商Nuance合作,Siri实现了语音识别功能。2010年,Siri被苹果以2亿美金收购。Siri成为苹果公司在其产品iPhone和iPadAir上应用的一项语音控制功能。Siri可以令iPhone和iPadAir变身为一台智能化机器人。Siri支持自然语言输入,并且可以调用系统自带的天气预报、口程

7、安排、搜索资料等应用,还能够不断学习新的声音和语调,提供对话式的应答。GoogleNowGoogleNow是谷歌随安卓4.1系统同时推出的一款应用,它可以了解用户的各种习惯和正在进行的动作,并利用所了解的资料来为用户提供相关信息。今年3月24日,谷歌宣布GoogleNow语音服务正式登陆Windows和Mac桌面版Chrome浏览器。GoogleNow的应用会更加方便用户收取电子邮件,当你接收到新邮件吋,它就会自动弹出以便你查看。GoogleNow还推出了步行和行车里程记录功能,这个计步器功

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。