人语音识别技术

人语音识别技术

ID:35551426

大小:1010.71 KB

页数:12页

时间:2019-03-27

人语音识别技术_第1页
人语音识别技术_第2页
人语音识别技术_第3页
人语音识别技术_第4页
人语音识别技术_第5页
资源描述:

《人语音识别技术》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、人语音识别技术1.机器人语音识别概述语音识别是人机接口设计的一项重要内容,也是语音信号处理中非常重要的应用技术,正逐步成为信息技术中人机交互的关键技术。语音识别技术本身是一门交叉科学,其涉及到了信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等多项学术领域。语音识别技术的发展,让身处信息时代我们,能够用最基本的人类语言来进行电子产品的操作。相信大家都在科幻电影中看到过这样的场景:各种形态的智能机器人服务于社会、工厂、家庭,各种电子设备可以直接与人类进行对话,并执行高智能化的程序……目前,语音识别技术己经在诸多领域得到应用。随着信息产业的迅速发展

2、,包括计算机、办公自动化、通信、国防、机器人在内的各个领域,都迫切需要采用语音识别技术来改变极其不方便的人机接口方式。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的一种技术,其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。把这种具有语音信息处理能力的机器和设备纳入人的语音交互对象,使之像人一样具备听、说、写功能,能对语音做出理解和反应,并在交互方式上不受时间和地点的限制,这是研究机器人语音识别的重大意义。2.语音识别的发展历程早在计算机发明之前,语音识别的设想就已经被人们提出,早

3、期的声码器可被视作语音识别及合成的雏形。而在1920年,一款名为RadioRex的玩具狗应该可以被看做是最早的语音识别器,因为当这只狗的名字被呼唤的时候,它能够以“从底座上弹出来”这样的动作进行反应。最早的基于电子计算机的语音识别系统是1952年由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。1960年代,人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码LinearPredictiveCoding(LPC),及动态时间规整DynamicTimeWarp(DTW)技术。70年代,孤立词识别是语音识别研究领域具有划时代意

4、义的成果,另外IBM逐步开始立致于大词汇量连续语音识别的研究阵营。研究出的成果有简单备忘录的听写系统Tangon。80年代,语音识别的研究从孤立词识别转向连续词识别。识别方法的转变,改变了传统的DTW这种基于模板的识别方法,开始倾向于隐马尔科夫模型HMM这种基于统计模型的识别方法。90年代以后,语音识别的研究热点主要集中在人机语音交互、语音情感识别,多语种语音同声翻译等方面。1997年IBM公司推出中文听写机系统ViaVoice,该系统具有高精度的语音识别能力,是目前具有代表性的汉语连续语音识别系统,2012年美国苹果公司生产的基于iphone4S的siri特

5、有的语音识别功能,更是语音发展的又一个阶梯,而微软公司推出的kinect更是将图像识别和语音识别技术融为一体,扩展了语音识别的研究范畴。如今的保险柜的声控装置、微信聊天软件中的语音输入辅助功能,现在的科学水平都已经能够轻松实现了。我国在语音识别研究上也投入了很大的精力,语音识别研究以中科院作为首要研究中心。从50年代后期到80年代,中科院在吸收和引进国外资源的同时,开始与国际接轨,以实验室环境为工作条件,展开对孤立词特定人的语音识别的研究。国家863计划智能计算机主题专家组为语音识别技术的研究专门立项,在汉语语音识别、汉语语音数据库建立、汉语语音学、听觉模型等

6、基础研究方面取得长足进展。提到智能语音及语音技术研究、软件及芯片产品开发、语音信息服务,就不得不提到科大讯飞。其拥有自主知识产权的世界领先智能语音技术,已推出从大型电信级应用到小型嵌入式应用,从电信、金融等行业到企业和家庭用户,从PC到手机到MP3/MP4/PMP和玩具,能够满足不同应用环境的多种产品。当前,电子产品的人机交互功能期待着更为实用和多样化的方式。“语音是人与人之间最佳的沟通方式。我们最终将具备足够的计算能力,实现科幻小说中的场景。”英特尔感知计算高级副总裁莫里·艾登近日在接受媒体采访时表示:“就像触摸屏颠覆键盘一样,语音识别最终也将颠覆触摸屏”。

7、近两年,由于便携性的优势,手机在语音识别方面的发展暂时比较领先。苹果Siri、微软小娜、安卓三大语音助手的普及与发展也方便了人们的生活,与此同时笔记本、平板上语音识别技术也被越来越广泛的应用起来。三、理论基础:语音识别相关原理与算法的研究:1、语音识别基础(1)语音识别的基本原理:语音识别技术就是将采集到的音频信号经过一系列的变换转换为文字的复杂过程,其中包括采集音频、预处理音频、提取音频信号的特征、将特征值作为模版或训练模型存入库中待识别进行匹配,最后经过匹配进行识别。语音识别实现流程总体概括起来由3个步骤组成:音频信号的采集处理和提取特征参数;训练声学模型

8、并且匹配识别;建立语言模型及语法纠正。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。