语音识别技术详介和应用前景分析

语音识别技术详介和应用前景分析

ID:42077538

大小:28.50 KB

页数:5页

时间:2019-09-07

语音识别技术详介和应用前景分析_第1页
语音识别技术详介和应用前景分析_第2页
语音识别技术详介和应用前景分析_第3页
语音识别技术详介和应用前景分析_第4页
语音识别技术详介和应用前景分析_第5页
资源描述:

《语音识别技术详介和应用前景分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、音识别技术详细介绍及应用前景分析作者:未知专题來源:网络点击数:518更新时间:2006-8-25语音识别技术是2000年至2010年间信息技术领域十人重要的科技发展技术之-。它是一门交叉学科,正逐步成为信息技术中人机接口的关键技术。语音识别技术与语音合成技术结合使人们能够丿11掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。语音识别技术与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年來,语音识别技术取得显著进步

2、,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电了产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件人事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术的基础语音识别技术关系到多学科的研究领域,不同领域上的研究成果都对语音识別的发展作了贡献。让机器识别语音的困难在某种程度上就像一个外语不好的人听外国人讲话一样,它和不同的说话人、不同的说话速度、不同的说话内容、以及不同的环境条件冇关。语音信号木身的特点造成了语音识别的困难

3、。这些特点包括多变性,动态性,瞬时性和连续性等。计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基木理论。一个完整的语音识别系统可大致分为三部分:(1)语音特征提取:其目的是从语音波形屮提取出随时间变化的语音特征序列。(2)声学模型与模式匹配(识别算法):声学模型通常将获取的语音特征通过学习算法产生。在识別吋将输入的语音特征同声学模型(模式)进行匹配为比较,得到最佳的识別结果。(3)语言模型与语言处理:语言模型包括山识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。对小词表语音识别系统,往往不盂要语

4、言处理部分。声学模型是识别系统的底层模型,并且是语音识别系统小最关键的一部分。声学模型的冃的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板Z间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大的影响。必须根据不同语言的特点、识别系统词汇量的人小决定识别单元的人小。语言模型对中、大词汇量的语音识別系统特别重要。当分类发生错误时可以根据语言学模型、语法结构、语义学进行判断纠正,特别是一些同音字则必须通过上下文结构才能确定词义。语言学理论包括语义结构、语法规则、语言的数学描述模型等有

5、关方面。目前比较成功的语言模型通常是采用统计语法的语言模型与基于规则语法结构命令语言模型。语法结构口J以限定不同词Z间的相互连接关系,减少了识别系统的搜索空间,这冇利于提高系统的识别。语音识别过程实际上是一种认识过程。就像人们听语音时,并不把语音和语言的语法结构、语义结构分开來,因为当语音发音模糊时人们可以用这些知识來指导对语言的理解过程,但是对机器來说,识别系统也要利用这些方血的知识,只是如何有效地描述这些语法和语义还有困难:(1)小词汇量语音识别系统。通常包括儿十个词的语音识别系统。(2)屮等词汇量的语音识别系统。通常包括几百个词至上千个词的识别系统。(3)大词汇量语音识别系统。

6、通常包括儿千至儿万个词的语音识别系统。这些不同的限制也确定了语音识别系统的困难度。语音识别技术的发展情况我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还冇自己的特点与优势,并达到国际先进水平。其中具冇代表性的研究单位为清华大学电了工程系与中科院自动化研究所模式识别国家重点实验室。电了工程系语咅技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别梢度,达

7、到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识別结果Z-,其性能已经接近实用水平。硏发的5000词邮包校核非特定人连续语音识别系统的识别率达到9&73%,前三选识别率达99.96%;并且可以识別普通话少四川话两种语言,达到实用耍求。2000年7月在北京自然博物馆新开设的动物展馆屮展出的具有语音识别口语对话功能“熊猫”,采用了我们研发

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。