欢迎来到天天文库
浏览记录
ID:38234291
大小:82.51 KB
页数:4页
时间:2019-05-26
《语音识别的研究与发展》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、计算机与现代化!""!年第%期YXSG/FYXZG2X/FJ/X0G/总第’&期文章编号:#"")$!*’(+!""!)"%$"""%$"*语音识别的研究与发展何湘智(国防科技大学机电工程与自动化学院,湖南长沙*#""’%)摘要:综合阐述了语音识别技术的提出与发展历史,语音识别系统的分类,目前所面临的困难和采用的主要技术,以及发展方向和应用前景。关键词:语音识别;隐马尔可夫;矢量量化;动态时间规整中图分类号:,-%.*文献标识码:/!"#$#%#&’("&)*+#,#-./0#)1.23/##
2、("$#(.4)515.)0123456$783(9:;;<6<:=>84@A:53?B15635<3、:=BM<8A>;PQ;J,R文数字的语音识别系统———/DCAK系统。;语音识别技术的提出及发展历史)"年代,计算机的应用推动了语音识别的发展。这一时期的重要成果是提出了用动态规划(J-)方法随着现代科学和计算机技术的发展,人们在与机来解决语音识别中不等长的对正问题。器的信息交流中,需要一种更加方便、自然的方式。而人的直观感觉可以给人最直接的印象4、,获取信息速’"年代,语音识别领域取得了突破。线性预测编码技术(W-9)的引入,使语音识别的特征提取产生度也就最快。虽然,嗅觉、触觉也是人类固有的感觉,人们可以从中得到某些外界信息,但最重要、最精细了一次飞跃。动态时间规整技术(J,R)基本成熟,提的信息源只有图像和语言两种。而且,语言是人类最出了矢量量化(PQ)和隐马尔可夫模型(0>>)理论。重要的、最有效的、最常用的和最方便的通信形式。实现了基于线性预测倒谱和J,R技术的特定人孤立这就很容易让人想到能否用自然语言代替传统的人语音识别系统。机交流5、方式如键盘、鼠标等。一般来讲,人与机器的("年代,语音识别研究进一步走向深入,其显著语言通信大致分为两种情况:第一种情况就是机器讲特征是0>>模型和人工神经元网络(/FF)在语音识话,人听话。这就是“人工嘴巴”即语音的人工合成;别中的成功应用。0>>模型的广泛应用应归功于第二种情况就是人讲话,机器听话。这即是“人工耳/,U,V<;;实验室T4N35>纯数学模型工程化,从而为更多研成而言,技术上要复杂,但应用却更加6、广泛。语音识究者了解和认识。别/ST(/D@:E4@3?SM<8T、/MM;<、/,U,、F,,等著名就是/,U,V<;;实验室实现了第一个可识别十个英公司都为语音识别系统的实用化开发研究投以巨资。收稿日期:!""#$##$#%作者简介:何湘智(#&’($),男,湖南衡7、山人,国防科技大学机电工程与自动化学院硕士研究生,研究方向:信号处理与模式识别。J计算机与现代化/00/年第.期!"#公司于$%%&年开发出汉语’()’*(+,语音识别系理、所采用的基本技术相似。语音识别的原理图如图统,次年又开发出可以识别上海话、广东话和四川话$所示。等地方口音的语音识别系统’()’*(+,’%-。它带有一个./,000词的基本词汇表,可以扩展到12,000词,还包括办公常用词条,具有”纠错机制”,其平均识别率可以达到%23。该系统对新闻语音识别具有较高的精度,是目前具有代表性的8、汉语连续语音识别系统。45,,+67*89:公司是世界领先的电话自动语音识图$语音识别原理图别系统(;4<)解决方案的提供者,代表产品为45,,+67*89:1。利用该产品,用户可以通过电话用自预处理。包括反混叠滤波、模数变换、自动增益然语言与系统进行交互,进行旅游预约、股票交易、银控制、去除声门激励以及在声学参数分析之前正确选行服务、订票服务、宾馆服务和寻呼服务等,由于系统择识别基元等问题。是自动的,无需服务人员的介入。目前市场上出现了参数分析。经过预处理后的语音信号,就要对其语
3、:=BM<8A>;PQ;J,R文数字的语音识别系统———/DCAK系统。;语音识别技术的提出及发展历史)"年代,计算机的应用推动了语音识别的发展。这一时期的重要成果是提出了用动态规划(J-)方法随着现代科学和计算机技术的发展,人们在与机来解决语音识别中不等长的对正问题。器的信息交流中,需要一种更加方便、自然的方式。而人的直观感觉可以给人最直接的印象
4、,获取信息速’"年代,语音识别领域取得了突破。线性预测编码技术(W-9)的引入,使语音识别的特征提取产生度也就最快。虽然,嗅觉、触觉也是人类固有的感觉,人们可以从中得到某些外界信息,但最重要、最精细了一次飞跃。动态时间规整技术(J,R)基本成熟,提的信息源只有图像和语言两种。而且,语言是人类最出了矢量量化(PQ)和隐马尔可夫模型(0>>)理论。重要的、最有效的、最常用的和最方便的通信形式。实现了基于线性预测倒谱和J,R技术的特定人孤立这就很容易让人想到能否用自然语言代替传统的人语音识别系统。机交流
5、方式如键盘、鼠标等。一般来讲,人与机器的("年代,语音识别研究进一步走向深入,其显著语言通信大致分为两种情况:第一种情况就是机器讲特征是0>>模型和人工神经元网络(/FF)在语音识话,人听话。这就是“人工嘴巴”即语音的人工合成;别中的成功应用。0>>模型的广泛应用应归功于第二种情况就是人讲话,机器听话。这即是“人工耳/,U,V<;;实验室T4N35>纯数学模型工程化,从而为更多研成而言,技术上要复杂,但应用却更加
6、广泛。语音识究者了解和认识。别/ST(/D@:E4@3?SM<8T、/MM;<、/,U,、F,,等著名就是/,U,V<;;实验室实现了第一个可识别十个英公司都为语音识别系统的实用化开发研究投以巨资。收稿日期:!""#$##$#%作者简介:何湘智(#&’($),男,湖南衡
7、山人,国防科技大学机电工程与自动化学院硕士研究生,研究方向:信号处理与模式识别。J计算机与现代化/00/年第.期!"#公司于$%%&年开发出汉语’()’*(+,语音识别系理、所采用的基本技术相似。语音识别的原理图如图统,次年又开发出可以识别上海话、广东话和四川话$所示。等地方口音的语音识别系统’()’*(+,’%-。它带有一个./,000词的基本词汇表,可以扩展到12,000词,还包括办公常用词条,具有”纠错机制”,其平均识别率可以达到%23。该系统对新闻语音识别具有较高的精度,是目前具有代表性的
8、汉语连续语音识别系统。45,,+67*89:公司是世界领先的电话自动语音识图$语音识别原理图别系统(;4<)解决方案的提供者,代表产品为45,,+67*89:1。利用该产品,用户可以通过电话用自预处理。包括反混叠滤波、模数变换、自动增益然语言与系统进行交互,进行旅游预约、股票交易、银控制、去除声门激励以及在声学参数分析之前正确选行服务、订票服务、宾馆服务和寻呼服务等,由于系统择识别基元等问题。是自动的,无需服务人员的介入。目前市场上出现了参数分析。经过预处理后的语音信号,就要对其语
此文档下载收益归作者所有