浅谈语音识别技术的应用及发展

浅谈语音识别技术的应用及发展

ID:5302858

大小:724.88 KB

页数:2页

时间:2017-12-07

浅谈语音识别技术的应用及发展_第1页
浅谈语音识别技术的应用及发展_第2页
资源描述:

《浅谈语音识别技术的应用及发展》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第4卷 第2期长春理工大学学报(高教版)Vol.4No.22009年2月CHANGCHUNUNIVERSITYOFSCIENCEANDTECHNOLOGY(Highereducationedition)Feb.2009浅谈语音识别技术的应用及发展朱淑鑫 谢忠红(南京农业大学信息科技学院,江苏南京,210095)[摘 要] 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。本文简单介绍了语音识别技术的基本原理和应用,并且对语音识别技术的发展趋势进行了展望。 [关键词] 语音识别;应用;发展[中图分类号] TN912.34[文献标识码] A[作者简介] 朱淑鑫(1

2、978— ),女,江苏大丰人,研究生在读,助教,研究方向为多媒体;谢忠红(1977— ),女,江苏泰兴人,博士研究生,讲师,研究方向为模式识别。语音识别是一门交叉学科,它所涉及的领域包括:信这属于小词汇量语音识别系统;如果它是为你自动订飞机号处理、模式识别、概率论和信息论、发声机理和听觉机票,那么它就应该还会认识地名、时间等成百上千条必须理、人工智能等。语音识别目前正逐步成为信息技术中人用的词和字,这属于中等词汇量语音识别系统;如果它是机接口的关键技术,随着连续语音识别率的提高,语音逐为一个记者把口述的一篇报告转换成为文字,那它的词汇步成为计算机的标准输入手段之一。量就必须很大才能胜任这样的

3、工作,这属于大词汇量语音识别系统。一、语音识别基础及分类3.特定人和非特定人语音识别系统(一)语音识别基础特定人系统是指系统在使用前必须由用户输入大量的语音识别技术就是让机器通过识别和理解过程把语音发音数据、对其进行训练。非特定人系统则试图达到在系信号转变为相应的文本或命令的高技术。语音识别技术研统构建成功之后,用户不需要事先输入大量的训练数据,究工作大约开始于20世纪50年代,由AT&TBell实验室即可使用的目的。语音信号的可变性很大,不同的人说话开发了第一个用于识别10个英文数字的语音识别系统——的时候,即使是同一个音节,如果对其进行仔细分析,会Audry系统;在20世纪60—90年代

4、,由于动态时间规整发现存在相当大的差异。要让一个语音识别系统能够识别(DTW)、语音信号线性预测编码(LPC)、隐马尔科夫非特定人的语音,困难程度就比较大。这样的识别系统要模型(HMM)、人工神经元网络(ANN)等模型的应用能从大量的不同人的发音样本中学习到非特定人语音的发极大地推动了语音识别技术的发展。音速度、语音强度、发音方式等基本特征,并寻找归纳其(二)语音识别系统分类相似性作为识别时的标准。因为这个学习和训练的过程相1.孤立语音和连续语音识别系统当复杂,所用的语音样本也要顶先采集,所以必须在系统自然的语音,只在句尾或是文字需要加标点的地方必生成之前完成,并把有关的信息存入系统的数据库

5、中,以须间断,其他的部分可以连续不断地发音。但是语音识别供真正识别时用。系统,可能要求说话者以单字、单词或是短语为发音单位,其间就必须要略微停顿,否则识别就会有问题。以前二、语音识别的基本原理及相关应用的语音识别系统,几乎都是以单字或单词为单位的孤立语以上所提到的不同的语音识别系统,其具体实现细节音识别系统,例如:一个使用语音进行家电控制的语音识有所不同,但所采用的基本原理和处理方法都大体相似。别系统,可以识别用户发出的诸如“开”“关”“请打具体一点说,一个典型的语音识别系统主要包括语音信号开”“提高音量”等语音指令。这样对各个音节的识别会的预处理、参数分析、测度估计和模式匹配几个部分。失比

6、较准确,识别过程中对算法复杂度的要求也减轻许多。真测度、测度估计、语音库、专家知识库和判决隶属于模随着近年来的研究和发展,连续语音识别技术已渐趋成式匹配部分。实现的基本做法是:在一定数量的样本训练熟,这个最自然的说话方式,将成为语音识别系统的主集基础上确定某个测度估计,使按这种测度估计对被识别流。对象进行分类所造成的错误识别率最小或引起的损失最2.大词汇量和小词汇量语音识别系统小。从理论上说来,一个计算机如果能听懂“是”及“不(一)预处理是”的语音输入,那它就可以采用语音方式进行操作。在预处理包括选择和识别基元、预滤波、采样和量化、语音识别技术的发展过程中,词汇量也正是从小到大发加窗、端点检

7、测、预加重等过程。预处理的目的是去除噪展的,随着词汇量的增大,对系统各方面的要求也越来越声,加强有用的信息,并对输入测量仪器或其他因素造成高,它的成本也越来越高了。的退化现象进行复原。其中的选择和识别基元是语音识别如果语音识别系统只是要为你在开车的时候利用语音研究的第一步。语音识别基元有单词(句)、音节和音素进行电话拨号,那它几乎只要能听懂十个数字就可以了,三种,具体选择哪一种,由具体的研究任务决定。单词—6

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。