利用matlab平台实现少量字的语音识别(含源文件).

利用matlab平台实现少量字的语音识别(含源文件).

ID:19443345

大小:2.04 MB

页数:32页

时间:2018-10-02

利用matlab平台实现少量字的语音识别(含源文件)._第1页
利用matlab平台实现少量字的语音识别(含源文件)._第2页
利用matlab平台实现少量字的语音识别(含源文件)._第3页
利用matlab平台实现少量字的语音识别(含源文件)._第4页
利用matlab平台实现少量字的语音识别(含源文件)._第5页
资源描述:

《利用matlab平台实现少量字的语音识别(含源文件).》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、本科毕业论文(设计)论文题目利用MATLAB平台实现少量字的语音识别31摘要摘要:初步研究两种不同的语音识别算法---动态时间伸缩算法(DTW)和隐马尔科夫模型(HMM),初步探究并实现在MATLAB环境中应用DTW识别法的孤立字语音识别实验平台。关键字:MATLAB,语音识别,LPC,LPCC,MFCC,动态时间伸缩算法(DTW),隐马尔科夫模型(HMM)Abstract【Abstract】:Usetwokindsofarithmetictostudyspeechrecognition:DynamicTimeWarping(DTW)andtheHiddenMarkovModel(

2、HMM).BuildabasictestplatformofspeechrecognitionusingDTW.【Keywords】:MATLAB,speechrecognition,LPC,LPCC,MFCC,DynamicTimeWarping,HiddenMarkovModel31目录引言41.语音识别简介51.1语音识别系统的分类51.2语音识别系统的基本构成52.语音识别参数62.1线性预测系数(LPC)62.2线性预测倒谱系数(LPCC)82.3MFCC系数82.4参数计算流程93.DTW算法113.1DTW算法原理113.2DTW的高效算法144.HMM算法164.1

3、HMM的原理164.2HMM的前向概率和后向概率174.3识别算法——Viterbi解码194.4baum-welch算法205.实验及总结235.1实验准备以及步骤235.2实验结果及讨论255.3实验结论29参考文献3031引言自上世纪80年代开始,语音识别技术的研究进入了一个蓬勃发展的时期,一些商用系统也从实验室进入市场。然而,在实际的应用中,由于各种干扰因素导致的测试条件与训练环境的不匹配,系统的性能往往会收到极大的影响。因此提高语音识别系统的性能就成为了语音识别技术真正走向实用化的关键课题。语音识别是以声音作为研究对象它是语音信号处理的一个重要研究方向,是模式识别的一个分

4、支涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。本文研究了汉语语音识别技术及其实现方法。论文首先分析了语音信号预处理问题。对MFCC倒谱系数在语音识别中的运用做了详细介绍。其次研究了基于DTW的语音识别系统,针对DTW算法中系统识别性能过分依赖于端点检测、动态规划的计算量太大等缺陷,分别提出了快速DTW算法和端点松动的DTW算法,仿真结果比较理想。继而研究了基于HMM的语音识别系统。针对HMM在实际应用中的优化计算问题,包括初始模型选取,定标等进

5、行了深入的分析与探讨。针对传统定标仍能溢出的问题,给出了无溢出的参数重估公式。31第一章语音识别简介1.1语音识别系统的分类语音识别是近年来十分活跃的一个研究领域。在不远的将来,语音识别技术有可能作为一种重要的人机交互手段,辅助甚至取代传统的键盘、鼠标等输入设备,在个人计算机上进行文字录入和操作控制。本文介绍了语音识别的基本流程、所用到的语音参数算法、语音识别的训练算法和识别算法做初步的探究,主要运用了特定人孤立词识别的DTW算法和非特定人识别的连续HMM算法的MATLAB识别系统。语音识别按说话人的讲话方式可分为孤立词(IsolatedWord)识别、连接词(ConnectedW

6、ord)识别和连续语音(ContinuousSpeech)识别。孤立词识别是指说话人每次只说一个词或短语,每个词或短语在词汇表中都算作一个词条,一般用在语音电话拨号系统中。连接词语音识别支持一个小的语法网络,其内部形成一个状态机,可以实现简单的家用电器的控制,而复杂的连接词语音识别系统可以用于电话语音查询、航空定票等系统。连续语音识别是指对说话人以日常自然的方式发音,通常特指用于语音录入的听写机。显然,连续非特定人语音识别的难度要大得多,因为不仅有说话人口音的问题,还有协同发音、断字断句、搜索等问题,除了考虑语音的声学模型外还要涉及到语言模型,如构词法、文法等。从识别对象的类型来看

7、,语音识别可以分为特定人(SpeakerDependent)语音识别和非特定人(SpeakerIndependent)语音识别。特定人是指只针对一个用户的语音识别,非特定人则可用于不同的用户。实际上,非特定人语音识别的初始识别率往往都比较低,一般都要求用户花一定的时间对系统进行训练,将系统的参数进行一定的自适应调整,才能使识别率达到满意的程度。非特定人大词表连续语音识别是近几年研究的重点,也是研究的难点。目前的连续语音识别大多是基于HMM(隐马尔可夫模型)框架,并将声

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。