基于HMM算法的语音识别原理与实现.pdf

基于HMM算法的语音识别原理与实现.pdf

ID:48000772

大小:407.98 KB

页数:14页

时间:2020-01-11

基于HMM算法的语音识别原理与实现.pdf_第1页
基于HMM算法的语音识别原理与实现.pdf_第2页
基于HMM算法的语音识别原理与实现.pdf_第3页
基于HMM算法的语音识别原理与实现.pdf_第4页
基于HMM算法的语音识别原理与实现.pdf_第5页
资源描述:

《基于HMM算法的语音识别原理与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、广州大学机械与电气工程学院数字语音信号处理基于HMM算法的语音识别原理与实现院系:机电学院电子与通信工程姓名:关卿学号:2111307020指导老师:王杰完成日期:2014-06-14摘要针对语音识别中的预加重、加窗分帧、端点检测,特征参数提取以及训练和识别等过程,给出了基于MATLAB所实现各个环节的具体程序设计,根据语音识别的原理,构建了基于MATLAB的软件实现流程,为语音识别设计提供了一种基本的实现模型,并为其他语音识别方法提供了比较方便于更改的平台基础。关键词:语音识别;预处理;特征提取;端点检测;H

2、MM算法。AbstractAimedattheprocessofpre-emphasis,windowframing,endpointdetection,featureextraction,aswellastrainingandrecognitioninspeechrecognition,thespecificprogrammingdesignbasedonMATLABisgiveninthepaper.andestablishingaMATLABsoftwareimplementationprocessina

3、ccordancewiththeprinciplesofspeechrecognition.Itprovidesabasicrealizationmodelforspeechrecognition,andamoreconvenientplatformtochangeforotherspeechrecognitionmethod.Keywords:speechrecognition;endpointdetection;MFCCparameter;HMMalgorithm一,引言所谓语音识别,就是计算机通过对人类语

4、音的识别和理解,将人类的语音信号转变成相应的文本或命令的技术,也就是让计算机听懂人说话。不同的语音识别系统的具体实现细节有所不同,但所采用的功能模块及识别原理基本是类似的,常见的语音识别系统的原理性方框图如图1所示。已知语音语音分段特征参数提取语音规整模式库取模式识别待检测语语音分段特征参数提取语音规整匹配结果音图1语音识别系统语音信号经过话筒变成电信号后加在识别系统的输入端,接着进行一系列的预处理工作然后进入到特征提取及语音规整阶段,其主要目的是获得能标识语音信号的特征向量。接下来就进入到模式训练及识别阶段,

5、即按照一定的准则,从大量已知的模式中获得能表征该模式本质特征的模型参数,通过一定的准则和模式匹配的算法来获得识别结果。1.语音识别的预处理无论是已知的或待检测的语音信号,都需要进行一系列的预处理工作。预处理部分主要包括预加重、加窗分帧、端点检测等。该阶段主要实现了高频部分信号的提升、加窗分帧、检测信号的起始和终止点等作用。语音信号的预处理是语音识别的前提与基础,在语音识别中具有举足轻重的地位。下面对部分过程的软件仿真实现进行简单介绍。1.1预加重预加重是对语音信号中的高频部分频谱进行提升,从而增加语音高频部分的

6、分辨率,便于语音参数的分析。一般做法是将语音信号通过一个一阶高通滤波器1-az-1,通常称之为预加重滤波器,其传递函数为:H(z)=1-az-1。若预加重前n时刻的语音信号为S(n),经过预加重滤波器后得到的信号为Y(n),则:Y(n)=S(n)-aS(n-1),a的取值一般在0.9到1.0之间,目前比较常见的取值是0.9375。1.2分帧加窗虽然语音信号具有时变特性,但在较短的时间(如:10~30ms)之内,其特性可以认为是基本不变的,这就是人们常说的“短时平稳特性”。我们利用这个特性,将语音信号进行分帧,即

7、将其截取成具有短时平稳的一段语音信号来进行分析,这也是语音处理的基础。分帧的具体过程是通过对语音信号加入窗函数来实现的,即sw(n)=s(n)*w(n),其中s(n)为加窗前的语音信号,sw(n)加窗后的信号,w(n)为窗函数。常见的窗函数有:矩形窗,汉明窗,汉宁窗,在语音信号的预处理中,一般选用汉明窗来进行语音的分帧。1.3端点检测端点检测是从包含语音的一段信号中确定出有效语音信号的起始和终止点。通常的端点检测的方法有短时能量、短时平均过零率和短时平均幅度。其中比较常见的短时能量是基于在信噪比较高的情况下,一

8、般无语音信号的噪声能量很小,而有语音信号的能量则显著增大,因此,定义为一帧样点的加权平方和。短时平均过零率则以一帧语音信号波形穿过横轴(零电平)的次数来作为检测的基础。实际中,常常同时使用以上两种方法(双门限端点检测法)的端点检测方法。1.3.1短时能量由于语音信号的能量随时间而变化,清音和浊音之间的嫩俩差别相当显著。因此用能量来进行分析。定义如下:N12Enxn(m)m0(1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。