基于hmm的汉语数字语音识别系统研究

基于hmm的汉语数字语音识别系统研究

ID:32511141

大小:2.57 MB

页数:72页

时间:2019-02-10

基于hmm的汉语数字语音识别系统研究_第1页
基于hmm的汉语数字语音识别系统研究_第2页
基于hmm的汉语数字语音识别系统研究_第3页
基于hmm的汉语数字语音识别系统研究_第4页
基于hmm的汉语数字语音识别系统研究_第5页
资源描述:

《基于hmm的汉语数字语音识别系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、l1、~,’哆^中文摘要语音是人与机器之间进行交流的重要工具,语音识别技术就是让机器听懂人类的语音并执行相关动作,具有广泛的应用背景。虽然在这方面的研究有很多,但目前仍有许多问题有待进一步探索。语音的声学模型和识别理论是构建语音识别系统的基础。本文首先介绍了语音的声学模型结构,然后按照语音识别系统的处理步骤详细地分析了各个过程。在语音信号的端点检测方面提出了改进的谱熵算法,实验表明用该方法进行端点检测后提取特征参数可提高语音识别系统的鲁棒性。特征参数的选取对整个语音识别系统的实时性、鲁棒性有很大的

2、影响。文中对语音信号的短时时域特征和语谱图进行分析后,详细阐述了线性预测分析系数(LPC)、线性预测倒谱系数(LPCC)及Mel频率倒谱系数(MFCC)等特征参数的提取方法,并对其失真测度进行了讨论。文中论述了动态时间归整理论和隐马尔可夫模型原理,用MATLAB语言编程研究了它们在语音识别系统中的应用。用DTW理论进行孤立词语音识别时比较了特定人和非特定人识别及特征参数的选择对识别率的影响。此外,实际构建了基于HMM模型的非特定人小型孤立词语音识别的整个系统,该系统可选用不同的特征参数,具有较好的

3、鲁棒性。用该系统对“0~9"十个数字进行了识别实验,实验发现用LPCC参数时,选取12维的识别效果最好;26维的MFCC参数的识别率比12维的LPCC参数的识别率高10%左右。关键词:语音识别,线性预测倒谱系数,Mel频率倒谱系数,动态时间规整,隐马尔可夫模型0p■J.1^,ABSTRACTSpeechisanimportanttoolforpeoplecommunicatingwithmachines.ThetechnologyofAutomaticSpeechRecognition(ASR)c

4、anletmachinesunderstandhumanity’Slanguageandcarryoutcorrespondingoperationsanditcanbewidelyusedinmanyareas.Thoughithasbeenstudiedformanyyears,therearestimanyproblemsinASRworthytobestudied.TheAcousticmodelofthespeech——production/speech——perceptandthesp

5、eechrecognitiontheoryarethebasicsofASR,SOeachstepofASRprocessiSanalyzedindetaiIs.Theimprovedspectrumentropyalgorithmisbroughtforwardfortheendpointsdetection,andtheresultsofexperimentsshowthatrobustnessofthesystemhasbeenimprovedwhileusingthismethodfore

6、ndpointsdetection.Thechosenspeechfeatureparametershavegreateffectsonrobustnessandreal——timeofthespeechrecognitionsystem.Afterintroducingshort—timefeatureparametersandspectrograms,threeapproachestoextractingspeechfeatureparameterssuchasLinearPredictive

7、Coding(LPC),LinearPredictiveCepstrumCoefficients(LPCC)andMel—FrequencyCepstrumCoefficients(MFCC),arediscussedindetai1S,thentheirdistortionmeasureareintroduced.TheDTWtheoryandHMMtheoryarediscussed.TheirapplicationsinrecognitionareanalyzedthroughtheMATL

8、ABprograms.TheisolatedwordrecognitionsystemsbasedontheDTWtheoryforspeaker。—independentandspeakerdependentarediscussedwhileusingdifferentfeatureparameters.0ntheotherside,thesmall—vocabularyspeaker—independentspeechrecognitionsystembasedonHMMiSc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。