汉语数字语音识别技术与实现方法研究

汉语数字语音识别技术与实现方法研究

ID:32471857

大小:428.13 KB

页数:62页

时间:2019-02-06

汉语数字语音识别技术与实现方法研究_第1页
汉语数字语音识别技术与实现方法研究_第2页
汉语数字语音识别技术与实现方法研究_第3页
汉语数字语音识别技术与实现方法研究_第4页
汉语数字语音识别技术与实现方法研究_第5页
资源描述:

《汉语数字语音识别技术与实现方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学硕士学位论文汉语数字语音识别技术与实现方法研究姓名:孙玲申请学位级别:硕士专业:控制理论与控制工程指导教师:汪秉文20041113摘要本文研究了汉语数字语音识别技术及其实现的方法本文基于语音信号产生的数学模型从时域频域倒谱域出发对语音信号进行分析论述了语音识别的基本理论在此基础上讨论了语音识别系统的主要技术及其在本课题中的应用并重点讨论了本课题中语音信号特征参数的提取并在其中加入RASTA滤波抗噪在比较三种模式匹配方法的基础上本文选择隐马尔可夫HMM模型作为本课题中模式匹配的方法并讨论了经典齐次隐马尔可夫HMM模型的基本原理及其用于语音识别的训练和识别算法针对经典

2、HMM的齐次性缺陷讨论了考虑状态持续时间分布的HMM模型即基于段长分布的隐马尔可夫模型DDBHMM的基本原理改进viterbi算法使之适合于DDBHMM模型研究了基于DDBHMM的训练和识别算法接着用Matlab6.5对模型训练和识别算法进行了仿真并分别给出了主要仿真结果然后讨论了基于C的数字语音识别系统的程序设计给出了系统的软件结构图设计了其类库规划并实现了人机交互界面本文还介绍了本课题组自己设计的录音软件建立了用于训练和测试模型的数字语音数据库并对系统算法的实时性和准确性进行了测试结果表明采用改进算法的DDBHMM模型准确性高于经典的HMM模型但实时性低于经典的HMM模型

3、最后指出了本课题研究未来的改进方向关键词汉语数字语音识别隐马尔柯夫HMM模型特征提取考虑段长分布的隐马尔可夫DDBHMM模型viterbi算法IIAbstractMandarindigitalspeechrecognitiontechnologyandimplementapproachisstudiedinthisthesis.Onthebasisofthedigitalmodelofspeechgeneration,thespeechsignalisanalyzedinthetimedomain,frequencydomainandthecepstrumdomain.The

4、nthefundamentaltheoryandthemaintechnologyofspeechrecognitionisexpoundedinthethesis.Acomputationallyefficientalgorithmonsuppressinofacousticnoiseinspeechisadopted,whichisRASTA-MFCCs.AftercomparingthetheoryofpatternrecognitionasDTWHMMandANNHiddenMarkovModel(HMM)ischosedinthethesis.WestudyHMMm

5、odelappliedindigitalspeechrecognitionandspeechdigitalsignalprocessingaboutspeechrecognition,anddiscussitstrainingandrecognizingalgorithm.AstothelimitationoftheclassicalHMM,thenwediscusstheDurationDistributionBasedHiddenMarkovModel(DDBHMM)whichhastakendurationdistributionintoaccount.Themodif

6、iedViterbialgorithmisdiscussed,whichisfitDDBHMM.AndwealsodiscussedthetrainingandrecognizingalgorithmundertheDDBHMM.Then,wesimulattrainingandrecognizingalgorithmbasedonmatlab6.5,andgetthesimulationmainresults.Wealsodiscussprogrammedesignofdigitalspeechrecognitionsystem,whichisbasedonC++.Wedr

7、awthesystemstructurecharm.designtheclasslibraryprogrammingandrealizetheinterfacebetweenpeopleandcomputerisdiscussedWedisscusshowtobuildadigitalspeechdatabasefortrainingandtestingdigitmodelwiththespecialrecordingtoolmadebyourresearchgroup.Wepresenttheoutc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。