基于最佳状态数的汉语数字语音识别系统的研究与实现

基于最佳状态数的汉语数字语音识别系统的研究与实现

ID:36782735

大小:7.66 MB

页数:60页

时间:2019-05-15

基于最佳状态数的汉语数字语音识别系统的研究与实现_第1页
基于最佳状态数的汉语数字语音识别系统的研究与实现_第2页
基于最佳状态数的汉语数字语音识别系统的研究与实现_第3页
基于最佳状态数的汉语数字语音识别系统的研究与实现_第4页
基于最佳状态数的汉语数字语音识别系统的研究与实现_第5页
资源描述:

《基于最佳状态数的汉语数字语音识别系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、北京邮电大学硕士学位论文基于最佳状态数的汉语数字语音识别系统的研究与实现摘要近年来汉语数字语音识别系统越来越广泛的应用于各个领域。在实际生活中,由于噪声等因素的影响,常常造成汉语数字较低的识别率。本文对汉语数字语音识别系统的训练数据、评测数据及声学模型进行了研究。完成了对两个新语音库中评测讲话者的选择。并对系统识别精确度进行分析,通过对单音子模型及双音子模型的状态数的调整,提高了语音识别系统的识别精确度。本文主要研究了以下三方面的内容:1.研究了汉语语音识别系统中声学模型的构造。并了解语音识别系统中相关声学模型参数估计、识别过程的算法及步骤。这个过程有利于对语音库中训练数据和

2、评测数据的区分,并为提高系统识别精确度提供了依据。2.提出了一种为语音库选择评测讲话者的方法。对于目前已拥有的几组不同的评测讲话者,通过分别比较各组评测讲话者识别精确度曲线与语音库所有讲话者识别精确度曲线之间的最小均方差值,选择出该值最小的一组评测讲话者,作为此语音库的评测讲话者,用于客观衡量语音识别系统中模型的训练好坏。3.在提高识别系统精确度的研究中,对数字l和数字5的识别错误率进行了分析并找出相应的问题,通过逐步调整单音子模型及双音子模型的状态数,进而对模型进行改进。最后,在实验中逐步修改数字1、数字5的单音子模型及双音子模型的状态数,对修改后的模型进行训练、参数重估,

3、并对系统进行评测,得到新的识别精确度。结果表明,通过对模型状态数的修改,系统的识别精确度得到提高。关键词:隐马尔可夫模型单音子模型双音子模型评测讲话者评测数据北京邮电大学硕士学位论文THEI之ESEARCHANDI也ALIZATION0FMAN门DARINDIGITSPEECHRECOGNlTlolNSYSTEMBASEDONOPTI蚤小MS丑虹ENUN住;ERABSTRACTMandarindigitspeechrecognitionsystemhasbeenwidelyusedindifferentregionsinthepastdecades.However,inrea

4、lcondition,mandarindigitspeechrecognitionsystemalwayshasquitelowaccuracyforsomedigitsduetotheenvironmentfactorssuchasnose.Thethesishasmadeaseriesofresearchontrainingdata,evaluationdataandacousticmodels.Newevaluationspeakersareselectedfortwonewcategories.Also,throughtheanalysisofthesystemrec

5、ognitionaccuracy,weadjustthestatenumberofthemonophoneandbiphonemodelsofspecificdigits.Recognitionaccuracyhasbeenimprovedtosomeextent.Themainresearchincludesthefollowing:I.Westudythestructureofmandarindigitspeechrecognitionandlearnthealgorithmfortrainingandevaluatingtheparameters,alsothereco

6、gnitionprocess.ThesehelpUStoknowmoreabouttherelationbetweentrainingdataandevaluationdatainacategory,andenlightenUSthewaytoimprovethemodels.2.Thethesisfindsanewmethodtoselectabestgroupofevaluationspeakersforaspecificcategory.Foreachsetsofevaluationspeakers,fitsacurvetothem.Wealsofitacurvetoa

7、llthespeakersinacategory.BymeasuringtheRootMeanSquareError(RMSE)thattheevaluationspeakers’curvecomparedtotheallspeakercurve,weCallfindagroupofevaluationspeakersthatbestrepresentthiscategory.Usingtheseevaluationspeakers,wecanevaluationhowwellwe’vetrainour

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。