基于近似熵的VDR人声识别技术研究.pdf

基于近似熵的VDR人声识别技术研究.pdf

ID:52212738

大小:346.21 KB

页数:5页

时间:2020-03-25

基于近似熵的VDR人声识别技术研究.pdf_第1页
基于近似熵的VDR人声识别技术研究.pdf_第2页
基于近似熵的VDR人声识别技术研究.pdf_第3页
基于近似熵的VDR人声识别技术研究.pdf_第4页
基于近似熵的VDR人声识别技术研究.pdf_第5页
资源描述:

《基于近似熵的VDR人声识别技术研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2011年第30卷第6期传感器与微系统(TransducerandMicrosystemTechnologies)61基于近似熵的VDR人声识别技术研究李满,李春华(黑龙江科技学院电气与信息工程学院,黑龙江哈尔滨150027)摘要:利用话者识别原理和语音数字信号处理技术对人声建模方法进行研究,建立了基于GMM模型的VDR环境下的人声识别基准系统;从分析影响人声识别率因素的角度出发,指出传统算法的不足,并提出一种基于近似熵的语音端点检测算法。理论分析和实验结果证明:新算法能有效屏蔽大动态冲击性噪声,解决了语音的虚检现象,并且在低信噪比0dB情况下的识别率提升66%。关键

2、词:人声识别;话者识别;航行数据记录仪;近似熵;端点检测中图分类号:TN912.34文献标识码:A文章编号:1000-9787(2011)06-0061--04Research0nvoicerecognitionbased0nGMMimnVVDURKLIMan,LIChun—hua(SchoolofElectricandInformationEngineering,HeilongjiangInstituteofScienceandTechnology,Harbin150027,China)Abstract:Humanvoicemodelingmethodisresea

3、rched,usingspeakerrecognitionprinciplesanddigitalsignalprocessingtechnology,basicsystemofvoicerecognitionbasedonGMMmodelinVDRisestablished.Fromtheperspectiveanalysisofaffectingonvoicerecognitionratio,thelackoftraditionalalgorithmsispointedoutandanendpointdetectionalgorithmofspeechbasedo

4、napproximateentropyismade.Theoreticalanalysisandexperimentalresultsconfirmedthatthenewalgorithmcaneffectivelyshieldlargedynamicimpactnoise,problemofvoicevirtualcheckissolved.andincreasedvoicerecognitionrateof66%inlowSNR0dB.Keywords:voicerecognition;speakerrecognition;voyagedatarecorder;

5、approximateentropy;endpointdetection0引言系统识别率各个环节因素的分析,提出了一种基于近似熵航行数据记录仪(voyagedatarecorder,VDR)可实时监的语音端点检测方法对基准系统进行优化,同时给出动态控并记录从船舶操纵方式到机器运转状况等各种重要信阈值的解决方法,理论分析和实验结果证明:在低信噪比和息,由于其容量有限,只能循环存储,因此,准确判断舰大动态冲击噪声干扰情况下仍可大幅提高系统识别率。船内是否有人声是判定舰船发生故障与否的重要标志,是1VDR人声识别方法决定VDR主机是否关机的先决条件之一,因此,开展舰船1.1

6、人声识别方法VDR环境下的人声识别研究意义重大。人声识别同语音识别既有区别又有联系,对其自身特目前,国内外最成功的语音识别系统主要分为说话人点的研究有助于提高系统识别率。识别、关键词检出、连续语音识别和语言辨识等,识别效果从表1可以看出:人声识别的参照对象是环境噪声;可达90%以上,而人声识别却少有研究。哈尔滨工程大研究方法与语音激活检测相似,检测目标是多帧信号内有学的周祖洋完成了实验室环境的人声识别,张逊螟对识别无人声,但不涉及语义识别。。。由此可知:VDR人声识别算法加以改进,增加了Ⅳ文本判决策略,初步实现了特点:1)人作为VAD主体,可以主动配合或重发再次获得V

7、DR人声识别。然而,以上工作都是以音阶为基元对人声信息的完整性,而人声识别属被动检测,VDR信息一旦丢进行建模,未能反映人声共性,系统开销巨大且可推广性失不可挽回,因此,它对准确率要求更高,检测难度更大;差。2)不必提取语音信号中的语义成分;3)宁可拒识(FR),也本文对人声建模和识别方法进行研究,以说话人为基不能误受(FA),因为误受带来的后果将是灾难性的;4)人元训练人声模型,并建立了人声识别基准系统,通过对影响声识别可能是某一时刻Ⅳ个说话人语音信号的叠加。收稿日期:2011_o4_28基金项目:黑龙江省教育厅2009年度科学技术研究项目(115

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。