欢迎来到天天文库
浏览记录
ID:36794567
大小:2.76 MB
页数:77页
时间:2019-05-15
《语音识别置信度特征提取算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、密级:保密期限:踌章却硕士研究生学位论文学姓专导学号:Q2重量墨量名:垦垂晶业:槿式迟别皇蟹能丕缠.师:割剧院:值皇皇通信王程堂暄2010年1月27日)北京邮电人学硕上学位论文语音识另0置信度特征提取算法研究独创性c或创新性)声明IYLILll111IIIIIt7LIlll51111181111151113IIill掣本人声明所呈交的论文是本人在导师指导下进行的研究工作及耿借酮针艽成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而
2、使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。本人签名:国玉昌l=蔓\瓢伊日期:2Q!Q:!:2昼关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。(保密的学位论文在解
3、密后遵守此规定)保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论文注释:本学位本人签名:导师签名:适用本授权书。同期:日期:2010.1.282殳f!:≥!堕一一一,北京邮电大学硕二t学位论文语音识别置信度特征语音识别置信度特征提取算法研究摘要大规模连续语音识别的研究已经进行了二十多年,虽已取得了显著进展,但距离广泛应用还有相当的距离。在克服识别算法本身缺陷、追求识别性能提升的过程中,研究者们逐渐引入了置信度的概念,用它来衡量语音识别系统所作决策的可信程度。近年来,语音识别置信度在语音错误检测与错误纠正,无监督和半监督训练
4、、多遍搜索技术和语料库中错误语料甄选等应用中都发挥了非常重要的作用。传统的语音识别置信度标注基于不同置信特征或者特征组合进行分类判决,目前常使用的置信特征主要来源于解码信息。但是,一方面现有置信度特征对解码信息的挖掘仍局限于孤立和静态,而忽略了词与周围环境之间的关系;另一方面,目前声学特征仍占主要地位,而人类听觉实验表明,人在进行语音理解时,大约有30%的信息来自于语法、语义等知识的指导。因此,在置信度特征提取中,如何挖掘出词与环境之间的关系,同时提炼出词的语法和语义特征,从而提高识别后处理性能,是一个非常值得研究的问题。基于上述目的,本文
5、在搭建传统语音识别置信度标记系统的基础上,提出了两种新的置信度特征,一是环境特征,分为上下文环境、动态环境、句全局环境三类,通过对解码信息的再加工,从空间与时间角度较全面地描述了词与环境之间的关系;二是基于主题相似性的语义层置信特征提取算法TSS(TopicSimilaritybasedSemanticconfidencefeatureextractionalgorithm),通过主题模型LDA(LatentDirichletAllocation)计算得到识别结果中词的主题分布及其上下文的主题分布,并将二者之间的主题相似性作为词的语义置信特
6、征。实验表明,本文提出的两种特征深入挖掘了解码层的有效信息,又增加了置信特征的信息来源,与解码层置信特征进行组合后能有效地提高置信度标注的精度。关键词:置信度环境特征潜狄利克雷分配主题模型语义,beenmade,butthereiSstillaconsiderabledistancefromthewiderangeofapplications.Inthepursuitofovercomingthedeficienciesinsiderecognitionalgorithmitself,andimprovingrecognitionperfo
7、rmance,researchershavegraduallyintroducedtheconceptofconfidencemeasure,tomeasureinwhichdegreewecouldtrusttheresultofspeechrecognitionsystem.Inrecentyears,speechrecognitionconfidencemeasurehasplayedaveryimportantroleinmanyapplications,includingspeecherrordetectionandcorrect
8、ion,nosupervisionandsemi-supervisedtraining,multi-searchtechnologyandcorpusselectionandve
此文档下载收益归作者所有