无监督语音模式发现与关键词检索算法研究

无监督语音模式发现与关键词检索算法研究

ID:37362158

大小:6.97 MB

页数:135页

时间:2019-05-22

无监督语音模式发现与关键词检索算法研究_第1页
无监督语音模式发现与关键词检索算法研究_第2页
无监督语音模式发现与关键词检索算法研究_第3页
无监督语音模式发现与关键词检索算法研究_第4页
无监督语音模式发现与关键词检索算法研究_第5页
资源描述:

《无监督语音模式发现与关键词检索算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级:中国科学院大学Universi略ofChineseAcademyofSciences博士学位论文作者姓名:韭基指导教师:遂丞红研究虽赵迭卫班究虽生国整堂院岜堂巫究匮学位类别:工堂簋±学科专业:值曼皇筐息处翌研究所:生国科堂瞳岂当篁匠究压2013年5月12罂璺翌巳宝趔璺宝垒△翌亟i垒里垒丝金!里垡墨£Q!壁!!曼坠亟ZhenZhangADissertationSubmittedtoTheUniVersityofChineseAcadelnyofSciencesInpanialful衄Ⅱ心ntof也erequi聆mentForthedegreeofDoctorofS远nal

2、andInf.orma“onProcessingIns6tuteofAcous廿cs,ChineseAcadeⅡIyofSciencesMa只2013中国科学院声学研究所学位论文原创性声明和使用授权说明原创性声明本人郑重声明:本论文的所有工作,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。论文作者签名:彰男日期:弘凸年占月新日学位论文使用授权说明本人完全了解中国科学院研究生院关于收集、保存、使用

3、学位论文的规定,·按照中国科学院研究生院要求提交学位论文的印刷本和电子版本;·中国科学院研究生院与中国科学院声学研究所有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务;·中国科学院研究生院与中国科学院声学研究所可以采用影印、缩印、数字化或其它复制手段保存论文;(保密论文在解密后遵守此规定)论文作者签名:彩蛎导师签名:日期:弘f弓年J月’钿摘要随着通信技术与互联网技术的快速发展,多媒体数据呈现爆炸式增长,电话数据与来自网络的语音数据的积累越来越丰富,如何快速有效地从这些数据中获取到信息,成为当前研究者的主要研究热点。本文针对于语音数据的快速信息检索.提出了无监督进行语

4、音搜索获取语音流中语音模型的算法,针对关键词长词检索困难的情况,提出了基于两阶段检索的搜索算法提升中文关键词长词检索性能。提出了动态扩展位置特定后验词图的索引形式,提升了系统的召回率以及关键词检索性能。论文工作的主要内容和创新点如下:1.提出了两种语音流中模式发现的算法,分别为基于语音识别、基于音素后验概率的算法.在基于识别算法构建的系统上用分段的动态时阋弯曲算法,在识别结果上进行匹配,在识别结果上对比了识别首选与使用多候选结构作为搜索对象的性能。达到了92.21%的精度与80.71%的召回率;基于音素后验概率的算法,通过模型估计后验概率,得到每帧数据上的音素后验概率矢量,通

5、过计算相似度,获取到语音中相似的语音模式,可以达到65.44%的精度与48.73%的召回率。2。提出了针对中文关键词长词的两阶段搜索算法,通过对倒排序索引预筛选,选取可能包含有关键词长词的候选分段列表,通过对这些候选分段进行基于动态规划的线性扫描,在损失了少量搜索时问的代价下,获得了关键词长词召回率以及关键词性能的提升。在测试集上。针对关键词长词的EER下降了25%以上。3.提出了动态扩展位置特定后验词图的索引形式,针对传统的位置特定后验词图生成过程与音节识别器解码过程的词假设扩展的相似性,提出在解码过程中动态地生成位置特定后验词图网络,通过和传统的位置特定后验词图进行有效融

6、合,获得了召回率以及EER的性能提升,并且相对于非限定词图,保证了高精度区的表现。对比基线的关键词检索性能,在两个测试集上EER下降了4%以上,并且保持了高精度部分的性能表现。无监督语音模式发现与关键词检索算法研究4.提出了在线计算词假设置信度的算法,通过解码当前帧计算竞争路径间的后验概率,获得帧同步的置信度分数,作为动态扩展位置特定后验词图的词假设的置信度。5。提出了利用子词图进行在线词假设的置信度的算法,通过前后延展一定帧数的语音,获取到针对词假设的邻接词图,通过对邻接子词图使用近似的前后向算法估算出词假设的置信度,在动态扩展位置特定后验词图算法中,效果优于帧同步的置信度

7、算法。关键词:语音检索,语音识别,语音识别解码器,语音模式发现,关键词长词算法,动态位置特定后验词图扩展算法,在线置信度计算AbstractN0wday8,withtherapiddevel叩mentofco删呲lnicationa11dInternettech-noIo舀es,theexplosivegrow哳ofmultimediadatahasbecoInetrue.Thev0Iumeofaudiodatafromtelephoneandintemetbecomericher.Theresearc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。