基于语音识别与特征的无监督语音模式提取.pdf

基于语音识别与特征的无监督语音模式提取.pdf

ID:53575824

大小:318.13 KB

页数:4页

时间:2020-04-19

基于语音识别与特征的无监督语音模式提取.pdf_第1页
基于语音识别与特征的无监督语音模式提取.pdf_第2页
基于语音识别与特征的无监督语音模式提取.pdf_第3页
基于语音识别与特征的无监督语音模式提取.pdf_第4页
资源描述:

《基于语音识别与特征的无监督语音模式提取.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第40卷第5期计算机工程2014年5月、,o1.40NO.5ComputerEngineeringMav2014-多媒体技术及应用一文章编号:1000-3428(2014)05—0262—04文献标识码:A中图分类号:TN912.34基于语音识别与特征的无监督语音模式提取张震,赵庆卫,颜永红(中国科学院语言声学与内容理解重点实验室,北京100190)摘要:在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信

2、度估计算法,提高系统性能,同时建立仅基于特征匹配的相似音频片段检测系统,不使用任何知识源,仅从语音中获取重复的语音模式,在广播电视新闻与自然I:l语对话2个测试集上对比2个系统的性能。实验结果表明,基于识别的系统具有较好的检测效果,而基于特征的系统具备多语种的推广性。关健词:语音识别;语音模式发现;分段动态时间弯曲算法;图聚类算法;音素回环后验概率计算Unsu0laervisedI1SoeechIIPatternExtractionBased0nSpeechRecognitionandFeatureZHANGZhen,ZHA

3、OQing-wei,YANYong—hong(KeyLaboratoryofSpeechAcousticsandContentUnderstanding,ChineseAcademyofSciences,Beijing100190,China)[Abstract]Thispaperproposestheunsupervisedmethodbasedonbothspeechrecognitionsystemand~amre—basedsystemtosearchforthespeechpatterns.Inspeechreco

4、gnitionsystem,thealternativeresultsofthespeechrecognitionsystemdecoderareusedtosearchaudiopattemswithsegmentaldynamictimewarpingalgorithm.Thengraphclusteringalgorithmisused,aswellasconfidenceestimationalgorithm,toimprovetheperformanceofthesystem.Italsoproposesthesy

5、stembasedonfeatureonlywithoutanyknowledgeresource.Inthefinal,theperformancesofthetwosystemsonbothradioandtelevisionnewsandspokendialoguesetsarecompared.Thespeechrecognitionsystemachievesbetterperformance.andthefatllrebasedsystemcanbeusedonmanylanguages.[Keywords]sp

6、eechrecognition;speechpattemdiscovery;segmentaldynamictimewarpingalgorithm;graphclusteringalgorithm;phonemeloopcalculationofposteriorprobabilityDOI:10.3969/j.issn.1000-3428.2014.05.054索一样,有预先定义的关键词列表,在语音中搜索对应的1概速关键词结果。所以需要一些新的方式进行语音流中相似信随着多媒体互联网的发展,出现越来越多的多媒体数息的检出,

7、这种无监督的方法对于语音的利用提供了很多据。之前网络传输成本、存储成本都相对高昂,人们更喜方便pj,比如对海量数据进行无监督聚类,对于刑侦案件上,欢使用文本形式进行信息的存储,而随着信息科技的不断需要提取出发音相同或者相近的片段进行比对,以作为案发展,网络传输速度的飞速提高,存储的成本越来越低廉,件侦破的证据。可以大量存储多媒体信息,如语音、视频录像等。目前如本文工作的出发点是在未知信息的语音流中,用语音何有效地处理这些数据成为了一个研究热点,许多研究单流检索语音流的方式进行语音信息无监督的发掘,找到语位和机构致力于有效地进

8、行信息利用。因为多媒体数据的音流中重复的短语语义实体。文中构建了2套系统,分信息存储于图像、声音中,无法直接利用这些信息,需要别为基于语音识别的相似音频片段检测系统与基于特征匹一些技术对信息进行相关处理,在图像上有图像识别等关配的相似音频片段检测系统。基于识别的系统具有检出率键技术,而语音

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。