广播语音的自动标注系统

广播语音的自动标注系统

ID:36868365

大小:2.83 MB

页数:73页

时间:2019-05-17

广播语音的自动标注系统_第1页
广播语音的自动标注系统_第2页
广播语音的自动标注系统_第3页
广播语音的自动标注系统_第4页
广播语音的自动标注系统_第5页
资源描述:

《广播语音的自动标注系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、密级:保密期限:砖右却童犬警硕士研究生学位论文学号:Q2鱼兰Z窆姓名:值亘塞专业:撞式迟剔皇蟹筐丕统导师:鄞至学院:信皇皇逗筐王程堂瞳二零一零年一月二十七日创新性声明舢fI『J

2、J『『If『『III『

3、『fIf『I『I㈣JIJJJ川删Y1758549本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。申请学位论

4、文与资料若有不实之处,本人承担一切相关责任。量本人签名:么鸳:里釜日期:2垒&:主:!Z关于论文使用授权的说明学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文不属于保密范围,适用本授权书。本人签名:彳绷导师签名:≈莓日期:2。户。五,7日期:切⋯州7广播语音的自动标注系统摘要近年来,随着计算机技术、网络技术和通讯

5、技术的快速发展,人们可方便快捷地获得图像、视频、音频等多媒体文件,全球多媒体数据出现爆炸式的增长,其中音频信息占有十分重要的地位。如何对海量级的多媒体资源进行有效的索引和信息检索成为当前一个研究热点,一种基于内容的音频检索方法对当今的大词汇量语音识别系统提出了更高的要求。在众多多媒体数据中,广播新闻是被大多数的多媒体研究课题重视的代表性音频数据,因为广播语音包含静音,音乐,说话人语音和噪音背景等音频要素。要提高广播语音识别的性能以及鲁棒性,需要大规模精确标注的语料库。众所周知,为大规模语音语料库添加标注需要大量人力、物力,而由于广播语音识别的性能还不够高,现阶段的标注工作还

6、只能通过人工手动来完成。如何自动完成语音音频的文本标注是降低语音识别系统成本的重要方向。在这一背景下,本文研究搭建一个广播语音的自动标注系统。由于多数情况下,广播语音的音频文件和其相应的文本可在互联网找到,所以,本文的研究重点不再是单纯的识别问题,而是如果完成给定的已知文本与音频的对齐。本文提出了一种基于语音识别和动态规划找锚点(可信对齐区域)的递归对齐算法,这个算法可简单描述为:首先对连续音频进行语音识别得到识别文本,然后再对识别文本与已知文本进行文本内容的匹配对齐,通过文本匹配找到可信任的对齐区域(称作“锚点’’),利用锚点将音频和已知文本分成己对齐部分及未对齐部分,然

7、后对未对齐部分重复上述递归过程。本文中,根据标注语料的目的、已知文本可能含错、部分音频质量太差等现实因素提出三大改进:第一,以句子为单位完成音频与文本的对齐,为方便之后的人工修订;第二,采用DTW的动态规划算法找对齐锚点,利用DTW的容错性能降低错误文本对整个标注系统的影响;第三,对于音频质量特别差,以至于找不到对齐锚点的部分,本文采用声学模型自适应的算法来提高语音语音检测以系统的搭建内容层三层98.9%的句之后人工修文还研究了在广播新闻学模型自适ANAUTOⅣ讼TICLABELINGSYSTEMFORBROADCASTNEWSABSTRACTAsmedevelopment

8、ofthecomputertechnology,networktechnologyandcommunicationtechnology,largeamountsofaudioandvideocontenthavebecomeavailableovertheInternet.Miningthesedatasources,eithertofacilitatetheirsearchviaaudioindexingengineshasbecomeaninterestingareaofresearch,whichneedsalargevocabularyspeechrecogniti

9、onsystemwithimprovedperformance.Asatypicalmultimediadata.broadcastnewsismostlyresearchedbyspeechresearchers.Largeamountsspeechwithqualitylabelingtranscriptsareindispensablefortrainingacousticmodelinautomaticspeechrecognition(ASR),andtypicallythetranscriptsareg

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。