欢迎来到天天文库
浏览记录
ID:54016654
大小:606.52 KB
页数:7页
时间:2020-04-28
《语音文摘研究综述.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、东莞理工学院学报第20卷第3期Vol.20No.32013年6月JOURNALOFDONGGUANUNIVERSITYOFTECHNOLOGYJun.2013语音文摘研究综述111,2张剑潘晓衡邓见光(1畅东莞理工学院工程技术研究院,广东东莞523808;2畅华南理工大学计算机科学与工程学院,广州510006)摘要:近年来发展的语音理解是建立在语音识别和自然语言理解之上的热门研究领域。语音文摘是语音理解中一个重要研究应用,主要研究方向有:1)书面文档文摘技术在语音文档文摘提取的应用研究;2)新兴的基于结构
2、建模的语音理解与文摘的研究。近年来,该领域已经有许多重要的研究成果。本文对近年语音理解领域中的语音文摘研究成果进行综述,最后展望未来语音文摘技术可能的研究热点。关键词:语音理解;语音文摘;结构建模;模式识别中图分类号:TP912文献标识码:A文章编号:1009-0312(2013)03-0053-05语音交流是人们日常生活中最主要和最便利的信息沟通媒介。每天人们通过互联网和手持设备,接触到大量的多媒体信息,比如:电话语音信息、广播和电视节目、视频课程、各类电话视频会议等。通过直接收听语音或收看视频来获取自
3、己所需信息,是非常费时和低效的。为了帮助人们能快捷地从这些[1]信息当中抽取感兴趣的部分,越来越多的研究者将研究兴趣放在自动语音理解与组织的任务上面:[2][3][4][5][6]比如:语音识别、语音文档检索、语音文摘、语音文档信息抽取、主题分析与组织等。自动语音理解与摘要技术作为语音文档理解与管理系统的核心技术之一,主要完成从大量的原始语音中抽取出含有最有信息量或者与用户最“感兴趣”的语音部分的任务。语音文摘抽取与书面文档文摘抽取相比,是一个新兴和待发展研究领域。早在20世纪50年代,书面文档文摘抽取技
4、术的研究就已[7]经开始发展,现已拓展出更多新的方向,如:多文档、多语言、和多媒体文摘抽取。文摘抽取大体上可以分为摘取式文摘抽取(ExtractiveSummarization)和概括式文摘抽取(AbstractiveSummarization)两类。摘取式文摘抽取是按照目标压缩率从原始文档中选取最重要的或最有指示性的部分来构成简略版本的过程;而概括式摘要的提取,是根据原始语音文档的主要意思,重新组织语句,生成一个概括性的[8]简略版本。概括式文摘因其没有包含足够的信息量,无法满足人们的需求。相比之下,抽
5、取式摘要能帮助人们更准确地理解整个文档,并且更快地定位到感兴趣的信息。现今文档理解与摘要的研究主要集中在抽取式摘要上。论文将从两个方面即:1)书面文档文摘技术在语音文档文摘提取的应用研究;2)新兴的基于结构建模的语音理解与文摘的研究,对自动语音摘要领域现有的研究成果进行综述。1从书面文档文摘到语音文摘1畅1书面文档摘要提取方法的应用[9-13]对于目前有一些研究者把用于书面文档摘要提取的方法应用到语音文档理解与摘要任务中。[9]Christensen等提出了如何将报刊新闻摘要提取技术应用于新闻广播语音摘要
6、的提取。首先,他们同样把语音文摘的提取问题看作是一个二元分类问题,即:先用特征向量来表示每一段语音,再通过二元分类器对每一语音段进行判断,认定该语音段是或者不是文摘中的语句。他们发现与在报刊新闻摘要任务中的作用相比,语音段在文档中的位置特征对于新闻广播语音摘要提取的作用不是那么大。同时发现,没有任何一组特征的作用特别突出,而包括结构特征如:句子位置、长度等和词汇特征如:词条权收稿日期:2012-11-13基金项目:2012年广东省自然科学基金博士启动基金(S2012040007560);2012年东莞理工
7、学院校博士启动基金(ZJ120408)。作者简介:张剑(1982—),男,江西南昌人,助理研究员,博士,主要从事语音理解、语音文摘、自然语言理解、人工智能研究。54东莞理工学院学报2013年重、专有名词等在内的特征组合的作用最大。另外,他们还发现语音识别的错误给人们阅读所生成摘取式文摘造成了相当大的困难,尤其是抽取出的摘要没有段落和标准语句的停顿,给人们理解文摘带来了很大的挑战。[10][14]Zhu&Penn提出使用最大边界相关(MaximalMarginalRelevance,MMR)权重作为单一的特
8、征来表示每一语音段,然后再训练摘要提取模型,以提高摘要提取性能。他们首先计算候选语音段与待生成文摘的语音文档核心主题的相关度,以及候选语音段与已选语音段间的相似度,进而计算出该候选语音段的MMR值,即:MMR(Si)=λ×Relevance(Si,D)-(1-λ)×Similarity(Si,Sum)[11]Hori&Furui提出了对每个语音段进行摘要权重计算的方法来抽取摘要,这种摘要权重包含了语音段中每个词的重要权重的累加
此文档下载收益归作者所有