国外言语行为自动标注研究进展

国外言语行为自动标注研究进展

ID:9142817

大小:59.50 KB

页数:0页

时间:2018-04-19

国外言语行为自动标注研究进展_第页
预览图正在加载中,预计需要20秒,请耐心等待
资源描述:

《国外言语行为自动标注研究进展》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、国外言语行为自动标注研究进展孙亚刘思瑶陈帅对外经济贸易大学英语学院文章釆用统计方法考察了近十年在国外期刊上与言语行为自动标注相关的论文,进而呈现国外言语行为自动标注研宄的进展。近十年言语行为自动标注以言语行为理论为基础,对文本、音频等言语行为进行标注,热点话题主要为情感识别、文本挖掘、人机对话、机器翻译等,研宂体裁也多集中于医疗对话、商务会议、信函、网络语言等。文章对国内未来言语行为自动标注研宄有一定的启示意义。关键词:言语行为;B动标注;标注体系;基金:北京市社会科学基金重点项目“北京商务人才外语沟通能力的语言学理论基础研宄”(编号为14WYA006)TheRecen

2、tInternationalAdvancesinStudiesofSpeechActAutomaticAnnotationandTheirImplicationsSUNYaLIUSi-yaoCHENShuaiSchoolofInternationalStudies,IJniversityofInternationalBusinessandEconomics;Abstract:Thepaperreviewsthearticlespublishedininternationaljournalsinthepasttenyearsinordertopresenttherecen

3、tadvancesinspeechactautomaticannotationstudieswithstatisticalmethod.Theresultsshowthat,withspeechacttheoryastheprimarytheoreticalbasis,thehottopicsinthisareaaremainlyemotionrecognition,textmining,spokendialoguesystem,andmachinetranslation,andresearchgenresaremostlymedicaldialogue,busines

4、smeetings,letters,andnetworklanguage.Keyword:speechact;automaticannotation;annotationsystem;引言英国哲学家Austin任20世纪50年代提出的言语行为理论(speechacttheory)认为人们在以言行事,人们说话的同吋是在实施某种行为U1。Aiustin指出言语行为可以分为叙事行为、施事行为和取效行为三种。言语行为自动标注是指“使用计算机等技术使言语行为分类的工作自动化,有时也被称为言语行为自动识别或自动分类等”m。言语行为自动标注对于对话系统、机器翻译和自动问答系统中问题理

5、解和意图判断只有重要的意义,己成为信息检索和自然语言处理领域的一个研宄热点。言语行为标注体系及苏自动识别的应用主要集中在对话系统、机器翻译和自动问答系统等方面D1。虽然已有学者提及相关术语“言语行为自动标注”U1,或对言语行为自动标注进行综述研宂,但至今还未见考察国外言语行为自动标注研宄最新进展的相关文章。文章拟考察近十年(2007-2016)发表在国际期刊上的论文,以期呈现国外言语行为自动标注研究进展。一、研究问题与方法本研宄将回答以下问题:(1)近十年国外言语行为自动标注研宄的主要标注体系是什么?(2)近十年国外言语行为自动标注的热点研宄体裁、研究话题是什么?首先,

6、木研宄以“speechactautomaticannotation”为检索词,选取SSCI来源期刊中的语言学期刊和计算机科学期刊,时间设置为2007-2016年,共获得100篇相关英文文献。为保证结果的可靠性,筛选过程由两位研宂者分别进行并汇总核对。其次,对文献的关键词频数进行人工统计,并得出关键词统计表。最后,本研宄基于关键词词频统计数据,挖掘近十年W外言语行为自动标注的研究热点,包括标注体系、研究体裁和研究话题。二、言语行为标注体系在进行言语行为自动标注时,研宂者最常用到的标注体系是DAMSL标注体系,其他常见的有D1ME-DAMSL、1NTS1NT、VERBM0B

7、1L标注体系。(一)DAMSL标注体系计算机自动标注系统建立在Austin和Searle的言语行为理论之上,同时推动了言语行为理论的发展_[11。对话行为多层置标语言体系(DialogueActMarkupinSeveralLayers,简称DAMSL)。主要针对对话行为的信息标注,标注分为四个层次:(1)交流状况(CommunicativeStatus)记录对话是否可以理解并且完整,包括不可译(Uninterpretable)、中断(Abandoned)和自言自语(Self-talking);(2)信息层次(InformationLev

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。