口语对话中的代词指代消解

口语对话中的代词指代消解

ID:6000948

大小:410.10 KB

页数:12页

时间:2017-12-30

口语对话中的代词指代消解_第1页
口语对话中的代词指代消解_第2页
口语对话中的代词指代消解_第3页
口语对话中的代词指代消解_第4页
口语对话中的代词指代消解_第5页
资源描述:

《口语对话中的代词指代消解》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、软件学报ISSN1000-9825,CODENRUXUEWE-mail:jos@iscas.ac.cnJournalofSoftware,2011,22(2):233−244[doi:10.3724/SP.J.1001.2011.03720]http://www.jos.org.cn©中国科学院软件研究所版权所有.Tel/Fax:+86-10-62562563∗口语对话中的代词指代消解1,2+111费仲超,周雅倩,黄萱菁,吴立德1(复旦大学计算机科学技术学院,上海200433)2(上海贝尔股份有限公司产品线战略及技术领先部,

2、上海201206)PronounResolutioninSpokenDialog1,2+111FEIZhong-Chao,ZHOUYa-Qian,HUANGXuan-Jing,WULi-De1(SchoolofComputerScience,FudanUniversity,Shanghai200433,China)2(PortfolioStrategyandTechnologyLeadershipCTOGroup,Alcatel-LucentShanghaiBell,Shanghai200433,China)+Corresp

3、ondingauthor:E-mail:zcfei@fudan.edu.cnFeiZC,ZhouYQ,HuangXJ,WuLD.Pronounresolutioninspokendialog.JournalofSoftware,2011,22(2):233−244.http://www.jos.org.cn/1000-9825/3720.htmAbstract:Thispaperpresentsatwo-stagepronounresolutionalgorithm.Itdoesnotneedtocleanthetestin

4、gcorpusandpredefinepatternsmanually.Inthefirststageofthealgorithm,somenewfeaturesandmachinelearningmethodsareusedtoclassifypronounsintoanaphoricandnon-anaphoricones.Inthesecondstage,thesetwokindsofpronounsareresolvedrespectively.Fortheanaphoricones,somemethodsarepr

5、esentedtoextractdistance,syntactic,andsemanticfeaturesetc.Forthenon-anaphoricones,theRightFrontierRuleisimprovedtodotheresolutionwork.WhiletestingthecorpuspublishedbyByronin2004,thisalgorithmachievesaprecisionof77.0%andarecallof66.0%.ComparedwiththeworkofByron,thea

6、lgorithmisfullyautomatic,andtheresultsaremuchbetter.Keywords:pronounresolution;spokendialogunderstanding;pronounclassification摘要:提出一套分为两步的代词指代消解算法,算法不需要人工清洗语料及预定义规则.算法第1步采用一些新特征和机器学习算法对名词性指代代词和非名词性指代(non-anaphoric)代词分类,第2步分别对两类代词进行消解.针对名词性代词指代消解,提出了适用于口语对话的特征抽取及表示方

7、法,如代词和候选先行词的距离、语法、语义等的抽取和表示方法,然后通过综合这些特征来选择先行词.针对非名词性指代,将右边界规则(rightfrontierrule)改进为可以在口语对话中自动抽取的形式,并根据该规则选择先行项.在Byron于2004年发布的语料上测试,消解正确率达到77.0%,召回率达到66.0%.与Byron的工作相比,该方法在保证系统能够自动完成的同时还提高了消解性能.关键词:代词指代消解;口语对话理解;代词分类中图法分类号:TP391文献标识码:A[1]口语对话(spokendialog)是指语音交互记录

8、.随着自动口语对话系统研究的发展,口语对话理解得到了比∗基金项目:国家自然科学基金(60503070,60673038);上海市科委科研计划(08511500302)收稿时间:2009-02-20;定稿时间:2009-08-12234JournalofSoftware软件学报Vol.22,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。