句法与词义相结合的中文代词消解

句法与词义相结合的中文代词消解

ID:5267422

大小:209.58 KB

页数:7页

时间:2017-12-07

句法与词义相结合的中文代词消解_第1页
句法与词义相结合的中文代词消解_第2页
句法与词义相结合的中文代词消解_第3页
句法与词义相结合的中文代词消解_第4页
句法与词义相结合的中文代词消解_第5页
资源描述:

《句法与词义相结合的中文代词消解》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1句法与词义相结合的中文代词消解宋巍秦兵郎君刘挺(哈尔滨工业大学信息检索研究室,哈尔滨150001)E-mail:{wsong,bqin,bill_lang,tliu}@ir.hit.edu.cn摘要:句法知识对代词消解有着很大的支持。近年来依存句法由于其利于描述语言中词与词之间的关系、突出核心词的特点日益得到重视。本文提出了一种中文第三人称代词消解方法,直接利用依存句法分析器的结果,构建有效的句法角色特征和名词短语的支配词之间的词义相似相关性特征,采用支持向量机作为分类器,在ACE2005语料上的取得了满意的效果。关键词:代词消解;依存句法

2、;句法角色;词义相似;支持向量机CombiningSyntaxandWordSenseforChinesePronounResolutionWeiSongBingQinJunLangTingLiu(InformationRetrievalLaboratory,HarbinInstituteofTechnology,Harbin150001)E-mail:{wsong,bqin,bill_lang,tliu}@ir.hit.edu.cnAbstract:Syntacticknowledgeisimportantforpronounresolut

3、ion.Inrecentyears,researchondependencyparsingbecomesactive,becausedependencygrammarbenefitstorepresenttherelationbetweenterms.WeproposeadependencyparsingbasedmethodforChinesepronounresolution,designeffectivesyntacticrolefeaturesandwordsensesimilarityandwordrelevancefeatures

4、inrelatedtothedependentwords.SupportVectorMachineisusedastheclassifier.TheexperimentalresultontheACE2005trainingdatashowsthatourapproachgivesagoodperformanceandiseffectiveforChinesepronounresolution.Keywords:pronounresolution;dependencyparsing;syntacticrole;wordsensesimilar

5、ity;SupportVectorMachine1引言指代是指当前的指示语与上文出现的短语(先行语)存在语义关联,指代消解的过程即是对当前指示语确定先行语的过程。指代消解是自然语言理解与处理领域的核心问题之一,在信息[1]抽取、机器翻译等应用中,都发挥重要作用。[2][3]早期的指代消解算法基于语言学知识,以Hobbs算法和中心理论为代表。近年来,研究者们尝试使用机器学习方法来解决。基于机器学习的指代消解方法一般可以分为两类:有指导方法和无指导方法。前者的主要思想是将指代消解问题视为二元分类问题,首先利用标注有指代关1本文受到国家自然科学基金

6、(60675034)、863项目(2008AA01Z144)和微软基金(共指消解技术研究)资助系的训练数据训练一个分类器,而后利用这个分类器判断两个名词短语是否具有指代关系。应用[4][5][6]于指代消解的有指导的机器学习方法有贝叶斯、决策树、最大熵等。基于无指导方法的指[7]代消解算法研究相对较少。Cardie等提出一种基于聚类的名词短语共指消解方法,采用特征向量来表示各个名词短语,然后用聚类算法来实现名词短语的共指消解。[8,9]在中文上指代消解的研究相对较少。与英文相比,中文浅层词汇处理难度更大,体现在句子需要分词,名词短语没有明确的

7、性别、单复数特征,代词没有明确的主、宾格特征等。这些难点都给指代消解的特征提取带来了很大困难。2相关工作句法分析一直是研究者依靠的“武器”之一。Hobbs提出了两种指代消解的算法:一种是简单Hobbs算法,通过自左向右先广搜索,层次遍历句法树来消解代词,另外一种在句法知识基[10]础上加入了语义约束。1994年,Lappin和Leass提出了句法与约束规则相结合的方法,首先使用槽文法分析器分析句子结构,继而通过约束规则过滤掉不满足条件的候选先行语,最后计算[11]候选先行语权值来评判其作为先行语的可能程度。XiaofengYang提出基于Tr

8、ee-Kernel的方法,[12]将句法分析树结构作为特征,利用ConvolutionTreeKernel计算两棵句法树之间的相似程度,取得了很好的效果。[13]近

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。