《同义词词林》在中文实体关系抽取中的作用-论文.pdf

《同义词词林》在中文实体关系抽取中的作用-论文.pdf

ID:53738848

大小:562.14 KB

页数:9页

时间:2020-04-21

《同义词词林》在中文实体关系抽取中的作用-论文.pdf_第1页
《同义词词林》在中文实体关系抽取中的作用-论文.pdf_第2页
《同义词词林》在中文实体关系抽取中的作用-论文.pdf_第3页
《同义词词林》在中文实体关系抽取中的作用-论文.pdf_第4页
《同义词词林》在中文实体关系抽取中的作用-论文.pdf_第5页
资源描述:

《《同义词词林》在中文实体关系抽取中的作用-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第28卷第2期中文信息学报V01.28。NO.22014年3月JOURNALOFCHINESEINF0RMATIONPROCESSINGMar.,2O14文章编号:1003-0077(2014)02—0091—09《同义词词林》在中文实体关系抽取中的作用刘丹丹,彭成,钱龙华,周国栋(苏州大学自然语言处理实验室,江苏苏州215006;·苏州大学计算机科学与技术学院,江苏苏州215006)摘要:语义信息在命名实体间语义关系抽取中具有重要的作用。该文以《同义词词林》为例,系统全面地研究了词汇语义信息对基于树核函数的中文语义关系抽取的有效性,

2、深入探讨了不同级别的语义信息和一词多义等现象对关系抽取的影响,详细分析了词;12语义信息和实体类型信息之间的冗余性。在ACE2005中文语料库上的关系抽取实验表明,在未知实体类型的前提下,语义信息能显著提高抽取性能;而在已知实体类型的情况下,语义信息也能明显提高某些关系类型的抽取性能,这说明《词林》语义信息和实体类型信息在中文语义关系抽取中具有一定的互补性。关键词:中文实体关系抽取;树核函数;同义词词林;语义信息中圈分类号:TP391文献标识码:ATheEffectofTongYiCiCiLininChineseEntityRelat

3、ionExtractionLIUDandan,PENGCheng,QIANLonghua,ZH0UGuodong(NaturalLanguageProcessingLab,SoochowUniversity,Suzhou,Jiangsu215006,China;SchoolofComputerScience&Technology,SoochowUniversity,Suzhou,Jiangsu215006,China)Abstract:Semanticinformationplaysanimportantroleinthesemant

4、icrelationextractionbetweennamedentities.Taking“TongYiCiCiLin”asanexample,thispapersystematicallyinvestigatestheeffectivenessoflexicalsemanticinformationontreekernel—basedChinesesemanticrelationextraction.particularlytheinfluenceofdifferent1evelsofsemanticinformationand

5、polysemyphenomenon,aswel1asdetailsabouttheredundancybetweenlexicalsemanticinformationandentitytypeinformation.TheexperimentsofrelationextractionontheACE2005Chinesecorpusshowsthatsemanticinformationcansignificantlyimprovetheextractionperformancewithoutentitytypes,whilein

6、thecaseofknownentitytypes,semanticinformationcanalsonoticeablyenhancetheextractionperformanceforsomerelationtypes.Thisimpliesacertaindegreeofcomplementaritybetween“CiLin”semanticinformationandan—titytypeinformationinChinesesemanticrelationextraction.Keywords:Chineseenti

7、tyrelationextraction;treekernel;TongYiCiCiLin;semanticinformationted)。作为一项应用基础性研究,实体关系抽取对1引言自然语言处理的许多应用如内容理解、问题回答、自动文摘、机器翻译、文本分类以及信息过滤等都具有命名实体间语义关系抽取(简称实体关系抽取,重要的意义。或关系抽取)是信息抽取中的一个重要研究内容,其无论是采用指导性的机器学习方法,还是采用任务是从自然语言文本中提取出两个命名实体之间无指导的聚类方法,关系抽取研究的关键问题都是所存在的语义关系,例如,短语“美国总

8、统克额的如何有效的表达关系实例并计算关系实例之间的相乎壤之行”中的两个实体“克林顿”(PER)和“平壤”似度。基于特征向量的方法[I将关系实例表示成(GPE)之间存在的物理位置关系(PHYS.Loca—高维特征空间中的一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。