中文篇章级句间语义关系体系及标注-论文.pdf

中文篇章级句间语义关系体系及标注-论文.pdf

ID:53908750

大小:859.71 KB

页数:9页

时间:2020-04-27

中文篇章级句间语义关系体系及标注-论文.pdf_第1页
中文篇章级句间语义关系体系及标注-论文.pdf_第2页
中文篇章级句间语义关系体系及标注-论文.pdf_第3页
中文篇章级句间语义关系体系及标注-论文.pdf_第4页
中文篇章级句间语义关系体系及标注-论文.pdf_第5页
资源描述:

《中文篇章级句间语义关系体系及标注-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第28卷第2期中文信息学报Vo1.28。No.22014年3月J0URNALOFCHINESEINFORMATIONPROCESSINGMar..2O14文章编号:1003-0077(2014)02—0028-09中文篇章级旬间语义关系体系及标注张牧宇,秦兵,刘挺(哈尔滨工业大学,黑龙江哈尔滨150001)摘要:篇章句间关系(DiscourseRelation)是篇章级语义分析的重要内容,该文在英文篇章句间关系研究的基础上分析了中英文问的差异,总结了中文篇章级语义分析的特点,并在此基础上提出面向中文篇章句间关系的层次化语义关系体系,

2、对句间关系类型进行详细描述。为了验证体系的合理性和完备性,我们在互联网新闻语料上进行了标注实践,分析了标注中遇到的难点并给出解决方案,为进一步的中文篇章级语义分析工作奠定基础。关键词:中文篇章级语义分析;句闯关系;语义体系;语料标注中图分类号:TP391文献标识码:AChineseDiscourseRelationSemanticTaxonomyandAnnotationZHANGMuyu,QINBing,LIUTing(HarbinInstituteofTechnology,Harbin,Heilongjiang150001,Ch

3、ina)Abstract:DiscourseRelationisanimportantpartofdiscoursesemanticanalysis.ThispaperanalysesthedifferencesbetweenChineseandEnglishdiscourses,thenpresentsthefirstChinesediscourserelationtaxonomybasedontheEnglishdiscourserelationresearchesindetails.Aimingattherationality

4、ofthehierarchy,weconductsannotationexperimentsonChineseinternetnewstextsandanalysesalldifficultieshappenedduringthedataannotationtogetherwiththeresolutiontolayafoundationDrthefuturediscoursesemanticanalysis.Keywords:Chinesediscoursesemanticanalysis;discourserelation;se

5、mantictaxonomy;dataannotation(1)以词汇语义为核心的分析理论。词汇链理1引言论(LexicalCohesion)通过分析词汇语义构建主题词汇链,利用主题词汇的分布和转移情况分析篇章随着词汇语义、句子语义研究的逐渐成熟,篇章语义[7]。该理论的操作性较强,但以词汇为主要分级语义分析逐渐成为研究热点,作为篇章语义分析析对象,表现力比较有限;中心理论L8在给定的句子的重要内容,篇章句间关系研究(DiscourseRela—中跟踪焦点变化,通过定义不同的焦点变化方式来tion)也开始受到越来越多的关注。该研究以

6、分析描述篇章结构并获知语义信息。该理论主要关注句文本块间的因果、比较等语义关联为目标,在缺少篇子间的焦点转换,对篇章信息关注较少,转移关系类章级资源和方法的情况下,利用篇章旬间关系将词型比较单一。汇语义融合成为篇章级语义信息,成为语义分析的(2)以语义资源为核心的分析理论。框架语义重要解决途径之一,对自动文摘l_1]、自动问答]、倾学(FrameNet)通过构建“语义框架”将语义知识转向性分析[3]以及文本质量评价[5]、文本连贯性评化为计算机词典L9],用词义间的关联反映语义。山价等许多NLP任务起到了很大的帮助。西大学刘开瑛教授

7、、李茹教授领导的课题组研究构根据依赖的核心内容不同,传统的语义分析方建了中文框架语义知识库(ChineseFrameNet,法大致可以分为以下3类。CFN)。该理论语义信息丰富,便于计算机使用,但收稿日期:2012—12—13定稿日期:2013—03—29基金项目:国家自然科学基金重点项目(61133012);国家自然科学基金面上项目(61273321);国家863前沿技术研究项目(2012AA011102)2期张牧宇等:中文篇章级句问语义关系体系及标注29专业性极强,构建过程耗时耗力,脚本理论将文本语构;DuVerle口明使用丰富

8、的词汇、句法和结构化特义转化为具体的情景知识,通过对典型场景建模将征,采用SVM方法训练两个独立模型识别文本间文本语义具体化[1。该理论构思巧妙,但现实场景的修辞关系;VwFeng[1以RST体系为基础,使用无法穷尽,限制了实用性。了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。