一种基于混合分析的汉语文本句法语义分析方法.pdf

一种基于混合分析的汉语文本句法语义分析方法.pdf

ID:52768227

大小:252.52 KB

页数:7页

时间:2020-03-30

一种基于混合分析的汉语文本句法语义分析方法.pdf_第1页
一种基于混合分析的汉语文本句法语义分析方法.pdf_第2页
一种基于混合分析的汉语文本句法语义分析方法.pdf_第3页
一种基于混合分析的汉语文本句法语义分析方法.pdf_第4页
一种基于混合分析的汉语文本句法语义分析方法.pdf_第5页
资源描述:

《一种基于混合分析的汉语文本句法语义分析方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、中文信息学报第16卷第4期JOURNALOFCHINESEINFORMATIONPROCESSINGVol.16No.4一种基于混合分析的汉语文本句法语义分析方法尹凌姚天张冬茉李芳(上海交通大学计算机科学与工程系上海200030)摘要:本文提出了一种领域相关的汉语文本句法语义分析方法。根据领域文本的特点,该方法将浅层句法分析和深层句法语义分析结合在了一起。其浅层句法分析部分采用有限状态层叠的方法,将文本中的命名实体识别出来,从而大大减轻了深层分析部分的负担。其深层句法语义分析部分

2、将语义分析和语法分析结合起来,主要依靠词汇搭配信息来决定句子的结构。该方法在解决领域相关文本的短语结构歧义方面取得了较好的试验结果。关键词:浅层句法分析;深层句法分析;有限状态层叠;分语义场中图分类号:TP391.1AHybridAnalysisBasedChineseTextSyntacticandSemanticAnalysisMethodYinLingYaoTianfangZhangDongmoLiFang(DepartmentofComputerScienceandEngineeringS

3、hanghaiJiaoTongUniversity200030Shanghai)Abstract:ThispaperproposesaChinesetextanalysismethodonspecificdomain.Accordingtothetextscharacter,thismethodcombinesshallowparsingtechnologywithdeepparsingandsemanticanalysistechnology.Drawingonfinitestatecascade

4、smethod,itsshallowparsingmodulerecognizesnamedentitiesinthetexts.Sothatitgreatlyeasestheburdenofthedeepanalysismodule.Principallydependingonwordcollocationinformation,itsdeepanalysismodulecombinessyntacticanalysisandsemanticanalysistodeterminesentencestru

5、cture.Itgainsgoodeffectatresolvingtheambiguityofphrasestructureinspecificdomain.KeyWords:shallowparsing;deepparsing;finitestatecascades;subsemanticfield一、概述[1]对于汉语语料库的多级加工,主要分为切词、词类标注、短语结构标注、语义信息标注等。针对后两个阶段,本文以足球比赛报道为试验领域,提出了一种领域相关的汉语文本分析方法。它对已经完成分词和词性标注

6、的中间文本进行处理,借鉴并扩展了C.J.Fillmore的格语法,分析结果力求将句子中各个成分之间的格关系标注清楚。分析足球比赛报道文本的特点,发现有许多实体名称,如球队名称,比赛名称,人的身份等,对深层句法和语义分析是至关重要的。我们把这些实体名称称为命名实体(namedenti收稿日期:2001-12-24基金项目:国家自然科学基金(60083003).作者尹凌,女,1978年生,上海交通大学计算机系研究生,主要研究方向为自然语言处理.姚天,男,上海交通大学副教授,主要研究方向为自然语言处理.张冬茉

7、,女,上海交通大学副教授,主要研究方向为自然语言处理.李芳,女,上海交通大学副教授,主要研究方向为自然语言处理.45ty)。这些命名实体通常由一列并置的名词组成,可以由简单的语法规则识别,直接调用深层分析很可能由于前面词汇错误的结合,将它们拆分开来。如果用浅层句法分析先将这些实体标注出来,深层分析在此基础上再进行分析,这样就可以大大减少深层分析失败的情况。由此,我们采用深层分析和浅层分析相结合的方法,在深层分析之前,先用浅层分析对句子进行预处理。在以下各节当中,首先介绍了系统的整体框架;然后阐述了浅层分析部

8、分的主要原理;第四节讨论了深层分析部分的数据准备和核心算法;第五节给出标注结果;第六节对系统进行了讨论和评测。二、系统整体框架该系统的整体框架如图1所示。图中第三个步骤属于浅层分析模块,后四个步骤属于深层分析模块,值得说明的是,第二个步骤中,对应每个词的语义码来自于根据词汇的搭配关系制定的分语义场。第四个步骤中,挑选句子的谓语中心词借鉴了北京大学的骨架分析法。图1系统流程图46三、浅层句法分析浅层句法分析(sh

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。