欢迎来到天天文库
浏览记录
ID:5299367
大小:450.93 KB
页数:6页
时间:2017-12-07
《句法语义接口问题》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、2006年第3期外国语总第163期No.3,May2006JournalofForeignLanguagesGeneralSerialNo.163文章编号:1004-5139(2006)03-0030-06中图分类号:H043文献标识码:A句法语义接口问题陆俭明(北京大学汉语语言学研究中心/中文系,北京100089)摘要:本文从自然语言处理的角度探讨句法和语义的接口问题,认为可以有不同的探索的思路,文章对不同的探索思路作了一定的分析,并就每一种探索思路提出了一连串需要我们进一步研究、解决的问题.关键词:句法
2、语义接口;自然语言处理;构式;词语的特征研究OnInterfacebetweenSyntaxandSemanticsLUPan-ming(DepartmentofChinese/theCenterforChineseLinguistics,Beijing100089,China)Abstract:Inthispaper,wediscusstheissueofinterfacebetweensyntaxandsemanticsfromtheperspectiveofnaturallanguageprocess
3、ing.Weproposethevariousapproachestolinksyntacticandsemanticrepresentationstoeachother.However,therearedifferentproblemsforeachapproachneedtobetakenintoconsideration.Keywords:interfacebetweensyntaxandsemantics;naturallanguageprocessing;construction;studyofl
4、exicalfeaturestructure系。一个范畴可能刻画为几个特征,一个特征也可能用来刻画多个范畴。所有规则都是建立现在世界范围的自然语言处理研究工作,在已知的或者更确切点说是假设的范畴的基大致都停留在句处理阶段。其进展不像希望的础上。从逻辑上来说,所有规则都可以表示为那样快。句处理的核心问题是怎么让计算机处PiQ这样的蕴涵式。比如,可以有这样的规则,理、理解自然语言中一个句子的意思,又怎么如果某个词W.是主.词一(P),那么W鱼生垫让计算机自动生成一个符合自然语言规则的、(Q)。这条规则在“‘名词
5、”,跟“‘主语”,两让人能理解的句子。在这个问题的解决上,现个范畴间建立起了一种联系,尽管这条规则所在可以说是八仙过海、各显神通。从大的方面描述的联系是粗糙的,甚至不那么正确,但是,说,大致有两种策略,一种是基于规则的处理以这样的方式建立范畴之间的联系,是分析语策略,要求研究者拥有两方面的语言知识:一言的结构时必不可少的。而语言学家所要做是范畴((category)知识,二是规则(rule)知的,正是去寻找正确的和好的联系。范畴知识识。范畴知识有句法的,有语义的;句法的如一般用词库(机器可读词典MRD)来负
6、载,主语、谓语、宾语、定语以及名词、动词、形规则知识则由所谓规则库(规则的集合)来承容词等,语义的如施事、受事、工具以及数量、担。计算机建立了词库和规则库,就可以利用领属、自主、位移等。范畴用来刻画语言对象这些词库和规则库,按研究者的需要进行运的一个或一组特征。规则用来表述范畴间的关算、分析,然后研究者根据计算机的分析结果(着重看计算机的分析结果是否跟预期的要处理的汉语资源建设,已成为中文信息处理,求或目标相符),来调整原有的范畴体系、具乃至我国的信息科技发展的关键性工程。在汉体语言成分的属性取值以及相关的
7、规则,即改语资源的建设中,揭示、描述句法语义的互动、进词库和规则库的内容。基于统计的“句处理”接口(interface)问题是其中的一个重要组成研究,主要借助于计算机对大规模语料库真实部分f2]4文本的统计分析,由计算机来抽象出语言知识。因此,基于统计的“句处理”,其重要依靠就是存放实际的语言交际中真实出现的语朱德熙先生[[9]生前一直强调语法研究中言材料的语料库(corpus)。语料库可以分“生形式和意义的结合。这是从汉语本体研究的角语料库”和“熟语料库”。所谓生语料库,是度来说的,是从汉语本体研究中悟出
8、的道理。指未加工的、未带有任何语言学信息标注的语从中文信息处理的角度说,巫需从交际过程中料库;所谓熟语料库是指经过词的切分、词性编码、解码的角度来考虑问题。从交际过程中标注等一定加工的、带有语言学信息标注的语编码、解码的过程来说,就是要解决好句法、料库。([7].[s])可见,建设一个语料库,语义的接口问题。除了通过某种手段录入大量语料外,重要的是怎么解决好句法语义的接口问题?现在要对所录入的语料进行如下的标注加
此文档下载收益归作者所有