面向自动句法研究名词再分类探究

面向自动句法研究名词再分类探究

ID:6230125

大小:32.50 KB

页数:10页

时间:2018-01-07

面向自动句法研究名词再分类探究_第1页
面向自动句法研究名词再分类探究_第2页
面向自动句法研究名词再分类探究_第3页
面向自动句法研究名词再分类探究_第4页
面向自动句法研究名词再分类探究_第5页
资源描述:

《面向自动句法研究名词再分类探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、面向自动句法研究名词再分类探究  摘要:词类划分是为句法分析服务的,名词的再分类也必须遵循这一原则。但就现有的名词细类看,由于在分类时为句法分析考虑得不够充分,所以划出的小类对自动句法分析难以起到应有的作用。鉴于此,本文一改过去那种为了把某词放到合适的词类中而找“特点”的做法,按照词的句法分布,详细描述每个词的句法功能。按照句法功能总和相同即为一类的标准为名词进行再分类,以期为自动句法分析提供客观依据。关键词:句法结构句法分析句法功能词类一、引言10自动句法分析是自然语言处理中的一个重要课题,其任务是将句子中的词之间的线性序列转换成具有结构的分析树。一般来说,自动句

2、法分析的操作对象是句子或短语的词类标记序列,要想使计算机能够准确地分析词类标记序列的内部关系,必须为它提供完备的语法知识。对于简单的NP+VP→S这种模式的词类标记序列,现有的词类知识能够很好地为自动句法分析服务,但对于嵌套的名词结构如“经济体制改革”或者是在句法结构上存在远距离依存关系的短语等具有多层次较复杂的情况来说,必须为它提供更多的词类知识。但遗憾的是,现有的语法知识中的词类知识是粗糙的和不完备的,难以支持自动句法分析。以现有的名词细类为例,具体地说有以下几个问题:名词究竟有哪些语法功能并不清楚,一般语法书只列举几条“语法特点”,例如,说名词可受数量结构修饰

3、,不受副词修饰,可以作主语、宾语等等。但即便是这几条语法特点,往往也缺乏普遍性;都标记为“N”的名词,有的词相互间的语法功能却相差很大,一般的名词可以作主语、宾语、定语、体词性偏正结构的中心语等,而“年间”“时”等只具有上述的最后一种功能;缺乏词的各种语法功能的定量描写,上述问题都给计算机进行自动句法分析带来一定的困难。鉴于这种情况,我们主张“按照词的句法分布,根据其充当句法成分的功能来对名词进行分类,语法功能总和相同即为一类。说一个词能充当主语,等于说它能在主谓结构里作第一个直接成分;说一个词能充当宾语,等于说它能在述宾结构里作第二个直接成分。这样,我们就是用句法

4、结构来作为名词归类的测试环境,换言之,是从句法结构推导出词类。这种做法能使词类划分更直接地为句法分析服务。”①二、名词句法功能信息库的构建与实现(一)名词句法功能信息库属性字段的确立10名词句法功能信息库旨在考察每一个名词具体的句法功能,然后根据句法功能的总和来确定词类的总数。也就是说,只要句法功能的总和相同,这样的词就归为一类。既然是从句法结构推导出词类,我们首先就要确定句法结构的种类以便统计列出句法成分的清单,然后详细考察每一个词。只要能充当所列清单中的成分,我们就标记为“1”,如果不具备某项功能,就标为“0”。我们为名词分类而采用的句法结构共8种,句法成分共2

5、1种,具体如下表:1.并列结构跟句法分析没有多大关系,即便是强调它也作句法成分,其功能已经包含在上述八种结构中,所以没有必要列出。2.中心语用下标作区别的意义在于考察名词是否能直接受其他词的修饰。3.对定语用下标作区分的意义在于考察名词是否能直接作定语,状1、状2也属于类似的情况,只不过句法成分是状语而已。4.在“定‘的’中结构”里作第一直接成分的,绝大多数情况下也能在“的”字结构里作第一直接成分,所以没有列出“的”字结构这一项。(二)句法功能统计的原则要确定这么细致的句法成分,对于一些复杂情况的定类必须遵循一定的原则:101.主谓结构作宾语时,只统计结构内部各成分

6、的功能,不考虑整个结构的外部功能。如“我们听说学校开除了两名夜不归宿的学生”这句中的“学校”看作主语,不考虑它在整个句子中的句法功能。2.兼语记入宾语,如“这件事情让公司处理吧”,这里的“公司”看作宾语。3.联合结构、同位语结构中的成分按其整体功能标记,如“老师学生同台演出”中的“学生”看作句子的主语;“在一架钳工工作台前,一位穿蓝大褂的中年人注视着孩子们,他是教师塔吉耶夫。”这里的“教师”看作句子的宾语。4.方位结构一律按定中结构处理,如“从电视上学到不少东西”中的“电视”看作“上”的定语。5.“的”字结构作主语或者宾语的,按定语处理。如“个人的利益要服从集体的”

7、中的“集体”看作定语。三、基于语料库统计的名词细分类及其对句法分析的作用(一)名词的细分类我们随机抽取了1998年《人民日报》语料中的高频名词100个,每个名词随机抽取100个例句进行句法分析,根据分析结果构建了一个小规模的语料库,下面略举几例以便说明10从上表的统计结果可以看出,名词的句法功能是复杂多样的,但并非如有些学者所想象的那样一词一类。按照句法功能总和相同即可归为一类的原则,通过分析统计,这100个词分属于73类。这个数目,对于我们人来说是太大了,掌握起来比较困难,但却给计算机自动句法分析带来了方便。因为属于同一词类的词,其语法功能是完全相同的。原有的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。