基于标注语料库的现代汉语句型句模对应关系研究

基于标注语料库的现代汉语句型句模对应关系研究

ID:13592991

大小:1.31 MB

页数:110页

时间:2018-07-23

基于标注语料库的现代汉语句型句模对应关系研究_第1页
基于标注语料库的现代汉语句型句模对应关系研究_第2页
基于标注语料库的现代汉语句型句模对应关系研究_第3页
基于标注语料库的现代汉语句型句模对应关系研究_第4页
基于标注语料库的现代汉语句型句模对应关系研究_第5页
资源描述:

《基于标注语料库的现代汉语句型句模对应关系研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、单位代码10451学号200202007分类号H146烟台师范学院硕士研究生毕业(学位)论文论文题目基于标注语料库的现代汉语句型句模对应关系研究毕业研究生姓名孙道功学科专业名称汉语言文字学指导教师姓名亢世勇教授张绍麒教授论文提交日期二○○五年四月II前言本课题是国家973项目“面向大规模真实文本的汉语计算理论、方法和工具”的子课题——“汉语句子语义结构语料库开发和应用”的内容之一。整个工作是在清华大学计算机与技术系孙茂松教授指导下、烟台师范学院汉语言文学院亢世勇教授的主持下进行的,语料库的标注工作是由2002级、2003级中文信息处理方向的研究生以及

2、汉语言文学院的2001级本科班的十几位同学花费了半年多的时间完成的,并由专人进行了最后的校对工作。句型和句模的抽取工作是由清华大学计算机与技术系的计算语言学专业研究生张正操帮助完成的。句型和句模的对应关系研究已有的研究成果很少,本课题的研究力求在理论和实践方面有所突破。理论方面,在标注语料库的基础上初步建立起现代汉语句型和句模的对应体系,深化对现代汉语句法语义关系的研究,丰富三个平面的语法理论,并为全面建立现代汉语句系提供理论基础。实践方面,通过定量统计,了解常用句干的使用频度情况,找出现代汉语的高频句干(句型句模结合体)形式,作为句子教学中择句的标

3、准和依据,减少句子选择的主观性和任意性,推动对外汉语教学中的句子教学;同时,高频的句干模型成为计算机理解自然语言和机器翻译的优先选择模式,对提高计算机的语义理解、机器翻译的准确度也有所帮助。II目录摘要IIAbstractIV第一章绪论1第一节句型和句模对应关系的研究现状分析1第二节句型和句模对应关系研究的意义价值9第三节句型和句模对应关系的研究思路和方法10第二章语料库的标注原则及方法12第一节句法成分、语义成分的标注思想12第二节句法成分、语义成分的标记及其含义13第三节句法成分、语义成分的标注对象及方法15第三章句型和句模的对应体系17第一节句

4、型和句模对应关系的分类17第二节单句形式的对应关系19第三节复句形式的对应关系39第四节句型和句模对应关系的主要特点54第四章句型和句模对应关系的频度研究57第一节单句形式的对应关系的使用频度统计分析57第二节现代汉语常用的100个高频句干75第三节句型频度统计对确定现代汉语语序类型的影响80第四节高频句型和高频句模的对应关系82第五章特殊句式的句型和句模对应关系分析84—兼语句的再认识84第六章余论93[参考文献]95102附录100个句干表98后记101摘要102现代汉语句型和句模的对应关系已有的研究成果很少。在标注语料库的基础上初步建立起现代汉

5、语句型和句模的对应体系,对深化现代汉语句法语义关系的研究,丰富三个平面的语法理论,推动对外汉语教学中的句子教学,提高计算机的语义理解、机器翻译的准确度,都有着重要的意义和价值。现代汉语句型和句模对应体系的建立,仅凭内省式的简单枚举法是不能完成的。在大规模的标注语料库的基础上进行句型句模对应关系的研究成为一种必然。我们在已有的研究成果的基础上首先确定了句法成分和语义成分以及标注对象。句法成分主要包括主语语块、谓语语块、宾语语块、状语语块、补语语块、兼语语块、独立语块七大类型,语义成分共分出23类,分别是施事、当事、受事、客事、共事、系事、结果、数量、范

6、围等。语义成分标注对象主要是谓语动词和处于主宾语或状语位置上与谓语动词发生语义关系的体词性成分。并分别为句法成分和语义成分制定了两套标注标记,然后在试标注的基础上制定句法成分和语义成分的标注规范。在此基础上进行句型和句模的分类抽取、频度统计等研究工作,考察句型和句模对应关系。本文在标注语料库的基础上,以三个平面的语法理论为指导思想,着重讨论了句型句模的对应体系、使用频度等几个问题。我们以句型为出发点考察句型句模的对应关系,因为句型的数量要比句模少得多。根据句型的特点区分为单句形式的对应关系和复句形式的对应关系。在单句形式的对应关系中,讨论了主谓句和非

7、主谓句两种形式的对应关系,共包括了394种句子类型,占语料库句子总量的61.981%。主谓句又分成谓词性谓语句、体词性谓语句、主谓谓语句三种,其中谓词性谓语句是我们研究的重点。在谓词性谓语句中,讨论了[S][P][O]型,[S][P]型,[S][P][O[S][P][O]]型,[S][P][J][P][O]型,[S][D][P][P]型等核心句型及其下位句型与句模的对应关系。非主谓句中主要讨论了[P][O]型、[P]型和兼语型等类型的对应关系。我们发现各种不同的句型对应的句模数量差别很大,核心句型对应的句模数量多。而且核心句型和下位句型之间,核心句模

8、和下位句模之间有着比较规则的派生关系,新的句干的生成,就是在核心句型的基础上不断添加状语等句法成分,在核心句

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。