欢迎来到天天文库
浏览记录
ID:42221429
大小:382.12 KB
页数:30页
时间:2019-09-09
《语言信息处理技术报告》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、指导教师作者姓名学院名称课程名称日期语言信息处理技术报告黄河燕,鉴萍,史树敏王斌王兴成王阳路翔王勇计算机学院语言信息处理2011年12月8日摘要随着计算机的普及,我们的生活变得日益信息化、智能化,各种计算机应用蓬勃发展。本文讨论的是其中的面向依存文法的句法分析技术。我们采用基于规则的方法进行翻译,研究使用依存文法束分析汉语并使用已有工具ctbparser实现了一个对汉语语法的分析。现代依存语法理论的创立者是法国语言学家Tesniere,依存文法(dependencygrammar)是一种用词之间的支配与被支配关系来描述语言结构的文法理论。Tesniere
2、^人类语言进行广泛对比研究,侧重于研究语言的共性。其初衷是建立一门跨越各国语言界限、客观揭示入类语言内在规律的句法理论。因此,依存文法适合用来分析汉语句子。汉语有自己的特殊性,汉语的词类和句法功能之间不存在直接映射。本文进行汉语语法分析的总体思路把分析分为两个部分:先给出词汇可能的句法功能,即依存标注(可能不唯一),然后再根据标注问的主从关系分析句子的句法结构。在进行句法分析时,主要依据是依存关系的五大公理。进行句法分析时采取寻找该依存标注的支配标注的方法:从句首到句尾进行分析,依次取词寻找其主词。关键词:自然语言处理依存文法语法分析汉语Abstract
3、Withthewidespreadapplicationofcomputertechnology,Ourmodernlifebecomemoreandmoreintelligent.Inourarticle,wediscussthetechnologyofdependencyparsinganalysisandhowtoaccomplishaparser.Weapplytherule-basedmethodtotranslating.AFrenchlinguistnamedTesnierefoundedthemoderntheoryofdependenc
4、ygrammar.Thistheorydescribesthelanguagestructurebytherelationshipofdominationbetweenwords.Hisextensivecomparativestudyofhumanlanguagefocusesonthecommonnessoflanguage.Hisoriginalpurposewastoestablishalanguagetheorywhichacrossnationalboundariesandrevealtheinternallawsofhumanlangu硝e
5、objectively.Therefore,thedependencygrammarissuitablefortheanalysisofChinesesentences.ChineselanguagehasitsownspecificssothereisnodirectmappingbetweentheChinesepartofspeechandthesyntaxfunction.Inthethesis,themainthoughtoftheanalysisoftheChinesesyntaxhastwosteps:first,wegivetheposs
6、iblesyntaxfunctions(namelydependencylabel)oftheword,thenanalyzethesyntaxstructureofthesentenceonthebaseofthedominantrelationsbetweenthedependencylabels.Welabelthewordonthebasisofthemaincharactersofeachpartofthespeech・Weanalyzethesyntaxstructureaccordingtothefiveaxiomsofthedepende
7、ncygrammar・KEYWORDS:naturallanguggeprocessing;dependencygrammar;莎ntaxanalysis;Chinese.目录1•弓I言51.2开发目的61.3国内外相关工作62.机器翻译概论82.1机译系统的结构82.2机器翻译研究的方法93.设计与分析123.1依存语法123.2任务整体框架153.3方法原理163.4算法描述214测试实例235•系统使用说明256.课题组各成员具体工作介绍261.引言开发背景随着牛活的信息化、计算机的普及以及Internet网的迅速发展,人们每天要接触和处理的信息量
8、越来越大。这些信息很大部分都以各种自然语言为载体。而剥+这样一个庞大的信息库,人
此文档下载收益归作者所有