欢迎来到天天文库
浏览记录
ID:34042546
大小:2.63 MB
页数:86页
时间:2019-03-03
《基于动词次范畴化的汉语句法分析后处理方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、在基于统计的句法分析方法中,最关键的两个问题是建立消解语言歧义统计模型和句法分析后处理的设计,它们决定着句法分析系统的分析正确率和效率。本文从事的工作则主要从句法分析后处理方面入手,提出了一个基于动词次范畴化的汉语句法分析后处理的方法,主要研究工作如下:1.研究现有常用的统计句法分析模型和句法分析算法,并对其进行综合分析比较,而且解释了动词次范畴化句法模式的理论、形式化描写以及次范畴化和对应的句法树之间的关系。2.用统计句法分析模型产生n-best句法分析树输出,通过用基于转移的错误驱动的学习方法来进行一步改善动词次范畴化的
2、提取,进行相应的重排序来寻找最优的句法分析树,并进行了相应的基于动词次范畴化规则方法的句法分析后处理实验。3.通过用基于转移的错误驱动的学习方法来进行一步改善动词次范畴化的提取,达到改善句法分析的最优解,并进行了基于动词次范畴化统计信息方法的句法分析后处理实验。本文的实验采用了中文信息学会CIPS.ParsEval.2009竞赛语料作为训练语料,它来自于清华汉语语料库(TCT),并用中文信息学会CIPS.ParsEval.2009测试数据进行实验。实验表明本文最好的结果Fl值达到88.759%接近中文信息学会句法分析CIPS
3、.ParsEval.2009最好结果Fl值88.77%,———二些丝些一I\删i嬲■i宣ii暑i宣宣iiiiiiiiiiiii置iiiiiiiiiiiiiiiiiiiiiii萱iiii宣iiii宣ii一_V-『’’一一有利的证明本文的基于动词次范畴化的汉语句法分析后处理方法具有较高的句法分析效率和正确率。关键词:动词次范畴化;汉语句法分析后处理;句法分析AbstractParsingisafundamentalprobleminnaturallanguageprocessing.Themaintaskofparsingist
4、odeterminetheinputsequenceofwordswhetherCanconstituteasentencetocomply丽tllgrammarrule,thatis,toconstructthehierarchicalconstituentstructureofasentence.Throughusinggrammarruleandotherknowledgeofnaturallanguageprocessing,itchangestheinputsentenceorderbetweenwordsfrom
5、thelinearorderintoanon-lineardatastructure.Ithasmanyapplications,suchasmachinetranslation,informationretrieval,automaticsummarization,ithasaimportantrole.Aboutbasedstatisticalsyntacticparsingmethods,therearetwoimportantissues.OneistoestablishstatisticalmodelofAmbig
6、uityResolutionparsingalgorithm.theotheristhedesignofsyntacticparsingpostprocess,theydeterminethesyntacticanalysissystemaccuracyandefficiency.Thepaperismainlyengagedintheworkofthesyntacticparsingaspectsofpostprocessing,whichbasedonverbsubcategofizationforChinesesynt
7、acticanalysis.Themainresearchworkisasfollows:1.WestudyexistingcommonstatisticalparsingmodelandsyntacticanalysisalgorithmaSwellasitscomprehensiveanalysisandcomparison,andalsoexplaintheverbsubeategorizationsyntacticmodeltheory,formaldescription,syntactictre圮sandtheco
8、rrespondingrelationshipofverbsubeategorization.2.Withthestatisticparsingmodeloutputingthen—bestparsingtrees,byusingthetransfer-basederror-drivenl
此文档下载收益归作者所有