基于简单名词短语的汉语介词短语识别研究

基于简单名词短语的汉语介词短语识别研究

ID:35068892

大小:4.76 MB

页数:55页

时间:2019-03-17

基于简单名词短语的汉语介词短语识别研究_第1页
基于简单名词短语的汉语介词短语识别研究_第2页
基于简单名词短语的汉语介词短语识别研究_第3页
基于简单名词短语的汉语介词短语识别研究_第4页
基于简单名词短语的汉语介词短语识别研究_第5页
资源描述:

《基于简单名词短语的汉语介词短语识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、乂連謹^义聋DALITYOFTECHNOLOGYIANUNIVERS颇±享恆巧文MASTE民八LDISSERTATION基于简单名词短语的汉语介词短语巧别研究计算誠臟术学科专业作者姓名指导教师__________答辩2016年6月日期硕±学位论文基于简单名词短语的巧语介词短语识别研究ResearchonChinesePrepositionalPhraseIdentificationBasedonSimple

2、NounPhrase作者姓名;桑乐园学科、专业:计算机应用技术学号:21309167指导教师;黄德根教授完成日期l:yoUM乂遠巧义乂#DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中己经注明引用内容和致谢的地方外,本论文不包含其他个人或集体邑经发表的研究成果,化不包含其他己申请学位或其他用途使

3、用过的成果一。与我同工作的同志对本巧究所做的贡献均&在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承捏相关法律责任。>学位论文题目:4<為>朵拓1絲麻敵;;Ufe令肩ii化/诚如彩I作者签名:.日期:日_年秦争5、W_^月_2_大连理王大学硕壬学位论文摘要一介词短语形式多样,位置灵活,是没语中十分重要的短语类型之。介词短语识别问题一直都是自然语言处理的研究热点,准确识别介词短语可W简化其所在句子的内部结构,缩小中也词选择范围,降低后续句法分

4、析的难度及复杂度,还可W提高翻译模板的匹配度。本文通过分析介词短语识别研究的难点及研究现状一,提出了种融合简单名词短语信息的介词短语识别方法;首先利用简单名词短语识别模型识别语料中的简单名词短语,并利用规则库对简单名词短语识别结果进行校正,使其更符合介词短语内部的短语形式和特点;然后使用分词融合方法将简单名词短语识别结果融入到语料中;最后采用多层介词短语识别模型分层识别介词短语,并通过双重错误校正系统校正介词短语识别结果。简单名词短语不但可保留充分的句法信息,还能减少歧

5、义问题,引入该名词短语信息到介词短语巧别方法中不但可W简化句子结构,尤其是复杂句子的结构,还可W降低介词短语依赖长距离上下文信息与CRF模型窗口受限的矛盾。多层介词短语识别的方法通过逐层识别句子中介词短语解决了并列型和嵌套型介词短语识别困难的问题。双重错误校正系统首先利用介词的固定搭配校正介词短语识别结果,然后利用错误驱动学习方法生成的转换规则集对校正结果进行进一步修正,该系统结合了语言学知识和统计学方法,改善了统计模型的数据稀疏问题,有效地提高了介词短语的识别结果。实

6、验结果表明,基于简单名词短语信息的介词短语识别方法是有效的。通过对《人民日报》中的7049个介词短语进行五倍交叉实验-,其识别的精确率、召回率及F值分别为:91.54%、91.46%、91.50%,使用双重错误驱动系统校正后,其识别的精确率、召-回率及F值分别为:93.10%、93.02%、%.06%。本文的实验和方法可W为复杂句子的翻译及模板匹配提供帮助。关键词:简单名词短语件随机场模型融合重错误校正系统;条;分词;双--I大连理工大学硕±学位论文Resea

7、rchonChinesePrepositionalPhraseIdentificationBasedonSimpleNounPhraseAbstract’过limthrareitilhrasesstructuresrecomlexaccouninAscassofortanseosonaatpp,pppp,gforaratherlargeroortioninChinesesen化打ce.Thereositionalhrasesrec

8、onitio打haspppppgbeenalwaysemphasisofnaturallanguageprocessing,whichsimplifies化estructureofsentencereducesthecomlexitofsentenceandthenumberofcandidatemainverbsand,py,makestheparsingeasilyincreasesteinlatematchi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。