基于深度学习的汉语词义消歧方法研究

基于深度学习的汉语词义消歧方法研究

ID:35067267

大小:2.99 MB

页数:76页

时间:2019-03-17

基于深度学习的汉语词义消歧方法研究_第1页
基于深度学习的汉语词义消歧方法研究_第2页
基于深度学习的汉语词义消歧方法研究_第3页
基于深度学习的汉语词义消歧方法研究_第4页
基于深度学习的汉语词义消歧方法研究_第5页
资源描述:

《基于深度学习的汉语词义消歧方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号^UDCS^ ̄--密敏…巧….…给…I^).、v.’.■*?‘-、f'.:硕±研究生学位论文詞'基于深度学习的巧语词义消歧方法研究申请人;张晶堇学号:21W52培养单位;升算机科学技术学院学科专业:软件工程研巧方向:白然语言处理指导教师:杨艳教授完成日期:2016年5月20曰分类号UDG畫*.^又%密银...公....开rKU7文赛^^拿硕±研究生学位论文基于深度学习的巧语词义消歧方法研究申请人:张晶董学号:21313巧培养单位:计算机科学

2、技术学院学科专业:软件工程研究方向:自然语言处理指导教师:杨艳教授完成日期:2016年5月20日独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研。巧成果据我所知,除了文中特别加标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研巧成果,也不包含为获得黑龙江大学或其他教育机构的学位或证书而使用过的材料。学位论文作者签名:^為g签字日期:从年(7月各日学位论文版权使用授巧书、本人完全了解黑龙江大学有关保留使用学位论文的规定,同意学校保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅

3、和借阅。本人授权遷龙注去董可W将学位论文的全部或部分内容编入有关数据库进行检索,可W采用影印、缩印或其他复制手段保存、泊编本学位论文。学位论文作者签名:导师签名:脉手签字曰期:年t月《曰签字曰期:年^月^曰学位论文作者毕业后去向:中文摘要自然语言中一词多义现象是普遍存在的。词义消歧(wordsensedisambiguation,WSD)任务是依据上下文语境确定词的词义,词义消歧任务可以直接影响机器翻译(MachineTranslation,MT)、信息检索(InformationRetrieval,IR)等任务的性能。本文在机器学习框架下研究汉语词义

4、消歧和未登录词词义预测问题。具体而言,本文将从以下三个方面展开研究:(1)基于序列标注的汉语词义消歧。本文将词义消歧任务形式化为序列标注问题,研究不同序列标注模型和不同特征的消歧性能。实验结果表明:融入五级标注词义特征的条件随机场模型消歧效果较好。(2)基于词向量的汉语词义消歧。为了进一步提高词义消歧性能,本文尝试将包含语义信息的词向量融入词义消歧中。一方面,利用上下文共现词频与句法依存信息缩减歧义词词义的候选数量,而后在神经网络模型下,通过计算学习获得的词义标记向量与歧义词向量的语义相似度确定词义;另一方面,我们对最大熵模型进行优化,并通过确定性区别词和语义相似度对语料进行扩展

5、,以提高词义消歧的准确率。实验结果表明,利用扩展语料在神经网络最大熵模型的消歧效果最佳。(3)基于词向量的汉语未登录词的词义预测。在词义消歧的基础之上,本文探索未登录词的词义预测问题,分为两个子问题:词义候选构造与词义预测。在构造词义候选阶段,本文分别采用基于词性、内部语素、语义相似度的方法以及多方法融合进行构造;在词义预测阶段,本文利用不同粒度的词向量语义相似度对候选的词义进行预测。实验结果显示:基于多方法融合的方法构造未登录词的预测词义效果最佳。关键词:词义消歧;未登录词词义预测;深度学习;序列标注;词向量-I-AbstractPolysemyiscommoninnatura

6、llanguages.WordSenseDisambiguation(wordsensedisambiguation,WSD)taskisaimingatdeterminingthesenseofapolysemybasedonitscontext.TheresultsofWSDtaskcandirectlyaffectmachinetranslation(MT),informationretrieval(IR)andothertasks.Inthispaper,weexploreChineseWSDtaskandout-of-vocabularysensepredictiont

7、askontheframeworkofmachinelearning.Specifically,thepaperwillexpandthestudyofthefollowingthreeaspects.(1)Chinesewordsensedisambiguationassequencelabeling.WeformalizeWSDtaskasasequencelabelingproblem.Ontheframeworkofmachinelearning,weusediffere

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。