基于半监督的汉语词义消歧方法

基于半监督的汉语词义消歧方法

ID:37045698

大小:500.55 KB

页数:60页

时间:2019-05-15

基于半监督的汉语词义消歧方法_第1页
基于半监督的汉语词义消歧方法_第2页
基于半监督的汉语词义消歧方法_第3页
基于半监督的汉语词义消歧方法_第4页
基于半监督的汉语词义消歧方法_第5页
资源描述:

《基于半监督的汉语词义消歧方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工学硕士学位论文基于半监督的汉语词义消歧方法徐志峰哈尔滨理工大学2018年3月国内图书分类号:TP391.2工学硕士学位论文基于半监督的汉语词义消歧方法硕士研究生:徐志峰导师:张春祥申请学位级别:工学硕士学科、专业:软件工程所在单位:计算机科学与技术学院答辩日期:2018年3月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP391.2DissertationfortheMasterDegreeinEngineeringBasedonSemi-SupervisedMethodofChineseWordSenseDisambiguationCan

2、didate:XuZhifengSupervisor:ZhangChunxiangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:SoftwareEngineeringDateofOralExamination:March,2018University:HarbinUniversityofScienceandTechnology哈尔滨理工大学硕士学位论文原创性声明本人郑重声明:此处所提交的硕士学位论文《基于半监督的汉语词义消歧方法》,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期间独立进行研究工

3、作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名:日期:年月日哈尔滨理工大学硕士学位论文使用授权书《基于半监督的汉语词义消歧方法》系本人在哈尔滨理工大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工大学所有,本论文的研究内容不得以其他单位的名义发表。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学

4、可以采用影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。本学位论文属于保密,在年解密后适用授权书。不保密√。(请在以上相应方框内打√)作者签名:日期:年月日导师签名:日期:年月日基于半监督的汉语词义消歧方法摘要词义消歧是自然语言处理领域中的一个重要研究问题。词义消歧的目的是为了确定歧义词汇在日常交流对话中的含义。句子中的语义信息和词性信息是两种重要的语言学知识,能够帮助确定歧义词汇的语义类别。随着自然语言处理领域的快速发展,词义消歧问题的解决成为了自然语言处理领域的一个难题。本文提出了一种半监督的词义消歧方法。以歧义词汇为中心,从左右邻接的词

5、汇单元中抽取出消歧特征来构建词义消歧模型,并采用半监督的方法来优化词义消歧模型,提高词义消歧分类器的性能。本文的主要研究内容分为以下三个方面:其一,阐述了词义消歧问题的研究背景和意义,介绍了词义消歧技术在国内外的研究现状,并对目前的研究现状进行了分析,对词义消歧技术面临的难题进行了分析和说明。其二,介绍了实验中需要用到的词典资源和语料库,阐述了《同义词词林》的内容组织结构。对训练语料和测试语料的背景和内容进行了说明,介绍了其预处理过程。详细的说明了消歧特征的提取过程。其三,以歧义词汇左、右邻接词单元的词形、词性和译文作为消歧特征,来构建贝叶斯词义分类器;以歧

6、义词汇左、右邻接词单元的词形和词性作为消歧特征,来构建最大熵词义分类器。采用Co-Training算法并结合大量无标注语料来优化词义消歧模型。使用SemEval-2007:Task#5的训练语料和哈尔滨工业大学的无标注语料来优化贝叶斯分类器和最大熵分类器,同时,对优化后的词义消歧模型进行测试。实验结果表明:运用本文所提出的半监督方法,词义消歧模型的准确率有所提高。关键词词义消歧;自然语言处理;语义类别;消歧特征-I-BasedonSemi-SupervisedMethodofChineseWordSenseDisambiguationAbstractWord

7、sensedisambiguation(WSD)isoneofimportantresearchissuesinfieldofnaturallanguageprocessing.Thepurposeofwordsensedisambiguationistodeterminethemeaningofambiguouswordsindailycommunicationandconversation.Semanticinformationandpartofspeechinformationaretwokindsofimportantlinguisticknowle

8、dge,whichhelptodeterminese

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。