基于语义类词法信息的词义消歧

基于语义类词法信息的词义消歧

ID:35178978

大小:4.98 MB

页数:63页

时间:2019-03-20

基于语义类词法信息的词义消歧_第1页
基于语义类词法信息的词义消歧_第2页
基于语义类词法信息的词义消歧_第3页
基于语义类词法信息的词义消歧_第4页
基于语义类词法信息的词义消歧_第5页
资源描述:

《基于语义类词法信息的词义消歧》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工学硕±学位论文基于语义类词法信息的词义消歧孙瓣荣哈尔滨理王大学2016年3月国内图书分类号.2:TP391工学硕i学位论文基于语义类词法信息的词义消歧硕±研究生:孙雜荣导师:张春祥申请学位级别:工学硕击学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2016年3月授予学位单位:哈尔滨理工大学ClassifiedIndex:TP391.2DissertationfortheMasterDegreeinEngineeringWordSenseDisambiguationBas

2、edonSemanticandLexicalInformationCandidate:SunLurongSupervisor:ZhangChunxiangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyDateofOralExamination:March,2016University:HarbinUniversityofScienceandTechnology哈尔演理工大学硕±学位论文原创性声明本人郑重声明:此处巧提交的硕古学位论文《

3、基于语义类词法信息的词义消歧》,是本人在导师指导下,在哈尔滨理工大学攻读硕±学位期间独立进行研巧工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发表或撰写过的研巧成果。对本文研究工作做出贡献的个人和集体,均已在文中臥明确方式注明。本声明的法律结果将完全由本人承担。'作者签名、巧菱赛-日期;从八年*月如日:或哈尔滨理工大学硕±学位论文使用授权书《基于语义类词法信息的汉语词义消歧》系本人在哈尔滨理工大学攻读硕±学位期间在导师指导下完成的硕壬学位讼文。本论文的研究成果归哈尔滨理工Jt其他单位的名义发表大学所有

4、,本论文的研巧内容不得t^。本人完全了解哈尔滨理工大学关于保存、使用学位论文的规定*同意学校保留并向有关部口提交论文和电子版本。本人授权哈尔滨理工大学可抖采用,允许论文被查阅和借阅影印、缩印或其他复制手段保存论文,可公布论文的全部或部分内容。本学位论文属于保密,在年解密后适用授权书。I□不保密0。(请在臥上相应方框内打V)日期A。//年;作者签名:菊、聪秦:月日导师籍名:多月炭曰;曰期如U年哈尔滨理工大学工学硕士学位论文基于语义类词法信息的词义消歧摘要汉语的词汇组合搭配的灵活性和变通性,导致中文词汇歧义现

5、象的产生。语言的不确定性直接影响着自然语言处理领域的相关应用的实现,这说明词义消歧研究是解决自然语言处理的关键。让计算机依据从语料中提取出的语言学知识,自动地为歧义词匹配符合语境的词义是词义消歧的目的。本文针对本课题的研究的起源、意义和已有研究现状以及词义消歧未来将面临的挑战进行了介绍,并对比分析了主流词义消歧方法的优缺点。参考已有的相关知识和研究成果,提出一种结合统计学习理论的有监督的混合特征消歧方法。该方法结合语言学中常用的词法信息和语义类信息作为消歧特征。最后利用提取到的特征来训练分类模型,并测试该模型的消歧准确率。本文的研究内容主要体现为以下三个

6、方面:其一,本文阐述了词义消歧领域中较为主流的消歧方法,并针对这些方法做出示例和比较。简述了词义消歧的评测体系和准确率的计算方式,以及词义消歧研究亟待解决的问题。其二,分析了词义消歧的语言学工程资源,包括语料的来源、语料格式、解析工具、语料标注体系、特征筛选和特征的提取。深入研究语料可提供的语言学知识有助于筛选出有益于消歧的特征。利用《同义词词林》获得词汇的语义类信息即语义代码,结合语义类和词法信息的特征提取方法,可以获取包括语义代码、词形和词性等语言学知识。其中,语义代码的多层知识结构可以提供不同层次的指导。其三,通过提取单一特征或不同特征信息的组合,

7、构建有差异的特征向量集。分别利用这些差异化的特征向量集训练支持向量机分类器,然后对比多组不同特征向量集的实验结果,证明新方法及消歧分类器的性能。关键词词义消歧;语义类;词法信息;特征提取;支持向量机-I-哈尔滨理工大学工学硕士学位论文WordSenseDisambiguationBasedonSemanticandLexicalInformationAbstractVocabularycollocationofChineselanguagehasstrongflexibilityandversatility,thesefeaturesleadtotheg

8、enerationofChineselexicalambiguity.Theun

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。