基于svm的离合词词义消歧

基于svm的离合词词义消歧

ID:35058800

大小:3.00 MB

页数:55页

时间:2019-03-17

基于svm的离合词词义消歧_第1页
基于svm的离合词词义消歧_第2页
基于svm的离合词词义消歧_第3页
基于svm的离合词词义消歧_第4页
基于svm的离合词词义消歧_第5页
资源描述:

《基于svm的离合词词义消歧》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、HEBEIUNIVERSITY密级:分类号:学校代码:10075学号:20131291硕士学位论文基于SVM的离合词词义消歧学位申请人:张振景指导教师:李新福教授学位类型:工学硕士学科专业:计算机科学与技术授予单位:河北大学答辩日期:二〇一六年五月ClassifiedIndex:CODE:10075U.D.C:NO:20131291ADissertationfortheDegreeofM.EngineeringLiheciWordSenseDisambiguationBasedonSVMCandidate:ZhangZhenjingS

2、upervisor:Prof.LiXinfuAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyUniversity:HebeiUniversityDateofOralExamination:May,2016河北大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包

3、含为获得河北大学或其他教育机构的学位或证书所使用过的材料一。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了致谢。作者签名、.年^:在416月曰_日期学位论文使用授权声明本人完全了解河北大学有关保留、使用学位论文的规定,目P;学校有权保留并向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅。学校可W公布论文的全部或部分内容,可W采用影印、缩印或其他复制手段保存论文。本学位论文属于1、保密□,在年月日解密后适用本授权声明。2、不保密1^。

4、。"(请在W上相应方格内打V)、保护知识产权声明本人为申请河北大学学位所提交的题目为(Sv/M^)的学位论文,是我个人在导师指导并与导师合作下取得的研究成果,研究工作及取得的研究成果是在河北大学所提供的研巧经费及导师的研究经费资助下完成的。本人完全了解并严格遵守中华人民共和国为保护知识产权所制定的各项法律、行政法规W及河北大学的相关规定。本人声明如下:本论文的成果归河北大学所有,未经征得指导教师和河北大学的书面同意和授权,本人保证不W任何形式公开和传播科研成果和科研工作内容。如果违反本声明,本

5、人愿意承担相应法律责任。寸扛^、年声明人:^《日期:貝^_日心作者签名;杂日期:年i只I_日导师签名:姑 ̄^>4毕^A6日落日期:叫、摘要摘要离合词词义消歧对汉英机器翻译、信息检索、语音识别、文本分类等众多领域有着重要的影响。本文以北京大学中国语言学研究中心的现代汉语语料库为基础,研究具有两个词义且其词性相同的离合词的词义消歧问题。首先,针对扩展形式的离合词和非扩展形式的离合词,分别设计相应的特征模板,根据特征模板提取上下文特征;然后,通过考虑不同类型的特征对离合词词义消歧效果的影响不同,提出了

6、一种基于特征类型重要性的特征加权方法。该方法针对一种类型特征权重,分别改变另外两种类型特征权重的消歧正确率来验证三类特征的消歧效果,对不同权重下的离合词词义消歧效果进行了考察;最后,设计了基于SVM的离合词词义消歧分类模型。在建立SVM分类器时,利用遗传算法对SVM的惩罚因子C和核函数参数γ进行优化,把十折交叉验证得到的离合词词义消歧正确率作为适应度函数。实验结果表明,使用遗传算法优化SVM参数后的分类器时,基于特征类型重要性的特征加权方法的消歧效果优于布尔函数加权方法、基于词频的特征加权方法、TF-IDF加权方法。关键词离合词词义消

7、歧SVM特征提取特征加权遗传算法IAbstractAbstractLiheciWordSenseDisambiguation(WSD)isveryimportanttomanyresearchfieldssuchasChinese-Englishmachinetranslation,informationretrieval,speechrecognition,textclassification,etc.BasedonthelargemodernChinesecorpusofCenterofChineseLinguisticsPKU,

8、weresearchtheLiheciwordsensedisambiguationwhichhavetwomeaningsandpartofspeechofthemarethesame.Firstly,fordiffe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。