基于集成方法的文本蕴涵识别.pdf

基于集成方法的文本蕴涵识别.pdf

ID:50117866

大小:2.19 MB

页数:65页

时间:2020-03-06

基于集成方法的文本蕴涵识别.pdf_第1页
基于集成方法的文本蕴涵识别.pdf_第2页
基于集成方法的文本蕴涵识别.pdf_第3页
基于集成方法的文本蕴涵识别.pdf_第4页
基于集成方法的文本蕴涵识别.pdf_第5页
资源描述:

《基于集成方法的文本蕴涵识别.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于集成方法的文本蕴涵识别梅荣月2015年1月中图分类号:TP391UDC分类号:004基于集成方法的文本蕴涵识别作者姓名梅荣月学院名称计算机学院指导教师张春霞副教授答辩委员会主席樊孝忠教授申请学位工学硕士学科专业计算机科学与技术学位授予单位北京理工大学论文答辩日期2015年1月AnIntegratedMethodtoRecognizeTextualEntailmentCandidateName:RongyueMeiSchoolorDepartment:SchoolofComputerScienceFacultyMentor:A.P.ChunxiaZhangChair,T

2、hesisCommittee:Prof.XiaozhongFanDegreeApplied:MasterofEngineeringMajor:ComputerScienceandTechnologyDegreeby:BeijingInstituteofTechnologyTheDateofDefence:January,2015研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京理工大学或其它教育机构的学位或证书所使用过

3、的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学硕士学位论文摘要文本蕴涵识别是自然语言处理和信息抽取领域中的重要研究问题。在自然语言处理研究中,人们经常会遇到同义异形问题,即语义表达多样性问题。文本蕴涵识别可用于解决自然语言语义表达多样性问题和属性值知识验证问题。语义表达多样性问题是指相同的含义可以使用多种不同的语句表现出来。属性值知识验证问题是用来验证属性值抽取系统的输出结果是否正确。另外,文本蕴涵识别在问答系统、多文档自动摘要、信息抽取、语义检索以及机器翻译评测等多个自然语言处理领域应

4、用中起着至关重要的作用。本文提出了一种基于集成方法的文本蕴涵识别算法,并开发了文本蕴涵识别系统。另外,本文提出了句法依存关系和Wordnet相结合的句法相似性分类特征和语义角色分类特征来识别文本蕴涵关系。在基于集成方法的文本蕴涵识别算法中,首先,采用基于词汇相似度的文本蕴涵识别算法和基于SVM分类器的文本蕴涵识别算法判别文本蕴涵关系。最后,采用集成方法对这两种算法的文本蕴涵关系判别结果进行了有机地融合。基于词汇相似度的方法主要研究文本在表面字符串层面的相似度问题,采用了五种计算词汇相似度算法。它们是基于余弦相似度的文本蕴涵识别算法、基于最长公共子序列的文本蕴涵识别算法、基

5、于最短编辑距离的文本蕴涵识别算法、基于词汇重叠的文本蕴涵识别算法,以及基于跳跃间距相似度的文本蕴涵识别算法。文本蕴涵识别问题可被看作成一个二分类问题,本文采用支持向量机SVM分类算法设计实现文本蕴涵分类器。分类器的训练特征主要包括:词汇相似性特征、句法相似性特征、词汇语义相似性特征和句法语义相似性特征。实验结果表明:基于集成方法的文本蕴涵识别算法的识别性能优于基于词汇相似度的文本蕴涵识别算法和基于SVM分类器的文本蕴涵识别算法,更适用于文本蕴涵识别问题。关键词:自然语言处理;文本蕴涵;支持向量机;依存关系;语义角色标注I北京理工大学硕士学位论文AbstractTextua

6、lentailmentrecognitionisanimportantresearchareaofnaturallanguageprocessingandinformationextraction.Inordertosolvetheproblemofvariabilityofsemanticexpressionsinnaturallanguageprocessingandslotfillervalidation,thispaperstudiesandanalyzesthetechnologyoftextualentailmentrecognition.Theslotfil

7、lervalidationtrackfocusesontherefinementofoutputfromEnglishslotfillingsystemsbyeithercombininginformationfrommultipleslotfillingsystems,orapplyingmoreintensivelinguisticprocessingtovalidateindividualcandidateslotfillers.Inaddition,textualentailmentrecognitionisusefu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。