欢迎来到天天文库
浏览记录
ID:50117866
大小:2.19 MB
页数:65页
时间:2020-03-06
《基于集成方法的文本蕴涵识别.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于集成方法的文本蕴涵识别梅荣月2015年1月中图分类号:TP391UDC分类号:004基于集成方法的文本蕴涵识别作者姓名梅荣月学院名称计算机学院指导教师张春霞副教授答辩委员会主席樊孝忠教授申请学位工学硕士学科专业计算机科学与技术学位授予单位北京理工大学论文答辩日期2015年1月AnIntegratedMethodtoRecognizeTextualEntailmentCandidateName:RongyueMeiSchoolorDepartment:SchoolofComputerScienceFacultyMentor:A.P.ChunxiaZhangChair,T
2、hesisCommittee:Prof.XiaozhongFanDegreeApplied:MasterofEngineeringMajor:ComputerScienceandTechnologyDegreeby:BeijingInstituteofTechnologyTheDateofDefence:January,2015研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京理工大学或其它教育机构的学位或证书所使用过
3、的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学硕士学位论文摘要文本蕴涵识别是自然语言处理和信息抽取领域中的重要研究问题。在自然语言处理研究中,人们经常会遇到同义异形问题,即语义表达多样性问题。文本蕴涵识别可用于解决自然语言语义表达多样性问题和属性值知识验证问题。语义表达多样性问题是指相同的含义可以使用多种不同的语句表现出来。属性值知识验证问题是用来验证属性值抽取系统的输出结果是否正确。另外,文本蕴涵识别在问答系统、多文档自动摘要、信息抽取、语义检索以及机器翻译评测等多个自然语言处理领域应
4、用中起着至关重要的作用。本文提出了一种基于集成方法的文本蕴涵识别算法,并开发了文本蕴涵识别系统。另外,本文提出了句法依存关系和Wordnet相结合的句法相似性分类特征和语义角色分类特征来识别文本蕴涵关系。在基于集成方法的文本蕴涵识别算法中,首先,采用基于词汇相似度的文本蕴涵识别算法和基于SVM分类器的文本蕴涵识别算法判别文本蕴涵关系。最后,采用集成方法对这两种算法的文本蕴涵关系判别结果进行了有机地融合。基于词汇相似度的方法主要研究文本在表面字符串层面的相似度问题,采用了五种计算词汇相似度算法。它们是基于余弦相似度的文本蕴涵识别算法、基于最长公共子序列的文本蕴涵识别算法、基
5、于最短编辑距离的文本蕴涵识别算法、基于词汇重叠的文本蕴涵识别算法,以及基于跳跃间距相似度的文本蕴涵识别算法。文本蕴涵识别问题可被看作成一个二分类问题,本文采用支持向量机SVM分类算法设计实现文本蕴涵分类器。分类器的训练特征主要包括:词汇相似性特征、句法相似性特征、词汇语义相似性特征和句法语义相似性特征。实验结果表明:基于集成方法的文本蕴涵识别算法的识别性能优于基于词汇相似度的文本蕴涵识别算法和基于SVM分类器的文本蕴涵识别算法,更适用于文本蕴涵识别问题。关键词:自然语言处理;文本蕴涵;支持向量机;依存关系;语义角色标注I北京理工大学硕士学位论文AbstractTextua
6、lentailmentrecognitionisanimportantresearchareaofnaturallanguageprocessingandinformationextraction.Inordertosolvetheproblemofvariabilityofsemanticexpressionsinnaturallanguageprocessingandslotfillervalidation,thispaperstudiesandanalyzesthetechnologyoftextualentailmentrecognition.Theslotfil
7、lervalidationtrackfocusesontherefinementofoutputfromEnglishslotfillingsystemsbyeithercombininginformationfrommultipleslotfillingsystems,orapplyingmoreintensivelinguisticprocessingtovalidateindividualcandidateslotfillers.Inaddition,textualentailmentrecognitionisusefu
此文档下载收益归作者所有