欢迎来到天天文库
浏览记录
ID:35183177
大小:5.87 MB
页数:70页
时间:2019-03-21
《知识库与语料库相结合的语义相似度的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学校化巧:10004密级:公开如#、交道乂爹BEIJINGJIAOTONGUNIVERSITY硕壬学位论文知识库与语料库相结合的语义相似度的研究与实现作者姓名脇伦顯学科专业软件工程m指导教师卢韦教授培养院系软件学院二零-六年四月"。泌节,邏如交4乂攀硕±学位论文知识库与语料库相结合的语义相似度的研究与实现ResearchandImplementationofSemanticSimilaritComutinbypgyC
2、omb-rus-iningKnowledebasedandCobasedMethodsgp作者;施凯伦导师:卢幸教授北京交通大学2016年4月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可レッ将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编W供査阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。学校可^为存在馆际[合作关系的
3、兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:知&导师签名:炸^签宇曰期:1//6年令月曰签字曰月6曰受::学校代码10004巧级公开北京交通大学硕壬学位论文知识库与语料摩相结合的语义相似度的研究与实现ResearchandImlementationofSemanticSimilaritComutinbpypgy-Comb-badMethodsiningKnowledebaseda
4、ndCorussegp2687作者姓名:1311:施凯伦学号导师姓名:教授:卢華职称学位类别;硕±;工学学位级别学科专业::软件工程研巧方向软件王程北京交通大学2016年4月I致谢本论文研巧工作得到了国家自然科学基金项目(No.61272353)的资助,首先在此表示感谢。本论文的研究工作是在导师卢羊教授的亲切关怀和悉屯、指导下完成的。卢羊老、严谨的治学精神深深感染和激励着我师严肃的科学态度;不倦的工作热情和科学的工作方法给了我极大的帮助
5、和影响。在这H年的时间里,卢幸老师在学习上和生活上都给予了我很大的关也和帮助,在此谨向卢韦老师致崇离的敬意和最衷也的感谢。本论文在研巧过程中,邢薇薇老师、车啸平老师、蔡圆媛博±也提出了许多的宝贵的意见和建议,拓宽了我的研巧思路,在此表示衷也的感谢。软件学院1301班的同学们对我论文中的研巧工作给予了热情的帮助,在此向他们表达我的感激一、之情。在这H年的时间里,我和你们起在学习上共同进步,生活上共同关屯,感谢你们对我的爱护、包容和帮助,愿友谊长存。感谢我亲爱的家人和朋友
6、,他们的关爱和支持是我人生道路上强大的动力,因为有了他们的理解和支持屯、,我才能够在学校专完成我的学业,在生活上更加从容地迎接困难和挑战。最后,感谢在百忙之中抽出时间参与我论文评审和答辩的各位老师。北京交通大学硕±学位论文摘要摘要一语义相似度计算作为自然语言处理的基础之,在词义消歧、机器翻译、拼写修正、文本分类和自动问答系统等领域有着广泛的应用。当前语义相似度计算方法主要有两个发展方向一,其是基于语料库的空间向量模型的相似度计算方法;其二是基于知识库结构的语义相
7、似度计算方法。词向量由大规模语料经过神经网,由于缺少语义信息很难计算词与词么间的内在关系络语言模型训练得到;知识库中包含了丰富的语义信息,能反映词与词之间的关系,但受制于语义词典的容量难W准确地计算文本之间的相似度。本文的创新点为在计算语义相似度时,结合了知识库与语料库的相似度计算方法,在词语的相似度计巧和短文本的相似度计算上取得了较好的成果。针对词语相似度的计算,本文分析了基于知识库和基于语料库的相似度计算方法的优劣之处并取长补短,提出了基于知识库与语料库相结合的语义相
8、似度计算方法。首先,基于连续词袋模型对语料库进行训练得到初始词向量,利用WordNet对词向虽进行语义信息加强,然后,通过最大相似度计算模型计算得到词与词之间的相似度值---H个基准数据集上进行了实始验,并在RG65、MC30和WS353证。针对短文本相似度的计算,本文引入了相似度矩阵方法作为短文本相似度计、算的主要方法,分别计巧短文本的基于知识库的相似度特征基于语料库的相似度特征、基于知识库与语料库相结合的相似度特征,在微软研巧院释义数
此文档下载收益归作者所有