知识库与语料库相结合的语义相似度的研究与实现

知识库与语料库相结合的语义相似度的研究与实现

ID:35183177

大小:5.87 MB

页数:70页

时间:2019-03-21

知识库与语料库相结合的语义相似度的研究与实现_第1页
知识库与语料库相结合的语义相似度的研究与实现_第2页
知识库与语料库相结合的语义相似度的研究与实现_第3页
知识库与语料库相结合的语义相似度的研究与实现_第4页
知识库与语料库相结合的语义相似度的研究与实现_第5页
资源描述:

《知识库与语料库相结合的语义相似度的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校化巧:10004密级:公开如#、交道乂爹BEIJINGJIAOTONGUNIVERSITY硕壬学位论文知识库与语料库相结合的语义相似度的研究与实现作者姓名脇伦顯学科专业软件工程m指导教师卢韦教授培养院系软件学院二零-六年四月"。泌节,邏如交4乂攀硕±学位论文知识库与语料库相结合的语义相似度的研究与实现ResearchandImplementationofSemanticSimilaritComutinbypgyC

2、omb-rus-iningKnowledebasedandCobasedMethodsgp作者;施凯伦导师:卢幸教授北京交通大学2016年4月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可レッ将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编W供査阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。学校可^为存在馆际[合作关系的

3、兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:知&导师签名:炸^签宇曰期:1//6年令月曰签字曰月6曰受::学校代码10004巧级公开北京交通大学硕壬学位论文知识库与语料摩相结合的语义相似度的研究与实现ResearchandImlementationofSemanticSimilaritComutinbpypgy-Comb-badMethodsiningKnowledebaseda

4、ndCorussegp2687作者姓名:1311:施凯伦学号导师姓名:教授:卢華职称学位类别;硕±;工学学位级别学科专业::软件工程研巧方向软件王程北京交通大学2016年4月I致谢本论文研巧工作得到了国家自然科学基金项目(No.61272353)的资助,首先在此表示感谢。本论文的研究工作是在导师卢羊教授的亲切关怀和悉屯、指导下完成的。卢羊老、严谨的治学精神深深感染和激励着我师严肃的科学态度;不倦的工作热情和科学的工作方法给了我极大的帮助

5、和影响。在这H年的时间里,卢幸老师在学习上和生活上都给予了我很大的关也和帮助,在此谨向卢韦老师致崇离的敬意和最衷也的感谢。本论文在研巧过程中,邢薇薇老师、车啸平老师、蔡圆媛博±也提出了许多的宝贵的意见和建议,拓宽了我的研巧思路,在此表示衷也的感谢。软件学院1301班的同学们对我论文中的研巧工作给予了热情的帮助,在此向他们表达我的感激一、之情。在这H年的时间里,我和你们起在学习上共同进步,生活上共同关屯,感谢你们对我的爱护、包容和帮助,愿友谊长存。感谢我亲爱的家人和朋友

6、,他们的关爱和支持是我人生道路上强大的动力,因为有了他们的理解和支持屯、,我才能够在学校专完成我的学业,在生活上更加从容地迎接困难和挑战。最后,感谢在百忙之中抽出时间参与我论文评审和答辩的各位老师。北京交通大学硕±学位论文摘要摘要一语义相似度计算作为自然语言处理的基础之,在词义消歧、机器翻译、拼写修正、文本分类和自动问答系统等领域有着广泛的应用。当前语义相似度计算方法主要有两个发展方向一,其是基于语料库的空间向量模型的相似度计算方法;其二是基于知识库结构的语义相

7、似度计算方法。词向量由大规模语料经过神经网,由于缺少语义信息很难计算词与词么间的内在关系络语言模型训练得到;知识库中包含了丰富的语义信息,能反映词与词之间的关系,但受制于语义词典的容量难W准确地计算文本之间的相似度。本文的创新点为在计算语义相似度时,结合了知识库与语料库的相似度计算方法,在词语的相似度计巧和短文本的相似度计算上取得了较好的成果。针对词语相似度的计算,本文分析了基于知识库和基于语料库的相似度计算方法的优劣之处并取长补短,提出了基于知识库与语料库相结合的语义相

8、似度计算方法。首先,基于连续词袋模型对语料库进行训练得到初始词向量,利用WordNet对词向虽进行语义信息加强,然后,通过最大相似度计算模型计算得到词与词之间的相似度值---H个基准数据集上进行了实始验,并在RG65、MC30和WS353证。针对短文本相似度的计算,本文引入了相似度矩阵方法作为短文本相似度计、算的主要方法,分别计巧短文本的基于知识库的相似度特征基于语料库的相似度特征、基于知识库与语料库相结合的相似度特征,在微软研巧院释义数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。