基于维基百科的人物关系抽取研究

基于维基百科的人物关系抽取研究

ID:35106436

大小:7.57 MB

页数:71页

时间:2019-03-18

基于维基百科的人物关系抽取研究_第1页
基于维基百科的人物关系抽取研究_第2页
基于维基百科的人物关系抽取研究_第3页
基于维基百科的人物关系抽取研究_第4页
基于维基百科的人物关系抽取研究_第5页
资源描述:

《基于维基百科的人物关系抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、與交4#賴IA硕巧业学位论文,mM基于维基百誦人物关斜顺研究?H|工程领域计算机技指导教师徐金安副教授批交遺乂聲硕±专业学位论文基于维基百科的人物关系抽取研究民esea’ichonPersona民elationExtractlionbasedonWikiediap作者:刘博佳导师:徐金安北京交通大学2016年6月学位论文版权使用授权书本学位论文作者完全了解北巧交通乂学有关保留。特、使用学位论文的规定授权北京交通大学可W将学位论文的全部或部分内容编入有关数据库进行检索,レ提供阅览服务,并采用

2、影印、缩印或扫描等复制手段保存、汇编ッ供查阅和借阅。同念学校向図家有关部口或祝构送交论文的复印件和磁盘。学校可W为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:心导师签名:1哀1鸿输啥杂—签字日期?/^^/:山《年月公日签字日期:2占年月之r日.密级:公W学校代码loool:北京交通大学硕:t专业学位论文基于维基百科的人物关系抽取研究ResearchonPersonalRelationExtractionbasedonWikipedia作

3、者姓名:刘博佳学号:14125181:导师姓名:徐金安职称副教授:王程硕±专业领域:计算机技术学位级别硕i北京交通大学2016年6月i致谢两年的硕±生活即将结束,在这段时间里化学习能力与生活态度上,我都收获了很多一。这期间每点滴的成果和收获都离不开老师的淳淳教导、同n师兄师、,弟们的热屯帮助、同学朋友的鼓励tu及家人的支持和陪伴,在此我想和大家说^""句谢谢你们。、感谢我的导师徐金安副教授,从大二开始,您就悉屯教导我,引导我学习了、、自然语言处理研究中很多有趣的方向,您开阔的视野严谨的治学态度科学的工作方法给了

4、我极大的帮助和影响,教导我如何做科研,如何做人。在此衷也感谢四年多来您对我的关也和指导。陈娃枫副教授对于我的科研工作和论文都提,出了许多的宝贵意见,她渊博的知识和严谨的治学态度让我感触很深在我遇到。困难迷悄时,她的体贴开导常常使我感到温暖,感谢她的指导和帮助在实验室学习、工作及撰写论文期间,罗特等同实验室的同学对我论文中的研巧和撰写工作给予了热情帮助和指导,与我相互陪伴度过了很多实验室中的曰一夜,感谢他们的无私帮助,。感谢实验室的杨茜与高梓豪等同学与你们起写论文的时光我将终生难忘。、、。衷甘感谢我的父母,是他们的理解和支持使我能够在学校

5、专屯完成我的学业最后,业上我还要由衷地感谢计算机学院的各位老师和同学,感谢他们在学和生活上对我的帮助和指导。ii北京交遁大学硕±专业学位论文im摘要-在信息抽取研究工作中,人物关系抽取是个重耍的研究课题。针对人物关系抽取的研究工作兴起于MUC会议的评测项H,后来由ACE会议取代。目前,大部分的中文人物关系研究工作所用语料,大都是来自ACE会议的结构化评测语料或者人民日报等较为规范的新闻语料,特别是在互联网时代,。但在现实应用中人们越来越习惯从互联网中检索想要了解的人物、事件等信息,维基百科就是其一一中个常用的捜索引擎,。维基百科是

6、个开放的知识库它包含了丰富的人物关系信息一,同时,它也是个较符合网络文本半结构化特点的知识库。因此,基于维基百科的人物关系抽取与实际生活中的人物关系抽取更为相似。人物关系抽取的主要思想是将其转化为人物关系分类问题。传统的抽取方法主要分为基于知识库、基于机器学习和基于模式匹配。在基于机器学习的方法中又主耍分基于核与基于特征向量的分类方法。在人物关系抽取的过程中的两个主要难点是人名识别和人物关系识别。针对上述难点,本文提出了相应的解决办法,具有W下创新点:(1为解决现有分词工具在人名识别中存在的外文音译人名识别率不高的问)题,本文采用抽取维

7、基百科中信息盒数据的方法,构建了基于中文维基百科的人物库ink;同时利用维基百科中的L数据构建了基于中文维基百科的外文音译人名词典;口)本文提出采取模式匹配与特征向量方法融合的层次分类方法进行人物关系分类-VMs多值分类方法解决人物关系分类中的多值分类问题^提,利用DAGS,1高分类模型执行速度与性能,,同时在人物关系的划分中引入本人关系tU减轻维基""百科中存在的同人不同名的现象;并通过实验验证了此方法的可行性。一个规模可观的维基百科人物库与人名词典本文利用提出的方法构建了。同时经过实验验证,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。