面向社会安全事件的知识图谱构建方法研究

面向社会安全事件的知识图谱构建方法研究

ID:23618398

大小:2.90 MB

页数:69页

时间:2018-11-09

面向社会安全事件的知识图谱构建方法研究_第1页
面向社会安全事件的知识图谱构建方法研究_第2页
面向社会安全事件的知识图谱构建方法研究_第3页
面向社会安全事件的知识图谱构建方法研究_第4页
面向社会安全事件的知识图谱构建方法研究_第5页
资源描述:

《面向社会安全事件的知识图谱构建方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391单位代码:11232密级:工学硕士学位论文面向社会安全事件的知识图谱构建方法研究学院:计算机学院学科(专业):网络信息检索与内容理解学号:2015020260作者:郭正斌指导教师:张仰森教授完成日期:二零一八年四月十四日学位论文版权使用授权书本人完全了解北京信息科技大学关于收集、保存、使用学位论文的规定,按照学校要求提交学位论文的印刷本和电子版本。学校有权保留学位论文并向中国科学技术信息研究所等国家主管部门或其指定机构送交论文的电子版和纸质版,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学

2、位论文。学校有权适当复制、公布论文的全部或部分内容。学校有权将本人的学位论文加入《中国优秀硕士学位论文全文数据库》和编入《中国知识资源总库》。学位论文作者签名:年月日□公开□保密(____年____月)(保密的学位论文在解密后应遵守此协议)指导教师签名:学位论文作者签名:年月日年月日硕士学位论文原创性声明本人郑重声明:所呈交的论文题目为《面向社会安全事件的知识图谱构建方法研究》学位论文,是本人在导师指导下,进行研究工作所取得的成果。尽我所知,除了文中特别加以标注的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没

3、有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明并表示了谢意。本学位论文原创性声明的法律责任由本人承担。作者签字:年月日摘要摘要互联网是一把双刃剑,既满足了人们的信息需求,又引发了越加严重的网络安全问题。本文所研究的社会安全事件属于在网络上传播的信息内容安全事件,是网络空间安全的一部分。社会安全事件快速传播所引发的网络舆情,可能会引起社会负面影响和破坏党政机关形象,影响社会稳定。知识图谱通过整合实体、概念以及它们之间的关系为数据的关联分析奠定基础,帮助研究人员通过实体或概念之间的

4、关系实现对事件之间关系的研究。构建社会安全事件知识图谱,对于以事件信息为基础,挖掘社会安全事件内部以及事件之间的多元化关系,具有十分重要的意义。本文开展了面向社会安全事件的知识图谱构建方法研究,研究内容包括以下五个方面:(1)社会安全事件的结构化数据资源建设方法研究完成了基于百度百科的数据资源库建设。提出了百度百科词条的数据获取、解析、存储方法,实现了Neo4j图数据库的节点、关系、属性等信息存储。提出了社会安全事件数据资源库的层次设计,完成了词向量库、Json格式资源库和Neo4j数据库的构建。(2)命名实体识别方法研究研究基

5、于深度学习模型的命名实体识别,提出了两种基于双向LSTM模型的命名实体识别优化模型——强化中心字模型和强化逆向序列模型。强化中心字模型通过并列添加一个输入序列为中心字的神经网络模型,实现对当前序列窗口核心字的优化,F1值达到了97.16%。强化逆向序列模型通过强化逆向序列对神经网络模型的贡献作用,实现对逆向序列的优化,F1值达到了97.27%。实验结果表明,两种优化模型都能提升命名实体识别的效果。(3)实体关系抽取方法研究提出了基于命名实体词性的关系抽取优化模型——词向量优化模型和并列结构优化模型,实现了基于依存句法分析的开放式

6、关系抽取。基于命名实体词性的关系抽取优化模型,解决了传统深度学习模型无法学习词性特征的问题。词向量优化模型是在词向量的基础上添加词性向量,并列结构优化模型是通过并列结构学习句子中实体对的词性。基于并列结构的实体词性优化模型,在CNN、LSTM、GRU模型方面取得了很好的效果,F1值分别提升了12%、6.96%、6.07%。基于依存句法分析的关系抽取能够实现基于定中关系的名词短语识别和基于主谓宾成分的实体关系抽取。实验结果表明,开放式关系抽取取得了不错的效果。(4)事件摘要生成方法研究I摘要研究基于TextRank算法的摘要自动生

7、成,提出了基于TextRank和句子综合相似度的摘要生成模型。句子综合相似度整合词形相似度、统计相似度、语义相似度,解决了句子摘要冗余问题,提升了摘要抽取的效果。(5)事件知识图谱系统的设计与实现设计了系统的总体框架和子模块的功能架构,实现了事件知识图谱系统。基于Webcollector爬虫框架、依存句法分析、TextRank算法、Neo4j图数据库等技术,设计和实现了系统功能,完成了事件知识图谱的构建。关键词:知识图谱;命名实体识别;关系抽取;摘要生成;深度学习IIABSTRACTABSTRACTInternetisadoub

8、le-edgedsword,whichnotonlysatisfiespeople'sinformationneeds,butalsoraisesseriousnetworksecurityissues.Thesocialsecurityeventstudied

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。