硕士论文——基于词向量的新闻事件追踪和相关性推断研究

硕士论文——基于词向量的新闻事件追踪和相关性推断研究

ID:31040635

大小:971.08 KB

页数:69页

时间:2019-01-05

硕士论文——基于词向量的新闻事件追踪和相关性推断研究_第1页
硕士论文——基于词向量的新闻事件追踪和相关性推断研究_第2页
硕士论文——基于词向量的新闻事件追踪和相关性推断研究_第3页
硕士论文——基于词向量的新闻事件追踪和相关性推断研究_第4页
硕士论文——基于词向量的新闻事件追踪和相关性推断研究_第5页
资源描述:

《硕士论文——基于词向量的新闻事件追踪和相关性推断研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文论文题目:(英文):基于词向量的新闻事件追踪和相关性推断研究NewsEventTrackingandCorrelationInferenceBasedonWordVector作者:指导教师:XX年X月X日中国人民大学硕士学位论文(中文题目)基于词向量的新闻事件追踪和相关性推断研究NewsEventTrackingandCorrelationInference(英文题目)BasedonWordVector作者学号:作者姓名:所在学院:信息学院专业名称:计算机应用技术导师姓名:论文主题词:词向量;话题追踪;事件侦

2、测;(3-5个)关系推断论文提交日期:摘要随着互联网的发展,人们每天接收到的新闻越来越多,如何从这些新闻里实时地侦测热点事件,以及如何进行事件的追踪成为研究的重点。热点事件是指在某个时间,发生在某地的受人们关注的事,而事件的追踪指的是把一段时间内,一系列相关事件聚合成话题,也被称为话题追踪。目前国内外有许多关于热点事件侦测和话题追踪的研究工作,工业界也已经出现类似的商业系统,例如百度新闻,必应资讯等,但大多数工作忽略了话题的粒度问题。另一方面,人们往往比较关注新闻中的命名实体,例如人名,地名等,如何根据新闻的实时性特点,给

3、出命名实体间的相关关系也是一个研究难点。本文的目标是基于新闻数据,实时的进行话题追踪以及相关性推断研究,包括话题中的相关事件关系展现,以及新闻中命名实体间的关系推断等。本文提出了基于关键词的话题追踪和多层级话题展示算法,在话题追踪的开始,就确定了此话题的聚类粒度,并且在不同的话题间形成了层级关系,可以向用户自由的推送相关层级的话题,通过对比试验得知,精确度好于传统的话题追踪模型。另一方面,本文针对新闻领域的相关性推断问题,首次提出了基于词向量的动态训练模型以及基于时间维度的一词多向量模型,利用训练后的词向量进行事件间关系展

4、现以及命名实体间的关系推断等。在数据抓取的基础上,本文实现了原型系统。此系统可以实时的抓取和抽取新闻数据,高效地进行热点事件侦测,在热点事件的基础上,实现了基于关键词的话题追踪和相关性推断算法,最后通过可视化方式把算法的最终效果展示给了用户。关键词:词向量;话题追踪;事件侦测;关系推断1AbstractWiththedevelopmentoftheInternet,peoplereceivemoreandmorenewseveryday,howtodetecthoteventsandtopictrackingfromthe

5、senewsinreal-timebecomefocusinresearch.Hoteventisthatatacertaintime,occurredinsomewhereinthelimelight,andeventtrackingreferstoclustersomerelatedeventswhichoccurredinsameperiodoftime,alsocalledtopictracking.Currentlytherearemanystudiesonhoteventdetectionandtopictra

6、cking,andtheindustryalsohasasimilarbusinesssystemssuchasBaidunews,Bingnewsetc.,butmostworkisneglectedtopicgranularity.Ontheotherhand,peopletendtofocusmoreonthenamedentitiesinnews,suchasnames,places,howtoshowrelationsbetweennamedentitiesbasedonreal-timenewsisalsoad

7、ifficulttask.So,goalofthispaperisbasedonreal-timenews,dotopictrackingandcorrelationinference,includingtherelationshipbetweeneventswhichinonetopic,aswellasinferrelationshipsbetweennamedentitiesinnews.Inthispaper,wepresentakeyword-basedtopictrackingandmulti-leveldis

8、playoftopicsalgorithm,atthebeginningoftopictracking,wewilldecidethegranularityofthetopic,andshowflexiblemulti-leveltopicstousers.Ontheotherhand,wepresen

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。