基于微博的局部社交网络构建及热点人物提取方法研究

基于微博的局部社交网络构建及热点人物提取方法研究

ID:35064891

大小:3.02 MB

页数:59页

时间:2019-03-17

基于微博的局部社交网络构建及热点人物提取方法研究_第1页
基于微博的局部社交网络构建及热点人物提取方法研究_第2页
基于微博的局部社交网络构建及热点人物提取方法研究_第3页
基于微博的局部社交网络构建及热点人物提取方法研究_第4页
基于微博的局部社交网络构建及热点人物提取方法研究_第5页
资源描述:

《基于微博的局部社交网络构建及热点人物提取方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、■分类号密级UDC硕i学位论文基于微博的局部社交网络构建及热点人物提取方法研究:彭彪作者姓名—:W点k学科、专业:计算机软件与理论叩苗P巧I围。。1学号:21201308Jitfill"fiHHBr:':-指导教师卓>杜亚革、、‘完成日期:二^.,,^^^^^為西华大学学位论文独创性声明:作者郑重声明所呈交的学位论文,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中&经注明引用巧容和致谢的地方外,本论文

2、不包含其他个人或集体己经发表的研究成果,也不包含其他己申请一学位或其他用途使用过的成果。与我同工作的同志对本研究所做的贾献均己在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。学位论文作者齡指导補齡:日期:曰期。6‘7如西华大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,在校攻读学位期间论文工作的知识产权属于西华大学,同意学校保留并向国家,有关部口或机构送交论文的复印件和电子版允许论文被查阅和借阀,西

3、华大学可臥将本论文的全部或部分巧容编入有关数据库进行检索,可於采用影印、缩印或扫描等复印手段保存和汇编本学位论文。(保密的论文在解密后遵守此规定)学位论文作者签名指导教师签名U曰期:日期>,U、7ClassifiedIndex:UDC:XihuaUniversityMasterDegreeDissertationTheMethodofLocalSocialNetworkConstructionandFocusingPersonaeExtractioninMicroblo

4、gCandidate:BiaoPengMajor:ComputerSoftwareandTheoryStudentID:212013081202001Supervisor:YajunDuApril,2016摘要随着互联网时代的到来,网络渐渐地融入人们的生活。许多网民通过互联网进行购物、交友、学习等日常活动,它已经成为人们生活中十分重要的一部分。在人们的互联网生活中,网络社交平台,如:新浪微博、腾讯微博、Twitter等,已经成为了众多网民较为活跃的场所。人们可以在这些社交平台中结交新朋友,并与其他

5、用户分享他们感兴趣的文字、图片、视频等信息,而这些被用户发布的信息在一定程度上反映出了用户的行为习惯和兴趣爱好。就目前来说,社交数据具有内容简短、数量庞大、实时性高等特点,因此从海量社交数据中挖掘出有效的信息是数据挖掘领域的一大挑战。面对着大量的社交平台用户数据,构建用户的社交图谱和兴趣图谱是提高社交网络中社交搜索质量的关键。针对与上述问题,为了有效地构建出用户的社交图谱和兴趣图谱,本文的主要研究内容包含有以下几点:1.本文基于链路预测(LinkPrediction)的思想,通过改进FriendL

6、ink(FL)算法,提出了活跃朋友的预测算法(ActiveFriendPrediction,AFP)。为了适用于微博这类拥有稀疏的用户属性信息的在线社交平台,本文将用户的在线社交网络抽象为有向图(其中节点代表用户、边代表用户之间存在关系),通过图的局部链路特征来分析用户之间的相似度。本文提出了节点活跃系数的概念,即利用各个节点的出度和入度,通过它们的比值来刻画节点的活跃程度,进而从用户的社交网络图中筛选出行为活跃的用户。同时结合社交网络图的节点之间的链路结构相似度来计算出节点的活跃度评分,从而根据

7、该评分提取出与用户有潜在关系的活跃间接邻居,并利用这些节点构建出用户的高活跃度局部社交网络,即用户的社交图谱。2.本文提出了用户关注的隐式和显式热点人物提取算法(FocusingPersonaeExtractionalgorithm,FPE)。微博是一种以短文本为信息载体的社交平台,虽然微博文本包含着用户关注的人物实体,但是,这些文本中总是充斥着大量的噪声信息。因此,本文从用户及其社交图谱中的用户所发表的微博中提取出人物实体,根据目标用户社交图谱中用户的活跃度评分以及包含了相关的人物实体的微博条数

8、,从而计算出用户对人物实体的关注度,并将具有较高关注度的人物实体作为热点人物构建出用户的热点人物兴趣图谱。此外,该方法还可以用来提取整个局部社交网络中被关注的热点人物。最后,本文通过对比实验的方式,比较了不同的基于链路的节点相似度计算方法与本文改进的算法在精确度、召回率、F值以及时间效率上的差异,并且分别在基于不同的链路预测算法所构建出的目标用户社交图谱中提取用户关注的热点人物。最终实验证明,本文改进的节点评分计算方法较其他方法来说有较高的精确度、召回率、F值,此I外本文提出的隐式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。