基于微博影响力的评价模型(最终版)

基于微博影响力的评价模型(最终版)

ID:16261102

大小:1.07 MB

页数:29页

时间:2018-08-08

基于微博影响力的评价模型(最终版)_第1页
基于微博影响力的评价模型(最终版)_第2页
基于微博影响力的评价模型(最终版)_第3页
基于微博影响力的评价模型(最终版)_第4页
基于微博影响力的评价模型(最终版)_第5页
资源描述:

《基于微博影响力的评价模型(最终版)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于微博影响力的评价模型摘要本文研究的是微博用户和微博的影响力,以及最大好友圈和消息最佳发布问题。对于问题一,首先,我们查阅相关文献,基于已给数据将用户粉丝数量,用户和粉丝的活跃度,粉丝的专注度作为我们评价微博用户影响力的指标。根据这些指标,我们对题目所给表格中的数据进行统计,将得到的结果作为各个用户在各指标下得到的分数。然后,我们建立了熵权模型,将这些数据进行标准化处理,对各个指标的权重进行了计算,分别得到了在不同人数的微博环境下各指标在评价用户影响力时所占权重。最后,将各指标下分数与权重相乘,再将各个用户的所有指标分数求和得到最终用户影响力评

2、分。将其排序筛选后,得到影响力最大的十个大V编号。对于问题二,首先,在问题一所建立模型的基础上,我们确立了将微博被转发次数和转发人的影响力作为我们评价微博影响力的指标。然后,我们统计了各条微博在各指标下的数据。其次,我们利用熵权模型将数据标准化处理,并求出了这两个指标在评价微博影响力时所占权重。最后,我们将各微博各指标下分数与权重相乘,并将所有指标分数求和得到最终微博影响力评分。将其排序筛选后,得到影响力最大的十条微博消息。对于问题三,首先,我们根据题目对于好友圈的定义,将M={(i,j)}定义为关注情况矩阵,即第j用户关注第i用户的情况。进而将

3、多人相互关注的关系用函数关系式表达出来,将所有符合条件的用户编号写入矩阵中。然后,先通过对符合两两关注情况的用户进行筛选,再从筛选好的用户中逐步添加用户,判断是否为三人相互关注,四人相互关注,直至好友圈内不能再添加人为止。此时的好友圈为最大好友圈。最后,我们通过循环算法实现上述过程,得到了2000人微博环境下10人为最大好友圈,10000人微博环境下13人为最大好友圈,并求出了好友圈中所有用户的编号。对于问题四,我们将其转化为优化问题,建立了0-1规划模型处理。首先,将用户发布消息与微博用户之间相互关注的情形转化为0-1矩阵(0表示用户未发布消息

4、或表示微博用户之间未相互关注,1则反之),分别表示为x和A。这样若某用户能看到消息,则x与A转置后的矩阵乘积大于等于1。然后,我们将其推广至所有用户,将该问题转化为目标函数为发布消息的人数最少,约束条件为x与A转置后的乘积全部大于等于1的优化问题。最后,我们通过matlab中自带的遗传算法求得最小用户数。但发现效果并非很好。又采用了贪婪算法,求得了2000人微博环境下发布该消息的用户数最少为93人,10000人微博环境下则为249人。本文建立的模型在已有文献的基础上有一定的改进,求解算法科学,定位速度更快,定位精度更高,有一定的实用和推广价值。关

5、键词:微博影响力熵权模型遗传算法贪婪算法291问题重述1.1问题背景微博,作为互联网上新兴应用,由于智能手机的普及,使得其运用变得极其方便,从而吸引了大量的注意力。而微博上的大V用户往往有着很大的影响力,如何正确而有效的评价用户影响力是需要关注的应用问题之一。1.2数据集数据文件data1.xls和data2.xls分别包含了当用户总量为2000和10000时这些用户的相互关注数据,每一行为该行号对应的用户对其它用户的关注信息。数据文件data3.xls和data4.xls分别为当用户总量为2000和10000时这些用户发布或转发的消息数据,每一

6、行为该行号对应的用户发布或转发的消息编号。1.3提出问题根据上述问题背景及数据,题目要求我们建立数学模型讨论下列问题。(1)对具有较大影响力的大V定义合适的影响因子,并且找出影响力最大的十个大V。(2)某些微博消息,被大量的用户关注和转发,因而具有很大的影响,请找出影响力最大的十条消息。(3)在微博中,相互关注的用户被称为好友,对于一个群体,如果他们相互之间均为好友,则称为好友圈,请找出人数最多的好友圈。(4)假设一微博用户发布的消息,其粉丝都会看到,如果要发布一则消息,确保所有用户都能看到(不考虑转发),请选择一种发布该消息的用户数最少的方案。

7、2模型假设(1)用户之间不会因为消息的转发而对消息的原创者进行关注,即关注是在初始状态下不会改变的。(2)忽略各条微博影响力的时效性,即微博影响力随时间是不变的。(3)假设所有用户均非长期不上线用户。(4)不考虑同一用户多次转发同一消息的情况。(5)用户只能由关注对象发布后才能看到或转发消息。293符号说明第个微博用户或微博消息的第个指标标准化后的值为熵权法模型中所得的第个指标的权重第个微博用户或微博消息的第个指标的最终分数第j列数据所属指标的熵值第i个微博用户与第j个微博用户建立起的关注矩阵注:其余符号在文中使用时说明。4问题分析4.1问题一问

8、题一要求我们分别在2000人和10000人的微博环境下,对用户的影响因子进行定义,并筛选出影响力前十的用户。首先,经查阅文献[1],并基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。