微博社交网络中用户群体关系挖掘和群体行为研究

微博社交网络中用户群体关系挖掘和群体行为研究

ID:6082974

大小:35.50 KB

页数:11页

时间:2018-01-02

微博社交网络中用户群体关系挖掘和群体行为研究_第1页
微博社交网络中用户群体关系挖掘和群体行为研究_第2页
微博社交网络中用户群体关系挖掘和群体行为研究_第3页
微博社交网络中用户群体关系挖掘和群体行为研究_第4页
微博社交网络中用户群体关系挖掘和群体行为研究_第5页
资源描述:

《微博社交网络中用户群体关系挖掘和群体行为研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、微博社交网络中用户群体关系挖掘和群体行为研究  CommunityRelationshipMiningandBehaviorAnalysisforaMicroblog中图分类号:TP391文献标志码:A文章编号:1009-6868(2014)01-0011-003摘要:提出了一种基于权重属性的图聚类方式。该图聚类方式在图聚类的基础上,考虑了每个节点的不同属性,并根据影响度给属性分配权重,从而在依据亲密度构建的网络拓扑图上进行图聚类的修正。实验证明,该方法更符合实际的群体聚合方式。关键词:社群挖掘;图聚类;相似

2、度计算Abstract:Thispaperproposesagraph-clusteringalgorithmbasedonattributeinformation.Theattributes(andtheirweights)ofeachnodeareconsideredinthismodelwhenmodifyingthenetworktopologybasedonintimacy.Experimentsshowthatthemodifiedalgorithmisclosertotheactualgroup

3、polymerization.Keywords:communitydetection;graphclustering;similaritycalculation11社交网络发展势头强劲,微博更是一个强大的社交平台。名人们纷纷开启了认证微博,相互关注顿时拉近了陌生人在网络空间中的距离。随着智能终端性能的突破性革新,社交平台向着移动互联网络进军。中国互联网络信息中心(CNNIC)发布的第32次《中国互联网络发展状况统计报告》中显示2013年具有微博的网民数已达33077万人,社交网站的网民数已达28880万人。对

4、比使用率与增长率,微博的发展势头超过了传统的社交网站。与往年数据对比发现,传统社交网站的用户大批量转战到微博,这主要是因为微博用户只需要即时即地的输入简短的文字信息或者上传图片就可以公开发布状态,支持原创,更快速更便捷地反映微博用户的情感等各方面资讯,关注、@等功能增强了微博用户之间的互动。11从网络营销角度看,微博不仅成为用户社交生活的网络工具,也成为传统网络与移动互联网的营销基地,在普通微博用户的博文被感知程度低的情况下,以营销为目的的博文却在潜移默化地培养着客户群,然而这样的客户群是可以依靠群体挖掘技术

5、实现的。因此,需要自适应隐式或显示的在海量微博用户中组件群组。基于微博的信息挖掘是实现微博资源多重利用的技术手段,本文主要依据六度空间理论,研究传统社交网络中群组机制在微博社交网络中的移植性,研究群体关系的挖掘方案与行为,在依靠用户兴趣模聚类获取到的网络拓扑结构后依靠节点的属性矩阵进行初始拓扑结构的重分割。1微博社交网络相关工作社交网络不同于普通的静态网络,社交网络中的网络结构随着时间变化而不断发生变化,一定程度上反映真实世界的状况。微博社交的即时即地性能够更好地反映网络与现实世界的关联。社会性网络中普遍存在

6、群体现象,可以把网络结构中连接紧密的节点集命名为群体,类似于“好友圈”的显示群体,群体与群体之间通过关键节点互联被称为稀疏网络,社交性网络中的群体挖掘主要有相似度计算和图聚类两方面的研究热点。(1)基于相似度的社会群体挖掘11网络在时间维度上的动态性,文献[1]提出的网络相似性度量方法,在基于图形结构的基础上计算用户的概要信息与语义信息,用户的概要信息主要以标签记录为主,通常在用户申请账号时生成静态的文本,这样计算出的相似度与网络拓扑结构缺乏动态性。相似度计算就是计算用户之间的相似情况,依靠计算每两个用户之间

7、的相似度来构建网络拓扑结构,将大型网络社区分割成一个个具有关联性的小型的群体。在文献[2]中提出了一种新的协同过滤的用户相似度计算算法,但没有将其扩展到社交网络。文献[3]用监督式学习方法构建了一个关系相似度模型,利用关系特性与非关系特性以及两个核心用户与其所在的社区信息,实现高度准确的好友推荐。(2)社交网络的图聚类技术图挖掘方法是社会性复杂网络分析的重要方法,主要是将网络中的个体分别用节点表示,形成复杂的网络图。节点之间采用直线连接的通常表示节点之间的某种关系,节点之间的距离计算公式直接影响到聚类的结果。

8、欧几里德距离与曼哈坦距离不能直接用在节点距离的计算中,坐标的缺少使得节点间的距离不能直接采用欧几里得距离和曼哈坦距离。实验证明采用k-medoids算法时,相比随即漫步距离算法与最短路径算法,在数据库系统和逻辑编程(DBLP)数据集形成的网络图的子图中最短距离算法的聚类结果更为合理[4]。Kohout与Nerda认为可以通过一个有向图模型将社交网络中的用户分到集群中去,他们分析了几个不同的遗传算子,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。