欢迎来到天天文库
浏览记录
ID:28061539
大小:18.01 KB
页数:5页
时间:2018-12-08
《多维社交网络中的社区发现算法研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。多维社交网络中的社区发现算法研究 摘要:多维社交网络中蕴含着多个维度的信息,若单独选择其中一维进行社区发现显然是不合理的。为解决这个问题,提出一种综合社交关系和兴趣相似的社区发现方法。首先研究用户的社交行为关系,定义用户社交强弱度,推出用户紧密度公式;然后使用主题模型研究用户博文主题特性,定义主题相似度公式;再推出用户总相关度公式,并用其计算节点间的传递概率,使用LabelPropagation算法对用户进行划分;最
2、终划分出综合用户社交联系紧密且兴趣相似的社区,在真实微博上验证该方法的合理性和有效性。 关键词:多维社交网络;微博;社区发现;主题模型;兴趣相似 中图分类号:TP393文献标识码:A文章编号:2095--00-04 0引言 新浪微博已经成为国内重要的社交网络,为了对社交网络进行分析[1],可以将网络画成图,图中的节点表示用户,图中的边表示用户的关系,这种网络中所表现出的结构称为社区结构[2,3]。社区发现可以研究社交网络中的社区结构[4],而且已发展成为数据挖掘领域中的热点。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课
3、外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 在社会媒体中,人们与其他人的联络比以前更方便。通过观察社会媒体上的用户行为,可以看到用户之间存在着多个以不同方式交互的网络。以微博为例,两个用户可以互相关注而建立“朋友”关系,也可以互相“评论”或“推荐转发”所发的微博,这些不同类型的行为方式会形成一个多维的社交网络。多维网络是指一个网络中的不同节点间有不同的联系方式,每一种联系方式构成一维网
4、络[5]。用户间的以上行为就构成了一个三维有向网络。同时,基于用户所发的博文、相互之间所讨论的内容以及共同关注的话题,利用LDA主题模型[6]挖掘出共同的兴趣爱好,衍生出第四维网络――兴趣相似网络。在这种多维网络中,若只考虑其中一维而进行社区发现是不准确的,因为仅仅一维很难概括出整个多维网络的信息,前人已提出或总结出一些经典的算法。K-L算法[7]由Kernighan和Lin提出,算法中定义了一个增益函数Q,然后用贪婪算法原理交换节点对,使Q值达到最大,最后划分出两个大小已知的社区,该算法的缺点在于只能划分出两个社区且必须知道这两个社区成员的数量;XX年,Girvan和Newman提出了GN算
5、法[8],GN算法是通过不断地移除介数最大的边,直到整个网络退化成一个社区为止,该算法的优点在于无需预先知道社区的数目,但其计算复杂度较高;Lei为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。Tang等[9]提出了先将多维网络集成,然后利用谱聚类方法、随机块模型方法或隐含空间模型将
6、上述集成后的网络进行社区划分,但缺点是都只能针对中等规模的无向网络,并不适于复杂的有向多维社交网络的社区发现。因此,为了能够在多维有向社交网络中进行准确有效的社区发现,本文提出了一种基于多维社交网络的社区发现方法,并采用真实的微博社交媒体网络[10]数据进行实验。实验结果表明,本文方法能够更加有效地进行社区发现。 1基于社交关系和兴趣相似的微博社区发现 微博的社交模式让交友更加便捷,用户与用户之间可以互相关注成为好友,也可以互相评论、转发、推荐取得联系。通常在社交网络中,互动频繁的用户更容易在一起,也更容易被划分到同一个社区;另外,微博中的用户喜欢发一些博文或者转发一些自己喜爱的微博,通过
7、分析博文主题可以找到相似性,而博文相似度较高的用户也更容易被划分到同一个社区。因此通过分析研究微博用户间的社交行为模式以及微博主题的相似性,即可归纳出用户社交关系紧密程度和主题相似程度。本文算法首先将三维有向网络融合成一维无向带权网络,并计算其紧密度;然后利用LDA模型计算出主题相似度;再使用用户总相关度公式计算每对用户的相关度,并将其作为网络图中节点间边的权值,最终发现社区。 社交关系紧密度计
此文档下载收益归作者所有