社交圈子发现.doc

社交圈子发现.doc

ID:53241521

大小:402.00 KB

页数:13页

时间:2020-04-02

社交圈子发现.doc_第1页
社交圈子发现.doc_第2页
社交圈子发现.doc_第3页
社交圈子发现.doc_第4页
社交圈子发现.doc_第5页
资源描述:

《社交圈子发现.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、自我网络研究摘要人们的自我网络很大,并且很杂乱,目前没有一种有效的方式来对自我网络进行组织。社交网站允许用户把他们的朋友以及亲人手动分配到他们的社交圈子里。(比如在google+,推特或者是脸书上),但是,当网络用户量增加的时候,他们必须对他们自己构建的社交圈子进行更新以及重新构造。在本文中,我们研究了一种自动识别社交圈子的方法,我们提出了一种利用聚类的方法对用户的个人网络中的互相之间的关系进行分析,并且还开发出了一个模型来检测圈的结构以及圈中的用户信息。对于每一个圈子,我们都要了解圈子中的成员以及确定用户的轮廓相似性度量。这个模型允许节点也就是用户存在于多个圈子,

2、也允许圈子的重叠以及分层嵌套。实验表明,我们的模型能够准确的从各种社交网络上准确的识别不同的数据,并且我们所用的都是真实的数据。1、介绍线上的社交活动允许我们能够浏览我们的成千上百的朋友以及熟人所发的帖子。这些我们所关注的人能够产生海量的信息,我们必须采用适当的方法来处理这些过量的信息,并且我们应该把我们的这些朋友分类到我们称之为社交圈的圈子中。几乎所有的社交网络都有上述的功能,例如facebook以及推特。一旦用户创建了他的社交圈,他们也就能够对内容过滤、对隐私进行保护、以及与其他希望跟随他们的帖子的人建立交流小组。一个个人网络的例子如图1所示。这些网络的所有者可

3、以通过与他们所关注的人的共同的节点或者属性来形成一个新的圈子。在这个例子中,社交网络的所有者只是想要与他在科学社的朋友们一起分享TDKK的文章,并且只想与他们的家人分享家里宝宝的照片,同时还不想让他们的高中同学发的内容在主页上显示太多。这些就是我们所谓的社交圈的功能。图1社交网络例子图1:这是一个带标签个人网络。社交圈的主人与圈中的每一个人都是好友的关系。每个人都可能属于任何一个圈子,也可能没有圈子。我们旨在发现圈中的成员并且找到一个圈中的成员的共同属性。这个网络展示了我们的数据中的一种典型的行为:大约有百分之25的我们的社交圈完全被包括在其他的圈子中,大约有百分之

4、50的圈子与其他的圈子有重叠,还有百分之二十五的圈子与其他的圈子没有任何交集。现在,这些社交网络上用户通过手动的方式或者天真的通过他们的朋友的共同属性来划分他们的社交圈子。不论哪一种方法,都达不到一个特别令人满意的结果:第一种方法费时费力,而且当用户的朋友增加的时候他没有一种自动更新的机制,而后面一种方法不能补货用户的社交团体信息,并且当信息丢失的时候就可能不能完全的实现他的功能。在本文中,我们研究自动发现用户社交圈的问题。也就是说,如果给我们提供了一个个人社交网络,我们的目标就是去识别他的圈子,并且每一个圈子都是由他的朋友组成的。圈子是用户指定的,就像每个用户都会

5、完全独立于其他他们自己不联系的陌生人来组织他们自己的个人网络,这就意味着我们可以完全在他自己的个人社交圈中来讨论这个社交圈检测的问题,而不用考虑其他的陌生人。在实际操作中,这些社交圈可能会重叠,比如说一个同乡的人也可能是你的大学同学,或者是分层嵌套的,比如说在你的大学同学里肯定还有一部分人跟你是一个课题组的。我们把这些所有的情况都要考虑到我们的模型当中。在图1中,我们了解到了一个个人用户,称为U,并且我们与他的朋友Vi生成了一个网络。我们把这个用户U作为自我,把节点Vi作为变量。接下来的任务就是识别每个Vi属于哪个圈子,换句话说,我们的任务就是找到U的个人网络的社交

6、团体。一般的,有两种有用的数据源对这个任务有所帮助。第一个是这种个人网络的边缘设置。我们希望我们的圈子必须是由与圈子的主人密切联系的变量形成的。然而,不同的圈子重叠的很厉害,而且变量同时属于多个圈子,并且很多圈子都多层嵌套在一个大的圈子里。为一个变量的圈中关系建模是十分重要的。第二,我们希望我们所形成的圈子中的成员不仅要互相之间密切的联系,而且需要有共同的特性。这样我们就需要针对每个圈子准确的建立不同规模的用户轮廓。我们把重叠的圈子作为一个潜在的变量或者是变量之间共同轮廓功能的相似性。我们建立一种自学习方法去学习能够导致密切联系圈子的相似性规模。在建模解决这个问题之

7、后,我们接下来要处理的问题就是当一个新的朋友被加到这个网络当中时,如何能够准确的更新我们现有的圈子信息。并在根节点的形式下用一个用户弱监督的方法提升分类的效率。对于前一汇总问题,我们展示的方法是已经定义好的用户圈子,而且我们可以准确的预测出每一个用户应该属于那个圈子。对于后一个问题来说,我们展示的方法是用户提供的每一个根节点都提高了分类的准确性,虽然从本质上说,2——3个节点就已经可以使得准确性得到一个很大的提高。我们的模型有两个创新,第一,在对比混合关系模型时,我们能够预测一个节点应该属于哪几个圈子。第二,通过提出一个相似性轮廓的定义参数,我们可以了解相似性节

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。