大型网络随机化的社区挖掘算法

大型网络随机化的社区挖掘算法

ID:37816909

大小:382.46 KB

页数:7页

时间:2019-05-31

大型网络随机化的社区挖掘算法_第1页
大型网络随机化的社区挖掘算法_第2页
大型网络随机化的社区挖掘算法_第3页
大型网络随机化的社区挖掘算法_第4页
大型网络随机化的社区挖掘算法_第5页
资源描述:

《大型网络随机化的社区挖掘算法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、计算机研究与发展ISSN1000—12391CN1卜1777/TPJournalofComputerResearchandDevelopment46(Suppl.):406—412,2009一种面向大型网络的快速随机化社区挖掘算法余韬肖仰华何震瀛汪卫吴文涛(复旦大学计算机科学技术学院上海200433)(yyuuttaaoo@gmail.com)FastRandomizedAlgorithmforCommunityDetectioninLargeNetworksYuTao,XiaoYanghua,HeZhe

2、nying,WangWei,andWuWentao(SchoolofComputerScience,FudanUniversity,Shanghai200433)AbstractDetectingcommunitystructureisfundamentalforuncoveringtheorganizationprincipleofrealnetworks.Existingcommunitydetectionalgorithmsarenottractableforlargegraphs,inpartic

3、ularthegraphswithmillionsofnodes.However,proliferationoflarge-scalerealnetworkdatademandsnewmethodstoidentifycommunitiesefficientlyandeffectively.Forthispurpose,arandomizedalgorithmisproposedtoefficientlyminecommunitystructurewithhighqualityfromlargenetwo

4、rks.EachrandomizedstepofthenewalgorithmistorenumbertheverticesbyaDFSorder.SuchDFSrenumberingishelpfultoidentifytheedgesbetweencommunities.Finally,theeffectivenessandefficiencyofthenewalgorithmareshownbyexperimentalresultsonbothsyntheticandrealnetworks.Key

5、wordsrandomizedalgorithm;communitydetection;largenetworks摘要寻找网络的社区结构对于理解真实网络的自组织机制、可视化大网络有重要的作用.然而,现有的社区挖掘算法由于性能较低,还难以处理大型网络,特别是有着百万顶点的网络.然而,百万规模的大网络却在越来越多的真实应用中大量涌现,这对于高效的有效社区识别算法提出新的需求.为此,一种新颖的随机算法被提出,能够在接近线性时间内,从大型网络上高效地挖掘质量较高的网络社区:新算法的核心思路是在每一随机步骤中对网络

6、中的顶点进行基于深度优先顺序的编码,这样的编码有助于有效地识别社区之间的边.最后,通过针对模拟网络和真实网络的一系列实验验证了新算法的高效,}生和有效性.关键词随机算法;社区挖掘;大惆络中图法分类号TP391近年来,大量的真实网络数据大量涌现,常见的包括Www、互联网、生物网络和社会网络.在各种网络分析中,社区挖掘是最为常见的网络分析任务之一,且已被成功地应用于各种不同主题的网络¨4]的分析中.通常,网络上的一个社区划分是指将网络上的全部顶点划分成若干分组,使得组内顶点之间的链接密度显著高于组间.寻找以及

7、评估网络上的社区结构不仅有助于人们理解网络系统的功能和行收稿日期:2009一06—19基金项目:国家自然科学基金项目(60673133,60703093),国家“九七三”重点基础研究发展计划基金项目(2005CB321905);上海市重点学科建设基金项目(B114)余韬等:一种面向大型网络的快速随机化社区挖掘算法407为,也有助于改善大型网络结构的可视化.然而,在可接受的时间内从网络中挖掘较高质量的社区结构绝非易事.在某个给定的社团结构质量指标的度量下,挖掘该指标度量下最优网络社区结构似乎是一个NP难的问

8、题,因为可能的社区划分的数量与网络规模呈指数关系.而近年来,迅速膨胀的网络规模使得面向这些网络的社区挖掘更加复杂.某些在线社会网络,比如MySpace,Facebook上的交友网络,其规模已经达到数百万的点和数亿的边∞].现有的非线性社区发现算法显然已经难以胜任这一规模网络上的社区分析.因此,我们迫切需要新的高效的方法来挖掘网络的社区结构.虽然已经有大量的研究工作致力于各类大型网络的社区挖掘,但是设计一个能够保证挖掘质量的高效

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。