欢迎来到天天文库
浏览记录
ID:17380947
大小:210.00 KB
页数:10页
时间:2018-08-30
《最大流算法发现web社团改进》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、蒇羀羆膄蕿螃袂膃蚁薆膁膂莁螁膇膁薃薄肃膀蚆袀罿膀莅蚃袅腿蒈袈膄膈薀蚁肀芇蚂袆羆芆莂虿袂芅蒄袅袈芄蚇螇膆芄莆羃肂芃葿螆羈节薁羁袄芁蚃螄膃莀莃薇聿荿蒅螂羅莈薇薅羁莈莇袁袇莇葿蚃膅莆薂衿肁莅蚄蚂羇莄莄袇袃蒃蒆蚀膂蒃薈袆肈蒂螁蚈肄蒁蒀羄羀肇薃螇袆肆蚅羂膄肆莅螅肀肅蒇羀羆膄蕿螃袂膃蚁薆膁膂莁螁膇膁薃薄肃膀蚆袀罿膀莅蚃袅腿蒈袈膄膈薀蚁肀芇蚂袆羆芆莂虿袂芅蒄袅袈芄蚇螇膆芄莆羃肂芃葿螆羈节薁羁袄芁蚃螄膃莀莃薇聿荿蒅螂羅莈薇薅羁莈莇袁袇莇葿蚃膅莆薂衿肁莅蚄蚂羇莄莄袇袃蒃蒆蚀膂蒃薈袆肈蒂螁蚈肄蒁蒀羄羀肇薃螇袆肆蚅羂膄肆莅螅肀肅蒇羀羆膄蕿
2、螃袂膃蚁薆膁膂莁螁膇膁薃薄肃膀蚆袀罿膀莅蚃袅腿蒈袈膄膈薀蚁肀芇蚂袆羆芆莂虿袂芅蒄袅袈芄蚇螇膆芄莆羃肂芃葿螆羈节薁羁袄芁蚃螄膃莀莃薇聿荿蒅螂羅莈薇薅羁莈莇袁袇莇葿蚃膅莆薂衿肁莅蚄蚂羇莄莄袇袃蒃蒆蚀膂蒃薈袆肈蒂螁蚈肄蒁蒀羄羀肇薃螇袆肆蚅羂膄肆莅螅肀肅蒇羀羆膄蕿螃袂膃蚁薆膁膂莁螁膇最大流算法发现web社团改进何拥军龚发根摘 要:提出了一种更好的分配边容量的方法,即不是给每条边分配一个相同的常量值,而是为不同的边依据信息的重要度来动态的分配不同的边值,较好的解决最大流算法发现web社团中的主题漂移问题。关键词:web社团;超
3、链接;最大流Themaximal-flowdiscoversthewebmassorganizationalgorithmimprovementAbstract:Proposedsideonekindofbetterassignmentthecapacitymethod,namelyisnotassignsasameconstantvalueforeach,butiscomesthedynamicassignmentdifferentontheotherhandvaluefordifferentontheonehan
4、dbasedontheinformationimportance,thegoodsolutionmaximal-flowalgorithmdiscoversinthewebmassorganizationthesubjectdriftingquestion.1引言Web社团是自Internet诞生以来就客观存在的一些web群体,一个web社团通常是这样的一群页面的集合:它们在内容上一般都是围绕某一主题,具有一定的相关性,或者具有某一相似特性[1]。一般的一个web社团只是整个互联网web图中的一个非常小的子图。如何去
5、发现互联网上这些潜在的web社团也是近几年来才引起众多研究者关注的研究领域。在任一个图中边和节点都是很重要的元素,同样在web图当中,代表超链接的边也往往包含有一些非常重要的信息,如果能利用图的理论知识,通过web链接图来研究web社团将会有更好的效果,所以很多的研究工作关注通过web的超链接结构关系来挖掘web社团资源[2]。众多的研究者提出了各种各样的基于链接结构分析发现web社团的方法。Gibson和Kleinberg等人[3,4]提出了基于链接分析搜索算法HITS,Kumar等人[5]从二分有向图的角度对互联
6、网上的社团给出了一种明确的定义描述,把web社团看作一些二分有向图的核。Yasuhito[6]等人提出了通过交互站点的方法。文献[7][8]最先提出通过最大流算法来发现web社团,文献[9][10]从多方面对最大流算法进行了实验及评价。2相关研究工作2.1最大流算法与最小割切网络中的最大流算法具有广泛的应用,在这首先介绍一下在图论中对S-T的最大流问题的简化定义:给定一个网络流图,边的容量为,两个节点,然后找出流经源节点到沉积节点最大流量。直观理解,假设边为管道,节点为开关,那么最大流问题就是如何让源节点S到沉积节点
7、T能流过的流量最大。Ford和Fulkerson[11]已经证明了“最大流-最小割切”理论,即网络流中最大流等于把到沉积节点分离的最小割切容量,等式如下:(1)其中为网络流,为给切,假设,其中为一个子集,,给定,那么边集就叫做S-T的一个割切,包含在割切中的边叫做割边,最小割切即满足割边的容量和为所有割边中最小的一个割切。2.2web社团这里引用文献[9][10]里定义web社团为:设为某些节点的集合,一个web社团是其中的一个子集,满足条件:对任何节点,与属于当中节点之间连接的边数大于它和以外节点之间连接的边数,即
8、,如图1所示图1web社团3最大流算法的特点及存在的问题最大流算法应用到web链接结构中抽取社团的思想最先是由G.Flake等人提出的,在文献[9][10]里面G.Flake等人通过实验证明了最大流算法对于解决HITS算法在社团抽取当中存在的主题漂移问题有较好的效果。下面重点探讨该算法同时所存在的一些问题并提出自己的解决方案。3.1社团体积与边
此文档下载收益归作者所有