基于节点相似度的网络社团挖掘研究.pdf

基于节点相似度的网络社团挖掘研究.pdf

ID:50429713

大小:5.31 MB

页数:71页

时间:2020-03-06

基于节点相似度的网络社团挖掘研究.pdf_第1页
基于节点相似度的网络社团挖掘研究.pdf_第2页
基于节点相似度的网络社团挖掘研究.pdf_第3页
基于节点相似度的网络社团挖掘研究.pdf_第4页
基于节点相似度的网络社团挖掘研究.pdf_第5页
资源描述:

《基于节点相似度的网络社团挖掘研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、啼4訪旅巧.YOFICSCNCEANDTECHNOLOGYOFCHINAIEUNIVERSITELECTRON专业学位硕±学位讫文MASTERTHESISFORPROFESSIONALDEGREE戀塌论文题目基于节点相似度的网络社团挖掘抑究专业学位类别学号2Q1222Q6Q573作者姓名王疵茜I独剑性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加W标注和致谢的地方夕h论文中不

2、包含其他人己经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。作者签名:祕慕日期:2^少年(月寺日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使巧学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可将学位论文的全部或部分内容编入有关数据库进行检索,可W采用影印、缩印或扫描等复制手段保

3、存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师簇名:—日期:yT年(月3日分类号密级公开注1UDC学位论文基于节点相似度的网络社团挖掘研究(题名和副题名)王娅茜(作者姓名)指导教师蔡世民副教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士专业学位类别工程硕士工程领域名称计算机技术提交论文日期2015年03月论文答辩日期2015年05月学位授予单位和日期电子科技大学2015年06月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。THERESEARCHO

4、FCOMMUNITYDETECTIONINCOMPLEXNETWORKSWIHTNODESIMILARITIESAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:MasterofEngineeringAuthor:wangyaxiAdvisor:AssociateProf.CaishiminSchool:SchoolofComputerScience&Engineering摘要摘要随着大数据时代的到来,一般网络

5、,如社交网络、移动互联网、万维网,所包含的节点数不是十万而是百万,因此有必要运用复杂网络的知识从网络结构中获取综合信息。复杂网络社团挖掘研究的重要性就在于,它能够帮助我们发现网络中未知的功能模块,比如信息网络中的话题或者社交网络中的在线群落。这意味着需要将网络划分成社团内连边紧密而社团间连边稀疏的群落。考虑到隶属于同一社团的节点具有较高的相似性,通过计算节点的相似性,可将社团挖掘的问题转化为聚类问题。传统社团挖掘研究的方向主要集中在新算法的提出和算法的改进上,没有考虑到网络特征对于挖掘算法的影响。因此,本文在国内外研

6、究成果的基础上,以考察网络社团结构强度参数对于基于节点相似度的社团挖掘算法的影响为目的,展开了两阶段研究:第一阶段是分析网络结构参数对节点相似度度量方法的影响;第二阶段是网络结构参数对聚类算法的影响,并且在此阶段做了理论分析和实际分析两个方面工作。主要工作如下:1、深入分析了各种节点相似度度量指标的构造方法,并将它们划分为三类:基于半结构信息定义、基于结构信息定义、采用动力学方法定义。根据相似度指标各自的特点,从中选择了具有代表性的指标进行考察。通过比较分析每一种指标在不同模块度的实际网络上计算得到的相似度矩阵的值大

7、小和值分布,得到结构参数对指标的影响。实验最后给出不同场景相似度度量指标的选择。2、理论研究方面,从模拟网络的建模入手,选择结构强度可调的BA无标度网络增长模型,采用模块度优化的社团检测方式对生成的模拟网络进行模块度和社团个数的分析。实验采用精确度和召回率作为评价指标。结果发现,基于同步聚类的社团挖掘算法普遍比基于AP聚类算法更加易受到网络结构参数的影响。而且,在同步聚类方法上采用基于随机游走的相似度指标计算节点间相似性的方式最不易受到影响,其次是采用基于网络结构信息的相似度指标,而最易受到影响的是基于半结构信息的相

8、似度指标。3、实际研究方面,考虑到模拟网络不能囊括所有实际网络的特性,在真实数据集上进行研究。选择了模块度具有差异的三组实际网络进行对比分析。实验同样得出同步聚类相对来说不易受到网络结构参数的影响的结论。而不同之处在于,在同步聚类检测结果中,除了LRW指标检测结果依然表现的最好,LHN-I、AA、RA表现几乎没有差别。关键词:社团挖掘、节点相似

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。