资源描述:
《基于线性谱统计量的社区发现算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、0分类号:O211单位代码:1183:研究生学号:2015312053密级公开吉林大学硕士学位论文学术学位()基于线性谱统计量的社区发现算法CommunityDetectionAlgorithmBasedontheLinearSpectralStatistics作者姓名:王双双专业:概率论与数理统计研究方向:随机图论指导教师:董志山副教授培养单位:数学研究所2018年6月――――――――――――――――――――――――基于线性谱统计量的社区发现算法―――――――――――――――――――――――――Comm
2、unityDetectionAlgorithmBasedontheLinearSpectralStatistics作者姓名:王双双专业名称:概率论与数理统计指导教师:董志山副教授类别:理学硕士答辩日期:2018524年月日未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、出租、、修改、发行改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限).否则应承担侵权,的法律责任.吉林大学硕士学位论文原创性声明本人郑重声明:所呈交的硕士学位论文,独,是本人在指导教师的指导
3、下立进行研究工作所取得成果,除文中已经注明引用的内容外,本文不包含任何其他人或集体已经发表或撰写过的作品成果,对本文做出重要贡献的个人和集体.,均已在文中己明确方式标明本人完全意识到本声明的法律结果由本人承担.学位论作者签名:狄曰期:年6月6曰摘要社区发现作为网络研究的重要课题,其应用涉及到从查找通信网络和生物网络社区到金融风控中老赖识别等多个领域,受到了统计学,物理学和计算机科学等不同学科的广泛关注.然而过去使用的聚类算法多数要求社区个数k已知.我们将要通过假设检验算法自动获取社区数目k.在随机块模型假设下,单个社区可以看做是ER图,本文从理论上证
4、明了ER图邻接矩阵的线性谱统计量弱收敛到N(0,15).从而在原假设为ER图的情况下,提出基于线性谱统计量的假设检验算法检验网络是否是ER随机图,创新性地将高维随机矩阵的线性谱统计量等相关定理用于随机网络的社区发现问题.本文结合基于motif谱聚类算法与基于线性谱统计量的假设检验算法提出两种k未知时的聚类算法框架.本文的难点主要集中在两方面,第一个难点是证明经过标准化的ER图邻接矩阵的线性谱统计量弱收敛到高斯分布,第二个难点是如何基于线性谱统计量的假设检验算法构建k未知的聚类算法.关键词:社区发现,随机块模型,假设检验,线性谱统计量,中心极限定理,谱聚类iAbstractC
5、ommunitydetectionisanimportantsubjectinnetworks,whoseapplicationsareinadiversesetofareas,rangingfromdetectioncommunitiesinsocialandbiologicalnetworkstoidentifyingdeadbeatinfinancialcredit.Communitydetectinginanetworkhasreceivedmuchattentionfromstatistics,physicsandcomputerscience.However,th
6、eclusteringal-gorithmsusedinthepastareoftenlimitedbytheknownnumberofcommunitiesk.Inthispaper,wewilllearnkautomaticallyinagraphbyusingahypothesistest.Everycommu-nityinagraphgeneratedfromastochasticblockmodelcanbeconsideredasanERgraph,thereforethenullhypothesisisthatanetworkisgeneratedfroman
7、ERgraph.ToestablishaconnectionbetweentheERgraphandtheWignermatrix,wewillprovethecentrallimittheoremofthelinearspectralstatisticsoftheadjancymatrixofERrandomgragh,anduesthelinmitingdistributionoflinearspectralstatisticsasstatisticsforhypothesistestingtode-termi