欢迎来到天天文库
浏览记录
ID:58139511
大小:479.76 KB
页数:6页
时间:2020-04-24
《基于矩阵分解的异质信息网络聚类分析研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、小型微型计算机系统2014年10月第10期JournalofChineseComputerSystemsVo1.35No.102014基于矩阵分解的异质信息网络聚类分析研究李依桐,黄岳,石川,吴斌。(北京邮电大学计算机学院,北京100876)(哥伦比亚大学,美国)E-mail:yitongglee@gmail.com摘要:实际的网络化数据往往包含不同类型的节点和边,采用异质信息网络建模可以更加全面的包含交互对象和对象之间的关联,因此异质信息网络分析成为数据挖掘的研究热点.虽然同质信息网络中的聚类已经被深入研究,但是异质信息网络中的聚类还很少研究.异质信息网络中多类对象共存以及丰富的语义信息对
2、聚类分析提出了新的挑战.本文研究异质信息网络中的聚类问题,并提出了一种基于矩阵分解的聚类方法HeteClus.该方法首先利用HeteSim计算基于用户指定的语义路径的对象相似度矩阵;然后采用正交非负矩阵三因子化分解方法得到节点的软聚类或者硬聚类结果.人工和实际网络数据验证了方法的有效性,并通过实例阐明了矩阵分解的物理意义.关键词:异质信息网络;聚类;非负矩阵分解;矩阵三因子化;语义相似度计算中图分类号:TP311文献标识码:A文章编号:1000—1220(2014)10-2256-06ClusteringAnalysisinHeterogeneousInformationNetworkBas
3、edonMatrixFaetorizationUYi-tong,HUANGYue。SHIChuan。。WUBin(DepartmentofComputerScience,BeijingUniversityofPostsandTelecommunications,Beijing100876,China)(FuFoundmionSchoolofEngineeringandAppliedScience,ColumbiaUniversity。USA)Abstract:Therealnetworkeddataoftencontaindifferenttypesofobjectsandlinks。and
4、thereforeitCanbemodeledwimheterogene—OUSinformati0nnetwork.whichincludesmorecomprehensiveinteractionbetweentheobjectsandcontainsrichsemantics.Althoughtheclusteringonhomogeneousnetworks,hasbeenintensivelystudied-fewworksaredoneO11heterogeneousnetworks.Themultipletypesofobjectsandrichsemanticsinheter
5、ogeneousinformationnetworksbringnewchallengestotheclusteringanalysisonit.Inthispaper,westudytheclusteringprobleminheterogeneousnetworks。andproposeamatrixfactorizationbasedclusteringmethod:HeteClus.111emethodfirstusesHeteSimtobuildthesimilaritymatrixbasedonuser—guidedpath.Thentheorthogonalnon—negati
6、vematrixtri-factori—zationmethodisemployedtogetclusteringresults.Experimentsonartificialandrealnetworkeddataareperformedtodemonstratethecapabilityofthismethod,andcasestudiesaregiventoshowthephysicalmeaningofthematrixdecompositionresults.Keywords:heterogeneousinformationnetwork;clusteringanalysis;no
7、nnegativematrixfaetorization;matrixtri—factorization:semanticsimilaritysearch1引言系统的组成对象和他们之间的关系.异质信息网络分析的美好前景吸引了越来越多的研究者的关注,成为逐渐兴起的研由对象间的链接构成的信息网络,可以给我们呈现庞大究热点.的网络信息视图.目前信息网络的研究,主要集中于同质网聚类分析是数据挖掘的主要任务之一.聚类是
此文档下载收益归作者所有