基于矩阵分解的异质信息网络聚类分析研究-论文.pdf

基于矩阵分解的异质信息网络聚类分析研究-论文.pdf

ID:58139511

大小:479.76 KB

页数:6页

时间:2020-04-24

基于矩阵分解的异质信息网络聚类分析研究-论文.pdf_第1页
基于矩阵分解的异质信息网络聚类分析研究-论文.pdf_第2页
基于矩阵分解的异质信息网络聚类分析研究-论文.pdf_第3页
基于矩阵分解的异质信息网络聚类分析研究-论文.pdf_第4页
基于矩阵分解的异质信息网络聚类分析研究-论文.pdf_第5页
资源描述:

《基于矩阵分解的异质信息网络聚类分析研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、小型微型计算机系统2014年10月第10期JournalofChineseComputerSystemsVo1.35No.102014基于矩阵分解的异质信息网络聚类分析研究李依桐,黄岳,石川,吴斌。(北京邮电大学计算机学院,北京100876)(哥伦比亚大学,美国)E-mail:yitongglee@gmail.com摘要:实际的网络化数据往往包含不同类型的节点和边,采用异质信息网络建模可以更加全面的包含交互对象和对象之间的关联,因此异质信息网络分析成为数据挖掘的研究热点.虽然同质信息网络中的聚类已经被深入研究,但是异质信息网络中的聚类还很少研究.异质信息网络中多类对象共存以及丰富的语义信息对

2、聚类分析提出了新的挑战.本文研究异质信息网络中的聚类问题,并提出了一种基于矩阵分解的聚类方法HeteClus.该方法首先利用HeteSim计算基于用户指定的语义路径的对象相似度矩阵;然后采用正交非负矩阵三因子化分解方法得到节点的软聚类或者硬聚类结果.人工和实际网络数据验证了方法的有效性,并通过实例阐明了矩阵分解的物理意义.关键词:异质信息网络;聚类;非负矩阵分解;矩阵三因子化;语义相似度计算中图分类号:TP311文献标识码:A文章编号:1000—1220(2014)10-2256-06ClusteringAnalysisinHeterogeneousInformationNetworkBas

3、edonMatrixFaetorizationUYi-tong,HUANGYue。SHIChuan。。WUBin(DepartmentofComputerScience,BeijingUniversityofPostsandTelecommunications,Beijing100876,China)(FuFoundmionSchoolofEngineeringandAppliedScience,ColumbiaUniversity。USA)Abstract:Therealnetworkeddataoftencontaindifferenttypesofobjectsandlinks。and

4、thereforeitCanbemodeledwimheterogene—OUSinformati0nnetwork.whichincludesmorecomprehensiveinteractionbetweentheobjectsandcontainsrichsemantics.Althoughtheclusteringonhomogeneousnetworks,hasbeenintensivelystudied-fewworksaredoneO11heterogeneousnetworks.Themultipletypesofobjectsandrichsemanticsinheter

5、ogeneousinformationnetworksbringnewchallengestotheclusteringanalysisonit.Inthispaper,westudytheclusteringprobleminheterogeneousnetworks。andproposeamatrixfactorizationbasedclusteringmethod:HeteClus.111emethodfirstusesHeteSimtobuildthesimilaritymatrixbasedonuser—guidedpath.Thentheorthogonalnon—negati

6、vematrixtri-factori—zationmethodisemployedtogetclusteringresults.Experimentsonartificialandrealnetworkeddataareperformedtodemonstratethecapabilityofthismethod,andcasestudiesaregiventoshowthephysicalmeaningofthematrixdecompositionresults.Keywords:heterogeneousinformationnetwork;clusteringanalysis;no

7、nnegativematrixfaetorization;matrixtri—factorization:semanticsimilaritysearch1引言系统的组成对象和他们之间的关系.异质信息网络分析的美好前景吸引了越来越多的研究者的关注,成为逐渐兴起的研由对象间的链接构成的信息网络,可以给我们呈现庞大究热点.的网络信息视图.目前信息网络的研究,主要集中于同质网聚类分析是数据挖掘的主要任务之一.聚类是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。