欢迎来到天天文库
浏览记录
ID:19878014
大小:4.73 MB
页数:9页
时间:2018-10-07
《基于张量分解的网络异构信息聚类分析方法(》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于张量分解的网络异构信息聚类分析方法*收稿日期:2017-06-02基金项目:国家自然科学基金资助项目(61401483,61401483)作者简介:吴继冰(1987-),男,江苏南通人,博士研究生,E-mail:wujibing@nudt.edu.cn;邓苏(通信作者),男,教授,博士,博士生导师,E-mail:sudeng@sohu.com吴继冰,黄宏斌,邓苏国防科学技术大学信息系统工程重点实验室,湖南长沙410073摘要:提出一种基于张量分解的聚类算法,能够同时处理网络中多类型、多语义关系的异构信息。网络信息体系中的各种异构信息被建模为一个多维张量,异构信
2、息之间丰富的语义关系建模为张量中的元素。提出有效的张量分解方法,将不同类型的信息对象一次性划分到不同的簇中。在人工合成的数据集和真实数据集上的实验结果表明,该聚类方法可以很好地处理网络信息体系中的异构信息聚类问题,并且性能优于现有的聚类方法。关键词:聚类;异构信息;张量分解;信息网络中图分类号:TN95文献标志码:A 文章编号:ATensorDecompositionbasedClusteringMethodforHeterogeneousInformationinNetworksWUJibing,HUANGHongbin,DengSuScienceandTe
3、chnologyonInformationSystemsEngineeringLaboratory,NationalUniversityofDefenseTechnology,Changsha410073,ChinaAbstract:Atensordecompositionbasedclusteringmethodisproposedforheterogeneousinformationinnetworks.Thisclusteringmethodcanclustermultipletypesofobjectsandrichsemanticrelationship
4、ssimultaneously.Themulti-typesofinformationobjectsinnetworksaremodeledasahigh-dimensionaltensor,andtherichsemanticrelationshipsamongdifferenttypesofobjectsaremodeledaselementsinthetensor.Basedonaneffectivetensordecompositionmethod,themulti-typesofobjectsarepartitionedintodifferentclus
5、terssimultaneously.Theexperimentalresultsonbothsyntheticdatasetsandreal-worlddatasetshowthattheproposedclusteringmethodcandealwiththeheterogeneousinformationinnetworkswell,andoutperformsthestate-of-the-artclusteringalgorithms.Keywords:clustering;heterogeneousinformation;tensordecompos
6、ition;informationnetworks9信息的处理和分析在现代网络信息体系中占有重要的地位,扮演着网络信息体系中的大脑角色。信息的高效分析处理决定了网络信息体系的智能化程度。通过各种途径汇聚而来的信息,只有经过高效的分析挖掘才能更好地服务于用户。而在信息分析处理中,聚类分析是信息分析挖掘的一种重要手段。聚类分析是挖掘数据中蕴含的语义信息及拓扑结构的有效方法。网络信息体系中包含着语义丰富、来源多样的各类信息,而这些信息对象之间存在着丰富的语义和交互关系。也就是说,网络信息体系中包含着丰富的异构信息对象。传统的聚类方法往往忽略了这些信息对象之间的异构性,采
7、用统一的度量方法来计算异构信息之间的距离或者相似度。显然,这种方法对于异构信息对象是不适用的。例如,在电子商务网络中,包含着庞大的用户信息和商品信息,这两种信息对象之间又存在着收藏,购买等语义信息。我们无法直接度量某一个用户与某一件商品之间的相似性。在科学论著发表网络中,存在的异构信息包括:作者、论文、期刊、会议、主题等。这些异构对象这间存在着复杂的语义关系,例如作者著作论文,论文发表于期刊,作者参加会议,论文包含主题词等等。传统的聚类方法试图将不同类型的对象转换到统一的欧氏空间,且只能聚类某一种类型的对象,如作者,而将其他类型的对象经过转换、归一化后作为属性来度
8、量不同作者
此文档下载收益归作者所有