基于张量分解的网络异构信息聚类分析方法(

基于张量分解的网络异构信息聚类分析方法(

ID:19878014

大小:4.73 MB

页数:9页

时间:2018-10-07

基于张量分解的网络异构信息聚类分析方法(_第1页
基于张量分解的网络异构信息聚类分析方法(_第2页
基于张量分解的网络异构信息聚类分析方法(_第3页
基于张量分解的网络异构信息聚类分析方法(_第4页
基于张量分解的网络异构信息聚类分析方法(_第5页
资源描述:

《基于张量分解的网络异构信息聚类分析方法(》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于张量分解的网络异构信息聚类分析方法*收稿日期:2017-06-02基金项目:国家自然科学基金资助项目(61401483,61401483)作者简介:吴继冰(1987-),男,江苏南通人,博士研究生,E-mail:wujibing@nudt.edu.cn;邓苏(通信作者),男,教授,博士,博士生导师,E-mail:sudeng@sohu.com吴继冰,黄宏斌,邓苏国防科学技术大学信息系统工程重点实验室,湖南长沙410073摘要:提出一种基于张量分解的聚类算法,能够同时处理网络中多类型、多语义关系的异构信息。网络信息体系中的各种异构信息被建模为一个多维张量,异构信

2、息之间丰富的语义关系建模为张量中的元素。提出有效的张量分解方法,将不同类型的信息对象一次性划分到不同的簇中。在人工合成的数据集和真实数据集上的实验结果表明,该聚类方法可以很好地处理网络信息体系中的异构信息聚类问题,并且性能优于现有的聚类方法。关键词:聚类;异构信息;张量分解;信息网络中图分类号:TN95文献标志码:A   文章编号:ATensorDecompositionbasedClusteringMethodforHeterogeneousInformationinNetworksWUJibing,HUANGHongbin,DengSuScienceandTe

3、chnologyonInformationSystemsEngineeringLaboratory,NationalUniversityofDefenseTechnology,Changsha410073,ChinaAbstract:Atensordecompositionbasedclusteringmethodisproposedforheterogeneousinformationinnetworks.Thisclusteringmethodcanclustermultipletypesofobjectsandrichsemanticrelationship

4、ssimultaneously.Themulti-typesofinformationobjectsinnetworksaremodeledasahigh-dimensionaltensor,andtherichsemanticrelationshipsamongdifferenttypesofobjectsaremodeledaselementsinthetensor.Basedonaneffectivetensordecompositionmethod,themulti-typesofobjectsarepartitionedintodifferentclus

5、terssimultaneously.Theexperimentalresultsonbothsyntheticdatasetsandreal-worlddatasetshowthattheproposedclusteringmethodcandealwiththeheterogeneousinformationinnetworkswell,andoutperformsthestate-of-the-artclusteringalgorithms.Keywords:clustering;heterogeneousinformation;tensordecompos

6、ition;informationnetworks9信息的处理和分析在现代网络信息体系中占有重要的地位,扮演着网络信息体系中的大脑角色。信息的高效分析处理决定了网络信息体系的智能化程度。通过各种途径汇聚而来的信息,只有经过高效的分析挖掘才能更好地服务于用户。而在信息分析处理中,聚类分析是信息分析挖掘的一种重要手段。聚类分析是挖掘数据中蕴含的语义信息及拓扑结构的有效方法。网络信息体系中包含着语义丰富、来源多样的各类信息,而这些信息对象之间存在着丰富的语义和交互关系。也就是说,网络信息体系中包含着丰富的异构信息对象。传统的聚类方法往往忽略了这些信息对象之间的异构性,采

7、用统一的度量方法来计算异构信息之间的距离或者相似度。显然,这种方法对于异构信息对象是不适用的。例如,在电子商务网络中,包含着庞大的用户信息和商品信息,这两种信息对象之间又存在着收藏,购买等语义信息。我们无法直接度量某一个用户与某一件商品之间的相似性。在科学论著发表网络中,存在的异构信息包括:作者、论文、期刊、会议、主题等。这些异构对象这间存在着复杂的语义关系,例如作者著作论文,论文发表于期刊,作者参加会议,论文包含主题词等等。传统的聚类方法试图将不同类型的对象转换到统一的欧氏空间,且只能聚类某一种类型的对象,如作者,而将其他类型的对象经过转换、归一化后作为属性来度

8、量不同作者

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。