异构信息网络中基于元路径的搜索和挖掘(上)

异构信息网络中基于元路径的搜索和挖掘(上)

ID:14654656

大小:633.50 KB

页数:9页

时间:2018-07-29

异构信息网络中基于元路径的搜索和挖掘(上)_第1页
异构信息网络中基于元路径的搜索和挖掘(上)_第2页
异构信息网络中基于元路径的搜索和挖掘(上)_第3页
异构信息网络中基于元路径的搜索和挖掘(上)_第4页
异构信息网络中基于元路径的搜索和挖掘(上)_第5页
资源描述:

《异构信息网络中基于元路径的搜索和挖掘(上)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大连理工大学本科外文翻译异构信息网络中基于元路径的搜索和挖掘Meta-Path-BasedSearchandMininginHeterogeneousInformationNetworks学院(系):软件学院专业:网络工程学生姓名:学号:指导教师:完成日期:2014年4月大连理工大学DalianUniversityofTechnology异构信息网络中基于元路径的搜索与挖掘异构信息网络中基于元路径的搜索和挖掘YizhouSunJiaweiHan波士顿东北大学计算机与信息学院伊利诺伊大学香槟分校计算机学院摘要:最近,从各个领

2、域提取出来的信息网络被广泛的研究,提出和发展了不同的功能挖掘这些网络,如排名,社区检测和链路预测。大多数现有的网络研究是同构网络,其中的节点和链接假设为一个单一类型。然而在现实中,异构信息网络可以更好地模拟真实世界的系统,这是典型的半结构化和类型化,承接网络架构。为了直接开采这些异构信息网络,我们提出探索信息网络的元结构,即网络架构。提出的元路径的概念,系统地捕获在多个类型的对象,通过网络架构的图形的众多语义关系,它们被定义为一个路径。元路径可以为搜索和挖掘网络提供指导,帮助分析和了解网络中的对象和关系的语义。在此框架下,

3、相似性搜索和其他挖掘任务,如关系的预测和集群可以通过网络的元结构的系统的探索加以解决。此外,随着用户的指导和反馈,我们可以为一个特定的挖掘任务选择最好的元路径或它们的加权组合。关键词:异构信息网络;元路径;相似性搜索;关系预测;用户指导引言真实世界的物理和抽象的数据对象是相互关联的,形成一个庞大互连网络。通过这些结构化数据对象和这些对象之间的交互成多种类型,如网络成为半结构化的异构信息网络。用于处理大数据的现实世界的应用,包括相互连接的社交媒体和社交网络,科学,工程或医疗信息系统,在线电子商务系统,和大多数数据库系统,可以

4、被结构化为异构信息网络。不同于对象和链接被看做相同类型或无类型的节点或链路的同构信息网络,在我们的模型中,异构信息网络是半结构化和类型,即节点和链接被构造一组类型,形成了网络架构。例如在像书目数据库DBLP(http://www.informatik.uni-trier.de/?ley/db/)和PubMed(http://www.ncbi.nlm.nih.gov/pubmed/),论文通过作者,期刊和条件连在一起。Flickr(http://www.flickr.com/),一个社交网络,照片是通过用户,组,标签和评论连

5、接在一起。不同种类的知识都可以从这样一个信息网络视图中导出,如发现集群和层次结构[1-3],排名[1,3,4]主题分析[5,6]分类[7,8],相似性搜索[9,10]-8-异构信息网络中基于元路径的搜索与挖掘,以及关系预测。这些功能有助于在几乎每个行业的无处不在的在线数据库和其他联机或脱机的系统的新知识的产生。例如,不同的研究领域和为作者和会议排序可以通过这样的分析在书目数据库发现,这对用户更好地理解数据,并获得宝贵的知识将是有益的。目前大多数网络的研究都是基于同构网络。为了将同质信息网络为基础的方法适用到异构信息网络,我

6、们必须将异构网络成看出同质的,或者干脆忽略与节点和链路相关的类型信息。不幸的是,这两种方法会导致严重的信息丢失。因此,利用异构节点和链路的语义含义直接提供挖掘方法对异构信息网络来说是有必要的。由于对象通过在异构信息网络不同的语义含义连接,我们建议充分利用异构信息网络的网络架构。网络架构提供了信息网络的元结构,它提供了搜索网络和挖掘的指导和帮助分析和了解网络中的对象和关系的语义。更具体地讲,一个元路径为基础的方法被提出。元的路径是一种定义在在网络的架构的路径,它是两个对象类型之间的关系的序列,并定义对象之间的新的或现有的关系

7、所限定的路径。在这篇文章中,我们介绍了在异构信息网络三种类型的挖掘任务,即相似性搜索,关系的预测和聚类。在文章的最后,我们讨论了一些沿着这个方向发展的研究前沿。1异构信息网络和元路径信息网络表示现实世界的抽象,着眼于对象之间的对象和相互作用。事实证明,这个抽象级别中不仅表示和存储有关的真实世界的基本信息,拥有极大的权力,同时也通过探索链接的作用,提供一个从中挖掘知识的有用工具。在形式上,我们定义了一个信息网络,如下所示。1.1定义1信息网络信息网络被定义为一个有向图,,与对象类型映射函数,链接类型映射函数,每个对象属于一个

8、特殊的对象类型。每一个链接属于一个特殊的关系,并且如果两个链路都属于相同的关系式,两个链路共享相同的起始对象类型以及该结束的对象类型。给定一个复杂的异构信息网络,为更好地理解对象类型和在网络中的链路类型,有必要提供其元层(即,模式级别)描述。因此,我们提出网络架构的概念来描述一个网络的元结构。-8-异构

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。