机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法

机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法

ID:30061052

大小:338.67 KB

页数:10页

时间:2018-12-26

机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法_第1页
机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法_第2页
机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法_第3页
机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法_第4页
机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法_第5页
资源描述:

《机器学习论文-基于本体的发布_订阅系统的数据模型和匹配算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于本体的发布/订阅系统的数据模型和匹配算法作者:范晓可学号:104754130795摘要:现有的发布/订阅系统不能根据事件的语义来进行事件与订阅的匹配,且不能支持具有复杂结构(如图状结构)的事件.将语义Web技术引入发布/订阅系统中,提出一种基于本体的发布/订阅系统.该系统采用本体来表示事件的概念模型,采用RDF图来表示事件,采用图模式来表示订阅条件.它能较好地解决现有的发布/订阅系统的上述问题.实验结果表明,该系统具有较高的订阅匹配效率.关键词:发布/订阅;本体;RDF;匹配算法Internet的快速普及,极大地改变了分布式系统的规模.基于Internet

2、的分布式系统可以包含上万个分布于世界各地的参与者,在系统的整个生命周期中,这些参与者的位置和行为都可能会改变.这就需要有一种更为灵活的通信模型和交互机制,以反映系统的高度动态和松散耦合的特性.而发布/订阅(publish/subscribe,简称pub/sub)范型(paradigm)能够很好地满足上述需求,因此受到越来越多的关注.在pub/sub方式下,信息提供者以“事件”的形式,将信息发布到pub/sub系统中;信息使用者定义一个订阅条件,表示对系统中的某一特定种类的事件感兴趣;而pub/sub系统保证将所发布的事件及时、可靠地传送到所有感兴趣的订阅者.p

3、ub/sub交互风格的优点在于,信息的生产者和消费者在时间、空间和控制流这3个方面都被完全解耦[1],因而能够很好地满足大规模、高度动态的分布式系统的需要.在不同的分布式系统中,各参与者之间所交换的信息的格式和含义往往是不一样的.为了使pub/sub系统成为一种通用的分布式计算基础设施,能够支持多种应用系统,它就必须具有很强的表达能力,能够:·支持各种具有不同语义和格式的事件;·提供一个强大的订阅语言,使得信息的接收者能够方便地表达它对哪些事件感兴趣.虽然在pub/sub系统领域已经有了很多研究,但是现有的pub/sub系统在表达能力方面尚存在如下不足:(1)

4、目前已有的系统基本上都是根据事件的结构信息来进行事件与订阅的匹配,而缺乏对事件本身语义的理解.如果pub/sub系统能够从语义上进行事件与订阅的匹配,必将会大大提高匹配的准确度,同时也会使订阅者能够更加方便地定义其订阅条件.(2)目前已有的系统只能支持关系数据结构(如“属性=值”对)和树形数据结构(如XML),而某些应用场景可能要求事件具有更为复杂的结构,如图状数据结构.此外,不同的发布者所发布的事件可能具有不同的结构,例如有的为XML,有的为图状结构.因此,需要有一种统一的机制,能够同时处理不同格式的事件.为了解决上述问题,我们将语义Web技术引入pub/s

5、ub系统中,提出一种基于本体的pub/sub系统(ontology-basedpublish/subscribesystem,简称OPS).该系统将事件中所涉及到的各种概念整合到一起,建立起统一的概念模型,从语义和结构两个方面来解决订阅匹配问题.同时,在OPS系统内部,每个事件被表示为一个RDF(resourcedescriptionframework)[2]图,它是一种带标记的有向图(directedlabeledgraph,简称DLG).TimBerners-Lee指出[3],任何格式的数据都可以被表示为DLG,进而可以被表示为RDF.因此,本系统可以同时

6、支持各种格式的事件,包括关系数据结构、树型数据结构以及图状数据结构等,其表达能力大大高于已有的pub/sub系统.当事件被发布时,系统首先将其转换成RDF格式,然后再对其进行进一步的处理.而对于事件接收者而言,所有的事件都是RDF格式的.本文第1节介绍相关的研究工作.第2节介绍OPS系统的数据模型.第3节介绍其订阅语言.第4节介绍匹配算法.第5节对系统进行模拟实验,并对其效率作出评价.第6节对本文进行总结.1相关工作Pub/sub系统可以分为基于主题和基于内容两大类.在基于主题的系统中(如IBMMQSeries[4]),事件被划分为若干个固定的主题,每个事件都

7、只能属于其中的某一个主题.发布者在发布事件时,必须指明该事件属于哪一个主题;订阅者则对某一主题下的所有事件进行订阅.在基于内容的系统中,订阅者根据事件的内部结构,设置一个订阅条件,所有满足该条件的事件都将被传送给该订阅者.与基于主题的pub/sub系统相比,基于内容的pub/sub系统提供了更强的表达能力,使订阅者能够以更细的粒度来定义其订阅条件.目前的基于内容的pub/sub系统又可分为两类,一类是基于Map的,另一类是基于XML的.在基于Map的pub/sub系统中,事件的内容为多个“属性=值”的集合,订阅条件一般是各个属性之上的简单断言的连接,通常称为平

8、面模式(flatpattern).较有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。