欢迎来到天天文库
浏览记录
ID:33631084
大小:51.34 KB
页数:11页
时间:2019-02-27
《基于二分图模型的上下文有关网站服务发现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于二分图模型的上下文有关网站服务发现1.华东师范大学软件工程学院,上海200062,中国2.信息和通信技术研究所,京都619-0289,日本3.庆应义塾大学,神奈川县252-8520,日本C4高等教育出版社和施普林格出版社柏林海德堡2013摘要随着面向服务架构(SOA)不断成熟,由于服务发现,服务消费需求导致迫切要求。不同于Web文档,执行服务以此实现目标和用户期望的目标。这会导致这样的概念,即服务发现应该不仅把服务的“使用情境”考虑进去,而且应该把探索的很好的服务内容(描述)考虑进去。在本文中,我们将介绍用来表示服务使用的服务理念。在查询处理中,为了进行检查识
2、别服务,需要检查服务内容和服务方面。我们建议通过上下文加权二部图模型代表服务。基于二分图模型,我们通过查询扩展减少查询之间的差距空间和服务空间,以此来提高召回。我们还通过考虑服务内容,实用性以及content-relevance,为了结果排名而设计了一个迭代算法以此提高精度。最后,我们开发了一个可以实施这一机制的服务搜索引擎,并进行一些实验来验证我们的想法。1.简介近年来,网上Web服务(WSS)由于有数以千计的服务被公众访问,所以呈现爆炸式增长。优选的服务通过简单的组装以满足用户的需求。为了支持服务组装,不同的工具,诸如ActiveBPEL的1),OracleB
3、PEL2),和BPMN建模3),已根据该要求被设计和实现,以帮助定义逻辑协作图服务。由于theWS消费不断上升,为了设计WS发现机制找到相关和适当的服务,这一迫切需要已经出现了。要是没有这样的机制,大量手动所需的努力将继续成为基于WS应用的瓶颈。对于目前WS的搜索引擎,如BindingPoint4),WebServiceList5)和Salcentral6),基于内容的映射仍然是最流行的技术。我们通过图表描述说明两种服务内容。图表1中,一种是由WSDL7定义)(左侧),而另一个是RESTful8)Web服务(右侧)。一般情况下,服务描述的内容可能包括服务名称,操作
4、名称,参数和服务document9)。然而,值得一提的是,由于短的服务描述,基于内容的映射算法是不够的,这使得映射之间查询空间和服务空间[1]难以转换。如图2所示,我们从ProgrammableWeb10)收集服务并获得长期经销,其中约70%的服务都是少于30个条款,90%的服务是少于40个条款。提高测绘质量的一种方法是做本地内容分析并且执行术语概念化[2]。例如,如果条件a和b经常共同出现在许多内容,那么这两个词都应该语义上是接近的。Woogle[3]采取同样的方法来设计WS搜索引擎。在一定程度上,通过精确语义聚集紧密条款,这有助于提高系统精确度。但是,这个本地
5、的分析方法是通过限制服务描述长度或服务描述之间的重叠。它也试图要求用户为了所需要的服务,如操作名,参数名称,甚至可组合的服务要求等等提供详细的信息。用户输入请求过多会使系统难以使用。服务SI使用上下文的第一定义(使用上下文)是定义为一组使用服务的应用程序实例{}AJ的,表示为A[SI]={}*,0[SL]*},其中06、事实是服务被定义为在应用程序中使用。如该图3所示,有一个所谓“BuddyPing”的应用程序通过整合实现现有的几种服务,包括“del.icio.us”,“Flickr”和“谷歌地图”。一般情况下,用户所知道的任务描述(即应用程序要求)比相关的服务更清楚。在这种情况下,用户可能更喜欢递交面向应用的查询(查询到任务描述),而不是以内容为导向的查询(查询到的服务内容)。例如,如图3所示,用户可能不知道的服务“del.icio.us”到它的应用需求的可用性。与此相反,最好是通过查询来检索该服务像面向应用服务的功能描述“手机标记”。基于内容的映射方法用来解决这类查询是效率不7、高并且没有用,这是因为缺乏应用程序相关的信息。基于内容的映射方法与结果排名总是一起使用。由于服务描述的缺乏,所以排名结果不太可信。对于成功的反面搜索引擎,解决最重要的问题之一就是要区分具有类似内容的服务。据说,甚至forWeb网页搜索以及页面的排名是由两个额外的元素,决定域相关性和使用流行度[4]所决定的,这个域是和,体育、社会,等等主题相关。域相关性意味着这一页对于主题域重要,但对于其他的并不重要。使用流行意味着如果一个页面被大量的页面所指代,我们认为它是普遍接受的,并且将给排名得分添加额外的价值。PageRank[5]是代表这一点的实例。在这方面,对于服务排名8、我们需要考
6、事实是服务被定义为在应用程序中使用。如该图3所示,有一个所谓“BuddyPing”的应用程序通过整合实现现有的几种服务,包括“del.icio.us”,“Flickr”和“谷歌地图”。一般情况下,用户所知道的任务描述(即应用程序要求)比相关的服务更清楚。在这种情况下,用户可能更喜欢递交面向应用的查询(查询到任务描述),而不是以内容为导向的查询(查询到的服务内容)。例如,如图3所示,用户可能不知道的服务“del.icio.us”到它的应用需求的可用性。与此相反,最好是通过查询来检索该服务像面向应用服务的功能描述“手机标记”。基于内容的映射方法用来解决这类查询是效率不
7、高并且没有用,这是因为缺乏应用程序相关的信息。基于内容的映射方法与结果排名总是一起使用。由于服务描述的缺乏,所以排名结果不太可信。对于成功的反面搜索引擎,解决最重要的问题之一就是要区分具有类似内容的服务。据说,甚至forWeb网页搜索以及页面的排名是由两个额外的元素,决定域相关性和使用流行度[4]所决定的,这个域是和,体育、社会,等等主题相关。域相关性意味着这一页对于主题域重要,但对于其他的并不重要。使用流行意味着如果一个页面被大量的页面所指代,我们认为它是普遍接受的,并且将给排名得分添加额外的价值。PageRank[5]是代表这一点的实例。在这方面,对于服务排名
8、我们需要考
此文档下载收益归作者所有