欢迎来到天天文库
浏览记录
ID:11046486
大小:51.34 KB
页数:11页
时间:2018-07-09
《基于二分图模型的上下文有关网站服务发现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于二分图模型的上下文有关网站服务发现1.华东师范大学软件工程学院,上海200062,中国2.信息和通信技术研究所,京都619-0289,日本3.庆应义塾大学,神奈川县252-8520,日本C4高等教育出版社和施普林格出版社柏林海德堡2013摘要随着面向服务架构(SOA)不断成熟,由于服务发现,服务消费需求导致迫切要求。不同于Web文档,执行服务以此实现目标和用户期望的目标。这会导致这样的概念,即服务发现应该不仅把服务的“使用情境”考虑进去,而且应该把探索的很好的服务内容(描述)考虑进去。在本文中,我们将介绍用
2、来表示服务使用的服务理念。在查询处理中,为了进行检查识别服务,需要检查服务内容和服务方面。我们建议通过上下文加权二部图模型代表服务。基于二分图模型,我们通过查询扩展减少查询之间的差距空间和服务空间,以此来提高召回。我们还通过考虑服务内容,实用性以及content-relevance,为了结果排名而设计了一个迭代算法以此提高精度。最后,我们开发了一个可以实施这一机制的服务搜索引擎,并进行一些实验来验证我们的想法。1.简介近年来,网上Web服务(WSS)由于有数以千计的服务被公众访问,所以呈现爆炸式增长。优选的服务
3、通过简单的组装以满足用户的需求。为了支持服务组装,不同的工具,诸如ActiveBPEL的1),OracleBPEL2),和BPMN建模3),已根据该要求被设计和实现,以帮助定义逻辑协作图服务。由于theWS消费不断上升,为了设计WS发现机制找到相关和适当的服务,这一迫切需要已经出现了。要是没有这样的机制,大量手动所需的努力将继续成为基于WS应用的瓶颈。对于目前WS的搜索引擎,如BindingPoint4),WebServiceList5)和Salcentral6),基于内容的映射仍然是最流行的技术。我们通过图表
4、描述说明两种服务内容。图表1中,一种是由WSDL7定义)(左侧),而另一个是RESTful8)Web服务(右侧)。一般情况下,服务描述的内容可能包括服务名称,操作名称,参数和服务document9)。然而,值得一提的是,由于短的服务描述,基于内容的映射算法是不够的,这使得映射之间查询空间和服务空间[1]难以转换。如图2所示,我们从ProgrammableWeb10)收集服务并获得长期经销,其中约70%的服务都是少于30个条款,90%的服务是少于40个条款。提高测绘质量的一种方法是做本地内容分析并且执行术语概念化
5、[2]。例如,如果条件a和b经常共同出现在许多内容,那么这两个词都应该语义上是接近的。Woogle[3]采取同样的方法来设计WS搜索引擎。在一定程度上,通过精确语义聚集紧密条款,这有助于提高系统精确度。但是,这个本地的分析方法是通过限制服务描述长度或服务描述之间的重叠。它也试图要求用户为了所需要的服务,如操作名,参数名称,甚至可组合的服务要求等等提供详细的信息。用户输入请求过多会使系统难以使用。服务SI使用上下文的第一定义(使用上下文)是定义为一组使用服务的应用程序实例{}AJ的,表示为A[SI]={}
6、*,0[SL]*},其中07、更清楚。在这种情况下,用户可能更喜欢递交面向应用的查询(查询到任务描述),而不是以内容为导向的查询(查询到的服务内容)。例如,如图3所示,用户可能不知道的服务“del.icio.us”到它的应用需求的可用性。与此相反,最好是通过查询来检索该服务像面向应用服务的功能描述“手机标记”。基于内容的映射方法用来解决这类查询是效率不高并且没有用,这是因为缺乏应用程序相关的信息。基于内容的映射方法与结果排名总是一起使用。由于服务描述的缺乏,所以排名结果不太可信。对于成功的反面搜索引擎,解决最重要的问题之一就是要区分具有类似8、内容的服务。据说,甚至forWeb网页搜索以及页面的排名是由两个额外的元素,决定域相关性和使用流行度[4]所决定的,这个域是和,体育、社会,等等主题相关。域相关性意味着这一页对于主题域重要,但对于其他的并不重要。使用流行意味着如果一个页面被大量的页面所指代,我们认为它是普遍接受的,并且将给排名得分添加额外的价值。PageRank[5]是代表这一点的实例。在这方面,对于服务排名我们需要考
7、更清楚。在这种情况下,用户可能更喜欢递交面向应用的查询(查询到任务描述),而不是以内容为导向的查询(查询到的服务内容)。例如,如图3所示,用户可能不知道的服务“del.icio.us”到它的应用需求的可用性。与此相反,最好是通过查询来检索该服务像面向应用服务的功能描述“手机标记”。基于内容的映射方法用来解决这类查询是效率不高并且没有用,这是因为缺乏应用程序相关的信息。基于内容的映射方法与结果排名总是一起使用。由于服务描述的缺乏,所以排名结果不太可信。对于成功的反面搜索引擎,解决最重要的问题之一就是要区分具有类似
8、内容的服务。据说,甚至forWeb网页搜索以及页面的排名是由两个额外的元素,决定域相关性和使用流行度[4]所决定的,这个域是和,体育、社会,等等主题相关。域相关性意味着这一页对于主题域重要,但对于其他的并不重要。使用流行意味着如果一个页面被大量的页面所指代,我们认为它是普遍接受的,并且将给排名得分添加额外的价值。PageRank[5]是代表这一点的实例。在这方面,对于服务排名我们需要考
此文档下载收益归作者所有